Prof. Dr. Helga Baum Grundkurs Analysis Skript zur Vorlesung Analysis I* und II* im Studienjahr 2006/2007 26. Oktober 2009 Vorwort Dieses Skript dient als begleitendes Lehrmaterial für meinen Grundkurs Analysis für die Studienanfänger des Wintersemesters 2006/07. Es soll Ihnen nicht den Gang in die Bibliothek ersetzen. Gehen Sie bei Gelegenheit dort hin und blättern Sie in den vielen dort stehenden Lehrbüchern zum Grundkurs Analysis. Sie werden dann selbst feststellen, welches dieser Bücher Ihnen am besten gefällt und Ihnen am meisten hilft. Dieses Skript enthält den Stoff des Grundkurses Analysis, so wie ich ihn in den nächsten vier Semestern lesen werde und soll Ihnen die Nacharbeit der Vorlesung erleichtern. Es soll Sie auf keinen Fall davon abhalten, während der Vorlesung mitzuschreiben. Erfahrungsgemäß ist das Mitschreiben einer Vorlesung (auch dann, wenn man ab einer bestimmten Stelle nicht mehr alles oder nichts mehr versteht) etwas, das vielen von Ihnen am Anfang schwer fällt. Es ist aber eine Fähigkeit, die Sie für Ihr Studium benötigen und lernen müssen. Mathematik lernt man nur, wenn man sich selbst mit ihr beschäftigt. Es reicht also nicht, sich in die Vorlesung zu setzen. Die wenigsten von Ihnen werden nach den 90 Minuten rausgehen und alles verstanden haben. Das ist völlig normal. Arbeiten Sie die Vorlesung zu Hause an Hand Ihrer Mitschriften nach und versuchen Sie, die nicht verstandenen Stellen zu klären. Wenn Ihnen das allein nicht gelingt, nutzen Sie die Übung und die Sprechstunden dazu. Den sicheren Umgang mit dem gelernten Stoff erwerben Sie nur durch das Lösen der Übungsaufgaben, die Sie jede Woche bekommen. Die Aufgaben sind nicht nur ein Selbsttest oder ein lästiges Übel, um den Übungsschein zu bekommen – sie sind das entscheidende Mittel, mit dem Sie zunehmend Routine im Umgang mit Mathematik bekommen. Möchte man verstehen, “was in der Welt vorgeht” und dies genauer analysieren, so stellt man schnell fest, daß man dazu die funktionalen Abhängigkeiten von Ursachen und Wirkungen geeignet modellieren muß. Die Analysis beschäftigt sich mit der Frage, wie man das Änderungsverhalten von Funktionen verstehen, beschreiben und beherrschen kann. Sie stellt Begriffe bereit, mit denen man die Änderung einer Funktion “im Kleinen” (also bei gerin- VIII Vorwort gen Änderungen ihrer unabhängigen Variablen) erfassen kann und untersucht, wann und auf welche Weise man aus diesen Eigenschaften “im Kleinen” globale Eigenschaften der Funktion bestimmen kann. Das wichtigste und unverzichtbare Hilfsmittel für solche Untersuchungen ist der Begriff des Grenzwertes. Man muß exakt formulieren können, was es in dem jeweils benutzten Modell bedeutet, daß man sich an einen Punkt annähert. Ich beginne deshalb den Grundkurs Analysis I/II mit dem Studium einer Klasse von Räumen, in denen man einen solchen Grenzwertbegriff formulieren kann, mit den metrischen Räumen. Anschließend werden verschiedene Klassen von Funktionen zwischen allgemeinen oder speziellen metrischen Räumen behandelt, insbesondere die stetigen, die differenzierbaren, die meßbaren, die integrierbaren und die holomorphen Funktionen. Als Anwendung der grundlegenden Eigenschaften verschiedener Funktionenklassen wird in Analysis IIIa und IIIb eine Einführung in die Lösungstheorie gewöhnlicher Differentialgleichungen, in die Maßtheorie und in die Analysis auf Untermannigfaltigkeiten gegeben. Im Einzelnen werden wir in den 4 Teilen der Vorlesung folgende Schwerpunkte behandeln: Analysis I* (Wintersemester 2006/07): • • • • Reelle und komplexe Zahlen Metrische Räume und ihre topologischen Eigenschaften Folgen und Reihen in Banachräumen Stetige Abbildungen zwischen metrischen Räumen Analysis II* (Sommersemester 2007): • • • Differentialrechnung für Funktionen einer reellen Variablen Differentialrechnung für Funktionen mehrerer reeller Variablen Integralrechnung für Funktionen einer reellen Variablen Analysis IIIa (Wintersemester 2007/08): • • • Mehrdimensionales Riemann-Integral Analysis auf Untermannigfaltigkeiten Gewöhnliche Differentialgleichungen Analysis IIIb (Sommersemester 2008): • • Maß- und Integrationstheorie Funktionentheorie Vorwort IX Einige Lehrbücher zum Analysis-Grundkurs • • • • • • • • • • H. Amann, J. Escher: Analysis I, II und III, Birkhäuser- Verlag M. Barner, F. Flohr: Analysis I und II, de Gruyter-Verlag Th. Bröcker: Analysis I, II und III, Wissenschaftsverlag Mannheim J. Dieudonne: Grundzüge der modernen Analysis, Deutscher Verlag der Wissenschaften K. Endl, W. Luh: Analysis I, II und III, Aula-Verlag Wiesbaden O. Forster: Analysis 1, 2 und 3, Vieweg-Verlag H. Heuser: Lehrbuch der Analysis, Teil 1 und 2, Teubner-Verlag Stuttgart St. Hildebrandt: Analysis 1 und 2, Springer-Verlag K. Königsberger: Analysis 1 und 2, Springer-Verlag W. Walter: Analysis 1 und 2, Springer-Verlag Häufig benutzte Bezeichnungen und Abkürzungen ∀ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . für alle ∃ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . es existiert ∃! . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . es existiert genau ein ⇔ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . genau dann, wenn ⇒ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . daraus folgt := . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ist definiert als (auch :↔) x ∈ M . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .x ist Element der Menge M ∅ . . . . . . . . . . . . . . . . . . . . . . . . . . . leere Menge (Menge, die kein Element enthält) A ⊂ M . . . . . . . . . . . . . . . . . . . . . . . A ist Teilmenge von M , d.h. x ∈ A ⇒ x ∈ M A und B seien Mengen. A ∪ B := {x | x ∈ A oder x ∈ B} heißt die Vereinigung von A und B. A ∩ B := {x | x ∈ A und x ∈ B} heißt der Durchschnitt von A und B. Falls ˙ bezeichnet dann die disjunkte A ∩ B = ∅, heißen A und B disjunkt; A∪B Vereinigung von A und B. A \ B = {x | x ∈ A und x ∈ / B} heißt Differenzmenge. A × B = {(x, y) | x ∈ A und y ∈ B} heißt das Produkt von A und B. Für eine endliche Menge A bezeichnet ♯A die Anzahl ihrer Elemente. Inhaltsverzeichnis 1 Reelle und komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Das Beweisprinzip der vollständigen Induktion . . . . . . . . . . . . . . 1.2 Die reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Die Körpereigenschaften von R . . . . . . . . . . . . . . . . . . . . . . 1.2.2 Die Anordnungseigenschaften von R . . . . . . . . . . . . . . . . . 1.2.3 Vollständigkeitseigenschaft der reellen Zahlen . . . . . . . . . 1.2.4 Die Überabzählbarkeit der Menge der reellen Zahlen . . . 1.2.5 Wurzeln und Potenzen reeller Zahlen . . . . . . . . . . . . . . . . 1.3 Die komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Die Vektorräume Rn und Cn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 6 7 8 11 16 19 26 34 2 Metrische Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Definition und Beispiele metrischer Räume . . . . . . . . . . . . . . . . . 2.2 Offene und abgeschlossene Mengen in metrischen Räumen . . . . 2.3 Folgen in metrischen Räumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Allgemeine Eigenschaften konvergenter Folgen . . . . . . . . 2.3.2 Spezielle Eigenschaften von konvergenten Folgen im Vektorraum Ck bzw. Rk . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.3 Spezielle Eigenschaften konvergenter Folgen in R . . . . . . 2.4 Vollständige metrische Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Kompakte und folgenkompakte Teilmengen metrischer Räume 2.6 Zusammenhängende Teilmengen eines metrischen Raumes . . . . 2.7 Banachräume und Hilberträume . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 39 42 53 54 3 57 62 68 75 84 87 Reihen in Banachräumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 3.1 Konvergenzkriterien für Reihen in Banachräumen . . . . . . . . . . . . 94 3.2 Komplexe Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 3.3 Exponentialfunktion, Logarithmusfunktion und komplexe Potenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 XII Inhaltsverzeichnis 4 Stetige Abbildungen zwischen metrischen Räumen . . . . . . . . 119 4.1 Der Grenzwert einer Abbildung in einem Punkt . . . . . . . . . . . . . 119 4.2 Stetige Abbildungen (Definition und Beispiele) . . . . . . . . . . . . . . 126 4.3 Eigenschaften stetiger Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . 135 4.4 Folgen stetiger Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 4.5 Funktionenreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 4.6 Die trigonometrischen und die Hyperbelfunktionen . . . . . . . . . . 152 4.7 Der metrische Raum der stetigen Abbildungen . . . . . . . . . . . . . . 162 5 Differentialrechnung für Funktionen einer reellen Veränderlichen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 5.1 Differenzierbare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 5.2 Der Mittelwertsatz der Differentialrechnung . . . . . . . . . . . . . . . . . 185 5.3 Differentiation von Funktionenfolgen und -Reihen . . . . . . . . . . . . 196 5.4 Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 6.1 Ableitung, Richtungsableitung und Gradient einer Abbildung . 211 6.2 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222 6.3 Die Taylorentwicklung und Extrema für Funktionen mehrerer reeller Veränderlicher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228 6.4 Der Satz über die Umkehrabbildung . . . . . . . . . . . . . . . . . . . . . . . 232 6.5 Implizite Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239 6.6 Extrema unter Nebenbedingungen . . . . . . . . . . . . . . . . . . . . . . . . . 246 7 Integralrechnung für Funktionen einer reellen Variablen . . . 253 7.1 Stammfunktionen und ihre Berechnung . . . . . . . . . . . . . . . . . . . . . 253 7.2 Das Riemannsche Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267 7.3 Hauptsatz der Differential- und Integralrechnung . . . . . . . . . . . . 282 7.4 Der Mittelwertsatz der Integralrechnung . . . . . . . . . . . . . . . . . . . . 286 7.5 Parameterabhängige Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289 7.6 Uneigentliche Riemannsche Integrale . . . . . . . . . . . . . . . . . . . . . . . 292 7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete . 299 Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317 1 Reelle und komplexe Zahlen Wir gehen davon aus, daß der Aufbau der Zahlbereiche bis zu den reellen Zahlen bekannt ist. Man findet dies zum Beispiel in dem Buch von J. Kramer: Zahlen für Einsteiger (Vieweg-Verlag, 2006). Wir benutzen in dieser Vorlesung die folgenden Bezeichnungen für die Zahlbereiche: N . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge aller natürlichen Zahlen: 1, 2, 3, . . . N0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . N ∪ {0} Z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge aller ganzen Zahlen: 0, ±1, ±2, . . . Q . . . . . . . . . . . . . . . . . . . . . . . Menge aller rationalen Zahlen: { m n | m ∈ Z, n ∈ N} Q+ . . . . . . . . . . . . . . . . . . Menge der positiven rationalen Zahlen: {q ∈ Q | q > 0} R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge der reellen Zahlen R\Q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge der irrationalen Zahlen C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge der komplexen Zahlen Offensichtlich gilt: N ⊂ Z ⊂ Q ⊂ R. Die Zahlbereiche werden bekanntlich aus folgendem Grund erweitert: N ⊂ Z: Die Subtraktion ist durch die Erweiterung immer ausführbar. Seien a, b ∈ N. Die Gleichung x + a = b ist in Z immer lösbar, aber nicht in N. Z ⊂ Q: Die Division ist durch die Erweiterung immer ausführbar. Seien a, b ∈ Z, a 6= 0. Die Gleichung x · a = b ist in Q immer lösbar, aber nicht in Z. Q ⊂ R: Die Erweiterung ist nötig, damit Wurzeln positiver Zahlen existieren. Sei q ∈ Q+ , n ∈ N. Die Gleichung xn = q ist in R immer lösbar, aber nicht in Q. Im Abschnitt 1.1. werden wir zunächst ein wichtiges und oft benutztes Beweisprinzip wiederholen und an Beispielen demonstrieren: das der vollständigen Induktion. Im Abschnitt 1.2. fassen wir die grundlegenden, die Menge der reellen Zahlen charakterisierenden Eigenschaften (ihre Axiome) zusammen und 2 1 Reelle und komplexe Zahlen leiten wesentliche, aus den Axiomen folgende Eigenschaften her. Der Abschnitt 1.3. enthält die Definition und die grundlegenden Eigenschaften der komplexen Zahlen. In Abschnitt 1.4. betrachten wir die Vektorräume Rn und Cn und definieren den Abstand von Vektoren in diesen Vektorräumen. 1.1 Das Beweisprinzip der vollständigen Induktion Die natürlichen Zahlen werden durch auf Peano zurückgehende Axiome (die Peano-Axiome) eingeführt. Aus diesen Axiomen folgt die Induktionseigenschaft für die natürlichen Zahlen, die folgendes besagt: Ist M ⊂ N0 eine Teilmenge der (um Null ergänzten) natürlichen Zahlen, die die folgenden beiden Eigenschaften erfüllt: (1) n0 ∈ M , (2) Ist k ∈ M , so ist auch (k + 1) ∈ M . Dann gilt für diese Menge: {n ∈ N0 | n ≥ n0 } ⊂ M . Als Umformulierung dieser Induktionseigenschaft erhalten wir das Beweisprinzip der vollständigen Induktion. Beweisprinzip der vollständigen Induktion Sei n0 ∈ N0 eine fixierte natürliche Zahl. Für jede Zahl n ∈ N0 mit n ≥ n0 sei eine Aussage A(n) gegeben. Wir setzen voraus, dass die folgenden beiden Bedingungen erfüllt sind: (1) A(n0 ) ist richtig (Induktionsanfang). (2) Falls A(k) richtig ist für eine Zahl k ≥ n0 , so ist auch A(k + 1) richtig. (Induktionsschritt). Dann ist die Aussage A(n) für alle Zahlen n ∈ N0 mit n ≥ n0 richtig. Um einzusehen, dass das Prinzip der vollständigen Induktion aus der Induktionseigenschaft der natürlichen Zahlen folgt, setzen wir M := {n ∈ N0 | Aussage A(n) ist richtig}. Dann gilt: n0 ∈ M (nach Induktionsanfang). Ist k ∈ M , so ist (k + 1) ∈ M (nach Induktionsschritt). Aus der Induktionseigenschaft der natürlichen Zahlen folgt nun, dass A(n) für alle n ≥ n0 richtig ist. 1.1 Das Beweisprinzip der vollständigen Induktion 3 Beispiel 1: Satz 1.1 Für jede natürliche Zahl n ∈ N gilt n X j = 1 + 2 + ... + n = j=1 n(n + 1) . 2 (Aussage A(n)) Beweis. Durch vollständige Induktion. . Induktionsanfang: Die Aussage A(1) ist richtig, denn 1 = 1(1+1) 2 Induktionsschritt : Sei nun eine natürliche Zahl k ≥ 1 gegeben. Wir setzen voraus, dass die Aussage A(k) richtig ist (Induktionsvoraussetzung) und behaupten, dass dann auch die Aussage A(k + 1) richtig ist (Induktionsbehauptung). Induktionsbeweis: k+1 X k X A(k) k(k + 1) + (k + 1) j + (k + 1) = 2 j=1 k (k + 1)(k + 2) = (k + 1) +1 = . 2 2 j= j=1 ⊓ ⊔ Beispiel 2: Satz 1.2 Für jede natürliche Zahl n ∈ N gilt n X j=1 (2j − 1) = n2 . (Aussage A(n)) Beweis. Durch vollständige Induktion. Induktionsanfang: A(1) ist richtig, denn 1 = 1. Induktionsschritt : Induktionsvoraussetzung: A(k) sei richtig. Induktionsbehauptung: A(k + 1) ist richtig. Induktionsbeweis: k+1 X j=1 (2j − 1) = k X j=1 A(k) (2j − 1) + (2(k + 1) − 1) = k 2 + 2k + 1 = (k + 1)2 . ⊓ ⊔ Beispiel 3: Die Fakultät einer natürlichen Zahl. Definition 1.1. Sei n ∈ N. Die Zahl n! := n Y j=1 j = 1 · 2 · 3 · ... · n heißt n–Fakultät. Weiterhin setzen wir 0! := 1 . 4 1 Reelle und komplexe Zahlen Satz 1.3 Die Anzahl an aller Anordnungen von n verschiedenen Objekten ist n!. Beweis. Durch vollständige Induktion. Induktionsanfang: Für n = 1 gilt a1 = 1 = 1!. Induktionsschritt : Induktionsvoraussetzung: Es gelte ak = k!. Induktionsbehauptung: ak+1 = (k + 1)!. Induktionsbeweis: Wir betrachten (k + 1) Objekte O1 , . . . , Ok+1 . Die möglichen Anordnungen dieser Objekte kann man in (k + 1) Klassen Kj mit j ∈ {1, . . . , k + 1} unterteilen: Kj sei die Menge derjenigen Anordnungen, in denen Oj als erstes Element steht, das heißt Kj := {(Oj , Oi1 , . . . , Oik ) | {i1 , i2 , . . . , ik } = {1, . . . , k + 1} \ {j} }. Zj sei die Anzahl der Elemente in Kj . Folglich ist Zj gleich der Anzahl der Anordnungen der k Objekte O1 , . . . , Oj−1 , Oj+1 , . . . , Ok+1 . Nach Induktionsvoraussetzung ist aber die Anzahl der Anordnungen von k Objekten gleich ak = k! . Also gilt ak+1 = k+1 X Zj = j=1 k+1 X j=1 ak = k+1 X j=1 k! = (k + 1) · k! = (k + 1)! . ⊓ ⊔ Beispiel 4: Die Binomialkoeffizienten. Definition 1.2. Sei x ∈ R und k ∈ N. Die Zahl x · (x − 1) · (x − 2) · ... · (x − (k − 1)) x := k! k x k heißt Binomialkoeffizient. Man nennt sie “x über k”. Für k = 0 setzt x man 0 := 1. Satz 1.4 Seien n, k ∈ N und x ∈ R. Dann gilt (1) Ist k > n, so folgt nk = 0. (2) Für 0 ≤ k ≤ n gilt n! n n = = . k!(n − k)! k n−k 1.1 Das Beweisprinzip der vollständigen Induktion 5 (3) Es gilt x x x+1 + = . k k−1 k Beweis. Ist k > n, so tritt im Zähler 0 als Faktor auf. Folglich ist n k = 0. n · (n − 1) · . . . · (n − (k − 1)) n = k! k n! n · (n − 1) · . . . · (n − (k − 1)) · (n − k) · . . . · 2 · 1 = = k! · (n − k)! k! · (n − k)! n = . n−k x · (x − 1) · . . . · (x − (k − 1)) x · (x − 1) · . . . · (x − (k − 2)) x x + = + k! (k − 1)! k k−1 x − (k − 1) x · (x − 1) · . . . · (x − (k − 2)) · +1 = (k − 1)! k | {z } = x+1 = x−(k−1)+k k k x · (x − 1) · . . . · ((x + 1) − (k − 1)) (x + 1) · (k − 1)! k (x + 1) · ((x + 1) − 1) · ((x + 1) − 2) · . . . · ((x + 1) − (k − 1)) = k! x+1 = . k = ⊓ ⊔ Satz 1.5 Seien k und n natürliche Zahlen und sei 1 ≤ k ≤ n. Es bezeichne cnk die Anzahl aller k–elementigen Teilmengen einer n–elementigen Menge. Dann gilt n n ck = . k Insbesondere ist nk ∈ N . Beweis. Der Beweis von Satz 1.5 erfolgt duch vollständige Induktion über n. Induktionsanfang: Es gilt c11 = 1 = 11 , denn aus einer einelementigen Menge kann nur ein Element ausgewählt werden. Induktionsschritt : 6 1 Reelle und komplexe Zahlen Induktionsvoraussetzung: Es gelte cnk = nk ∀ k ∈ {1, . . . , n}. n+1 Induktionsbehauptung: cn+1 = ∀ k ∈ {1, · · · , n + 1}. k k Induktionsbeweis: Bei der Auswahl einer einelementigen Teilmenge aus einer (n + 1)–elementigen Menge hat man (n + 1) verschiedene Möglichkeiten. Es gilt somit: n+1 cn+1 = (n + 1) = . 1 1 Betrachtet man die Anzahl aller (n+1)–elementigen Teilmengen einer (n+1)– elementigen Menge, so gilt offensichtlich n+1 n+1 cn+1 = 1 = . n+1 Es genügt also, die Behauptung für k ∈ {2, · · · , n} zu zeigen. Betrachten wir eine Menge M = {E1 , · · · , En+1 } mit (n + 1) Elementen. Dann zerfallen die k–elementigen Teilmengen von M in zwei disjunkte Klassen: K0 : alle Teilmengen, die En+1 nicht enthalten, und K1 : alle Teilmengen, die En+1 enthalten. Somit ergibt sich: die Anzahl der k–elementigen Teilmengen in Klasse K0 ist gleich der Anzahl der k–elementigen Teilmengen von {E 1 , · · · , En }, also entsprechend der Induktionsvoraussetzung gleich cnk = nk . Die Anzahl der k–elementigen Teilmengen in Klasse K1 ist gleich der Anzahl der (k − 1)– elementigen Teilmengen von {E1 , · · · , En }, also nach Induktionsvoraussetn zung gleich cnk−1 = k−1 . Folglich gilt nach Satz 1.4 cn+1 = k n n n+1 + = . k k−1 k ⊓ ⊔ 1.2 Die reellen Zahlen Im Folgenden setzen wir voraus, dass die reellen Zahlen existieren und dass sie dem Leser bereits bekannt sind. Das Ziel dieses Abschnittes besteht darin, noch einmal die grundlegenden, die reellen Zahlen eindeutig charakterisierenden Eigenschaften (ihre sogenannten “Axiome”) zusammenzustellen und daraus wichtige Rechenregeln abzuleiten. Diese grundlegenden Eigenschaften sind • • • die Körperaxiome, die Anordnungsaxiome und das Vollständigkeitsaxiom. 1.2 Die reellen Zahlen 7 Wir werden in dieser Vorlesung nicht darauf eingehen, ob überhaupt eine Menge existiert, die die obigen drei Axiome erfüllt, und wie und woraus man sie ggf. konstruieren kann. Wir werden auch nicht untersuchen, ob eine Menge, die die obigen Axiome erfüllt, eindeutig bestimmt ist. Für diese Fragen verweisen wir auf eines der Bücher • • • J. Kramer: Zahlen für Einsteiger, Vieweg-Verlag, 2006 H.-D. Ebinghaus: Zahlen, Grundwissen Mathematik, Springer, 2. Aufl. 1988 A. Oberschelp: Aufbau des Zahlensystems, Vandenhoeck & Ruprecht, Göttingen 1976. 1.2.1 Die Körpereigenschaften von R Man kann reelle Zahlen addieren und multiplizieren: (x, y) ∈ R × R 7−→ x + y ∈ R Addition, (x, y) ∈ R × R 7−→ x · y ∈ R Multiplikation. Addition und Multiplikation haben folgende Eigenschaften K1 - K9: Addition: K1: x + y = y + x ∀ x, y ∈ R (Kommutativgesetz der Addition) K2: (x + y) + z = x + (y + z) ∀ x, y, z ∈ R (Assoziativgesetz der Addition) K3: 0 + x = x + 0 = x ∀ x ∈ R (0 ist neutrales Element der Addition) K4: Zu zwei reellen Zahlen x, y ∈ R existiert genau eine reelle Zahl z ∈ R, so dass x + z = y = z + x. Diese Zahl z heißt Differenz zwischen x und y, z := y − x. Insbesondere existiert zu jedem x ∈ R genau ein −x ∈ R mit x + (−x) = 0. (Existenz des negativen Elements). Multiplikation: K5: x · y = y · x ∀ x, y ∈ R (Kommutativgesetz der Multiplikation) K6: (x · y) · z = x · (y · z) ∀ x, y, z ∈ R (Assoziativgesetz der Multiplikation) K7: 1 · x = x · 1 = x ∀ x ∈ R (1 ist das neutrale Element der Multiplikation) K8: Zu jedem x ∈ R, x 6= 0 und jedem y ∈ R existiert genau ein z ∈ R mit x · z = y. Diese Zahl z heißt Quotient von y und x, z := xy . Insbesondere existiert zu jedem x 6= 0 ein inverses Element x1 , so dass x · ( x1 ) = 1. K9: (x + y) · z = x · z + y · z ∀ x, y, z ∈ R (Distributivgesetz). 8 1 Reelle und komplexe Zahlen Definition 1.3. Eine Menge K, auf der zwei Operationen + und · + : K × K −→ K (x, y) 7−→ x + y · : K × K −→ K (x, y) 7−→ x · y mit den Eigenschaften K1 bis K9 gegeben sind, heißt Körper. Wir schreiben den Körper K mit seinen beiden Operationen + und · oft in der Form [K, +, ·]. Der Begriff des Körpers ist ein zentraler algebraischer Begriff und wird in der Algebra-Vorlesung ausführlich behandelt. Körperaxiom der reellen Zahlen [ R, +, · ] ist ein Körper. [ Q, +, · ] ist ebenfalls ein Körper, während [ Z, +, · ] kein Körper ist (zum Beispiel besitzt 2 kein multiplikativ inverses Element in Z). Ein Körper mit zwei Elementen ist durch K := {0, 1} und die Operationen 0 + 0 := 0, 0 + 1 = 1 + 0 := 1, 1 + 1 := 0, 0 · 0 := 0, 0 · 1 = 1 · 0 := 0 und 1 · 1 := 1 gegeben. Bezeichnungen: Für n reelle Zahlen x1 , · · · , xn werden die Summe und das Produkt folgendermaßen abgekürzt: n P xi := x1 + x2 + . . . + xn i=1 Klammern sind wegen K2 und K6 nicht nötig. n Q xi := x1 · x2 · . . . · xn i=1 Für zwei Teilmengen A, B ⊂ R sei A + B := {a + b | a ∈ A, b ∈ B} ⊂ R A · B := {a · b | a ∈ A, b ∈ B} ⊂ R −A := {−a | a ∈ A} ⊂ R. 1.2.2 Die Anordnungseigenschaften von R Außer [ R, +, · ] gibt es noch viele andere Körper. Die Körperaxiome K1-K9 reichen also nicht aus, um R eindeutig zu beschreiben. Auf dem Körper der reellen Zahlen kann man im Gegensatz zu einigen anderen Körpern zusätzlich eine Anordnung einführen. Anordnungseigenschaften von R Der Körper der reellen Zahlen [ R, +, · ] enthält eine Teilmenge von (positiven) reellen Zahlen R+ mit folgenden Eigenschaften: 1.2 Die reellen Zahlen 9 A1: Für jede reelle Zahl x gilt entweder x = 0 oder x ∈ R+ oder x ∈ −R+ , das heißt R ist die disjunkte Vereinigung R = −R+ ∪˙ {0} ∪˙ R+ . A2: Ist x, y ∈ R+ , so gilt x + y ∈ R+ und x · y ∈ R+ . Definition 1.4. Ein Körper [ K, +, · ], in dem eine Teilmenge “positiver Elemente” K+ ⊂ K existiert, so dass A1 und A2 gelten, heißt angeordneter Körper. Anordnungsaxiom der reellen Zahlen Die reellen Zahlen [R, + , · ] sind ein angeordneter Körper. Mittels der Eigenschaften A1 und A2 kann man Elemente von R vergleichen. Definition 1.5. Man sagt “x ist kleiner gleich y” und schreibt x ≤ y, falls y − x ∈ R+ ∪˙ {0}. Aus den Anordnungseigenschaften A1 und A2 erhält man die folgenden Eigenschaften der Relation ≤: O1 : Für alle x, y ∈ R gilt x ≤ y oder y ≤ x. O2 : Für alle x ∈ R gilt x ≤ x Reflexivität O3 : Aus x ≤ y und y ≤ x folgt x = y Antisymmetrie O4 : Aus x ≤ y und y ≤ z folgt x ≤ z Transitivität Bemerkung: Sei M eine Menge und ≤ eine Relation zwischen Elementen von M . Gelten O1 − O4 für ≤, so heißt ≤ reflexive Ordnung auf M . , Aus A1 und A2 folgen außerdem folgende Monotonieeigenschaften von ≤: M1: Aus x ≤ y folgt x + z ≤ y + z für alle z ∈ R. M2: Aus x ≤ y folgt x · z ≤ y · z für alle z ∈ R+ . Bezeichnung: • • Gilt x ≤ y und x 6= y, so schreibt man auch x < y (sprich: “x kleiner als y”). x ≥ y :⇐⇒ y ≤ x bzw. x > y :⇐⇒ y < x. Mittels der Ordnungsrelation können wir Intervalle definieren: Für a ≤ b, a, b ∈ R sei 10 1 Reelle und komplexe Zahlen [a, b] := {x ∈ R | a ≤ x ≤ b} (abgeschlossenes Intervall) (a, b) := {x ∈ R | a < x < b} (offenes Intervall) [a, b) := {x ∈ R | a ≤ x < b} (a, b] := {x ∈ R | a < x ≤ b} (halboffenes Intervall) (halboffenes Intervall) Des Weiteren seien [a, ∞) := {x ∈ R | a ≤ x} (a, ∞) := {x ∈ R | a < x} (−∞, a) := {x ∈ R | x < a} (−∞, a] := {x ∈ R | x ≤ a} R := (−∞, ∞). Sei I eines der Intervalle [a, b], (a, b), [a, b), oder (a, b]. Dann heißt die Zahl L(I) := b − a Länge des Intervalls I. Definition 1.6. Unter dem Betrag einer reellen Zahl x ∈ R versteht man die Zahl x falls x ≥ 0 |x| := −x falls x < 0. Ist I ein Intervall der Länge L, so gilt für x, y ∈ I : |x − y| ≤ L. Satz 1.6 Für den Betrag einer reellen Zahl gelten folgende Eigenschaften: (1) (2) (3) (4) |x| ≥ 0 ∀ x ∈ R, |x| = 0 ⇔ x = 0. |x · y| = |x| · |y| ∀ x, y ∈ R. |x + y| ≤ |x| + |y|. (Dreiecksungleichung) ||x| − |y|| ≤ |x + y|. Beweis. (1) und (2) folgen unmittelbar aus der Definition des Betrages | · | . Zum Beweis von (3) benutzen wir die Monotonieeigenschaften. Wegen x ≤ |x| und −x ≤ |x| bzw. y ≤ |y| und −y ≤ |y| folgt nach Addition dieser Gleichungen x + y ≤ |x| + |y| und −(x + y) ≤ |x| + |y| und folglich |x + y| ≤ |x| + |y| . Zum Beweis von (4) benutzen wir die Dreiecksungleichung und |x| = | − x|: |x| = |(x + y) − y| ≤ |x + y| + |y|, und daher |x| − |y| ≤ |x + y|, |y| = |(x + y) − x| ≤ |x + y| + |x|, Somit erhalten wir ||x| − |y|| ≤ |x + y|. und daher |y| − |x| ≤ |x + y|. ⊓ ⊔ 1.2 Die reellen Zahlen 11 Die bisherigen Eigenschaften (Körpereigenschaften K1-K9, Anordnungseigenschaften A1-A2) bestimmen [ R, +, · ] noch immer nicht eindeutig. Sie gelten zum Beispiel auch für den Körper der rationalen Zahlen [ Q, +, · ]. Die reellen Zahlen R haben aber eine grundsätzlich andere Eigenschaft als die rationalen Zahlen Q : die Vollständigkeit. 1.2.3 Vollständigkeitseigenschaft der reellen Zahlen Es gibt viele verschiedene Möglichkeiten die Vollständigkeitseigenschaft der reellen Zahlen zu beschreiben. Alle diese sind äquivalent. Wir benutzen hier die Existenz der Schnittzahl von Dedekindschen Schnitten. Definition 1.7. Ein Dedekindscher Schnitt von R ist eine Zerlegung ˙ R = A∪B der reellen Zahlen in zwei disjunkte, nichtleere Teilmengen A und B mit der Eigenschaft, dass jedes Element a ∈ A kleiner als jedes Element b ∈ B ist, das heißt a<b ∀ a ∈ A, ∀ b ∈ B. Bezeichnung für Dedekindsche Schnitte: (A | B) Bemerkung: Die Definition eines Dedekindschen Schnittes ist in jedem angeordneten Körper möglich, da eine Relation “<” definiert ist; zum Beispiel in [Q, +, · ]. Beispiel: Sei a ∈ R eine reelle Zahl. A = (−∞, a], B = (a, ∞) A = (−∞, a), B = [a, ∞) (A | B) Dedekindsche Schnitte. Definition 1.8. Sei (A | B) ein Dedekindscher Schnitt von R. Eine Zahl s ∈ R heißt Schnittzahl von (A | B), falls a ≤ s ≤ b für alle a ∈ A und b ∈ B. ˙ , ist s entweder das größte Element von A (falls s ∈ A) oder Wegen R = A∪B das kleinste Element von B (falls s ∈ B). Vollständigkeitsaxiom (V) der reellen Zahlen Jeder Dedekindsche Schnitt (A | B) von R besitzt eine eindeutig bestimmte Schnittzahl Bemerkungen: Die Vollständigkeitseigenschaft gilt nicht in jedem angeordneten Körper, zum 12 1 Reelle und komplexe Zahlen √ Beispiel√nicht im Körper [ Q, +, · ]: Seien nämlich A = (−∞, 2] ∩ Q und ˙ . Somit bilden A und B einen B = ( 2, +∞) ∩ Q. Dann gilt Q = A∪B Dedekindschen Schnitt von Q. Dieser hat √ aber in Q keine Schnittzahl. (Wir werden noch sehen, dass die Zahl 2 nicht rational ist). Definition 1.9. Ein angeordneter Körper [ K, +, · ] mit der Eigenschaft (V), das heißt in dem jeder Dedekindsche Schnitt eine Schnittzahl hat, heißt vollständig. Zusammenfassung: Die reellen Zahlen [R, +, · ] bilden einen vollständigen, angeordneten Körper. Bemerkung: Zwei vollständige, angeordnete Körper [ K1 , +, · ] und [ K2 , +, · ] sind isomorph (dies beweisen wir hier nicht). Somit sind die reellen Zahlen [R, +, ·] (bis auf Isomorphie) der einzige vollständige, angeordnete Körper. Die reellen Zahlen R sind somit durch die Körpereigenschaften K1-K9, die Anordnungseigenschaften A1, A2 und die Vollständigkeitseigenschaft V (bis auf Isomorphie) eindeutig bestimmt. Wir beweisen nun einige Eigenschaften der reellen Zahlen, die aus der Vollständigkeitseigenschaft (V) folgen. Definition 1.10. 1. Eine Teilmenge A ⊂ R heißt von oben beschränkt, falls eine Zahl M ∈ R existiert, so dass a ≤ M für alle a ∈ A gilt. Eine solche Zahl M heißt obere Schranke von A. 2. Eine Teilmenge A ⊂ R heißt von unten beschränkt, falls eine Zahl m ∈ R existiert, so dass m ≤ a für alle a ∈ A gilt. Eine solche Zahl m heißt untere Schranke von A. 3. Eine Teilmenge A ⊂ R heißt beschränkt, falls sie sowohl von unten als auch von oben beschränkt ist. Definition 1.11. Sei A ⊂ R. 1. Eine Zahl M0 ∈ R heißt Supremum von A, falls sie die kleinste obere Schranke von A ist, das heißt falls a) a ≤ M0 ∀ a ∈ A , b) für jedes ε > 0 existiert ein a ∈ A, so dass M0 − ε < a . 2. Eine Zahl m0 ∈ R heißt Infimum von A, falls sie die größte untere Schranke von A ist, das heißt falls a) m0 ≤ a ∀a ∈ A , b) für jedes ε > 0 existiert ein a ∈ A, so dass a < m0 + ε . 1.2 Die reellen Zahlen 13 Bezeichnung: Falls das Supremum bzw. das Infimum einer Menge A ⊂ R existiert, so bezeichnen wir es mit sup A := Supremum von A inf A := Infimum von A. Offensichtlich existiert höchstens ein Supremum und höchstens ein Infimum einer Menge A ⊂ R. Aus der Vollständigkeitseigenschaft von R erhält man die folgende Aussage über die Existenz von Supremum bzw. Infimum. Satz 1.7 Jede nach oben beschränkte, nichtleere Menge A ⊂ R besitzt ein Supremum. Jede nach unten beschränkte, nichtleere Menge A ⊂ R besitzt ein Infimum. Beweis. (1) Sei A ⊂ R von oben beschränkt. Wir betrachten die Menge X := {M ∈ R | a ≤ M ∀ a ∈ A}. Da A von oben beschränkt ist, ist X 6= ∅. Es sei Y := R \ X. Dann gilt: ˙ a) R = Y ∪X. b) Sei y ∈ Y und x ∈ X. Da y ∈ / X, existiert ein a ∈ A mit y < a. Andererseits ist a ≤ x nach Definition von X. Folglich gilt y < x für alle y ∈ Y und x ∈ X. Also ist (Y | X) ein Dedekindscher Schnitt von R. Nach dem Vollständigkeitsaxiom (V) von R existiert eine Schnittzahl M0 dieses Dedekindschen Schnittes, also eine Zahl M0 ∈ R mit y ≤ M0 ≤ x ∀ y ∈ Y, x ∈ X. Wir zeigen, dass die Schnittzahl M0 in X liegt. Wir führen diesen Beweis indirekt. Wir nehmen an, dass M0 ∈ / X und führen dies zum Widerspruch. Ist M0 ∈ / X, so ist M0 das größte Element von Y . Nach Definition von Y gibt es ein a0 ∈ R mit M0 < a0 . Dann ist wegen der Monotonieeigenschaft von < aber auch a0 a0 M 0 + a0 < + = a0 M0 < 2 2 2 und folglich M 0 + a0 ∈ Y. 2 Dann kann M0 aber nicht das größte Element von Y sein, d.h. wir erhalten wir einen Widerspruch. Unsere Annahme war demnach falsch. Folglich ist M0 ∈ X, also eine obere Schranke von A. Als Schnittzahl von (Y | X) ist M0 das kleinste Element von X, also die kleinste obere Schranke von A. Das zeigt, dass M0 = sup A. Der Beweis der 2. Aussage des Satzes wird analog geführt. ⊓ ⊔ 14 1 Reelle und komplexe Zahlen Definition 1.12. 1. Sei A ⊂ R eine nach oben beschränkte Menge. Liegt das Supremum von A in A, so nennt man es auch das Maximum von A und schreibt dafür max A. 2. Sei A ⊂ R eine nach unten beschränkte Menge. Liegt das Infimum von A in A, so nennt man es auch das Minimum von A und schreibt dafür min A. Wir leiten aus Satz 1.7 einige Folgerungen ab. Folgerung 1.1 (Archimedisches Axiom der reellen Zahlen) Die Menge der natürlichen Zahlen N ⊂ R ist nicht nach oben beschränkt, das heißt zu jedem x ∈ R existiert ein n ∈ N mit x < n. Das gleiche gilt auch für jede unendliche Teilmenge N von N. Beweis. Wir führen den Beweis indirekt. Angenommen N (bzw. N ) ist nach oben beschränkt. Dann existiert nach Satz 1.7 das Supremum M0 = sup N. Es sei M := M0 − 21 . Da M0 die kleinste obere Schranke ist, existiert ein m ∈ N, mit M0 − 12 < m. Folglich ist M0 < m + 1 < m + 1. 2 Da aber m + 1 ∈ N ist, kann M0 keine obere Schranke sein. Dies ergibt den Widerspruch. ⊓ ⊔ Folgerung 1.2 1. Zu jedem ε ∈ R+ existiert ein n ∈ N mit n1 < ε. 2. Zu jedem q ∈ N, q 6= 1, und ε ∈ R+ existiert ein n ∈ N mit 1 qn <ε Beweis. Zu 1) Zur Zahl 1ε ∈ R existiert nach dem Archimedischen Axiom ein n ∈ N mit 1ε < n. Folglich gilt n1 < ε. Zum Beweis der 2. Aussage setzen wir N := {q n | n ∈ N}. N ist eine unendliche Teilmenge von N. Den Beweis kann man dann analog zu 1) führen. ⊓ ⊔ Folgerung 1.3 Sei A ⊂ Z eine nichtleere, nach oben (unten) beschränkte Menge ganzer Zahlen. Dann besitzt A ein Maximum (Minimum). 1.2 Die reellen Zahlen 15 Beweis. Sei A nach unten beschränkt und d = inf A. Nach dem Archimedischen Axiom existiert ein n0 ∈ N mit |d| < n0 . Das heißt, es gilt −n0 < d und somit 0 < d + n0 < a + n0 für alle a ∈ A. Betrachten wir nun die Menge A0 := {a + n0 | a ∈ A} ⊂ N. Wir zeigen, dass diese Menge ein kleinstes Element besitzt. Sei k ∈ A0 und bezeichne (A0 )k := {x ∈ A0 | x ≤ k}. Die Menge (A0 )k ist endlich und besitzt deshalb ein kleinstes Element m0 (siehe Übungsaufgabe 5). Dann ist m0 auch das kleinste Element von A0 und m0 − n0 das kleinste Element von A . Folglich gilt m0 − n0 = min A. Ist A von oben beschränkt, so ist max A = − min(−A). ⊓ ⊔ Satz 1.8 (Q liegt dicht in R) Seien x, y ∈ R und x < y. Dann existiert eine rationale Zahl q ∈ Q mit x<q<y. Beweis. Wir wählen ein n ∈ N mit 1 n < y − x und setzen A := {z ∈ Z | z > n · x}. Wiederum nach dem Archimedischen Axiom ist A nicht leer und besitzt, da von unten beschränkt, ein Minimum (Folgerung 1.3). Sei m0 = min A. Dann gilt m0 ∈ A und m0 − 1 ∈ / A. Folglich ist mn0 > x und m0n−1 ≤ x. Wir erhalten somit m0 m0 − 1 1 x< = + < x + (y − x) = y n n n ⊓ ⊔ und folglich liegt die rationale Zahl q := mn0 im Intervall (x, y). Definition 1.13. Eine Familie abgeschlossener Intervalle In ⊂ R, n ∈ N, heißt Intervallschachtelung, wenn gilt: 1. In ⊂ Im ∀ n > m 2. Zu jeder positiven Zahl ε ∈ R+ existiert ein n ∈ N mit L(In ) < ε. Satz 1.9 (Prinzip der Intervallschachtelung) Sei I1 ⊃ I2 ⊃ I3 ⊃ · · · eine Intervallschachtelung. Dann existiert genau eine reelle Zahl x ∈ R, so dass x ∈ In für alle n ∈ N, das heißt ∞ \ n=1 In = {x}. Beweis. 1. Existenz: Sei In = [an , bn ]. Da In ⊂ Im für alle n ≥ m, folgt am ≤ an ≤ bn ≤ bm . (∗) 16 1 Reelle und komplexe Zahlen Wir betrachten die Menge der unteren Intervallgrenzen A := {an | n ∈ N} ⊂ R. A ist nach oben beschränkt, zum Beispiel durch b1 , hat also nach Satz 1.7 ein Supremum. Sei x = sup A. Wir zeigen, dass x ∈ In für alle n ∈ N. Nach Definition ist an ≤ x. Es bleibt zu zeigen, dass x ≤ bn für alle n ∈ N. Angenommen x > bm für ein m ∈ N. Da x die kleinste obere Schranke von A ist, kann bm keine obere Schranke von A sein. Somit existiert ein an ∈ A, so dass an > bm . Dies widerspricht aber der Schachtelungseigenschaft (∗). Folglich war die Annahme falsch, das heißt x ≤ bn für alle n ∈ N und somit gilt an ≤ x ≤ bn , also x ∈ In für alle n ∈ N. 2. Eindeutigkeit: Angenommen es gäbe zwei Zahlen x, y ∈ R mit x 6= y und x, y ∈ In für alle n ∈ N. Sei ε = |x − y| > 0. Dann existiert ein Intervall In0 mit L(In0 ) < ε. Da |x − y| > L(In0 ), können aber nicht beide Zahlen x, y in ⊓ ⊔ In0 liegen. Damit ist die Eindeutigkeit von x gezeigt. Bemerkung: Die Vollständigkeitseigenschaft eines angeordneten Körpers kann man durch das Intervallschachtelungsprinzip oder die Existenz des Supremums ersetzen. Es gilt: Sei [K, +, ·] ein angeordneter Körper. Dann sind folgende Aussagen äquivalent: 1. Jeder Dedekindsche Schnitt von K besitzt eine Schnittzahl. 2. Jede nach oben beschränkte Teilmenge von K besitzt ein Supremum. 3. Es gilt das Intervallschachtelungsprinzip und das Archimedische Axiom. Die Implikation: 1. =⇒ 2. =⇒ 3. haben wir bewiesen. Die Umkehrung werden wir hier nicht beweisen. 1.2.4 Die Überabzählbarkeit der Menge der reellen Zahlen Wir beweisen mit Hilfe des Vollständigkeitsaxioms, dass die Menge der reellen Zahlen nicht abzählbar ist. Dazu zunächst einige Definitionen. Definition 1.14. Seien X und Y zwei nichtleere Mengen. Eine Abbildung f : X −→ Y heißt • • • injektiv, falls f (x1 ) 6= f (x2 ) für alle x1 , x2 ∈ X mit x1 6= x2 . surjektiv, falls für jedes y ∈ Y ein x ∈ X mit f (x) = y existiert. bijektiv, falls f injektiv und surjektiv ist, d.h. falls für jedes y ∈ Y genau ein x ∈ X mit f (x) = y existiert. Definition 1.15. Eine Menge A heißt abzählbar, wenn es eine bijektive Abbildung f : N −→ A von der Menge der natürlichen Zahlen auf die Menge A gibt. (Es existiert also zu jedem a ∈ A genau ein n ∈ N mit f (n) = a). 1.2 Die reellen Zahlen 17 Die bijektive Abbildung f liefert uns eine Abzählvorschrift für A: Mit der Bezeichnung an := f (n) ist nämlich A = {a1 , a2 , a3 , . . .} mit ai 6= aj für i 6= j. Eine Menge A heißt überabzählbar, wenn sie weder leer, noch endlich oder abzählbar ist. Wir sagen, die Menge A ist höchstens abzählbar, wenn sie leer, endlich oder abzählbar ist. Beispiele: 1. Die Menge der natürlichen Zahlen N und die Menge N0 sind abzählbar. 2. Die Menge der ganzen Zahlen Z ist abzählbar, denn fZ : N −→ Z 2k 7−→ k 2k + 1 7−→ −k ist eine bijektive Abbildung zwischen N und Z. Satz 1.10 Die Menge Q der rationalen Zahlen ist abzählbar. Beweis. (1. Cantorsches Diagonalisierungsverfahren). Wir geben zunächst eine Abzählvorschrift der Menge Q+ der positiven rationalen Zahlen an. Jede Zahl q ∈ Q+ sei als Bruch dargestellt: q= n , m n, m teilerfremde, natürliche Zahlen. Wir betrachten das folgende Schema, das die Paare (n, m) als Punkte eines ebenen Gitters darstellt. Dabei werden Punkte ausgelassen, für die m und n nicht teilerfremd sind. 18 1 Reelle und komplexe Zahlen m6 5 4 3 2 1 1 6 I 1 5 6 1 4 I 1 3 6 1 2 I 1 1 2 5 I R 3 4 2 3 I R I R 4 3 3 2 I I R I 5 2 2 R 3 4 R 5 2 3 4 5 6 n Die Gitterpunkte werden nun längs des im Gitter gezeichneten Streckenzuges nummeriert. Dadurch erreicht man alle Punkte des konstruierten Gitters und erhält somit eine bijektive Abbildung ϕ : N −→ Q+ . Diese Abzählung beginnt offensichtlich mit: 1, 2, 3 2 1 1 1 1 , , 3, 4, , , , , 5, · · · 2 3 2 3 4 5 Wir erweitern nun ϕ zu einer bijektiven ϕ(n) 0 φ(n) := −ϕ(−n) Abbildung φ : Z −→ Q mittels falls n ∈ N falls n = 0 falls n ∈ Z, n < 0. Die Abbildung φ ◦ fZ : N −→ Z −→ Q bildet N bijektiv auf Q ab. Somit ist Q abzählbar. ⊓ ⊔ Satz 1.11 Die Menge R der reellen Zahlen ist überabzählbar. Beweis. Angenommen, es existiert eine Abzählung von R, d.h. es gilt R = {x1 , x2 , x3 , . . .}. Zu dieser Abzählung konstruieren wir induktiv eine Intervallschachtelung 1.2 Die reellen Zahlen 19 I1 ⊃ I2 ⊃ I3 ⊃ I4 ⊃ I5 ⊃ . . . Es sei I1 := [ x1 + 1, x1 + 4 ]. 3 Offensichtlich ist x1 ∈ / I1 und L(I1 ) = 13 . Aus einem schon vorhandenen Intervall In konstruieren wir In+1 wie folgt: Wir teilen In in drei gleichlange, abgeschlossene Intervalle und wählen als In+1 eines dieser Teilintervalle, das xn+1 nicht enthält. Für die so konstruierte Folge von Intervallen gilt I1 ⊃ I2 ⊃ I3 ⊃ I4 ⊃ . . . xn ∈ / In L(I1 ) = 31 , L(I2 ) = 312 , . . . , L(In ) = 1 3n . Somit ist I1 ⊃ I2 ⊃ I3 ⊃ . . . eine Intervallschachtelung. Sei nun x ∈ ∞ T In . n=1 Nach Annahme war R = {x1 , x2 , x3 , x4 , . . .}. Es muß also ein k0 ∈ N mit x = xk0 geben. Dann ist xk0 ∈ Ik0 . Dies widerspricht aber der Konstruktion der Intervalle. Somit war die Annahme der Abzählbarkeit von R falsch. ⊓ ⊔ Definition 1.16. Zwei Mengen A und B heißen gleichmächtig, falls eine bijektive Abbildung f : A −→ B existiert. Die Menge B hat eine größere Mächtigkeit als A, falls A zu einer Teilmenge von B gleichmächtig ist, aber B zu keiner Teilmenge von A. Die Mengen N, Z und Q sind gleichmächtig. Die Menge R hat eine größere Mächtigkeit als diese drei Mengen. Kontinuumshypothese (1878): (Georg Cantor [1845–1918]) Es gibt keine Menge A, deren Mächtigkeit größer als die von N und kleiner als die von R ist. Diese Hypothese leitete die Entwicklung der Mengenlehre ein. Sie ist (auf der Basis der heute zugrundegelegten Axiome der Mengenlehre) weder beweisbar noch widerlegbar. Solche Fragen werden in den Vorlesungen über mathematische Logik behandelt. 1.2.5 Wurzeln und Potenzen reeller Zahlen In diesem Abschnitt behandeln wir einige wichtige Gleichungen und Ungleichungen für Potenzen und Wurzeln reeller Zahlen. Sei x ∈ R eine reelle Zahl. Die Potenz xn für n ∈ N0 definieren wir induktiv durch: x0 := 1, x1 := x, x2 := x · x , . . . , xn+1 := xn · x. 20 1 Reelle und komplexe Zahlen Für x 6= 0 setzen wir x−n := 1 . xn Damit ist die k–te Potenz xk für jede ganze Zahl k ∈ Z und jede reelle Zahl x ∈ R, x 6= 0, definiert. Aus den Körper- und Anordnungseigenschaften der reellen Zahlen folgt sofort 1. Für x ∈ R mit x 6= 0 und k, l ∈ Z gilt xk · xl = xk+l , xk·l = (xk )l und (x · y)k = xk · y k . 2. Ist 0 < x < y, dann gilt xn < y n für alle n ∈ N. Satz 1.12 (Binomischer Satz) Seien x, y ∈ R. Dann gilt für jedes n ∈ N (x + y)n = n X n k n−k x ·y . k k=0 Beweis. Wir führen den Beweis durch vollständige Induktion über n: Induktionsanfang: n = 1: 1 0 1 1 1 0 x ·y + x · y = x + y. 0 1 Induktionsschritt : Induktionsvoraussetzung: Für ein fixiertes n ∈ N gilt (x + y)n = n X n k n−k x ·y . k k=0 Induktionsbehauptung: (x + y)n+1 = n+1 X k=0 Induktionsbeweis: n + 1 k n−k+1 x ·y . k 1.2 Die reellen Zahlen 21 (x + y)n+1 = (x + y)n · (x + y) ! n X n k n−k IV · (x + y) = x ·y k k=0 n n X X n k n k n+1−k n−k = x ·x·y + x ·y k k k=0 k=0 n n X n k+1 n+1−(k+1) X n k n+1−k = x ·y + x ·y k k k=0 = k=0 n+1 X n X n n l (n+1)−l xl · y (n+1)−l + x ·y l−1 l l=1 = l=1 1.4 = l=0 n X n n n n+1 0 n 0 n+1 + xl · y (n+1)−l + x y + x y l l−1 n 0 n+1 X n + 1 l (n+1)−l x ·y . l l=0 ⊓ ⊔ Aus dem Binomischen Satz 1.12 ergibt sich die Folgerung 1.4 n P 1. (1 + x)n = 2. 3. n P k=0 n P k=0 n k k=0 = 2n , (−1)k n k k x , n k = 0. Beweis. (1) ist der Binomische Satz für y = 1, (2) ist der Binomischer Satz für x = y = 1 und (3) ist der Binomischer Satz für x = −1, y = 1. ⊓ ⊔ Satz 1.13 (Bernoullische Ungleichung) Für jede reelle Zahl x ≥ −1 und für jedes n ∈ N gilt: (1 + x)n ≥ 1 + n x. Beweis. Beweis durch vollständige Induktion über n. Induktionsanfang: Die Aussage gilt offensichtlich für n = 1. Induktionsschritt : Induktionsvoraussetzung: Für ein fixiertes n ∈ N gilt (1 + x)n ≥ 1 + nx. Induktionsbehauptung: (1 + x)n+1 ≥ 1 + (n + 1) x. Induktionsbeweis: 22 1 Reelle und komplexe Zahlen IV (1+x)n+1 = (1+x)n (1+x) ≥ (1+n x)(1+x) = 1+(n+1) x+n x2 ≥ 1+(n+1) x. |{z} ≥0 Als Anwendung erhält man unmittelbar ⊓ ⊔ Folgerung 1.5 1. Sei y ∈ R, y > 1, und r ∈ R+ . Dann existiert ein n ∈ N, so daß y n > r. 2. Sei y ∈ R, 0 < y < 1 und r ∈ R+ . Dann existiert ein n ∈ N mit y n < r. Beweis. Sei r ∈ R+ und y > 1. Nach dem Archimedischen Axiom für reelle r Zahlen existiert eine natürliche Zahl n ∈ N, so daß n > y−1 . Dann folgt mit der Bernoullischen Ungleichung y n = (1 + (y − 1))n ≥ 1 + n (y − 1) ≥ n (y − 1) > r. Ist 0 < y < 1, so wenden wir das eben Bewiesene auf die reelle Zahl y1 > 1 an ⊔ und erhalten eine natürliche Zahl n ∈ N mit ( y1 )n > r1 und somit y n < r. ⊓ Satz 1.14 (Geometrische Summe) Für jede reelle Zahl x 6= 1 und jede natürliche Zahl n gilt: n X 1 − xn+1 xk = . 1−x k=0 Beweis. Beweis durch vollständige Induktion über n. Induktionsanfang: n = 1: (1 − x)(1 + x) 1 − x2 = = 1 + x = x0 + x1 . 1−x 1−x Induktionsschritt : Induktionsvoraussetzung: Die Behauptung ist für ein fixiertes n richtig. Induktionsbehauptung: n+1 X xk = k=0 Induktionsbeweis: n+1 X k=0 xk = n X k=0 1 − xn+2 . 1−x xk + xn+1 n+1 IV 1 − x = + xn+1 1−x 1 − xn+1 + xn+1 (1 − x) = 1−x n+2 1−x = . 1−x 1.2 Die reellen Zahlen 23 ⊓ ⊔ Wir beweisen nun die Existenz der n-ten Wurzel einer positiven reellen Zahl. Satz 1.15 Sei x ∈ R+ eine positive reelle Zahl und n ∈ N. Dann existiert genau eine positive reelle Zahl y ∈ R+ mit y n = x. √ Bezeichnung: y := n x heißt die n–te Wurzel aus x. Beweis. Zum Beweis benutzen wir das Intervallschachtelungsprinzip. Es genügt, den Fall x > 1 zu behandeln. Den Fall x < 1 führt man durch Übergang zu x′ = x1 darauf zurück. Wir definieren induktiv die folgende Folge abgeschlossener Intervalle: Wir setzen I1 := [1, x]. Sei Ik := [ak , bk ] bereits konstruiert. Dann definieren wir Ik+1 k der Mittelpunkt von Ik . Wir setzen durch Halbierung von Ik : Sei m = ak +b 2 dann [ak , m] falls mn ≥ x Ik+1 = [ak+1 , bk+1 ] := [m, bk ] falls mn < x. Dann gilt nach Konstruktion: 1. I1 ⊃ I2 ⊃ I3 ⊃ . . .. k−1 2. L(Ik ) = (x − 1) · 12 für alle k ∈ N. 3. ank ≤ x ≤ bnk für alle k ∈ N. Wir erhalten also ineinander geschachtelte Intervalle, deren Längen nach Folgerung 1.2 beliebig klein werden. Nach dem Intervallschachtelungsprinzip existiert genau eine reelle Zahl y ∈ R mit y ∈ Ik für jedes k ∈ N. Wir zeigen nun, dass y n = x gilt. Dazu betrachten wir die Intervalle Jk := [ank , bnk ]. Da Ik ⊃ Ik+1 , gilt wegen der Monotonie der Potenzen auch Jk ⊃ Jk+1 . Für die Länge von Jk erhalten wir L(Jk ) = bnk − ank = (bk − ak )(bkn−1 + bkn−2 ak + . . . + bk akn−2 + akn−1 ) akn−1 a2k ak n−1 + 2 + . . . + n−1 = L(Ik ) · bk 1+ bk bk bk 1 ≤ (x − 1) · k−1 · b1n−1 · n 2 Nach Folgerung 1.2 gibt es zu jedem ε > 0 ein k ∈ N mit L(Jk ) ≤ ε. Die Folge der Intervalle Jk ist also eine Intervallschachtelung. Nach Konstruktion gilt aber sowohl x ∈ Jk (Eigenschaft 3.) als auch y n ∈ Jk für alle k ∈ N. Da der ∞ T Jk nur ein Element enthält, folgt x = y n . Durchschnitt k=1 Die Eindeutigkeit der Zahl y ∈ R+ mit y n = x ist klar, denn ist z.B. y1 < y2 , so folgt y1n < y2n . ⊓ ⊔ 24 1 Reelle und komplexe Zahlen Bemerkung: Die Gleichung y n = x hat für gerade n zwei reelle Lösungen √ √ y1 = n x und y2 = − n x. Die Eindeutigkeitsaussage von Satz 1.15 gilt also nur in R+ . Die Gleichung y n = x ist in Q im allgemeinen nicht lösbar. √ Satz 1.16 Seien n und k natürliche Zahlen. Dann ist n k genau dann eine rationale Zahl, falls k die n–te Potenz einer natürlichen Zahl ist, das heißt falls k = mn für ein m ∈ N. Insbesondere gilt: √ • Für jede Primzahl p und jedes n > 1 ist die Zahl n p irrational. √ √ n n • Wenn k rational ist, so ist k sogar eine natürliche Zahl. Beweis. √ 1. (⇐=): Sei k√= mn mit m ∈ N. Dann ist per Definition m := n k ∈ N ⊂ Q. 2. (=⇒): Sei n k ∈ Q. Dann existieren teilerfremde Zahlen m, q ∈ N, so dass √ n m n mn n n k= m q . Nach Definition erhält man k = ( q ) = qn und somit kq = m . Wir zeigen nun, dass q = 1 gilt. Angenommen q > 1. Dann existiert eine Primzahl p > 1, die q teilt. Folglich teilt p auch kq n = mn , das heißt p teilt auch m. Das ist aber ein Widerspruch dazu, dass q und m teilerfremd sind. Somit ist q = 1 und k = mn für m ∈ N. ⊓ ⊔ Wir können jetzt die Potenzen mit rationalen Exponenten definieren. Definition 1.17. Sei x ∈ R+ eine positive reelle Zahl und q ∈ Q eine rationale n , n ∈ Z, m ∈ N. Dann sei Zahl mit der Darstellung q = m √ n xq := m x . Diese Definition ist korrekt, d.h. unabhängig von der Wahl der Darstellung von q. Die folgenden Eigenschaften für die Potenzen mit rationalen Exponenten sind leicht nachzuprüfen: Seien p, q ∈ Q und x, y ∈ R+ . Dann erhält man: 1. xq · xp = xp+q , (xq )p = xp·q , xq · y q = (xy)q . 2. Sei p < q. Dann gilt xp < xq falls x > 1 und xp > xq falls 0 < x < 1. 3. Sei 0 < x < y. Dann gilt xq < y q falls q > 0 und xq > y q falls q < 0. Wir werden auf die Potenzen und ihre Eigenschaften später zurückkommen. Abschließend beweisen wir eine Ungleichung zwischen dem geometrischen und dem arithmetischen Mittel von n positiven reellen Zahlen. 1.2 Die reellen Zahlen 25 Definition 1.18. Seien a1 , a2 , . . . , an positive reelle Zahlen. Dann heißen die Zahlen a1 + a2 + . . . + a n n √ G(a1 , . . . , an ) := n a1 · a2 · . . . · an A(a1 , . . . , an ) := arithmetisches Mittel geometrisches Mittel von a1 , a2 , . . . , an . Satz 1.17 Für alle positiven reellen Zahlen a1 , a2 , . . . , an gilt √ a1 + a2 + . . . + a n n . a1 · a2 · . . . · an ≤ n Die Gleichheit tritt nur dann auf, wenn a1 = a2 = . . . = an . Beweis. Das arithmetische und das geometrische Mittel ist homogen, d.h. für ein λ ∈ R+ gilt A(λa1 , . . . , λan ) = λ · A(a1 , . . . , an ) und G(λa1 , . . . , λan ) = λ · G(a1 , . . . , an ). Es genügt deshalb, den Beweis für den Fall A(a1 , . . . , an ) = 1 zu führen. (Wir setzen im anderen Fall λ = A−1 ). Wir zeigen mit vollständiger Induktion über n: Sind a1 , . . . , an positive reelle Zahlen mit a1 + a2 + . . . + an = n, so gilt a1 · a2 · . . . · an ≤ 1 und die Gleichheit tritt nur auf, wenn a1 = a2 = . . . = an = 1. Induktionsanfang: n = 1. In diesem Fall gilt die Behauptung offensichtlich. Induktionsschritt : Die Aussage gelte für ein n ∈ N. Wir müssen sie dann für n + 1 beweisen. Für a1 = a2 = . . . = an+1 = 1 gilt die Aussage. Seien also a1 , a2 , . . . , an+1 positive Zahlen mit a1 + a2 + . . . + an+1 = n + 1, von denen eine von 1 verschieden ist. OBdA sei a1 < 1 und a2 > 1. Dann ist 0 < (1 − a1 )(a2 − 1) = a1 + a2 − 1 − a1 · a2 und somit a1 · a2 < a1 + a2 − 1. (∗) Außerdem gilt (a1 + a2 − 1) + a3 + . . . + an+1 = n. Wir wenden die Induktionsvoraussetzung auf die n Summanden der letzten Gleichung an und erhalten mit (*) (∗) 1 ≥ (a1 + a2 − 1) · a3 · . . . · an+1 > (a1 · a2 ) · a3 · . . . · an+1 . Damit ist der Satz bewiesen. ⊓ ⊔ 26 1 Reelle und komplexe Zahlen 1.3 Die komplexen Zahlen Für jede von Null verschiedene reelle Zahl x gilt x2 > 0. Man kann im Zahlbereich der reellen Zahlen also keine Wurzeln aus negativen Zahlen ziehen. Insbesondere gibt es keine reelle Lösung der Gleichung x2 = −1. Die komplexen Zahlen sind eine Erweiterung der reellen Zahlen, die es möglich macht, auch Wurzeln aus negativen Zahlen zu ziehen. Dazu betrachten wir die Menge der Paare reeller Zahlen R2 := R × R := {(a, b) | a, b ∈ R} und führen auf dieser Menge eine Addition + : R2 × R2 −→ R2 und eine Multiplikation · : R2 × R2 −→ R2 ein. Zwei Paare z1 = (a1 , b1 ) und z2 = (a2 , b2 ) aus R2 addieren bzw. multiplizieren wir nach folgenden Regeln: z1 + z2 := (a1 , b1 ) + (a2 , b2 ) = (a1 + a2 , b1 + b2 ) z1 · z2 := (a1 , b1 ) · (a2 , b2 ) = (a1 a2 − b1 b2 , a1 b2 + a2 b1 ). (1.1) (1.2) Die mit dieser Addition und Multiplikation ausgestattete Menge R2 bezeichnet man mit dem neuen Symbol C, d.h. C := R2 , um auszudrücken, dass man außer der üblichen Addition (1.1) der reellen Paare auch noch die Multiplikation (1.2) festgelegt hat. Die Elemente von C heißen komplexe Zahlen. Satz 1.18 Die komplexen Zahlen [C, +, ·] bilden einen Körper. Es gelten also folgende Rechenregeln für die Addition + und die Multiplikation · K1: z1 + z2 = z2 + z1 für alle z1 , z2 ∈ C. K2: (z1 + z2 ) + z3 = z1 + (z2 + z3 ) für alle z1 , z2 , z3 ∈ C. K3: Die komplexe Zahl 0 := (0, 0) ist das neutrale Element der Addition, das heißt es gilt 0 + z = z + 0 = z für alle z ∈ C. K4: Zu je zwei komplexen Zahlen z1 , z2 ∈ C existiert eine komplexe Zahl w ∈ C mit w + z2 = z1 . K5: z1 · z2 = z2 · z1 für alle z1 , z2 ∈ C. K6: (z1 · z2 ) · z3 = z1 · (z2 · z3 ) für alle z1 , z2 .z3 ∈ C. K7: Die komplexe Zahl 1 := (1, 0) ist das neutrale Element der Multiplikation, das heißt es gilt 1 · z = z · 1 = z für alle z ∈ C. K8: Zu je zwei komplexen Zahlen z1 und z2 6= 0 existiert eine komplexe Zahl v ∈ C mit v · z2 = z1 . K9: (z1 + z2 ) · z3 = z1 · z3 + z2 · z3 für alle z1 , z2 , z3 ∈ C. Beweis. Diese Eigenschaften folgen direkt aus den Körpereigenschaften von R und den Definitionen von + und ·. Wir überprüfen K4 und K8: Seien z1 = (x1 , y1 ) und z2 = (x2 , y2 ) zwei komplexe Zahlen. Dann gilt für w := (x1 − x2 , y1 − y2 ) die Gleichung w + z2 = z1 . Sei zusätzlich z2 6= 0. Wir betrachten 1.3 Die komplexen Zahlen v := x1 x2 + y1 y2 y1 x2 − x1 y2 , x22 + y22 x22 + y22 27 ∈ C. Man rechnet leicht nach, dass für diese komplexe Zahl v die Geichung v·z2 = z1 erfüllt ist. ⊓ ⊔ Die komplexe Zahl w mit w + z2 = z1 , so heißt Differenz von z1 und z2 und wird mit w := z1 − z2 bezeichnet. Die komplexe Zahl v mit v · z2 = z1 heißt Quotient von z1 und z2 und wird mit v := zz12 bezeichnet. Für z ∈ C mit z 6= 0 sei z −1 := 1z . Die Potenzen z n für n ∈ N seinen induktiv durch z 1 := z, n z n+1 := z n · z erklärt. Weiterhin sei z −n := 1z = z1n . Bemerkung: Im Gegensatz zum Körper der reellen Zahlen ist der Körper der komplexen Zahlen nicht angeordnet (Übungsaufgabe 15). Bezeichnungen: Für den bequemen Umgang mit den komplexen Zahlen eignet sich die nun folgende Vereinbarung. Nach Definition gilt für die komplexen Zahlen (a, 0) und (b, 0) (a, 0) + (b, 0) = (a + b, 0) und (a, 0) · (b, 0) = (a · b, 0). Die Zuordnung a ∈ R 7−→ (a, 0) ∈ C ist also eine Einbettung der Menge der reellen Zahlen in die Menge der komplexen Zahlen, die mit den jeweiligen Körperoperationen + und · verträglich ist. Wir können deshalb R als Teilkörper von C auffassen. Dies werden wir in Zukunft tun und die komplexe Zahl (a, 0) einfach mit a bezeichnen. Dies rechtfertigt auch die Bezeichnung 0 := (0, 0) für das neutrale Element der Addition und 1 := (1, 0) für das neutrale Element der Multiplikation (siehe Satz 1.18). Die komplexe Zahl (0, 1) bezeichnen wir mit i und nennen sie die imaginäre Einheit. Für i = (0, 1) gilt i2 = (0, 1) · (0, 1) = (−1, 0) = −1. Die Gleichung x2 = −1 ist also im Körper der komplexen Zahlen lösbar. Ist z = (a, b) eine beliebige komplexe Zahl, so gilt mit unseren Vereinbarungen z = (a, b) = (a, 0) + (0, b) = (a, 0) + (0, 1)(b, 0) = a + i · b. Jede komplexe Zahl z ∈ C ist also in der Form z = a + ib a, b ∈ R (1.3) darstellbar. Dies ist die übliche Darstellung der komplexen Zahlen. Man kann dann mit den komplexen Zahlen wie mit den reellen rechnen, indem man i2 = −1 berücksichtigt. Es gilt also für z1 = a1 + i b1 und z2 = a2 + i b2 28 1 Reelle und komplexe Zahlen z1 + z2 = (a1 + ib1 ) + (a2 + ib2 ) = (a1 + a2 ) + i (b1 + b2 ) (1.4) z1 · z2 = (a1 + ib1 ) · (a2 + ib2 ) = (a1 a2 − b1 b2 ) + i (a1 b2 + b1 a2 ) (1.5) Ist z = a + ib ∈ C, so heißt Re(z) := a der Realteil von z und Im(z) := b der Imaginärteil von z. Ist Re(z) = 0, so heißt z rein imaginär, ist Im(z) = 0, so heißt z reell. Beispiel: Sei z = a + ib 6= 0 . Dann ist a b 1 a − ib a − ib 1 = 2 −i 2 , = = = 2 z a + ib (a + ib)(a − ib) a + b2 a + b2 a + b2 also gilt 1 a b 1 Re = 2 =− 2 bzw. Im . 2 z a +b z a + b2 Definition 1.19. Ist z = a + ib ∈ C eine komplexe Zahl, so heißt z := a − ib die konjugiert komplexe Zahl zu z. Es gelten folgende, leicht zu überprüfende Rechenregeln: Satz 1.19 Für alle komplexen Zahlen z und w gilt: 1. 2. 3. 4. z + w = z + w, z · w = z · w, z = z . z + z = 2 · Re(z) , z − z = 2i · Im(z) . z = z ⇐⇒ z ∈ R. z · z = Re(z)2 + Im(z)2 . Insbesondere ist 0 ≤ z · z ∈ R. ⊓ ⊔ Definition 1.20. Sei z = a + ib ∈ C eine komplexe Zahl. Der Betrag von z ist die reelle Zahl p √ |z| := a2 + b2 = z · z. Satz 1.20 (Eigenschaften des Betrages komplexer Zahlen) Seien z und w komplexe Zahlen. Dann gilt: 1. 2. 3. 4. 5. |z| ≥ 0 , wobei |z| = 0 genau dann, wenn z = 0. |z · w| = |z| · |w|. |z + w| ≤ |z| + |w| (Dreiecksungleichung) |z| = |z| |Re(z)| ≤ |z|, |Im(z)| ≤ |z|. 1.3 Die komplexen Zahlen 29 Beweis. 1., 4. und 5. folgen trivialerweise aus der Definition. Formel 2. folgt aus |z · w|2 = (zw)(zw) = zz · ww = |z|2 · |w|2 . Die Dreiecksungleichung folgt aus |z + w|2 = (z + w)(z + w) = (z + w)(z + w) = zz + ww + wz + zw = zz + ww + wz + wz = |z|2 + |w|2 + 2 · Re(wz) ≤ |z|2 + |w|2 + 2 · |wz| = |z|2 + |w|2 + 2 · |w| · |z| = (|z| + |w|)2 . ⊓ ⊔ Die geometrische Interpretation der komplexen Zahlen Der Darstellung der reellen Zahlen auf einer Geraden entspricht die Darstellung der komplexen Zahlen in der Ebene, die man dann oft Gaußsche Zahlenebene oder komplexe Zahlenebene nennt. Wir wählen ein kartesisches Koordinatensystem in der Ebene und stellen die komplexe Zahl z = (a, b) = a + ib ∈ C als Punkt der Ebene mit den Koordinaten (a, b) dar. imaginäre Achse (y-Achse) iR 6 3 ib z = (a, b) = a + bi |z| i ϕ 1 a R reelle Achse (x-Achse) Die reellen Zahlen R entsprechen der x–Achse, die rein imaginären Zahlen iR der y–Achse. 30 1 Reelle und komplexe Zahlen √ Nach dem Satz von Pythagoras ist |z| = a2 + b2 gleich dem Abstand des Punktes z = (a, b) zum Ursprung des Koordinatensystems. Die komplexe Zahl z = (a, −b) = a − ib entsteht durch Spiegelung von z an der reellen Achse. Für z 6= 0 sei ϕ der Winkel zwischen der x–Achse und dem Strahl vom Ursprung durch z, gemessen in positiver Richtung (entgegen dem Uhrzeigersinn). Dann gilt im rechtwinkligen Dreieck cos ϕ = a |z| und sin ϕ = b |z| . Die Darstellung z = |z| (cos ϕ + i · sin ϕ) (1.6) heißt trigonometrische Darstellung der komplexen Zahl z 6= 0. Der Winkel ϕ heißt Argument von z und wird mit arg(z) bezeichnet. Das Argument ϕ ist bis auf ganzzahlige Vielfache von 2π eindeutig bestimmt. Geometrische Deutung von z1 + z2 : Die Summe z1 + z2 entspricht dem Endpunkt der vom Nullpunkt ausgehenden Diagonalen im von z1 und z2 gebildeten Parallelogramm. iR 6 i(b1 + b2 ) ib2 ib1 3 z2 z1 + z2 = (a1 + a2 , b1 + b2 ) z2 = (a2 , b2 ) 1 z1 z1 = (a1 , b1 ) - a2 a1 a1 + a2 R Geometrische Deutung von z1 · z2 : Wir betrachten die trigonometrische Darstellung von z1 und z2 z1 = |z1 |(cos ϕ1 + i sin ϕ1 ) z2 = |z2 |(cos ϕ2 + i sin ϕ2 ) Nach den Additionstheoremen für cos und sin gilt 1.3 Die komplexen Zahlen 31 z1 · z2 = |z1 ||z2 | · {(cos ϕ1 · cos ϕ2 − sin ϕ1 · sin ϕ2 ) + i · (sin ϕ1 · cos ϕ2 + sin ϕ2 · cos ϕ1 )} = |z1 · z2 | · (cos(ϕ1 + ϕ2 ) + i · sin(ϕ1 + ϕ2 )) und folglich |z1 · z2 | = |z1 | · |z2 | und arg(z1 · z2 ) = arg(z1 ) + arg(z2 ). Nach diesen Formeln kann z1 · z2 gezeichnet werden. z1 · z2 w z2 ϕ1 + ϕ2 z1 ϕ1 ϕ2 1 |w| = |z1 · z2 | Für die Winkel gilt ϕ1 = arg(z1 ) und ϕ2 = arg(z2 ). Der Punkt z1 · z2 liegt auf dem vom Ursprung ausgehenden Strahl, der mit der reellen Achse R den Winkel ϕ1 + ϕ2 einnimmt. Mittels des Strahlensatzes erhält man einen Punkt w auf dem Strahl durch den Ursprung und z2 mit |w| = |z1 ·z2 |. Man dreht diesen Punkt w um den Winkel ϕ1 um den Ursprung und erhält den Punkt z1 ·z2 . Beispiele: a) Die Abbildung z ∈ C 7−→ iz ∈ C beschreibt die Drehung um den Ursprung um den Winkel π2 (entgegen dem Uhrzeigersinn). b) Die Abbildung z ∈ C 7−→ rz ∈ C, r ∈ R+ , ist die Streckung von z um den Faktor r auf dem durch den Ursprung und z gehenden Strahl. c) Was bedeutet die Inversion z ∈ C 7−→ z −1 = z1 ∈ C geometrisch? Betrachten wir den Kreis K1 = {z ∈ C | |z|2 = 1} vom Radius 1. Sei z ∈ C ein vom Ursprung verschiedener Punkt. Der Punkt ẑ ∈ C heißt Spiegelpunkt von z an K1 , falls ẑ auf dem von 0 ausgehenden Strahl durch z liegt und |z| · |ẑ| = 1 gilt. Dann existiert ein c ∈ R+ mit ẑ = cz. Setzen wir das in 1 |z| · |ẑ| = 1 ein, so erhalten wir c = |z|1 2 = z·z . Folglich ist der Spiegelpunkt 1 1 ẑ = z = z . Die Inversionsabbildung z ∈ C 7−→ z −1 ∈ C ist also die Hintereinanderausführung der Spiegelung am Kreis K1 und der Spiegelung an der 32 1 Reelle und komplexe Zahlen reellen Achse. iR z z −1 1 R z −1 Wir erklären nun Wurzeln aus komplexen Zahlen: Wie wir gerade gesehen haben, gelten für eine komplexe Zahl z die Formeln |z n | = |z|n und arg(z n ) = n · arg(z). Daraus folgt Satz 1.21 Sei w ∈ C eine von Null verschiedene komplexe Zahl mit den Betrag r := |w| und dem Argument ϕ =: arg(w) ∈ [0, 2π). Dann hat die Gleichung z n = w genau n verschiedene komplexe Lösungen, nämlich √ ϕ k · 2π ϕ k · 2π + i sin + + zk := n r · cos n n n n wobei k ∈ {0, 1, 2, . . . , n − 1}. Beweis. Für die komplexen Zahlen zk gilt nach Definition |zk | = √ n r und arg (zk ) = ϕ 2πk + =: ϕk . n n Hieraus folgt √ zkn = ( n r)n (cos(ϕ + 2πk ) + i sin(ϕ + 2πk)) = |w|(cos ϕ + i sin ϕ) = w. | {z } | {z } |zk |n n·arg (zk ) 1.3 Die komplexen Zahlen 33 Wir haben also n verschiedene Lösungen der Gleichung z n = w gefunden. Wir zeigen, dass es keine weiteren Lösungen gibt. Sei z eine beliebige Lösung von z n = w und z = |z|(cos ψ + i · sin ψ) p die trigonometrische Darstellung von z. Es gilt |z|n = |w| und folglich |z| = n |w|. Weiterhin ist n · ψ = ϕ + 2πl, für 2πl ein l ∈ Z und somit ψ = ϕ n + n . Wir teilen l durch n mit Rest: l = k + rn, r ∈ Z und 0 ≤ k ≤ n − 1. Dann gilt ψ = ϕk + r · 2π und folglich z = zk . ⊓ ⊔ Geometrische Deutung der Wurzeln: Die Lösungen zk von z np = w bilden die Ecken eines regelmäßigen n-Ecks auf dem Kreis vom Radius n |w|. iR n=4 6 w z1 M 1 z0 ϕ z2 ) ϕ 4 π 2 R N z3 Wir formulieren abschließend den Fundamentalsatz der Algebra, der eine der wichtigsten Aussagen über komplexe Zahlen enthält. Satz 1.22 (Fundamentalsatz der Algebra) Es seien a0 , a1 , . . . , an−1 komplexe Zahlen. Dann besitzt die Gleichung z n + an−1 z n−1 + . . . + a1 z + a0 = 0 eine Lösung z ∈ C. ⊓ ⊔ 34 1 Reelle und komplexe Zahlen Der Beweis dieses Satzes für allgemeine n erfolgt später. Wir beweisen den Fundamentalsatz der Algebra hier zunächst nur für n = 2. In diesem Fall erhält man alle komplexen Lösungen z der quadratischen Gleichung z 2 + a1 z + a0 = 0 mittels quadratischer Ergänzung. Es gilt ⇐⇒ ⇐⇒ z 2 + a1 z + a0 = 0 a2 a1 2 + a0 − 1 = 0 z+ 2 4 w2 = c wobei w := z + a2 a1 und c = 1 − a0 . 2 4 Für c 6= 0 können wir die Gleichung w2 = c nach Satz 1.21 lösen und erhalten genau 2 verschiedene komplexe Lösungen von z 2 + a1 z + a0 = 0. Für c = 0 a2 gilt a0 = 41 und deshalb a1 a1 z+ . z 2 + a1 z + a0 = z + 2 2 In diesem Fall ist z = − a21 eine 2-fache Lösung von z 2 + a1 z + a0 = 0. 1.4 Die Vektorräume Rn und Cn Definition 1.21. Mit Rn bezeichnen wir die Menge aller n–Tupel reeller Zahlen. Mit Cn bezeichnen wir die Menge aller n–Tupel komplexer Zahlen. Wir addieren zwei n-Tupel x = (x1 , . . . , xn ) und y = (y1 , . . . , yn ) aus Rn (Cn ) mittels: x + y := (x1 , . . . , xn ) + (y1 , . . . , yn ) = (x1 + y1 , . . . , xn + yn ). Wir multiplizieren ein n-Tupel x = (x1 , . . . , xn ) ∈ Rn (Cn ) mit einer Zahl λ ∈ R (C) mittels: λ · z := λ · (x1 , . . . , xn ) = (λx1 , . . . , λxn ). Satz 1.23 Rn ist ein n–dimensionaler Vektorraum über dem Körper der reellen Zahlen R. Cn ist ein n–dimensionaler Vektorraum über dem Körper der komplexen Zahlen C. Beweis. Siehe Algebra–Vorlesung Die Elemente von Rn und Cn bezeichnet man deshalb auch als Vektoren. ⊓ ⊔ 1.4 Die Vektorräume Rn und Cn 35 Definition 1.22. (1) Unter dem Skalarprodukt zweier Vektoren x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) aus Rn versteht man die Zahl hx, yi := n X j=1 xj · yj ∈ R. (2) Unter dem Skalarprodukt zweier Vektoren z = (z1 , . . . , zn ), w = (w1 , . . . , wn ) aus Cn versteht man die Zahl hz, wi := n X j=1 zj · w j ∈ C. (3) Die Norm eines Vektors x ∈ Rn bzw. z ∈ Cn ist die Zahl v v uX uX p p u n 2 u n t kxk := hx, xi = xj ∈ R, bzw. kzk := hz, zi = t |zj |2 ∈ R. j=1 j=1 Satz 1.24 (Eigenschaften des Skalarprodukts und der Norm) Seien x, y ∈ Rn , z, w ∈ Cn , λ ∈ R und µ ∈ C. Dann gilt 1. hx, yi = hy, xi hz, wi = hw, zi. 2. hx + x̂, yi = hx, yi + hx̂, yi hz + ẑ, wi = hz, wi + hẑ, wi. 3. hλx, yi = hx, λyi = λhx, yi hµz, wi = µhz, wi und hz, µwi = µhz, wi. 4. kxk ≥ 0 , wobei kxk = 0 ⇐⇒ x = (0, . . . , 0). kzk ≥ 0 , wobei kzk = 0 ⇐⇒ z = (0, . . . , 0). 5. kλxk = |λ| · kxk kµzk = |µ| · kzk. 6. Cauchy–Schwarzsche Ungleichung (CSU): |hx, yi| ≤ kxk · kyk bzw. |hz, wi| ≤ kzk · kwk Die Gleichheit gilt genau dann, wenn x und y, bzw. z und w linear abhängig sind. 7. Dreiecksungleichung: kx + yk ≤ kxk + kyk bzw. kz + wk ≤ kzk + kwk. Beweis. Die Aussagen 1.–5. folgen unmittelbar aus der Definition. Beweis der Cauchy-Schwarzschen Ungleichung: Da das Skalarprodukt auf Rn ein Spezialfall desjenigen auf Cn ist, genügt es, 36 1 Reelle und komplexe Zahlen |hz, wi| ≤ kzk · kwk für alle komplexen Vektoren z und w zu beweisen. Da die Norm nichtnegativ ist, gilt 0 ≤ k kwk2 z − hz, wiw k2 . (∗) Daraus folgt und wir erhalten 0 ≤ h kwk2 z − hz, wiw, kwk2 z − hz, wiw i 0 ≤ kwk4 kzk2 − hz, wikwk2 hw, zi − kwk2 hz, wihz, wi + hz, wihz, wikwk2 . Folglich gilt kwk4 kzk2 ≥ |hz, wi|2 kwk2 . OBdA sei w 6= 0, ansonsten ist die Behauptung sofort erfüllt. Dann folgt |hz, wi|2 ≤ kwk2 kzk2 und somit |hz, wi| ≤ kzk · kwk. Die Gleichheit kann nur gelten, wenn in (*) die Gleichheit steht. Dies ist aber genau dann der Fall, wenn kwk2 z − hz, wiw = 0, dh. wenn z und w linear abhängig sind. Beweis der Dreiecksungleichung: Es genügt abermals kz + wk ≤ kzk + kwk für alle z, w ∈ Cn zu beweisen. Es gilt kz + wk2 = hz + w, z + wi = hz, zi + hw, wi + hz, wi + hw, zi = kzk2 + kwk2 + hz, wi + hz, wi = kzk2 + kwk2 + 2Rehz, wi ≤ kzk2 + kwk2 + 2|Rehz, wi| ≤ kzk2 + kwk2 + 2|hz, wi| ≤ kzk2 + kwk2 + 2kzk · kwk = (kzk + kwk)2 . ⊓ ⊔ Definition 1.23. Seien x und y zwei Vektoren aus Rn bzw. Cn . Die Zahl d(x, y) := kx − yk heißt Euklidischer Abstand zwischen x und y. 1.4 Die Vektorräume Rn und Cn 37 Satz 1.25 Für alle Vektoren x, y, u ∈ Rn (Cn ) gilt 1. d(x, y) ≥ 0 , wobei d(x, y) = 0 ⇐⇒ x = y. 2. d(x, y) = d(y, x). 3. d(x, y) ≤ d(x, u) + d(u, y). Beweis. Die Behauptungen folgen sofort aus Satz 1.24. ⊓ ⊔ Im folgenden Kapitel betrachten wir Eigenschaften von Rn bzw. Cn , die sich aus der Existenz des Euklidischen Abstandes ergeben. Dabei ist oft nicht wichtig, dass es sich bei der zugrundeliegenden Menge um Rn oder Cn handelt und dass der Abstand d der konkrete Euklidische Abstand ist. Man benötigt oft nur seine drei in Satz 1.25 formulierten Eigenschaften. Wir können deshalb die gleichen Untersuchungen für beliebige Mengen X machen, auf denen eine Abstandsfunktion, d.h. eine Funktion d : X × X −→ R mit den drei in Satz 1.25 formulierten Eigenschaften gegeben ist. Eine solche Abstandsfunktion d gibt uns ein Maß dafür, wie weit zwei Punkte in X voneinander entfernt sind. Ein solches Abstandsmaß möchte man z.B. auf der Erdoberfläche haben, um anzugeben, wie weit zwei Orte voneinander entfernt sind. Man benötigt solche Abstandsmaße auch für Funktionenräume, z.B. in der Lösungstheorie von Differentialgleichungen, die viele Prozesse der Natur mathematisch beschreiben. Es gibt sehr viele weitere Gründe, sich bei den betrachteten Mengen X nicht auf die Vektorräume Rn und Cn zu beschränken. 2 Metrische Räume In diesem Kapitel betrachten wir Mengen X, auf denen ein Abstand d : X × X −→ R mit den Eigenschaften aus Satz 1.25 gegeben ist. Mit Hilfe eines solchen Abstandes können wir erklären, was es bedeutet, dass eine Folge von Punkten xn ∈ X, n = 1, 2, . . ., gegen einen Punkt x ∈ X konvergiert. Der Konvergenzbegriff ist grundlegend für das Studium des lokalen Änderungsverhaltens von Funktionen, die auf der Menge X erklärt sind. 2.1 Definition und Beispiele metrischer Räume Definition 2.1. Ein metrischer Raum ist ein Paar (X, d) bestehend aus einer nichtleeren Menge X und einer Abbildung d : X × X −→ R mit folgenden Eigenschaften 1. d(p, q) ≥ 0 ∀ p, q ∈ X und d(p, q) = 0 ⇐⇒ p = q (Positivität), 2. d(p, q) = d(q, p) ∀ p, q ∈ X (Symmetrie), 3. d(p, q) ≤ d(p, r) + d(r, q) ∀ p, q, r ∈ X (Dreiecksungleichung). Die Elemente von X heißen Punkte des metrischen Raumes, d(p, q) nennt man Abstand zwischen p und q. Die Abbildung d heißt Metrik (oder Abstandsfunktion) auf X. Beispiel 1: Aus Kapitel 1 wissen wir, dass folgende Räume metrische Räume sind: • • • • R C Rn Cn mit mit mit mit d(x, y) := |x − y| d(z, v) := |z − v| d(p, q) := kp − qk d(r, s) := kr − sk für x, y ∈ R für z, v ∈ C für p, q ∈ Rn für r, s ∈ Cn , wobei | · | den Betrag der rellen bzw. komplexen Zahl und k · k die Euklidische Norm auf Rn bzw. Cn bezeichnen. Diese Metriken nennen wir die Standardmetrik auf R, C, Rn bzw. Cn . Ist nichts anderes vereinbart, so seien R, C, Rn 40 2 Metrische Räume bzw. Cn mit dieser Metrik versehen. Beispiel 2: Auf einer Menge können verschiedene Metriken existieren: Die folgenden 3 Abbildungen d1 , d2 , d3 sind z.B. Metriken auf R2 : • • Der “Luftlinienabstand“(Standardmetrik): p d1 (x, y) := kx−yk := (x1 − y1 )2 + (x2 − y2 )2 , wobei x = (x1 , x2 ), y = (y1 , y2 ) Die “Mannheimer-Metrik“ (in Mannheim muß man rechtwinklige Straßen langlaufen, um von einem Punkt zum anderen zu kommen) : d2 (x, y) := |x1 − y1 | + |x2 − y2 | • Die “Metrik der französischen Eisenbahn“ (um von einer Stadt zur anderen zu kommen, muß man über Paris fahren): Sei p ein fixierter Punkt. d1 (x, p) + d1 (p, y) falls x 6= y d3 (x, y) := 0 falls x = y Beispiel 3: Auf jeder nichtleeren Menge X existiert eine Metrik. Wir definieren d : X × X −→ R durch 0 falls x = y d(x, y) := 1 falls x 6= y. Dann ist (X, d) ein metrischer Raum. (X, d) heißt diskreter metrischer Raum und d die diskrete Metrik. Beispiel 4: Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge. Dann ist (A, d|A×A ) ebenfalls ein metrischer Raum. Hierbei bezeichnet d|A×A die Einschränkung der Abbildung d auf die Menge A × A. Sie heißt durch d induzierte Metrik auf A. Beispiel 5: Seien (X1 , d1 ), . . . , (Xn , dn ) metrische Räume. Wir betrachten die Menge X = X1 × X2 × . . . × Xn = {(p1 , . . . , pn ) | pi ∈ Xi , i ∈ {1, . . . , n}} 2.1 Definition und Beispiele metrischer Räume 41 und definieren die Produktmetrik v uX u n d((p1 , . . . , pn ), (q1 , . . . , qn )) := t dj (pj , qj )2 . j=1 Dann ist (X, d) ein metrischer Raum und heißt das kartesische Produkt der metrischen Räume (X1 , d1 ), . . . , (Xn , dn ). Beweis: Die Positivität und Symmetrie sind aus der Definition sofort ersichtlich. Wir zeigen die Dreiecksungleichung. Seien dazu p = (p1 , . . . , pn ), q = (q1 , . . . , qn ) und r = (r1 , . . . , rn ) drei beliebige Punkte in X. Unter Benutzung der Dreiecksungleichung für die Metriken dj und der CauchySchwarzschen Ungleichung (CSU, siehe Kapitel 1.4) erhalten wir 2 d(p, q) = ≤ = n X dj (pj , qj )2 j=1 n X j=1 n X j=1 2 dj (pj , rj ) + dj (rj , qj ) dj (pj , rj )2 + 2dj (pj , rj ) · dj (rj , qj ) + dj (rj , qj )2 = d(p, r)2 + d(r, q)2 + 2 n X j=1 dj (pj , rj ) · dj (rj , qj ) v v uX uX n u n u d(pj , rj )2 · t d(rj , qj )2 ≤ d(p, r)2 + d(r, q)2 + 2 t CSU j=1 2 j=1 2 = d(p, r) + d(r, q) + 2 d(p, r) · d(r, q) = (d(p, r) + d(r, q)) 2 Da der Abstand nicht-negativ ist, können wir in der Ungleichung auf beiden Seiten die Wurzel ziehen und erhalten die Dreiecksungleichung für d. ⊓ ⊔ Insbesondere gilt Rn = R × . . . × R und Cn = C × . . . × C (versehen mit der Standardmetrik bzw. der Produktmetrik). ˆ heißen isometrisch, Definition 2.2. Zwei metrische Räume (X, d) und (Y, d) wenn eine bijektive Abbildung f : X −→ Y existiert, so dass ˆ (x), f (y)) d(x, y) = d(f ∀ x, y ∈ X ˆ gilt. Die Abbildung f heißt dann Isometrie zwischen (X, d) und (Y, d). 42 2 Metrische Räume 2.2 Offene und abgeschlossene Mengen in metrischen Räumen Definition 2.3. Sei (X, d) ein metrischer Raum, x ∈ X und ε ∈ R+ . Die Menge K(x, ε) := {y ∈ X | d(x, y) < ε} heißt ε–Kugel in X um x. Beispiel 1: Sei X = Rn mit der Standardmetrik d(x, y) = kx − yk versehen. Dann ist K(0, ε) = {x ∈ Rn | kxk < ε} = {x ∈ Rn | x21 + . . . + x2n < ε2 } die Kugel vom Radius ε um den Nullpunkt im Rn ohne ihren Rand. Ist n = 1, so ist jedes offene Intervall eine ε–Kugel. ( ε) x a+b 2 - K(x, ε) = (x − ε, x + ε) ( a R ) b a−b (a, b) = K( a+b 2 , 2 ) R Für n = 2 sind die ε–Kugeln gerade die Kreisscheiben vom Radius ε ohne ihren Rand. R K((a, b), ε) 6 = {(x, y) ∈ R2 | (x − a)2 + (y − b)2 < ε2 } R 6 K(0, ε) ε 3 - ε3 b • (a, b) R a Beispiel 2: Sei X = R2 mit folgender Metrik versehen: d((x1 , x2 ), (y1 , y2 )) = max(|x1 − y1 |, |x2 − y2 |). R 2.2 Offene und abgeschlossene Mengen in metrischen Räumen 43 Dann ist (X, d) ein metrischer Raum (Übungsaufgaben 16). Die ε–Kugel um den Nullpunkt ist für diese Metrik ein Quadrat mit der Seitenlänge 2ε ohne seinen Rand: K(0, ε) = {(x1 , x2 ) ∈ R2 | |x1 | < ε, |x2 | < ε}. R ε 6 ε R −ε −ε Beispiel 3: Sei (X, d) ein diskreter metrischer Raum. Dann gilt für die εKugeln ( {x} falls ε ≤ 1 K(x, ε) = X falls ε > 1. Definition 2.4. Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge von X. Ein Punkt x ∈ A heißt innerer Punkt von A, falls eine ε–Kugel K(x, ε) um x existiert, die vollständig in A liegt. Int(A) bezeichne die Menge aller inneren Punkte von A ⊂ X. A K(x, ε) x• Satz 2.1 (Eigenschaften des Inneren einer Menge) Sei (X, d) ein metrischer Raum und seien A und B Teilmengen von X. Dann gilt: 1. 2. 3. 4. 5. Int(X) = X, Int(∅) = ∅. Int(A) ⊂ A. Int(Int(A)) = Int(A). A ⊂ B =⇒ Int(A) ⊂ Int(B) Int(A ∩ B) = Int(A) ∩ Int(B) . (Monotonie). 44 2 Metrische Räume 6. Für beliebig viele Teilmengen Ai ⊂ X, i ∈ Λ, gilt [ [ Int(Ai ) ⊂ Int( Ai ) i∈Λ i∈Λ Beweis. Die Eigenschaften 1. und 2. folgen unmittelbar aus der Definition des Inneren einer Menge. Zu 3. Aus der 2. Eigenschaft des Inneren folgt Int(Int(A)) ⊂ Int(A). Es bleibt somit noch Int(A) ⊂ Int(Int(A)) zu zeigen. Sei x ∈ Int(A). Nach Definition von Int(A) existiert eine ε–Kugel um x mit K(x, ε) ⊂ A. Wir zeigen nun, dass K(x, ε) ⊂ Int(A) gilt. Sei y ∈ K(x, ε) beliebig gewählt. Wir betrachten die Kugel um y mit dem Radius ε−d(x, y). Dann gilt A K(x, ε) •y x• K(y, ε − d(x, y)) ⊂ K(x, ε) ⊂ A. Ist nämlich z ∈ K(y, ε − d(x, y)), so gilt d(y, z) < ε − d(x, y) K(y, ε − d(x, y)) x• •y ε R und wir erhalten d(x, z) ≤ d(x, y) + d(y, z) < ε. Folglich liegt z in K(x, ε). Nach Definition ist somit jeder Punkt y von K(x, ε) ein innerer Punkt von A, also K(x, ε) ⊂ Int(A). Daraus folgt wiederum, dass x ein innerer Punkt der Menge Int(A) ist. Damit haben wir Int(A) ⊂ Int(Int(A)) bewiesen. Zu 4. Wir zeigen A ⊂ B =⇒ Int(A) ⊂ Int(B): Sei x ∈ Int(A). Dann existiert eine ε-Kugel K(x, ε) mit K(x, ε) ⊂ A. Da A ⊂ B folgt K(x, ε) ⊂ B. Folglich ist x ∈ Int(B). Zu 5. Wir zeigen Int(A ∩ B) = Int(A) ∩ Int(B): Sei x ∈ Int(A ∩ B). Dann existiert eine ε–Kugel um x mit K(x, ε) ⊂ A ∩ B und es folgt, dass sowohl K(x, ε) ⊂ A als auch K(x, ε) ⊂ B. Somit ist x ∈ Int(A) und x ∈ Int(B) und wir erhalten x ∈ Int(A) ∩ Int(B). Es gilt folglich Int(A ∩ B) ⊂ Int(A) ∩ Int(B). Sei nun x ∈ Int(A) ∩ Int(B), das heißt x ∈ Int(A) und x ∈ Int(B). Folglich existieren ε1 , ε2 ∈ R+ , so dass K(x, ε1 ) ⊂ A und K(x, ε2 ) ⊂ B. Wir betrachten ε := min(ε1 , ε2 ). Dann ist 2.2 Offene und abgeschlossene Mengen in metrischen Räumen 45 K(x, ε) ⊂ K(x, ε1 ) ⊂ A, bzw. K(x, ε) ⊂ K(x, ε2 ) ⊂ B. Also gilt K(x, ε) ⊂ A ∩ B, somit ist x ∈ Int(A ∩ B). Dies zeigt, dass Int(A) ∩ Int(B) ⊂ Int(A ∩ B). Zu 6. Wir betrachten eine Familie {Ai }i∈Λ aus beliebig vielen Teilmengen S Ai . Aus Ai ⊂ X. Sei Aj eine fixierte Menge dieser Familie. Dann ist Aj ⊂ i∈Λ der Monotonieeigenschaft des Inneren folgt [ Int(Aj ) ⊂ Int( Ai ). i∈Λ Da dies für alle j ∈ Λ gilt, erhalten wir [ [ Int(Aj ) ⊂ Int( Ai ). j∈Λ i∈Λ ⊓ ⊔ Bemerkung: Im allgemeinen ist Int(A) ∪ Int(B) 6= Int(A ∪ B). Wir betrachten dazu als metrischen Raum X = R mit der Standardmetrik und die Teilmengen A = Q und B = R \ Q. Dann ist A ∪ B = R und Int(A ∪ B) = R. Da in jedem Intervall sowohl eine eine rationale als auch eine irrationale Zahl liegt, gilt K(x, ε) 6⊆ Q, und K(x, ε) 6⊆ R \ Q. Also ist Int(Q) = Int(R \ Q) = ∅. Definition 2.5. Eine Teilmenge A eines metrischen Raumes (X, d) heißt offen, falls Int(A) = A gilt, dh. falls zu jedem x ∈ A eine ε–Kugel K(x, ε) existiert, die vollständig in A liegt. Beispiele: 1. Das Innere Int(A) jeder Teilmenge A eines metrischen Raumes ist offen. (Nach Satz 2.1, Punkt 3.). 2. Die ε–Kugeln K(x, ε) eines metrischen Raumes (X, d) sind offen. Ist nämlich y ∈ K(x, ε), dann gilt K(y, ε − d(x, y)) ⊂ K(x, ε) (siehe Beweis von 3. in Satz 2.1). Insbesondere sind die Intervalle (a, b) im metrischen Raum R (mit der Standardmetrik) offen. 46 2 Metrische Räume Satz 2.2 Die offenen Teilmengen eines metrischen Raumes (X, d) haben folgende Eigenschaften: 1. Die Mengen X und ∅ sind offen. 2. Der Durchschnitt endlich vieler offener Mengen ist offen. 3. Die Vereinigung beliebig vieler offener Mengen ist offen. Beweis. Zu 1: Siehe Satz 2.1, Punkt 1. Zu 2: Seien U1 und U2 offen. Dann gilt Int(U1 ) = U1 und Int(U2 ) = U2 . Aus Satz 2.1 folgt Int(U1 ∩ U2 ) = Int(U1 ) ∩ Int(U2 ) = U1 ∩ U2 und somit ist U1 ∩ U2 offen. Induktiv schließt man auf die Behauptung für endlich viele Mengen. Zu 3: Seien Ui , i ∈ Λ, beliebig viele offene Mengen. Dann gilt Int(Ui ) = Ui für alle i ∈ Λ. Wegen Satz 2.1 ist [ [ [ [ Ui = Int(Ui ) ⊂ Int( Ui ) ⊂ Ui i∈Λ und somit S i∈Λ Ui = Int( S Ui ). Also ist i∈Λ Ui offen. i∈Λ i∈Λ i∈Λ i∈Λ S ⊓ ⊔ Beispiele: Sei X = R mit der Standardmetrik d(x, y) = |x − y|. 1. Für jeden Punkt a ∈ R sind (a, ∞) und (−∞, a) offen, denn: [ [ (−n, a) (a, n), (−∞, a) = (a, ∞) = n∈N −n∈N n>a −n<a 2. Der Durchschnitt beliebig vieler offener Mengen ist im allgemeinen nicht offen. Sei zum Beispiel 1 1 Un = (− , ) , n ∈ N. n n Dann ist T n∈N Un = {0} nicht offen in R. Als nächstes wollen wir beschreiben, wie offenen Mengen in Teilräumen aussehen. Ist (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge von X, so ist die Menge A selbst ein metrischer Raum mit der induzierten Metrik d|A×A : A × A −→ R. 2.2 Offene und abgeschlossene Mengen in metrischen Räumen 47 Satz 2.3 Sei (X, d) ein metrischer Raum und A ⊂ X eine beliebige Teilmenge. Eine Menge B ⊂ A ist im metrischen Raum (A, d|A×A ) genau dann offen, wenn es in (X, d) eine offene Menge U ⊂ X gibt, so daß B = U ∩ A gilt. Beweis. Wir vergleichen zunächst die Kugeln des metrischen Raumes (A, d|A×A ) mit denen des metrischen Raumes (X, d). Es gilt KA (b, ε) = {a ∈ A | d(b, a) < ε} = KX (b, ε) ∩ A. (1) Sei B ⊂ A im metrischen Raum (A, d|A×A ) offen. Nach Definition existiert für jedes b ∈ B eine Zahl ε(b) > 0, so dass KA (b, ε(b)) = KX (b, ε(b)) ∩ A ⊂ B. Wir betrachten die Menge U := [ b∈B KX (b, ε(b)) ⊂ X. Da U die Vereinigung von Kugeln in X ist, ist U nach Satz 2.2, Punkt 3. offen in X. Da B ⊂ A und B ⊂ U , ist B ⊂ U ∩ A. Andererseits gilt ! [ U ∩A = KX (b, ε(b)) ∩ A b∈B [ = KX (b, ε(b)) ∩ A b∈B = [ b∈B KA (b, ε(b)) ⊂ B, denn jede der Kugeln KA (b, ε(b)) liegt in B. Folglich gilt B = U ∩ A. (2) Sei nun B = U ∩ A, wobei U ⊂ X eine offene Menge in (X, d) ist. Es ist zu zeigen, dass B offen im metrischen Raum (A, d|A×A ) ist. Sei b ∈ B. Da b ∈ U und U in (X, d) offen ist, existiert ein ε(b) > 0 mit KX (b, ε(b)) ⊂ U . Folglich gilt KA (b, ε(b)) = KX (b, ε(b)) ∩ A ⊂ U ∩ A = B. Somit ist B offen in (A, d|A×A ). ⊓ ⊔ Definition 2.6. Sei (X, d) ein metrischer Raum und A ⊂ X eine beliebige Teilmenge. Der Abschluss von A ist die Menge cl(A) := {x ∈ X | ∀ ε > 0 gilt K(x, ε) ∩ A 6= ∅}. 48 2 Metrische Räume Beispiel: Sei X = R mit der Standardmetrik d(x, y) = |x − y|. Für A = [a, b) erhalten wir Int(A) = (a, b) und cl(A) = [a, b]. Satz 2.4 Sei (X, d) ein metrischer Raum. Für den Abschluss einer Teilmenge A ⊂ X gilt: cl(A) = X \ Int(X \ A). Beweis. Die Aussage folgt aus folgenden Äquivalenzen: x ∈ X \ Int(X \ A) ⇐⇒ x ∈ X und x ∈ / Int(X \ A) ⇐⇒ ∀ ε > 0 gilt K(x, ε) 6⊂ X \ A ⇐⇒ ∀ ε > 0 gilt K(x, ε) ∩ A 6= ∅ ⇐⇒ x ∈ cl(A). ⊓ ⊔ Satz 2.5 (Eigenschaften des Abschlusses) Sei (X, d) ein metrischer Raum und A, B Teilmengen von X. Dann gilt: 1. 2. 3. 4. 5. 6. cl(∅) = ∅ und cl(X) = X. A ⊂ cl(A). A ⊂ B ⇒ cl(A) ⊂ cl(B). cl(cl(A)) = cl(A). cl(A ∪ B) = cl(A) ∪ cl(B). Seien Ai , i ∈ Λ , beliebig viele Teilmengen von X. Dann gilt \ \ cl(Ai ). cl Ai ⊂ i∈Λ i∈Λ Beweis. Das überlassen wir dem Leser als Übungsaufgabe 21. Man verwende dazu die Sätze 2.4 und 2.1. ⊓ ⊔ Beispiel: Im allgemeinen gilt nicht cl(A ∩ B) = cl(A) ∩ cl(B). Wir betrachten dazu den metrischen Raum X = R mit der Standardmetrik. Für A = (0, 1) und B = (1, 2) gilt A ∩ B = ∅. Folglich ist cl(A ∩ B) = ∅. Da cl(A) = [0, 1] und cl(B) = [1, 2], erhält man andererseits den nichtleeren Durchschnitt cl(A) ∩ cl(B) = {1}. Definition 2.7. Sei (X, d) ein metrischer Raum. Eine Teilmenge A ⊂ X heißt abgeschlossen, falls cl(A) = A gilt. 2.2 Offene und abgeschlossene Mengen in metrischen Räumen 49 Satz 2.6 Sei (X, d) ein metrischer Raum und A ⊂ X. Dann gilt: 1. 2. 3. 4. A ⊂ X ist genau dann abgeschlossen, wenn X \ A offen ist. X und ∅ sind abgeschlossen. Der Durchschnitt beliebig vieler abgeschlossener Mengen ist abgeschlossen. Die Vereinigung endlich vieler abgeschlossener Mengen ist abgeschlossen. Beweis. (1) Wir benutzen Satz 2.4 und erhalten A ⊂ X ist abgeschlossen ⇐⇒ A = cl(A) ⇐⇒ A = X \ Int(X \ A) ⇐⇒ X \ A = Int(X \ A) ⇐⇒ X \ A ist offen (2)–(4) folgen aus (1), Satz 2.1 und den Beziehungen zwischen Vereinigung und Durchschnitt bei der Komplementbildung: (2) X = X \ ∅. Da ∅ offen ist, ist X abgeschlossen. ∅ = X \ X. Da X offen ist, ist ∅ abgeschlossen. (3) Seien Ai , i ∈ Λ, beliebig viele abgeschlossene Teilmengen von X. Dann gilt nach den bekannten Regeln der Mengenlehre \ [ X\ (X \ Ai ). (⋆) Ai = i∈Λ i∈Λ Da Ai abgeschlossen ist, ist X \Ai offen. Die Vereinigung beliebig vieler offener Mengen ist offen, folglich ist die rechte Seite von (⋆) ebenfalls offen. Wenden T A abgeschlossen wir (1) auf die linke Seite von (⋆) an, so folgt, dass i i∈Λ ist. (4) Es genügt, die Behauptung für zwei abgeschlossene Mengen zu beweisen. Die Gültigkeit für endlich viele Teilmengen erhält man dann durch Induktion. Seien A und B zwei abgeschlossene Teilmengen von X. Nach den bekannten Regeln der Mengenlehre gilt: X \ (A ∪ B) = (X \ A) ∩ (X \ B). Da A und B abgeschlossen sind, sind X \ A und X \ B offen und somit deren Durchschnitt ebenfalls offen. Dann ist nach (1) aber A ∪ B abgeschlossen. ⊓ ⊔ Beispiel: Sei X = R2 mit der Standardmetrik d(x, y) = kx − yk. Für die Menge A = {x ∈ R2 | kxk < 1} gilt Int(A) = A. Folglich ist R2 \ A = {x ∈ R2 | kxk ≥ 1} abgeschlossen in R2 . Sei A ⊂ X eine Teilmenge eines metrischen Raumes (X, d). Dann gilt Int(A) ⊂ A ⊂ cl(A). Wir wollen nun die Punkte studieren, die in cl(A) \ Int(A) liegen. 50 2 Metrische Räume Definition 2.8. Sei A ⊂ X eine Teilmenge eines metrischen Raumes (X, d). Unter dem Rand von A versteht man die Menge ∂A := cl(A) \ Int(A). Ein Punkt x ∈ ∂A heißt Randpunkt von A. Satz 2.7 (Charakterisierung des Randes) Sei (X, d) ein metrischer Raum und A ⊂ X. 1. ∂A = X \ Int(A) ∪ Int(X \ A) . Insbesondere ist ∂A abgeschlossen. 2. Ein Punkt x ∈ X ist genau dann ein Randpunkt von A, wenn für alle ε > 0 gilt K(x, ε) ∩ A 6= ∅ und K(x, ε) ∩ (X \ A) 6= ∅. Beweis. Sei A ⊂ X. Dann gilt ∂A = cl(A) \ Int(A) = (X \ Int(X \ A)) \ Int(A) = X \ (Int(X \ A) ∪ Int(A)). Daraus erhalten wir x ∈ ∂A ⇐⇒ x ∈ / Int(A) und x ∈ / Int(X \ A) ⇐⇒ ∀ ε > 0 gilt K(x, ε) ∩ (X \ A) 6= ∅ und K(x, ε) ∩ A 6= ∅. ⊓ ⊔ Bezeichnung: Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge. Dann bezeichnet Int(A) die inneren Punkte von A. Die Punkte in Int(X \ A) nennen wir auch die äußeren Punkte Punkt einer Menge von A. Dann sagt uns Satz 2.7 insbesondere, dass sich X in die Menge der inneren Punkte von A, die Menge der äußeren Punkte von A und den Rand von A zerlegt, d.h. es gilt X = Int(A) ∪˙ Int(X \ A) ∪˙ ∂A. Beispiel 1: Sei X = R1 mit der Standardmetrik d(x, y) = |x − y|. Für A = [a, b) gilt Int(A) = (a, b), Int(X \ A) = (−∞, a) ∪ (b, ∞) , cl(A) = [a, b] und ∂A = {a} ∪ {b}. Beispiel 2: Sei X eine nichtleere Menge mit der diskreten Metrik d. Im metrischen Raum (X, d) gilt für die Kugeln von Radius 1/2 1 K(x, ) = {x}. 2 Da die Kugeln eines beliebigen metrischen Raumes offene Mengen sind, ist im diskreten metrischen Raum (X, d) jede 1-elementige Teilmenge {x} ⊂ X 2.2 Offene und abgeschlossene Mengen in metrischen Räumen 51 S offen. Sei nun A ⊂ X eine beliebige Teilmenge. Da A = x∈A {x} und die Vereinigung beliebig vieler offener Mengen offen ist, ist A offen. Insbesondere gilt A = Int(A). Weiternin ist A = X \ (X \ A). Da X \ A offen ist, ist nach Satz 2.5 A auch abgeschlossen. Insbesondere ist cl(A) = A. Daraus folgt dann für den Rand der Menge A bzgl. der diskreten Metrik ∂A = cl(A) \ Int(A) = A \ A = ∅ . Definition 2.9. Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge. Ein Punkt x ∈ X heißt Häufungspunkt von A, falls in jeder ε-Kugel K(x, ε) ein von x verschiedener Punkt von A liegt, d.h. falls (K(x, ε) \ {x}) ∩ A 6= ∅. Die Menge der Häufungspunkte von A wird mit HP (A) bezeichnet. Satz 2.8 Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge. Dann gilt 1. x ∈ X ist genau dann ein Häufungspunkt von A, wenn in jeder ε-Kugel K(x, ε) unendlich viele voneinander verschiedene Punkte von A liegen. 2. cl(A) = A ∪ HP (A). 3. A ist genau dann abgeschlossen, wenn HP (A) ⊂ A. Beweis. (1) Sei x ∈ X ein Häufungspunkt von A und ε > 0 eine beliebig fixierte Zahl. Wir müssen zeigen, dass die Kugel K(x, ε) unendlich viele voneinander verschiedene Punkte von A enthält. Aus der Definition des Häufungspunktes erhalten wir zunächst, dass ein von x verschiedener Punkt a1 ∈ K(x, ε) existiert mit a1 ∈ A. Wir betrachten ε1 := d(x, a1 ) > 0. Dann ist ε1 < ε. Wiederum aus der Häufungspunkt-Eigenschaft von x, erhalten wir einen weiteren von a1 und x verschiedenen Punkt a2 ∈ K(x, ε1 ) mit a2 ∈ A. Wir betrachten dann ε2 := d(x, a2 ) und erhalten einen von a1 , a2 und x verschiedenen Punkt a3 ∈ K(x, ε2 ) mit a3 ∈ A. Fahren wir so fort, so ergibt sich induktiv eine Folge unendlich vieler voneinander verschiedener Punkte a1 , a2 , a3 , a4 , . . . ∈ A ∩ K(x, ε). (2) Wir zeigen zuerst, dass A ∪ HP (A) ⊂ cl(A): Da A ⊂ cl(A), ist dazu nur zu zeigen, dass HP (A) ⊂ cl(A). Sei x ∈ HP (A). Dann gilt (K(x, ε) \ {x}) ∩ A 6= ∅ für alle ε > 0. Folglich ist K(x, ε) 6⊂ X \ A für alle ε > 0 und damit x ∈ / Int(X \ A). Also gilt x ∈ X \ Int(X \ A) = cl(A). Wir zeigen nun cl(A) ⊂ A ∪ HP (A): Sei x ∈ cl(A) \ A. Wir müssen zeigen, dass x ein Häufungspunkt von A ist. Aus Satz 2.4 folgt x ∈ / Int(X \ A) ∪ A. Insbesondere gilt für alle ε-Kugeln K(x, ε) 6⊂ X \ A. Somit ergibt sich K(x, ε) ∩ A 6= ∅ und da x 6∈ A ist, gilt (K(x, ε) \ {x}) ∩ A 6= ∅. Also ist x ein Häufungspunkt von A. 52 2 Metrische Räume (3) A ist genau dann abgeschlossen, wenn A = cl(A), also wegen (2) genau dann wenn A = A ∪ HP (A). Dies ist aber äquivalent dazu, dass HP (A) ⊂ A. ⊓ ⊔ Definition 2.10. Sei (X, d) metrischer Raum und A ⊂ X Teilmenge. Ein Punkt x ∈ A heißt isolierter Punkt von A, falls ein ε > 0 existiert, so daß K(x, ε) ∩ A = {x} gilt. Mit Iso(A) bezeichnen wir die Menge der isolierten Punkte von A. Beispiel: Sei X = R1 versehen mit der Standardmetrik. Für die Menge A = (0, 1) ∪ { 23 } ∪ (2, 3) ⊂ R gilt 3 Iso(A) = { } 2 HP (A) = [0, 1] ∪ [2, 3] 3 ∂A = {0, 1, , 2, 3} 2 Int(A) = (0, 1) ∪ (2, 3) 3 cl(A) = [0, 1] ∪ { } ∪ [2, 3]. 2 Für die Menge B = {1, 1 1 1 2 , 3 , 4 , . . .} ⊂ R gilt Iso(B) = B HP (B) = {0} ∂B = cl(B) = B ∪ {0} Int(B) = ∅. Definition 2.11. Sei (X, d) ein metrischer Raum. Eine Teilmenge A ⊂ X heißt dicht in X, wenn cl(A) = X gilt. Satz 2.9 Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge von X. Dann sind die folgenden Aussagen äquivalent: 1. A ist dicht in X. 2. A besitzt keine äußeren Punkte , d.h. Int(X \ A) = ∅. 3. X \ A enthält keine ε–Kugel. Beweis. Es gelten die folgenden äquivalenten Ausagen A ⊂ X dicht ⇐⇒ cl(A) = X ⇐⇒ X \ Int(X \ A) = X ⇐⇒ Int(X \ A) = ∅ ⇐⇒ X \ A enthält keine ε–Kugel. ⊓ ⊔ 2.3 Folgen in metrischen Räumen 53 Beispiel: Wir betrachten wieder X = R mit der Standardmetrik. Die Menge der rationalen Zahlen Q und die Menge der irrationalen Zahlen R \ Q sind dicht in R. Um das einzusehen, erinnern wir uns an Kapitel 1. Wir wissen, dass in jedem Intervall (a, b) eine rationale Zahl liegt. Folglich enthält R \ Q keine offenen Intervalle, das heißt keine Kugeln des metrischen Raumes R. Somit ist Q nach Satz 2.9 dicht in R. Analog schließen wir für R \ Q, da jedes offene Intervall auch eine irrationale Zahl enthält. Definition 2.12. Sei (X, d) ein metrischer Raum und x ∈ X. Unter einer Umgebung von x verstehen wir eine offene Menge U ⊂ X, die x enthält. Bemerkung: • • • Jede Kugel K(x, ε) ist eine Umgebung von x. Jede Umgebung U von x enthält eine ε–Kugel um x. Jede Umgebung U von x ist die Vereinigung von Kugeln. Da U offen ist, existiert nämlich für S jedes y ∈ U ein ε(y) > 0, so daß K(y, ε(y)). K(y, ε(y)) ⊂ U . Folglich gilt U = y∈U Man kann deshalb in allen obigen Definitionen (innerer Punkt, Abschluss, Randpunkt, Häufungspunkt, isolierter Punkt, . . .) den Begriff “Kugeln um x” durch “Umgebungen von x” ersetzen. 2.3 Folgen in metrischen Räumen Definition 2.13. Sei X eine nichtleere Menge. Unter einer Folge in X versteht man eine Abbildung F : N −→ X n 7−→ F (n) =: xn , die jeder natürlichen Zahl n einen Punkt xn ∈ X zuordnet. Eine Folge ist also eine durch die Abbildung F gegebene Aufzählung von Punkten in X. Wir geben künftig lediglich die Bildwerte der Abbildung F an und benutzen für die Folge die nachstehenden Schreibweisen: x1 , x2 , x3 , . . . oder (xn )∞ oder kurz (xn ). n=1 Definition 2.14. Sei (X, d) ein metrischer Raum und (xn ) eine Folge in X. Wir sagen, dass (xn ) gegen x ∈ X konvergiert, falls zu jedem ε > 0 ein (von ε-abhängiger) Index n0 ∈ N existiert, so dass xn ∈ K(x, ε) für alle n ≥ n0 . Der Punkt x heißt Grenzwert (GW) der Folge (xn ). Besitzt eine Folge (xn ) einen Grenzwert, so heißt sie konvergent. Besitzt die Folge (xn ) keinen Grenzwert, so heißt sie divergent. 54 2 Metrische Räume Bezeichnung: Für eine gegen x konvergente Folge (xn ) schreiben wir lim xn = x n→∞ n→∞ xn −→ x oder xn −→ x. oder kurz Es gilt also • • lim xn = x ⇐⇒ ∀ ε > 0 ∃ n0 mit d(x, xn ) < ε n→∞ ∀ n ≥ n0 . Sei speziell X = R mit der Standardmetrik d(x, y) = |x − y|. Dann gilt lim xn = x ⇐⇒ ∀ ε > 0 ∃ n0 mit | x − xn | < ε ∀ n ≥ n0 . n→∞ Wir erhalten daraus die folgende Charakterisierung der Konvergenz von Folgen Satz 2.10 Sei (X, d) ein metrischer Raum und (xn ) eine Folge in X. Dann konvergiert die Folge (xn ) im metrischen Raum (X, d) genau dann gegen x ∈ X, wenn die Folge der Abstände (d(x, xn )) im metrischen Raum R gegen Null konvergiert: xn −→ x in (X, d) ⇐⇒ d(x, xn ) −→ 0 in R. 2.3.1 Allgemeine Eigenschaften konvergenter Folgen Satz 2.11 (Eindeutigkeit des Grenzwerts) Konvergiert eine Folge (xn ) im metrischen Raum (X, d) gegen x ∈ X und gegen x∗ ∈ X, so gilt x = x∗ . Beweis. Angenommen x 6= x∗ . Dann ist ε := d(x, x∗ ) > 0. Also existieren n0 und n∗0 mit d(x, xn ) < ε 2 ∀ n ≥ n0 , d(x∗ , xn ) < Somit gilt d(x, xn ) < 2ε und d(x∗ , xn ) < Dreiecksungleichung folgt ε 2 ε 2 für alle n ≥ max(n0 , n∗0 ). Nach ε = d(x, x∗ ) ≤ d(x, xn ) + d(xn , x∗ ) < Dies ist aber ein Widerspruch. ∀ n ≥ n∗0 . ε ε + =ε 2 2 ⊓ ⊔ Definition 2.15. Sei (X, d) ein metrischer Raum und A ⊂ X. A heißt beschränkt, falls es eine Kugel K(x0 , M ) des metrischen Raumes (X, d) gibt, die A enthält. Eine Folge (xn ) in (X, d) heißt beschränkt, wenn die Menge der Folgenglieder {x1 , x2 , x3 , . . .} beschränkt ist. Satz 2.12 Jede konvergente Folge (xn ) eines metrischen Raumes (X, d) ist beschränkt. 2.3 Folgen in metrischen Räumen 55 Beweis. Sei (xn ) eine konvergente Folge und x = lim xn . Nach Definition n→∞ der Konvergenz existiert ein n0 ∈ N, so dass d(xn , x) < 1 für alle n ≥ n0 . Wir setzen nun M := max( d(x, x1 ), d(x, x2 ), . . . , d(x, xn0 −1 ) ) + 1. Dann gilt d(x, xn ) < M für alle n ∈ N. Damit liegt die Menge {x1 , x2 , . . .} in der Kugel K(x, M ) und ist somit beschränkt. ⊓ ⊔ Als nächstes wollen wir ein Kriterium für die Konvergenz von Folgen in Produkträumen behandeln. Wir erinnern nochmal an die Definition der Produktmetrik. Seien (X1 , d1 ), (X2 , d2 ), . . . , (Xk , dk ) metrische Räume. Das Produkt dieser k metrischen Räume ist das Paar (X, d) mit X : = X1 × X2 × . . . × Xk v u k uX dj (aj , bj )2 wobei a = (a1 , . . . , ak ), b = (b1 , . . . , bk ). d(a, b) := t j=1 Satz 2.13 Seien (X1 , d1 ), . . . , (Xk , dk ) metrische Räume und (X, d) das Produkt dieser Räume. Eine Folge (xn = (xn1 , . . . , xnk ))∞ n=1 von Punkten im Produktraum X konvergiert genau dann gegen y = (y1 , . . . , yk ) ∈ X, wenn lim xnj = yj in (Xj , dj ) für jedes j ∈ {1, . . . , k} gilt. n→∞ Beweis. Nach Definition der Produktmetrik ist v u k uX d((xn1 , . . . , xnk ), (y1 , . . . , yk )) = t di (xni , yi )2 ≥ dj (xnj , yj ) | {z } | {z } xn (∗) i=1 y für jedes j ∈ {1, . . . , k}. Sei nun (xn ) gegen y in (X, d) konvergent. Dann existiert für jedes ε > 0 ein n0 ∈ N mit d(y, xn ) < ε für alle n ≥ n0 . Nach Abschätzung (*) folgt daraus dj (yj , xnj ) < ε für alle n ≥ n0 und jedes j ∈ {1, . . . , k}. Somit konvergiert xnj gegen yj in (Xj , dj ) für jedes j ∈ {1, . . . , k}. Sei umgekehrt lim xnj = yj für jedes j ∈ {1, . . . , k} und ε > 0. Dann existien→∞ ren n0j ∈ N so dass dj (yj , xnj ) < √ε k für alle n ≥ n0j . Es folgt v v u k u k uX ε2 uX t 2 =ε dj (xnj , yj ) < t d(xn , y) = k j=1 j=1 für alle n ≥ m0 = max(n01 , . . . , n0k ). Also konvergiert xn gegen y im Produktraum (X, d). ⊓ ⊔ Wir charakterisieren nun den Abschluß einer Teilmenge eines metrischen Raumes durch konvergente Folgen. 56 2 Metrische Räume Satz 2.14 Sei A eine beliebige Teilmenge eines metrischen Raumes (X, d). Dann gilt für den Abschluß von A x ∈ cl(A) ⇐⇒ Es existiert eine Folge (an ) mit an ∈ A, so dass lim an = x. n→∞ Beweis. (=⇒) Sei x ∈ cl(A). Dann gilt K(x, ε) ∩ A 6= ∅ für alle ε > 0. Sei n ∈ N und ε = n1 . Dann existiert ein Element an ∈ K(x, n1 ) ∩ A. Wir erhalten also eine Folge a1 , a2 , a3 . . . in A mit d(x, an ) < n1 . Die Folge der Abstände (d(x, an )) konvegiert gegen Null (Archimedisches Axiom) , somit konvergiert die Folge (an ) gegen x. (⇐=) Sei (an ) eine Folge in A, die gegen x konvergiert und ε > 0. Dann existiert ein n0 ∈ N, so dass an ∈ K(x, ε) für alle n ≥ n0 . Folglich ist K(x, ε)∩ A 6= ∅, also x ∈ cl(A). ⊓ ⊔ Folgerung 2.1 Sei (X, d) ein metrischer Raum. Dann gilt: 1. Eine Teilmenge A ⊂ X ist genau dann abgeschlossen, wenn der Grenzwert jeder konvergenten, vollständig in A liegenden Folge gleichfalls in A liegt. 2. Eine Teilmenge A ⊂ X ist genau dann dicht im metrischen Raum (X, d), wenn für jedes x ∈ X eine Folge (an ) von Punkten aus A existiert, die gegen x konvergiert. Beweis. A ⊂ X ist genau dann abgeschlsooen, wenn cl(A) = A. A ⊂ X ist genau dann dicht, wenn cl(A) = X. Die Charakterisierung von cl(A) aus Satz 2.14 liefert dann die Behauptung. ⊓ ⊔ Definition 2.16. Sei (xn ) eine Folge in einer Menge X. Unter einer Teilfolge von (xn ) verstehen wir eine unendliche Auswahl von Elementen dieser Folge, d.h. eine Folge (xnj )∞ j=1 , wobei {n1 , n2 , n3 , . . .} eine Teilmenge vonN mit n1 < n2 < n3 < . . . ist. Offensichtlich gilt Satz 2.15 Sei (X, d) ein metrischer Raum und (xn ) eine gegen x ∈ X konvergente Folge. Dann konvergiert jede Teilfolge von (xn ) ebenfalls gegen x. Definition 2.17. Sei (xn ) eine Folge im metrischen Raum (X, d). Ein Punkt x ∈ X heißt Häufungspunkt der Folge (xn ), wenn es eine Teilfolge (xnj )∞ j=1 von (xn ) gibt mit lim xnj = x. j→∞ Die Menge der Häufungspunkte von (xn ) bezeichnen wir mit HP (xn ). Beispiele: 1. Sei (X, d) ein metrischer Raum und (xn ) eine gegen x ∈ X konvergente Folge. Dann gilt nach Satz 2.15, dass HP (xn ) = {x}. 2.3 Folgen in metrischen Räumen 57 2. Sei X = R mit der Standardmetrik und (xn ) die folgende Folge 1 falls n gerade xn := n 1 falls n ungerade Dann gilt HP (xn ) = {0, 1}. Satz 2.16 Sei (X, d) ein metrischer Raum und (xn ) eine Folge in X. Die Menge der Häufungspunkte von (xn ) ist abgeschlossen. Beweis. Das überlassen wir dem Leser als Übungsaufgabe 26. ⊓ ⊔ 2.3.2 Spezielle Eigenschaften von konvergenten Folgen im Vektorraum Ck bzw. Rk In diesem Abschnitt betrachten wir spezielle Eigenschaften konvergenter Folgen im Vektorraum Ck bzw. Rk , den wir mit der in Kapitel 1.4 eingeführten Standardmetrik p d(z, w) := kz − wk := |z1 − w1 |2 + . . . + |zk − wk |2 z = (z1 , . . . , zk ) , w = (w1 , . . . , wk ) ∈ Ck bzw. Rk versehen. Da der metrische Raum Rk ein Teilraum des metrischen Raumes Ck ist, gelten alle Eigenschaften, die wir im folgenden für Folgen in Ck formulieren, auch für Folgen in Rk . Aus Satz 2.13 folgt als Spezialfall sofort Satz 2.17 k 1. Eine Folge von Vektoren (zn = (zn1 , . . . , znk ))∞ n=1 aus C konvergiert ge∗ ∗ ∗ k nau dann gegen den Vektor z = (z1 , . . . , zk ) ∈ C , wenn die Folge der ∗ Komponenten (znj )∞ n=1 für jedes j ∈ {1, ..., k} in C gegen zj konvergiert. 2. Eine Folge komplexer Zahlen (wn ) konvergiert genau dann gegen w ∈ C, wenn die Folge der Realteile (Re(wn )) gegen Re(w) und die Folge der Imaginärteile (Im(wn )) gegen den Imaginärteil Im(w) konvergiert. 3. Eine Folge komplexer Zahlen (wn ) konvergiert genau dann gegen w ∈ C, wenn die Folge (w n ) gegen w konvergiert. Der folgende Satz fasst die wichtigsten Rechenregeln für Folgen in Ck (bzw. in Rk ) zusammen. 58 2 Metrische Räume Satz 2.18 (Rechenregeln für konvergente Folgen in Ck ) 1. Seien (zn ) und (wn ) zwei konvergente Folgen in Ck mit den Grenzwerten lim zn = z ∈ Ck und lim wn = w ∈ Ck . Dann gilt: n→∞ n→∞ (a) lim (zn + wn ) = lim zn + lim wn = z + w n→∞ n→∞ n→∞ (b) lim µ · zn = µ · lim zn = µ · z n→∞ n→∞ ∀µ∈C (c) lim hzn , wn i = h lim zn , lim wn i = hz, wi n→∞ n→∞ n→∞ (d) lim kzn k = k lim zn k = kzk. n→∞ n→∞ 2. Seien (zn ) und (wn ) zwei konvergente Folgen komplexer Zahlen mit den Grenzwerten lim zn = z und lim wn = w in C. Dann gilt: n→∞ n→∞ (a) lim zn · wn = lim zn · lim wn = z · w n→∞ n→∞ n→∞ (b) Ist w 6= 0, so ist auch wn 6= 0 für alle n größer als ein n0 ∈ N, und es gilt lim zn zn z lim = n→∞ = . n→∞ wn lim wn w n→∞ 3. Seien (xn ) und (yn ) zwei konvergente Folgen reeller Zahlen mit den Grenzwerten lim xn = x und lim yn = y. n→∞ n→∞ (a) Gilt xn ≤ yn für fast alle1 n ∈ N, so folgt x ≤ y. (b) Sei (un ) eine weitere Folge reeller Zahlen mit xn ≤ un ≤ yn für fast alle n ∈ N und sei x = y. Dann ist die Folge (un ) ebenfalls konvergent und es gilt lim un = x. n→∞ Beweis. Zu 1. (a) Es gilt k(zn + wn ) − (z + w)k ≤ kzn − zk + kwn − wk und für alle ε > 0 existieren n0 , n∗0 ∈ N, so dass kzn − zk < ε 2 ∀ n ≥ n0 und kwn − wk < ε 2 ∀ n ≥ n∗0 . Daraus folgt k(zn + wn ) − (z + w)k < ε für alle n ≥ max(n0 , n∗0 ) und somit lim (zn + wn ) = (z + w). n→∞ (b) Ist µ = 0, so gilt die Behauptung trivialerweise. Sei µ 6= 0. Dann gilt kµz − µzn k = |µ| · kz − zn k. Da (zn ) gegen z konvergiert, existiert für ε > 0 ein n0 ∈ N, so dass 1 für fast alle n ∈ N bedeutet, dass die Aussage mit eventueller Ausnahme von endlich vielen naürlichen Zahlen gilt 2.3 Folgen in metrischen Räumen kz − zn k < ε |µ| 59 ∀ n ≥ n0 . Folglich gilt kµz − µzn k = |µ| · kz − zn k < ε für alle n ≥ n0 , und somit lim µzn = µz. n→∞ (c) Mittels der Cauchy-Schwarzschen Ungleichung erhält man die folgende Abschätzung |hzn , wn i − hz, wi| = |hzn − z, wn i − hz, wn − wi| ≤ |hzn − z, wn i| + |hz, wn − wi| ≤ kzn − zk kwn k + kzk kwn − wk. (∗) Da die Folge (wn ) konvergiert, ist die Menge {w1 , w2 , . . .} beschränkt. Somit existiert ein M ∈ R+ mit kwn k ≤ M für alle n ∈ N. Sei nun ε > 0 gegeben. Dann existieren n0 und n∗0 , so dass kz − zn k < ε 2M ∀ n ≥ n0 und kw − wn k ≤ ε 2M ∀ n ≥ n∗0 . OBdA sei z 6= 0, denn ansonsten tritt der letzte Summand in (∗) nicht auf. Wir erhalten |hzn , wn i − hz, wi| ≤ ε ε + =ε 2 2 ∀ n ≥ max(n0 , n∗0 ). Daraus folgt lim hzn , wn i = hz, wi. n→∞ (d) Sei zn −→ z. Aus der Dreiecksungleichung für die Norm in Ck folgt | kzn k − kzk | ≤ kzn − zk < ε ∀ n ≥ n0 . Also konvergiert (kzn k) gegen kzk. (1c) Zu 2. (a) zn · wn = hzn , w n i −→ hz, wi = z · w. (b) Da w 6= 0 und (wn ) gegen w konvergiert, existiert eine positive reelle Zahl η so dass 0 < η < |wn | für alle n größer als ein n0 . Man erhält zn zn · w − wn · z |(zn − z)w − (wn − w)z| z = wn − w = wn · w |wn | · |w| |zn − z||w| + |wn − w||z| . ≤ |wn | · |w| Daraus folgt zn |w| z |z| ≤ |zn − z| · − + |wn − w| · ≤ε wn w η|w| η|w| Also konvergiert die Folge ( wznn ) gegen z w. ∀ n ≥ n0 . 60 2 Metrische Räume Zu 3. (a) Angenommen, es wäre x > y. Wir setzen ε = x − y > 0. Dann existiert ein n0 ∈ N, so dass |xn − x| < ε ε und |yn − y| < 2 2 ∀ n ≥ n0 . Deshalb ist xn > x − 2ε = y + 2ε > yn für alle n ≥ n0 . Dies steht aber im Widerspruch zur Voraussetzung und somit ist die Annahme x > y falsch. (b) Den Beweis dieser Aussage überlassen wir dem Leser als Übungsaufgabe (Übungsaufgabe 28). ⊓ ⊔ k Definition 2.18. Eine Folge (zn )∞ n=1 in C , die gegen den Nullvektor 0 = (0, . . . , 0) konvergiert, heißt Nullfolge. Bemerkung: Aus Satz 2.18 folgt dann • • • • • • Eine Folge von Vektoren (zn ) in Ck ist genau dann eine Nullfolge, wenn die Folge der reellen Zahlen (kzn k) eine Nullfolge ist. Eine Folge von Vektoren (zn ) konvergiert genau dann gegen den Vektor z, wenn (zn − z) eine Nullfolge ist. Ist (zn ) eine Nullfolge von Vektoren und µ ∈ C, so ist auch (µ · zn ) eine Nullfolge. Sind (zn ) und (wn ) Nullfolgen von Vektoren, so ist auch (zn + wn ) eine Nullfolge. Ist (zn ) eine Nullfolge und (wn ) eine konvergente Folge von Vektoren, so ist die Folge der Skalarprodukte (hzn , wn i) ebenfalls eine Nullfolge. Ist (yn ) eine Nullfolge reller Zahlen und xn eine weitere Folge reeller Zahlen mit 0 ≤ xn ≤ yn für fast alle n ∈ N, dann ist (xn ) ebenfalls eine Nullfolge. Wichtige Beispiele konvergenter Folgen in R bzw. C: 1. Sei q eine positive rationale Zahl. Dann gilt in R q 1 lim = 0. n→∞ n Dies gilt, da nach dem Archimedischen Axiom zu jedem ε > 0 ein n0 ∈ N q 1 existiert, so dass n10 ≤ ε q . Folglich ist | n1 | < ε für alle n ≥ n0 , woraus die Behauptung folgt. 2. Sei x eine positive reelle Zahl. Dann gilt in R √ lim n x = 1. n→∞ √ Um dies einzusehen, betrachten wir zunächst x > 1. Sei xn := n x − 1. Dann gilt xn > 0 und aus der Bernoullischen Ungleichung erhalten wir 2.3 Folgen in metrischen Räumen 61 x = (1 + xn )n ≥ 1 + n · xn . ( x−1 Also gilt 0 < xn ≤ x−1 n . Da n ) eine Nullfolge ist, konvergiert (xn ) ebenfalls √ n gegen Null, und somit ( x) gegen 1. Ist 0 < x < 1, so folgt x1√ > 1 und wir erhalten mittels Satz 2.18 und dem 1 = 1. gerade Bewiesenen lim n x = lim √ n 1 n→∞ n→∞ x 3. Im metrischen Raum R gilt lim n→∞ √ n n = 1. Zum Beweis betrachten wir die Folge xn := binomischen Formel folgt √ n n − 1. Es gilt xn ≥ 0. Aus der 1 n(n − 1)x2n . 2 q q 2 2 . Nach 1. ist ( Folglich gilt 0 ≤ xn ≤ n−1 n−1 ) eine Nullfolge, somit ist √ (xn ) ebenfalls eine Nullfolge und folglich gilt lim n n = 1. n = (1 + xn )n ≥ n→∞ 4. Sei z ∈ C mit |z| < 1. Dann gilt im metrischen Raum C lim z n = 0. n→∞ Dies sieht man folgendermaßen: Da 0 ≤ |z| < 1, existiert für jedes ε > 0 ein n0 ∈ N mit |z|n0 < ε. Da | z | < 1 ist, erhält man |z|n < |z|n0 für alle n ≥ n0 , das heißt |z|n = |z n | < ε für alle n ≥ n0 . Folglich gilt lim z n = 0. n→∞ 5. Sei k ∈ N eine fixierte natürliche Zahl und z ∈ C mit |z| > 1. Dann gilt im metrischen Raum C nk lim n = 0. n→∞ z Dies bedeutet, dass für |z| > 1 die Folge der Potenzen |z|n schneller wächst als jede noch so große Potenz von n. Zum Beweis setzen wir x := |z| − 1 und wählen eine natürliche Zahl p > k. Für jedes n > 2p folgt aus der binomischen Formel p−Faktoren z }| { n(n − 1) · . . . · (n − (p − 1)) p n n p (1 + x) > ·x = ·x . p! p Da p < n2 , ist jeder der Faktoren n, (n − 1), . . . , (n − (p − 1)) größer als p Es folgt (1 + x)n > ( n2 )p · xp! und somit 0< nk 2p · p! 2p · p! 1 < ≤ · . p |z|n xp · np−k |x {z } n konstant n 2. 62 2 Metrische Räume nk n n→∞ z Auf der rechten Seite steht eine Nullfolge, also ist lim = 0. 2.3.3 Spezielle Eigenschaften konvergenter Folgen in R In diesem Abschnitt betrachten wir spezielle Eigenschaften von Folgen im metrischen Raum R, der immer mit der Standardmetrik d(x, y) := |x − y| versehen sei. Wir nutzen dabei aus, dass R ein vollständiger angeordneter Körper ist. Um später Formulierungen vereinheitlichen zu können, betrachten wir zunächst eine spezielle Sorte von divergenten Folgen reeller Zahlen und ordnen diesen den Grenzwert +∞ oder −∞ zu. Definition 2.19. Sei (xn ) eine Folge reeller Zahlen. Wir sagen, dass (xn ) gegen +∞ strebt, falls zu jedem M ∈ R ein n0 ∈ N existiert mit xn ≥ M für alle n ≥ n0 . Wir sagen, dass (xn ) gegen −∞ strebt, falls zu jedem M ∈ R ein n0 ∈ N existiert mit xn ≤ M für alle n ≥ n0 . Für Folgen reeller Zahlen, die gegen +∞ bzw. −∞ streben, benutzen wir die Schreibweise lim xn = +∞ bzw. lim xn = −∞. n→∞ n→∞ Man nennt diese Sorte divergenter Folgen reeller Zahlen oft auch bestimmt divergent oder uneigentlich konvergent (je nach Autor des benutzten Buches) und ±∞ den uneigentlichen Grenzwert. Beispiele: • • • • • • Ist xn = n oder xn = n2 , so gilt lim xn = +∞ n→∞ Die Folge 1, 0, 2, 0, 3, 0, 4, 0, . . . ist in R divergent und konvergiert nicht gegen +∞, obwohl sie beliebig große Glieder enthält. Aus xn −→ +∞ und yn −→ +∞ folgt xn + yn −→ +∞ und xn · yn −→ +∞. Aus xn −→ +∞ und yn −→ a für a > 0 folgt xn + yn −→ +∞ und xn · yn −→ +∞ . Wenn xn −→ +∞ , so x1n −→ 0 . Wenn xn −→ 0 und xn > 0, so x1n −→ +∞ . Bemerkung: Aus xn −→ +∞ und yn −→ 0 kann man i.a. nichts über das Verhalten von xn · yn folgern, wie die folgenden Beispiele zeigen. • • Sei xn = n2 und yn = 2 Sei xn = n und yn = 1 n , so gilt 1 n2 , so gilt xn · yn = n −→ +∞. xn · yn = 1 −→ 1. 2.3 Folgen in metrischen Räumen • Sei xn = n2 und yn = • Für xn = n und yn = 1 n3 , ( so gilt xn · yn = 1 n 1 2n 1 n n gerade n ungerade xn · yn = 63 −→ 0. gilt 1 n gerade . 1 2 n ungerade Folglich konvergiert xn · yn überhaupt nicht. Eine wichtige Folgerung aus dem Vollständigkeitsaxiom der reellen Zahlen ist die folgende Eigenschaft beschränkter Folgen. Satz 2.19 (Satz von Bolzano/Weierstraß2 ) Jede beschränkte Folge reeller Zahlen (xn ) besitzt einen Häufungspunkt, d.h. eine konvergente Teilfolge. Beweis. Nach Voraussetzung existiert ein M > 0 mit −M < xn < M für alle n ∈ N. Wir betrachten die folgende Menge A ⊂ R: A := {x ∈ R1 | x ≤ xn für unendlich viele n}. 1. A ist nicht leer, da −M ∈ A. 2. A ist nach oben beschränkt, da zum Beispiel M eine obere Schranke ist. Nach dem Satz 1.7 existiert ein Supremum g = sup A der Menge A. Sei ε > 0. Aus der Definition des Supremums erhalten wir (i) g + ε 6∈ A. D.h. für höchstens endlich viele xn gilt die Ungleichung g + ε ≤ xn . (ii) Es existiert ein x ∈ A mit g − ε < x. Somit sind unendlich viele Folgenglieder xn größer oder gleich x, also größer als g − ε. Insgesamt folgt also, dass unendlich viele Glieder der Folge (xn ) im Intervall (g − ε, g + ε) liegen. Wir konstruieren jetzt eine Teilfolge (xnk ) von (xn ) auf folgende Weise. ε = 1 =⇒ ∃ xn1 : g − 1 < xn1 < g + 1 1 1 1 ε = =⇒ ∃ xn2 : g − < xn2 < g + , n2 > n1 , 2 2 2 .. . 1 1 1 ε = =⇒ ∃ xnk : g − < xnk < g + , nk > nk−1 . . . k k k Damit haben wir eine Teilfolge (xnk ) von (xn ) gefunden mit |xnk − g| < alle k ∈ N. Somit ist lim xnk = g. k→∞ 1 k für ⊓ ⊔ 64 2 Metrische Räume Definition 2.20. Eine Folge reeller Zahlen (xn ) heißt monoton wachsend, falls x1 ≤ x2 ≤ x3 ≤ . . . und monoton fallend, falls x1 ≥ x2 ≥ x3 ≥ . . . Eine Folge heißt monoton, wenn sie monoton wachsend oder monoton fallend ist. Satz 2.20 Jede monoton wachsende, nach oben beschränkte Folge reller Zahlen (xn )∞ n=1 konvergiert gegen sup{xn | n ∈ N}. Jede monoton fallende, nach unten beschränkte Folge reeller Zahlen (xn )∞ n=1 konvergiert gegen inf{xn | n ∈ N}. Beweis. Sei (xn ) monoton wachsend und nach oben beschränkt. Nach Satz 1.7 existiert das Supremum g = sup{xn | n ∈ N}. Wir zeigen, dass xn −→ g. Sei ε > 0. Nach Definition des Supremums existiert ein m0 ∈ N mit xm0 > g − ε, also mit xm0 ∈ (g − ε, g]. Da (xn ) monoton wachsend ist, gilt xn ≥ xm0 für alle n ≥ m0 . Folglich konvergiert (xn ) gegen g. Den Beweis für monoton fallende, nach unten beschränkte Folgen führt man analog. ⊓ ⊔ Das Supremum und das Infimum einer beschränkten Teilmenge A ⊂ R liegt im Abschluss cl(A). Ist A ⊂ R beschränkt und abgeschlossen, so existiert folglich das Maximum max(A) und das Minimum min(A) von A. Sei nun (xn ) eine beschränkte Folge reeller Zahlen. Dann ist die Menge der Häufungspunke HP (xn ) nicht leer (Satz 2.19) und abgeschlossen (Satz 2.16). Folglich existiert das Maximum max HP (xn ), d.h. ein größter Häufungspunkt von (xn ), und das Minimum min HP (xn ), d.h. ein kleinster Häufungspunkt von (xn ). Definition 2.21. Sei (xn ) eine beschränkte Folge reeller Zahlen. Man nennt den größten Häufungspunkt von (xn ) auch limes superior von (xn ) und bezeichnet ihn mit lim sup xn := lim xn := max HP (xn ). n→∞ Den kleinsten Häufungspunkt von (xn ) nennt man auch limes inferior von (xn ) und bezeichnet ihn mit lim inf xn := lim xn := min HP (xn ). n→∞ 2.3 Folgen in metrischen Räumen 65 Ist (xn ) nicht nach oben beschränkt, so setzen wir lim sup xn := +∞. n→∞ Ist (xn ) nicht nach unten beschränkt, so setzen wir lim inf xn := −∞. n→∞ Satz 2.21 Sei (xn ) eine beschränkte Folge reeller Zahlen. Dann gilt lim xn = g ⇐⇒ lim sup xn = lim inf xn = g. n→∞ n→∞ n→∞ Beweis. (1) Sei (xn ) gegen g ∈ R konvergent. Dann gilt HP (xn ) = {g} und somit lim inf xn = lim inf xn = g. n→∞ n→∞ (2) Sei umgekehrt lim sup xn = lim inf xn = g Dann gilt HP (xn ) = {g}, das n→∞ n→∞ heißt jede konvergente Teilfolge von (xn ) konvergiert gegen g. Angenommen (xn ) würde nicht gegen g konvergieren. Dann existiert ein ε > 0, so daß gilt ∀ n0 ∃ n ≥ n0 mit |xn − g| ≥ ε. Wir konstruieren jetzt eine Teilfolge von (xn ) folgendermaßen: n0 = 1 =⇒ ∃ n1 ≥ 1 : |xn1 − g| ≥ ε, n0 = n1 + 1 =⇒ ∃ n2 > n1 : |xn2 − g| ≥ ε, . . . , n0 = nk−1 + 1 =⇒ ∃ nk > nk−1 : |xnk − g| ≥ ε, . . . Dadurch erhalten wir eine Teilfolge (xnk ) von (xn ) mit |xnk − g| ≥ ε, die ebenfalls beschänkt ist. Nach Satz von Bolzano–Weierstraß enthält sie eine konvergente Teilfolge (xnki ), deren Grenzwert g ∗ nach Konstruktion von g verschieden ist. Dies ist ein Widerspruch zu unserer Voraussetzung. ⊓ ⊔ Anwendung: Die Eulerzahl e Satz 2.22 Die Folge der reellen Zahlen (an ) mit n 1 an := 1 + n ist in R konvergent. Der Grenzwert der Folge (an ) heißt Eulerzahl e. Beweis. Wir zeigen, dass (an ) eine monoton wachsende, nach oben beschränkte Folge ist. Nach Satz 2.20 existiert dann ein Grenzwert für (an ). 1. Beschränktheit von (an ): Aus der binomischen Formel folgt n X n k n 1 1 = . · an = 1 + n n k k=0 66 2 Metrische Räume Wir schätzen den Term n k · 1 k n für 1 ≤ k ≤ n ab: k−Faktoren }| { z k n 1 n(n − 1) · . . . · (n − (k − 1)) · = k n k! · n · . . . · n} | · n {z k−mal 2 (k − 1) 1 1 · 1− · ...· 1 − ·1· 1− = k! n n n {z } | (∗) ≤1 1 ≤ k! Folglich gilt für alle n ∈ N n 1 an = 1 + n 1 1 1 1 ≤ 1 + + + + ... + 1! 2! 3! n! 1 1 1 1 + + ...+ = 1+ + 1 2·3 2·3·4 2 ·3 · ...· n 1 1 1 1 1 ≤ 1 + 0 + 1 + 2 + 3 + . . . + n−1 2 2 2 2 2 n−1 X 1 k = 1+ 2 k=0 = 1+ 1 − ( 12 )n 1 2 (geometrische Summe) < 3. 2. Monotonie von (an ): Gleichung (∗) zeigt, dass k k n 1 n+1 1 · < . · k n n+1 k Somit gilt an < an+1 für alle n ∈ N. ⊓ ⊔ Satz 2.23 Die Folge der rellen Zahlen (bn ) mit n bn := 1 + X 1 1 1 1 1 + + + ...+ = 1! 2! 3! n! k! k=0 konvergiert in R und es gilt 2.3 Folgen in metrischen Räumen 67 n 1 = e. lim bn = lim 1 + n→∞ n→∞ n Beweis. Aus dem Beweis von Satz 2.22 folgt an ≤ bn < 3 für alle n ∈ N. Folglich ist (bn ) eine nach oben beschränkte, monoton wachsende Folge. Nach Satz 2.20 existiert deshalb ein Grenzwert von (bn ) und es gilt e = lim an ≤ lim bn . n→∞ n→∞ Andererseits gilt für m ≤ n wegen Formel (∗) aus dem Beweis von Satz 2.22 n n k X 1 n 1 an = 1 + = n n k k=0 (1 − n1 ) · . . . · (1 − n−1 (1 − n1 ) (1 − n1 )(1 − n2 ) n ) + + ...+ = 1+1+ 2! 3! n! (1 − n1 ) ) (1 − n1 ) · . . . · (1 − m−1 n ≥ 1+1+ + ...+ . 2! m! Wir halten m fest und gehen in dieser Ungleichung mit n gegen +∞. Dann folgt 1 1 e = lim an ≥ 1 + 1 + + . . . + = bm ∀ m ∈ N. n→∞ 2! m! Deshalb gilt lim bm ≤ e und wir erhalten zusammenfassend e = lim bn . ⊓ ⊔ m→∞ n→∞ Um die Eulerzahl genauer berechnen zu können, beweisen wir die folgende Fehlerabschätzung. Satz 2.24 Es sei bn = n P k=0 1 k! . Dann gilt für jedes n ∈ N die folgende Abschätzung für die Eulerzahl e: 1 n · n! Beweis. Für festes n gilt e − bn = lim (bk − bn ) . Für k > n erhalten wir bn < e < bn + k→∞ 1 1 + ...+ (n + 1)! k! 1 1 1 1 = 1+ + + ... + (n + 1)! (n + 2) (n + 2)(n + 3) (n + 2) · . . . · k 1 1 1 1 1+ + . . . + + < (n + 1)! (n + 2) (n + 2)2 (n + 2)k−n−1 bk − bn = = < 1 1 − ( n+2 )k−n 1 · 1 (n + 1)! ) 1 − ( n+2 (geometrische Summe) 1 1 n+2 1 n(n + 2) 1 = . · · = · 1 (n + 1)! 1 − n+2 (n + 1)! n + 1 n · n! (n + 1)2 68 2 Metrische Räume Der Grenzübergang in dieser Ungleichung für k gegen +∞ liefert e − bn ≤ 1 n(n + 2) 1 < · n · n! (n + 1)2 n · n! ∀ n ∈ N. ⊓ ⊔ Bemerkung: Mittels der Fehlerabschätzung aus Satz 2.24 kann man Näherungswerte für e angeben. Man erhält zum Beispiel für n = 10: b10 = 10 X 1 = 2.7182815 . . . k! k=0 1 = 0.00000002 . . . 10 · 10! Folglich ist 2.7182815 < e < 2.7182815 + 0.00000002 und somit e ≈ 2.7182815 . Als weitere Anwendung der Fehlerabschätzung beweisen wir Satz 2.25 Die Eulerzahl e ist irrational. Beweis. Angenommen e wäre eine rationale Zahl. Dann können wir e in der Form e = pq für p, q ∈ N darstellen. Für q ∈ N gilt nach Satz 2.24 0 < e − bq < 1 . q · q! Daraus folgt 0 < e · q! − bq · q! < 1q . Da e = pq , ist e · q! ganzzahlig. Wegen bq = 1 1 1 1 + + + ...+ 0! 1! 2! q! ist bq · q! ganzzahlig. Somit ist auch e · q! − bq · q! ganzzahlig. Das ist aber ein Widerspruch zu 0 < e · q! − bq · q! < 1q < 1. ⊓ ⊔ 2.4 Vollständige metrische Räume In diesem Abschnitt lernen wir eine Klasse von metrischen Räumen kennen, in denen man die Konvergenz einer Folge überprüfen kann, ohne ihren Grenzwert zu kennen. 2.4 Vollständige metrische Räume 69 Definition 2.22. Sei (X, d) ein metrischer Raum. Eine Folge (xn ) in (X, d) heißt Cauchy–Folge, wenn zu jedem ε > 0 ein (von ε abhängiges) n0 ∈ N existiert, so dass d(xn , xm ) < ε für alle n, m ≥ n0 . Satz 2.26 Jede konvergente Folge in einem metrischen Raum ist eine Cauchy– Folge. Beweis. Sei (xn ) eine gegen x konvergente Folge und ε > 0. Dann existiert ein n0 ∈ N mit d(xn , x) < 2ε für alle n ≥ n0 . Für n, m ≥ n0 folgt dann aus der Dreiecksungleichung d(xn , xm ) ≤ d(xn , x) + d(x, xm ) < ε ε + = ε. 2 2 Somit ist (xn ) eine Cauchy-Folge. ⊓ ⊔ Bemerkung: Die Umkehrung gilt i.a. nicht. Wir betrachten dazu den metrischen Raum (X, d) mit X = (0, 1) ⊂ R und der Metrik d(x, y) = |x − y|. Sei xn := n1 . Dann existiert für jedes ε > 0 ein n0 ∈ N mit 1 1 1 < ε ∀ n, m ≥ n0 . d(xn , xm ) = − ≤ n m min (n, m) Die Folge (xn ) ist also eine Cauchy-Folge in (X, d). Sie konvergiert aber in (X, d) nicht. Satz 2.27 Jede Cauchy-Folge in einem metrischen Raum ist beschränkt. Beweis. Sei ε = 1. Dann existiert ein n0 ∈ N so dass d(xn , xm ) < 1 für alle n, m ≥ n0 . Insbesondere bedeutet das, dass xn ∈ K(xn0 , 1) für alle n ≥ n0 . Wir setzen r := max { d(xn0 , x1 ), d(xn0 , x2 ), . . . , d(xn0 , xn0 −1 ) } + 1. Dann gilt xn ∈ K(xn0 , r) für alle n ∈ N. Folglich ist die Folge (xn ) beschränkt. ⊓ ⊔ Definition 2.23. Ein metrischer Raum (X, d) heißt vollständig, wenn jede Cauchy–Folge in (X, d) konvergiert. Bemerkung: In einem vollständigen, metrischen Raum kann man also die Konvergenz einer Folge untersuchen, ohne ihren Grenzwert zu kennen. Man prüft dafür die Cauchy–Bedingung ∀ ε > 0 ∃ n0 ∈ N mit d(xn , xm ) < ε ∀ n, m ≥ n0 . 70 2 Metrische Räume Satz 2.28 Der metrische Raum (R, d(x, y) = |x − y|) ist vollständig. Beweis. Sei (xn ) eine Cauchy–Folge reeller Zahlen. Dann ist (xn ) beschränkt. Nach dem Satz von Bolzano-Weierstraß existiert eine konvergente Teilfolge (xnk ) von (xn ). Sei x = lim xnk und ε > 0. Dann existieren k0 , n0 ∈ N, so dass k→∞ |x − xnk | < |xn − xm | < ε 2 ε 2 ∀ k ≥ k0 ∀ n, m ≥ n0 . Sei nun n ≥ n0 . Wir wählen ein k ≥ k0 mit nk ≥ n0 . Dann folgt aus der Dreiecksungleichung |xn − x| ≤ |xn − xnk | + |xnk − x| < ε ε + <ε. 2 2 Also konvergiert die Folge (xn ) gegen x. ⊓ ⊔ Bemerkung: Der metrische Raum der rationalen Zahlen Q (mit der Standardmetrik) ist nicht vollständig. • • Wir betrachten die Folge rationaler Zahlen (xn ), definiert durch 2 1 xn + ∀ n ∈ N. x0 := 1 und xn+1 := 2 xn √ Wir wissen, dass (xn ) in R gegen 2 konvergiert (siehe Übungsaufgabe 31). Die √ Folge (xn ) ist also eine Cauchy–Folge in R und somit auch in Q. Aber 2 ist keine rationale Zahl. Folglich konvergiert (xn ) nicht in Q. n Wir betrachten die Folge der rationalen Zahlen yn := 1 + n1 . (yn ) ist eine Cauchyfolge in Q, konvergiert aber in Q nicht, da die Eulerzahl e irrational ist. Satz 2.29 Sind (X1 , d1 ), . . . , (Xk , dk ) vollständige metrische Räume, so ist auch das Produkt (X, d) dieser metrischen Räume vollständig. Beweis. Sei (xn := (xn1 , . . . , xnk )) eine Cauchy–Folge im Produktraum (X = X1 × . . . × Xk , d) und ε > 0. Dann existiert ein n0 ∈ N, so dass v u k uX di (xni , xmi )2 < ε ∀ n, m ≥ n0 . d(xn , xm ) = t i=1 Daraus erhalten wir di (xni , xmi ) < ε für alle n, m ≥ n0 und jedes i ∈ {1, . . . , k}. Folglich sind die Folgen (xni )∞ n=1 Cauchy–Folgen in (Xi , di ) für jedes i ∈ {1, . . . , k}. Da (Xi , di ) vollständige metrische Räume sind, konvergieren die Folgen (xni )∞ n=1 gegen ein yi ∈ Xi . Somit gilt nach Satz 2.13 2.4 Vollständige metrische Räume 71 lim xn = (y1 , . . . , yk ) ∈ X1 × . . . × Xk . n→∞ ⊓ ⊔ Folgerung 2.2 Die metrischen Räume C, Rn und Cn (jeweils mit der Standardmetrik) sind vollständig. Satz 2.30 Sei (X, d) ein vollständiger metrischer Raum und A ⊂ X eine Teilmenge. Dann ist der metrische Raum (A, d|A×A ) genau dann vollständig, wenn A abgeschlossen ist. Beweis. (⇐=): Sei A abgeschlossen und (an ) eine Cauchy–Folge in (A, d) (Zur Abkürzung bezeichnen wir die Einschränkung von d auf A × A ebenfalls mit d). Dann ist (an ) auch Cauchy–Folge in (X, d), die, da (X, d) vollständig ist, gegen ein x ∈ X konvergiert. Da A abgeschlossen ist, liegt jeder Grenzwert einer Folge von Elementen aus A wieder in A. Somit ist x ∈ A, das heißt (an ) konvergiert in A. Folglich ist (A, d) ein vollständiger metrischer Raum. (=⇒): Sei nun (A, d) vollständig. Wir zeigen, dass dann A abgeschlossen ist. Sei x ∈ cl(A). Dann existiert eine Folge an ∈ A mit lim an = x. Damit ist n→∞ (an ) eine Cauchy–Folge in (A, d) und somit in A konvergent. Das heißt, x liegt in A. Folglich gilt cl(A) ⊂ A. Die Teilmenge A ⊂ X ist also abgeschlossen. ⊓ ⊔ Folgerung 2.3 Jede abgeschlossene Teilmenge A ⊂ Rn bzw. A ⊂ Cn ist ein vollständiger metrischer Raum (mit Standardmetrik). Wir wissen, dass nicht jeder metrische Raum vollständig ist. Man kann aber jeden metrischen Raum vervollständigen. Abschließend behandeln wir diese Vervollständigungsprozedur, die uns zeigt, dass man jeden metrischen Raum als dichten Teilraum eines gewissen vollständigen metrischen Raumes auffassen kann. Diese Prozedur wird in der Analysis vielfältig angewendet. Satz 2.31 (Vervollständigung metrischer Räume) Zu jedem metrischen Raum (X, d) gibt es einen vollständigen metrischen e d) ˜ und eine Abbildung ϕ : X −→ X, e für die gilt: Raum (X, ˜ ist eine Isometrie. 1. ϕ : (X, d) −→ (ϕ(X), d) e 2. ϕ(X) ⊂ X ist dicht. ˜ ist bis auf Isometrie eindeutig bestimmt, d.h. ist (X ′ , d′ ) ein weiterer e d) (X, vollständiger metrischer Raum und ϕ′ : X −→ X ′ eine Abbildung mit den ˜ −→ (X ′ , d′ ) e d) Eigenschaften 1. und 2., dann existiert eine Isometrie F : (X, ′ so dass F ◦ ϕ = ϕ . 72 2 Metrische Räume ˜ aus Satz 2.31 heißt Vervollständie d) Definition 2.24. Der metrische Raum (X, gung von (X, d). Beweis. Den Beweis führen wir in mehreren Schritten. e 1. Schritt: Definition der Menge X. Dazu betrachten wir die Menge CF(X, d) der Cauchy-Folgen des metrischen Raumes (X, d). Zwei Cauchy-Folgen (xn ), (yn ) ∈ CF(X, d) bezeichnen wir als äquivalent (symbolisch: (xn ) ∼ (yn )), wenn d(xn , yn ) → 0 für n → +∞. Dies definiert eine Äquivalenzrelation auf dem Raum CF(X, d). Aus d(xn , xn ) = 0 und d(xn , yn ) = d(yn , xn ) ergeben sich unmittelbar die Reflexität und die Symmetrie der Relation ∼. Aus der Dreiecksungleichung 0 ≤ d(xn , zn ) ≤ d(xn , yn ) + d(yn , zn ) folgt, dass mit d(xn , yn ) → 0 und d(yn , zn ) → 0 stets d(xn , zn ) → 0 gilt. Dies e sei die Menge der Äquivalenzklaszeigt die Transitivität von ∼. Die Menge X sen von Cauchy-Folgen bzgl. der Relation ∼: e := CF(X, d)/ ∼ . X Die Äquivalenzklasse der Cauchy-Folge (xn ) ∈ CF(X, d) bezeichnen wir mit [(xn )]. e 2. Schritt: Definition des Abstandes d˜ auf X. Seien (xn ), (yn ) ∈ CF(X, d) zwei Cauchy-Folgen von (X, d). Nach der Vierecksungleichung gilt |d(xm , ym ) − d(xn , yn )| ≤ d(xm , xn ) + d(ym , yn ) . Folglich ist die Folge der reellen Zahlen (d(xn , yn )) eine Cauchy-Folge im metrischen Raum R. Da R vollständig ist, konvergiert diese Folge, d.h. es existiert lim d(xn , yn ) . Wir definieren für zwei Elemente ξ = [(xn )] und η = [(yn )] n→∞ e den Abstand von X ˜ η) := lim d(xn , yn ) . d(ξ, n→∞ Diese Definition ist korrekt, d.h. sie hängt nicht von der Wahl der Repräsentanten (xn ) bzw. (yn ) in den Äquivalenzklassen ξ bzw. η ab. Sind nämlich (xn ) ∼ (x′n ) und (yn ) ∼ (yn′ ), so gilt nach Vierecksungleichung |d(x′n , yn′ ) − d(xn , yn )| ≤ d(x′n , xn ) + d(yn′ , yn ) . Benutzt man nun die Definition von ∼, so folgt lim d(xn , yn ) = lim d(x′n , yn′ ) . n→∞ n→∞ 2.4 Vollständige metrische Räume 73 e ×X e → R ist ein Abstand auf X: e Die Symmetrie und die Die Abbildung d˜ : X ˜ Positivität von d sind offensichtlich wegen der analogen Eigenschaften von d. Die Äquivalenzrelation ∼ auf CF(X, d) ist gerade so definiert, dass ˜ η) = 0 ⇐⇒ lim d(xn , yn ) = 0 ⇐⇒ (xn ) ∼ (yn ) ⇐⇒ ξ = η. d(ξ, n→∞ Die Dreiecksungleichung folgt ebenfalls aus derjenigen von d: Seien ξ = [(xn )], η = [(yn )], ρ := [(wn )]. Dann gilt ˜ η) = lim d(xn , yn ) d(ξ, n→∞ ≤ lim (d(xn , wn ) + d(wn , yn )) n→∞ ˜ ρ) + d(ρ, ˜ η) . = d(ξ, ˜ definiert. e d) Damit haben wir einen metrischen Raum (X, 3. Schritt: Definition der Abbildung ϕ: Sei x ∈ X. Wir betrachten die konstante Folge (xn := x) in X und bezeichnen ˜ Die Abbildung ϕ e ihre Äquivalenzklasse x̃ := [(xn := x)] in (X, e d). mit x̃ ∈ X definieren wir durch e ϕ : X −→ X x 7−→ x̃ Die Abbildung ϕ : X −→ ϕ(X) ist offensichtlich bijektiv und es gilt nach Definition von d˜ ˜ ˜ ỹ) = lim d(x, y) = d(x, y). d(ϕ(x), ϕ(y)) = d(x̃, n→∞ ˜ von (X, ˜ e d). (X, d) ist also isometrisch zum Teilraum (ϕ(X), d) ˜ ist vollständig. e d) 4. Schritt: Der metrische Raum (X, ∞ ˜ Wir zeigen, dass (ξk ) in e d). Sei (ξk )k=1 eine beliebige Cauchy-Folge aus (X, ˜ konvergiert. Zunächst wählen wir in jeder Äquivalenzklasse ξk einen e d) (X, Repräsentanten (xkn )∞ n=1 ∈ CF(X, d). In jeder dieser Cauchy-Folgen wählen wir dann ein Folgenglied xknk ∈ X so, dass d(xkn , xknk ) < 1 k ∀ n > nk . (∗) Wir zeigen nun, dass die Folge (xknk )∞ k=1 eine Cauchy-Folge in (X, d) ist. Aus ˜ der Dreiecksungleichung und (∗) der Isometrie zwischen (X, d) und (ϕ(X), d), folgt ˜ kn , x̃k′ n ′ ) d(xknk , xk′ nk′ ) = d(x̃ k k ˜ k′ , x̃k′ n ′ ) ˜ kn , ξk ) + d(ξ ˜ k , ξk′ ) + d(ξ ≤ d(x̃ k k ˜ k , ξk′ ) + lim d(xk′ n , xk′ n ′ ) = lim d(xknk xkn ) + d(ξ k n→∞ 1 ˜ k , ξk′ ) + 1 . < + d(ξ k k′ n→∞ 74 2 Metrische Räume e ˜ Da (ξk )∞ k=1 eine Cauchy-Folge in (X, d) ist, existiert zu vorgegebenem ε > 0 ein Index k0 ∈ N, so dass ˜ k , ξk′ ) , 1 , 1 < ε d(ξ k k′ 6 Folglich ist d(xknk , xk′ nk′ ) < ε 2 ∀ k, k ′ ≥ k0 . ∀ k, k ′ ≥ k0 . (∗∗) und somit (xknk )∞ k=1 eine Cauchy-Folge in (X, d). Die Äquivalenzklasse dieser ˜ gegen ξ konvergiert. e d) Folge sei ξ := [(xknk )]. Wir zeigen, dass (ξk ) in (X, Aus (∗) und (∗∗) folgt ˜ k , ξ) ≤ d(ξ ˜ k , x̃kn ) + d(x̃ ˜ kn , ξ) d(ξ k k = lim d(xkn , xknk ) + ′lim d(xknk , xk′ nk′ ) n→∞ k →∞ ∀ k > k0 . < ε e ˜ e Folglich konvergiert die Cauchy-Folge (ξk )∞ k=1 im Raum (X, d) gegen ξ ∈ X. e ist. 5. Schritt: Wir zeigen, dass die Menge ϕ(X) dicht in X ∞ e Sei ξ ∈ X ein beliebiges Element und (xn )n=1 eine Cauchy-Folge in der Äquivalenzklasse ξ. Wir betrachten die entsprechende Folge (x̃n ) in ϕ(X). Für ε > 0 existiert ein n0 ∈ N mit ˜ n , ξ) = lim d(xn , xm ) < ε d(x̃ m→∞ ∀ n > n0 . e ist bewieFolglich konvergiert (x̃n ) gegen ξ und die Dichtheit von ϕ(X) in X sen. ˜ ist bis auf Isometrie eindeutig bestimmt: e d) 6. Schritt: (X, Sei (X ′ , d′ ) ein weiterer vollständiger metrischer Raum und ϕ′ : X −→ X ′ eine Abbildung, so dass ϕ′ : (X, d) −→ (ϕ′ (X), d′ ) eine Isometrie und ϕ′ (X) ⊂ X ′ dicht ist. Dann definiert die Abbildung f : ϕ(X) −→ ϕ′ (X) ϕ(x) 7−→ ϕ′ (x) ˜ und offensichtlich eine Isometrie zwischen den metrischen Räumen (ϕ(X), d) ′ ′ e ˜ (ϕ (X), d ). Wir erweitern f zu einer Isometrie F zwischen (X, d) und (X ′ , d′ ): e und ξ = lim x̃n für eine Folge (x̃n ) aus ϕ(X). Da (x̃n ) eine CauchySei ξ ∈ X n→∞ Folge in ϕ(X) ist, ist auch ihr Bild (f (x̃n )) eine Cauchy-Folge in ϕ′ (X). Sei ξ ′ := lim f (x̃n ) ∈ X ′ . ξ ′ ist korrekt definiert, d.h. unabhängig von der Wahl n→∞ der Folge (x̃n ). Sei nämlich (ỹn ) eine weitere Folge mit ξ = lim ỹn , so gilt n→∞ ˜ n , ỹn ) = d′ (f (x̃n ), f (ỹn )) → 0 , also lim f (ỹn ) = ξ ′ . Wir erhalten somit d(x̃ n→∞ eine Fortsetzung von f zu einer Abbildung 2.5 Kompakte und folgenkompakte Teilmengen metrischer Räume e −→ X ′ F :X 75 ξ = lim x̃n 7−→ ξ ′ = lim f (x̃n ) . n→∞ n→∞ e und η = lim ỹn ∈ X e gilt F ist offensichtlich bijektiv. Für ξ = lim x̃n ∈ X n→∞ ˜ η) = lim d(x̃ ˜ n , ỹn ) = lim d′ (f (x̃n ), f (ỹn )) = d′ (ξ ′ , η ′ ) = d′ (F (ξ), F (η)). d(ξ, n→∞ n→∞ ˜ und (X ′ , d′ ). Aus e d) Die Abbildung F ist folglich eine Isometrie zwischen (X, ′ der Definition von F folgt sofort, dass F ◦ ϕ = ϕ . Damit ist Satz 2.31 vollständig bewiesen. ⊓ ⊔ Bemerkung: Eine Möglichkeit zur Konstruktion der reellen Zahlen aus den rationalen Zahlen besteht darin, die in Satz 2.31 beschriebene Vervollständigungsprozedur für die Menge der rationalen Zahlen Q mit dem Abstand e erfüllt dann die d(x, y) = |x − y| auszuführen. Die entstehende Menge Q Axiome der reellen Zahlen aus Kapitel 1. 2.5 Kompakte und folgenkompakte Teilmengen metrischer Räume Definition 2.25. Eine Teilmenge A eines metrischen Raumes (X, d) heißt folgenkompakt, falls jede Folge (an ) von Punkten aus A einen Häufungspunkt in A hat, d.h. eine in A konvergente Teilfolge besitzt. Ist X ⊂ X folgenkompakt, so nennt man den metrischen Raum (X, d) folgenkompakt. Bemerkung: Sei (X, d) ein metrischer Raum und A ⊂ X. Dann ist A ⊂ X genau dann folgenkompakt, wenn der metrische Raum (A, d|A×A ) folgenkompakt ist. Satz 2.32 Im metrischen Raum R (mit Standardmetrik) ist jede beschränkte und abgeschlossene Menge folgenkompakt. Beweis. Sei A ⊂ R eine abgeschlossene und beschränkte Menge und (an ) eine Folge in A. Dann ist (an ) ebenfalls beschränkt. Nach dem Satz von Bolzano-Weierstraß existiert ein Häufungspunkt von (an ). Wir zeigen, dass jeder Häufungspunkt von (an ) in A liegt. Sei x ∈ HP (an ) und (anj ) eine gegen x ∈ R konvergente Teilfolge von (an ). Dann gilt x = limsn→+∞ an ∈ cl(A). Da A abgeschlossen ist, ist A = cl(A), also liegt x in A. Die Menge A ist demnach folgenkompakt. ⊓ ⊔ 76 2 Metrische Räume Beispiel: Die abgeschlossenen Intervalle [a, b] ⊂ R sind folgenkompakt. Satz 2.33 Sei (X, d) das Produkt der metrischen Räume (X1 , d1 ), . . . , (Xk , dk ) und seien Aj ⊂ Xj folgenkompakte Mengen, j = 1, . . . k. Dann ist die Produktmenge A := A1 × A2 × . . . × Ak folgenkompakt in (X, d). Beweis. Den Beweis überlassen wir dem Leser als Übungsaufgabe (Aufgabe 36). ⊓ ⊔ Beispiel: Die ’Würfel’ W := [a1 , b1 ] × [a2 , b2 ] × . . . × [ak , bk ] ⊂ Rk sind folgenkompakte Teilmengen des metrischen Raumes Rk . Satz 2.34 Sei (X, d) ein metrischer Raum und B ⊂ X folgenkompakt. Ist A ⊂ X abgeschlossen und A ⊂ B, so ist A ebenfalls folgenkompakt. Beweis. Sei (an ) eine beliebige Folge in A. Dann ist (an ) auch Folge in B und besitzt, da B folgenkompakt ist, eine in B konvergente Teilfolge (anj ). Sei b = lim anj ∈ cl(A). Da A abgeschlossen ist, ist cl(A) = A und somit b ∈ A. j→∞ Also enthält (an ) eine in A konvergente Teilfolge. Damit ist A folgenkompakt. ⊓ ⊔ Satz 2.35 Jede folgenkompakte Teilmenge eines metrischen Raumes (X, d) ist beschränkt und abgeschlossen. Beweis. Sei A ⊂ X folgenkompakt. (1) Angenommen A wäre nicht abgeschlossen. Dann existiert ein Punkt x ∈ cl(A) \ A. Sei (an ) eine Folge in A, die gegen x konvergiert. Dann konvergiert jede Teilfolge von (an ) ebenfalls gegen x 6∈ A, woraus HP (an ) ∩ A = ∅ folgt. Dies widerspricht der Vorraussetzung, dass A folgenkompakt ist. (2) Angenommen A wäre nicht beschränkt. Wir fixieren einen Punkt x0 ∈ X. Dann gilt A 6⊂ K(x0 , n) für alle n ∈ N. Folglich existiert eine Folge (an ) in A, so dass d(x0 , an ) > n für alle n ∈ N. Damit ist jede Teilfolge von (an ) unbeschränkt und kann folglich nicht konvergieren, d.h. HP (an ) = ∅. Dies widerspricht der Vorraussetzung, dass A folgenkompakt ist. ⊓ ⊔ Bemerkung: Die Umkehrung von Satz 2.35 gilt im allgemeinen nicht. Um das einzusehen, betrachten wir eine unendliche Menge X mit der diskreten Metrik 0 x=y d(x, y) = 1 x 6= y. Jede Teilmenge A ⊂ X ist abgeschlossen und beschränkt. Eine abzählbar unendliche Teilmenge A = {a1 , a2 , . . . , } ⊂ X ist aber nicht folgenkompakt, da 2.5 Kompakte und folgenkompakte Teilmengen metrischer Räume 77 eine Folge in (X, d) genau dann konvergiert, wenn sie ab einem bestimmten Index konstant ist. Satz 2.36 Eine Teilmenge im metrischen Raum Rn (mit Standardmetrik) ist genau dann folgenkompakt, wenn sie abgeschlossen und beschränkt ist. Beweis. Wegen Satz 2.35 genügt es zu zeigen, dass eine abgeschlossene, beschränkte Teilmenge A ⊂ Rn folgenkompakt ist. Da A beschränkt ist, existiert ein Würfel W = [a1 , b1 ] × [a2 , b2 ] × . . . × [an , bn ] ⊂ Rn , der A enthält. W ist folgenkompakt und A abgeschlossen, folglich ist A nach Satz 2.34 folgenkompakt. ⊓ ⊔ Beispiele: • Die n–dimensionale Sphäre vom Radius r > 0 Srn := {x ∈ Rn+1 | kxk = r} ⊂ Rn+1 • • ist folgenkompakt. Der n–dimensionale Torus T n := S 1 × . . . × S 1 ⊂ R2n ist folgenkompakt. Die abgeschlossene Kugel Drn = {x ∈ Rn | kxk ≤ r} ⊂ Rn ist folgenkompakt. Wir untersuchen nun weitere Eigenschaften folgenkompakter metrischer Räume. Definition 2.26. Sei (X, d) ein metrischer Raum und A ⊂ X. A heißt total beschränkt, falls es zu jedem ε > 0 endlich viele Punkte x1 , x2 , . . . , xk ∈ X k S K(xi , ε). gibt mit A ⊂ i=1 Ist die gesamte Menge X total beschränkt, so sagt man, dass der metrische Raum (X, d) total beschränkt ist. Satz 2.37 Jeder folgenkompakte metrische Raum ist total beschränkt. Beweis. Sei (X, d) folgenkompakt. Angenommen (X, d) wäre nicht total beschränkt. Dann existiert ein ε0 > 0, so dass für alle k ∈ N und für alle x1 , . . . , xk ∈ X K(x1 , ε0 ) ∪ . . . ∪ K(xk , ε0 ) 6= X. Wir betrachten zunächst k = 1 und x1 ∈ X beliebig. Dann ist K(x1 , ε0 ) 6= X. Wir wählen einen Punkt x2 ∈ X \ K(x1 , ε0 ). Dann gilt d(x1 , x2 ) ≥ ε0 > 0. Da K(x1 , ε0 ) ∪ K(x2 , ε0 ) 6= X, existiert ein x3 ∈ X \ (K(x1 , ε0 ) ∪ K(x2 , ε0 )). Also gilt d(x3 , x1 ) ≥ ε0 > 0 und d(x3 , x2 ) ≥ ε0 > 0 . Wir führen dieses Verfahren fort und erhalten eine Folge von Punkten x1 , x2 , x3 , . . . in X mit der Eigenschaft d(xi , xj ) ≥ ε0 > 0 für alle i 6= j. Diese Folge kann aber keine konvergente Teilfolge enthalten. Dies widerspricht der Folgenkompaktheit von (X, d) ⊓ ⊔ 78 2 Metrische Räume Definition 2.27. Ein metrischer Raum heißt separabel, falls eine abzählbare, dichte Teilmenge A ⊂ X existiert. Beispiele: R, C, Rn und Cn sind separable metrische Räume, denn Q ⊂ R, (Q + iQ) ⊂ C, Qn ⊂ Rn und (Q + iQ)n ⊂ Cn sind jeweils dichte und abzählbare Teilmengen. Satz 2.38 Jeder folgenkompakte metrische Raum (X, d) ist separabel. Beweis. Sei (X, d) folgenkompakt. Nach Satz 2.37 ist (X, d) total beschränkt. Wir verschaffen uns dadurch abzählbar viele Punkte von X: ε=1 ε= ε= =⇒ ∃ x11 , . . . , x1k1 ∈ X : X = k1 S i=1 k2 S 1 2 =⇒ ∃ x21 , . . . , x2k2 ∈ X : X = 1 n =⇒ ∃ xn1 , . . . , xnkn ∈ X : X = Wir betrachten die abzählbare Menge A := ∞ k S Sn i=1 k Sn K(x1i , 1). K(x2i , 21 ) i=1 ... K(xni , n1 ). {xni } ⊂ X und zeigen, dass n=1 i=1 A dicht in X ist. Wir müssen dazu zeigen, dass jedes x ∈ X der Grenzwert einer Folge von Elementen aus A ist. Sei x ∈ X. Für jedes n ∈ N gilt x ∈ k Sn K(xni , n1 ). Demnach existiert ein in ∈ {1, . . . , kn } so dass x ∈ K(xnin , n1 ). i=1 Wir setzen an := xnin ∈ A, und erhalten dadurch eine Folge (an ) in A mit ⊓ ⊔ d(an , x) < n1 . Die Folge (an ) konvergiert somit gegen x. Satz 2.39 (Satz von Cantor für folgenkompakte metrische Räume) Sei (X, d) ein folgenkompakter metrischer Raum und (Fn ) eine Familie abgeschlossener Teilmengen von (X, d) mit F1 ⊃ F2 ⊃ F3 ⊃ . . . . Dann gilt ∞ \ n=1 Fn 6= ∅. Beweis. Wir wählen aus jeder Menge Fn einen Punkt xn ∈ Fn . Da (X, d) folgenkompakt ist, existiert eine Teilfolge (xnk ) von (xn ), die gegen einen ∞ T Punkt x ∈ X konvergiert. Wir zeigen, dass x ∈ Fn . n=1 Sei m ∈ N fixiert. Dann gilt xn ∈ Fm für alle n ≥ m. Insbesondere exisiert ein km ∈ N so dass xnk ∈ Fm für alle k ≥ km . Daraus folgt wegen der Abgeschlossenheit von Fm 2.5 Kompakte und folgenkompakte Teilmengen metrischer Räume 79 x = lim xnk ∈ cl(Fm ) = Fm k→∞ und somit x ∈ ∞ T ⊓ ⊔ Fm . m=1 Bemerkung: Im Unterschied zum Satz von Cantor für vollständige metrische Räume (Übungsaufgabe 35) benötigt man nicht die Voraussetzung ∞ T diam(Fn ) → 0. Die Menge Fn kann aus mehreren Punkten bestehen. n=1 Beispiel (Cantorsches Diskontinuum): Wir definieren die folgende Familie von Teilmengen aus R 1 2 7 8 1 2 C0 := [0, 1], C1 := C0 \ ( , ), C2 := C1 \ (( , ) ∪ ( , )), . . . 3 3 9 9 9 9 (Es werden also immer die offenen, mittleren Drittel aus den abgeschlossenen Intervallen entfernt). Damit sind die Voraussetzungen des Satzes 2.39 erfüllt: X = [0, 1] ist folgenkompakt, C0 ⊃ C1 ⊃ C2 ⊃ . . . und alle Mengen Cn sind abgeschlossen. (Der Durchmesser jeder Menge Cn ist 1). Wir betrachten C := ∞ \ n=1 Cn 6= ∅. C wird das Cantorsche Diskontinuum genannt. C ist folgenkompakt, da C beschränkt und als Durchschnitt abgeschlossener Mengen selbst abgeschlossen ist. Nachdem wir bisher folgenkompakte Teilmengen betrachtet haben, die durch spezielle Eigenschaften von Folgen definiert wurden, betrachten wir im Folgenden einen Kompaktheitsbegriff, der mit Hilfe von offenen Mengen definiert wird. Definition 2.28. Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge. Eine Familie U = {Ui }i∈I von Teilmengen von X heißt offene Überdeckung von A, falls die folgenden beiden Eigenschaften gelten (1) Ui ⊂ S X ist offen für alle i ∈ I. Ui . (2) A ⊂ i∈I Eine Teilmenge Û ⊂ U der Überdeckung U heißt Teilüberdeckung, wenn [ A⊂ U. U∈Û Eine Teilüberdeckung heißt endlich, wenn sie endlich viele Elemente enthält. 80 2 Metrische Räume Definition 2.29. Sei (X, d) ein metrischer Raum. Eine Teilmenge A ⊂ X heißt kompakt, wenn man aus jeder offenen Überdeckung von A eine endliche Teilüberdeckung auswählen kann. Ist die gesamte Menge X kompakt, so sagt man, dass der metrische Raum (X, d) kompakt ist. Es gilt wiederum, dass eine Teilmenge A eines metrischen Raumes (X, d) genau dann kompakt ist, wenn der metrische Raum (A, d|A×A ) kompakt ist. Satz 2.40 Ein metrischer Raum (X, d) ist genau dann kompakt, wenn er folgenkompakt ist. Beweis. 1. (X, d) kompakt =⇒ (X, d) folgenkompakt: Sei (X, d) kompakt und (xn ) eine Folge in X. Wir betrachten die Menge Fn := cl({xn+1 , xn+2 , . . .}). Fn ist abgeschlossen für alle n ∈ N und es gilt . . . ⊃ Fn ⊃ Fn+1 ⊃ Fn+2 ⊃ . . . Dann ist Un := X \ Fn offen und . . . ⊂ Un ⊂ Un+1 ⊂ Un+2 ⊂ . . . (∗) Im Folgenden zeigen wir, dass U := {Un } keine Überdeckung von X ist. Zum Beweis nehmen wir an, dass U eine Überdeckung von X wäre. Da X kompakt ist, würde eine endliche Teilüberdeckung existieren mit X = Un1 ∪ . . . ∪ Unk (n1 < n2 < . . . < nk ). Wegen (∗) folgt X = Unk = X \ Fnk . Also ist Fnk leer. Dies steht aber im Widerspruch zur Definition der Mengen Fn . Die Annahme war also falsch, das heißt U = {Un } ist keine Überdeckung von X. Es folgt ∞ [ n=1 Also gilt ∞ T n=1 Un = ∞ [ (X \ Fn ) = X \ ( n=1 Fn 6= ∅. Sei nun x ∈ ∞ \ n=1 ∞ T n=1 Fn ) 6= X. Fn . Dann ist x ∈ Fn für alle n ∈ N. Wir konstruieren uns nun eine gegen x konvergente Teilfolge: x ∈ F1 = cl({x1 , x2 , . . .}) ⇒ ∃ xn1 : d(x, xn1 ) < 1 x ∈ Fn1 = cl({xn1 +1 , xn1 +2 , . . .}) ⇒ ∃ xn2 : d(x, xn2 ) < 21 , n1 < n2 x ∈ Fn2 = cl({xn2 +1 , xn2 +2 , . . .}) ⇒ ∃ xn3 : d(x, xn3 ) < 31 , n2 < n3 . . . ∞ Folgern wir so weiter, so erhalten wir eine Teilfolge (xnk )∞ k=1 von (xn )n=1 mit 1 d(x, xnk ) < k . Demnach konvergiert (xnk ) gegen x ∈ X. Folglich ist (X, d) 2.5 Kompakte und folgenkompakte Teilmengen metrischer Räume 81 folgenkompakt. (2) (X, d) folgenkompakt =⇒ (X, d) kompakt: Sei (X, d) folgenkompakt und U eine offene Überdeckung von X. Wir müssen zeigen, dass U eine endliche Teilüberdeckung besitzt. (a) Wir zeigen zunächst, dass U eine abzählbare Teilüberdeckung enthält. Nach Satz 2.38 ist (X, d) separabel. Folglich existiert eine abzählbare Teilmenge A ⊂ X mit cl(A) = X. Wir definieren die Menge Λ = {(a, q) ∈ A × Q+ | ∃ U ∈ U : K(a, q) ⊂ U } ⊂ A × Q+ . Λ ist abzählbar, da A × Q+ abzählbar ist. Ist (a, q) ∈ Λ, so existiert ein U ∈ U mit K(a, q) ⊂ U . Wir wählen eine dieser Mengen U und bezeichnen sie mit U (a, q). Dann ist U ∗ := {U (a, q)}(a,q)∈Λ eine abzählbare Teilfamilie von U. Wir zeigen nun, dass U ∗ eine Überdeckung von X ist, das heißt dass [ U (a, q). X= (a,q)∈Λ Sei x ∈ X. Da U eine Überdeckung von X ist, existiert ein U0 ∈ U mit x ∈ U0 . Da U0 offen ist, gibt es eine Kugel K(x, ε0 ) ⊂ U0 . Da A ⊂ X dicht liegt, enthält X \ A keine Kugel. Insbesondere liegt die Kugel K(x, ε30 ) nicht vollständig in X \ A. Somit existiert ein a ∈ A ∩ K(x, ε30 ). Wir wählen eine rationale Zahl q ∈ Q+ mit ε30 < q < 32 · ε0 . Wir zeigen nun, dass x ∈ U (a, q). Wegen d(x, a) < ε30 < q folgt x ∈ K(a, q). Sei y ∈ K(a, q) ein beliebiges Element dieser Kugel. Dann erhalten wir d(x, y) ≤ d(x, a) + d(a, y) < ε0 ε0 2 +q < + · ε0 < ε0 . 3 3 3 Demnach gilt y ∈ K(x, ε0 ) und somit K(a, q) ⊂ K(x, ε0 ) ⊂ U0 . Die Definition von Λ besagt dann, dass S (a, q) zu Λ gehört. Folglich ist x ∈ K(a, q) ⊂ U (a, q). Damit ist X = U (a, q) bewiesen. (a,q)∈Λ (b) Es bleibt zu zeigen, dass man in jeder abzählbaren, offenen Überdeckung eine endliche Teilüberdeckung findet. Sei U = {U1 , U2 , . . .} eine abzählbare, offene Überdeckung von X. Wir betrachten Fn = X \ (U1 ∪ . . . ∪ Un ) . {z } | offen Dann ist F1 ⊃ F2 ⊃ . . . eine absteigende Folge abgeschlossener Mengen. Wir zeigen nun, dass ein n ∈ N existiert mit Fn = ∅. Wäre keine dieser Mengen Fn leer, so hätte man nach dem Satz 2.39 82 2 Metrische Räume ∞ \ n=1 Fn 6= ∅. Wegen ∅ 6= ∞ \ n=1 Fn = ∞ \ (X \ n=1 n [ i=1 Ui ) = X \ ( ∞ [ n [ n=1 i=1 Ui ) = X \ ( ∞ [ Un ) n=1 wäre U dann keine Überdeckung von X, was im Widerspruch zur Voraussetzung steht. Folglich ist Fn = ∅ für ein n ∈ N und es gilt X = U1 ∪ . . . ∪ Un . Wir haben somit eine endliche Teilüberdeckung in U gefunden, das heißt (X, d) ist kompakt. ⊓ ⊔ Folgerung 2.4 Eine Teilmenge eines metrischen Raumes ist genau dann kompakt, wenn sie folgenkompakt ist. Insbesondere gelten für kompakte Teilmengen metrischer Räume die folgenden Eigenschaften: 1. 2. 3. 4. Jede kompakte Menge ist total beschränkt, insbesondere beschränkt. Jede kompakte Menge ist abgeschlossen. Jede abgeschlossene Teilmenge einer kompakten Menge ist selbst kompakt. Eine Teilmenge im metrischen Raum Rn ist genau dann kompakt, wenn sie beschränkt und abgeschlossen ist. Weitere Eigenschaften kompakter Mengen findet man in den Übungsaufgaben. Folgerung 2.5 (Klassischer Überdeckungssatz von Heine/Borel) Sei [a, b] ⊂ R ein abgeschlossenes Intervall und U = {(ai , bi )}i∈I eine Familie (beliebig vieler) offener Intervalle, deren Vereinigung [a, b] überdeckt: [ [a, b] ⊂ (ai , bi ). i∈I Dann existieren endlich viele Intervalle (ai1 , bi1 ), . . . , (ain , bin ) ∈ U, die [a, b] bereits überdecken, dh. n [ (aij , bij ). [a, b] ⊂ j=1 Wir wissen, dass eine Teilmenge im Rn genau dann kompakt ist, wenn sie beschränkt und abgeschlossen ist. Eine ähnliche Charakterisierung kompakter Mengen in allgemeinen metrischen Räumen ist nicht möglich. Man hat aber für vollständige metrische Räume das folgende Kriterium für Kompaktheit. Satz 2.41 Sei (X, d) ein vollständiger metrischer Raum. Eine Teilmenge in (X, d) ist genau dann kompakt, wenn sie abgeschlossen und total beschränkt ist. 2.5 Kompakte und folgenkompakte Teilmengen metrischer Räume 83 Beweis. =⇒ folgt aus den Sätzen 2.40, 2.37 und 2.34 ⇐= findet man z.B. im Buch von Dieudonné: Grundzüge der modernen Analysis, Bd. 1. ⊓ ⊔ Abschließend sei noch ein Satz erwähnt, der oft als technisches Hilfsmittel bei Beweisen und Konstruktionen in der Topologie benutzt wird. Satz 2.42 (Die Lebesgue-Zahl einer Überdeckung) Sei (X, d) ein metrischer Raum, A ⊂ X eine kompakte Teilmenge und U eine offene Überdeckung von A. Dann existiert eine reelle Zahl ℓ(U) > 0, so dass folgendes gilt: Jede Teilmenge B ⊂ A, deren Durchmesser kleiner als ℓ(U) ist, liegt vollständig in einer der offenen Mengen U ∈ U. ℓ(U) heißt Lebesgue-Zahl der Überdeckung U. Beweis. Das überlassen wir dem Leser als Übungsaufgabe. ⊓ ⊔ Bemerkung: Wenn man sich den Satz 2.40 ansieht, fragt man sich natürlich, warum man denn überhaupt zwei verschiedene Kompaktheitsbegriffe definiert, wenn diese dann doch übereinstimmen. Ein Grund dafür ist, dass man die kompakten Mengen dadurch auf zwei völlig verschiedene Weisen charakterieren kann (einmal durch Eigenschaften von Folgen, zum anderen durch Eigenschaften offener Überdeckungen). Beide Varianten haben zum Nachweis von Kompaktheit in verschiedenen Situationen jeweils Vorteile. Der tieferliegende Grund ist aber der folgende: Die metrischen Räume sind eine spezielle Klasse der sogenannten topologischen Räume, die wir hier kurz ergänzend einführen wollen: Sei X eine nichtleere Menge. Eine Topologie auf X ist eine Familie T von Teilmengen von X, die folgende Eigenschaften hat: 1. X, ∅ ∈ T . 2. Die Vereinigung beliebig vieler Teilmengen aus T ist ebenfalls in T . 3. Der Durchschnitt endlich vieler Teilmengen aus T ist ebenfalls in T . Das Paar (X, T ) nennt man dann topologischen Raum. Die Elemente in T heißen die offenen Mengen des topologischen Raumes (X, T ). Ist (X, d) ein metrischer Raum, so bilden die offenen Mengen des metrischen Raumes nach Satz 2.2 eine Topologie auf X. Jeder metrische Raum ist folglich ein spezieller topologischer Raum. In topologischen Räumen kann man kompakte und folgenkompakte Mengen auf die gleiche Weise definieren, wie im metrischen Raum. Man kann dann zeigen, dass es sowohl topologische Räume gibt mit kompakten Mengen, die nicht folgenkompakt sind als auch topologische Räume mit folgenkompakten Mengen, die nicht kompakt sind !!. Für topologische Räume, die zu den Grundstrukturen der Analysis gehören, fallen die beiden Kompaktheitsbegriffe also nicht mehr zusammen. 84 2 Metrische Räume 2.6 Zusammenhängende Teilmengen eines metrischen Raumes Definition 2.30. Sei (X, d) ein metrischer Raum. Eine Teilmenge A ⊂ X heißt zusammenhängend, wenn es keine offenen und zueinander disjunkten Teilmengen U, V ⊂ X gibt, so dass A ⊂ U ∪ V , A ∩ U 6= ∅ und A ∩ V 6= ∅. Ist die Menge X selbst zusammenhängend, so nennt man den metrischen Raum (X, d) zusammenhängend. Beispiel: Sei X = R2 , U, V ⊂ X offene Teilmengen von X und A ⊂ X wie im Bild. Dann ist A nicht zusammenhängend. U V A Bemerkung: Nach Definition ist ein metrischer Raum (X, d) zusammenhängend, wenn er sich nicht in die disjunkte Vereinigung zweier offener nichtleerer Mengen zerlegt. Man kann wiederum zeigen, dass eine Teilmenge A eines metrischen Raumes (X, d) genau dann zusammenhängend ist, wenn der metrische Raum (A, d|A×A ) zusammenhängend ist. Wir beschreiben nun die zusammenhängenden Mengen im metrischen Raum R mit der Standardmetrik d(x, y) = |x − y|. Satz 2.43 Eine Teilmenge A ⊂ R ist genau dann zusammenhängend, wenn sie mit je zwei Punkten a, b ∈ A auch das Intervall [a, b] vollständig enthält. Die einzigen zusammenhängenden Teilmengen in R sind folglich R, (−∞, b), (−∞, b], (a, ∞), [a, ∞), (a, b), [a, b], (a, b], [a, b) und {a}. Beweis. (=⇒) Sei A ⊂ R zusammenhängend. Angenommen es existieren a, b ∈ A mit [a, b] 6⊂ A. Dann gibt es ein x ∈ [a, b] mit x 6∈ A. Wir betrachten die Mengen U := (−∞, x) und V := (x, ∞). U und V sind disjunkte offene Teilmengen in R mit A ⊂ U ∪ V = R \ {x}. Außerdem ist A ∩ U 6= ∅, da a ∈ A ∩ U und A ∩ V 6= ∅, da b ∈ A ∩ V . Dies widerspricht aber der Voraussetzung, dass A zusammenhängend ist. (⇐=) Sei A ⊂ R eine Teilmenge, die mit 2 Punkten a, b ∈ A, a ≤ b, auch das Intervall [a, b] enthält. Wir nehmen an, A sei nicht zusammenhängend. Dann existieren offene disjunkte Teilmengen U, V ⊂ R mit A ⊂ U ∪ V , A ∩ U 6= ∅ und A ∩ V 6= ∅. Wir wählen a ∈ A ∩ U und b ∈ A ∩ V . OBdA gelte a < b. Wir betrachten z := sup(U ∩ [a, b]). Dann gilt 2.6 Zusammenhängende Teilmengen eines metrischen Raumes z ∈ cl(U ∩ [a, b]) ⊂ cl(R \ V ) = R \ V 85 (da V offen ist), z ∈ cl(U ∩ [a, b]) ⊂ cl([a, b]) = [a, b] ⊂ A. Da U ∪ V die Menge A überdeckt, liegt z in U . Da U offen ist, existiert ein ε > 0 mit (z − ε, z + ε) ⊂ U . Also gilt (z − ε, z + ε) ∩ [a, b] ⊂ U ∩ [a, b]. Es folgt min{z + ε, b} = sup((z − ε, z + ε) ∩ [a, b]) ≤ sup(U ∩ [a, b]) = z. Dann muss b ≤ z gelten. Da andererseits z ∈ [a, b], folgt b = z und somit z ∈ V . Da U und V disjunkt sind und z ∈ U , kann das nicht gelten. Damit war unsere Annahme, dass A nicht zusammenhängend ist, falsch. ⊓ ⊔ Bemerkung: Der analoge Beweis liefert, dass jede Verbindungstecke zwischen zwei Punkten im metrischen Raum Rn zusammenhängend ist. Weitere zusammenhängende Teilmengen erhält man durch die folgenden beiden Sätze. Satz 2.44 Sei (X, d) ein metrischer Raum und A ⊂ X eine zusammenhängende Teilmenge. Gilt A ⊂ B ⊂ cl(A), so ist B ebenfalls zusammenhängend. Insbesondere ist der Abschluss einer zusammenhängenden Menge selbst zusammenhängend. Beweis. Angenommen B wäre nicht zusammenhängend. Dann existieren offene, disjunkte Mengen U, V ⊂ X mit B ⊂ U ∪ V, B ∩ U 6= ∅ und B ∩ V 6= ∅. Wir zeigen nun, dass dann A auch nicht zusammenhängend ist. Wegen A ⊂ B gilt A ⊂ U ∪ V . Es bleibt zu zeigen, dass A ∩ V 6= ∅ und A ∩ U 6= ∅. Wir nehmen A ∩ U = ∅ an. Dann gilt A ⊂ X \ U und somit, da U offen ist, B ⊂ cl(A) ⊂ cl(X \ U ) = X \ U . Dann wäre B ∩ U = ∅ im Gegensatz zur Wahl von U . Folglich war unsere Annahme, dass A und U disjunkt sind, falsch. Die analogen Betrachtungen beweisen A ∩ V 6= ∅. Somit ist A nicht zusammenhängend, was den Voraussetzungen widerspricht. ⊓ ⊔ Satz 2.45 Sei (X, d) ein metrischer Raum und Ai , i ∈ I, beliebig T viele zuAi 6= ∅. sammenhängende Teilmengen mit nichtleerem Durchschnitt B := i∈I S Ai zusammenhängend. Dann ist auch die Vereinigung A := i∈I Beweis. Wir nehmen an, A wäre nicht zusammenhängend. Dann existieren offene, disjunkte Mengen U, V ⊂ X mit A ⊂ U ∪V, A∩U 6= ∅ und A∩V 6= ∅. Für i ∈ I gilt dann auch Ai ⊂ U ∪ V . Da Ai zusammenhängend ist, muss entweder Ai ∩ U = ∅ oder Ai ∩ V = ∅ gelten. Wir setzen I1 := {i ∈ I | Ai ⊂ V } und I2 := {i ∈ I | Ai ⊂ U }. Da A ∩ U 6= ∅ und A ∩ V 6= ∅ gilt I1 6= ∅ 6= I2 . Wir erhalten 86 2 Metrische Räume A= [ Ai = i∈I und [ i∈I1 [ i∈I1 [ Ai ∪ Ai i∈I2 [ Ai ∩ Ai ⊂ V ∩ U = ∅. Da für alle i ∈ I gilt ∅ 6= B := B⊂ T k∈I [ i∈I1 i∈I2 Ak ⊂ Ai , folgt [ Ai ∩ Ai = ∅. i∈I2 Dies ist ein Widerspruch. Folglich war die Annahme falsch und A ist zusammenhängend. ⊓ ⊔ Wir zeigen abschließend, dass sich jeder metrische Raum in disjunkte zusammenhängende Teilmengen zerlegt. Definition 2.31. Sei (X, d) ein metrischer Raum und x ∈ X. Die Menge [ C(x) := A A zush. x∈A heißt die durch x bestimmte Zusammenhangskomponente von X. Bemerkung: (1) Nach Satz 2.45 ist C(x) zusammenhängend. Somit ist C(x) die größte zusammenhängende Teilmenge von X, die x enthält. (2) Jede Zusammenhangskomponente von (X, d) ist abgeschlossen. Nach Satz 2.44 ist nämlich der Abschluss cl(C(x)) der Zusammenhangskomponente C(x) ebenfalls zusammenhängend. Folglich gilt cl(C(x)) ⊂ C(x), also cl(C(x)) = C(x). Somit ist C(x) abgeschlossen. (3) Sind x, y ∈ X, so gilt entweder C(x) = C(y) oder C(x) ∩ C(y) = ∅. Wir betrachten den Fall, dass C(x) ∩ C(y) 6= ∅. Dann ist C(x) ∪ C(y) zusammenhängend (nach Satz 2.45) und enthält x und y. Folglich gilt C(x) ∪ C(y) ⊂ C(x) und C(x) ∪ C(y) ⊂ C(y) und somit C(x) = C(y) = C(x) ∪ C(y). Dies beweist den folgenden Satz Satz 2.46 Sei (X, d) ein metrischer Raum. Dann zerlegt sich X in disjunkte Zusammenhangskomponenen, d.h. [ X= Ci , i∈I wobei die Mengen Ci zusammenhängend, abgeschlossen und paarweise disjunkt sind. 2.7 Banachräume und Hilberträume 87 2.7 Banachräume und Hilberträume In diesem Abschnitt betrachten wir spezielle vollständige metrische Räume, deren Basismenge Vektorräume sind und deren Metrik durch eine Norm bzw. durch ein Skalarprodukt gegeben ist. Definition 2.32. Ein Vektorraum über dem Körper K (oder ein K-Vektorraum) ist ein Tripel [V, +, ·], wobei V eine nichtleere Menge und + und · zwei Operationen + : V × V −→ V (v, w) 7−→ v + w (Addition) ·: (Multiplikation mit Skalaren) K × V −→ V (λ, v) 7−→ λ · v mit den folgenden Eigenschaften sind: 1. [V, +] ist eine abelsche Gruppe. 2. Es gelten die Distributivgesetze: λ · (v + w) = λ · v + λ · w und (λ + µ) · v = λ · v + µ · v 3. λ · (µ · v) = (λ · µ) · v und 1 · v = v, wobei λ, µ ∈ K und v, w ∈ V . Wir werden Vektorräume auch kurz mit V bezeichnen, wenn die Operationen + und · klar sind. Ist K der Körper der reellen Zahlen, so heißt V reeller Vektorraum, ist K der Körper der komplexen Zahlen, so heißt V komplexer Vektorraum. Die algebraische Theorie von Vektorräumen wird in der Vorlesung über lineare Algebra behandelt. Insbesondere wird dort erklärt werden, was die Dimension eines Vektorraumes ist. Definition 2.33. Sei V ein reeller oder komplexer Vektroraum. Eine Norm auf V ist eine Abbildung k · k : V −→ R mit den folgenden Eigenschaften: 1. kxk ≥ 0 für alle x ∈ V und kxk = 0 ⇐⇒ x = 0. 2. kα · xk = |α| · kxk für alle α ∈ K und x ∈ V . 3. kx + yk ≤ kxk + kyk (Dreiecksungleichung). Das Paar (V, k · k) heißt normierter Vektorraum. Beispiele für normierte Vektorräume: 1. Die Vektorräume Rn bzw. Cn mit den folgenden Normen kxkp := n X j=1 |xj |p p1 , p ∈ N, und kxk∞ := max |xj | , j=1,...,n 88 2 Metrische Räume wobei x = (x1 , . . . , xn ). Die Norm k · k2 auf dem Rn bzw. Cn ist die in Kapitel 1.4 betrachtete Euklidische Norm. 2. Sei X eine nichtleere Menge und bezeichne Fb (X) den Vektorraum aller beschränkten reellwertigen Funktionen Fb (X) := {f : X −→ R | f (X) ⊂ R beschränkt}. Die Operationen + und · sind hierbei auf folgende Weise definiert: Fb (X) × Fb (X) −→ Fb (X) (f1 , f2 ) 7−→ f1 + f2 R × Fb (X) −→ Fb (X) (λ, f ) 7−→ λ · f mit (f1 + f2 )(x) := f1 (x) + f2 (x) mit (λ · f )(x) := λ · f (x). Dann ist durch kf k∞ := sup |f (x)| , x∈X f ∈ Fb (X) eine Norm auf Fb (X) gegeben. 3. Sei BF(Rn ) der Vektorraum aller beschränkten Folgen (xn ) von Vektoren im Rn mit den Operationen (xn ) + (yn ) := (xn + yn ) λ · (xn ) := (λ · xn ) , wobei λ ∈ R, (xn ), (yn ) ∈ BF(Rn ). Dann ist durch k(xn )k∞ := sup{kxn k2 | n ∈ N} , (xn ) ∈ BF(Rn ) eine Norm auf BF(Rn ) gegeben. Auf jedem normierten Vektorraum ist auf kanonische Weise eine Metrik definiert, die wir im folgenden auch immer auf normierten Vektorräumen festlegen werden: Satz 2.47 Sei (V, k · k) ein normierter Raum. Dann ist die Abbildung dk·k : V × V −→ R (x, y) 7−→ dk·k (x, y) := kx − yk eine Metrik auf V . Beweis. Der Beweis wird genauso wie für die Euklidische Norm in Kapitel 1.4. geführt. ⊓ ⊔ 2.7 Banachräume und Hilberträume 89 Definition 2.34. Ein normierter Vektorraum (V, k · k) heißt Banachraum, wenn er (als metrischer Raum) vollständig ist. Beispiele: 1. Rn und Cn mit der Euklidischen Norm k · k2 sind endlich-dimensionale Banachräume (siehe Kapitel 2.4). 2. Die Räume der beschränkten reellwertigen Funktionen Fb (X) und der beschränkten Folgen BF(Rn ) sind mit der Supremum-Norm k·k∞ unendlichdimensionale Banachräume (Übungsaufgabe 42). Wir werden nun zeigen, dass die endlich-dimensionalen Vektorräume Rn und Cn mit jeder Norm Banachräume sind. Dazu führen wir die folgende Äquivalenzrelation für Normen ein: Definition 2.35. Sei V ein reeller oder komplexer Vektorraum. Zwei Normen k·k1 und k·k2 auf V heißen äquivalent, wenn es positive Konstanten a, b ∈ R+ gibt, so dass gilt a · kxk1 ≤ kxk2 ≤ b · kxk1 ∀ x ∈ V. (∗) Satz 2.48 Seien k·k1 und k·k2 zwei äquivalente Normen auf dem Vektorraum V . Dann stimmen alle topologischen Eigenschaften von (V, k·k1 ) und (V, k·k2 ) überein. Insbesondere gilt für Folgen (xn ) in V und für Teilmengen A ⊂ V : 1. 2. 3. 4. 5. 6. (xn ) −→ x ∈ V bzgl. k · k1 gdw. (xn ) −→ x ∈ V bzgl. k · k2 . (xn ) ist Cauchy-Folge bzgl. k · k1 gdw. (xn ) ist Cauchy-Folge bzgl. k · k2 . A ist offen bzgl. k · k1 gdw. A ist offen bzgl. k · k2 . A ist abgeschlossen bzgl. k · k1 gdw. A ist abgeschlossen bzgl. k · k2 . A ist kompakt bzgl. k · k1 gdw. A ist kompakt bzgl. k · k2 . A ist zusammenhängend bzgl. k · k1 gdw. A ist zusammenhängend bzgl. k · k2 . Beweis. Aus (∗) folgen für die Kugeln Ki (x, ε) bzgl. der Norm k · ki die folgenden Beziehungen K1 (x, ε) ⊂ K2 (x, b · ε) , ε K2 (x, ε) ⊂ K1 (x, ) a ∀ ε > 0. Da alle topologischen Begriffe für metrische Räume mittels Kugeln definiert sind, folgen die Behauptungen des Satzes unmittelbar aus diesen Beziehungen der Kugeln zueineinander. ⊓ ⊔ Satz 2.49 Alle Normen auf den Vektorräumen Rn bzw. Cn sind zueinander äquivalent. 90 2 Metrische Räume Beweis. Wir beweisen die Behauptung für den reellen Vektorraum Rn . Der Beweis für Cn wird analog geführt. Sei k · k2 : Rn −→ R die Euklidische Norm auf dem Rn und N : Rn −→ R eine beliebige Norm. Da die Äquivalenz von Normen eine Äquivalenzrelation ist, genügt es zu zeigen, dass die Normen k · k2 und N äquivalent sind. Wir müssen also positive reelle Konstanten a und b finden, so dass a · kxk2 ≤ N (x) ≤ b · kxk2 für alle x ∈ Rn . n (1) Es existiert ein b ∈ R+ mit N (x) ≤ b · kxk2 für alle x ∈ PRn : n Jeder Vektor x ∈ R hat die Form x = (x1 , . . . , xn ) = j=1 xj ej , wobei ej = (0, . . . , 0, 1, 0, . . . , 0) mit 1 an der j.-Stelle. Dann gilt wegen der Normeigenschaften und der Cauchy–Schwarzschen Ungleichung (siehe Satz 1.24) N (x) = N n X j=1 xj · ej ≤ n X j=1 N (xj · ej ) = v v uX uX u n u n 2 t |xj | · t N (ej )2 ≤ j=1 = b · kxk2 . | j=1 {z =:b>0 n X j=1 |xj | · N (ej ) } (2) Es existiert ein a ∈ R+ mit a · kxk2 ≤ N (x) für alle x ∈ Rn : Sei x ∈ Rn ein vom Nullvektor verschiedener Vektor. Dann gilt x x = kxk2 · N . N (x) = N kxk2 · kxk2 kxk2 Wir setzen a := inf{N (y) | kyk2 = 1} ≥ 0 . Dann gilt N (x) ≥ a · kxk2 für alle x ∈ Rn . Es bleibt zu zeigen, dass a > 0. Angenommen a = 0. Sei S n−1 := {y ∈ Rn | kyk2 = 1 } die Sphäre vom Radius 1 im Rn . Nach Definition von a existiert eine Folge (xn ) in S n−1 mit N (xn ) −→ a = 0. Da die Sphäre S n−1 in Rn beschränkt und abgeschlossen bzgl. der Euklidischen Norm k · k2 ist, ist sie folgenkompakt bzgl. k · k2 (siehe Satz 2.36). Folglich existiert eine Teilfolge (xnk ) von (xn ), die gegen einen Vektor y0 ∈ S n−1 bzgl. k · k2 konvergiert. Wir erhalten dann aus der Dreiecksungleichung für N und der in (1) bewiesenen Ungleichung 0 ≤ N (y0 ) ≤ N (y0 − xnk ) + N (xnk ) ≤ b · ky0 − xnk k2 + N (xnk ). Bei k gegen +∞ konvergiert die rechte Seite dieser Ungleichung gegen 0. Folglich ist N (y0 ) = 0 und somit y0 = 0. Dies widerspricht y0 ∈ S n−1 . Somit ist a > 0. ⊓ ⊔ Da Rn und Cn mit der Euklidischen Norm vollständig sind, folgt aus den 2.7 Banachräume und Hilberträume 91 Sätzen 2.48 und 2.49, dass die Vektroräume Rn und Cn mit jeder Norm Banachräume sind. In der Vorlesung über lineare Algebra wird beweisen, dass jeder reelle Vektorraum der Dimension n < +∞ isomorph zu Rn und jeder komplexe Vektorraum der Dimension n < +∞ isomorph zu Cn ist. Dies liefert Folgerung 2.6 Jeder endlich-dimensionale, reelle oder komplexe normierte Vektorraum ist ein Banachraum. Für ∞–dimensionale Vektorräume gilt Satz 2.49 und die daraus abgeleitete Folgerung nicht mehr. Im Laufe der Analysis-Vorlesung werden wir weitere vollständige und unvollständige unendlich-dimensionale normierte Vektorräume kennenlernen. Abschließend befassen wir uns mit dem Begriff des Skalarproduktes auf einem Vektorraum, den wir bereits in einem Spezialfall in Kapitel 1.4. betrachtet haben. Definition 2.36. Sei H ein reeller oder komplexer Vektorraum und bezeichne K den dazugehörigen Körper der reellen bzw. komplexen Zahlen. Ein Skalarprodukt auf H ist eine Abbildung h·, ·i : H × H −→ K mit (1) (2) (3) (4) hx, yi = hy, xi für x, y ∈ H, hx + y, zi = hx, zi + hy, zi für x, y, z ∈ H, hλx, yi = λhx, yi = hx, λyi für λ ∈ K und x, y ∈ H, hx, xi ≥ 0 und hx, xi = 0 ⇔ x = 0. Satz 2.50 (Cauchy–Schwarzsche Ungleichung (CSU)) Sei h·, ·i ein Skalarprodukt auf dem Vektorraum H. Dann gilt |hx, yi|2 ≤ hx, xi · hy, yi Die Gleichheit tritt genau dann ein, wenn x und y linear abhängig sind. Beweis. Für λ ∈ K und x, y ∈ H gilt 0 ≤ hx + λy, x + λyi = hx, xi + λhy, xi + |λ|2 hy, yi + λhx, yi. (∗) Es genügt, die Behauptung für y 6= 0 zu beweisen. Für y = 0 ist sie trivial. Sei λ := − hx,yi hy,yi . Dann folgt 0 ≤ hx, xi − 2hx, yihx, yi |hx, yi|2 |hx, yi|2 + = hx, xi − . hy, yi hy, yi hy, yi Daraus folgt |hx, yi|2 ≤ hx, xi · hy, yi . Nach (∗) gilt die Gleichheit genau dann wenn x = −λy. ⊓ ⊔ 92 2 Metrische Räume Satz 2.51 Ist h·, ·i ein Skalarprodukt auf H, so ist durch p kxk := hx, xi eine Norm und durch d(x, y) := eine Metrik auf H definiert. p hx − y, x − yi = kx − yk Beweis. Wir müssen die Dreiecksungleichung für die Norm beweisen, der Rest ist trivial bzw. schon bekannt. kx + yk2 = hx + y, x + yi = hx, xi + hy, yi + hx, yi + hy, xi = hx, xi + hy, yi + 2 · Rehx, yi ≤ hx, xi + hy, yi + 2 · |hx, yi| p p CSU ≤ hx, xi + hy, yi + hx, xi · hy, yi = (kxk + kyk)2 . ⊓ ⊔ Bemerkung: Ein Vektorraum (H, h·, ·i) mit Skalarprodukt istp im Folgenden immer mit der Topologie der von h·, ·i erzeugten Norm kxk = hx, xi versehen. Ist eine Norm gegeben, so möchte man gern wissen, ob diese durch ein Skalarprodukt wie oben beschrieben definiert ist. Dies ist nicht immer der Fall. Ein Kriterium dafür liefert der Satz Satz 2.52 Sei (V, k·k) ein normierter Vektorraum. Die Norm k·k wird genau dann durch ein Skalarprodukt h·, ·i definiert, wenn das Parallelogrammgesetz gilt: kx + yk2 + kx − yk2 = 2(kxk2 + kyk2 ) ∀x, y ∈ E. ⊓ ⊔ Beweis. Übungsaufgabe 43. Definition 2.37. Ein Hilbertraum ist ein Vektorraum p H mit Skalarprodukt h·, ·i, dessen zugehöriger normierter Raum (H, k·k = h·, ·i) ein Banachraum ist. Beispiele für Hilberträume: • Rn mit dem Skalarprodukt hx, yi := • Cn mit dem Skalarprodukt hz, wi := n P j=1 n P j=1 xj · yj zj · w j 3 Reihen in Banachräumen In diesem Kapitel werden wir Reihen in Banachräumen und Kriterien für ihre Konvergenz behandeln. Reihen sind eines der wichtigsten Hilfsmittel zur Konstruktion und Darstellung von Funktionen. Im gesamten Kapitel bezeichnet E einen Banachraum über dem Körper der reellen oder der komplexen Zahlen mit der Norm k·k. Als Spezialfall kann man sich an Stelle von E z.B. die Banachräume R, C, Rn oder Cn (mit beliebiger Norm) vorstellen. In einem Vektorraum kann man jeder Folge von Vektoren eine neue Folge zuordnen: die Folge der Partialsummen. Sei (xk )∞ k=1 eine Folge von Vektoren aus E. Wir bilden daraus eine neue Folge sn := x1 + x2 + · · · + xn = s1 := x1 s2 := x1 + x2 n X k=1 xk ∈ E, also s3 := x1 + x2 + x3 s4 := x1 + x2 + x3 + x4 ... Definition 3.1. Die Folge (sn )∞ n=1 heißt Reihe in E mit den Gliedern xk . Man schreibt für diese Reihe symbolisch ∞ X xk oder x1 + x2 + x3 + . . . k=1 Den Vektor sn := x1 + . . . + xn = der Reihe. n P k=1 xk nennt man die n-te Partialsumme 94 3 Reihen in Banachräumen Eine Reihe ∞ P xk in E heißt konvergent, falls die Folge der Partialsummen k=1 (sn ) in E konvergiert. Ist (sn ) konvergent, so heißt s := lim sn Wert der n→∞ Reihe und man schreibt ∞ X s= xk . k=1 Eine Reihe, die in E nicht konvergiert, heißt divergent. Das Symbol ∞ P xk hat also zwei Bedeutungen: es bezeichnet symbolisch die k=1 Folge (sn ) der Partialsummen und im Konvergenzfall auch ihren Grenzwert. Sei speziell E = R. Wenn lim sn = +∞ oder lim sn = −∞ , so schreibt n→∞ n→∞ man symbolisch ∞ ∞ X X xk = +∞ oder xk = −∞. k=1 k=1 Die Reihe ist in diesem Fall in R divergent. Gilt xk ≥ 0 für alle k ∈ N, so bedeutet die Schreibweise ∞ X xk < +∞, k=1 dass die Reihe in R konvergiert. Definition 3.2. Eine Reihe ∞ P xk im Banachraum E heißt absolut–konvergent, k=1 wenn die Reihe der reellen Zahlen ∞ P k=1 kxk k in R konvergiert. Im nächsten Abschnitt behandeln wir wichtige Konvergenzkriterien für Reihen in Banachräumen. 3.1 Konvergenzkriterien für Reihen in Banachräumen Satz 3.1 (Cauchy–Kriterium) Eine Reihe ∞ P k=1 xk in einem Banachraum E ist genau dann konvergent, wenn zu jedem ε > 0 ein n0 ∈ N existiert, so dass kxn + . . . + xm k < ε ∀ m ≥ n ≥ n0 (∗) gilt. 3.1 Konvergenzkriterien für Reihen in Banachräumen 95 Beweis. Da der Banachraum E vollständig ist, konvergiert die Folge der Partialsummen sn = x1 + . . . + xn genau dann, wenn sie eine Cauchy-Folge ist. Dies ist nach Definition der Cauchy-Folge genau dann erfüllt, wenn zu jedem ε > 0 ein n0 ∈ N existiert, so dass für alle m ≥ n ≥ n0 die Ungleichung ksm − sn−1 k < ε gilt, was äquivalent zum Cauchy–Kriterium (∗) ist. ⊓ ⊔ Der folgende Satz gibt ein nützliches notwendiges Kriterium für die Konvergenz einer Reihe an: Satz 3.2 Ist eine Reihe ∞ P xk im Banachraum E konvergent, so ist die Folge k=1 der Reihenglieder (xk ) eine Nullfolge in E. Beweis. Zum Beweis nutzen wir das Cauchy–Kriterium im Fall m = n. Kon∞ P xk , dann existiert für alle ε > 0 ein n0 ∈ N, so dass kxn k < ε für vergiert k=1 alle n ≥ n0 . Daraus folgt lim xn = 0. ⊓ ⊔ n→∞ Die Umkehrung dieses Satzes gilt im allgemeinen nicht. Beispiel 1: Die harmonische Reihe Sei E = R. Wir betrachten die harmonische Reihe ∞ X 1 1 1 1 = 1 + + + + ... k 2 3 4 k=1 Behauptung: Die harmonische Reihe ist in R divergent und es gilt ∞ X 1 = +∞. k k=1 Beweis. Sei m ∈ N fixiert. Wir wählen ein n ∈ N mit n ≥ 2m . Dann gilt 1 1 + ...+ 2 n 1 1 1 1 1 1 1 + ... + m) ≥ 1 + + ( + ) + ( + . . . + ) + . . . + ( m−1 2 3 4 5 8 2 +1 2 | {z } sn = 1 + 2m−1 Summanden 1 1 1 1 ≥ 1 + + 2 · + 4 · + . . . + 2m−1 · m 4 8 {z 2 } |2 m Summanden m ≥ 1+ . 2 Folglich existiert zu jedem M ∈ R eine Zahl m, so dass sn ≥ 1 + m 2 ≥ M für alle n ≥ 2m . Somit strebt die Folge der Partialsummen (sn ) gegen +∞. ⊓ ⊔ 96 3 Reihen in Banachräumen Beispiel 2: Die geometrische Reihe Sei E = C und z ∈ C eine fixierte komplexe Zahl. Wir betrachten die geometrische Reihe ∞ X zk = 1 + z + z2 + z3 + z4 + . . . k=0 Behauptung: 1. Ist |z| < 1, so konvergiert die geometrische Reihe und es gilt 2. Ist |z| ≥ 1, so divergiert die geometrische Reihe ∞ P zk . ∞ P zk = k=0 1 1−z . k=0 Beweis. Sei |z| < 1. Für die Partialsumme gilt nach Satz 1.14 sn = 1 + z + . . . + z n = 1 − z n+1 . 1−z Da |z| < 1, ist (z n+1 ) eine Nullfolge und somit gilt lim sn = n→∞ 1 1−z . Im Falle |z| ≥ 1 ist |z k | ≥ 1 und somit (z k ) keine Nullfolge. Nach Satz 3.2 ist ∞ P deshalb z k divergent. ⊓ ⊔ k=0 ∞ P Satz 3.3 Ist eine Reihe xk im Banachraum E absolut–konvergent, so ist k=1 sie auch konvergent und es gilt ∞ ∞ X X kxk k. (∗∗) xk ≤ k=1 Beweis. Sei ∞ P k=1 k=1 kxk k konvergent. Entsprechend dem Cauchy-Kriterium gibt es zu jedem ε > 0 ein n0 ∈ N, so dass kxn k + . . . + kxm k < ε für alle m ≥ n ≥ n0 . Wegen der Dreiecksungleichung für die Norm kxn + . . . + xm k ≤ kxn k + . . . + kxm k P∞ gilt dann das Cauchy-Kriterium auch für die Reihe k=1 xk , die folglich konvergiert. Aus den Grenzwertsätzen (analog zu Satz 2.18) erhält man für sn = x1 + . . . + xn k lim sn k = lim ksn k ≤ lim (kx1 k + . . . + kxn k) = n→∞ n→∞ Dies zeigt die Abschätzung (∗∗). n→∞ ∞ X k=1 kxk k. ⊓ ⊔ 3.1 Konvergenzkriterien für Reihen in Banachräumen 97 Reihen im Banachraum E kann man addieren und mit reellen bzw. komplexen Zahlen multiplizieren. Im folgenden bezeichnet K den Körper der reellen Zahlen, falls E ein reeller Banachraum ist, bzw. den Körper der komplexen Zahlen, falls E ein komplexer Banachraum ist. Satz 3.4 Seien (xk ) und (yk ) Folgen im Banachraum E und λ, µ ∈ K. Kon∞ ∞ P P vergieren die Reihen xk und yk gegen x bzw. y , so konvergiert die Reihe ∞ P k=1 k=1 (λxk + µyk ) gegen λx + µy. k=1 Beweis. Seien sn := n X xk sˆn := k=1 n X s∗n := yk k=1 n X (λxk + µyk ). k=1 Dann gilt s∗n = λsn + µsˆn . Die Behauptung folgt dann aus den Grenzwertsätzen für Folgen in Vektorräumen (analog zu Satz 2.18). ⊓ ⊔ Satz 3.5 (Majorantenkriterium) ∞ P Sei xk eine Reihe im Banachraum E und (ck ) eine Folge reeller Zahlen, k=1 so dass kxk k ≤ ck für alle k ∈ N. Konvergiert die Reihe die Reihe ∞ P ∞ P ck in R, so ist k=1 xk in E absolut–konvergent und es gilt k=1 ∞ ∞ ∞ X X X kxk k ≤ ck . xk ≤ k=1 k=1 k=1 (∗ ∗ ∗) Beweis. Wir nutzen wiederum das Cauchy–Kriterium. Sei Dann gibt es für alle ε > 0 ein n0 ∈ N, so dass cn + . . . + c m < ε ∞ P ck konvergent. k=1 ∀ m ≥ n ≥ n0 . Nach Voraussetzung ist kxn k + . . . + kxm k ≤ cn + . . . + cm . Folglich gilt das ∞ ∞ P P xk kxk k . Somit ist die Reihe Cauchy-Kriterium auch für die Reihe k=1 k=1 absolut–konvergent, also auch konvergent. Die Ungleichung (∗ ∗ ∗) folgt wie im Beweis von Satz 3.3. ⊓ ⊔ 98 3 Reihen in Banachräumen Beispiel 3: Sei E = C. Wir betrachten eine Folge komplexer Zahlen ak ∈ C mit |ak | ≤ 1 für alle k ∈ N und z ∈ C mit |z| < 1. ∞ P ak z k ist absolut–konvergent und es gilt: Behauptung: Die Reihe k=0 ∞ X 1 k . ak z ≤ 1 − |z| k=0 Beweis. Dies folgt aus dem Majorantenkriterium und der Konvergenz der geometrischen Reihe, da k k k |ak z | = |ak | · |z| ≤ |z| und ∞ X k=0 |z|k = 1 . 1 − |z| ⊓ ⊔ Satz 3.6 (Wurzelkriterium) ∞ p P xk eine Reihe im Banachraum E und α := lim sup k kxk k . Sei k→∞ k=1 1. Ist α < 1, so ist die Reihe 2. Ist α > 1, so ist die Reihe ∞ P k=1 ∞ P xk absolut–konvergent. xk divergent. k=1 p Beweis. 1. Sei α = lim sup k kxk k < 1. Da α der größte Häufungspunkt der k→∞ p Folge ( k kxk k) ist, sind höchstens endlich viele dieser Folgeglieder größer als α. Es existiert folglich ein k0 ∈ N so dass p 1+α k kxk k ≤ α < <1 ∀ k ≥ k0 . 2 Somit gilt kxk k < Da 1+α 2 1+α 2 k ∀ k ≥ k0 . < 1, konvergiert die geometrische Reihe ∞ P k=1 1+α k . 2 Aus dem Majo- ∞ P rantenkriterium folgt dann die absolute Konvergenz der Reihe xk . k=1 p 2. Sei α = lim sup k kxk k > 1. Dann existiert eine Teilfolge (xkj ) von (xk ) mit k→∞ ∞ p P kj kxkj k ≥ 1, also mit kxkj k ≥ 1. Somit ist (xk ) keine Nullfolge und xk k=1 konvergiert nicht (Satz 3.2). ⊓ ⊔ 3.1 Konvergenzkriterien für Reihen in Banachräumen 99 Satz 3.7 (Quotientenkriterium) ∞ P xk eine Reihe im Banachraum E, deren Glieder xk alle vom NullvekSei k=1 tor verschieden sind. 1. Ist α := lim sup k→∞ 2. Ist β := lim inf k→∞ kxk+1 k kxk k kxk+1 k kxk k > 1, so ist die Reihe Beweis. 1. Sei α = lim sup k→∞ ∞ P < 1, so ist die Reihe kxk+1 k kxk k Folglich gilt < 1 . Dann existiert ein k0 ∈ N, so dass kxk+1 k ≤ 1+α 2 kxk0 +j k ≤ 1+α 2 j und somit α+1 2 xk divergent. k=1 kxk+1 k 1+α ≤α< <1 kxk k 2 Da xk absolut–konvergent. k=1 ∞ P kxk k ∀ k ≥ k0 . ∀ k ≥ k0 kxk0 k ∀j ≥ 0. < 1, konvergiert die geometrische Reihe ∞ P j=0 rantenkriterium folgt dann, dass die Reihe ∞ P j ( α+1 2 ) . Aus dem Majo- xk absolut konvergiert. k=1 2. Sei nun β = lim inf k→∞ kx k kxk+1 k kxk k > 1 . Dann sind höchstens endlich viele der Zahlen kxk+1 kleiner als 1. Folglich existiert ein k0 ∈ N, so dass 0 < kxk k ≤ kk kxk+1 k für alle k ≥ k0 gilt. Also ist (xk ) keine Nullfolge. Nach Satz 3.2 ist ∞ P xk divergent. ⊓ ⊔ deshalb die Reihe k=1 Beispiel 4: Ob man das Wurzel- oder das Quotientenkriterium anwendet, muß man anhand der Gestalt der Reihenglieder entscheiden. Das Wurzelkriterium ist leistungsfähiger als das Quotientenkriterium. Betrachten wir ∞ P xk , wobei xk := 2−k für gerade k und z.B. E = R und die Reihe k=1 xk := 8−k für ungerades k sei. Das Wurzelkriterium zeigt Konvergenz an, √ da lim sup k xk = 21 gilt, während das Quotientkriterium keine Aussage lie= 0 und lim sup xxk+1 = +∞ gilt. fert, da lim inf xxk+1 k k Beispiel 5: Für jede komplexe Zahl z ∈ C ist die Reihe ∞ X zk k=0 k! =1+z+ z2 z3 z4 + + + ... 2! 3! 4! 100 3 Reihen in Banachräumen absolut–konvergent. Beweis. Wir benutzen das Quotientenkriterium mit xk = zk k! : xk+1 z k+1 · k! |z| = xk z k · (k + 1)! = k + 1 −→ 0 Beispiel 6: Sei E = C, z ∈ C eine fixierte komplexe Zahl und p ∈ Q+ eine positive rationale Zahl. Die Reihe ∞ X kp k=1 zk ist für |z| > 1 absolut-konvergent und für |z| < 1 divergent. Beweis. Wir benutzen das Quotientenkriterium mit xk = kp . zk p xk+1 (k + 1)p · z k 1 1 = k+1 = · −→ . xk k p · z k+1 k |z| |z| x xk+1 xk+1 1 Es gilt also lim xk+1 = lim sup = lim inf xk xk = |z| . Die Behauptung k folgt dann aus dem Quotientenkriterium. ⊓ ⊔ Beispiel 7: Sei E = C und z ∈ C. Die Reihe ∞ X zk k k=1 ist absolut-konvergent, falls |z| < 1 und divergent, falls |z| > 1. p k |z| Beweis. Wir benutzen das Wurzelkriterium. Mit xk := zk ist k |xk | = √ . k k p p √ k k k Da lim k = 1 gilt, konvergiert |xk | gegen |z|. Damit ist lim sup |xk | = |z| k→∞ und das Wurzelkriterium liefert die Behauptung. ⊓ ⊔ Wir interessieren uns natürlich auch dafür, was mit der Konvergenz für z ∈ C mit |z| = 1 passiert. Für z = 1 ist die obige Reihe gerade die harmonische Reihe, also divergent. Um die anderen Fälle mit |z| = 1 behandeln zu können, beweisen wir ein weiteres Kriterium. 3.1 Konvergenzkriterien für Reihen in Banachräumen 101 Satz 3.8 (Abel–Dirichlet–Kriterium) Sei x1 , x2 , x3 , . . . eine Folge im Banachraum E, deren Partialsummenfolge (sn = x1 + x2 + . . . + xn ) beschränkt ist. Sei weiterhin a1 , a2 , a3 , . . . eine monoton fallende Nullfolge positiver reeller Zahlen. Dann konvergiert die Reihe ∞ X ak xk k=1 im Banachraum E. Beweis. Seien sn = x1 + x2 + . . . + xn und σn = a1 x1 + . . . + an xn . Nach Voraussetzung existiert eine reelle Zahl C, so dass ksn k ≤ C für alle n ∈ N. Für m > n erhalten wir σm − σn = an+1 xn+1 + an+2 xn+2 + . . . + am xm = an+1 (sn+1 − sn ) + an+2 (sn+2 − sn+1 ) + . . . + am (sm − sm−1 ) = −an+1 sn + (an+1 − an+2 )sn+1 + . . . + (am−1 − am )sm−1 + am sm . Da nach Voraussetzung ak − ak+1 ≥ 0 gilt, folgt kσm − σn k ≤ C · an+1 + (an+1 − an+2 ) + (an+2 − an+3 ) + . . . +(am−1 − am ) + am = 2C · an+1 . Da (an ) eine Nullfolge ist, existiert zu jedem ε > 0 ein n0 ∈ N, so dass kσm − σn k < ε für alle m > n ≥ n0 . Damit ist (σn ) eine Cauchy–Folge und konvergiert im Banachraum E. ⊓ ⊔ Beispiel 7 (Fortsetzung): ∞ k P z Die Reihe k ist konvergent für z ∈ C mit |z| = 1 und z 6= 1. k=1 Beweis. Seien ak := k1 , xk := z k und sn := z + z 2 + . . . + z n . Es gilt 1 − zn 2 n sn = z + z + . . . + z = z . 1−z n | 2 Da |z| = 1, folgt |sn | = |z| · |1−z |1−z| ≤ |1−z| . Somit ist die Folge der Partialsummen (sn ) beschränkt. Aus dem Abel-Dirichlet-Kriterium folgt dann, dass ∞ k P z ⊓ ⊔ die Reihe k konvergiert. k=1 102 3 Reihen in Banachräumen Das folgende Bild zeigt das Konvergenzverhalten der Reihe ∞ P k=1 iR 6 divergent i zk k . konvergent 1 R absolut konvergent Spezialfall (z = −1): Die alternierende harmonische Reihe ∞ X (−1)k k=1 1 1 1 1 = −1 + − + ± . . . k 2 3 4 ist konvergent. Wir werden später sehen, dass ihr Wert ln 2 ist. Als nächstes betrachten wir Reihen reeller Zahlen, die sich so verhalten wie die alternierende harmonische Reihe. Definition 3.3. Eine Reihe ∞ P xk reeller Zahlen heißt alternierend, wenn k=1 xk+1 > 0 ⇐⇒ xk < 0 ∀ k ∈ N. Satz 3.9 (Leibnitz–Kriterium für alternierende Reihen) Sei (bk ) eine monoton fallende Nullfolge positiver reeller Zahlen. Dann gilt: 1. Die alternierende Reihe ∞ P (−1)k bk konvergiert. k=1 2. Es gilt die folgende Fehlerabschätzung für den Wert s der Reihe ∞ P (−1)k bk : k=1 n X k (−1) bk ≤ bn+1 s − k=1 Beweis. Zum Beweis benutzen wir das Abel–Dirichlet–Kriterium. Wir setzen in Satz 3.8 xk := (−1)k und ak := bk . Dann ist sn = x1 + . . . + xn ∈ {0, −1}, also beschränkt, und (ak ) eine monoton fallende Nullfolge. Folglich konvergiert n P (−1)k bk . Für den Wert s dieser Reihe gilt k=1 3.1 Konvergenzkriterien für Reihen in Banachräumen 103 s = s2m − b2m+1 + b2m+2 − b2m+3 + . . . = s2m+1 + b2m+2 − b2m+3 + b2m+4 − . . . . Da die Folge (bk ) monoton fallend ist, gilt s2m+1 < s < s2m und somit |s − sn | < |sn+1 − sn | = bn+1 . ⊓ ⊔ Dies zeigt die Fehlerabschätzung. Beispiel 8: Die Leibnitz-Reihe Die Reihe ∞ X 1 1 1 1 1 = 1 − + − + − ... (−1)k 2k + 1 3 5 7 9 k=0 konvergiert nach dem Leibnitz-Kriterium. Wir werden später sehen, dass der Grenzwert π4 ist. Satz 3.10 (Cauchysches Verdichtungskriterium) Sei (xk ) eine monoton fallende Folge positiver reeller Zahlen. Dann gilt ∞ X k=1 xk konvergiert ⇐⇒ ∞ X 2j x2j konvergiert. j=0 Beweis. Wir betrachten die Partialsummen beider Reihen sn := x1 + . . . + xn tm := x1 + 2x2 + 4x4 + . . . + 2m x2m . Zunächst schätzen wir diese beiden Partialsummen gegeneinander ab. Nach Voraussetzung ist die Folge (xk ) monoton fallend. Somit gilt für alle n < 2m+1 2m Summanden }| { z sn = x1 + . . . + xn ≤ x1 + (x2 + x3 ) + . . . + (x2m + . . . + x2m+1 −1 ) ≤ x1 + 2x2 + . . . + 2m x2m = tm . Folglich gilt s n ≤ tm Andererseits folgt für n ≥ 2m ∀ n < 2m+1 (∗). 104 3 Reihen in Banachräumen sn = x1 + . . . + x2k + . . . + xn 2m−1 Summanden z }| { ≥ x1 + x2 + (x3 + x4 ) + . . . + (x2m−1 +1 + . . . + x2m ) 1 1 ≥ x1 + x2 + 2x4 + . . . + 2m−1 x2m = tm . 2 2 Folglich gilt 2sn ≥ tm ∀ n ≥ 2m (∗∗). Nun zum Beweis der behaupteten Äquivalenz: ∞ P xk konvergent. Dann ist die Folge (sn ) konvergent und folglich (=⇒): Sei k=1 beschränkt. Wegen (∗∗) ist dann auch die Folge (tm ) beschränkt. Außerdem ist (tm ) monoton wachsend. Nach Satz 2.20 konvergiert dann die Folge (tm ), ∞ P 2j x2j . also die Reihe j=0 (⇐=): Sei ∞ P 2j x2j konvergent. Dann ist die Folge (tm ) konvergent und folg- j=0 lich beschränkt. Wegen (∗) ist dann auch die Folge (sn ) beschränkt. Außerdem ist (sn ) monoton wachsend. Nach Satz 2.20 konvergiert dann die Folge (sn ), ∞ P xk . ⊓ ⊔ also die Reihe k=1 Beispiel 9: Sei p eine positive rationale Zahl. Die Reihe ∞ X 1 kp k=1 ist genau dann konvergent, wenn p > 1. Beweis. Da p > 0, sind die Voraussetzungen von Satz 3.10 erfüllt. Dann gilt ∞ ∞ ∞ X X X 1 j 1 2 j p = (2(1−p) )j konvergiert. konvergiert ⇐⇒ kp (2 ) j=0 j=0 k=1 Die geometrische Reihe ∞ P (2(1−p) )j konvergiert genau dann, wenn 2(1−p) < 1 j=0 d.h. genau dann, wenn p > 1 gilt. ⊓ ⊔ Das Cauchy–Produkt von Reihen komplexer Zahlen Wir haben bereits gesehen, dass man konvergente Reihen in Banachräumen addieren und mit Skalaren multiplizieren kann. Betrachtet man nur Reihen im Banachraum der komplexen Zahlen (E = C), so kann man sie auch auf bestimmte Weise multiplizieren. 3.1 Konvergenzkriterien für Reihen in Banachräumen Definition 3.4. Seien eine neue Reihe ∞ P ∞ P ak und ∞ P 105 bk zwei Reihen in C. Wir betrachten k=0 k=0 ck mit den Reihengliedern k=0 ck := k X j=0 Die Reihe ∞ P aj · bk−j = a0 bk + a1 bk−1 + · · · + ak−1 b1 + ak b0 ck heißt Cauchy–Produkt der Reihen ∞ P ak und bk . k=0 k=0 k=0 ∞ P Wir wollen die Frage behandeln, unter welchen Bedingungen aus der Kon∞ ∞ P P bk die Konvergenz des Cauchy-Produktes ak und vergenz der Reihen ∞ P k=0 k=0 ck folgt. Im allgemeinen folgt sie nicht. k=0 Beispiel 10: Wir betrachten die alternierenden Reihen ∞ X ak = k=0 ∞ X k=0 bk = ∞ X 1 1 1 (−1)k √ = 1 − √ + √ − √ ± .... k+1 2 3 4 k=0 Diese Reihen konvergieren nach dem Leibnitz–Kriterium für alternierende Reik P aj bk−j , so erhalten wir hen. Betrachten wir aber die Folge ck = j=0 ck = Es gilt k k X X (−1)j (−1)k−j (−1)k √ p ·√ . = j+1 k − j + 1 j=0 (j + 1)(k − j + 1) j=0 (k − j + 1)(j + 1) = 1 k+1 2 2 − 1 k−j 2 2 ≤ 1 k+1 2 2 und folglich |ck | ≥ k+1 2(k + 1) −→ 2. = k+2 +1 1 2k Damit ist (ck ) keine Nullfolge und die Reihe ∞ P k=0 ck somit divergent. 106 3 Reihen in Banachräumen Satz 3.11 Seien ∞ P ak und ∞ P bk konvergente Reihen komplexer Zahlen und k=0 k=0 sei mindestens eine der beiden Reihen absolut–konvergent. Dann konvergiert ∞ P ck und es gilt ihr Cauchy–Produkt k=0 ∞ X ck = k=0 ∞ P Beweis. Sei OBdA ∞ X ak k=0 ! · ∞ X k=0 bk ! . ak absolut–konvergent. Wir setzen k=0 An = n X ak Bn := k=0 n X bk Cn = k=0 n X ck . k=0 Weiterhin bezeichne A := lim An , B = lim Bn und βn = Bn − B . Dann n→∞ n→∞ erhalten wir Cn = c0 + c1 + . . . + cn = a0 b0 + (a0 b1 + a1 b0 ) + . . . + (a0 bn + a1 bn−1 + . . . + an b0 ) = a0 · Bn + a1 · Bn−1 + . . . + an · B0 = a0 (βn + B) + a1 (βn−1 + B) + . . . + an (β0 + B) = An · B + a0 βn + a1 βn−1 + . . . + an β0 . | {z } =:γn Es bleibt somit γn −→ 0 zu zeigen, da An · B gegen A · B konvergiert. Sei ε > 0 gegeben. Da Bn gegen B konvergiert, existiert ein n0 ∈ N so dass |βn | = |Bn − B| < ε ∀ n ≥ n0 . Damit schätzen wir |γn | ab. |γn | = |a0 βn + a1 βn−1 + . . . + an β0 | ≤ |a0 βn + . . . + an−n0 βn0 | + |an−n0 +1 βn0 −1 + . . . + an β0 | ≤ ε(|a0 | + . . . + |an−n0 |) + |an−n0 +1 βn0 −1 + . . . + an β0 | ! ∞ X ≤ ε· |ak | +|an−n0 +1 ||βn0 −1 | + . . . + |an ||β0 | | k=0 {z =:A∗ } ≤ εA∗ + |an−n0 +1 ||βn0 −1 | + . . . + |an ||β0 | A∗ ist endlich, da die Reihe ∞ P ∀ n ≥ n0 . ak nach Voraussetzung absolut konvergiert. k=0 Da (an ) eine Nullfolge ist, erhalten wir 3.1 Konvergenzkriterien für Reihen in Banachräumen lim |γn | ≤ εA∗ n→∞ 107 ∀ ε > 0. Somit konvergiert γn gegen 0 und Cn = An · B + γn gegen A · B. ⊓ ⊔ Satz 3.12 Das Cauchy-Produkt zweier absolut-konvergenter Reihen ist absolut konvergent. ⊓ ⊔ Beweis. Übungsaufgabe. Beispiel 11: ∞ X k=1 k · z k−1 = 1 (1 − z)2 Beweis. Wir betrachten die Reihen für |z| < 1. ∞ P k=0 Dann ist ck = k P j=0 ∞ P k=0 ck = ∞ P k=1 ak und ∞ P bk mit ak = bk = z k . k=0 z j · z k−j = (k + 1) · z k . Also ist das Cauchy–Produkt k · z k−1 . Da die geometrische Reihe ∞ P k=0 z k für |z| < 1 absolut 1 konvergiert und ihr Wert 1−z ist, konvergiert das Cauchy–Produkt für |z| < 1 gegen den oben angegebenen Wert. (Die Konvergenz folgt zwar auch aus dem Quotientenkriterium, aber auf diese Weise kann man auch den Wert der Reihe bestimmen). ⊓ ⊔ Der Umordnungssatz In einer endlichen Summe kann man die Summanden beliebig umordnen, ohne den Wert der Summe zu verändern. Dies ist für Reihen (“unendliche Summen“) nicht mehr der Fall. Abschließend untersuchen wir deshalb die Frage, unter welchen Bedingungen man Reihenglieder umordnen kann, ohne die Konvergenz zu verlieren. Definition 3.5. Sei ∞ P k=1 xk eine Reihe im Banachraum E und f : N −→ N eine bijektive Abbildung. Die Reihe ∞ P xf (k) heißt Umordnung von k=1 ∞ P xk . k=1 Man kann die Glieder einer Reihe nicht beliebig umordnen. Betrachten wir z.B. die Reihe 1 1 1 1 1 1 √ − √ + √ − √ + √ − √ ± . . . (∗) 1 1 2 2 3 3 Die Reihe (∗) ist konvergent, denn für die Partialsummen gilt 108 3 Reihen in Banachräumen s2m = 0 1 s2m+1 = √m+1 dh. sm −→ 0. Betrachten wir nun folgende Umordnung der obigen Reihe (∗) 1 1 1 1 1 1 1 1 1 √ +√ −√ + √ +√ −√ + √ +√ −√ + . . . (∗∗) 1 3 4 2 3 1 2 5 6 Für die 3n-ten Partialsummen s∗3n dieser Reihe (∗∗) gilt s∗3n 1 1 1 n 1 = √ ≥ √ + ... + √ = √ = + ...+ √ n+1 2n 2n 2n 2n | {z } | {z } n Summanden r n −→ ∞. 2 n Summanden Somit ist diese Reihe (**) nicht konvergent. Satz 3.13 (Umordnungssatz) Sei ∞ P xk eine absolut–konvergente Reihe k=1 im Banachraum E. Dann ist jede Umordnung von ∞ X xk = k=1 Beweis. Sei k=1 xk konvergent und es k=1 gilt ∞ P ∞ P ∞ P ∞ X xf (k) . k=1 xf (k) eine Umordnung von ∞ P xk . Nach Voraussetzung ist k=1 k=1 xk absolut-konvergent, also auch konvergent, d.h. es existiert ein s ∈ E mit s = ∞ P xk . Es bezeichne k=1 sn := x1 + . . . + xn und s∗n := xf (1) + . . . + xf (n) . Sei nun eine Zahl ε > 0 gegeben. Da ∞ P xk absolut konvergiert, existiert nach k=1 dem Cauchy-Kriterium ein n0 ∈ N, so dass m X j=n kxj k < ε. ∀ m > n ≥ n0 (∗) Da die Umordnung f : N −→ N bijektiv ist, gibt es ein p0 ∈ N, so dass {1, . . . , n0 } ⊂ f ({1, . . . , p0 }). Für p ≥ p0 ergibt sich dann sp − s∗p = x1 + . . . + xp − (xf (1) + . . . + xf (p) ) = Summe gewisser xi für i > n0 . 3.1 Konvergenzkriterien für Reihen in Banachräumen 109 Aus (∗) folgt ksp − s∗p k < ε ∀ p ≥ p0 . Da sp gegen s konvergiert, gibt es auch ein n∗0 ∈ N so dass ksp − sk < ε ∀ p > n∗0 . Damit erhalten wir ks∗n − sk ≤ ks∗n − sn k + ksn − sk < 2ε ∀ n ≥ max{p0 , n∗0 }. Folglich konvergiert die Folge (s∗n ) gegen s, also gilt ∞ P xf (k) = s. k=1 ⊓ ⊔ Ohne die Voraussetzung der absoluten Konvergenz gilt Satz 3.13 nicht mehr. Es gilt sogar Satz 3.14 (Riemannscher Umordnungssatz) ∞ P ak eine konvergente, aber nicht absolut konvergente Reihe reeller ZahSei k=1 len und sei s ∈ R eine beliebig (!) vorgegebene Zahl. Dann existiert eine bijekti∞ P af (k) gegen s konvergiert. ve Abbildung f : N → N, so dass die Umordnung k=1 Beweis. Sei oBdA ak 6= 0 für alle k ∈ N. Wir setzen |ak | + ak ak falls ak > 0 + ak := = 0 falls ak < 0 2 |ak | − ak 0 falls ak > 0 = a− := k −ak falls ak < 0 2 − + − Dann gilt ak = a+ k − ak und |ak | = ak + ak . Aus der Voraussetzung des Sat∞ ∞ P − P + ak divergent sind. Wäre nämlich ak und zes folgt, dass beide Reihen k=1 k=1 eine dieser beiden Reihen konvergent, so würde wegen der Konvergenz von ∞ P ak auch die andere dieser beiden Reihen konvergieren und die Konver- k=1 genz von ∞ P k=1 |ak | folgen (Satz 3.4). Sei nun (pm ) die Teilfolge aller positiven Zahlen von (ak ) und (qm ) die Teilfolge aller negativen Zahlen von (ak ). Offensichtlich entsteht die Folge (pm ), wenn man aus der Folge (a+ k ) alle Nullen streicht und (−qm ), wenn man aus der Folge (a− ) alle Nullen streicht. Nach dem oben Gesagten sind die Reihen k ∞ ∞ P P pm und qm divergent und es gilt m=1 m=1 ∞ X m=1 pm = +∞ , ∞ X m=1 qm = −∞ (∗) 110 3 Reihen in Banachräumen kann man schrittweise eine Folge jeweils kleinster der folgenden Eigenschaft wählen: n0 P n0 so dass n1 so dass n2 > n0 so dass n3 > n1 so dass m=1 n0 P m=1 n0 P m=1 n0 P pm > s pm + pm + pm + m=1 .. . ∞ P ak . Wegen (∗) k=1 Indizes n0 , n1 , n2 , . . . mit Wir konstruieren nun die gesuchte Umordnung der Reihe n1 P m=1 n1 P m=1 n1 P m=1 qm < s n2 P qm + qm + pm m=n0 +1 n2 P pm + m=n0 +1 > s n3 P qm < s m=n1 +1 Die Reihe p1 + . . . + pn0 + q1 + . . . + qn1 + pn0 +1 + . . . + pn2 + qn1 +1 + . . . + qn3 + . . . ist eine Umordnung von ∞ P (∗∗) ak . Aus der Minimalitätseigenschaft der Wahl k=1 der Indizes nj erhält man folgende Abschätzung für die Partialsumme s∗n der Reihe (∗∗): |s − s∗n | ≤ pn2j |s − Da die Reihe s∗n | ∞ P k=1 ≤ −qn2j+1 ∀ n2j−1 + n2j ≤ n < n2j + n2j+1 ∀ n2j + n2j+1 ≤ n < n2j+1 + n2j+2 ∞ ak konvergiert, sind die Teilfolgen (pn2j )∞ j=0 und (qn2j+1 )j=0 von (an ) Nullfolgen. Folglich konvergiert die Folge der Partialsummen (s∗n ) der Umordnung (∗∗) gegen s. ⊓ ⊔ 3.2 Komplexe Potenzreihen Als Anwendung der Konvergenzkriterien aus Kapitel 3.1 betrachten wir in diesem Abschnitt spezielle Reihen im Banachraum der komplexen Zahlen, die sogenannten Potenzreihen. Definition 3.6. Sei z0 ∈ C und (an ) eine Folge komplexer Zahlen. Eine Potenzreihe mit dem Zentrum z0 ist eine Reihe komplexer Zahlen der Form P (z) := ∞ X n=0 an (z − z0 )n , z ∈ C. 3.2 Komplexe Potenzreihen 111 Wir wollen die Frage untersuchen, für welche z ∈ C die Potenzreihe P (z) konvergiert. Offensichtlich konvergiert die Potenzreihe P (z) für z = z0 . Satz 3.15 Sei P (z) = ∞ P n=0 und sei z1 6= z0 . an (z − z0 )n eine Potenzreihe mit dem Zentrum z0 1. Ist P (z1 ) konvergent, so ist P (z) für jedes z ∈ C mit |z − z0 | < |z1 − z0 | absolut-konvergent. 2. Ist P (z1 ) divergent, so ist P (z) für jedes z ∈ C mit |z − z0 | > |z1 − z0 | divergent. Beweis. Zu 1: Da die Reihe P (z1 ) = ∞ P n=0 an (z1 − z0 )n konvergiert, ist die Folge (an (z1 − z0 )n ) eine Nullfolge, also insbesondere beschränkt. Sei C ∈ R so gewählt, dass |an (z1 − z0 )n | ≤ C für alle n ∈ N0 . Dann gilt n z − z0 n n n z − z0 . ≤C· |an (z − z0 ) | = |an (z1 − z0 ) | z1 − z0 z1 − z0 0 Für z ∈ C mit |z − z0 | < |z1 − z0 | folgt | zz−z | < 1. Aus dem Majorantenkri1 −z0 terium und dem Grenzwert der geometrischen Reihe erhält man ∞ ∞ X X z − z0 n 1 n |an (z − z0 ) | ≤ C z1 − z0 = C · 1 − | z−z0 | . z1 −z0 n=0 n=0 Insbesondere ist ∞ P n=0 an (z − z0 )n absolut-konvergent. Zu 2: Sei P (z1 ) divergent und |z − z0 | > |z1 − z0 |. Wäre P (z) konvergent, so würde aus 1. folgen, dass P (z1 ) absolut-konvergent wäre, was einen Widerspruch liefert. ⊓ ⊔ Definition 3.7. Die Zahl R := sup{|z−z0 | P (z) ist konvergent} ∈ R∪{+∞} heißt Konvergenzradius der Potenzreihe P (z). Die Kreisscheibe K(z0 , R) ⊂ C heißt Konvergenzkreis von P (z). Nach Satz 3.15 ist die Potenzreihe P (z) für z ∈ K(z0 , R) absolut-konvergent und für z ∈ C \ cl(K(z0 , R)) divergent. Aus Kapitel 3.1. wissen wir bereits • Für P (z) = • Für P (z) = • Für P (z) = ∞ P n=0 ∞ P n=0 ∞ P n=0 z n ist R = 1. zn n ist R = 1. zn n! ist R = +∞. 112 3 Reihen in Banachräumen Die nächsten beiden Sätze zeigen, wie man den Konvergenzradius einer Potenzreihe bestimmen kann. ∞ P Satz 3.16 Sei P (z) = an (z − z0 )n eine Potenzreihe und n=0 p λ := lim sup n |an |. Dann gilt für den Konvergenzradius R von P (z) n→∞ 1 + λ falls λ ∈ R R = 0 falls λ = +∞ ∞ falls λ = 0. Beweis. Sei α := lim sup n→∞ p p n |an (z − z0 )n | = lim sup n |an | · |z − z0 | = λ · |z − z0 |. n→∞ Nach dem Wurzelkriterium konvergiert P (z) für α < 1 und divergiert für α > 1. (1) Sei 0 < λ < +∞. Dann gilt ( konvergiert für alle z mit |z − z0 | < λ1 P (z) divergiert für alle z mit |z − z0 | > λ1 Folglich ist R = λ1 . (2) Sei λ = 0, dann ist auch α = 0. Somit konvergiert P (z) für alle z ∈ C und der Konvergenzradius R ist +∞. (3) Sei λ = +∞. Dann gilt 0 z = z0 α= +∞ z 6= z0 . Die Reihe P (z) divergiert also für alle z 6= z0 . Somit ist R = 0. ⊓ ⊔ Auf analoge Weise erhält man aus dem Quotientenkriterium Satz 3.17 Sei P (z) = ∞ P n=0 an (z − z0)n eine Potenzreihe und seien alle an von Null verschieden. Wir setzen µ := lim | an+1 an |. Dann gilt für den Konvergenzradius R von P (z) n→∞ 1 + µ falls µ ∈ R R = 0 falls µ = +∞ ∞ falls µ = 0. 3.3 Exponentialfunktion, Logarithmusfunktion und komplexe Potenzen 113 3.3 Exponentialfunktion, Logarithmusfunktion und komplexe Potenzen In Kapitel 1.2 haben wir Potenzen aq definiert, wobei a eine positive reelle Zahl und der Exponent q eine rationale Zahl bezeichnet. In diesem Abschnitt wollen wir Potenzen az für komplexe Exponenten z ∈ C erklären und die Eigenschaften dieser Potenzen untersuchen. Dazu betrachten wir zunächst die folgende komplexe Potenzreihe: E(z) := ∞ X z2 z3 zn =1+z+ + + ... n! 2! 3! n=0 Die Reihe E(z) hat folgende Eigenschaften: (1) E(z) ist für jedes z ∈ C absolut-konvergent. ∞ P 1 (2) Es gilt E(0) = 1 und E(1) = n! = e, wobei e die Eulerzahl bezeichnet. n=0 (3) Es gilt E(z1 ) · E(z2 ) = E(z1 + z2 ) für alle z1 , z2 ∈ C. Dies läßt sich mit der Formel für das Cauchy–Produkt aus Abschnitt 3.1 zeigen. Das Cauchy-Produkt der beiden absolut-konvergenten Reihen E(z1 ) und E(z2 ) ist ! ! n ∞ ∞ n X X X 1 X n k n−k z1k z2n−k = · z ·z k! (n − k)! n! k 1 2 n=0 n=0 k=0 k=0 ∞ X (z1 + z2 )n = n! n=0 = E(z1 + z2 ). Folglich gilt nach Satz 3.11, dass E(z1 + z2 ) = E(z1 ) · E(z2 ). Insbesondere ist E(z) 6= 0 und E(z) · E(−z) = E(0) = 1 für alle z ∈ C. (4) Es gilt E(z) = E(z). |z| (5) Es gilt |E(z) − 1| ≤ 1−|z| für alle z ∈ C mit 0 < |z| < 1: Wir benutzen dazu die Konvergenzeigenschaften der geometrischen Reihe und das Majorantenkriterium und erhalten ! ∞ ∞ ∞ ∞ X X X |z| z n X |z|n |z|n = |z| ≤ . |z|n = |E(z) − 1| = ≤ n! n! 1 − |z| n=1 n=1 n=0 n=1 (6) Es gilt E(q) = eq für alle q ∈ Q: Für n ∈ N ist E(n) = E(1 + . . . + 1) = E(1) · . . . · E(1) = e| · .{z . . · e} = en | {z } | {z } n−mal n−mal n−mal 114 3 Reihen in Banachräumen 1 1 = e−n = en . Folglich ist E(n) = en für Für n ∈ −N gilt E(n) = E(−n) n alle n ∈ Z. Sei nun q ∈ Q und q = m , wobei n ∈ Z und m ∈ N. Dann ist (eq )m = eq·m = en = E(n) = E(q · m) = E(q + . . . + q ) | {z } m−mal = E(q) · . . . · E(q) = E(q)m . | {z } m−mal Da eq und E(q) positiv sind, folgt eq = E(q). Die letzte Eigenschaft von E(z) rechtfertigt die folgende Definition: Definition 3.8. Unter der komplexen Potenz ez der Eulerzahl e verstehen wir den Wert der Potenzreihe E(z), d.h. ez := E(z) = Die Funktion ∞ X zn . n! n=0 exp : C −→ C z 7−→ ez heißt Exponentialfunktion. Aus den Eigenschaften der Potenzreihe E(z) folgt Satz 3.18 Die komplexen Potenzen der Eulerzahl erfüllen 1. ez+w = ez · ew |z| 2. |ez − 1| ≤ 1−|z| für alle z, w ∈ C. für alle z ∈ C mit 0 ≤ |z| < 1. Satz 3.19 Die Abbildung exp|R : R −→ R+ ist streng monoton wachsend und bijektiv. Es gilt 1. 1 ≤ ex 2. 0 < ex ≤ 1 für alle x ∈ R mit x ≥ 0. für alle x ∈ R mit x ≤ 0. Beweis. Nach Definition ist ex = E(x) ≥ 1 für alle x ≥ 0. Da ex ·e−x = e0 = 1, folgt daraus 0 < ex ≤ 1 für alle x ≤ 0. Seien nun x und y zwei reelle Zahlen mit x < y. Dann ist ey = ex+(y−x) = ex · ey−x > ex . Somit ist die Funktion exp|R steng monoton wachsend. Insbesondere ist sie deshalb injektiv. Es bleibt zu zeigen, dass exp|R : R → R+ surjektiv ist. 3.3 Exponentialfunktion, Logarithmusfunktion und komplexe Potenzen 115 Sei y ∈ R+ . Wir suchen eine Zahl s ∈ R mit es = y. Dazu betrachten wir die folgenden Mengen A = {x ∈ R | ex < y} und B = {x ∈ R | y ≤ ex }. Diese Mengen bilden einen Dedekindschen Schnitt (A|B) von R, denn • • • R ist die disjunkte Vereinigung von A und B. y−1 A und B sind nichtleer, denn e y < y ≤ ey (Übungsaufgabe 55 (2)). Für a ∈ A und b ∈ B gilt ea < y ≤ eb . Wegen der Monotonie der Exponentialfunktion folgt a < b. Sei s ∈ R die auf Grund des Vollständigkeitsaxioms der reellen Zahlen existierende Schnittzahl des Dedekindschen Schnittes (A|B). Wir zeigen nun, dass es = y gilt. Wir wissen, dass a ≤ s ≤ b für alle a ∈ A, b ∈ B. Sei (an ) eine Folge in A, die gegen s konvergiert. Dann gilt ean < y und |es − ean | = |ean ||e(s−an ) − 1| < |y| · |s − an | −→ 0. 1 − |s − an | Daraus folgt lim ean = es ≤ y. n→∞ Sei (bn ) eine Folge in B, die gegen s konvergiert. Dann gilt ebn ≥ y und |ebn − es | = |es ||e(bn −s) − 1| ≤ |es | · |bn − s| −→ 0. 1 − |bn − s| Es folgt lim ebn = es ≥ y. Also ist y = es . n→∞ ⊓ ⊔ Definition 3.9. Die Umkehrabbildung von exp|R bezeichnen wir mit ln : R+ −→ R und nennen ln(y) den natürlichen Logarithmus von y. Die Zahl ln(y) ist also eindeutig bestimmt durch die Bedingung eln(y) = y. Daraus ergeben sich folgende Eigenschaften für den natürlichen Logarithmus: Satz 3.20 Es seien y, y1 , y2 ∈ R+ und q ∈ Q. 1. 2. 3. 4. 5. 6. Die Funktion ln : R+ −→ R ist bijektiv und streng monoton wachsend. ln(y1 · y2 ) = ln(y1 ) + ln(y2 ). ln(y q ) = q · ln(y). ln( yy12 ) = ln(y1 ) − ln(y2 ). ln(1) = 0, ln(e) = 1. ln(y) > 0 für alle y > 1 und ln(y) < 0 für alle 0 < y < 1. 116 3 Reihen in Banachräumen Das folgende Bild zeigt den Funktionsverlauf der reellen Funktionen exp|R und ln. R6 .. ex ... ... .. ... .. . e ... ... . . .. ... .... . . . . ........................... ... .............. ...... ..1 .......... . . . . . . . . . . . . . . .... ..... ............. ...... ................................. ..... . . . ...1 ... .... . ... .... . ... .... . ... ln(x) R Sei a ∈ R+ . Dann gilt für die Potenz ax , x ∈ R, die Formel ax = eln(a)·x = ∞ X (x · ln(a))n . n! n=0 Dies rechtfertigt die folgende Definition der komplexen Potenzen einer beliebigen positiven reellen Zahl: Definition 3.10. Sei a ∈ R+ und z ∈ C. Unter der Potenz az verstehen wir die komplexe Zahl az := E(z · ln(a)) = ∞ X (z · ln(a))n = ez·ln(a) . n! n=0 Aus den Eigenschaften der Potenzreihe E(z) ergibt sich unmittelbar Satz 3.21 (Potenzgesetze für komplexe Potenzen) Es seien a, b ∈ R+ , x ∈ R und z, w ∈ C. Dann gilt: 1. 2. 3. 4. 5. 1z = 1 und a0 = 1. az · bz = (ab)z . az · aw = az+w . a−z = a1z . (ax )z = ax·z . Sei a ∈ R+ \ {1}. Dann ist die Abbildung 3.3 Exponentialfunktion, Logarithmusfunktion und komplexe Potenzen 117 expa : R −→ R+ x 7−→ ax bijektiv, streng monoton wachsend, falls a > 1, und streng monoton fallend, falls 0 < a < 1. Die Umkehrabbildung zu expa bezeichnen wir mit loga : R+ −→ R und nennen loga (y) den Logarithmus von y zur Basis a. Aus den Potenzgesetzen folgen dann unmittelbar die Aussagen des folgenden Satzes. Satz 3.22 Die Funktion loga : R+ −→ R ist bijektiv, streng monoton wachsend, falls a > 1, und streng monoton fallend, falls 0 < a < 1. Es seien x, y ∈ R+ , ρ ∈ R und a ∈ R+ . Dann gilt: 1. 2. 3. 4. 5. x loga x = ln ln a . loga (x · y) = loga x + loga y. loga (xρ ) = ρ · loga x. loga ( xy ) = loga (x) − loga (y). loga (1) = 0, loga (a) = 1. 4 Stetige Abbildungen zwischen metrischen Räumen 4.1 Der Grenzwert einer Abbildung in einem Punkt In diesem Abschnitt bezeichnen (X, dX ) und (Y, dY ) metrische Räume, A ⊂ X eine Teilmenge von X und f : A ⊂ X −→ Y eine auf A definierte Abbildung. Definition 4.1. Sei x ∈ X ein Häufungspunkt von A. Ein Punkt y ∈ Y heißt Grenzwert der Abbildung f im Punkt x, falls für jede Folge (an ) von Punkten aus A mit an 6= x und an −→ x, die Folge der Bildwerte (f (an )) gegen y konvergiert. Wir schreiben dafür symbolisch: y = lim f (a). a→x Bemerkung: Der Punkt x muss nicht unbedingt im Definitionsbereich A von f liegen. Wir benötigen lediglich, dass er der Grenzwert einer Folge von Punkten aus A ist, d.h. dass x ∈ HP (A). Beispiel 1: Es sei X = R2 , A = R2 \ {(0, 0)} und Y = R. Wir betrachten die Abbildung f : A −→ R mit f (x, y) := Behauptung: lim (x,y)→(0,0) x3 − y 3 . x2 + y 2 f (x, y) = 0. Beweis. Sei (x, y) 6= (0, 0). Dann gilt (x − y)(x2 + xy + y 2 ) xy x3 − y 3 = = (x − y)(1 + 2 ). 2 2 2 2 x +y x +y x + y2 1 Wegen x2xy +y 2 ≤ 2 , folgt 120 4 Stetige Abbildungen zwischen metrischen Räumen 3 |x − y|. 2 |f (x, y)| ≤ Sei nun ((xn , yn )) eine beliebige gegen (0, 0) konvergente Folge. Dann gilt xn −→ 0 und yn −→ 0 , somit xn − yn −→ 0 und folglich |f (xn , yn )| −→ 0. Also ist lim f (xn , yn ) = 0 für alle Folgen (xn , yn ) −→ (0, 0) und es gilt n→∞ lim (x,y)→(0,0) ⊓ ⊔ f (x, y) = 0. Beispiel 2: Es sei X = R2 , A = R2 \ {(0, 0)} und Y = R. Wir betrachten die Abbildung f : A −→ R mit f (x, y) = Behauptung: lim (x,y)→(0,0) xy 2 x2 + y 4 f (x, y) existiert nicht. Beweis. Wir betrachten die Folgen (an ) und (bn ) im R2 mit an := Dann gilt 1 1 , n n 1 1 −→ (0, 0), , n n 1 1 −→ (0, 0), , bn = n2 n an = und f (an ) = f (bn ) = bn := 1 n3 1 n2 + 1 n4 1 n4 1 n4 + 1 n4 1 1 . , n2 n = n −→ 0 n2 + 1 = 1 1 −→ . 2 2 Folglich hat f in (0, 0) keinen Grenzwert. ⊓ ⊔ Satz 4.1 Sei f : A ⊂ X −→ Y eine Abbildung und x ∈ HP (A). Dann sind die folgenden Bedingungen äquivalent: 1. lim f (a) = y. a→x 2. Für alle ε > 0 existiert ein δ > 0, so dass f A ∩ KX (x, δ) \ {x} ⊂ KY (y, ε), d.h. so dass für alle a ∈ A mit 0 < dX (x, a) < δ gilt dY (f (a), y) < ε. Beweis. (1) =⇒ (2): Sei lim f (a) = y. Angenommen 2. gilt nicht, das heißt a→x es existiert ein ε0 > 0, so dass es zu jedem δ > 0 ein a ∈ A gibt mit 0 < dX (x, a) < δ und dY (f (a), y) ≥ ε0 . Wir wählen speziell δ = n1 . Dann 4.1 Der Grenzwert einer Abbildung in einem Punkt 121 erhalten wir eine Folge (an ) in A mit an 6= x, so dass dX (x, an ) < n1 und dY (f (an ), y) ≥ ε0 gilt. Daraus folgt an −→ x aber f (an ) 6−→ y. Dies steht aber im Widerspruch zu der Voraussetzung lim f (an ) = y. n→∞ (2) =⇒ (1): Sei 2. erfüllt. Wir betrachten eine gegen x konvergente Folge (an ) in A mit an 6= x. Sei ε > 0. Nach Voraussetzung existiert ein δ > 0, so dass f A ∩ KX (x, δ) \ {x} ⊂ KY (y, ε). Da an gegen x konvergiert, existiert ein n0 ∈ N, so dass dX (x, an ) < δ für alle n ≥ n0 . Folglich ist dY (y, f (an )) < ε für alle n ≥ n0 . Also konvergiert (f (an )) gegen y und zwar für jede Folge (an ) in A mit an 6= x und an −→ x. ⊓ ⊔ Wir betrachten nun den Fall, dass der metrische Raum Y ein Produktraum ist. Satz 4.2 Sei (Y, dY ) das Produkt von metrischen Räumen Y1 , Y2 , . . . , Yn und f : A ⊂ X −→ Y = Y1 × Y2 × . . . × Yn . Wir bezeichnen mit fj : A −→ Yj die durch f (a) = (f1 (a), f2 (a), . . . , fn (a)) definierten Abbildungen. Dann gilt lim fj (a) = yj ∀ j ∈ {1, . . . , n} a→x ⇐⇒ lim f (a) = (y1 , . . . , yn ). a→x Beweis. Die Behauptung folgt aus dem Satz 2.13 über die Konvergenz von Folgen in Produkträumen. ⊓ ⊔ Spezialfall: Sei f : A ⊂ X −→ C eine Abbildung mit komplexen Werten. Dann gilt lim f (a) = lim Re(f (a)) + i · lim Im(f (a)). a→x a→x a→x Die speziellen Rechenregeln für konvergente Folgen im Vektorraum Rn bzw. Cn , siehe Satz 2.18, liefern unmittelbar die folgenden Aussagen über Grenzwerte von Abbildungen mit Werten in Vektorräumen: Satz 4.3 (Grenzwerte von Abbildungen mit Werten in Rn bzw. Cn ) Sei K der Körper der reellen bzw. der komplexen Zahlen und sei h·, ·i ein Skalarprodukt und k · k eine Norm auf Kn . 1. Seien f, g : A −→ Kn zwei Abbildungen, für die die Grenzwerte lim f (a) a→x und lim g(a) existieren. Dann gilt: a→x 122 4 Stetige Abbildungen zwischen metrischen Räumen (a) Es existiert lim (g + f )(a) und es gilt a→x lim (g + f )(a) = lim g(a) + lim f (a). a→x a→x a→x (b) Es existiert lim hf, gi(a) und es gilt: a→x lim hf, gi(a) = h lim f (a), lim g(a)i. a→x a→x a→x (c) Es existiert lim kf k(a) und es gilt: a→x lim kf k(a) = k lim f (a)k. a→x a→x n 2. Seien f : A −→ K und h : A −→ K zwei Abbildungen, für die die Grenzwerte lim f (a) und lim h(a) existieren. Dann existiert auch der a→x a→x Grenzwert lim (h · f )(a) und es gilt a→x lim (h · f )(a) = lim h(a) · lim f (a). a→x a→x a→x 3. Seien h : A −→ K und p : A −→ K zwei Abbildungen, für die die Grenzwerte lim h(a) und lim p(a) existieren und sei h(a) 6= 0 für alle a→x a→x a ∈ A und lim h(a) 6= 0 . Dann existiert der Grenzwert lim ( hp )(a) und a→x a→x es gilt p lim p(a) (a) = a→x . lim a→x h lim h(a) a→x ⊓ ⊔ Im metrischen Raum R hatten wir außer den konvergenten Folgen auch Folgen betrachtet, die gegen +∞ oder −∞ streben und diesen den uneigentlichen Grenzwert ±∞ zugeordnet. Wir betrachten die analoge Situation für Grenzwerte von Abbildungen f : X −→ Y , wobei X = R oder Y = R ist. 1. Fall: Sei X ein beliebiger metrischer Raum, Y = R und f : A ⊂ X −→ R. Man sagt, dass der (uneigentliche) Grenzwert von f in x gleich +∞ ist, falls lim f (an ) = +∞ für jede gegen x konvergente Folge (an ) in A mit an 6= x . n→∞ Analog wird lim f (a) = −∞ definiert. a→x Satz 4.4 Sei f : A ⊂ X −→ R eine Abbildung von einer Teilmenge eines metrischen Raumes X in die reellen Zahlen. Dann sind folgende Bedingungen äquivalent: 1. lim f (a) = +∞. a→x 4.1 Der Grenzwert einer Abbildung in einem Punkt 123 2. Für alle M > 0 existiert ein δ > 0 , so dass f (a) > M für alle a ∈ A mit 0 < dX (a, x) < δ. Beweis. Der Beweis wird analog zum Beweis von Satz 4.1 geführt. ⊓ ⊔ Beispiel: Wir betrachten die Funktion f : R2 \ {(0, 0)} −→ R definiert durch f (x, y) = Dann gilt lim (x,y)→(0,0) x2 1 . + y2 f (x, y) = +∞. 2. Fall: Sei X = R, Y ein beliebiger metrischer Raum und f : (c, +∞) ⊂ R −→ Y . Man sagt, dass lim f (a) existiert und gleich y ∈ Y ist, falls a→+∞ lim f (an ) = y für jede Folge (an ) in (c, +∞) mit an −→ +∞. n→+∞ Wir schreiben in diesem Fall lim f (a) = y . a→+∞ Analog definiert man lim f (a) = y. a→−∞ Satz 4.5 Mit den obigen Bezeichnungen sind folgende Bedingungen äquivalent: 1. lim f (a) = y. a→+∞ 2. Für alle ε > 0 existiert ein M > 0 so dass dY (f (a), y) < ε für alle a > M . Beweis. Der Beweis wird analog zum Beweis von Satz 4.1 geführt. ⊓ ⊔ Beispiel: Seien f1 , f2 : (0, +∞) ⊂ R −→ C gegeben durch 1 (cos t + i sin t) f2 (t) := cos t + i sin t t lim f1 (t) = 0 während der GW von f2 für t gegen +∞ nicht f1 (t) := Dann gilt t→+∞ existiert. Beweis. Die erste Behauptung folgt, da |f (t)| = 1t . Für die 2. Behauptung betrachte man die Folge tn = nπ. Da f2 (2kπ) = 1 und f2 ((2k + 1)π) = −1 , hat die Bildfolge f (tn ) zwei verschiedene Häufungspunkte. ⊓ ⊔ 3. Fall: Seien X = Y = R und f : (c, +∞) ⊂ R −→ R. Dann gilt lim f (a) = ±∞ a→+∞ genau dann, wenn für alle Folgen (an ) in (c, +∞), die gegen +∞ streben, die Folge f (an ) gegen ±∞ strebt. Analog wird der uneigentliche Grenzwert von f für a gegen −∞ definiert. 124 4 Stetige Abbildungen zwischen metrischen Räumen Im Fall von reellen Funktionen f : A ⊂ R −→ R kann man einseitige Grenzwerte definieren. Definition 4.2. Sei f : A ⊂ R −→ R und x ∈ (α, β) ⊂ A. Man sagt, dass der linksseitige Grenzwert von f in x existiert und gleich y ∈ R ist, falls lim f (an ) = y für jede gegen x konvergente Folge (an ) in A n→∞ mit an < x. Wir bezeichnen den linksseitigen Grenzwert mit lim− f (a) = y. a→x Man sagt, dass der rechtsseitige Grenzwert von f in x existiert und gleich y ∈ R ist, falls lim f (an ) = y für jede gegen x konvergente Folgen (an ) in n→∞ A mit an > x. Wir bezeichnen den rechtsseitigen Grenzwert mit lim f (a) = y. a→x+ Satz 4.6 Sei f : (α, β) ⊂ R −→ R eine monoton wachsende Funktion. Dann existieren für jedes x ∈ (α, β) die einseitigen Grenzwerte und es gilt lim f (a) = sup{f (t) | α < t < x}, a→x− lim f (a) = inf{f (t) | x < t < β}. a→x+ Die analoge Aussage gilt für monoton fallende Funktionen. Beweis. Da f monoton wächst, ist die Menge {f (t) | α < t < x} von oben durch f (x) beschränkt. Folglich existiert das Supremum y := sup{f (t) | α < t < x} ≤ f (x). Nach Definition des Supremums gibt es zu jedem ε > 0 ein t∗ ∈ (α, x), so dass y − ε < f (t∗ ) ≤ y. Da f monoton wachsend ist, gilt desweiteren y − ε < f (t∗ ) ≤ f (t) ≤ y ∀ t ∈ (t∗ , x) (∗) Sei nun δ := x − t∗ . Dann folgt aus (∗), dass für alle |x − t| < δ mit t < x die Abschätzung |y − f (t)| < ε gilt. Somit ist lim− f (t) = y . t→x Analog beweist man limt→x+ f (t) = inf{f (t) | β > t > x}. Beispiel 1: Sei a > 1 gegeben. Dann gilt x lim a x→+∞ x = +∞. Beweis. Es ist ax = ex·ln(a) = 1 + x · ln(a) + x2 · ln2 (a) + ... . 2! Für a > 1 ist ln(a) > 0. Für x > 0 erhalten wir somit ⊓ ⊔ 4.1 Der Grenzwert einer Abbildung in einem Punkt ln2 (a) 1 ln2 (a) ax = + ln(a) +x · + |{z} ... ≥ · x. x 2! 2 |x {z } >0 125 >0 ax x→+∞ x Da offensichtlich lim x = +∞, folgt lim x→+∞ Beispiel 2: Es gilt lim x→0 ln(1+x) x ⊓ ⊔ = +∞. =1. Beweis. Für x > −1 gilt nach Übungsaufgabe 55 x ≤ ln(1 + x) ≤ x. 1+x Daraus folgt ln(1 + x) 1 ≤ ≤1 1+x x ln(1 + x) 1 ≥ ≥1 1+x x 1 x→0 1+x Da lim falls x > 0. falls − 1 < x < 0. = 1, folgt aus den Grenzwertsätzen lim x→0 Beispiel 3: Es gilt 1 lim (1 + x) x = e = 1. ⊓ ⊔ lim (1 + x1 )x = e . und x→0 ln(1+x) x x→+∞ Beweis. Nach Satz 3.18 gilt |ex − 1| ≤ |x| 1 − |x| ∀ |x| < 1. Folglich ist lim ean = 1 für jede Nullfolge (an ). Sei nun (xn ) eine beliebige n→∞ Nullfolge in R mit xn 6= 0 und zn := dass (zn ) eine Nullfolge ist. Also gilt ln(1+xn ) xn − 1 . Aus Beispiel 2 ergibt sich, 1 1 1 = lim ezn = lim eln (1+xn )· xn · e−1 = lim (1 + xn ) xn · e−1 n→∞ n→∞ n→∞ und somit 1 lim (1 + xn ) xn = e. n→∞ ⊓ ⊔ Beispiel 4: Es gilt x lim x→+∞ ln(x) = +∞ . ln(x) x Beweis. Wir wissen, dass ln(x) = eln(x) . Sei (xn ) eine gegen +∞ konvergente Folge. Dann gilt yn := ln(xn ) −→ +∞, da ln streng monoton wachsend und ln(xn ) ⊓ ⊔ bijektiv ist. Aus Beispiel 1 erhalten wir lim eln(xn ) = +∞. n→+∞ 126 4 Stetige Abbildungen zwischen metrischen Räumen 4.2 Stetige Abbildungen (Definition und Beispiele) Definition 4.3. Es seien (X, dX ) und (Y, dY ) metrische Räume und f : X −→ Y eine Abbildung. 1. f heißt stetig im Punkt x0 ∈ X, falls zu jedem ε > 0 ein δ > 0 existiert, so dass f (KX (x0 , δ)) ⊂ KY (f (x0 ), ε). (Die Größe von δ hängt von ε und von x0 ab). 2. f heißt folgenstetig im Punkt x0 ∈ X, falls für jede Folge (xn ) in X, die gegen x0 konvergiert, die Bildfolge (f (xn )) in Y gegen f (x0 ) konvergiert. 3. Die Abbildung f heißt stetig (folgenstetig), wenn sie in jedem Punkt x ∈ X stetig (folgenstetig) ist. Y f (x0 ) 6 graph(f ) 62ε ? • x0 X Satz 4.7 Sei f : X −→ Y eine Abbildung zwischen metrischen Räumen. Dann sind folgende Bedingungen äquivalent: 1. f : X −→ Y ist in x0 ∈ X stetig. 2. f : X −→ Y ist in x0 ∈ X folgenstetig. 3. x0 ist ein isolierter Punkt von X oder x0 ist ein Häufungspunkt von X und es gilt lim f (x) = f (x0 ). x→x0 Beweis. (1) =⇒ (2) : Sei f : X −→ Y stetig in x0 ∈ X und (xn ) eine (beliebige) gegen x0 konvergente Folge in X. Wir müssen zeigen, dass die Folge (f (xn )) gegen f (x0 ) konvergiert. Sei ε > 0. Nach Definition der Stetigkeit existiert ein δ > 0 , so dass f (KX (x0 , δ)) ⊂ KY (f (x0 ), ε). Da die Folge (xn ) gegen x0 konvergiert, existiert ein n0 ∈ N, so dass xn ∈ KX (x0 , δ) für alle n ≥ n0 . Folglich ist f (xn ) ∈ KY (f (x0 ), ε) für alle n ≥ n0 . 4.2 Stetige Abbildungen (Definition und Beispiele) 127 Also konvergiert (f (xn )) gegen f (x0 ). (2) =⇒ (3) : Jeder Punkt x0 ∈ X ist entweder isoliert oder ein Häufungspunkt von X. Ist der Punkt x0 ∈ HP (X), so existiert eine gegen x0 konvergente Folge (xn ) in X mit xn 6= x0 . Nach (2) konvergiert dann für jede dieser Folgen die Bildfolge (f (xn )) gegen f (x0 ), das heißt es gilt lim f (x) = f (x0 ). x→x0 (3) =⇒ (1) : Wenn x0 ein isolierter Punkt ist, so existiert ein δ > 0, so dass KX (x0 , δ) = {x0 }. Dann ist f (KX (x0 , δ)) = {f (x0 )} ⊂ KY (f (x0 ), ε) für alle ε > 0. Somit ist f in x0 stetig. Sei nun x0 ein Häufungspunkt von X und lim f (x) = f (x0 ). Nach Satz 4.1 x→x0 existiert für alle ε > 0 ein δ > 0, so dass f (KX (x0 , δ)) ⊂ KY (f (x0 ), ε). ⊓ ⊔ Folglich ist f in x0 stetig. Als nächstes betrachten wir spezielle Kriterien für die Stetigkeit reeller Funktionen f : A ⊂ R −→ R. Satz 4.8 Sei f : A ⊂ R −→ R eine reelle Funktion und x0 ∈ (α, β) ⊂ A. Dann ist f in x0 genau dann stetig, wenn die beiden einseitigen Grenzwerte existieren und lim f (x) = lim f (x) = f (x0 ). x→x0 − x→x0 + Beweis. (=⇒) folgt aus Satz 4.7 als Spezialfall. (⇐=) Wir setzen voraus, dass die beiden einseitigen Grenzwerte existieren und dass lim − f (x) = lim + f (x) = f (x0 ). x→x0 x→x0 Angenommen, f sei in x0 nicht stetig. Dann existiert ein ε0 > 0, so dass es zu jedem δ > 0 ein x ∈ A gibt mit der Eigenschaft, dass |x0 − x| < δ und |f (x0 ) − f (x)| ≥ ε0 . Wählen wir speziell δ = n1 , so erhalten wir eine Folge xn ∈ A mit |x0 − xn | < n1 und |f (x0 ) − f (xn )| ≥ ε0 . Insbesondere konvergiert die Folge (xn ) gegen x0 und es existiert eine Teilfolge (xnk ) von (xn ) mit xnk < x0 oder eine Teilfolge (xnk ) von (xn ) mit xnk > x0 , für die f (xnk ) nicht gegen f (x0 ) konvergiert. Betrachten wir diese Teilfolge, so erhalten wir einen Widerspruch zur Voraussetzung lim f (x) = lim f (x) = f (x0 ). ⊓ ⊔ x→x0 − x→x0 + Satz 4.8 zeigt, dass es genau drei verschiedene Typen von Unstetigkeitsstellen einer reellen Funktion gibt. f : A ⊂ R −→ R ist genau dann in x0 ∈ (α, β) ⊂ A unstetig, wenn einer der folgenden Fälle vorliegt: 128 4 Stetige Abbildungen zwischen metrischen Räumen (1) Hebbare Unstetigkeitsstelle Beide einseitigen Grenzwerte von f in x0 existieren und stimmen überein, sind aber ungleich f (x0 ). In diesem Fall kann man die Unstetigkeit von f in x0 durch Abänderung von f (x0 ) beheben. Beispiel: f (x) := ( R 0 1 x=0 x 6= 0 6 f )( - • Der Punkt x0 = 0 ist eine hebbare Unstetigkeitsstelle. R (2) Sprungstelle Die beiden einseitigen Grenzwerte von f in x0 existieren, sind aber voneinander verschieden. Unter dem Sprung σ(f, x0 ) von f in x0 verstehen wir die Differenz der einseitigen Grenzwerte σ(f, x0 ) := lim + f (x) − lim − f (x). x→x0 R Beispiel: f (x) := x→x0 ( x+ 0 x |x| x 6= 0 x=0 Dann ist der Punkt x0 = 0 eine Sprungstelle und der Sprung σ(f, x0 ) = 2. 6 f 1 ( • ) −1 R (3) Unstetigkeitsstelle 2. Art Mindestens einer der beiden einseitigen Grenzwerte von f in x0 existiert nicht in R. Wir betrachten z.B. die Dirichlet-Funktion ( 1 x∈Q h(x) := 0 x 6∈ Q Jeder Punkt x0 ∈ R ist eine Unstetigkeitsstelle zweiter Art von h. 4.2 Stetige Abbildungen (Definition und Beispiele) 129 Sei f (x) := ( 1 x 0 R x 6= 0 x=0 6 f Der Punkt x0 = 0 ist eine Unstetigkeitsstelle zweiter Art, denn lim+ f (x) = +∞ R x→0 und lim− f (x) = −∞. x→0 Satz 4.9 1. Eine monotone Funktion f : A ⊂ R −→ R ist in x0 ∈ (α, β) ⊂ A genau dann stetig, wenn lim f (x) = lim f (x). x→x0 + x→x0 − 2. Eine monotone Funtion f : (α, β) ⊂ R −→ R, −∞ < α < β < +∞, hat höchstens abzählbar viele Unstetigkeitsstellen. Jede Unstetigkeitsstelle ist eine Sprungstelle. 3. Sei A ⊂ R ein (verallgemeinertes) Intervall und f : A ⊂ R −→ R eine streng monotone Funktion. Dann ist f : A −→ f (A) bijektiv und die Umkehrabbildung f −1 : f (A) −→ A stetig. Beweis. Übungsaufgabe 60. ⊓ ⊔ Als nächstes stellen wir einige Eigenschaften stetiger Abbildungen zwischen metrischen Räumen zusammen, die sich unmittelbar aus der Definition der Stetigkeit, der Äquivalenz zur Folgenstetigkeit und den Rechenregeln für konvergente Folgen ergeben. Satz 4.10 Seien f : X −→ Y und g : Y −→ Z zwei Abbildungen zwischen metrischen Räumen, f in x0 ∈ X und g in f (x0 ) ∈ Y stetig. Dann ist g ◦ f in x0 stetig. Insbesondere ist die Verknüpfung stetiger Abbildungen ebenfalls stetig. Beweis. Sei (xn ) eine Folge in X, die gegen x0 konvergiert. Da f in x0 stetig und somit folgenstetig ist, konvergiert die Folge (f (xn )) in Y gegen f (x0 ). Wegen der Stetigkeit von g in f (x0 ) konvergiert dann die Folge (g(f (xn )) = (g ◦ f )(xn )) gegen g(f (x0 )) = (g ◦ f )(x0 ). Folglich ist g ◦ f in x0 folgenstetig und somit stetig. ⊓ ⊔ 130 4 Stetige Abbildungen zwischen metrischen Räumen Satz 4.11 Seien (X, dX ) und (Y, dY ) metrische Räume und A eine Teilmenge von X. Ist f : X −→ Y stetig, so ist auch die Einschränkung f|A : A −→ Y stetig bzgl. der auf A durch X induzierten Metrik dA := (dX )|A×A . Beweis. Sei (an ) eine Folge in A, die im metrischen Raum (A, dA ) gegen a ∈ A konvergiert. Dann konvergiert (an ) auch bzgl. der Metrik dX von X gegen a. Nach Voraussetzung konvergiert (f (an )) gegen f (a) in Y , also ist f|A in a folgenstetig und somit stetig. ⊓ ⊔ Satz 4.12 1. Sei f : X −→ Y1 × . . . × Yn eine Abbildung in das Produkt metrischer Räume und f = (f1 , . . . , fn ) die Komponentendarstellung von f . Die Abbildung f ist genau dann in x0 stetig, wenn jede Komponente fj : X −→ Yj in x0 stetig ist, j = 1, . . . , n. 2. Sei f : X1 × X2 −→ Y stetig in (x1 , x2 ) ∈ X1 × X2 . Dann ist h1 : X1 −→ Y x 7→ f (x, x2 ) h2 : X2 −→ Y in x1 stetig , in x2 stetig . x 7→ f (x1 , x) Satz 4.13 Sei X ein metrischer Raum und K der Körper der reellen oder der komplexen Zahlen, h·, ·i ein Skalarprodukt und k · k eine Norm auf Kn . 1. Seien f, g : X −→ Kn in x0 ∈ X stetig. Dann gilt (a) f + g : X −→ Kn ist in x0 stetig. (b) hf, gi : X −→ K ist in x0 stetig. (c) kf k : X −→ R ist in x0 stetig. 2. Seien f : X −→ Kn und h : X −→ K in x0 stetig. Dann ist auch h · f : X −→ Kn in x0 stetig. 3. Seien h, p : X −→ K in x0 stetig und sei p(x0 ) 6= 0. Dann ist auch die Abbildung hp : A = {x ∈ X | p(x) 6= 0} ⊂ X −→ K in x0 stetig. 4. Eine Abbildung f : X −→ C ist genau dann in x0 stetig, wenn sowohl der Realteil Re(f ) als auch der Imaginarteil Im(f ) in x0 stetig sind. f : X −→ C ist genau dann in x0 stetig, wenn die konjugiert-komplexe Abbildung f¯ : X −→ C in x0 stetig ist. 4.2 Stetige Abbildungen (Definition und Beispiele) 131 Wir betrachten nun einige Beispiele für stetige Abbildungen: Beispiel 1: Sei (X, d) ein metrischer Raum und x0 ∈ X. (a) Die identische Abbildung idX : X −→ X , idX (x) := x , ist stetig. (b) Die konstante Abbildung cx0 : X −→ X , cx0 (x) := x0 , ist stetig. P Beispiel 2: Sei P (z) = nk=0 ak z k ein Polynom mit komplexen Koeffizienten a0 , a1 , . . . , an . Dann ist die polynomiale Funktion P : C −→ C z 7→ P (z) = an z n + an−1 z n−1 + . . . + a1 z + a0 stetig. Beispiel 3: Seien P1 und P2 zwei Polynome mit komplexen Koeffizienten, d.h. P1 (z) = an z n + an−1 z n−1 + . . . + a1 z + a0 P2 (z) = bm z m + bm−1 z m−1 + . . . + b1 z + b0 wobei alle aj und bj komplexe Zahlen sind. Dann ist die rationale Funktion P1 : A := {z ∈ C | P2 (z) 6= 0} ⊂ C −→ C f := P 2 f (z) = an z n + an−1 z n−1 + . . . + a1 z + a0 bm z m + bm−1 z m−1 + . . . + b1 z + b0 auf A stetig. Beispiel 4: Die Abbildung ln : R+ −→ R ist stetig. Beweis. Dies folgt aus Satz 4.9, denn die Logarithmus-Funktion ist die Umkehrfunktion der bijektiven und monotonen Exponentialfunktion exp : R −→ R+ . ⊓ ⊔ Beispiel 5: Die Abbildung f : R+ × C −→ C (a, z) 7→ az ist stetig. Beweis. Sei (a0 , z0 ) ∈ R+ × C. Wir betrachten eine beliebige gegen (a0 , z0 ) konvergente Folge ((an , zn )). Dann gilt an −→ a0 und zn −→ z0 . Da nach Beispiel 4 der natürliche Logarithmus stetig ist, folgt 132 4 Stetige Abbildungen zwischen metrischen Räumen lim ln(an ) · zn = ln(a0 ) · z0 . n→∞ Aus Satz 3.18 erhalten wir dann für n hinreichend groß zn an − az00 = eln(an )·zn − eln(a0 )·z0 = eln(a0 )·z0 eln(an )·zn −ln(a0 )·z0 − 1 | ln(a ) · z − ln(a ) · z | n n 0 0 ≤ eln(a0 )·z0 1 − | ln(an ) · zn − ln(a0 ) · z0 | (∗) Die rechte Seite von (*) konvergiert bei n → +∞ gegen 0 und somit gilt lim aznn = az00 . Folglich ist f in (a0 , z0 ) folgenstetig, also stetig. ⊓ ⊔ n→∞ Beispiel 6: Seien a0 ∈ R+ und z0 ∈ C fixiert. Aus Satz 4.12 und Beispiel 5 folgt die Stetigkeit der Abbildungen expa0 : C −→ C z 7−→ az0 und pz0 : R+ −→ C a 7−→ az0 . Beispiel 7: Sei (X, d) ein metrischer Raum. Die Abstandsfunktion d : X × X −→ R (x, y) 7→ d(x, y) ist stetig. Beweis. Sei (x, y) ∈ X × X und ((xn , yn )) eine Folge, die in X × X gegen (x, y) konvergiert. In einem metrischen Raum gilt die Vierecksungleichung |d(xn , yn ) − d(x, y)| ≤ d(xn , x) + d(yn , y). Da xn −→ x und yn −→ y, folgt d(xn , x) −→ 0 und d(yn , y) −→ 0 und somit d(xn , yn ) −→ d(x, y). ⊓ ⊔ Beispiel 8: Sei V ein Vektorraum über dem Körper K der reellen oder der komplexen Zahlen. Dann ist jede Norm k · k : V −→ R und jedes Skalarprodukt h·, ·i : V × V −→ K stetig bezüglich der von der Norm bzw. vom Skalarprodukt induzierten Metrik. 4.2 Stetige Abbildungen (Definition und Beispiele) 133 Beweis. Dies folgt aus dem Verhalten des Skalarproduktes und der Norm bei konvergenten Folgen (Satz 2.18), welches die Folgenstetigkeit der beiden Abbildungen zeigt. ⊓ ⊔ Als nächstes definieren wir zwei Stetigkeitsbegriffe, die stärker als die gewöhnliche Stetigkeit sind. Definition 4.4. 1. Eine Abbildung f : X −→ Y heißt gleichmäßig stetig, wenn zu jedem ε > 0 ein δ > 0 existiert, so dass f (KX (x, δ)) ⊂ KY (f (x), ε) für alle x ∈ X. (Im Unterschied zur Definition der Stetigkeit hängt hier die Größe von δ nur von ε, aber nicht von x ab.) 2. Eine Abbildung f : X −→ Y heißt lipschitzstetig, wenn es eine positive Konstante L ∈ R+ gibt, so dass für alle x1 , x2 ∈ X gilt dY (f (x1 ), f (x2 )) ≤ L · dX (x1 , x2 ). L heißt Lipschitz–Konstante von f . Satz 4.14 Sei f : X −→ Y eine Abbildung zwischen metrischen Räumen. Dann gilt: 1. f ist lipschitzstetig =⇒ f ist gleichmäßig stetig. 2. f ist gleichmäßig stetig =⇒ f ist stetig. Beweis. Stetigkeit folgt per Definition aus gleichmäßiger Stetigkeit. Wir müssen also nur zeigen, dass jede lipschitzstetige Abbildung gleichmäßig stetig ist. Sei f lipschitzstetig mit Lipschitz–Konstante L und ε > 0. Wir setzen δ := Lε . Sei x0 ∈ X fixiert und x ∈ KX (x0 , δ), d.h. dX (x, x0 ) < δ = Lε . Aus der Lipschitzstetigkeit folgt dann dY (f (x), f (x0 )) ≤ L · dX (x, x0 ) < L · δ = ε, also f (x) ∈ KY (f (x0 ), ε). Somit ist f gleichmäßig stetig. ⊓ ⊔ Die folgenden beiden Beispiele zeigen, dass die Umkehrung der Aussagen des Satzes 4.14 nicht gilt. 134 4 Stetige Abbildungen zwischen metrischen Räumen Beispiel 1: Die Abbildung Y 6 .. + f : R −→ R 1 x 7−→ x ist stetig, aber nicht gleichmäßig stetig. .. ... Für ein fixes ε muß ... .. δ für x −→ 0 im.. ... mer kleiner gewählt .. ... ... werden. ... .. ... ε ⌢ ...... ⌣ ......... ......... ε⌢ ...................... ....................................... ........... ⌣ () ( δ ) X δ Beweis. Sei δ > 0 eine fixierte Zahl und x ∈ R+ . Dann gilt 1 δ 1 δ f (x + ) − f (x) = − = δ x + 2 2 x 2x(x + 2δ ) (∗) Die rechte Seite von (∗) konvergiert bei x −→ 0 gegen +∞. Man kann also für ein gegebenes ε > 0 kein δ > 0 finden, so dass die rechte Seite von (∗) für jedes x > 0 kleiner als ε bleibt. Folglich ist f nicht gleichmäßig stetig. ⊓ ⊔ Beispiel 2: Die Abbildung f : R+ −→ R+ √ x 7−→ x ist gleichmäßig stetig, aber nicht lipschitzstetig. Beweis. Es gilt p √ √ | x − y| ≤ |x − y| ∀ x, y ∈ R+ . (siehe √ Übungsaufgabe 10). Für ε > 0 setzen wir δ := ε2 . Ist |x − y| < δ, so √ folgt | x − y| ≤ ε. Somit ist f gleichmäßig stetig. Angenommen f wäre lipschitzstetig mit der Lipschitz-Konstanten L, das heißt √ √ ∀ x, y ∈ R+ . | x − y| ≤ L|x − y| Dann gilt √ √ x − y 1 x − y = √x + √y ≤ L Für hinreichend kleine x und y kann man aber Dies ergibt den Widerspruch. ∀ x, y ∈ R+ . √ 1√ x+ y beliebig groß machen. ⊓ ⊔ 4.3 Eigenschaften stetiger Abbildungen 135 4.3 Eigenschaften stetiger Abbildungen In einem metrischen Raum sind Teilmengen mit speziellen Eigenschaften ausgezeichnet, wie offene, abgeschlossene, kompakte oder zusammenhängende Teilmengen. Wir untersuchen in diesem Abschnitt, was mit diesen Eigenschaften bei stetigen Abbildungen passiert. Satz 4.15 Sei f : X −→ Y eine Abbildung zwischen metrischen Räumen. Dann sind folgende Bedingungen äquivalent: 1. f ist stetig. 2. Das Urbild jeder offenen Menge ist offen. 3. Das Urbild jeder abgeschlossenen Menge ist abgeschlossen. Beweis. (1. =⇒ 2.) Sei f : X −→ Y stetig und U ⊂ Y offen. Wir wollen zeigen, dass das Urbild f −1 (U ) := {x ∈ X | f (x) ∈ U } ⊂ X dann ebenfalls offen ist. Ist f −1 (U ) = ∅, so ist die Behauptung erfüllt. Sei also f −1 (U ) 6= ∅ und x0 ∈ f −1 (U ) ein beliebig gewählter Punkt. Dann gilt f (x0 ) ∈ U , und da U ⊂ Y offen ist, existiert ein ε > 0 mit KY (f (x0 ), ε) ⊂ U . Da f in x0 stetig ist, gibt es ein δ > 0, so dass f (KX (x0 , δ)) ⊂ KY (f (x0 ), ε) ⊂ U. Wir erhalten daraus durch Betrachten der Urbilder KX (x0 , δ) ⊂ f −1 f (KX (x0 , δ)) ⊂ f −1 (U ). Somit ist f −1 (U ) offen in X. (2. =⇒ 1.) Sei f −1 (U ) ⊂ X offen für jede offene Menge U ⊂ Y . Wir wählen einen beliebigen Punkt x0 ∈ X und ein beliebiges ε > 0. Da die Kugel KY (f (x0 ), ε) in Y offen ist, ist nach Voraussetzung auch das Urbild f −1 (KY (f (x0 ), ε)) in X offen. Es enthält den Punkt x0 . Folglich existiert ein δ > 0, so dass KX (x0 , δ) ⊂ f −1 (KY (f (x0 ), ε)). Wenden wir auf diese Inklusion f an, so erhalten wir f (KX (x0 , δ) ⊂ KY (f (x0 ), ε). Das bedeutet aber, dass f in x0 stetig ist. Da x0 ∈ X beliebig gewählt war, ist f stetig. (2. ⇐⇒ 3.) Um dies einzusehen, erinnern wir uns daran, dass die folgende Beziehung zwischen offenen und abgeschlossenen Mengen eines metrischen Raumes X gilt: B⊂X ist abgeschlossen ⇐⇒ X \ B ⊂ X Desweiteren gilt für das Urbild einer Komplementmenge ist offen . 136 4 Stetige Abbildungen zwischen metrischen Räumen f −1 (Y \ M ) = X \ f −1 (M ). Sei nun das Urbild f −1 (U ) jeder offenen Menge U ⊂ Y offen. Wir betrachten eine beliebige abgeschlossene Menge A ⊂ Y . Dann ist Y \ A offen in Y und folglich f −1 (Y \ A) = X \ f −1 (A) offen in X. Dies bedeutet, dass f −1 (A) abgeschlossen in X ist. Damit ist 2. =⇒ 3. bewiesen. Die Umkehrung zeigt man analog. ⊓ ⊔ Wir betrachten als nächstes das Verhalten von zusammenhängenden Mengen bei stetigen Abbildungen: Satz 4.16 Sei f : X −→ Y eine stetige Abbildung zwischen metrischen Räumen. Dann ist das Bild jeder zusammenhängenden Menge ebenfalls zusammenhängend. Beweis. Sei A ⊂ X eine zusammenhängende Menge. Wir wollen zeigen, dass dann auch das Bild f (A) ⊂ Y zusammenhängend ist. Angenommen f (A) ⊂ Y wäre nicht zusammenhängend. Dann existieren offene Mengen U, V ⊂ Y mit • • • U ∩ V = ∅, f (A) ⊂ U ∪ V , f (A) ∩ U 6= ∅ und f (A) ∩ V 6= ∅. • • • f −1 (U ) ∩ f −1 (V ) = f −1 (U ∩ V ) = f −1 (∅) = ∅, A ⊂ f −1 (f (A)) ⊂ f −1 (U ∪ V ) = f −1 (U ) ∪ f −1 (V ), A ∩ f −1 (U ) 6= ∅ und A ∩ f −1 (V ) 6= ∅ , da ein a ∈ A mit f (a) ∈ U und ein b ∈ A mit f (b) ∈ V existieren. Da f stetig ist, sind nach Satz 4.15 die Urbilder f −1 (U ) und f −1 (V ) ebenfalls offen. Desweiteren gilt für diese Urbilder Folglich ist A nicht zusammenhängend, was ein Widerspruch zur Voraussetzung ist. ⊓ ⊔ Als Anwendung erhalten wir für Abbildungen mit reellen Werten: Satz 4.17 (Zwischenwertsatz) Sei f : X −→ R eine stetige Abbildung von einem metrischen Raum X in die reellen Zahlen und sei A ⊂ X eine zusammenhängende Teilmenge. Seien desweiteren a, b ∈ f (A) Bildpunkte mit a < b. Dann gilt [a, b] ⊂ f (A). Insbesondere hat jede reellwertige Abildung, die auf A einen negativen und einen positiven Wert annimmt, auf A eine Nullstelle, d.h. es existiert ein x0 ∈ A mit f (x0 ) = 0. Beweis. Nach Satz 4.16 ist f (A) ⊂ R zusammenhängend und deshalb nach Satz 2.43 ein (verallgemeinertes) Intervall. Das heißt mit a, b ∈ f (A) und a < b ist auch [a, b] ⊂ f (A). ⊓ ⊔ 4.3 Eigenschaften stetiger Abbildungen 137 Wir definieren nun noch einen weiteren Zusammenhangsbegriff. Definition 4.5. Sei (X, d) ein metrischer Raum. Eine Teilmenge A ⊂ X heißt bogenzusammenhängend (oder wegezusammenhängend), falls zu je zwei Punkten a, b ∈ A eine stetige Abbildung ω : [0, 1] ⊂ R −→ A ⊂ X existiert, so dass ω(0) = a und ω(1) = b. Die Abbildung ω heißt Weg in A von a nach b. Beispiele: 1. Konvexe Mengen im Rn : Eine Teilmenge A ⊂ Rn heißt konvex, wenn mit je zwei Punkten x, y ∈ A auch die Verbindungsstrecke xy := {x+t(y−x) | t ∈ [0, 1]} vollständig in A liegt. Jede konvexe Menge ist bogenzusammenhängend, da die Abbildung ω : [0, 1] −→ A ω(t) := x + t(y − x) stetig ist und die Punkte x und y verbindet. Zum Beispiel ist jede Kugel K(x0 , r) konvex. 2. Sternförmige Mengen im Rn : Eine Teilmenge A ⊂ Rn heißt sternförmig, wenn ein Punkt x0 ∈ A existiert, so dass für jeden Punkt x ∈ A die Verbindungsstrecke x0 x vollständig in A liegt. Jede sternförmige Menge ist bogenzusammenhängend. Sind x, y ∈ A, so ist die Vereinigung der Strecken xx0 ∪ x0 y in A enthalten und man kann sie als Bild eines Weges von x nach y darstellen. 3. Jede bogenzusammenhängende Menge ist auch zusammenhängend (siehe Übungsaufgabe 67). Die Umkehrung gilt nicht. Z.B. ist die Menge Floh und Kamm aus der Übungsaufgabe 41 zusammenhängend, aber nicht bogenzusammenhängend. Es gilt jedoch, dass jede offene zusammenhängende Menge des Rn auch bogenzusammenhängend ist. Satz 4.18 Sei f : X −→ Y eine stetige Abbildung. Dann ist das Bild jeder bogenzusammenhängenden Teilmenge ebenfalls bogenzusammenhängend. Beweis. Sei A ⊂ X bogenzusammenhängend. Wir wollen zeigen, dass das Bild f (A) ebenfalls bogenzusammenhängend ist. Seien x, y ∈ f (A) zwei Punkte in f (A). Dann existieren a, b ∈ A mit x = f (a), y = f (b). Da A bogenzusammenhängend ist, gibt es einen (stetigen) Weg ω : [0, 1] −→ A von a nach b. Wir betrachten die Abbildung f ◦ ω : [0, 1] −→ f (A) ⊂ Y . Da f und ω stetig sind, ist f ◦ ω ebenfalls stetig. Weiterhin gilt (f ◦ ω)(0) = f (ω(0)) = f (a) = x und (f ◦ ω)(1) = f (ω(1)) = f (b) = y, d.h. f ◦ ω ist ein Weg in f (A) von x nach y. ⊓ ⊔ 138 4 Stetige Abbildungen zwischen metrischen Räumen Als nächstes beschäftigen wir uns mit dem Verhalten von kompakten Mengen bei stetigen Abbildungen: Satz 4.19 Sei f : X −→ Y eine stetige Abbildung. Dann ist das Bild jeder kompakten Menge ebenfalls kompakt. Beweis. Sei K ⊂ X eine kompakte Teilmenge. Wir wollen zeigen, dass dann auch das Bild f (K) ⊂ Y kompakt ist. Sei U = {Ui }i∈I eine beliebige offene Überdeckung von f (K), das heißt die Mengen Ui sind offen in Y und es gilt [ f (K) ⊂ Ui . i∈I Da f stetig ist, sind die Urbilder f −1 (Ui ) in X offen (siehe Satz 4.15). Außerdem gilt [ [ f −1 (Ui ). K ⊂ f −1 (f (K)) ⊂ f −1 Ui = i∈I i∈I Folglich ist die Mengenfamilie U ∗ := {f −1 (Ui )}i∈I eine offene Überdeckung von K. Da K ⊂ X kompakt ist, existiert eine endliche Teilüberdeckung von K aus U ∗ , das heißt es existieren i1 , . . . , in ∈ I, so dass K ⊂ f −1 (Ui1 ) ∪ . . . ∪ f −1 (Uin ). Durch Anwenden von f erhalten wir f (K) ⊂ f f −1 (Ui1 ) ∪ . . . ∪ f −1 (Uin ) ⊂ Ui1 ∪ . . . ∪ Uin . Somit ist {Ui1 , . . . , Uin } eine endliche Teilüberdeckung von f (K) aus U. Folglich ist f (K) kompakt. ⊓ ⊔ Die folgenden beiden Sätze sind Anwendungen der gerade bewiesenen Eigenschaft stetiger Abbildungen. Satz 4.20 (Satz von Weierstraß) Sei f : X −→ R eine stetige Abbildung von einem metrischen Raum X in die reellen Zahlen und sei K ⊂ X eine kompakte Teilmenge. Dann nimmt f auf K ein Maximum und ein Minimum an, d.h. es existieren Punkte a, b ∈ K mit f (a) = min{f (x) | x ∈ K} und f (b) = max{f (x) | x ∈ K} . Beweis. Sei K ⊂ X kompakt. Dann ist f (K) ⊂ R ebenfalls kompakt, und somit insbesondere beschränkt und abgeschlossen (Folgerung 2.4). Da f (K) ⊂ R beschränkt ist, existieren das Infimum S∗ := inf(f (K)) und das Supremum S ∗ := sup(f (K)). Da f (K) abgeschlossen ist, liegen sowohl das Supremum S ∗ als auch das Infimum S∗ in f (K). D.h. es existieren Punkte a, b ∈ K mit S∗ = f (a) = min{f (x) | x ∈ K} und S ∗ = f (b) = max{f (x) | x ∈ K} . ⊓ ⊔ 4.3 Eigenschaften stetiger Abbildungen 139 Satz 4.21 (Satz von Heine) Sei f : X −→ Y eine stetige Abbildung zwischen metrischen Räumen und K ⊂ X eine kompakte Teilmenge. Dann ist f auf K sogar gleichmäßig stetig. Beweis. Angenommen f|K : K −→ Y wäre nicht gleichmäßig stetig. Dann existiert ein ε0 > 0, so dass es für alle δ > 0 einen Punkt xδ ∈ K gibt mit f (KX (xδ , δ) ∩ K) 6⊂ KY (f (x), ε0 ) . Wir setzen δ = n1 . Dann erhalten wir für jedes n ∈ N zwei Punkte xn , x∗n ∈ K mit 1 dX (xn , x∗n ) < und dY (f (xn ), f (x∗n )) ≥ ε0 . n Betrachten wir nun die Folgen (xn ) und (x∗n ) in K genauer. Da K kompakt, also nach Satz 2.40 folgenkompakt ist, existiert eine Teilfolge (xnk ) von (xn ), die gegen einen Punkt x0 ∈ K konvergiert. Wir zeigen, dass die Teilfolge (x∗nk ) von (x∗n ) ebenfalls gegen x0 konvergiert. Es gilt d(x0 , x∗nk ) ≤ d(x0 , xnk ) + d(xnk , x∗nk ) . | {z } | {z } →0 < n1 k Daher gilt x∗nk −→ x0 ∈ K. Da f stetig, also auch folgenstetig ist, konvergieren dann die Bildfolgen f (xnk ) und f (x∗nk ) für k gegen +∞ gegen f (x0 ). Somit ist 0 < ε0 ≤ d(f (xnk ), f (x∗nk )) ≤ d(f (xnk ), f (x0 )) + d(f (x0 ), f (x∗nk )) . {z } | | {z } →0 Dies ist aber ein Widerspruch. →0 ⊓ ⊔ Wir wenden uns jetzt der folgenden Frage zu: Sei f : X −→ Y eine bijektive stetige Abbildung zwischen metrischen Räumen. Dann existiert die Umkehrabbildung (inverse Abbildung) f −1 : Y −→ X. Ist f −1 dann auch stetig? Im Allgemeinen gilt das nicht. Beispiel: Sei X = (0, 1) ∪ {2} ⊂ R und Y = (0, 1] ⊂ R. Wir betrachten die Abbildung f : X −→ Y gegeben durch t falls t ∈ (0, 1) f (t) := 1 falls t = 2. f ist stetig und bijektiv, da f|(0,1) = id(0,1) und 2 ∈ X ein isolierter Punkt ist. Aber f −1 : (0, 1] −→ (0, 1) ∪ {2} ist nicht stetig, da (0, 1] zusammenhängend, aber f −1 ((0, 1]) = (0, 1) ∪ {2} nicht zusammenhängend ist. 140 4 Stetige Abbildungen zwischen metrischen Räumen Definition 4.6. Seien X und Y metrische Räume. Eine Abbildung f : X −→ Y heißt Homöomorphismus, wenn f bijektiv ist und f und f −1 stetig sind. Die metrischen Räume X und Y heißen homöomorph, falls es einen Homöomorphismus f : X −→ Y gibt. Bezeichnung: X ≃ Y . Da die Verknüpfung stetiger Abbildungen stetig ist, folgt aus X ≃ Y und Y ≃ Z, dass X ≃ Z gilt. Die Homöomorphie ist also eine Äquivalenzrelation auf der Menge der metrischen Räume. Beispiel : Der Rn ist homöomorph zur Kugel K(x0 , r) um einen Punkt x0 ∈ Rn vom Radius r. Die folgende Abbildung ist ein Homöomorphismus: f : K(x0 , r) −→ x 7−→ Rn x−x0 r−kx−x0 k2 Dabei bezeichnet k · k2 die Euklidische Norm auf Rn . (Übungsaufgabe 68). Alle topologischen Eigenschaften von Teilmengen bleiben bei Homöomorphismen erhalten: Satz 4.22 Sei f : X −→ Y ein Homöomorphismus zwischen metrischen Räumen. Dann gilt: 1. A ⊂ X ist offen (abgeschlossen, kompakt, zusammenhängend bzw. bogenzusammenhängend) genau dann wenn f (A) ⊂ Y offen (abgeschlossen, kompakt, zusammenhängend bzw. bogenzusammenhängend) ist. 2. Eine Folge (xn ) konvergiert in X gegen x0 genau dann, wenn die Bildfolge (f (xn )) in Y gegen f (x0 ) konvergiert. Beweis. Dies folgt aus den vorherigen Sätzen über das Verhalten von offenen, abgeschlossenen, kompakten, zusammenhängenden bzw. bogenzusammenhängenden Mengen bei stetigen Abbildungen und aus der Äquivalenz von Stetigkeit und Folgenstetigkeit. ⊓ ⊔ Will man nachweisen, dass eine bijektive stetige Abbildung ein Homöomorphismus ist, so muß man die Stetigkeit der inversen Abbildung nachweisen. Ist der Urbildraum kompakt, so kann man sich diesen Nachweis sparen, denn es gilt der folgende Satz: Satz 4.23 (Satz über die Stetigkeit der inversen Abbildung) Sei f : X −→ Y eine bijektive stetige Abbildung und X ein kompakter metrischer Raum. Dann ist die inverse Abbildung f −1 : Y −→ X stetig. 4.3 Eigenschaften stetiger Abbildungen 141 Beweis. Sei U ⊂ X offen. Wir zeigen, dass (f −1 )−1 (U ) = f (U ) ⊂ Y offen ist. Da U ⊂ X offen ist, ist X\U ⊂ X abgeschlossen. Wir wissen aus Folgerung 2.4, dass jede abgeschlossene Teilmenge einer kompakten Menge selbst kompakt ist. Nach Vorrausetzung ist X kompakt, folglich ist X \ U kompakt. Wegen der Stetigkeit von f ist dann nach Satz 4.19 auch das Bild f (X \ U ) in Y kompakt und insbesondere abgeschlossen (Folgerung 2.4). Nun ist f bijektiv und folglich f (X\U ) = Y \f (U ). Also ist die Teilmenge f (U ) ⊂ Y offen. Nach Satz 4.15 ist die Abbildung f −1 deshalb stetig. ⊓ ⊔ Definition 4.7. Sei X ein metrischer Raum. Eine Abbildung f : X −→ X heißt kontrahierende Abbildung (oder Kontraktion), wenn sie lipschitzstetig mit einer Lipschitzkonstanten 0 < L < 1 ist, das heißt wenn d(f (x), f (y)) ≤ L · d(x, y) für alle x, y ∈ X. Für kontrahierende Abbildungen in vollständigen metrischen Räumen gilt der folgende sehr nützliche Fixpunktsatz. Satz 4.24 (Banach’scher Fixpunktsatz) Sei (X, d) ein vollständiger metrischer Raum und f : X −→ X eine kontrahierende Abbildung. Dann existiert genau ein Fixpunkt von f , d.h. genau ein Punkt x∗ ∈ X mit f (x∗ ) = x∗ . Sei x0 ∈ X ein beliebiger Punkt und xn := f ◦ . . . ◦ f (x0 ) =: f n (x0 ). Dann | {z } konvergiert die Folge (xn ) gegen x∗ . n−mal Beweis. (1) Eindeutigkeit des Fixpunktes: Angenommen es existieren zwei Fixpunkte x∗ und y ∗ von f , dh. es gelte f (x∗ ) = x∗ und f (y ∗ ) = y ∗ . Aus der Kontraktivität von f erhält man d(x∗ , y ∗ ) = d(f (x∗ ), f (y ∗ )) ≤ L · d(x∗ , y ∗ ). Da aber 0 < L < 1 gilt, folgt d(x∗ , y ∗ ) = 0, also x∗ = y ∗ . (2) Existenz des Fixpunktes: Sei x0 ∈ X ein beliebig gewählter Punkt. Wir definieren eine Folge von Punkten in X durch x1 := f (x0 ), x2 := f (x1 ) = f 2 (x0 ), .. . xn := f (xn−1 ) = f 2 (xn−2 ) = . . . = f n (x0 ). Dann gilt 142 4 Stetige Abbildungen zwischen metrischen Räumen d(xn+1 , xn ) = d(f (xn ), f (xn−1 )) ≤ L · d(xn , xn−1 ) = L · d(f (xn−1 ), f (xn−2 )) ≤ L2 · d(xn−1 , xn−2 ) = L2 · d(f (xn−2 ), f (xn−3 )) .. . ≤ Ln · d(x1 , x0 ). Für n > m folgt mit der Dreiecksungleichung und der Formel für die geometrische Summe d(xn , xm ) ≤ d(xn , xn−1 ) + d(xn−1 , xn−2 ) + . . . + d(xm+1 , xm ) ≤ (Ln−1 + . . . + Lm ) · d(x0 , x1 ) = Lm (L0 + L1 + . . . + Ln−1−m ) · d(x0 , x1 ) 1 − Ln−m · d(x0 , x1 ) = Lm · 1−L Lm − Ln = · d(x0 , x1 ) 1−L m L · d(x0 , x1 ). < 1−L Da 0 < L < 1, ist (Lm ) eine Nullfolge. Somit ist (xn ) eine Cauchyfolge in X. Da der metrische Raum X vollständig ist, konvergiert diese Cauchyfolge gegen einen Punkt x∗ ∈ X. Wir zeigen nun, dass dieser Grenzwert x∗ der gesuchte Fixpunkt von f ist. Dazu betrachten wir d(f (x∗ ), x∗ ) ≤ d(f (x∗ ), xn ) + d(xn , x∗ ) = d(f (x∗ ), f (xn−1 )) + d(xn , x∗ ) ≤ L d(x∗ , xn−1 ) + d(xn , x∗ ) . | {z } | {z } →0 Daraus folgt d(f (x∗ ), x∗ ) = 0, also f (x∗ ) = x∗ . →0 ⊓ ⊔ 4.4 Folgen stetiger Abbildungen In diesem Abschnitt bezeichnen X und Y wiederum metrische Räume mit den Metriken dX bzw. dY . Wir betrachten jetzt Folgen von stetigen Abbildungen fn : X −→ Y , n = 1, 2, 3, . . ., und untersuchen, unter welchen Bedingungen deren Grenzfunktion ebenfalls stetig ist. 4.4 Folgen stetiger Abbildungen 143 Definition 4.8. Die Folge der Abbildungen (fn ) heißt punktweise konvergent, falls für jedes x ∈ X die Folge (fn (x)) in Y konvergiert. Die durch f (x) := lim fn (x) n→∞ definierte Funktion f : X −→ Y heißt Grenzfunktion von (fn ). Schreibweise: fn −→ f . Im allgemeinen ist die Grenzfunktion einer punktweise konvergenten Folge stetiger Abbildungen nicht notwendiger Weise stetig. Wir betrachten dazu das folgende Beispiel: R 6 Seien X = [0, 1], Y = R und fn : [0, 1] −→ R die stetigen Funktionen fn (x) := xn . Dann ist die Grenzfunktion . 1 .... ........ . . . . f2 . .. 0 falls 0 ≤ x < 1 ... ...... f (x) := lim fn (x) = .......... f3 . f . . 1 1 falls x = 1 n→∞ .. .. .. .... ........ f4 . . . . .... .... ... ..................... . offensichtlich nicht stetig. . . . .... .... ... ..... .......... .......... ...................... ................................... ) 1 R Wir benötigen für die Stetigkeit der Grenzfunktion f eine stärkere Konvergenzeigenschaft der Folge (fn ). Definition 4.9. Die Folge der Abbildungen (fn ) konvergiert gleichmäßig gegen eine Grenzfunktion f : X −→ Y , falls zu jedem ε > 0 ein n0 ∈ N existiert, so dass dY (fn (x), f (x)) < ε für alle n ≥ n0 und für alle x ∈ X. Schreibweise: fn ⇉ f . Bei gleichmäßiger Konvergenz, konvergiert die Folge (fn (x)) für jeden Punkt x ∈ X mit der “gleichen Geschwindigkeit“ gegen f (x). Aus gleichmäßiger Konvergenz folgt offensichtlich die Konvergenz der Folge (fn ). Satz 4.25 Seien fn : X −→ Y stetige Abbildungen, n = 1, 2, 3, . . . , und die Folge (fn ) gleichmäßig gegen f : X −→ Y konvergent. Dann ist die Grenzfunktion f stetig. Beweis. Sei x0 ∈ X beliebig fixiert. Wir zeigen, dass f in x0 stetig ist. Sei ε > 0. Da (fn ) gleichmäßig gegen f konvergiert, existiert ein n0 ∈ N mit dY (fn (x), f (x)) < ε 3 ∀ n ≥ n0 , ∀ x ∈ X. 144 4 Stetige Abbildungen zwischen metrischen Räumen Die Abbildung fn0 ist in x0 stetig, folglich gibt es ein δ > 0, so dass ε fn0 (KX (x0 , δ)) ⊂ KY (fn0 (x0 ), ). 3 Für x ∈ KX (x0 , δ) erhalten wir damit dY (f (x), f (x0 )) ≤ dY (f (x), fn0 (x)) + dY (fn0 (x), fn0 (x0 )) + dY (fn0 (x0 ), f (x0 )) ε ε ε ≤ + + = ε. 3 3 3 Somit ist f (KX (x0 , δ)) ⊂ KY (f (x0 ), ε), also f in x0 ∈ X stetig. ⊓ ⊔ Satz 4.26 (Vertauschbarkeit von Grenzwerten) Seien fn : X −→ Y , n = 1, 2, 3, . . ., stetige Abbildungen und sei die Folge (fn ) gleichmäßig konvergent. Dann gilt in jedem Häufungspunkt x0 ∈ X lim ( lim fn (x)) = lim ( lim fn (x)). x→x0 n→∞ n→∞ x→x0 Beweis. Sei f die Grenzfunktion der Folge (fn ), d.h. f (x) = lim fn (x). Nach n→∞ Satz 4.25 ist f in x0 stetig. Folglich existiert der Grenzwert f (x0 ) = lim f (x) = lim lim fn (x). x→x0 x→x0 n→∞ Da die Abbildungen fn in x0 stetig sind, gilt andererseits f (x0 ) = lim fn (x0 ) = lim lim fn (x). n→∞ n→∞ x→x0 ⊓ ⊔ Für spezielle Funktionenfolgen impliziert die punktweise Konvergenz bereits die gleichmäßige Konvergenz. Wir wollen jetzt einen solchen Fall betrachten. Definition 4.10. Eine Folge von Funktionen fn : X → R, n = 1, 2, . . ., heißt • • monoton wachsend, falls fn (x) ≤ fn+1 (x) ∀ x ∈ X , ∀ n ∈ N und monoton fallend, falls fn (x) ≥ fn+1 (x) ∀ x ∈ X , ∀ n ∈ N. Satz 4.27 (Satz von Dini) Sei fn : X −→ R, n = 1, 2, 3, . . ., eine monotone Folge stetiger Funktionen, die punktweise gegen eine stetige Grenzfunktion f : X −→ Y konvergiert, und sei X kompakt. Dann konvergiert (fn ) sogar gleichmäßig gegen f . 4.5 Funktionenreihen 145 Beweis. Wir nehmen OBdA an, dass die Funktionenfolge (fn ) monoton wachsend ist. Dann gilt f (x) ≥ fn (x) für alle x ∈ X und alle n ∈ N. Sei ε > 0. Da (fn ) gegen f konvergiert, existiert zu jedem Punkt x ∈ X ein Index n0 (x, ε) ∈ N so dass 0 ≤ f (x) − fn (x) < ε für alle n ≥ n0 (x, ε). Da fn und f stetig sind, ist die Abbildung F := f − fn0 (x,ε) : X −→ R in x ∈ X stetig. Folglich gibt es ein δx > 0 mit 0 ≤ F (y) = f (y) − fn0 (x,ε) (y) < ε ∀ y ∈ KX (x, δx ). Aus der Monotonie der Funktionenfolge (fn ) folgt dann 0 < f (y) − fn (y) < ε ∀ n ≥ n0 (x, ε) , ∀ y ∈ KX (x, δx ). Wir betrachten nun die folgende offene Überdeckung von X U := {KX (x, δx ) | x ∈ X}. Da X kompakt ist, gibt es eine endliche Teilüberdeckung, d.h. es existieren endlich viele Punkte x1 , x2 , . . . , xp ∈ X mit X = KX (x1 , δ1 ) ∪ KX (x2 , δ2 ) ∪ . . . ∪ KX (xp , δp ). Wir setzen m0 := max{n0 (xj , ε) | j = 1, 2, . . . , p}. Sei nun z ∈ X. Dann ist z ∈ KX (xj , δxj ) für ein j ∈ {1, 2, . . . , p} und folglich 0 < f (z) − fn (z) < ε ∀ n ≥ m0 . Dies bedeutet, dass die Funktionenfolge (fn ) gleichmäßig gegen f konvergiert. ⊓ ⊔ 4.5 Funktionenreihen In diesem Abschnitt wenden wir die im vorigen Abschnitt über Funktionenfolgen erhaltenen Resultate auf Funktionenreihen an. Insbesondere wollen wir weitere Aussagen über Potenzreihen machen. Im folgenden bezeichnet (X, d) einen beliebigen metrischen Raum und (E, k·k) einen Banachraum. Da E ein Vektorraum ist, können wir zwei Abbildungen h, f : X −→ E addieren. Die Abbildung f + h : X −→ E ist gegeben durch (f + h)(x) := f (x) + h(x) ∀ x ∈ X. Seien fn : X −→ E Abbildungen von X nach E, n = 0, 1, 2, . . .. Wir bilden aus der Folge (fn ) eine neue Funktionenfolge durch 146 4 Stetige Abbildungen zwischen metrischen Räumen s0 := f0 s1 := f0 + f1 s2 := f0 + f1 + f2 .. . sm := f0 + f1 + f2 + · · · + fm Definition 4.11. Die Folge sm := m P fn n=0 heißt Funktionenreihe mit den Gliedern fn . Wir bezeichnen sie symbolisch mit Die Funktionenreihe ∞ P ∞ P fn . n=0 fn heißt punktweise konvergent, falls die Funktionen- n=0 folge (sm ) punktweise konvergiert. ∞ P Die Funktionenreihe fn heißt gleichmäßig konvergent, falls die Funktion=0 nenfolge (sm ) gleichmäßig konvergiert. Aus den Sätzen 4.25 und 4.26 erhält man dann sofort Satz 4.28 Sind fn : X −→ E stetige Abbildungen, n = 0, 1, 2, . . ., und kon∞ P vergiert die Funktionenreihe fn gleichmäßig, so ist die durch n=0 f (x) := ∞ X fn (x) n=0 ∀x∈X definierte Grenzfunktion f : X −→ E stetig. Insbesondere gilt für jeden Häufungspunkt x0 ∈ X lim x→x0 ∞ X n=0 fn (x) = ∞ X n=0 lim fn (x). x→x0 ⊓ ⊔ Als nächstes beweisen wir ein Kriterium für die gleichmäßige Konvergenz von Funktionenreihen. 4.5 Funktionenreihen 147 Satz 4.29 (Weierstraßsches Majorantenkriterium) Seien fn : X −→ E beschränkte Abbildungen, n = 0, 1, 2, . . ., d.h. sei kfn (x)k ≤ Mn und sei die Reihe der Schranken tionenreihe ∞ P ∞ P ∀ n ∈ N0 und ∀ x ∈ X , Mn in R konvergent. Dann ist die Funk- n=0 fn gleichmäßig konvergent und die durch f (x) := n=0 ∞ P fn (x) n=0 definierte Grenzfunktion f : X −→ E stetig. ∞ P Beweis. Sei ε > 0. Da die Reihe Mn konvergiert, gibt es nach dem n=0 Cauchy–Kriterium (Satz 3.1) ein n0 ∈ N0 , so dass Mm+1 + Mm+2 + · · · + Mn < ε für alle n > m ≥ n0 . Nach Voraussetzung gilt für alle x ∈ X ksn (x) − sm (x)k = kfn (x) + . . . + fm+1 (x)k ≤ kfn (x)k + . . . kfm+1 (x)k ≤ Mn + . . . + Mm+1 . Wir erhalten daraus für jedes x ∈ X ksn (x) − sm (x)k < ε ∀ n > m ≥ n0 . (∗) Also ist die Folge (sn (x)) für jedes x ∈ X eine Cauchy–Folge im Banachraum E. Da E vollständig ist, konvergiert die Folge (sn (x)). Sei s(x) := lim sn (x) . n→∞ ∞ P Die Funktionenreihe fn konvergiert somit punktweise gegen die Grenzn=0 funktion s : X −→ E. Gehen wir in (∗) mit n gegen ∞, so folgt wegen der Stetigkeit der Norm lim ksn (x) − sm (x)k = ks(x) − sm (x)k < ε n→∞ Somit konvergiert die Funktionenreihe ∞ P ∀x ∈ X ∀ m > n0 fn sogar gleichmäßig gegen s. Die n=0 Stetigkeit der Grenzfunktion folgt aus dem vorigen Satz. ⊓ ⊔ Wir wenden diese Sätze nun auf komplexe Potenzreihen an. Sei (an ) eine Folge komplexer Zahlen, z0 ∈ C und P (z) := ∞ X n=0 an (z − z0 )n , z ∈ C, die Potenzreihe mit den Koeffizienten an und dem Zentrum z0 . R := sup{|z − z0 | | P (z) konvergiert} bezeichne den Konvergenzradius der Potenzreihe P . Aus Kapitel 3.2 wissen wir bereits, dass 148 1. 4 Stetige Abbildungen zwischen metrischen Räumen R= lim sup 1 n→∞ √ n 1 a lim | n+1 an | |an | n→∞ falls diese Werte in [0, +∞) ∪ {+∞} existieren (siehe Sätze 3.16 und 3.17). 2. 3. P (z) konvergiert absolut für alle z ∈ K(z0 , R). P (z) divergiert für z ∈ C \ cl(K(z0 , R)). Wir beweisen nun, dass die durch die Potenzreihe P auf dem Konvergenzkreis definierte Funktion stetig ist. Satz 4.30 Sei P (z) := ∞ P n=0 an (z − z0 )n eine Potenzreihe mit dem Konver- genzradius R. Dann gilt ∞ P 1. P (z) = an (z − z0 )n konvergiert gleichmäßig auf jeder kompakten n=0 Teilmenge K ⊂ K(z0 , R). 2. Die Abbildung P : z ∈ K(z0 , R) 7−→ P (z) ∈ C ist stetig. Beweis. (1) Sei K ⊂ K(z0 , R) kompakt. Dann ist K abgeschlossen. Folglich ist η(K) := sup{|z − z0 | | z ∈ K} < R. Wir betrachten ein z1 ∈ K(z0 , R) mit η(K) < |z1 − z0 | < R. Da die Reihe ∞ P P (z1 ) = an (z1 − z0 )n konvergiert, sind ihre Reihenglieder eine Nullfolge, n=0 also insbesondere beschränkt. Somit existiert eine Zahl M > 0 , so dass |an (z1 − z0 )n | < M für alle n ∈ N0 . Wir erhalten daraus n (z − z0 )n η(K) n n ≤M· |an (z − z0 ) | = an (z1 − z0 ) · ∀ z ∈ K. (z1 − z0 )n |z1 − z0 | | {z } =:Mn Nach Wahl von z1 ist η(K) |z1 −z0 | < 1 . Folglich ist die geometrische Reihe ∞ P Mn n=0 konvergent. Nach Satz 4.29 konvergiert dann P (z) gleichmäßig auf K. (2) Sei z ∈ K(z0 , R) gegeben. Wir wählen ein ε(z) > 0, so dass cl(K(z, ε(z))) ⊂ K(z0 , R). Da die Menge cl(K(z, ε(z))) sowohl abgeschlossen als auch beschränkt ist, ist sie kompakt. Folglich konvergiert die Funktionenreihe P (z) auf cl(K(z, ε(z))) gleichmäßig und die Grenzfunktion P|cl(K(z,ε(z))) : cl(K(z, ε(z)) −→ C ist 4.5 Funktionenreihen 149 stetig. Da dies für alle z ∈ K(z0 , R) gilt, ist P auf dem gesamten Konvergenzkreis K(z0 , R) stetig. ⊓ ⊔ Wir betrachten nun eine spezielle Sorte von Potenzreihen P (z). Es sei P (z) = ∞ X n=0 an (z − x0 )n eine Potenzreihe mit reellem Zentrum x0 und endlichem Konvergenzradius 0 < R < +∞. Dann definiert P eine stetige Funktion P : (x0 − R, x0 + R) −→ C . x 7−→ P (x) In den Randpunkten des Definitionsintervalls gilt der Satz 4.31 (Abelscher Grenzwertsatz) ∞ P Sei P (z) = an (z − x0 )n eine Potenzreihe mit reellem Zentrum x0 ∈ R und n=0 Konvergenzradius 0 < R < ∞. 1. Ist P (x0 + R) konvergent, so ist P|(x0 −R,x0 +R] in x0 + R linksseitig stetig, ∞ P d.h. es gilt lim − P (x) = P (x0 + R) = an R n . x→(x0 +R) n=0 2. Ist P (x0 − R) konvergent, so ist P|[x0 −R,x0 +R) in x0 − R rechtsseitig stetig, ∞ P d.h. es gilt lim + P (x) = P (x0 − R) = (−1)n an Rn . x→(x0 −R) n=0 Beweis. Wir beweisen die erste Behauptung. Der Beweis der zweiten Behauptung erfolgt analog. Nach Voraussetzung konvergiert die Folge der Partialsumm P men sm = an Rn gegen s = P (x0 + R). Wir müssen zeigen, dass für jedes n=0 ε > 0 ein δ > 0 existiert, so dass |P (x) − s| < ε für alle x ∈ (x0 − R, x0 + R) mit x0 + R − x < δ . Wir setzen y := x − x0 . Aus den Eigenschaften der geometrischen Reihe und dem Cauchy–Produkt von Reihen folgt für alle y mit |y| < R 150 4 Stetige Abbildungen zwischen metrischen Räumen P (y + x0 ) = ∞ X an y n n=0 ∞ y −1 X y 1− · an y n = 1− R R n=0 ∞ ∞ y X y n X · an y n · = 1− R n=0 R n=0 | {z } | {z } abs. konv. abs. konv. m ∞ o y X n X y k am−k y m−k = 1− R m=0 R k=0 ∞ y X y m · sm . = 1− R m=0 R Außerdem gilt ∞ y y −1 y X y m s= 1− 1− ·s= 1− . s· R R R m=0 R Folglich ist für |y| < R ∞ y m yX . P (y + x0 ) − s = 1 − (sm − s) R m=0 R Sei nun ε > 0 gegeben. Da sm gegen s konvergiert, existiert ein n0 ∈ N mit ε ∀ m ≥ n0 . |sm − s| < 2 Wir setzen M := nP 0 −1 m=0 R − y < δ gilt |sm − s| und δ := min{R, ε·R 2M } . Für |y| < R mit 0<1− δ y < . R R Daraus folgt y · |P (y + x0 ) − s| ≤ 1 − R nX 0 −1 m=0 |sm − s| · y m R + ∞ X m=n0 |sm − s| · n0 −1 ∞ δ X y ε X y m · · |sm − s| + 1 − R m=0 R 2 m=n R 0 | {z } abs. konv. ε δ ·M + ≤ R 2 ε ε ≤ + = ε. 2 2 < y m R ! 4.5 Funktionenreihen Somit ist die Funktion P im Punkt x0 + R linksseitig stetig. 151 ⊓ ⊔ Als Anwendung der Stetigkeit der Grenzfunktion von Potenzreihen beweisen wir abschließend den folgenden Identitätssatz. Satz 4.32 (Identitätssatz für Potenzreihen) ∞ ∞ P P Seien P (z) = an (z − z0 )n und Q(z) = bn (z − z0 )n zwei Potenzreihen n=0 n=0 mit dem Zentrum z0 ∈ C und den Konvergenzradien RP > 0 bzw. RQ > 0. Es bezeichne R = min{RP , RQ }. ∗ Existiert eine Folge komplexer Zahlen zm ∈ K(z0 , R)\{z0}, m ∈ N , mit ∗ ∗ 1. P (zm ) = Q(zm ) für alle m ∈ N und ∗ 2. lim zm = z0 , m→∞ so gilt an = bn für alle n ∈ N0 , das heißt die Potenzreihen P und Q sind identisch. Insbesondere sind P und Q identisch, wenn sie auf einer (beliebig kleinen) offenen Umgebung des Zentrums z0 übereinstimmen. ∗ Beweis. Sei (zm ) eine Folge in K(z0 , R) \ {z0 } , die gegen z0 konvergiert und ∗ ∗ für die P (zm ) = Q(zm ) gilt. Wir beweisen an = bn durch Induktion über den Index n. ∗ gegen z0 konvergiert Ind.–Anfang: Es ist zu zeigen, dass a0 = b0 gilt. Da zm und P und Q auf K(z0 , R) stetig sind, folgt ∗ ∗ a0 = P (z0 ) = lim P (zm ) = lim Q(zm ) = Q(z0 ) = b0 . m→∞ m→∞ Ind.–Schritt : Es gelte a0 = b0 , a1 = b1 , . . . , an = bn . Es ist zu zeigen, dass an+1 = bn+1 gilt. Dazu betrachten wir die Potenzreihen P1 (z) = Q1 (z) = ∞ X k=n+1 ∞ X k=n+1 ak (z − z0 )k−(n+1) , bk (z − z0 )k−(n+1) . Die Potenzreihen P1 und Q1 konvergieren auf K(z0 , R), denn für z 6= z0 gilt P1 (z) = Q1 (z) = P (z) − n P k=0 ak (z − z0 )k (z − z0 )n+1 n P Q(z) − bk (z − z0 )k k=0 (z − z0 )n+1 , . 152 4 Stetige Abbildungen zwischen metrischen Räumen ∗ ∗ Nach Induktionsvoraussetzung gilt Q1 (zm ) = P1 (zm ) für alle m ∈ N . Da Q1 und P1 auf K(z0 , R) stetig sind, folgt ∗ ∗ an+1 = P1 (z0 ) = lim P1 (zm ) = lim Q1 (zm ) = Q1 (z0 ) = bn+1 . m→∞ m→∞ ⊓ ⊔ 4.6 Die trigonometrischen und die Hyperbelfunktionen Wir betrachten zunächst nochmal die Exponentialfunktion. Wie wir wissen, ∞ P zn konvergiert die Potenzreihe ez = n! für jedes z ∈ C und erfüllt n=0 ez+w = ez · ew . (∗) Die Konvergenz der Exponentialreihe ist gleichmäßig auf jedem kompakten Bereich in C. Folglich ist die Exponentialfunktion exp : z ∈ C 7−→ ez ∈ C ∞ P stetig und man kann lim mit vertauschen. Wir erhalten insbesondere z→z0 lim z→0 n=0 ∞ ∞ X X z n−1 z n−1 ez − 1 = lim = lim = 1. z→0 z→0 z n! n! n=1 n=1 (∗∗) Wir werden nun sehen, dass die Exponentialfunktion exp : C → C die einzige Funktion mit den Eigenschaften (∗) und (∗∗) ist. Wir beweisen dazu zunächst folgendes Lemma Lemma 4.12. Sei (zn ) eine Folge komplexer Zahlen mit lim zn = z. Dann n→∞ gilt zn n = ez . lim 1 + n→∞ n 1 Beweis. Aus Beispiel 3 in Abschnitt 4.1. wissen wir, dass lim (1 + x) x = e . Da zn → z gilt lim n→∞ zn n → 0. Daraus folgt x→0 z lim z zn n zn znn n→∞ n zn znn n 1+ = lim 1 + = ez . = lim 1+ n→∞ n→∞ n n n ⊓ ⊔ Daraus erhalten wir die folgende funktionale Charakterisierung der Exponentialfunktion. 4.6 Die trigonometrischen und die Hyperbelfunktionen 153 Satz 4.33 Sei f : C −→ C eine Funktion, die die folgenden Eigenschaften erfüllt: 1. 2. f (z + w) = f (z) · f (w) für alle z, w ∈ C. lim z→0 f (z)−1 z = 1. Dann gilt: f (z) = ez für alle z ∈ C. Beweis. Sei z ∈ C. Aus der 1. Eigenschaft von f folgt für alle n ∈ N: z n z =f f (z) = f n · . n n Wir betrachten die Folge z zn := n · f ( ) − 1 n Dann gilt f (z) = f z n n Aus der 2. Eigenschaft von f folgt zn n = 1+ . n f ( nz ) − 1 zn = 1, = lim z n→∞ n→∞ z n lim also lim zn = z. Aus Lemma 4.12 folgt n→∞ f (z) = lim n→∞ 1+ zn n = ez . n ⊓ ⊔ Mit Hilfe der Exponentialfunktion definieren wir jetzt die trigonometrischen Funktionen. Wir betrachten zunächst die Exponentialfunktion auf der imaginären Achse. Für eit mit t ∈ R gilt |eit |2 = eit · eit = eit · e−it = e0 = 1. Die komplexe Zahl eit liegt also auf der Kreislinie S 1 := {z ∈ C | |z| = 1}. Der Realteil von eit heißt der Cosinus der reellen Zahl t, der Imaginärteil heißt Sinus von t. Also ist eit + e−it eit − e−it und sin(t) := . 2 2i Dann erhält man unmittelbar die sogenannte Eulersche Formel cos(t) := eit = cos(t) + i sin(t) und wegen |eit | = 1 ist cos2 (t) + sin2 (t) = 1. 154 4 Stetige Abbildungen zwischen metrischen Räumen iR i 6 eit sin t t cos t 1 R Wir erweitern die Definition von Sinus und Cosinus auf die komplexen Zahlen und definieren sin, cos : C −→ C durch cos(z) := eiz + e−iz 2 sin(z) := eiz − e−iz 2i ∀ z ∈ C. Dann gilt ∞ X z3 z5 z7 z 2n+1 sin(z) = z − + − + ... = (−1)n , 3! 5! 7! (2n + 1)! n=0 cos(z) = 1 − ∞ X z 2n z2 z4 z6 (−1)n + − ... = . 2! 4! 6! (2n)! n=0 Diese Potenzreihen haben Konvergenzradius ∞, sind also absolut und gleichmäßig konvergent auf jeder kompakten Teilmenge von C. Eigenschaften der trigonometrischen Funktionen sin, cos: 1. sin : C −→ C und cos : C −→ C sind stetige Funktionen. 2. sin2 (z) + cos2 (z) = 1 ∀ z ∈ C : 1 1 sin2 (z) + cos2 (z) = − (e2iz + e−2iz − 2) + (e2iz + e−2iz + 2) = 1. 4 4 3. eiz = cos(z) + i · sin(z) ∀ z ∈ C cos(z) + i · sin(z) = (Eulersche Formel ): 1 iz 1 (e + e−iz ) + (eiz − e−iz ) = eiz . 2 2 4. Additionstheoreme: Für alle z1 , z2 ∈ C gilt sin(z1 + z2 ) = sin(z1 ) cos(z2 ) + sin(z2 ) cos(z1 ) cos(z1 + z2 ) = cos(z1 ) cos(z2 ) − sin(z1 ) sin(z2 ). 4.6 Die trigonometrischen und die Hyperbelfunktionen 155 5. Die Funktion sin ist ungerade, die Funktion cos ist gerade, d.h. es gelten sin(−z) = − sin(z) cos(−z) = + cos(z) ∀z∈C 6. Für reelle Zahlen x ∈ R sind auch sin(x) und cos(x) reell und es gilt | sin(x)| ≤ 1 | cos(x)| ≤ 1. Warnung: Für komplexe Zahlen z ∈ C gilt das im allgemeinen nicht mehr. Z.B. ist 1 lim | sin(it)| = lim |e−t − et | = +∞. t→∞ t→∞ 2 Zur Definition der Zahl π: Für die stetige Funktion cos|R : R −→ R gilt cos(0) = 1 und cos(2) < − 31 , denn ∞ X 22n cos(2) = (−1)n (2n)! n=0 =− 1 3 =− 1 3 ∞ 22n 2 X + (−1)n 3 n=3 (2n)! ∞ X 24r−2 24r − − (4r − 2)! (4r)! r=2 ∞ X 24r−2 4 − · 1− (4r − 2)! 4r(4r − 1) r=2 | {z } = 1−2+ >0 1 <− . 3 Andererseits gilt für sin|R : R −→ R, dass sin(x) > 0 auf x ∈ (0, 2), denn sin(x) = ∞ X (−1)n n=0 ∞ X x2n+1 (2n + 1)! x4r−3 x4r−1 − (4r − 3)! (4r − 1)! r=1 ∞ X x4r−3 x2 = · 1− (4r − 3)! (4r − 1)(4r − 2) r=1 {z } | = >0 >0 ∀ x ∈ (0, 2). 156 4 Stetige Abbildungen zwischen metrischen Räumen Satz 4.34 Die Funktion cos|R hat auf dem Intervall (0, 2) genau eine Nullstelle. Beweis. Da cos(0) = 1 > 0, cos(2) < − 31 < 0 und cos|R : R −→ R stetig ist, folgt aus dem Zwischenwertsatz, dass ein ξ ∈ (0, 2) mit cos(ξ) = 0 existiert. Es bleibt die Eindeutigkeit von ξ zu zeigen. Seien also ξ1 , ξ2 ∈ (0, 2), ξ1 < ξ2 1 ∈ (0, 2) und aus den Additionsmit cos(ξ1 ) = cos(ξ2 ) = 0. Dann gilt ξ2 ±ξ 2 theoremen folgt cos(ξ1 ) − cos(ξ2 ) = 2 sin( ξ2 + ξ1 ξ2 − ξ1 ) · sin( ) > 0. 2 2 ⊓ ⊔ Dies steht aber im Widerspruch zu cos(ξ1 ) = cos(ξ2 ) = 0. Definition 4.13. Die Nullstelle von cos|R auf dem Intervall (0, 2) heißt π . 2 π Es gilt also cos( π2 ) = 0 und sin( π2 ) = 1 , woraus ei 2 = i, eiπ = −1 und e2πi = 1 folgt. Insbesondere folgt dann aus den Produkt-Eigenschaften der Exponentialfunktion π π ei(ρ+ 2 ) = eiρ · ei 2 = i eiρ ei(ρ+π) = eiρ · eiπ = −eiρ . Die Eulersche Forml liefert dann die folgenden Beziehungen zwischen Sinus und Cosinus: Folgerung 4.1 Für alle ρ ∈ R gilt sin(ρ + π ) = + cos(ρ) 2 R sin(ρ + π) = − sin(ρ) 6 1 sin x π 2 −1 π 3 2π 2π R cos(ρ + π) = − cos(ρ) 4.6 Die trigonometrischen und die Hyperbelfunktionen R 157 6 1 cos x π 2 π 3 2π 2π R −1 Satz 4.35 1. Die Exponentialfunktion ez ist periodisch mit der Periode 2πi, das heißt es gilt ez = ez+2πi ∀ z ∈ C. 2. Die Funktionen sin : R −→ R und cos : R −→ R sind periodisch mit der kleinsten Periode 2π, das heißt 2π ist die kleinste positive reelle Zahl L mit sin(x + L) = sin(x), cos(x + L) = cos(x) ∀ x ∈ R. 3. ez = 1 ⇐⇒ z = 2πki für ein k ∈ Z. 4. Zu jedem z ∈ S 1 = {z ∈ C | |z| = 1} existiert genau eine reelle Zahl t ∈ [0, 2π) mit z = eit = cos(t) + i sin(t). Beweis. (1) Nach der Eulerschen Formel gilt e2πi = cos(2π) + i sin(2π) = 1 . Daraus folgt e(z+2πi) = ez · e2πi = ez . (2) Nach (1) ist die Funktion x ∈ R 7−→ eix = cos(x) + i sin(x) ∈ C 2πperiodisch, folglich gilt dies auch für ihren Realtteil cos(x) und ihren Imaginärteil sin(x). Da cos(ρ) > 0 für alle ρ ∈ (− π2 , π2 ) und cos(ρ) < 0 für alle ρ ∈ ( π2 , 3π 2 ) (siehe Folgerung 4.1), gibt es keine kleinere Periode als 2π. (3) (⇐=) Sei z = 2πki für ein k ∈ Z. Dann gilt ez = e2πik = (e2πi )k = 1k = 1. (=⇒) Sei ez = 1 und z = x + iy mit x, y ∈ R. Dann gilt 1 = ex+iy = ex · eiy = ex (cos(y) + i sin(y)) und somit q 2 x x 1 = e | cos(y) + i sin(y)| = e · cos2 (y) + sin (y) . {z } | =1 Da die Exponentialfunktion exp|R : R −→ R+ bijektiv ist, folgt x = 0. Somit erhalten wir z = iy und aus 1 = cos(y) + i sin(y) folgt cos(y) = 1, sin(y) = 0. Damit ist y = 2πk, also z = 2πki. 158 4 Stetige Abbildungen zwischen metrischen Räumen (4) Sei z ∈ S 1 = {z ∈ C | |z| = 1}. Wir wollen zeigen, dass es genau ein t ∈ [0, 2π) gibt, mit z = eit = cos(t) + i sin(t). Sei z = x + iy, dann gilt x2 + y 2 = 1 sowie |x| ≤ 1. Wir beweisen nun durch Fallunterscheidung: (a) Sei x = 1. Dann ist y = 0 und t = 0 eindeutige Lösung von x = cos t, y = sin t. (b) Sei x = −1. Dann ist y = 0 und t = π eindeutige Lösung von x = cos t, y = sin t. (c) Bleibt also noch der Fall x ∈ (−1, 1) zu betrachten. Sei x ∈ (−1, 1). Dann existieren genau zwei Werte α, β mit α ∈ (0, 2π), β ∈ (0, 2π), x = cos α = cos β. Dabei gilt sin α > 0 und sin β < 0 und es folgt p p |y| = 1 − x2 = 1 − cos2 α = | sin α| = | sin β|. Ist y > 0, so ist y = sin α und t = α die Lösung. Ist y < 0, so ist y = sin β und t = β die Lösung. ⊓ ⊔ Die trigonometrischen Funktionen Tangens und Cotangens Wir definieren die Funktionen Tangens (tan) und Cotangens (cot) durch o nπ + kπ | k ∈ Z −→ C tan : C\ 2 sin(z) z 7−→ tan(z) := cos(z) n o cot : C\ kπ | k ∈ Z −→ C z 7−→ cot(z) := cos(z) sin(z) Aus den Eigenschaften der Funktionen Sinus und Cosinus erhält man die folgenden Eigenschaften der Tangens und Cotangens-Funktion: 1. tan und cot sind stetige Funktionen. 2. tan und cot sind ungerade Funktionen, die π-periodisch sind, denn sin(z + π) = − sin(z), cos(z + π) = − cos(z). 3. Es gelten folgende Additionstheoreme: tan(z + w) = cot(z) · cot(w) − 1 tan(z) + tan(w) , cot(z + w) = . 1 − tan(z) · tan(w) cot(z) + cot(w) 4.6 Die trigonometrischen und die Hyperbelfunktionen 159 Die Umkehrfunktionen der trigonometrischen Funktionen Da die trigonometrischen Funktionen auf R betrachtet periodisch sind, existieren keine globalen Umkehrfunktionen. Es existieren aber Umkehrfunktionen auf jedem Monotoniebereich der trigonometrischen Funktionen. Nach Satz 4.9 sind diese Umkehrfunktionen ebenfalls stetig. Definition 4.14. Die Umkehrfunktion von sin|[− π , π ] heißt Arcussinus und 2 2 wird mit arcsin bezeichnet. arcsin : [−1, 1] −→ [ − π2 , π2 ] ist bijektiv, stetig und streng monoton wachsend. Die Umkehrfunktion von sin| 2k−1 2k+1 , k ∈ Z , ist nach den Additionstheo[ π, π] 2 2 remen fk (x) = (−1)k · arcsin x + k · π. Diese fk (x) werden auch Zweige der Umkehrfunktion von Sinus genannt. Definition 4.15. Die Umkehrfunktion von cos|[0,π] heißt Arcuscosinus und wird mit arccos bezeichnet. arccos : [ − 1, 1] −→ [0, π] ist bijektiv, stetig und streng monoton fallend. Die Umkehrfunktion von cos|[kπ,(k+1)π] , k ∈ Z, ist nach den Additionstheoremen 2k + 1 − (−1)k · π. gk (x) = (−1)k · arccos x + 2 Definition 4.16. Die Umkehrfunktion von tan|[− π , π ] heißt Arcustangens und 2 2 wird mit arctan bezeichnet. arctan : R −→ [ − π2 , π2 ] ist bijektiv, stetig und streng monoton wachsend. Die Umkehrfunktion von tan| 2k−1 2k+1 , k ∈ Z, ist nach den Additionstheo[ π, π] 2 2 remen hk (x) = arctan x + k · π. Definition 4.17. Die Umkehrfunktion von cot|[0,π] heißt Arcuscotangens und wird mit arccot bezeichnet. arccot : R −→ [0, π] ist bijektiv, stetig und streng monoton fallend. Die Umkehrfunktion von cot|[kπ,(k+1)π] , k ∈ Z, ist nach den Additionstheoremen 160 4 Stetige Abbildungen zwischen metrischen Räumen ik (x) = arccot x + k · π. Die Hyperbelfunktionen Unter den Hyperbelfunktionen Sinus hyperbolicus sinh : C −→ C und Cosinus hyperbolicus cosh : C −→ C versteht man die folgenden komplexen Funktionen: ez − e−z 2 ez + e−z cosh(z) = 2 sinh(z) = . Aus der Reihendarstellung für ez folgt sinh(z) = cosh(z) = ∞ X z 2n+1 z3 z5 =z+ + + ... (2n + 1)! 3! 5! n=0 ∞ X z 2n z2 z4 =1+ + + ... (2n)! 2! 4! n=0 Eigenschaften der hyperbolischen Funktionen sinh, cosh 1. Die Funktionen sinh : C −→ C und cosh : C −→ C sind stetig. 2. sinh(iz) = i sin(z) und cosh(iz) = cos(z) für alle z ∈ C. 3. cosh2 (z) − sinh2 (z) = 1 ∀ z ∈ C : cosh2 (z) − sinh2 (z) = cos2 (−iz) − (i · sin(−iz))2 = cos2 (−iz) + sin2 (−iz) = 1. 4. Additionstheoreme: cosh(z1 + z2 ) = cosh(z1 ) cosh(z2 ) + sinh(z1 ) sinh(z2 ) sinh(z1 + z2 ) = sinh(z1 ) cosh(z2 ) + cosh(z1 ) sinh(z2 ). 5. cosh(z) = cosh(−z), sinh(z) = − sinh(−z). 6. Die Funktion sinh|R : R −→ R ist bijektiv und hat nur die Nullstelle x = 0. Die Funktion cosh|R : R −→ R nimmt ihre Werte in [1, +∞) an und ist bijektiv von [0, +∞) auf [1, +∞). 4.6 Die trigonometrischen und die Hyperbelfunktionen 161 Definition 4.18. Die Umkehrfunktion von sinh|R : R −→ R heißt Areasinus hyperbolicus und wird mit arsinh bezeichnet. Die Umkehrfunktion von cosh|[0,+∞) : [0, +∞) −→ [1, +∞) heißt Areacosinus hyperbolicus und wird mit arcosh bezeichnet. Die Umkehrfunktionen können durch den natürlichen Logarithmus ausgedrückt werden: p arsinh(x) = ln(x + x2 + 1) x∈R p x≥1 arcosh(x) = ln(x + x2 − 1) Analog definieren wir die Hyperbelfunkionen Tangens hyperbolicus (tanh) und Cotangens hyperbolicus (coth): tanh : C −→ C z 7−→ tanh(z) = coth : C\{0} −→ C z 7−→ coth(z) = sinh(z) e2z − 1 = 2z cosh(z) e +1 e2z + 1 cosh(z) = 2z sinh(z) e −1 Für Tangens hyperbolicus gilt das folgenden Additionstheorem tanh(z + w) = tanh(z) + tanh(w) . 1 + tanh(z) · tanh(w) Die Funktion tanh|R : R −→ (−1, 1) ⊂ R ist streng monoton wachsend und bijektiv. Die Funktion coth|R\{0} : R\{0} −→ R\[ − 1, 1] ist streng monoton wachsend und bijektiv. Definition 4.19. Die Umkehrfunktion von tanh|R heißt Areatangens hyperbolicus artanh : (−1, 1) −→ R . Die Umkehrfunktion von coth|R\{0} heißt Areacotangens hyperbolicus arcoth : R\[ − 1, 1] −→ R\{0}. Es gilt 1 1 + x ln 2 1−x 1 x + 1 arcot(x) = ln 2 x−1 artanh(x) = |x| < 1 |x| > 1. 162 4 Stetige Abbildungen zwischen metrischen Räumen 4.7 Der metrische Raum der stetigen Abbildungen In diesem Abschnitt wollen wir die Eigenschaften des Raumes aller stetigen Abbildungen zwischen metrischen Räumen genauer untersuchen. Wir betrachten dazu einen kompakten metrischen Raum (X, dX ) und einen beliebigen metrischen Raum (Y, dY ) und bezeichnen mit C(X, Y ) die Menge aller stetigen Abbildungen von X nach Y C(X, Y ) := {f : X −→ Y | f stetig }. Da die Metrik dY stetig ist und eine stetige Abbildung F : X −→ R von einem kompakten metrischen X in die reellen Zahlen immer ein Maximum besitzt, ist für zwei stetige Abbildungen f, h ∈ C(X, Y ) die Zahl d∞ (f, h) := max{dY (f (x), h(x)) | x ∈ X} korrekt definiert. Aus den Eigenschaften der Metrik dY erhält man ohne Probleme, dass d∞ eine Metrik auf C(X, Y ) ist. Ist der Bildraum ein Vektorraum V , so trägt auch die Menge der stetigen Abbildungen C(X, V ) eine Vektoraumstruktur. Für f, h ∈ C(X, V ) und λ ∈ K definieren wir (f + h)(x) := f (x) + h(x) und (λ · f )(x) := λ · f (x) ∀ x ∈ X. Jede Norm k · k auf V liefert dann eine Norm k · k∞ auf dem Vektorraum C(X, V ) kf k∞ := max{kf (x)k | x ∈ X}. Die durch k · k∞ gegebene Metrik auf C(X, V ) stimmt mit der Metrik d∞ überein, die auf C(X, V ) durch die durch k · k gegebene Metrik dk·k von V induziert wird d∞ (f, h) = max{dk.k (f (x), h(x)) | x ∈ X} = max{kf (x) − h(x)k | x ∈ X} = kf − hk∞ . Im folgenden sind die Mengen C(X, Y ) bzw. die Vektorräume C(X, V ) immer mit der Metrik d∞ bzw. der Norm k · k∞ versehen. Satz 4.36 Sei X ein kompakter metrischer Raum und Y ein beliebiger metrischer Raum. 1. Sei (fn ) eine Folge stetiger Abbildungen fn ∈ C(X, Y ). Die Folge (fn ) konvergiert im metrischen Raum C(X, Y ) genau dann gegen f ∈ C(X, Y ), wenn die Funktionenfolge (fn ) gleichmäßig gegen f konvergiert. 2. Ist Y vollständig, so ist C(X, Y ) vollständig. 4.7 Der metrische Raum der stetigen Abbildungen 163 3. Ist E ein Banachraum, so ist C(X, E) ebenfalls ein Banachraum. Beweis. (1) Die erste Behauptung folgt aus der Äquivalenz der folgenden Bedingungen: ⇐⇒ ⇐⇒ ⇐⇒ ⇐⇒ fn −→ f in C(X, Y ) ∀ ε > 0 ∃ n0 ∈ N so dass d∞ (fn , f ) < ε ∀ n ≥ n0 ∀ ε > 0 ∃ n0 ∈ N so dass max{dY (fn (x), f (x)) | x ∈ X} < ε ∀ n ≥ n0 ∀ ε > 0 ∃ n0 ∈ N so dass dY (fn (x), f (x)) < ε ∀ n ≥ n0 ∀ x ∈ X. (fn ) konvergiert gleichmäßig gegen f . (2) Sei (Y, dY ) vollständig. Wir zeigen, dass dann auch (C(X, Y ), d∞ ) vollständig ist. Sei (fn ) Cauchy–Folge in C(X, Y ) und ε > 0. Dann existiert ein n0 ∈ N, so dass für alle x ∈ X dY (fn (x), fm (x)) ≤ d∞ (fn , fm ) < ε ∀ n, m ≥ n0 . (∗) Folglich ist die Folge (fn (x)) für jedes x ∈ X eine Cauchy–Folge in Y . Da Y vollständig ist, existiert f (x) := lim fn (x) auf X. Da die Metrik dY stetig n→∞ ist, folgt aus (∗) für jedes x ∈ X lim dY (fn (x), fm (x)) = dY (fn (x), lim fm (x)) m→∞ m→∞ = dY (fn (x), f (x)) < ε ∀n ≥ n0 . Dies zeigt, dass die Funktionenfolge (fn ) gleichmäßig gegen f konvergiert. Nach Satz 4.25 ist f stetig und nach (1) konvergiert die Folge (fn ) in C(X, Y ) gegen f . (3) ist ein Spezialfall von (2). ⊓ ⊔ In verschiedenen Situationen kann man stetige Abbildungen durch “einfache“ stetige Abbildungen approximieren. Zunächst betrachten wir Fälle, wo man Polynome für diese Approximation benutzen kann. Dazu sei [a, b] ⊂ R ein kompaktes Intervall und E ein reeller Banachraum mit der Norm k · k. Wir wollen im Raum der stetigen Abbildungen C([a, b], E) eine Menge von Polynomen finden, die in diesem Raum dicht liegt, mit deren Hilfe man also eine beliebige stetige Abbildung f ∈ C([a, b], E) approximieren kann. Wir bezeichnen mit E[x] den Vektorraum der Polynome mit Koeffizienten in E n o n X ak xk | ak ∈ E . E[x] := p(x) = k=0 Ist p ∈ E[x], so ist die durch p definierte Abbildung 164 4 Stetige Abbildungen zwischen metrischen Räumen p : [a, b] −→ E t 7−→ p(t) = n P a k tk k=0 stetig. Mit P bezeichnen wir die Menge dieser als Abbildungen aufgefassten Polynome. Es gilt also P ⊂ C([a, b], E). Satz 4.37 (Weierstraßscher Approximationssatz) Sei E ein reeller Banachraum. Dann ist die Menge der Polynome dicht in C([a, b], E), das heißt, für jede stetige Funktion f : [a, b] −→ E existiert eine Folge von Polynomen pn : [a, b] −→ E , die auf [a, b] gleichmäßig gegen f konvergiert. Beweis. (1) Es genügt, die Behauptung für das Intervall [0, 1] zu zeigen: Sei die Behauptung für das Intervall [0, 1] bewiesen und [a, b] ein beliebiges Intervall. Wir betrachten den Homöomorphismus φ : [0, 1] −→ [a, b] t 7−→ a + (b − a)t Die inverse Abbildung φ−1 ist durch φ−1 (x) = x−a b−a gegeben. Sei nun f ∈ C([a, b], E) und h := f ◦ φ ∈ C([0, 1], E). Nach unserer Annahme existiert eine Polynomfolge (Pn ), die auf [0, 1] gleichmäßig gegen h konvergiert. Dann ist Qn := Pn ◦ φ−1 eine Polynomfolge, die gleichmäßig gegen f = h ◦ φ−1 konvergiert. (2) Sei f ∈ C([0, 1], E). Unter dem n-ten Bernstein–Polynom zu f verstehen wir das folgende Polynom n- ten Grades: n k n X (1 − x)n−k · xk . B[f ]n (x) := f n k k=0 | {z } =:βk,n (x) Die Polynome βk,n (x) haben folgende Eigenschaften: (1) βk,n (x) ≥ 0 ∀ x ∈ [0, 1], n P βk,n (x) = (1 − x + x)n = 1 (2) (3) k=0 n P ∀ x ∈ [0, 1], (k − nx)2 · βk,n (x) = nx(1 − x) k=0 ∀ x ∈ [0, 1]. Im folgenden zeigen wir, dass die Bernstein-Polynome B[f ]n auf [0, 1] gleichmäßig gegen f konvergieren. 4.7 Der metrische Raum der stetigen Abbildungen 165 Da f stetig und [0, 1] kompakt ist, ist f ([0, 1]) ⊂ E ebenfalls kompakt, also insbesondere beschränkt. Es existiert also eine Konstante C > 0 so dass kf (x)k ≤ C für alle x ∈ [0, 1] . (∗) Da [0, 1] kompakt ist, ist die Funktion f sogar gleichmäßig stetig. Folglich existiert zu jedem ε > 0 ein δ > 0 so dass kf (x1 ) − f (x2 )k < Wir setzen n0 (ε) := ε 2 C ε·δ 2 ∀ x1 , x2 ∈ [0, 1] mit |x1 − x2 | < δ. (∗∗) und zeigen nun, dass kB[f ]n (x) − f (x)k < ε ∀ n ≥ n0 , ∀ x ∈ [0, 1]. Für x ∈ [0, 1] und n ∈ N definieren wir die folgenden Mengen k n o J1,n (x) := k ∈ {1, 2, . . . , n} − x < δ n k o n J2,n (x) := k ∈ {1, 2, . . . , n} − x ≥ δ . n Dann erhalten wir n X k − f (x) · βk,n (x) f n k=0 X k X k f ≤ − f (x) βk,n (x) + f − f (x) · βk,n (x) . n n k∈J1,n (x) k∈J2,n (x) | {z } | {z } k B[f ]n (x) − f (x) k (2) = :=S1 (x) :=S2 (x) Für den Summanden S1 (x) ergibt sich (1) S1 (x) ≤ (∗∗) ≤ X k − f (x) · βk,n (x) f n J1,n (x) ε X βk,n (x) · 2 J1,n (x) n εX (2) ε ≤ βk,n (x) = . 2 2 k=0 Ist k ∈ J2,n (x), so gilt ( nk − x)2 ≥ δ 2 , also S2 (x) ergibt sich (k−nx)2 n2 δ 2 ≥ 1 . Für den Summanden 166 4 Stetige Abbildungen zwischen metrischen Räumen S2 (x) ≤ J2,n (x) (∗),(3) ≤ 2C · n2 δ 2 n X k=0 ≥1 (k − nx)2 βk,n (x) | C εδ 2 . Dann ist {z =nx(1−x) 2C x(1 − x). nδ 2 = Sei nun n ≥ n0 = o X n (k − nx)2 k + kf (x)k · βk,n (x) · f 2 2 n | n{zδ } 2C nδ 2 } < 2ε . Für x ∈ [0, 1] ist außerdem 1 1 1 x(1 − x) = x − x2 = −(x − )2 + < . 2 4 4 Folglich ist S2 (x) < ε 2 . Insgesamt erhalten wir kB[f ]n (x) − f (x)k < ε für alle n ≥ n0 und x ∈ [0, 1]. Somit konvergiert die Folge der Bernstein-Polynome (B[f ]n ) gleichmäßig gegen f . ⊓ ⊔ Wir wollen den Weierstraßschen Approximationssatz nun verallgemeinern. Wir betrachten dazu einen beliebigen kompakten metrischen Raum X und den Banachraum C(X, R) der stetigen reellwertigen Funktionen auf X mit der Norm k · k∞ . Unter einer Unteralgebra von C(X, R) verstehen wir einen linearen Unterraum1 R ⊂ C(X, R) mit der zusätzlichen Eigenschaft, dass mit zwei Funktionen f, h ∈ R auch das Produkt f · h, definiert durch (f · h)(x) = f (x) · h(x), in R liegt. Ein Beispiel für eine Unteralgebra ist die im Weierstraßschen Approximationssatz betrachtete Menge der Polynome P ⊂ C([a, b], R). Wir wollen nun Bedingungen dafür angeben, dass eine Unteralgebra R ⊂ C(X, R) dicht in C(X, R) liegt. Als Hilfsmittel beweisen wir zunächst folgende Lemmata. Lemma 4.20. Sei X ein kompakter metrischer Raum. Ist R ⊂ C(X, R) eine Unteralgebra im Banachraum der stetigen reellwertigen Funktionen auf X, so ist auch der Abschluss cl(R) ⊂ C(X, R) eine Unteralgebra. Beweis. Seien f, g ∈ cl(R) ⊂ C(X, R) stetige Funktionen, die im Abschluss der Unteralgebra R liegen. Dann existieren Folgen stetiger Funtionen (fn ) und (gn ) mit fn , gn ∈ R, die bzgl. k · k∞ gegen f bzw. g konvergieren. Da R 1 d.h. eine Teilmenge von C(X, R), die abgeschlossen gegenüber den VektorraumOperationen ist 4.7 Der metrische Raum der stetigen Abbildungen 167 eine Unteralgebra ist, liegen die stetigen Funktionen fn + gn , λ · fn und fn · gn ebenfalls in R, wobei λ eine reelle Zahl bezeichnet. Mit den Normeigenschaften sieht man sofort, dass die Folgen (fn + gn ) und (λ · fn ) bzgl. k · k∞ gegen f + g bzw. λ · f konvergieren, somit liegen f + g und λ · f in cl(R). Es bleibt zu zeigen, dass auch f · g in cl(R) liegt. Da die Folge (fn ) konvergiert, ist sie beschränkt, d.h. es existiert eine Konstante C ∈ R+ mit |fn (x)| ≤ kfn k∞ ≤ C ∀ n ∈ N ∀ x ∈ X. Da g stetig und X kompakt ist, hat g auf X ein Maximum. Es existiert also eine Konstante M ∈ R+ so dass |g(x)| ≤ kgk∞ ≤ M ∀ x ∈ X. Damit erhalten wir kf · g − fn · gn k∞ = kf · g − fn · g + fn · g − fn · gn k∞ = kg(f − fn ) + fn (g − gn )k∞ ≤ kg(f − fn )k∞ + kfn (g − gn )k∞ = max{|g(x)| kf (x) − fn (x)k} + max{|fn (x)| kg(x) − gn (x)k} x∈X x∈X ≤ M kf − fn k∞ + Ckg − gn k∞ Da (fn ) gegen f und (gn ) gegen g konvergiert, folgt aus dieser Ungleichung, dass fn · gn gegen f · g konvergiert. Somit ist f · g ∈ cl(R). ⊓ ⊔ Lemma 4.21. Sei X ein kompakter metrischer Raum und R ⊂ C(X, R) eine Unteralgebra, die alle konstanten Funktionen enthält. Dann liegen für zwei Funktionen f, g ∈ R die Funktionen |f | , max{f, g} und min{f, g} im Abschluss cl(R). Beweis. (1) Sei f ∈ R. Da X kompakt und f stetig ist, besitzt f auf X ein Maximum, d.h. es existiert ein C ∈ R+ mit |f (x)|√≤ C für alle x ∈ X. Wir betrachten die stetige Funktion w : x ∈ [0, C 2 ] 7−→ x ∈ R . Sei Pn eine Folge von Polynomen, die auf [0, C 2 ] gleichmäßig gegen w konvergiert. Eine solche Folge existiert nach Satz 4.37. Dann konvergiert die Funktionenfolge (Pn ◦f 2 ) auf X gleichmäßig gegen w ◦ f 2 = |f | . Folglich konvergiert die Folge (Pn ◦ f 2 ) im metrischen Raum (C(X, R), k · k∞ ) gegen |f |. Da P R eine Algebra ist, ist n mit f ∈ R auch jede Potenz f i ∈ R. Seien Pn (x) = i=0 ani xi die obigen Polynome. Da R alle konstanten Funktionen enthält, folgt Pn ◦ f 2 = n X i=1 ain (f 2 )i ∈ R. 168 4 Stetige Abbildungen zwischen metrischen Räumen Somit ist |f | der Grenzwert einer Folge von Elementen aus R und folglich gilt |f | ∈ cl(R). (2) Seien f, g ∈ R. Dann sind f + g und f − g Elemente in R, weil R ein Unterraum von C(X, R) ist. Aus (1) folgt |f − g| ∈ cl(R) und |f + g| ∈ cl(R). Daraus erhalten wir ) max{f, g} = 21 (f + g + |f − g|) ∈ cl(R). min{f, g} = 12 (f + g − |f − g|) ⊓ ⊔ Mit Hilfe dieser Lemmata beweisen wir den folgenden Approximationssatz für reellwertige Funktionen: Satz 4.38 (Approximationssatz von Stone–Weierstraß(1)) Sei X ein kompakter metrischer Raum und R ⊂ C(X, R) eine Unteralgebra im Banachraum der reellwertigen Funktionen auf X mit folgenden Eigenschaften 1. R enthält alle konstanten Funktionen, 2. R trennt Punkte, d.h. für beliebige voneinander verschiedene Punkte x, y ∈ X existiert eine Funktion f ∈ R mit f (x) 6= f (y). Dann ist R dicht in (C(X, R), k.k∞ ), d.h. zu jedem f ∈ C(X, R) existiert eine Folge von Funktionen f1 , f2 , . . . ∈ R, die auf X gleichmäßig gegen f konvergiert. Beweis. (1) Wir zeigen zunächst die folgende Eigenschaft von R: Sind x0 und y0 zwei verschiedene Punkte in X und r1 und r2 zwei reelle Zahlen, so existert eine Funktion h ∈ R mit h(x0 ) = r1 und h(y0 ) = r2 : Da die Algebra R Punkte trennt, existiert eine Funktion f ∈ R mit f (x0 ) 6= f (y0 ). Sei g die stetige Funktion g := f − f (x0 ) . f (y0 ) − f (x0 ) Da R alle konstanten Funktionen enthält, liegt g in R. Wir betrachten nun die Funktion h := (r1 − r2 ) · g + r1 ∈ R. Dann gilt offensichtlich h(x0 ) = (r1 − r2 )g(x0 ) + r1 = r1 und h(y0 ) = (r1 − r2 )g(y0 ) + r1 = r2 . (2) Wir zeigen nun, dass R dicht in C(X, R) liegt. Sei f ∈ C(X, R). Wir müssen zeigen, dass für jedes ε > 0 ein fε ∈ R existiert, so dass kf − fε k∞ < ε: Seien a, b ∈ X zwei beliebige Punkte. Nach (1) existiert eine Funktion ha,b ∈ R mit ha,b (a) = f (a) und ha,b (b) = f (b). (Falls a = b, so setzen wir in (1) 4.7 Der metrische Raum der stetigen Abbildungen 169 x0 = a = b, r1 = f (a) und y0 , r2 beliebig). Da f und ha,b stetig sind, ist die Teilmenge ε n εo Ua,b := x ∈ X | ha,b (x) > f (x) − = (ha,b − f )−1 (− , +∞) ⊂ X 2 2 offen. Nach Definition ist a ∈ Ua,b . Sei b ∈ X ein fixiertes Element. Dann ist Ub := {Ua,b }a∈X eine offene Überdeckung von X. Da X kompakt ist, existiert eine endliche Teilüberdeckung Ub∗ ⊂ Ub , d.h. es existieren endlich viele Punkte a1 , a2 , . . . , an ∈ X, so dass X = Ua1 ,b ∪ Ua2 ,b ∪ . . . ∪ Uan ,b . Wir betrachten die Funktion fb := max{ha1 ,b , . . . , han ,b }. Nach Lemma 4.21 ist fb ∈ cl(R). Ist x ∈ X, so gilt x ∈ Uaj ,b für einen Index j ∈ {1, . . . , n}. Damit erhalten wir ε fb (x) ≥ haj ,b (x) > f (x) − . 2 Wir haben zur Funktion f ∈ C(X, R) also zunächst für jedes b ∈ X eine Funktion fb ∈ cl(R) gefunden, so dass fb (x) > f (x) − ε 2 ∀ x ∈ X. (∗) Da f und fb stetig sind, ist die Teilmenge n εo ε Vb := x ∈ X | fb (x) < f (x) + = (fb − f )−1 (−∞, ) ⊂ X 2 2 offen. Aus der Definition der Funktionen ha,b folgt, dass fb (b) = f (b). Folglich ist V := {Vb }b∈X eine offene Überdeckung von X. Da X kompakt ist, existiert eine endliche Teilüberdeckung V ∗ ⊂ V, d.h. es existieren endlich viele Punkte b1 , b2 , . . . , bk ∈ X, so dass X = Vb1 ∪ Vb2 ∪ . . . ∪ Vbk . Wir betrachten die stetige Funktion g := min{fb1 , . . . , fbk }. Aus den Lemmata 4.20 und 4.21 folgt g ∈ cl(R). Ist x ∈ X, so gilt x ∈ Vbi für einen Index i ∈ {1, . . . , k}. Damit erhalten wir ε g(x) ≤ fbi (x) < f (x) + . 2 Andererseits existiert für x ∈ X ein l ∈ {1, . . . , k} mit g(x) = fbl (x) und folglich gilt wegen (∗) 170 4 Stetige Abbildungen zwischen metrischen Räumen ε g(x) = fbl (x) > f (x) − . 2 Wir haben also eine stetige Funktion g ∈ cl(R) gefunden, so dass f (x) − ε ε < g(x) < f (x) − 2 2 ∀ x ∈ X, also ε . 2 Da g im Abschluss von R liegt, gibt es eine Funktion fε ∈ R mit kf − gk∞ < kg − fε k∞ < ε . 2 Wir erhalten somit kf − fε k∞ ≤ kf − gk∞ + kg − fε k∞ < ε ε + = ε. 2 2 Damit ist bewiesen, dass die Unteralgebra R dicht in C(X, R) liegt. ⊓ ⊔ Als nächstes beweisen wir einen analogen Approximationssatz für komplexwertige Funtionen. Satz 4.39 (Approximationssatz von Stone–Weierstraß (2)) Sei X ein kompakter, metrischer Raum und R ⊂ C(X, C) eine Unteralgebra im Banachraum der stetigen, komplexwertigen Funktionen auf X mit folgenden Eigenschaften 1. R enthält alle konstanten Funktionen, 2. R trennt Punkte, 3. Wenn f ∈ R, so f ∈ R. Dann gilt cl(R) = C(X, C), das heißt R ist dicht in (C(X, C, k.k∞ ). Beweis. Wir betrachten die folgende Teilmenge im Raum der reellwertigen stetigen Funktionen R∗ := {f ∈ R | Im(f ) = 0} ⊂ C(X, R). Dann gilt 1. Da R eine komplexe Unteralgebra in C(X, C) ist, ist R∗ eine reelle Unteralgebra in C(X, R). 2. Da R alle komplexen Konstanten enthält, enthält R∗ alle reellen Konstanten. 4.7 Der metrische Raum der stetigen Abbildungen 171 3. R∗ trennt ebenfalls Punkte: Seien x, y ∈ X zwei verschiedene Punkte. Wie im 1. Teil des Beweises von Satz 4.38 zeigt man, dass eine Funktion f ∈ R existiert, so dass f (x) = 0 und f (y) = 1 gilt. Dann gilt für die Funktion f ∗ = f + f ∈ R∗ , dass f ∗ (x) = 0 und f ∗ (y) = 2. f ∗ trennt also die Punkte x und y. Nach dem Approximationssatz von Stone-Weierstrass für reellwertige Funktionen (Satz 4.38), liegt dann R∗ dicht im Banachraum C(X, R). Folglich ist die Menge der Funktionen R∗ + iR∗ dicht im Banachraum C(X, R). Da R eine (komplexe) Unteralgebra ist und R∗ ⊂ R, gilt R∗ + iR∗ ⊂ R . Daraus erhält man C(X, C) = cl(R∗ + iR∗ ) ⊂ cl(R) ⊂ C(X, R), ⊓ ⊔ also cl(R) = C(X, C) . Wir wenden nun die Approximationssätze von Stone-Weierstraß auf einige Spezialfälle an. Beispiel 1: Approximation reellwertiger Funktionen f ∈ C([a, b], R) durch Polynome mit reellen Koeffizienten. Wir betrachten die Menge PR aller Polynome mit reellen Koeffinzienten n n o X PR := P ∈ C([a, b], R) P (t) := a k tk , a k ∈ R , n ∈ N . k=0 Wir hatten bereits bemerkt, dass PR eine Unteralgebra von C([a, b], R) ist. Offensichtlich enthält PR alle konstanten Funktionen (Polynome 0. Grades). PR trennt außerdem Punkte, denn sind x, y ∈ [a, b] verschiedene reelle Zahlen, so gilt p(x) 6= p(y) für das Polynom p(t) = t. Nach dem Satz von Stone-Weierstraß für reellwertige Funktionen liegt die Menge der reellen Polynome PR dicht im Banachraum C([a, b], R), d.h. für jede stetige Funktion f ∈ C([a, b], R) existiert eine Folge von Polynomen Pn ∈ PR , n ∈ N, die auf [a, b] gleichmäßig gegen die Funktion f konvergiert. Wir haben dieses Beispiel hier nur als Musterbeispiel angeführt. Die Aussage ist natürlich als Spezialfall des Approximationssatzes von Weierstraß (Satz 4.37) bereits bekannt. Im Beweis von Satz 4.37 haben wir sogar ein konstuktives Verfahren für die approximierende Folge von Polynomen angegeben. Beispiel 2: Approximation komplexwertiger Funktionen f ∈ C([a, b], C) durch Polynome mit komplexen Koeffizienten. Wir betrachten die Menge der Polynome mit komplexen Koeffizienten n n o X PC := P ∈ C([a, b], C) P (t) := a k tk , a k ∈ C , n ∈ N . k=0 172 4 Stetige Abbildungen zwischen metrischen Räumen Genau wie für den reellen Fall sieht man leicht, dass PC eine Unteralgebra von C([a, b], C) ist, die alle Voraussetzungen des Satzes 4.39 erfüllt. Somit erhalten wir Folgerung 4.2 Die Menge der komplexen Polynome PC dicht im Banachraum C([a, b], C), d.h. für jede stetige Funktion f ∈ C([a, b], C) existiert eine Folge von Polynomen Pn ∈ PC , n ∈ N, die auf [a, b] gleichmäßig gegen die Funktion f konvergiert. Beispiel 3: Approximation reellwertiger periodischer stetiger Funktionen durch reelle trigonometrische Polynome. In diesem Beispiel betrachten wir auf R definierte reellwertige stetige 2πperiodische Funktionen. Wir bezeichen den Vektorraum dieser Funktionen mit C(R, R)per := {f ∈ C(R, R) | f (x + 2π) = f (x) ∀ x ∈ R}. Da die Werte von f ∈ C(R, R)per durch diejenigen von f|[0,2π] vollständig bestimmt sind, ist kf k∞ := max{|f (x)|} x∈R per definiert und eine Norm auf C(R, R) . Eine auf R definierte 2π-periodische Funktion kann man als Funktion auf S 1 auffassen, wobei S 1 := {z ∈ C | |z| = 1} = {eit | t ∈ R} ⊂ C die Menge der komplexen Zahlen vom Betrag 1 ist. S 1 ist beschränkt und abgeschlossen in C, also mit der durch C induzierten Metrik ein kompakter metrischer Raum. Man ordnet f ∈ C(R, R)per dabei die Funktion f ∗ ∈ C(S 1 , R) zu f ∗ (eit ) := f (t). Diese Definition ist durch die Periodizitätsbedingung korrekt. Die Abbildung φ : C(R, R)per −→ C(S 1 , R) f 7−→ f∗ ist bijekjtiv und erfüllt kφ(f )k∞ = kf k∞ . Die normierten Vektorräume (C(R, R)per , k·k∞ ) und (C(S 1 , R), k·k∞ ) sind also isometrisch zueinander. Wir können deshalb den Approximationssatz von Stone-Weierstraß (Satz 4.38) auch auf die auf R definierten periodischen Funktionen anwenden. Definition 4.22. Ein reelles trigonometrisches Polynom ist eine 2π-periodische Funktion f ∈ C(R, R)per mit f (t) := a0 + n X ak cos(kt) + bk sin(kt) k=1 wobei a0 , a1 , . . . , an , b1 , . . . , bn ∈ R und n ∈ N. ∀ t ∈ R, 4.7 Der metrische Raum der stetigen Abbildungen 173 Wir bezeichnen mit PRper die Menge der reellen trigonometrischen Polynome. Wegen der Additionstheoreme 1 {cos((k + l)t) + cos((l − k)t)} 2 1 cos(kt) · sin(lt) = {sin((k + l)t) + sin((l − k)t)} 2 1 sin(kt) · sin(lt) = {cos((k + l)t) + cos((l − k)t)} 2 cos(kt) · cos(lt) = ist PRper eine Unteralgebra von C(R, R)per . Diese Unteralgebra enthält die konstanten Funktionen (a1 = . . . = an = b1 = . . . = bn = 0.) Sie trennt auch Punkte. Sind x, y ∈ R und x 6= y + k2π, so ist cos(x) 6= cos(y) oder sin(x) 6= sin(y). Dann trennt das trigonometrische Polynom p(t) = cos(t) oder das trigonometrische Polynom p(t) = sin(t) die Punkte x und y. Aus Satz 4.38 folgt somit Folgerung 4.3 Die Menge der reellen trigonometrischen Polynome PRper ist dicht im Banachraum C(R, R)per der auf R definierten stetigen reellwertigen 2π-periodischen Funktionen. D.h. für jede auf R definierte 2π-periodische reellwertige stetige Funktion f existiert eine Folge von reellen trigonometrischen Polynomen Pn ∈ PRper , n ∈ N, die auf R gleichmäßig gegen die Funktion f konvergiert. Beispiel 4: Approximation komplexwertiger periodischer stetiger Funktionen durch komplexe trigonometrische Polynome. In diesem Beispiel betrachten wir auf R definierte komplexwertige stetige 2πperiodische Funktionen. Wir bezeichnen den Vektorraum dieser Funktionen mit C(R, C)per := {f ∈ C(R, C) | f (x + 2π) = f (x) ∀ x ∈ R}. Wie im letzten Beispiel erhalten wir, dass die Banachräume (C(R, C)per , k · k∞ ) und (C(S 1 , C), k · k∞ ) isometrisch sind. Wir können somit den Approximationssatz von Stone-Weierstraß (Satz 4.39) auf die auf R definierten komplexwertigen 2π-periodischen Funktionen anwenden. Definition 4.23. Ein komplexes, trigonometrisches Polynom ist eine 2π– periodische Funktion f ∈ C(R, C)per mit f (t) = N X k=−n wobei n, N ∈ N0 und ck ∈ C. ck eikt , 174 4 Stetige Abbildungen zwischen metrischen Räumen Wir bezeichnen die Menge der komplexen trigonometrischen Polynome mit PCper . PCper ist eine Unteralgebra von C(R, C)per , die die konstanten Funktionen enthält, Punkte trennt und abgeschlossen gegenüber komplexer Konjugation ist. Aus Satz 4.39 erhalten wir deshalb Folgerung 4.4 Die Menge der komplexen trigonometrischen Polynome PCper ist dicht im Banachraum C(R, C)per der auf R definierten komplexwertigen stetigen 2π-periodischen Funktionen. D.h. für jede auf R definierte 2πperiodische komplexwertige stetige Funktion f existiert eine Folge von komplexen trigonometrischen Polynomen Qn ∈ PRper , n ∈ N, die auf R gleichmäßig gegen die Funktion f konvergiert. 5 Differentialrechnung für Funktionen einer reellen Veränderlichen Die Grundidee der Differentialrechnung ist die Approximation einer Funktion in der Umgebung eines Punktes durch lineare Abbildungen. Dadurch kann man viele Aussagen über das lokale Verhalten der Funktion machen. 5.1 Differenzierbare Abbildungen Sei E ein reeller normierter Vektorraum, U ⊂ R und x0 ∈ U Häufungspunkt von U . Definition 5.1. Eine Abbildung f : U ⊂ R −→ E heißt differenzierbar im Häufungspunkt x0 ∈ U , falls der Grenzwert f ′ (x0 ) := df f (x) − f (x0 ) (x0 ) := lim x→x0 dx x − x0 existiert. Dieser Grenzwert heißt Ableitung von f in x0 . Bemerkung: Ist U offen oder ein Intervall, so ist jeder Punkt von U ein Häufungspunkt. Definition 5.2. Sei jeder Punkt der Menge U ⊂ R ein Häufungspunkt. f : U −→ E heißt auf U differenzierbar, falls f in jedem Punkt x0 ∈ U differenzierbar ist. In diesem Fall heißt die Abbildung f ′ : U ⊂ R −→ E x 7→ f ′ (x) 1. Ableitung von f . 176 5 Differentialrechnung für Funktionen einer reellen Veränderlichen Geometrische Interpretation: Die Motivation für die Entwicklung der Differentialrechnung durch Leibniz war das Tangentenproblem: Man approximiere eine gegebene Kurve möglichst gut durch eine Gerade, die durch einen festen Punkt der Kurve geht. Sei f : U −→ E, x0 ∈ U . Wir betrachten die Sekante durch P0 = (x0 , f (x0 )) und P = (x0 + h, f (x0 + h)). Dies ist die Gerade, die durch die Abbildung Sh (x) := f (x0 ) + graph(Tx0 ) E6 f (x0 ) f (x0 + h) − f (x0 ) ·(x − x0 ) h | {z } • Anstieg gegeben ist. x0 • graph(Sh ) graph(f ) X x0 + h Was passiert mit den Sekanten Sh bei h → 0 ? Ist f in x0 differenzierbar, so gilt f (x0 + h) − f (x0 ) , f ′ (x0 ) = lim h→0 h das heißt, bei h → 0 konvergieren die Anstiege der Sekanten gegen f ′ (x0 ). Somit konvergieren die Sekanten Sh bei h → 0 gegen die Geraden, die durch die Funktion Tx0 (x) := f (x0 ) + f ′ (x0 )(x − x0 ) gegeben sind. Die durch Tx0 definierte Gerade heißt Tangente an die Kurve graph(f ) im Punkt P0 . Tx0 approximiert f in erster Näherung in einer ” Umgebung um x0 “, das heißt, es gilt (1) f (x0 ) = Tx0 (x0 ), f (x)−Tx0 (x0 ) = 0. (2) lim x−x0 x→x0 Bemerkung: In der Mechanik wurde die Differentialrechnung insbesondere durch Newton benutzt, um ein mathematisches Modell für Größen wie die Geschwindigkeit oder die Beschleunigung zu entwickeln. Sei zum Beispiel P ein Massepunkt und s(t) ∈ R3 gebe den Ort von P zur Zeit t an. Dann ist die Ortsänderung pro Zeiteinheit s(t) − s(t0 ) . t − t0 Folglich gibt s′ (t0 ) = lim t→t0 an. s(t)−s(t0 ) t−t0 die Geschwindigkeit von P zur Zeit t = t0 Satz 5.1 Sei f : U ⊂ R −→ E. Ist f in einem Häufungspunkt x0 ∈ U differenzierbar, so ist f in x0 stetig. 5.1 Differenzierbare Abbildungen 177 Beweis: Sei (xn ) ⊂ U eine Folge die gegen x0 konvergiert. Es ist zu zeigen, dass dann auch (f (xn )} gegen f (x0 ) konvergiert. Es gilt f (xn ) − f (x0 ) n→∞ −→ 0 · kf ′ (x0 )k. kf (xn ) − f (x0 )k = |xn − x0 | xn − x0 Somit ist f (xn )) gegen f (x0 ) konvergent. ⊓ ⊔ Folgerung 5.1 Sei jeder Punkt von U ⊂ R ein Häufungspunkt. Ist f : U −→ E differenzierbar, so ist f : U −→ E stetig. Rechenregeln für differenzierbare Funktionen Satz 5.2 Sei K = R, C und E ein normierter K-Vektorraum. Sei weiterhin U ⊂ R und x0 ∈ U sei Häufungspunkt von U . Die Abbildungen f, g : U −→ E und h : U −→ K seien in x0 differenzierbar. Dann gilt: (1) – Summenregel f + g : U −→ E ist in x0 differenzierbar und (f + g)′ (x0 ) = f ′ (x0 ) + g ′ (x0 ). (2) – Produktregel h · f : U −→ E ist in x0 differenzierbar und (h · f )′ (x0 ) = h′ (x0 ) · f (x0 ) + h(x0 ) · f ′ (x0 ). (3) – Quotientenregel Sei weiterhin h(x0 ) 6= 0. Dann ist hf : {x ∈ U | h(x) 6= 0} → K in x0 differenzierbar und ′ f ′ (x0 )h(x0 ) − h′ (x0 )f (x0 ) f (x0 ) = . h h2 (x0 ) Insbesondere gilt auch ′ 1 h′ (x0 ) (x0 ) = − 2 . h h (x0 ) Beweis: (1) Da f und g in x0 stetig sind, folgt durch Limesbildung aus f (x) − f (x0 ) g(x) − g(x0 ) f (x) + g(x) − (f (x0 ) + g(x0 )) = + . x − x0 x − x0 x − x0 sofort die Behauptung. 178 5 Differentialrechnung für Funktionen einer reellen Veränderlichen (2) Wegen der Stetigkeit von f und h in x0 folgt auch hier wieder mit Limesbildung aus (h · f )(x) − (h · f )(x0 ) f (x) − f (x0 ) h(x) − h(x0 ) = h(x) · + · f (x0 ). x − x0 x − x0 x − x0 die Behauptung. (3) Es gilt ( h1 )(x) − ( h1 )(x0 ) x − x0 = x→x0 1 h(x) − 1 h(x0 ) x − x0 −→ −h′ (x0 ) · = h(x0 ) − h(x) 1 · x − x0 h(x)h(x0 ) 1 . h2 (x0 ) Durch Limesbildung folgt dann die zweite Behauptung. Mit Hilfe der Produktregel erhält man sofort die Quotientenregel. ⊓ ⊔ Beispiel 5.1 Jedes Polynom P (x) = xn an + xn−1 an−1 + . . . + a0 , ai ∈ E für alle i ∈ {0, . . . , n}, ist auf R differenzierbar und es gilt P ′ (x) = nan xn−1 + (n − 1)an−1 xn−2 + . . . + 2a2 x + a1 , denn f (x) = x ist differenzierbar und f ′ (x) = 1 nach Definition. Dann ist auch fk (x) = xk = x . . · x} differenzierbar und nach Satz 5.2 gilt fk′ (x) = k · xk−1 . | · .{z k−mal Beispiel 5.2 Sei R(x) = P (x) a0 + a1 x + . . . + an xn = Q(x) b0 + b1 x + . . . + bm xm eine rationale Funktion auf R \ {x ∈ R | Q(x) = 0} und ai , bj ∈ R oder ai , bj ∈ C. Dann ist R : R \ {x ∈ R | Q(x) = 0} −→ R (C) differenzierbar. Satz 5.3 (Kettenregel) Seien U1 , U2 ⊂ R, f : U1 −→ E, g : U2 −→ U1 und E ein normierter Vektorraum. Sei g in einem Häufungspunkt x0 ∈ U2 differenzierbar und sei f im Häufungspunkt g(x0 ) ∈ U1 differenzierbar. Dann ist f ◦ g : U2 −→ E in x0 differenzierbar und es gilt 1 (f ◦ g)′ (x0 ) = g ′ (x0 ) · f ′ (g(x0 )). 1 Die Reihenfolge der Faktoren wurde so gewählt, weil man die Vektoren aus E nach Vereinbarung von links mit den Skalaren multipliziert. 5.1 Differenzierbare Abbildungen 179 Beweis: Für g(x) 6= g(x0 ) gilt g(x) − g(x0 ) f (g(x)) − f (g(x0 )) (f ◦ g)(x) − (f ◦ g)(x0 ) = · . x − x0 x − x0 g(x) − g(x0 ) Sei (xn ) eine gegen x0 konvergente Folge mit xn = 6 x0 für alle n ∈ N. (1) Sei g(xn ) 6= g(x0 ) für alle n ≥ n0 . Da g in x0 stetig ist, folgt dann n→∞ g(xn ) −→ g(x0 ). Folglich gilt f (g(xn )) − f (g(x0 )) n→∞ ′ −→ f (g(x0 )) · g ′ (x0 ). xn − x0 (2) Es gelte nun g(xn ) = g(x0 ) für unendlich viele n ∈ N. Da g in x0 und f in g(x0 ) differenzierbar ist, gilt g ′ (x0 ) = lim n→∞ g(xn ) − g(x0 ) = 0, xn − x0 und wegen f (g(xn )) − f (g(x0 )) = 0 = g ′ (x0 ) · f ′ (g(x0 )) xn − x0 für alle n mit g(xn ) = g(x0 ), gilt die Behauptung auch für den zweiten Fall. ⊓ ⊔ Satz 5.4 (Ableitung der inversen Abbildung) Es seien U1 , U2 ⊂ R und f : U1 −→ U2 sei bijektiv. Sei x0 ∈ U1 ein Häufungspunkt von U1 und f (x0 ) ∈ U2 ein Häufungspunkt von U2 . Es gelte: (1) f −1 ist in f (x0 ) stetig, (2) f ist in x0 differenzierbar und f ′ (x0 ) 6= 0. Dann ist f −1 : U2 −→ U1 in f (x0 ) differenzierbar und es gilt (f −1 )′ (f (x0 )) = 1 . f ′ (x0 ) Beweis: Für y ∈ U2 mit y = f (x) gilt x − x0 f −1 (y) − f −1 (f (x0 )) = = y − f (x0 ) f (x) − f (x0 ) 1 f (x)−f (x0 ) x−x0 . Sei nun (yn ) = (f (xn )) eine Folge in U2 , die gegen f (x0 ) konvergiert. Da f −1 in f (x0 ) stetig ist, konvergiert xn = f −1 (yn ) gegen x0 = f −1 (f (x0 )). Da f in x0 differenzierbar ist, folgt dann f −1 (yn ) − f −1 (f (x0 )) n→∞ 1 −→ ′ . yn − f (x0 ) f (x0 ) ⊓ ⊔ 180 5 Differentialrechnung für Funktionen einer reellen Veränderlichen Bemerkung: Satz 5.4 gilt nicht ohne die Voraussetzung f ′ (x0 ) 6= 0, denn sei zum Beispiel f : R −→ R x 7→ x3 . Dann ist f bijektiv und differenzierbar. Es gilt f (0) = 0 und f ′ (0) = 0. Die inverse Abbildung f −1 : R −→ R √ x 7→ 3 x ist in 0 nicht differenzierbar, denn der Grenzwert für x gegen 0 von √ 3 f −1 (x) − f −1 (0) 1 x = = √ 3 x x x2 existiert nicht in R. Ableitungen elementarer Funktionen (1) Die Exponentialfunktion exp : R −→ R x 7→ ex = ∞ X xn n! n=0 ist differenzierbar und es gilt (ex )′ = ex . Beweis: Die Potenzreihe ∞ eh − 1 X hn−1 h h2 = =1+ + + ... h n! 2! 3! n=1 ist auf cl(K(0, 1)) gleichmäßig konvergent. Deswegen sind lim und tauschbar und es gilt eh − 1 lim =1 h→0 h und folglich P ver- eh − 1 ex0 +h − ex0 = lim ex0 · = ex0 . h→0 h→0 h h exp′ (x0 ) = lim 2 5.1 Differenzierbare Abbildungen 181 (2) Die Logarithmusfunktion ln : R+ −→ R x 7→ ln(x) ist differenzierbar und es gilt ln′ (x) = x1 . Beweis: ln ist die Umkehrfunktion von exp : R −→ R+ , ln ist stetig, exp ist differenzierbar und exp′ (x) = exp(x) 6= 0 für alle x ∈ R. Somit sind die Voraussetzungen des Satzes 5.4 erfüllt und es folgt ln′ (ex ) = 1 1 = x. x ′ (e ) e 1 y ∀ y ∈ R+ . Somit ist ln′ (y) = 2 (3) Die Potenzfunktion Wir betrachten für a ∈ R die Funktion pa : R+ −→ R x 7→ xa = eln(x)·a . pa ist differenzierbar und p′a (x) = a · xa−1 . Beweis: Nach der Kettenregel (Satz 5.3) gilt: p′a (x) = exp′ (ln(x) · a) · a · ln′ (x) = eln(x)·a · a · xa 1 = · a = a · xa−1 . x x 2 (4) Die Exponentialfunktion zur Basis a Die Funktion expa : R −→ R+ x 7→ ax = eln(a)·x ist für a ∈ R+ differenzierbar und es gilt (expa )′ (x) = eln(a)·x · ln(a) = ln(a) · ax . 2 182 5 Differentialrechnung für Funktionen einer reellen Veränderlichen (5) Sinus-und Cosinusfunktion Die Funktionen cos, sin : R −→ R sind differenzierbar und es gilt cos′ (x) = − sin(x), Beweis: Die Reihen ∞ P sin′ (x) = cos(x). 2n+1 x = sin(x) und (−1)n (2n+1)! n=0 ∞ P 2n x = cos(x) (−1)n (2n)! n=0 sind gleichmäßig konvergent auf jeder kompakten Menge. Es folgt ∞ sin(h) X 1 = (−1)n · lim h2n = 1 h→0 h→0 h (2n + 1)! n=0 lim und ∞ h2n+1 cos(h) − 1 X (−1)n lim = = 0. h→0 (2n)! h→0 h n=1 lim Daher gilt sin(x) cos(h) + cos(x) sin(h) − sin(x) sin(x + h) − sin(x) = h h sin(h) cos(h) − 1 = cos(x) + sin(x) h h h→0 −→ cos(x) und cos(x) cos(h) − sin(x) sin(h) − cos(x) cos(x + h) − cos(x) = h h sin(h) cos(h) − 1 − sin(x) = cos(x) h h h→0 −→ − sin(x). 2 (6) Die Funktionen sinh und cosh Die Funktionen sinh, cosh : R −→ R sind differenzierbar und es gilt (sinh)′ (x) = cosh(x), (cosh)′ (x) = sinh(x). Beweis: Nach Definition gilt sinh(x) = Daraus folgt sofort 1 x e − e−x 2 und cosh(x) = 1 x e + e−x 2 5.1 Differenzierbare Abbildungen 183 1 x (e + e−x ) = cosh(x), 2 1 (cosh)′ (x) = (ex − e−x ) = sinh(x). 2 (sinh)′ (x) = 2 Definition 5.3. Sei f : U ⊂ R −→ E differenzierbar und x0 ∈ U ein Häufungspunkt von U . f heißt in x0 2-mal differenzierbar, falls die Ableitung von f ′ : U −→ E in x0 existiert. f ′ (x0 +h)−f ′ (x0 ) h h→0 Bezeichnung: lim =: f ′′ (x0 ) Bemerkung: Allgemein definiert man die n–te Ableitung f (n) (x0 ) als Ableitung (f (n−1) )′ (x0 ), falls die (n − 1)–te Ableitung f (n−1) : U −→ E existiert (und differenzierbar ist). Bezeichnung: f (n) (x0 ) = dn f dxn (x0 ). Definition 5.4. Eine Abbildung f : U ⊂ R −→ E heißt stetig differenzierbar, wenn f auf U differenzierbar und f ′ : U −→ E stetig ist. f : U ⊂ R −→ E heißt n–mal stetig differenzierbar, falls alle Ableitungen f (1) , f (2) , . . . , f (n) existieren und stetig sind. Eine Abbildung f : U ⊂ R −→ E heißt glatt, wenn sie beliebig oft differenzierbar ist, das heißt, wenn für alle n ∈ N die Ableitungen f (n) existieren (und stetig sind). Bezeichnung: C (k) (U ; E) bezeichne den Vektorraum aller k-fach stetig differenzierbaren Abbildungen von U nach E. C ∞ (U ; E) bezeichne den Vektorraum aller glatten Abbildungen von U nach E. Beispiel 5.1 Wir betrachten die Funktion f : R −→ R, defniert durch ( x2 sin x1 , x 6= 0 f (x) := 0, x = 0. Die Funktion f ist differenzierbar und f ′ ist in 0 unstetig: Wenn x 6= 0 ist, dann ist 1 1 1 1 1 + x2 · cos · − 2 = 2x · sin − cos . f ′ (x) = 2x · sin x x x x x Sei nun x = 0. Dann gilt 184 5 Differentialrechnung für Funktionen einer reellen Veränderlichen h2 · sin( h1 ) 1 h→0 f (h) − f (0) = = h · sin −→ 0 h h h | {z } beschränkt und daher f ′ (0) = 0. Da cos( x1 ) für x gegen 0 keinen Grenzwert hat, hat auch f ′ keinen Grenzwert in x = 0. Somit ist f ′ nicht stetig in x = 0. Insbesondere ist f nicht 2–mal differenzierbar in x = 0. Beispiel 5.2 Folgende Betrachtungen (Tagaki, 1903) liefern uns eine auf ganz R stetige, aber nirgends differenzierbare Funktion. Wir betrachten die stückweise lineare Funktion f0 : R −→ R definiert durch ( x − [x] falls x ∈ [[x], [x] + 12 ] , (5.1) f0 (x) := 1 − x + [x] falls x ∈ [[x] + 12 , [x] + 1] wobei [x] wie üblich das kleinste Ganze von x bezeichnet (GaußklammerFunktion) . R 6 f0 1 2 f1 −1 − 12 1 2 1 R Die Funktion f0 hat also die Periode 1. Wir definieren nun fn (x) := 4−n f0 (4n · x). Dann hat fn die Periode 4−n . Sei weiterhin f := ∞ P fn . Dann gilt n=0 (1) fn : R −→ R ist stetig. (2) Es gilt |fn (x)| ≤ 21 4−n = Mn für alle x ∈ R. Aus den Eigenschaften der geometrischen Reihe folgt ∞ X n=0 Somit ist ∞ P n=0 Mn = ∞ n 2 1X 1 = < ∞. 2 n=0 4 3 fn gleichmäßig konvergent auf R. 5.2 Der Mittelwertsatz der Differentialrechnung 185 Aus (1) und (2) folgt, dass f : R −→ R stetig ist. Trotzdem ist f nirgends differenzierbar. Beweis: Sei x ∈ R beliebig gegeben. Sei n ∈ N und hn := 41 · 4−n oder hn := − 41 ·4−n , so dass fn zwischen x und x+hn linear ist. Nach Konstruktion ist fk für alle k ≤ n zwischen x und x + hn linear. Da die linearen Abschnitte von fn den Anstieg ±1 haben, folgt fk (x + hn ) − fk (x) = ±1 hn ∀ k ≤ n. Für k > n ist hn = 4−(n+1) eine Periode von fk . Folglich ist für alle k > n und daher gilt fk (x+hn )−fk (x) hn n n k=0 k=0 =0 f (x + hn ) − f (x) X fk (x + hn ) − fk (x) X = = ±1, hn hn und diese Partialsummenfolge kann nicht (für n → ∞) konvergent sein, denn die Basisfolge ist keine Nullfolge. Somit existiert f ′ (x) = lim f (x+hhnn)−f (x) n→∞ nicht. ⊓ ⊔ 5.2 Der Mittelwertsatz der Differentialrechnung Definition 5.5. Sei f : [a, b] −→ R. Man sagt: f nimmt in x0 ∈ (a, b) ein lokales Maximum (bzw. Minimum) an, falls ein ε > 0 existiert, so dass für alle y ∈ [a, b] mit |y − x0 | < ε gilt f (y) ≤ f (x0 ) R bzw. (f (y) ≥ f (x0 )). 6 lok. Maximum f (x01 ) f (x02 ) lok. Minimum a x01 x02 b R Satz 5.5 Ist f : [a, b] −→ R differenzierbar und hat f in x0 ∈ (a, b) ein lokales Maximum (Minimum), so gilt f ′ (x0 ) = 0. 186 5 Differentialrechnung für Funktionen einer reellen Veränderlichen Beweis: Sei f (x0 ) lokales Maximum von f . Dann existiert einerseits ein ε > 0, so dass für alle x > x0 mit |x − x0 | < ε f (x) − f (x0 ) ≤0 x − x0 gilt und somit lim x→x+ 0 f (x) − f (x0 ) ≤ 0. x − x0 (⋆) Andererseits einerseits ein ε > 0, so dass für alle x < x0 mit |x − x0 | < ε f (x) − f (x0 ) ≥0 x − x0 gilt und daher lim− x→x0 Da f ′ (x0 ) = lim x→x0 f (x)−f (x0 ) x−x0 f ′ (x0 ) = lim x→x+ 0 f (x) − f (x0 ) ≥ 0. x − x0 (⋆⋆) existiert, muss gelten f (x) − f (x0 ) f (x) − f (x0 ) = lim . − x − x0 x − x0 x→x0 Aus (⋆) und (⋆⋆) folgt dann, dass f ′ (x0 ) = 0 ist. ⊓ ⊔ Bemerkung: Aus f ′ (x0 ) = 0 folgt im Allgemeinen nicht, dass f in x0 ein lokales Maximum oder Minimum hat. Wir betrachten zum Beispiel f (x) = x3 . Dann ist f ′ (0) = 0, aber 0 ist kein lokaler Extremwert von f . Satz 5.6 (Satz von Rolle) Sei f : [a, b] −→ R stetig und f : (a, b) −→ R differenzierbar. Weiterhin gelte f (a) = f (b). Dann existiert ein Punkt x0 ∈ (a, b) mit f ′ (x0 ) = 0. Beweis: Ist f konstant auf [a, b], so ist die Behauptung trivial. Ist f nicht konstant, so existiert ein x1 ∈ (a, b), so dass entweder f (x1 ) > f (a) = f (b) oder f (x1 ) < f (a) = f (b) gilt. Wir betrachten zunächst den ersten Fall. Da f : [a, b] −→ R stetig und [a, b] kompakt ist, nimmt f auf [a, b] ein globales Maximum und ein globales Minimum an. Das Maximum liegt wegen obiger Aussage nicht auf den Randpunkten. Folglich existiert ein x0 ∈ (a, b) f (x0 ) = max{f (x) | x ∈ [a, b]}. Nach Satz 5.5 folgt dann f ′ (x0 ) = 0. Der Beweis für den zweiten Fall ist analog. ⊓ ⊔ 5.2 Der Mittelwertsatz der Differentialrechnung 187 Satz 5.7 (Verallg. Mittelwertsatz der Diff.-rechnung von Cauchy) Seien f, g : [a, b] −→ R stetig und auf (a, b) differenzierbar. Dann existiert ein x0 ∈ (a, b) mit (f (b) − f (a)) · g ′ (x0 ) = (g(b) − g(a)) · f ′ (x0 ). Beweis: Wir betrachten die Funktion h(x) = [f (b) − f (a)] · g(x) − [g(b) − g(a)] · f (x). Dann ist h stetig in [a, b] und differenzierbar in (a, b) und es gilt h(a) = f (b)g(a) − g(b)f (a) = h(b). Nach dem Satz von Rolle existiert ein x0 ∈ (a, b) mit h′ (x0 ) = 0. Wir erhalten somit 0 = h′ (x0 ) = (f (b) − f (a))g ′ (x0 ) − (g(b) − g(a))f ′ (x0 ). ⊓ ⊔ Satz 5.8 (Mittelwertsatz von Lagrange) Sei f : [a, b] −→ R stetig und in (a, b) differenzierbar. Dann existiert ein x0 ∈ (a, b), so dass f (b) − f (a) = f ′ (x0 ). b−a Beweis: Folgt aus Satz 5.7 mit g(x) := x. R 6 Geometrische Bedeutung: Es existiert ein x0 ∈ (a, b), so dass der Anstieg der Tangente in (x0 , f (x0 )) gleich dem Anstieg der Sekante durch (a, f (a)) und (b, f (b)) ist. ⊓ ⊔ • • • a x0 b R Anwendung des Mittelwertsatzes auf den Kurvenverlauf der durch f definierten Kurve Satz 5.9 Sei f : (a, b) −→ R differenzierbar, a, b ∈ R ∪ {±∞}. Dann gilt: (1) Ist f ′ (x) ≥ 0 für alle x ∈ (a, b), so ist f monoton wachsend. Ist f ′ (x) > 0 für alle x ∈ (a, b), so ist f streng monoton wachsend. (2) Ist f ′ (x) ≤ 0 (< 0) für alle x ∈ (a, b), so ist f (streng) monoton fallend. (3) Ist f ′ ≡ 0 auf (a, b), so ist f konstant. 188 5 Differentialrechnung für Funktionen einer reellen Veränderlichen Beweis: Seien x1 , x2 ∈ (a, b), x1 < x2 . Wir wenden den Mittelwertsatz von Lagrange auf f |[x1 ,x2 ] an. Dann existiert ein y ∈ (x1 , x2 ), so dass f ′ (y) = f (x2 ) − f (x1 ) . x2 − x1 Da x2 − x1 > 0, folgen die Behauptungen aus Satz 5.8. ⊓ ⊔ Anwendung: Seien c, A ∈ R gegebene Konstanten. Dann existiert genau eine differenzierbare Funktion f : R −→ R mit f ′ = c · f und f (0) = A. Diese Funktion ist gegeben durch f (x) = Aecx . Zum Beweis setzen wir F (x) = f (x) · e−cx . Dann gilt F ′ (x) = f ′ (x) · e−cx − c · f (x) · e−cx = (cf − cf )e−cx = 0. Somit ist F konstant. Da F (0) = A ist, gilt A = f (x) · e−cx . Folglich ist f (x) = Aecx . 2 Satz 5.10 Sei f : (a, b) −→ R differenzierbar. Weiterhin sei f in x0 ∈ (a, b) 2–mal differenzierbar und es gelte (1) f (x0 ) = 0, (2) f ′′ (x0 ) < 0 (bzw. f ′′ (x0 ) > 0). Dann hat f in x0 ein isoliertes lokales Maximum (Minimum), das heißt, es existiert ein ε > 0, so dass für alle x mit 0 < |x − x0 | < ε f (x) < f (x0 ) (bzw. f (x) > f (x0 )). gilt. Beweis: Wir beweisen nur den Fall f ′′ (x0 ) < 0. (f ′′ (x0 ) > 0 analog.) Aus f ′′ (x0 ) = lim x→x0 f ′ (x) − f ′ (x0 ) <0 x − x0 folgt, dass ein ε > 0 existiert, so dass für alle x mit 0 < |x − x0 | < ε f ′ (x) − f ′ (x0 ) <0 x − x0 gilt. Da f ′ (x0 ) = 0 ist, erhält man f ′ (x) < 0, für alle x > x0 mit x − x0 < ε f ′ (x) > 0, für alle x < x0 mit x0 − x < ε. und Nach Satz 5.9 ist daher f |(x0 −ε,x0 ) streng monoton wachsend, während f |(x0 ,x0 +ε) streng monoton fallend ist. Somit hat f in x0 ein isoliertes lokales Maximum. ⊓ ⊔ 5.2 Der Mittelwertsatz der Differentialrechnung 189 Definition 5.6. Sei D ⊂ R offenes Intervall. Eine Funktion f : D −→ R heißt (1) konvex, falls f (λx1 + (1 − λ)x2 ) ≤ λf (x1 ) + (1 − λ)f (x2 ) ∀ x1 , x2 ∈ D, λ ∈ (0, 1), (2) konkav, falls f (λx1 + (1 − λ)x2 ) ≥ λf (x1 ) + (1 − λ)f (x2 ) ∀ x1 , x2 ∈ D, λ ∈ (0, 1). Geometrische Bedeutung: Ist f konvex, so liegt die Kurve graph(f ) unterhalb der Geraden durch (x1 , f (x1 )) und (x2 , f (x2 )) für beliebige x1 , x2 ∈ D. Ist f konkav, so liegt graph(f ) oberhalb der Geraden durch (x1 , f (x1 ) und (x2 , f (x2 )) für beliebige x1 , x2 ∈ D. R 6 R f (x2 ) 6 f ist konvex • • f (x2 ) f (x1 ) f ist konkav • x1 x2 R f (x1 ) • x1 x2 R Satz 5.11 Sei D ⊂ R ein offenes Intervall und f : D −→ R zweimal differenzierbar. Dann gilt: (1) f ist genau dann konvex, wenn f ′′ (x) ≥ 0 für alle x ∈ D. (2) f ist genau dann konkav, wenn f ′′ (x) ≤ 0 für alle x ∈ D. Beweis: Wir zeigen nur die Behauptung (1). Der Beweis der Behauptung (2) ist analog. (⇐) Sei f ′′ (x) ≥ 0 für alle x ∈ D. Nach Satz 5.9 ist f ′ auf D monoton wachsend. Seien x1 , x2 ∈ D, λ ∈ (0, 1). Wir setzen x := λx1 + (1 − λ)x2 mit x1 < x2 . Dann ist x1 < x < x2 . Nach dem Mittelwertsatz existieren ein ξ1 ∈ (x1 , x) und ein ξ2 ∈ (x, x2 ), so dass f (x2 ) − f (x) f (x) − f (x1 ) = f ′ (ξ1 ) ≤ f ′ (ξ2 ) = . x − x1 x2 − x Da x − x1 = (1 − λ)(x2 − x1 ) und x2 − x = λ(x2 − x1 ) gilt, erhalten wir 190 5 Differentialrechnung für Funktionen einer reellen Veränderlichen f (x) − f (x1 ) f (x2 ) − f (x) ≤ . 1−λ λ Daraus folgt f (x) ≤ λf (x1 ) + (1 − λ)f (x2 ). Somit ist f konvex. (⇒) Sei f konvex. Wir nehmen an, dass ein x0 ∈ D existiert mit f ′′ (x0 ) < 0. Sei c := f ′ (x0 ) und ϕ := f (x) − c(x − x0 ) für x ∈ D. Dann ist ϕ zweimal differenzierbar und es gilt ϕ′ (x0 ) = 0, ϕ′′ (x0 ) < 0. Nach Satz 5.10 hat daher ϕ in x0 ein isoliertes lokales Maximum, das heißt, es existiert ein h > 0 mit [x0 − h, x0 + h] ⊂ D, so dass ϕ(x0 − h) < ϕ(x0 ), während ϕ(x0 + h) < ϕ(x0 ) ist. Deshalb gilt f (x0 ) = ϕ(x0 ) > 1 1 (ϕ(x0 − h) + ϕ(x0 + h)) = (f (x0 − h) + f (x0 + h)). 2 2 Mit λ = 21 , x1 = x0 − h und x2 = x0 + h folgt, dass f nicht konvex ist. ⊓ ⊔ Definition 5.7. Sei D ⊂ R ein offenes Intervall und f : D −→ R stetig. Der Punkt x0 ∈ D heißt Wendepunkt, wenn eine Umgebung (x0 − ε, x0 + ε) ⊂ D von x0 existiert, so dass entweder f |(x0 −ε,x0 ) konkav und f |(x0 ,x0 +ε) konvex ist oder Umgekehrtes gilt. Satz 5.12 Sei f : (a, b) ⊂ R −→ R zweimal stetig differenzierbar. Ist x0 ∈ (a, b) ein Wendepunkt von f , so gilt f ′′ (x0 ) = 0. Beweis: Folgerung aus Satz 5.11 ⊓ ⊔ Bemerkung: Der Mittelwertsatz der Differentialrechnung gilt nicht für vektorwertige Funktionen. Wir betrachten dazu die Funktion f : [0, 2π] −→ R2 t 7→ f (t) = (cos(t), sin(t)). (0) Es gilt f (2π) − f (0) = (0, 0), also f (2π)−f = 0. Betrachten wir aber die Ab2π−0 ′ ′ leitung f , dann erhalten wir f (t) = (− sin(t), cos(t)). Somit ist |f ′ (t)| = 1, d.h. f ′ (t) 6= 0 für alle t ∈ [0, 2π]. 2 5.2 Der Mittelwertsatz der Differentialrechnung 191 Satz 5.13 (Mittelwertsatz für Vektorfunktionen) Sei (E, k·k) ein normierter Vektorraum, f : [a, b] −→ E stetig und auf (a, b) differenzierbar. Dann existiert ein Punkt x0 ∈ (a, b), so dass gilt kf (b) − f (a)k ≤ (b − a)kf ′ (x0 )k. Zum Beweis des Satzes benötigen wir das folgende Lemma: Lemma 5.8. Sei f : [a, b] −→ E in x0 ∈ (a, b) differenzierbar, seien k→∞ k→∞ (αk ), (βk ) ⊂ [a, b] Folgen mit αk < x0 < βk , αk −→ x0 , und βk −→ x0 für alle k ∈ N. Dann gilt lim k→∞ f (βk ) − f (αk ) = f ′ (x0 ). βk − αk Beweis: Wir betrachten yk := βk −x0 βk −αk ∈ (0, 1). Es gilt f (βk ) − f (αk ) − f ′ (x0 ) βk − αk f (βk ) − f (x0 ) f (αk ) − f (x0 ) ′ ′ = yk − f (x0 ) + (1 − yk ) − f (x0 ) . |{z} | {z } βk − x0 αk − x0 {z } {z } | | beschr. beschr. k→∞ k→∞ −→0 −→0 ⊓ ⊔ Damit folgt die Behauptung. Beweis:[des Satzes 5.13] und M := kf (b) − f (a)k. Wir betrachten die Funktion g : Sei L := b−a 3 [a, a + 2L] ⊂ R −→ E, definiert durch g(s) := f (s + L) − f (s). Dann folgt g(a) + g(a + L) + g(a + 2L) = f (b) − f (a) und somit M ≤ kg(a)k + kg(a + L)k + kg(a + 2L) (⋆). Wir zeigen zunächst, dass ein s1 ∈ (a, a + 2L) mit kg(s1 )k ≥ 31 M existiert. Wir nehmen an, dass für alle s1 ∈ (a, a + 2L) gilt kg(s1 )k < 13 M . Da g : [a, a + 2L] −→ E stetig ist, erhalten wir auch kg(a)k ≤ 1 M, 3 kg(a + 2L)k ≤ 1 M, 3 im Widerspruch zu (⋆). Sei nun t1 := s1 + L ∈ (a, b). Dann gilt (1) a < s1 < t1 < b und t1 − s1 = L = (2) kg(s1 )k = kf (t1 ) − f (s1 )k ≥ 1 M. 3 b−a , 3 192 5 Differentialrechnung für Funktionen einer reellen Veränderlichen Wir wiederholen nun diese Konstruktion, indem wir statt des Intervalls [a, b] das Intervall [s1 , t1 ] betrachten. Dadurch erhalten wir Folgen (sn ) und (tn ), so dass gilt tn − s n = 1 (b − a), 3n kf (tn ) − f (sn )k ≥ 1 · M, 3n [sn , tn ] ⊂ [sn−1 , tn−1 ]. Wir haben also eine Intervallschachtelung In := [sn , tn ], bei der die Länge der Intervalle In gegen 0 konvergiert. Nach dem Satz über die Intervallschachte∞ T In = {x0 }. Es gilt somit lung existiert dann ein x0 ∈ R mit n=1 sn −→ x0 , und tn −→ x0 , sn < x0 < tn kf (tn ) − f (sn )k M M ≥ = . n tn − s n (tn − sn ) · 3 b−a Aus Lemma 5.8 folgt nun f ′ (x0 ) = lim n→∞ f (tn ) − f (sn ) tn − s n und damit kf (tn ) − f (sn )k f (tn ) − f (sn ) k = lim n→∞ tn − s n tn − s n M kf (b) − f (a)k ≥ = . b−a b−a kf ′ (x0 )k = k lim n→∞ ⊓ ⊔ Satz 5.14 Sei f : [a, b] −→ E stetig–differenzierbar. Dann ist f Lipschitzstetig. Beweis: Nach Voraussetzung ist f ′ ∈ C([a, b], E). Folglich existiert kf ′ k∞ := max{kf ′ (x)kE | x ∈ [a, b]} ∈ R. Seien x1 , x2 ∈ [a, b] und o.B.d.A. x1 > x2 . Dann folgt aus Satz 5.13, dass ein ξ ∈ [x2 , x1 ] existiert, so dass kf (x1 ) − f (x2 )k ≤ kf ′ (ξ)kE · |x1 − x2 | ≤ kf ′ k∞ ·kx1 − x2 k. | {z } =:L Dies aber bedeutet, dass f Lipschitz-stetig mit der Lipschitz-Konstanten L ist. ⊓ ⊔ 5.2 Der Mittelwertsatz der Differentialrechnung 193 Die Regeln von L’Hospital Satz 5.15 Sei [a, b] ⊂ R ein beschränktes Intervall und x0 ∈ [a, b]. Es seien f, g : (a, b) \ {x0 } −→ R differenzierbare Funktionen mit (1) lim f (x) = lim g(x) ∈ {0, ±∞}, x→x0 x→x0 (2) g ′ (x) 6= 0 für alle x ∈ (a, b) \ {x0 }, ′ (x) (3) lim fg′ (x) = c ∈ R ∪ {±∞}. x→x0 f (x) x→x0 g(x) Dann gilt lim = c. Beweis: 1. Fall: lim f (x) = lim g(x) = 0. x→x0 x→x0 Wir setzen f und g in x0 durch f (x0 ) := g(x0 ) := 0 fort. Dann sind f, g : (a, b) −→ R stetig in x0 . Wir betrachten nun eine Folge (xn ), die gegen x0 konvergiert, wobei xn 6= x0 für alle n ∈ N gelten soll. Dann sind f, g : [xn , x0 ] −→ R stetig und in (xn , x0 ) differenzierbar, falls xn < x0 (ansonsten betrachten wir [x0 , xn ]). Weiterhin gilt f (x0 ) = g(x0 ) = 0. Nach dem verallgemeinerten Mittelwertsatz (5.7) existiert ein ξn ∈ (xn , x0 ) (bzw. ξn ∈ (x0 , xn )), so dass gilt f (xn )g ′ (ξn ) = g(xn )f ′ (ξn ). Nach dem Satz von Rolle (5.6) ist g(xn ) 6= 0 = g(x0 ). Anderenfalls existierte ein ξˆn ∈ (xn , x0 ) (bzw. ein ξˆn ∈ (x0 , xn )), so dass g ′ (ξˆn ) = 0 wäre, im Widerspruch zur Voraussetzung (1). Damit folgt f (xn ) f ′ (ξn ) = ′ . g(xn ) g (ξn ) Da (xn ) gegen x0 konvergiert, ist auch (ξn ) gegen x0 konvergent und wir erhalten f ′ (x) f ′ (ξn ) f (xn ) = lim ′ = lim ′ = c. lim n→∞ g (ξn ) x→x0 g (x) n→∞ g(xn ) f ′ (x) ′ x→x0 g (x) 2. Fall: lim g(x) = +∞ und lim x→x0 = 0. Es sei ε > 0 und (xn ) eine gegen x0 konvergente Folge mit xn < x0 . Dann existiert ein x⋆ ∈ (a, x0 ), so dass für alle x ∈ (x∗ , x0 ) gilt ′ f (x) < ε. g(x) > 0, und ′ g (x) Weiterhin gilt f (x⋆ ) f (xn ) − f (x⋆ ) g(x⋆ ) f (xn ) . (⋆) = + · 1− g(xn ) g(xn ) g(xn ) − g(x⋆ ) g(xn ) 194 5 Differentialrechnung für Funktionen einer reellen Veränderlichen Ab einem Index n0 ist jedes xn ∈ (x⋆ , x0 ). Durch Anwendung des verallgemeinerten Mittelwertsatzes auf das Intervall [x⋆ , xn ] erhalten wir daher, dass für alle n ≥ n0 ein ξn ∈ (x⋆ , xn ) existiert, so dass f ′ (ξn ) f (xn ) − f (x⋆ ) = . g(xn ) − g(x⋆ ) g ′ (ξn ) Eingesetzt in Gleichung (⋆), ergibt dies ⋆ f (xn ) f (x⋆ ) f ′ (ξn ) ≤ + 1 − g(x ) g(xn ) g(xn ) g ′ (ξn ) g(xn ) | {z } <ε und damit ∗ f (xn ) f (x∗ ) ≤ + ε 1 − g(x ) . g(xn ) g(xn ) g(xn ) n→∞ Da g(xn ) gegen +∞ für xn −→ x0 konvergiert, folgt f (x⋆ ) g(x⋆ ) −→ 0, =0 lim g(xn ) n→∞ g(xn ) und somit f (xn ) < ε. lim sup g(xn ) n→∞ ε kann beliebige Werte annehmen kann, deshalb erhalten wir f (xn ) =0 lim n→∞ g(xn ) für alle Folgen (xn ) mit xn −→ x0 , xn < x0 . Analog behandelt man Folgen xn −→ x0 mit xn > x0 . Somit gilt für alle Folgen (xn ) mit xn −→ x0 lim f (xn ) = 0, g(xn ) lim f (x) = 0. g(x) n→∞ also x→x0 f ′ (x) ′ x→x0 g (x) 3. Fall: lim g(x) = +∞ und lim x→x0 = c ∈ R beliebig, aber endlich. Wir betrachten die Funktion f1 (x) := f (x) − c · g(x). Dann ist lim x→x0 f1′ (x) f ′ (x) = lim ′ − c = 0. ′ x→x0 g (x) g (x) Da lim g(x) = ∞ ist, können wir den Fall 2 anwenden und erhalten x→x0 5.2 Der Mittelwertsatz der Differentialrechnung lim x→x0 195 f1 (x) = 0. g(x) Daraus folgt lim x→x0 f (x) f1 (x) = c + lim = c. x→x0 g(x) g(x) f ′ (x) ′ x→x0 g (x) 4. Fall: lim f (x) = lim g(x) = +∞ und lim x→x0 x→x0 ′ g (x) ′ x→x0 f (x) Dann gilt lim = ∞. g(x) x→x0 f (x) = 0 und aus Fall (2) folgt sofort lim = 0. Da f (x) und g(x) für x −→ x0 gegen +∞ konvergieren, sind f und g positiv in einer (x) Umgebung von x0 . Folglich gilt lim fg(x) = +∞. x→x0 5. Fall: lim f (x) = lim g(x) = +∞. x→x0 f ′ (x) ′ x→x0 g (x) Dann ist lim x→x0 = −∞ unmöglich, denn sonst wäre f oder g in einer ⊓ ⊔ Umgebung von x0 eine monoton fallende Funktion. Satz 5.16 Seien f, g : (a, ∞) −→ R differenzierbar und g ′ (x) 6= 0 für alle ′ (x) = c ∈ x ∈ (a, ∞). Ist lim f (x) = lim g(x) ∈ {0, ±∞} und lim fg′ (x) x→∞ x→∞ R ∪ {±∞}, so gilt lim x→∞ x→∞ f (x) = c. g(x) Beweis: O.B.d.A. sei a > 0. Wir betrachten die Funktionen f1 (x) = f ( x1 ) und g1 (x) = g( x1 ) auf dem Intervall (0, a1 ). Dann gilt 1 ′ 1 1 ′ 1 ′ ′ und g1 (x) = − 2 g 6= 0 f1 (x) = − 2 f x x x x und daher f ′ ( x1 ) Vor. f1′ (x) = c = lim ′ (x) x→0 g ′ ( 1 ) x→0 g1 x lim Mit Satz 5.15 folgt dann lim x→∞ f (x) f1 (x) = lim = c. x→0 g1 (x) g(x) ⊓ ⊔ Beispiele: 1 ln(1+x) = lim 1+x = x x→0 x→0 1 ex ex −1 = lim 1 = 1, lim x→0 x→0 x (1) lim (2) 1 1 1, lim 1 (3) lim (cos x) x = lim e x ln(cos x) = ex→0 x x→0 x→0 1. ln(cos x) lim 1 = ex→0 cos x ·(− sin x) = e0 = 196 5 Differentialrechnung für Funktionen einer reellen Veränderlichen 5.3 Differentiation von Funktionenfolgen und -Reihen Sei fn : [a, b] −→ R eine Folge differenzierbarer Funktionen, die gleichmäßig gegen eine Funktion f konvergiert. Dann muß (fn′ ) im Allgemeinen nicht konvergieren. Sei zum Beispiel fn (x) = n1 sin(nx). Dann konvergiert (fn ) gleichmäßig auf [0, 2π] gegen 0, aber fn′ (x) = cos(nx) konvergiert in keinem Punkt x 6= 0. Für x = π gilt z.B. ( 1, k gerade fk′ (π) = −1, k ungerade. Satz 5.17 Sei E ein Banachraum, fn : [a, b] ⊂ R −→ E differenzierbar für alle n ∈ N und gelte (1) ∃ x0 ∈ [a, b] : (fn (x0 )) konvergiert in E, (2) (fn′ ) konvergiert gleichmäßig auf [a, b]. Dann konvergiert auch (fn ) gleichmäßig auf [a, b] gegen eine Funktion f : [a, b] −→ E. f ist differenzierbar und es gilt f ′ (x) = lim fn′ (x). n→∞ Das heißt: lim und d dx sind vertauschbar. Beweis: (1) Sei ε > 0. Da (fn (x0 )) konvergent ist, existiert ein n0 ∈ N, so dass für alle m ≥ n ≥ n0 ε kfn (x0 ) − fm (x0 )k < (A) 2 gilt. Weil (fn′ ) gleichmäßig konvergiert, gibt es ein n0 ∈ N, so dass für alle t ∈ [a, b] und für alle m ≥ n ≥ n0 ′ kfn′ (t) − fm (t)k < ε . 2(b − a) (B) gilt. Wir wenden den Mittelwertsatz für Vektorfunktionen auf fn − fm : [a, b] −→ E an: Für zwei Werte x, t ∈ [a, b] existiert ein ϑm,n ∈ [x, t] (bzw. ∈ [t, x]) mit ′ kfn (x) − fm (x) − fn (t) + fm (t)k ≤ |x − t| · kfn′ (ϑm,n ) − fm (ϑm,n )k. Mit (A) folgt dann ∀ m ≥ n ≥ n0 und ∀ x, t ∈ [a, b] kfn (x) − fm (x) − fn (t) + fm (t)k ≤ |x − t| · ε ε ≤ . 2(b − a) 2 (C) Daher ist für t = x0 mit (C) und (A) kfn (x) − fm (x)k ≤ kfn (x) − fm (x) − fn (x0 ) + fm (x0 )k + kfn (x0 ) − fm (x0 )k ε ε < + = ε. (D) 2 2 5.3 Differentiation von Funktionenfolgen und -Reihen 197 für alle m ≥ n ≥ n0 und für alle x, t ∈ [a, b]. Somit ist (fn (x)) eine (gleichmäßige) Cauchyfolge in E. Da E vollständig ist, existiert eine Funktion f : [a, b] −→ E, so dass ∀ x ∈ [a, b]. f (x) = lim fn (x) n→∞ Gehen wir in (D) mit m gegen ∞, so folgt ∀ x ∈ [a, b] ∀ n ≥ n0 : kfn (x) − f (x)k < ε. Daher konvergiert (fn ) gleichmäßig gegen f auf [a, b]. (2) Es ist zu zeigen, dass f differenzierbar ist und f ′ (x) = lim fn′ (x) gilt. n→∞ Sei x ∈ [a, b] fest. Wir definieren ϕn : [a, b] −→ E durch ϕn (t) := Da fn stetig und lim t→x fn (t)−fn (x) t−x Für x 6= t gilt mit (C) fn (t)−fn (x) t−x fn′ (x) x 6= t x = t. = fn′ (x) existiert, ist ϕn : [a, b] −→ E stetig. 1 kfn (t) − fm (t) − fn (x) + fm (x)k |t − x| ε ∀ n, m ≥ n0 . ≤ 2(b − a) kϕn (t) − ϕm (t)k = Da ϕn − ϕm stetig ist, haben wir auch eine Abschätzung für x = t. Also ist kϕn (t) − ϕm (t)k ≤ ε 2(b − a) ∀ n, m ≥ n0 ∀ t ∈ [a, b]. Somit konvergiert die Folge (ϕn ) gleichmäßig auf [a, b] für festes x ∈ [a, b]. Wir setzen ϕ(t) = lim ϕn (t). Da ϕn stetig ist für alle n ∈ N und die Folge n→∞ (ϕn ) gleichmäßig gegen ϕ konvergiert, ist auch ϕ stetig. Wir erhalten ϕ(x) = lim ϕ(t) = lim lim ϕn (t) t→x t→x n→∞ f (t) − f (x) fn (t) − fn (x) = lim . = lim lim t→x t→x n→∞ t−x t−x Folglich ist f in x ∈ [a, b] differenzierbar und es gilt f ′ (x) = ϕ(x) = lim ϕn (x) = lim fn′ (x). n→∞ Als Anwendung erhalten wir n→∞ ⊓ ⊔ 198 5 Differentialrechnung für Funktionen einer reellen Veränderlichen Satz 5.18 Sei E ein Banachraum und fn : [a, b] −→ E eine Folge differenzierbarer Funktionen mit ∞ P (1) fn (x0 ) konvergiert für mindestens ein x0 ∈ [a, b]. (2) n=1 ∞ P n=1 fn′ konvergiert gleichmäßig auf [a, b]. Dann konvergiert ∞ P fn gleichmäßig auf [a, b], die Grenzfunktion n=1 f (x) := ∞ X fn (x) n=1 ist differenzierbar und d f (x) = dx ′ ∞ X ! fn (x) n=1 = ∞ X fn′ (x). n=1 Anwendung auf Potenzreihen Satz 5.19 Sei E ein Banachraum und P (x) = ∞ P n=0 an (x − x0 )n eine Potenz- reihe mit dem Zentrum x0 ∈ R, dem Konvergenzradius R und an ∈ E. Dann ist P : (x0 − R, x0 + R) ⊂ R −→ E differenzierbar und es gilt ′ P (x) = ∞ X n=1 an n(x − x0 )n−1 . Beweis: Sei fn (x) := an (x − x0 )n . Nach Satz 5.18 ist fn : R −→ E differenzierbar und es gilt fn′ (x) = an n(x − x0 )n−1 , f0′ (x) = 0. Offensichtlich konvergiert P (x) für x = x0 . Wir betrachten nun die Reihe Q(x) := ∞ X n=1 n · an (x − x0 )n−1 = ∞ X fn′ (x). n=0 und berechnen den Konvergenzradius der Potenzreihe Q: λ := lim sup n→∞ p p 1 n nkan k = lim sup n kan k = , R n→∞ wobei R der Konvergenzradius von P ist. Folglich ist R auch der Konvergenzradius von Q. 5.3 Differentiation von Funktionenfolgen und -Reihen 199 Nach Satz 4.30 konvergiert Q gleichmäßig auf jedem kompakten Teilintervall des Konvergenzintervalls (x0 − R, x0 + R). P ist also für alle ε > 0 auf dem Intervall Iε = [x0 − R + ε, x0 + R − ε] differenzierbar und es gilt P ′ (x) = ∞ X n=1 nan (x − x0 )n−1 ∀ x ∈ Iε . ⊓ ⊔ Mit ε gegen 0 folgt die Behauptung. Anwendung: Berechnung von π. Dazu betrachten wir arctan : R −→ (− π2 , π2 ). R π 6 2 π 4 • arctan - 1 R − π2 Einerseits gilt arctan′ (x) = 1 1+x2 (Übungsaufgabe). Andererseits folgt aus ∞ P 1 (−x2 )k = 1+x der geometrischen Reihe für x ∈ (−1, 1), dass 2 . Folglich ′ gilt arctan (x) = ∞ P k=0 k 2k (−1) x k=0 für alle x ∈ (−1, 1). Die Reihe ∞ P (−1)k x2k k=0 konvergiert auf (−1, 1) und ist die Ableitung der auf (−1, 1) konvergenten Potenzreihe ∞ X x2k+1 Q(x) = (−1)k . 2k + 1 k=0 Folglich ist arctan′ (x) = Q′ (x) auf (−1, 1) und es gilt arctan(x) = Q(x) + C, Q(0) = 0, arctan(0) = 0 Daher ist C = 0 und damit arctan(x) = ∞ X k=0 (−1)k x2k+1 , 2k + 1 für alle |x| < 1. Nach dem Leibnizkriterium für alternierende Reihen ist Q(1) = 1 − 31 + 15 − 1 7 ± . . . konvergent und es gilt Q(−1) = −Q(1). Nach dem abelschen Grenzwertsatz (Satz 4.31) ist damit Q in x = ±1 (einseitig) stetig und Q(±1) = lim Q(x) = lim arctan(x) = arctan(±1). x→±1 Wir erhalten x→±1 200 5 Differentialrechnung für Funktionen einer reellen Veränderlichen arctan x = ∞ P 2k+1 (−1)k x2k+1 ∀ |x| ≤ 1. k=0 Da arctan(1) = π 4 ist, gilt die Leibnizformel π 1 1 1 = 1 − + − ± .... 4 3 5 7 Diese Reihe konvergiert sehr langsam gegen π4 . Man benötigt 1000 Summanden, um π auf 3 Stellen genau zu erhalten. Schneller konvergente Reihen erhält man folgendermaßen: Durch Umkehrung der Additionstheoreme folgt x+y arctan(x) + arctan(y) = arctan 1−x·y und daher mit x = y = 1 5 2 arctan bzw. mit x = y = (x · y 6= 1) 5 1 = arctan , 5 12 5 12 2 arctan 5 12 = arctan 120 119 . 1 239 in obige Formel liefert 1 120 arctan(1) + arctan = arctan . 239 119 Einsetzen von x = 1 und y = Daraus folgt π = arctan(1) 4 1 1 − arctan 5 239 2k+1 X 2k+1 ∞ ∞ X 1 (−1)k (−1)k 1 − . =4· 2k + 1 5 2k + 1 239 = 4 · arctan (∗) (⋆⋆) k=0 k=0 (∗) heißt die Machinsche Formel. Ist ∞ P (−1)k ak eine alternierende Reihe mit k=0 monoton fallender Nullfolge (ak ), ak > 0 für alle k ∈ N0 , dann erhält man für den Fehler bei der Näherungsrechnung (nach Satz 3.9) |s − n X k=0 (−1)k ak | ≤ an+1 . 5.4 Taylorreihen 201 Für den Fehler F1 bei Addition von 8 Reihengliedern der ersten Reihe in (⋆⋆) gilt 1 4 · 17 < 4 · 10−13 . F1 ≤ |17 {z5 } =a8 Für den Fehler F2 bei Addition von 2 Reihengliedern der zweiten Reihe in (⋆⋆) gilt 1 1 < 3 · 10−13 . F2 ≤ · 5 5 239 | {z } a2 Somit ist der Fehler bei Addition der ersten 8 Reihenglieder kleiner als 3·10−12 und wir erhalten eine Näherung für π: π = 3.1415926535 + R, |R| < 10−11 . 5.4 Taylorreihen Das Ziel dieses Abschnitts ist die Approximation von Funktionen durch Polynome und die Entwicklung von Funktionen in Reihen. Dazu werden wir zunächst zur Abkürzung einige Bezeichnungen einführen. Die Landau-Symbole Sei h : I ⊂ R → E eine Funktion mit Werten in einem reellen normierten Vektorraum E, g : I ⊂ R → R eine reellwertige Funktion und x0 ∈ I. • h(x) = o(g(x)) für x → x0 , ist die Abkürzung für die Eigenschaft lim x→x0 • h(x) = O(g(x)) für x → x0 , ist die Abkürzung dafür, dass es eine Konstante C > 0 und ein Intervall (x0 − ε, x0 + ε) gibt mit kh(x)k ≤ C |g(x)| • • h(x) = 0. g(x) für alle x ∈ (x0 − ε, x0 + ε) ∩ I. h1 (x) = h2 (x)+o(g(x)) für x → x0 , ist die Abkürzung für h1 (x)−h2 (x) = o(g(x)) für x → x0 . Analog für O(g(x)). Insbesondere heißt h(x) = o((x − x0 )n ) für x → x0 , dass lim x→x0 h(x) = 0. (x − x0 )n h(x) geht für x → x0 also schneller gegen 0 als (x − x0 )n . Man sagt auch h verschwindet in x0 von höherer als n-ter Ordnung “. ” Für h1 (x) = h2 (x) + o((x − x0 )n ) für x → x0 , sagt man auch h2 appro” ximiert h1 in x0 von höherer als n-ter Ordnung “. 202 • 5 Differentialrechnung für Funktionen einer reellen Veränderlichen Zur Eigenschaft h(x) = O((x − x0 )n ) für x → x0 , d. h. kh(x)k ≤ C |x − x0 |n , für alle x ∈ (x0 − ε, x0 + ε) ∩ I sagt man auch h wächst in x0 von höchstens n-ter Ordnung “. ” Definition 5.9. Sei U ⊂ R offen und E ein normierter Vektorraum. Eine Abbildung f : U ⊂ R −→ E ∞ P ak (x − x0 )k , mit heißt reell–analytisch in x0 ∈ U , falls eine Potenzreihe k=0 ak ∈ E für alle k ∈ N0 , Zentrum x0 ∈ R und positivem Konvergenzradius ρ(x0 ) > 0 existiert, so dass gilt f (x) = ∞ X k=0 ak (x − x0 )k , ∀ x ∈ U ∩ (x0 − ρ, x0 + ρ). Bemerkung: (1) Man sagt auch: f ist in einer Umgebung von x0 in eine Potenzreihe entwickelbar. (2) f : U ⊂ R −→ E heißt reell–analytisch, wenn f in jedem Punkt x0 ∈ U reell–analytisch ist. (3) C w (U ; E) bezeichne den Vektorraum der reell–analytischen Funktionen. Beispiele (1) Jede Potenzreihe f (x) := ∞ P k=0 ak (x − x0 )k mit Konvergenzradius ρ > 0 ist in x0 reell–analytisch. (2) exp, sin, cos, sinh, cosh sind reell–analytisch auf R. Satz 5.20 Sei E ein Banachraum und f : U ⊂ R −→ E reell–analytisch in x0 ∈ U . Dann ist f in einer Umgebung Ũ von x0 unendlich oft stetig differenzierbar und es gilt: f (x) = Beweis: Sei f (x) = ∞ X f (n) (x0 ) · (x − x0 )n , n! n=0 ∞ P k=0 ∀ x ∈ Ũ . ak (x − x0 )k für alle x ∈ U ∩ (x0 − ρ, x0 + ρ) =: Ũ . Nach Satz 5.19 existiert f ′ auf Ũ und f ′ (x) = ∞ X k=1 k · ak (x − x0 )k−1 , ∀ x ∈ Ũ . 5.4 Taylorreihen 203 Diese Potenzreihe hat den gleichen Konvergenzradius wie f . Nach Satz 5.19 existiert wiederum f ′′ (x) mit f ′′ (x) = ∞ X k=2 k(k − 1)ak (x − x0 )k−2 , ∀ x ∈ Ũ . Durch weiteres Anwenden des Satzes 5.19 erhalten wir alle Ableitungen von f in der Umgebung Ũ von x0 : f (n) (x) = ∞ X k=n k(k − 1) · . . . · (k − n + 1)ak (x − x0 )k−n . Da offensichtlich für jedes n ∈ N0 f (n) (x0 ) = n! · an ⊓ ⊔ gilt, folgt die Behauptung. Wir suchen nun nach einer hinreichenden Bedingung dafür, dass eine Funktion f : U ⊂ R −→ E in einem Punkt x0 reell–analytisch ist. Definition 5.10. Sei I ⊂ R ein beliebiges Intervall, x0 ∈ I und f : I −→ E n–mal in x0 differenzierbar. Dann heißt Tn (f, x0 )(x) := n X f (k) (x0 ) k=0 k! (x − x0 )k n–tes Taylorpolynom von f in x0 . Sei f : I ⊂ R −→ E unendlich oft differenzierbar in x0 ∈ U . Dann heißt die Reihe ∞ X f (k) (x0 ) T (f, x0 )(x) := (x − x0 )k k! k=0 Taylorreihe von f in x0 (formale Reihe). Bemerkung: (a) Tn (f, x0 )(x) ist n–te Partialsumme von T (f, x0 )(x). (b) Tn (f, x0 ) ist n–mal differenzierbar und es gilt dl Tn (f, x0 )(x0 ) = f (l) (x0 ), dxl ∀l ≤ n 204 5 Differentialrechnung für Funktionen einer reellen Veränderlichen Definition 5.11. Sei f : I → E (I ⊂ R Intervall, E Banachraum) n-fach differenzierbar. Dann heißt Rn (f, x0 ) := f − Tn (f, x0 ) ∈ C (n) (I, E) das n-te Restglied von f in x0 . Rn beschreibt also die Abweichung des n-ten Taylorpolynoms von f . Satz 5.21 Sei f : I ⊂ R −→ E n–mal differenzierbar, x0 ∈ I. Dann gilt (1) (2) d(l) (Rn (f, x0 ))(x0 ) = 0, (dx)(l) kRn (f, x0 )(x)k = 0. lim x→x0 |x − x0 |n ∀ l ∈ {0, . . . , n}, Beweis: Wir beweisen den Satz durch Induktion über n: Ind.–Anfang: Sei n = 1. Dann definiert T1 (f, x0 ) die Tangente an den Graphen graph(f ) der Funktion f in (x0 , f (x0 )), das heißt, die Behauptung ist erfüllt. Ind.–Voraussetzung: Die Behauptung sei für n richtig. Ind.–Behauptung: Die Behauptung ist für n + 1 richtig. Ind.–Beweis: Sei f : I ⊂ R −→ E (n + 1)–mal differenzierbar. Dann ist Rn+1 := Rn+1 (f, x0 ) = f − Tn+1 (f, x0 ) (l) (n + 1)–mal differenzierbar und Rn+1 (x0 ) = 0 für alle l ∈ {0, . . . , n + 1}. Wir ′ ′ betrachten nun die Funktion Rn+1 : I −→ E. Offensichtlich ist Rn+1 n–mal ′ (l) differenzierbar und es gilt (Rn+1 ) (x0 ) = 0 für alle l ∈ {0, . . . , n}. Folglich ′ ist Tn (Rn+1 , x0 ) ≡ 0 auf I und es gilt nach Induktionsvoraussetzung lim x→x0 ′ kRn+1 (x)k = 0. |x − x0 |n Folglich existiert für alle ε > 0 ein δ > 0, so dass ′ kRn+1 (x)k <ε |x − x0 |n für alle x mit 0 < |x − x0 | < δ (⋆). Sei x ∈ I mit 0 < |x − x0 | < δ. Dann ist Rn+1 auf [x, x0 ] bzw. [x0 , x] differenzierbar und nach dem Mittelwertsatz für Vektorfunktionen existiert ein ξ ∈ (x, x0 ) bzw. ξ ∈ (x0 , x), so dass gilt (⋆) ′ (ξ)kE |x − x0 | < ε · |x − x0 |n+1 . kRn+1 (x) − Rn+1 (x0 ) kE ≤ kRn+1 | {z } =0 Wir erhalten kRn+1 (x)k |x−x0 |n+1 < ε für alle x mit 0 < |x − x0 | < δ und somit 5.4 Taylorreihen lim x→x0 205 kRn+1 (f, x0 )(x)k = 0. |x − x0 |n+1 ⊓ ⊔ Eigenschaft (2) von Satz 5.21 besagt, dass Tn (f, x0 ) die Funktion f in der Umgebung von x0 in höherer als n–ter Ordnung approximiert: f (x) = Tn (f, x0 ) + o((x − x0 )n ) für x → x0 . Die Taylorreihe T (f, x0 )(x) konvergiert nicht in jedem Fall und wenn sie es tut, muss sie nicht notwendigerweise gegen die Funktion f konvergieren: Beispiel 5.1 Die Taylorreihe kann den Konvergenzradius 0 haben. Wir zitieren dazu den Satz von Borel: Seien c0 , c1 , c2 , . . . beliebige reelle Zahlen. Dann existiert eine C ∞ –Funktion f : R −→ R mit ∞ X T (f, 0) = cn xn . n=0 Diese Reihe ist im Allgemeinen nicht konvergent. Der Beweis dieses Satzes kann z.B. in R. Narasimham: Analysis on real and complex manifolds, Nord ” Holland, 1968“, nachgelesen werden. Beispiel 5.2 Die Taylorreihe T (f, x0 ) kann den Konvergenzradius ρ = ∞ haben, aber es gilt T (f, x0 )(x) 6= f (x). Sei zum Beispiel −1 e x2 f ür x > 0 f (x) := 0 f ür x ≤ 0. Dann ist f (k) (0) = 0 für alle k ∈ N0 und f eine C ∞ –Funktion (siehe Übungsaufgabe 94). Also ist T (f, 0)(x) ≡ 0, aber f (x) 6= 0 für alle x > 0. Wir möchten nun untersuchen, wann die Taylorreihe T (f, x0 )(x) konvergiert und insbesondere, wann sie gegen f (x) konvergiert. Satz 5.22 Sei f : I ⊂ R −→ E eine C ∞ –Funktion und x0 ∈ I. Wenn für x ∈ I gilt lim kRn (f, x0 )(x)kE = 0, n→∞ so konvergiert T (f, x0 )(x) und es gilt f (x) = T (f, x0 )(x). Beweis: Für alle n ≥ 0 ist f (x) = Tn (f, x0 )(x) + Rn (f, x0 )(x). Folglich gilt n→∞ kf (x) − Tn (f, x0 )(x)k = kRn (f, x0 )(x)k −→ 0, 206 5 Differentialrechnung für Funktionen einer reellen Veränderlichen und daher lim Tn (f, x0 )(x) = T (f, x0 )(x) = f (x). n→∞ Im Fall f : I −→ R kann man das Restglied explizit angeben: ⊓ ⊔ Satz 5.23 Sei I ⊂ R ein beliebiges Intervall, x0 ∈ I, f : I −→ R (n + 1)–mal differenzierbar und Rn (f, x0 ) := f − Tn (f, x0 ) das Restglied. Dann existieren ϑ, θ ∈ (0, 1), so dass gilt Rn (f, x0 )(x) = f (n+1) (x0 + ϑ(x − x0 )) (x − x0 )n+1 (n + 1)! Lagrange-Form des Restgliedes Rn (f, x0 )(x) = f (n+1) (x0 + θ(x − x0 )) (1 − θ)n (x − x0 )n+1 Cauchy-Form n! des Restgliedes. Beweis: Sei x ∈ I fest. Wir definieren eine differenzierbare Funktion g : I −→ R durch g(y) := f (x) − Tn (f, y)(x). Dann ist g(x) = 0, g(x0 ) = Rn (f, x0 )(x) und ! n (k) X f (y) d (x − y)k g ′ (y) = − dy k! k=0 n (k+1) X f (k) (y) f (y) k k−1 (x − y) − k(x − y) =− k! k! k=0 (x − y)n (n+1) =− f (y). n! (2) Nach dem Mittelwertsatz der Differentialrechnung existiert ein θ ∈ (0, 1), so dass =y z }| { g(x) − g(x0 ) = g (x0 + θ(x − x0 )) · (x − x0 ) (x − x0 )n+1 (1 − θ)n (n+1) f (x0 + θ(x − x0 )). =− n! ′ Folglich ist Rn (f, x0 )(x) = (1 − θ)n (x − x0 )n+1 (n+1) f (x0 + θ(x − x0 )). n! (1) Wir betrachten zusätzlich die differenzierbare Funktion h : I −→ R, definiert durch h(y) := (x − y)n+1 . Dann gilt h(x) = 0, h(x0 ) = (x − x0 )n+1 und 5.4 Taylorreihen 207 h′ (y) = −(n + 1)(x − y)n . Nach dem verallgemeinerten Mittelwertsatz existiert daher ein ϑ ∈ (0, 1), so dass (g(x) − g(x0 ))h′ (x0 + ϑ(x − x0 )) = (h(x) − h(x0 ))g ′ (x0 + ϑ(x − x0 )). Für das Restglied folgt Rn (f, x0 )(x) · (n + 1)(x − x0 )n (1 − ϑ)n = (x − x0 )n+1 (x − x0 )n (1 − ϑ)n (n+1) f (x0 + ϑ(x − x0 )). n! und somit (x − x0 )n+1 (n+1) f (x0 + ϑ(x − x0 )). (n + 1)! Rn (f, x0 )(x) = ⊓ ⊔ Bemerkung: Satz 5.23 ermöglicht die Abschätzung des Fehlers bei der Approximation von f (x) durch Tn (f, x0 ). Beispiel 5.1 Die Taylorentwicklung von f (x) = ln(1 + x) in x = 0 auf (−1, 1] ist ln(1 + x) = ∞ P (−1)n+1 · n=1 xn n . Insbesondere gilt für die alternierende, harmonische Reihe ∞ P n=1 (−1)n+1 n = ln(2). Beweis: Die Abbildung f (x) := ln(x + 1) ist auf (−1, ∞) beliebig oft differenzierbar und es gilt f (0) = 0 sowie f (n) (x) = Folglich ist T (f, 0)(x) = ∞ P (n − 1)!(−1)n+1 , (1 + x)n (−1)n+1 · n=1 xn n ∀ n > 0. die Taylorreihe von f in x0 = 0. T (f, 0)(x) konvergiert für alle x ∈ (−1, 1). Zum Beweis betrachten wir die Cauchy–Form des Restgliedes: ∃ θ ∈ (0, 1) : Rn (f, 0)(x) = Ist |x| < 1, so gilt 1−θ 1−θ|x| (−1)n xn+1 f (n+1) (θx) (1 − θ)n (1 − θ)n xn+1 = n! (1 + θx)n+1 < 1. Folglich erhalten wir 208 5 Differentialrechnung für Funktionen einer reellen Veränderlichen |Rn (f, 0)(x)| = |x|n+1 (1 − θ)n . |1 + θx|n+1 Es gilt 1 + θx ≥ 1 − θ|x| > 1 − |x| für alle |x| < 1 und somit folgt n |x|n+1 n→∞ 1−θ |x|n+1 < −→ 0, ∀ |x| < 1. · |Rn (f, 0)(x)| < 1 − |x| 1 − θ|x| 1 − |x| Nach Satz 5.22 konvergiert die Taylorreihe in x0 = 0 für x ∈ (−1, 1) gegen f (x): ∞ X (−1)n+1 n x , ∀ |x| < 1. ln(1 + x) = n n=1 Nach dem Leibnizkriterium (Satz 3.9) existiert T (f, 0)(1) = 1 − 21 + 31 ± . . .. Wenden wir nun den Satz von Abel (Satz 4.31) an, so gilt wegen der Stetigkeit von ln lim ln(1 + x) = lim T (f, 0)(x) = T (f, 0)(1). x→1 x→1 Somit gilt ln(1 + x) = T (f, 0)(x) auch in x = 1. Beispiel 5.2 Sei α ∈ R. Dann gilt für x ∈ (−1, 1): (1 + x)α = ∞ P k=0 Die Reihe ∞ P k=0 α k k x . k x heißt auch Binomialreihe. α k Beweis: (1) f (x) = (1 + x)α ist auf (−1, ∞) beliebig oft differenzierbar und es gilt f (0) = 1 sowie f (k) (x) = α(α − 1) · . . . · (α − k + 1)(1 + x)α−k , und daher α(α − 1) · . . . · (α − k + 1) f (k) (0) = = k! k! α k Die Taylorreihe in x0 = 0 ist damit ∞ X α k T (f, 0)(x) = x k k=0 (2) Wo konvergiert diese Reihe und gegen welchen Wert konvergiert sie? Wir betrachten dazu die Cauchy–Form des Restgliedes 5.4 Taylorreihen 209 f (n+1) (θx) (1 − θx)n xn+1 n! α(α − 1) · . . . · (α − n) = (1 + θx)α−n−1 (1 − θ)n xn+1 n! α−1 = α· (1 − θ)n xn+1 (1 + θx)α−n−1 n n α−1 1−θ xn+1 (1 + θx)α−1 = α· 1 + θx n | {z } Rn (f, 0)(x) = <1 f ür |x|<1 Daher gilt für |x| < 1 α − 1 n x · |αx(1 + θx)α−1 | . |Rn (f, 0)(x)| ≤ {z } | n =M unabh. von n Die Binomialreihe Bα−1 (x) = ∞ P k=0 k x ist konvergent für alle |x| < 1 (siehe α−1 n Übungsaufgabe 62). Folglich gilt (nach Satz 3.2) α − 1 n n→∞ x −→ 0 n n→∞ und somit |Rn (f, 0)(x)| −→ 0 ∀ |x| < 1. Nach Satz 5.22 konvergiert die Taylorreihe für |x| < 1 gegen f (x) = (1 + x)α , das heißt ∞ X α k (1 + x)α = x . k k=0 Anwendung auf Extremwertaufgaben Satz 5.24 (Hinreichende Bedingung für lokalen Extremwert) Sei f : (a, b) −→ R n–mal differenzierbar, n ≥ 2, x0 ∈ (a, b) und sei f (1) (x0 ) = f (2) (x0 ) = . . . = f (n−1) (x0 ) = 0, f (n) (x0 ) 6= 0. Dann gilt: Ist n ungerade, so hat f in x0 keinen lokalen Extremwert. Ist n gerade und f (n) (x0 ) > 0, so hat f in x0 ein isoliertes lokales Minimum. Ist n gerade und f (n) (x0 ) < 0, so hat f in x0 ein isoliertes lokales Maximum. Beweis: Sei zunächst f (n) (x0 ) > 0. Es gilt f (n) (x0 ) = lim x→x0 f (n−1) (x) f (n−1) (x) − f (n−1) (x0 ) = lim >0 x→x0 x − x0 x − x0 210 5 Differentialrechnung für Funktionen einer reellen Veränderlichen Deshalb gibt es ein δ > 0, so dass für alle x mit 0 < |x − x0 | < δ gilt f (n−1) (x) > 0. x − x0 Daraus folgt f (n−1) (x) < 0 auf (x0 − δ, x0 ), f (n−1) (x) > 0 auf (x0 , x0 + δ). Nach Voraussetzung ist f (x) = Tn−2 (f, x0 ) + Rn−2 (f, x0 ) ξ z }| { 1 = f (x0 ) + f (n−1) (x0 + θ(x − x0 ))(x − x0 )n−1 f ür ein θ ∈ (0, 1). (n − 1)! 5.23 Ist n gerade, so ist f (n−1) (ξ)(x − x0 )n−1 > 0 für alle x mit 0 < |x − x0 | < δ. Somit ist f (x) > f (x0 ) für alle x mit 0 < |x − x0 | < δ und f hat in x0 ein lokales Minimum. Ist n nun ungerade, so gilt > 0 auf (x0 , x0 + δ) f (n−1) (ξ)(x − x0 )n−1 < 0 auf (x0 − δ, x0 ). Folglich hat f in x0 keinen lokalen Extremwert. Analog behandelt man f (n) (x0 ) < 0. ⊓ ⊔ Bemerkung: (1) Ist f in x0 ∈ (a, b) ∞-oft differenzierbar und f (n) (x0 ) = 0 für alle n, so kann man keine Aussage machen. (2) Sollen die Extrema von f auf [a, b] bestimmt werden, so sind außer den Stellen x0 ∈ (a, b) mit f ′ (x0 ) = 0 auch noch die Intervallenden zu untersuchen. 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen 6.1 Ableitung, Richtungsableitung und Gradient einer Abbildung Sei E ein reeller, normierter Vektorraum, U ⊂ Rn offen und f : U ⊂ Rn −→ E eine Abbildung. Erinnerung: f : U ⊂ R −→ E heißt differenzierbar in x0 ∈ U falls der Grenzwert f (x0 + h) − f (x0 ) =: f ′ (x0 ) h→0 h lim existiert. Das lässt sich auch schreiben als f (x0 + h) − f (x0 ) = L(h) + o(h) (h → 0) wobei die lineare Abbildung L : R → E definiert ist durch L(h) := f ′ (x0 ) · h. Das motiviert die folgende Definition 6.1. f : U ⊂ Rn → E heißt in x0 differenzierbar, falls eine lineare Abbildung L : Rn −→ E existiert, so dass f (x0 + h) − f (x0 ) = L(h) + o(khk) (h → 0) Das ist äquivalent zu lim h→0 f (x0 + h) − f (x0 ) − L(h) = 0. khk (⋆). 212 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen Die lineare Abbildung L : Rn −→ E heißt Ableitung von f in x0 (auch: Differential von f in x0 , Linearisierung von f in x0 ). f : U ⊂ Rn → E heißt differenzierbar, falls f in jedem x0 ∈ U differenzierbar ist. Symbol: L =: Df (x0 ) Satz 6.1 (1) Ist f : U ⊂ Rn −→ E in x0 ∈ U differenzierbar, so ist die lineare Abbildung L : Rn −→ E aus (⋆) eindeutig bestimmt. (2) Ist f : U ⊂ Rn −→ E in x0 ∈ U differenzierbar, so ist f in x0 stetig. Beweis: (1) Seien L, L̃ : Rn −→ E linear mit Dann folgt f (x0 + h) − f (x0 ) = L(h) + o(khk) e = L(h) + o(khk) (h → 0). e L(h) − L(h) = 0. h→0 khk lim Sei nun x ∈ Rn \{0} und t ∈ R. Betrachten wir die Folgen h := tx für t → 0+ , e so erhalten wir wegen der Linearität von L und L 0 = lim t→0+ = e e L(tx) − L(tx) |t| L(x) − L(x) = lim |t| · kxk kxk t→0+ |t| L(x) − L̃(x) . kxk e Also ist L(x) = L(x) für alle x ∈ Rn . (2) Sei f : U ⊂ Rn −→ E in x0 ∈ U differenzierbar und {xn } eine gegen x0 konvergente Folge. Dann gilt kf (xn )−f (x0 )kE ≤ kf (xn ) − f (x0 ) − L(xn − x0 )kE · kxn − x0 k + kL(xn − x0 )kE . {z } | {z } | kxn − x0 k | {z } →0 →0 →0 n Da jede lineare Abbildung L : R −→ E stetig ist, konvergiert {f (xn )} gegen f (x0 ). Somit ist f in x0 folgenstetig, also auch stetig. ⊓ ⊔ Definition 6.2. Sei f : U ⊂ Rn −→ E eine Abbildung, a ∈ Rn . Man sagt: f besitzt in x0 ∈ U eine Ableitung in Richtung a ∈ Rn , falls folgender Grenzwert existiert f (x0 + ta) − f (x0 ) , t ∈ R. lim t→0 t 6.1 Ableitung, Richtungsableitung und Gradient einer Abbildung ∇a f (x0 ) := lim t→0 f (x0 +ta)−f (x0 ) t 213 heißt die Richtungsableitung von f in Richtung a an der Stelle x0 . f wird also nur entlang der Geraden {x0 + ta | t ∈ R} betrachtet, das heißt, es gilt ∇a f (x0 ) = h′ (0), wobei h die Funktion h(t) := f (x0 + ta) ist. Satz 6.2 Ist f : U ⊂ Rn −→ E in x0 differenzierbar, so besitzt f in x0 in jeder Richtung a die Richtungsableitung und es gilt Df (x0 )(a) = ∇a f (x0 ). Beweis: Sei f in x0 differenzierbar und L = Df (x0 ), L : Rn −→ E. Wir betrachten h = ta. Dann gilt nach Definition der Differenzierbarkeit lim t→0 kf (x0 + ta) − f (x0 ) − L(ta)kE = 0. |t| · kak Da L linear ist, folgt lim k t→0 f (x0 + ta) − f (x0 ) − L(a)k = 0. t Damit existiert ∇a f (x0 ) = lim t→0 f (x0 + ta) − f (x0 ) = L(a) = Df (x0 )(a). t ⊓ ⊔ Eine Funktion kann aber in einem Punkt x0 eine Richtungsableitung besitzen, ohne in diesem Punkt differenzierbar zu sein: Beispiel 6.1 Die Abbildung f : R2 −→ R1 f (x, y) = ( xy 2 x2 +y 4 0 (x, y) 6= (0, 0) (x, y) = (0, 0), ist in x0 = (0, 0) nicht stetig (also auch nicht differenzierbar, siehe Beispiel in Abschnitt 4.1), obwohl in x0 in jeder Richtung die Richtungsableitung existiert: Sei a = (a1 , a2 ) ∈ R2 ein beliebiger Vektor. Dann gilt ( 2 a2 f (x0 + ta) − f (x0 ) f (ta) t3 a1 a22 a1 a22 t→0 a 6= 0 = = = 2 −→ a1 1 4 4 2 2 4 2 t t t(t a1 + t a2 ) a1 + t a2 0 a1 = 0. Somit existiert ∇a f (x0 ) für alle a = (a1 , a2 ) ∈ R2 . 214 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen Beispiel 6.2 Sei L : Rn −→ E eine lineare Abbildung. Dann ist L in jedem Punkt x0 ∈ Rn differenzierbar und es gilt DL(x0 ) = L, denn aufgrund der Linearität von L ist kL(x0 + h) − L(x0 ) − L(h)kE k0k lim = 0. = lim h→0 h→0 khk khk |{z} =0 Beispiel 6.3 Sei f : Rn1 × . . . × Rnk −→ E eine multilineare Abbildung. Dann ist f in jedem Punkt x0 differenzierbar und es gilt Df (x1 , . . . , xk )(a1 , . . . , ak ) = k X f (x1 , . . . , xj−1 , aj , xj+1 , . . . , xk ). j=i Beweis: (1) Jede multilineare Abbildung f : Rn1 × . . . × Rnk −→ E ist stetig. Insbesondere existiert ein δ > 0, so dass kx1 k, . . . , kxk k ≤ δ gilt kf (x1 , . . . , xk )kE ≤ 1. Folglich ist für alle xj ∈ R nj mit xj 6= 0 kx1 k kxk k f δ x1 , . . . , δ xk ·...· δ δ kx1 k kxk k 1 ≤ k kx1 k · . . . · kxk k. δ Somit existiert für jede multilineare Abbildung f : Rn1 × . . . × Rnk −→ E eine Konstante C > 0 mit kf (x1 , . . . , xk )kE = kf (x1 , . . . , xk )kE ≤ C · kx1 k · . . . · kxk k. (2) Zur Differenzierbarkeit: f (x1 + a1 , . . . , xk + ak ) − f (x1 , . . . , xk ) − = k X f (x1 , . . . , xj−1 , aj , xj+1 , . . . , xk ) j=1 | X j1 <j2 + {z L(a) f (x1 , . . . , aj1 , . . . , aj2 , . . . , xk ) X } f (x1 , . . . , aj1 , . . . , aj2 , . . . , aj3 , . . . , xk ) j1 <j2 <j3 + . . . + f (a1 , . . . , ak ). 6.1 Ableitung, Richtungsableitung und Gradient einer Abbildung 215 Folglich gilt wegen (1) kf (x1 + a1 , . . . , xk + ak ) − f (x1 , . . . , xk ) − L(a)k X ≤C kx1 k · . . . · kaj1 k · . . . · kaj2 k · . . . · kxk k j1 <j2 + X (. . .) + . . . + ka1 k · . . . · kak k . j1 <j2 <j3 Da kaj1 k·kaj2 k ≤ 21 (kaj1 k2 +kaj2 k2 ) ≤ 12 kak2 gilt, kann man alle Summanden durch kak2 abschätzen und es folgt lim a→0 kf (x + a) − f (x) − L(a)kE ≤ lim C(x) · kak = 0. a→0 kak ⊓ ⊔ Satz 6.3 (Rechenregeln für Ableitungen und Richtungsableitungen) Seien f, h : U ⊂ Rn −→ E, g : U ⊂ Rn −→ R. Dann gilt (1) Sind f und h in x0 differenzierbar, so ist f + h in x0 differenzierbar und es gilt D(f + h)(x0 ) = Df (x0 ) + Dh(x0 ). Existieren ∇a f (x0 ) und ∇a h(x0 ), so existiert ∇a (f + h)(x0 ) und es gilt ∇a (f + h)(x0 ) = ∇a f (x0 ) + ∇a h(x0 ). (2) Sind f und g in x0 differenzierbar, so gilt D(g · f )(x0 ) = Dg(x0 ) · f (x0 ) + Df (x0 ) · g(x0 ). Existieren ∇a f (x0 ) und ∇a g(x0 ), so gilt ∇a (g · f )(x0 ) = ∇a g(x0 ) · f (x0 ) + ∇a f (x0 ) · g(x0 ). (3) Sind f, g : U ⊂ Rn −→ R in x0 differenzierbar und g(x0 ) 6= 0, so ist einer Umgebung von x0 definiert, in x0 differenzierbar und es gilt g(x0 )Df (x0 ) − f (x0 )Dg(x0 ) f (x0 ) = D . g g(x0 )2 f g in (4) Kettenregel: Ist f : U ⊂ Rn −→ V ⊂ Rm in x0 differenzierbar und g : V ⊂ Rm −→ E in f (x0 ) differenzierbar, so ist g ◦ f : U ⊂ Rn −→ E in x0 differenzierbar und es gilt D(g ◦ f )(x0 ) = Dg(f (x0 )) ◦ Df (x0 ). 216 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen (5) Sei f = (f1 , f2 ) : U ⊂ Rn −→ E1 × E2 . Die Abbildung f ist genau dann in x0 differenzierbar, wenn f1 , f2 in x0 differenzierbar sind. Dann gilt Df (x0 ) = (Df1 (x0 ), Df2 (x0 )). Beweis: Die Aussagen (1)–(3) sowie Aussage (5) folgen direkt aus der Definition. (4) Seien y0 = f (x0 ), L = Df (x0 ) und L̃ = Dg(f (x0 )). Wir betrachten die Abbildungen ϕ(x) := f (x) − f (x0 ) − L(x − x0 ), ψ(y) = g(y) − g(y0 ) − L̃(y − y0 ) sowie ̺(x) := (g ◦ f )(x) − (g ◦ f )(x0 ) − (L̃ ◦ L)(x − x0 ). Nach Voraussetzung gilt ϕ(x) = o (kx − x0 k) , fürx → x0 und ψ(y) = o (ky − y0 k) , füry → y0 . k̺(x)k x→x0 kx−x0 k Es ist zu zeigen, dass ̺(x) = o (kx − x0 k) gilt, d.h. dass lim Da = 0 ist. ̺(x) = g(f (x)) − g(f (x0 )) − L̃(L(x − x0 )) = g(f (x)) − g(y0 ) − L̃(f (x) − f (x0 ) − ϕ(x)) = (g(f (x)) − g(y0 ) − L̃(f (x) − y0 )) + L̃(ϕ(x)) = ψ(f (x)) + L̃(ϕ(x)), genügt es zu zeigen, dass lim x→x0 kψ(f (x))k kx−x0 k (a) Da L̃ : Rm −→ E linear ist, gilt = lim x→x0 kL̃(ϕ(x))k kx−x0 k = 0 ist. kL̃(ϕ(x))kE ≤ Ckϕ(x)kRm . Folglich ist 0 ≤ lim x→x0 kL̃(ϕ(x))k kϕ(x)k = 0. ≤ C · lim x→x0 kx − x0 k kx − x0 k | {z } =0 kψ(y)k y→y0 ky−y0 k (b) Sei ε > 0 gegeben. Da lim = 0 ist, existiert ein δ > 0, so dass aus kf (x) − y0 k < δ folgt, dass kψ(f (x))k < εkf (x) − y0 k gilt. Da f in x0 stetig ist, existiert ein δ1 > 0, so dass aus kx − x0 k < δ1 folgt, dass kf (x) − y0 k < δ. Für kx − x0 k < δ1 gilt also kψ(f (x))k ≤ εkf (x) − y0 k = εkϕ(x) + L(x − x0 )k ≤ εkϕ(x)k + ε · CL kx − x0 k, und damit 6.1 Ableitung, Richtungsableitung und Gradient einer Abbildung kψ(f (x))k kϕ(x)k +ε · CL ≤ε kx − x0 k kx − x0 k | {z } 217 ∀|x − x0 | < δ1 . x→x0 → 0 Daher gilt 0 ≤ lim x→x0 Daraus folgt kψ(f (x))k ≤ ε · CL kx − x0 k lim x→x0 ∀ε > 0. kψ(f (x))k = 0, kx − x0 k womit die Kettenregel bewiesen ist. (3) fg : U ⊂ Rn −→ R ist die Verknüpfung folgender Abbildungen ψ : Rn −→ R2 mit ψ(x) = (f (x), g(x)), ϕ : R2 −→ R1 mit ϕ(x, y) = (a) Es gilt Dψ(x0 ) = (Df (x0 ), Dg(x0 )). (b) Sei a = (a1 , a2 ). Dann gilt Dϕ(x, y)(a) = lim |ϕ(x + a1 , x + a2 ) − ϕ(x, y) − ya1 −xa2 | y2 ya1 −xa2 , y2 = lim x . y denn 1 | x+a y+a2 − x y − ya1 −xa2 | y2 a→0 kak kak 1 |xy 2 + a1 y 2 − xy 2 − xya2 − y 2 a1 − ya1 a2 + xya2 + xa22 | = lim a→0 kak · y 2 |y + a2 | p kak x2 + y 2 1 |a2 | |xa2 − ya1 | ≤ lim |a2 | 2 = 0. = lim a→0 a→0 kak · y 2 |y + a2 | y |y + a2 | · kak a→0 (c) Nach der Kettenregel gilt f (x0 ) = D(ϕ ◦ ψ)(x0 ) = Dϕ(ψ(x0 )) ◦ Dψ(x0 ) D g = Dϕ(f (x0 ), g(x0 )) ◦ (Df (x0 ), Dg(x0 )) (b) g(x0 ) · Df (x0 ) − f (x0 ) · Dg(x0 ) = . g(x0 )2 ⊓ ⊔ Wir betrachten eine lineare Abbildung L : Rn −→ R. Aus der Algebra ist bekannt, dass ein eindeutig bestimmter Vektor vL ∈ Rn existiert, so dass gilt L(x) = hx, vL iRn ∀x ∈ Rn . Definition 6.3. Sei f : U ⊂ Rn −→ R eine in x0 ∈ U differenzierbare Funktion. Der Gradient von f in x0 ist der Vektor grad f (x0 ) ∈ Rn , definiert durch Df (x0 )(a) = ∇a f (x0 ) = hgrad f (x0 ), ai ∀a ∈ Rn . 218 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen Satz 6.4 Sei f : U ⊂ Rn −→ R1 in x0 ∈ Rn differenzierbar. Der Gradient grad f (x0 ) gibt diejenige Richtung an, in der die Funktion im Punkt x0 am schnellsten wächst, das heißt die Richtung der größten Richtungsableitung. Beweis: Sei a ∈ Rn , kak = 1. Dann gilt mit der Cauchy-Schwarz-Ungleichung ∇a f (x0 ) = hgrad f (x0 ), ai ≤ kgrad f (x0 )k · kak = kgrad f (x0 )k. Die Gleichheit gilt genau dann, wenn a = grad f (x0 ) kgrad f (x0 )k . ⊓ ⊔ Die geometrische Bedeutung des Gradienten Sei f : U ⊂ Rn −→ R differenzierbar, c ∈ Im(f ) und Mc := {x ∈ U | f (x) = c} ⊂ Rn Dann heißt Mc Niveaufläche von f zum Niveau c. Beispiel 6.4 Wir betrachten die Abbildung f : U ⊂ R2 −→ R (x, y) 7→ Höhe des Ortes über dem Meeresspiegel. z y Mc grad f (x0 ) x Beispiel 6.5 Sei f gegeben durch f : R3 −→ R (x, y, z) 7→ x2 + y 2 + z 2 . Dann ist Mc = {(x, y, z) ∈ R | x2 + y 2 + z 2 = c} die Sphäre vom Radius in R3 . √ c 6.1 Ableitung, Richtungsableitung und Gradient einer Abbildung grad f (p) grad f (p) p 219 p p + Tp Mc p + Tp Mc r Mr 2 Definition 6.4. Der Tangentialraum von Mc im Punkt p ∈ Mc ist die Menge der Vektoren Tp Mc := {X ∈ Rn | ∃ differenzierbare Kurve γ : (−ε, ε) −→ Mc ⊂ Rn mit γ(0) = p, γ ′ (0) = X}. Die Vektoren X heißen Tangentialvektoren und p + Tp Mc heißt Tangentialebene in p ∈ Mc . Satz 6.5 Sei f : U ⊂ Rn → R differenzierbar und sei p ∈ Mc . Dann gilt für jeden Tangentialvektor X ∈ Tp Mc grad f (p) ⊥ X. Beweis: Sei γ : (−ε, ε) −→ Mc eine differenzierbare Kurve mit γ(0) = p und γ ′ (0) = X. Da Mc die Niveaufläche zum Funktionswert c ist, gilt f (γ(t)) = c für alle t ∈ (−ε, ε). Nach der Kettenregel ist dann 0 = D(f ◦ γ)(0) = Df (γ(0))(γ ′ (0)) = Df (p)(X) = hgrad f (p), Xi. Also ist grad f (p) ⊥ X. ⊓ ⊔ Bemerkung: Ist p ∈ U ein regulärer Punkt von f , das heißt grad f (p) 6= 0, so gilt Tp Mc = (grad f (p))⊥ := {X ∈ Rn | hgrad f (p), Xi = 0}. Somit ist Tp Mc ⊂ Rn ein (n − 1)–dimensionaler Unterraum, den man als (grad f (p))⊥ berechnen kann. (Der Beweis folgt später.) 220 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen Satz 6.6 (MWS für Funktionen mehrerer Veränderlicher) Sei f : U ⊂ Rn −→ R differenzierbar. Seien x, y ∈ U und die Strecke xy zwischen x, y ∈ U liege in U . Dann existiert ein ξ ∈ xy mit ξ 6= x, ξ 6= y, so dass gilt f (y) − f (x) = hgrad f (ξ), (y − x)iRn = Df (ξ)(y − x). Beweis: Wir betrachten die Abbildung h : [0, 1] → R, h(t) := f (x + t(y − x)). Nach Voraussetzung ist h auf [0, 1] differenzierbar. Daher existiert nach dem Mittelwertsatz von Lagrange ein y θ ∈ (0, 1) mit x h(1) − h(0) = h′ (θ) · (1 − 0) = h′ (θ). U ⊂ Rn Nach Definition von h und aufgrund der Kettenregel ist dies äquivalent zu f (y) − f (x) = Df (x + θ(y − x))(y − x) =: Df (ξ)(y − x). ⊓ ⊔ Satz 6.7 Sei U ⊂ Rn offen und bogenzusammenhängend und f : U −→ E differenzierbar. Dann ist f genau dann konstant auf U , wenn Df (x) = 0 für alle x ∈ U gilt. Ist f reellwertig, so ist Df (x) = 0 äquivalent zu grad f (x) = 0. Beweis: (1) Wenn die Abbildung f konstant ist folgt sofort 0 = f (x0 + h) − f (x0 ) = Df (x0 ) + o(khk) | {z } | {z } =0, linear =0 (2) Sei Df (x) = 0 für alle x ∈ U und sei x ∈ U fix. Da U offen ist, existiert ein ε(x) > 0, so dass gilt K(x, ε(x)) ⊂ U . Für a ∈ Rn , kak = 1 ist a x ϕa : (−ε(x), ε(x)) −→ R t 7→ ϕa (t) = f (x + ta) U wohldefiniert und differenzierbar, wobei gilt ϕ′a (t) = Df (x + ta)(a) ≡ 0 ∀t ∈ (−ε(x), ε(x)). Folglich ist ϕa auf (−ε(x), ε(x)) konstant. Da aber ϕa (0) = f (x) für alle a ∈ Rn , kak = 1 gilt, ist f auf K(x, ε(x)) konstant. Seien nun x, y ∈ U beliebig, aber fest. Da U bogenzusammenhängend ist, existiert eine stetige 6.1 Ableitung, Richtungsableitung und Gradient einer Abbildung 221 Abbildung σ : [0, 1] −→ U ⊂ Rn mit σ(0) = x, σ(1) = y. Wir betrachten die offene Überdeckung {K(σ(t), ε(σ(t))}t∈[0,1] von σ([0, 1]). y σ x4 x2 x3 x1 x U Da [0, 1] kompakt und σ stetig ist, ist auch σ([0, 1]) kompakt und es existiert eine endliche Teilüberdeckung K(σ(t1 ), ε1 ), . . . , K(σ(tr ), εr ) von σ([0, 1]). Auf jeder dieser offenen Mengen gilt aber f|K(σ(tj ),εj ) = konst. = f (σ(tj )). Daraus folgt f (x) = f (σ(t1 )) = f (x1 ) = f (σ(t2 )) = f (x2 ) = . . . = f (σ(t2 )) = f (y), mit xi ∈ K(σ(ti ), εi ) ∩ K(σ(ti+1 ), εi+1 ). Folglich ist f auf U konstant. ⊓ ⊔ Bemerkung: Sei X ein metrischer Raum und sei A ⊂ X bogenzusammenhängend. Dann ist nach Kapitel 2, die Menge A auch zusammenhängend. Die Umkehrung gilt im Allgemeinen nicht. Für U ⊂ Rn offen gilt hingegen ist A genau dann bogenzusammenhängend, wenn A zusammenhängend ist. Satz (6.7) gilt somit für offene, zusammenhängende Mengen U ⊂ Rn . 222 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen 6.2 Partielle Ableitungen Wir betrachten zunächst reellwertige Funktionen f : U ⊂ Rn −→ R. Sei e = (e1 , . . . , en ) die Standardbasis des Rn . Definition 6.5. Die i–te partielle Ableitung von f in u ∈ U ist f (u + tei ) − f (u) ∂f (u) := (∇ei f )(u) = Df (u)(ei ) = lim ∈ R. t→0 ∂xi t Beispiel 6.6 Wir betrachten die Abbildung f : R2 −→ R (x, y) 7→ f (x, y) = sin(xy 2 ). Die partiellen Ableitungen sind dann ∂f (x, y) = y 2 cos(xy 2 ) und ∂x ∂f (x, y) = 2xy cos(xy 2 ). ∂y Bemerkung: Sei f : U ⊂ Rn −→ R in u ∈ U differenzierbar. Dann ist Df (u) : Rn −→ R eine lineare Abbildung. Diese entspricht bei Fixieren der Basis e in Rn der (1, n)–Matrix ∂f ∂f M (Df (u)) := (Df (u)(e1 ), . . . , Df (u)(en )) =: (u), . . . , (u) . ∂x1 ∂x1 Ist b = n P bj ej , so gilt j=1 Df (u)(b) = n X j=1 bj Df (u)(ej ) = ∂f ∂f (u), . . . , (u) ◦ (b1 , . . . , bn )⊤ . ∂x1 ∂xn Insbesondere gilt für den Gradienten von f : ∂f ∂f grad f (u) = (u), . . . , (u) . ∂x1 ∂xn Satz 6.8 (Hinreichende Bedingung für Differenzierbarkeit) Sei U ⊂ Rn offen und f : U −→ R eine Abbildung. Falls alle partiellen Ableitungen ∂f ∂f n −→ R existieren und stetig sind, so ist f auf U ∂x1 , . . . , ∂xn : U ⊂ R differenzierbar. 6.2 Partielle Ableitungen 223 Beweis: Sei u ∈ U und h ∈ Rn . Dann gilt f (u + h) − f (u) = f (u1 + h1 , u2 , . . . , un ) − f (u1 , . . . , un ) +f (u1 + h1 , u2 + h2 , u3 , . . . , un ) − f (u1 + h1 , u2 , . . . , un ) + . . . +f (u1 + h1 , . . . , un + hn ) − f (u1 + h1 , . . . , un−1 + hn−1 , un ) . Wir betrachten die Funktion g(x) := f (x, u2 , . . . , un ). Nach Voraussetzung ∂f (x, u2 , . . . , un ). Wenden wir den Mittelexistiert die Ableitung g ′ (x) = ∂x 1 wertsatz auf g an, so erhalten wir ein ξ ∈ [u1 , u1 + h1 ], so dass gilt f (u1 + h1 , u2 , . . . , un ) − f (u1 , . . . , un ) = h1 · ∂f (ξ1 , u2 , . . . , un ) . ∂x1 Analog existiert für alle j ∈ {1, . . . , n} ein ξj ∈ [uj , uj + hj ], so dass gilt f (u1 + h1 , . . . , uj + hj , uj+1 , . . . , un )−f (u1 + h1 , . . . , uj−1 + hj−1 , uj , . . . , uj ) ∂f ∂f (u1 + h1 , . . . , uj−1 + hj−1 , ξj , uj+1 , . . . , un ) =: hj · (cj ) . = hj · ∂xj ∂xj mit cj ∈ Rn . Folglich gilt n P ∂f (u)h f (u + h) − f (u) − j ∂xj j=1 khk P n ∂f ∂f (cj ) − ∂xj (u) hj j=1 ∂xj p = 2 h1 + . . . + h2n v u n 2 CSU uX ∂f ∂f (cj ) − (u) . ≤ t ∂xj ∂xj j=1 Für h = (h1 , . . . , hn ) −→ 0 konvergiert aber cj gegen u für alle j ∈ {1, . . . , n}. h→0 ∂f (cj ) −→ Da alle partiellen Ableitungen stetig sind, erhalten wir ∂x j und somit n P ∂f (u)h f (u + h) − f (u) − j ∂x j j=1 = 0. lim h→0 khk ∂f ∂xj (u) Folglich ist f differenzierbar und es gilt Df (u)(h) = n X ∂f (u)hj ∂x j j=1 ⊓ ⊔ Bemerkung: Die Stetigkeit der partiellen Ableitungen ist nicht notwendig für die Differenzierbarkeit. Sei zum Beispiel 224 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen f : R2 −→ R (x, y) 7→ f (x, y) = ( 1 ) x2 +y 2 (x2 + y 2 ) sin( √ x2 + y 2 > 0 0 x = y = 0. f ist in (0, 0) differenzierbar, aber (Übungsaufgabe). ∂f ∂x und ∂f ∂y sind in (0, 0) nicht stetig ∂f Bemerkung: Sei f : U ⊂ Rn −→ R gegeben und es existiere ∂x auf U . i ∂f n Existiert die partielle Ableitung der Funktion ∂xi : U ⊂ R −→ R nach der j-ten Koordinate, so bezeichnet man sie mit ∂ ∂f ∂2f . := ∂xj ∂xi ∂xj ∂xi Auf diese Weise entstehen partielle Ableitungen höherer Ordnung. Die Funktion ∂ k−1 f ∂ ∂kf : U ⊂ Rn −→ R := ∂xi1 · · · ∂xik ∂xi1 ∂xi2 · · · ∂xik heißt (falls sie existiert) k–te partielle Ableitung von f nach den Variablen xi1 , . . . , xik . Bezeichnung: ∂lf ∂xi ...∂xi =: ∂lf . ∂xli Beispiel 6.7 Wir betrachten die Funktion f : R2 −→ R mit f (x, y) = x3 y 2 . Dann erhalten wir die partiellen Ableitungen erster und zweiter Ordnung ∂f = 3x2 y 2 , ∂x ∂f = 2x3 y ∂y sowie ∂2f ∂f = 6x2 y = = 6x2 y. ∂y∂x ∂x∂y Beispiel 6.8 Wir betrachten die Funktion f : R2 −→ R, definiert durch ( 2 2 xy · xx2 −y +y 2 (x, y) 6= (0, 0) f (x, y) = 0 (x, y) = (0, 0). Dann können wir wieder die partiellen Ableitungen erster und zweiter Ordnung berechnen und erhalten x4 + 4x2 y 2 − y 4 ∂f , =y ∂x (x2 + y 2 )2 ∂f x4 − 4x2 y 2 − y 4 . =x ∂y (x2 + y 2 )2 In diesem Fall kann man die Reihenfolge der Ableitungen nicht vertauschen, denn 6.2 Partielle Ableitungen 225 ∂2f 1 −h4 (0, 0) = lim {h · 4 } = −1 h→0 h ∂y∂x h aber 1 h4 ∂2f (0, 0) = lim {h · 4 } = 1. h→0 h ∂x∂y h Wir wollen nun untersuchen, wann man die Reihenfolge der partiellen Ableitungen vertauschen kann. Dazu benötigen wir die folgende Definition 6.6. Eine Funktion f : U ⊂ Rn −→ R heißt von der Klasse C k , k ∈ N, falls alle partiellen Ableitungen von f der Ordnung ≤ k existieren und stetig sind. Es bezeichne C k (U, R) := {f : U −→ R | f von der Klasse C k }. Offensichtlich gilt für k ∈ N C 0 (U, R) ⊃ C k−1 (U, R) ⊃ C k (U, R). Satz 6.9 (Satz von Schwarz) Sei f ∈ C k (U, R). Dann sind alle partiellen Ableitungen der Ordnung ≤ k unabhängig von der Reihenfolge der Differentiation. Insbesondere gilt für f ∈ C 2 (U, R) ∂2f ∂2f = . ∂xi ∂xj ∂xj ∂xi Beweis: Es genügt zu zeigen, dass für jede C 2 –Funktion f : U ⊂ R2 −→ R gilt ∂2f ∂2f = . ∂x1 ∂x2 ∂x2 ∂x1 Auf Behauptung die für partielle Ableitungen höherer Ordnung schließt man dann induktiv. Wir betrachten u = (u1 , u2 ) ∈ U . Seien h = (h1 , h2 ) 6= 0 so gewählt, dass gilt [u1 − h1 , u1 + h1 ] × [u2 − h2 , u2 + h2 ] ⊂ U. Nun betrachten wir ϕ(x) := f (x, u2 + h2 ) − f (x, u2 ). Dann ist die Funktion ϕ auf [u1 , u1 + h1 ] differenzierbar. Nach dem Mittelwertsatz existiert ein ξ1 ∈ [u1 , u1 + h1 ], so dass gilt ϕ(u1 + h1 ) − ϕ(u1 ) = h1 · ϕ′ (ξ1 ). Sei nun F (h1 , h2 ) := f (u1 + h1 , u2 + h2 ) − f (u1 + h1 , u2 ) − f (u1 , u2 + h2 ) + f (u1 , u2 ). Dann gilt 226 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen F (h1 , h2 ) = ϕ(u1 + h1 ) − ϕ(u1 ) = h1 · ϕ′ (ξ1 ) ∂f ∂f (ξ1 , u2 + h2 ) − (ξ1 , u2 ) . = h1 ∂x1 ∂x1 | {z } =:(⋆) Nach dem Mittelwertsatz angewendet auf den Ausdruck (⋆) an, das heißt auf ∂f ∂x1 (ξ1 , ·), existiert ein ξ2 ∈ [u2 , u2 + h], so dass F (h1 , h2 ) = h1 · h2 · ∂2f (ξ1 , ξ2 ) ∂x2 ∂x1 (⋆⋆). Verfährt man analog mit der Funktion ψ(x) := f (u1 + h1 , x) − f (u1 , x), so existieren nach dem Mittelwertsatz ein ξ˜1 ∈ [u1 , u1 + h1 ] und ein ξ˜2 ∈ [u2 , u2 + h2 ], so dass ∂2f (ξ˜1 , ξ˜2 ) (⋆ ⋆ ⋆). F (h1 , h2 ) = h1 · h2 · ∂x1 ∂x2 Da h1 , h2 6= 0 gilt, folgt mit (⋆⋆) und (⋆ ⋆ ⋆) ∂2f ˜ ˜ ∂2f (ξ1 , ξ2 ) , ξ1 , ξ2 = ∂x1 ∂x2 ∂x2 ∂x1 wobei ξ1 , ξ˜1 ∈ [u1 , u1 + h1 ] und ξ2 , ξ˜2 ∈ [u2 , u2 + h2 ] sind. Da ∂2f ∂x2 ∂x1 ∂2 f ∂x1 ∂x2 und in (u1 , u2 ) nach Voraussetzung stetig sind, folgt für h = (h1 , h2 ) −→ 0 ∂2f ∂2f (u) = (u). ∂x1 ∂x2 ∂x2 ∂x1 Bemerkung: Oft wird die folgende Bezeichnung benutzt ∂2f ∂ ∂f ∂f = , fxy := . fx := ∂x ∂y ∂x ∂x∂y ⊓ ⊔ Der Satz von Schwarz zeigt, dass die Reihenfolge der Indizes für f ∈ C k egal ist. Satz 6.10 Sei f : U ⊂ Rn −→ Rm in u ∈ U differenzierbar und f = (f1 , . . . , fm ). Dann ist die Matrix Df (u) : Rn −→ Rm in den Standardbasen e, ẽ des Rn bzw. Rm gegeben durch M(Df (u)) = ∂f1 ∂x1 (u) ... ∂f1 ∂xn (u) ... ∂fm ∂xn (u) : ∂fm ∂x1 (u) : , 6.2 Partielle Ableitungen das heißt, für b = n P 1 227 bi ei ∈ Rn gilt b1 : : : Df (u)(b) = ∂fm ∂fm bn ∂x1 (u) . . . ∂xn (u) b1 ∂f ∂f =: (u), . . . , (u) : . ∂x1 ∂xn | {z } bn ∂f1 ∂x1 (u) ... ∂f1 ∂xn (u) Spaltenvektoren Beweis: Ist ẽ = (e˜1 , . . . , e˜n ) die Standardbasis des Rm und e = (e1 , . . . , en ) die Standardbasis des Rn und identifiziert man b1 a1 n m X X .. .. bi ei mit . aj e˜j mit . sowie b = a= i=1 j=1 bn am so gilt M(Df (u)) = (he˜j , Df (u)(ei )iRm )j∈{1,...,m} (Zeilen), i∈{1,...,n} (Spalten) . k Da Df (u) = Df1 (u)e˜1 + . . . + Dfm (u)e˜m und Dfk (u)(ei ) = ∂f ∂xi (u), gilt ∂fj (u) . M(Df (u)) = ∂xi j∈{1,...,m}, i∈{1,...,n} ⊓ ⊔ Satz 6.11 (Kettenregel für partielle Ableitungen) Seien g1 , . . . , gm : U ⊂ Rn −→ R und f : Rm −→ R differenzierbar. Sei F (x) := f (g1 (x), . . . , gm (x)) : U ⊂ Rn −→ R. Dann gilt m X ∂f ∂F ∂gj (x) = (g1 (x), . . . , gm (x)) · (x). ∂xi ∂yj ∂xi j=1 Beweis: Wir betrachten φ : U −→ Rm , definiert durch φ(x) = (g1 (x), . . . , gm (x)). Dann gilt F = f ◦ φ und DF (x) = Df (φ(x)) ◦ Dφ(x). Gehen wir zu den Matrizen über, die diesen linearen Abbildungen entsprechen, so erhalten wir einerseits M(DF (x)) = M(Df (φ(x))) ◦ M(Dφ(x)), mit ∂f ∂f (g1 (x), . . . , gm (x)) , . . . , (g1 (x), . . . , gm (x)) , ∂y1 ∂ym ∂g1 ∂g1 ∂x1 (x) . . . ∂xn (x) . : : M(Dφ(x)) = ∂gm ∂gm ∂x1 (x) . . . ∂xn (x) M(Df (φ(x))) = 228 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen Andererseits gilt M(DF (x)) = ∂F ∂F (x), . . . , (x) . ∂x1 ∂xn Vergleicht man die i–ten Spalten, so erhält man n X ∂f ∂gj ∂F (x) = (g1 (x), . . . , gm (x)) · (x). ∂xi ∂yj ∂xi j=1 ⊓ ⊔ Folgerung 6.1 Sei U ⊂ Rn offen. Sind g1 , . . . , gm ∈ C k (U, R) und f ∈ C k (Rm , R), so gilt F := f (g1 (·), . . . , gm (·)) ∈ C k (U, R). Folgerung 6.2 Sei f : U ⊂ Rn −→ Rm aus C (1) (U, Rm ). Dann ist Df : U ⊂ Rn −→ L(Rn , Rm ) x 7→ Df (x) stetig. 6.3 Die Taylorentwicklung und Extrema für Funktionen mehrerer reeller Veränderlicher Definition 6.7. Ein Multiindex α = (α1 , . . . , αn ) ist ein n–Tupel von natürlichen Zahlen αj ∈ N0 . |α| := α1 + . . . αn heißt die Ordnung des Multiindex und wir definieren α! := (α1 !) · . . . · (αn !). Für y = (y1 , . . . , yn ) ∈ Rn bezeichne y α := y1α1 · . . . · ynαn . Für eine Funktion f : U ⊂ Rn −→ R bezeichne (sofern existent) ∂ |α| f ∂ |α| f := . ∂xα (∂x1 )α1 · · · (∂xn )αn Satz 6.12 (Taylorformel) Sei U ⊂ Rn offen, f ∈ C k (U, R). Seien x, y ∈ U zwei Punkte, so dass die Strecke xy in U liegt. Dann existiert ein ξ ∈ xy, so dass gilt f (y) = X |α|≤k−1 X 1 ∂kf 1 ∂ |α| f (x)(y − x)α + (ξ)(y − x)α . α α! ∂x α! ∂xα |α|=k 6.3 Die Taylorentwicklung und Extrema für Funktionen mehrerer reeller Veränderlicher Beweis: Wir betrachten die Funktion g : [0, 1] −→ R mit g(t) := f (x + t(y − x)). Dann ist g ∈ C k und nach der Taylorformel für Funktionen in einer Variablen gilt g(1) = k−1 X r=0 Dabei ist 1 1 (r) g (0) + g (k) (t0 ) für ein t0 ∈ (0, 1). r! k! | {z } Restglied g (0) (0) = g(0) = f (x) n X ∂αf X ∂f (x) · (yi − xi ) = (x) · (y − x)α g (1) (0) = α ∂x ∂x i i=1 g (2) (0) = n X i,j=1 = |α|=1 2 ∂ f (x) · (yi − xi ) · (yj − xj ) ∂xi ∂xj X ∂2f 2! (x)(y − x)α · ∂xα α! (∗) (∗∗). |α|=2 2! α! ∂2 f ∂x2i Der Faktor in (∗∗) ist notwendig, da in (∗) ∂2 f ∂xi ∂xj = ∂2 f ∂xj ∂xi zweimal auftritt, in (∗∗) nur einmal vorhanden ist. Analog erhält man durch während mehrfaches Anwenden der Kettenregel und etwas Kombinatorik g (j) (0) = X j! ∂ |α| f (x) · (y − x)α . α! ∂xα |α|=j Damit folgt f (y) = X |α|≤k−1 X 1 ∂kf 1 ∂ |α| f α (x) · (y − x) + (ξ) · (y − x)α α! ∂xα α! ∂xα |α|=k mit ξ := x + t0 (y − x). ⊓ ⊔ Definition 6.8. Sei U ⊂ Rn offen, f : U ⊂ Rn −→ R differenzierbar. (1) f nimmt in x0 ∈ U ein lokales Minimum an, falls ein ε > 0 existiert, so dass f (x) ≥ f (x0 ) für alle x mit kx − x0 k < ε. (2) f hat in x0 ∈ U ein lokales Maximum, falls ein ε > 0 existiert, so dass f (x) ≤ f (x0 ) für alle x mit kx − x0 k < ε. (3) x0 ∈ U heißt kritischer Punkt von f , falls Df (x0 ) = 0, das heißt, es gilt ∂f ∂xi (x0 ) = 0 für alle i ∈ {1, . . . , n}. 229 230 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen Definition 6.9. Sei f : U ⊂ Rn −→ R von der Klasse C 2 und sei x0 ∈ U ein kritischer Punkt von f . Die symmetrische Bilinearform Hfx0 : Rn ×Rn −→ R Hfx0 (a, b) := n X j,i=1 ∂2f (x0 ) ai · bj ∂xi ∂xj heißt Hessesche Form von f in x0 . Bezeichnung: Sei A : Rn × Rn −→ R eine symmetrische Bilinearform, n P Aij ai bj und sei EW (Aij ) die Menge der Eigenwerte von (Aij ). A(a, b) = i,j Dann vereinbaren wir die folgenden Bezeichnungen: (1) A > 0 :⇔ A positiv definit ⇔ für alle a 6= 0 ist A(a, a) > 0 ⇔ für alle λ ∈ EW (Aij ) : λ > 0, (2) A < 0 :⇔ A negativ definit ⇔ für alle a 6= 0 ist A(a, a) < 0 ⇔ für alle λ ∈ EW (Aij ) : λ < 0, (3) A ≥ 0 :⇔ A positiv semidefinit ⇔ für alle a ist A(a, a) ≥ 0 ⇔ für alle λ ∈ EW (Aij ) : λ ≥ 0, (4) A ≤ 0 :⇔ A negativ semidefinit ⇔ für alle a ist A(a, a) ≤ 0 ⇔ für alle λ ∈ EW (Aij ) : λ ≤ 0. Satz 6.13 Sei U ⊂ Rn offen, f ∈ C 3 (U, R). (1) Hat f in x0 ∈ U ein lokales Maximum (lokales Minimum), so ist x0 kritischer Punkt von f und Hfx0 ist negativ semidefinit (positiv semidefinit). (2) Ist x0 ∈ U ein kritischer Punkt von f und Hfx0 negativ definit (positiv definit), so hat f in x0 ein isoliertes lokales Maximum (isoliertes lokales Minimum). Beweis: (1) f habe in x0 ∈ U ein lokales Maximum. Sei a ∈ Rn . Dann hat g : (−ε, ε) −→ R mit g(t) := f (x0 + ta) ein lokales Maximum in t = 0. Folglich gilt wegen g (1) (0) = 0 und g (2) (0) ≤ 0 hgrad f (x0 ), aiRn = und Hfx0 (a, a) = n X i,j=1 n X ∂f (0) · ai = 0 ∂x i i=1 ∂2f (0)ai aj ≥ 0. ∂xi ∂yj Da a beliebig ist, folgt daraus grad f (x0 ) = 0 und Hfx0 ≤ 0. Für ein lokales Minimum läuft der Beweis analog. 6.3 Die Taylorentwicklung und Extrema für Funktionen mehrerer reeller Veränderlicher (2) Sei x0 ∈ U ein kritischer Punkt und Hfx0 < 0. Sei ε > 0, so dass K(x0 , ε) ⊂ U . Da f ∈ C 3 (U, R) ist, gilt für y ∈ K(x0 , ε) die Taylorformel f (y) = f (x0 ) + + n 1 X ∂2f (x0 ) · (yi − x0i ) · (yj − x0j ) 2 i,j=1 ∂xi ∂xj X 1 ∂3f (ξ) · (y − x0 )α α! ∂xα |α|=3 X 1 ∂3f 1 (ξ) · (y − x0 )α , = f (x0 ) + Hfx0 (y − x0 , y − x0 ) + 2 α! ∂xα |α|=3 wobei ξ ∈ x0 y. Sei λ1 der größte Eigenwert von Hfx0 (λ1 < 0). Dann gilt Hfx0 (y − x0 , y − x0 ) ≤ λ1 ky − x0 k2 und folglich f (y) − f (x0 ) ≤ X 1 ∂ 3f 1 (ξ) · (y − x0 )α . λ1 ky − x0 k2 + 2 α! ∂xα |α|=3 Sei 0 < µ < ε und 0 < ky − x0 k < µ. Für jeden Multiindex α mit |α| = 3 gilt |(y − x0 )α | ≤ µ. ky − x0 k2 Damit folgt 2· X 1 ∂ 3f f (y) − f (x0 ) (y − x0 )α ≤ λ1 + 2 (ξ) · . (∗) 2 α ky − x0 k α! ∂x ky − x0 k2 |α|=3 {z } | |...|< |λ1 | µ ·µ Sei nun 0 < µ < ε so gewählt, dass µ< |λ1 | 3 ∂ f 2 sup α (z) | z ∈ K(x0 , ε) ∂x |α|=3 {z } | P existiert, da ∂3f ∂xα stetigist gilt. Wegen (∗) gilt für 0 < ky − x0 k < µ 2· f (y) − f (x0 ) < λ1 +|λ1 | = 0 |{z} ky − x0 k2 <0 und somit 231 232 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen f (y) < f (x0 ), ∀ y ∈ K(x0 , µ)\{x0 }. Folglich hat f in x0 ein lokales isoliertes Maximum. Analog beweist man den ⊓ ⊔ Fall Df (x0 ) = 0, Hfx0 > 0. Bemerkung (1) Sei A ∈ MR (2, 2) eine symmetrische 2 × 2–Matrix. Dann gilt (a) A > 0 ⇔ det(A) > 0 und A11 > 0, (b) A < 0 ⇔ det(A) > 0 und A11 < 0. (2) Sei A ∈ MR (n, n) und definiere A(v) durch A11 . . . A1v .. . A(v) := ... . Av1 . . . Avv Dann gilt (a’)A > 0 ⇔ det(A(v)) > 0 ∀v ∈ {1, . . . , n}, (b’)A < 0 ⇔ (−1)v det(A(v)) > 0 ∀v ∈ {1, . . . , n}. Beispiel 6.9 Wir betrachten die Funktion f : R3 −→ R mit f (x, y, z) := 35 − 6x + 2z + x2 − 2xy + 2y 2 + 2yz + 3z 2 . In welchen Punkten hat f lokale Extrema? Die Bedingung Df (x, y, z) = 0 ist nur im Punkt (x, y, z) = (8, 5, −2) =: x0 erfüllt. In diesem Punkt ist die Hesse-Matrix 2 −2 0 Hfx0 = −2 4 2 . 0 2 6 Da det(Hfx0 ) = 16 > 0 ist, hat f in x0 ein lokales Minimum. 6.4 Der Satz über die Umkehrabbildung Definition 6.10. Seien U, V ⊂ Rn offene Teilmengen. Eine Abbildung f : U −→ V heißt C k –Diffeomorphismus (k ≥ 1), wenn gilt 1) f ist bijektiv, 2) f und f −1 sind C k –Abbildungen. 6.4 Der Satz über die Umkehrabbildung 233 Bemerkung: Ein Diffeomorphismus heißt auch Koordinatentransformation und vereinfacht oft die Berechnung von Integralen oder das Lösen von Differentialgleichungen. Beispiel 1: Polarkoordinaten in der Ebene R 2 f : (0, ∞) × (0, 2π) −→ R \{[0, ∞) × {0}} (r, ϕ) 7→ (r cos ϕ, r sin ϕ) 6 y r (r, ϕ) heißen die Polarkoordinaten von (x, y). (x, y) = f (r, ϕ) • ϕ x Beispiel 2: Zylinderkoordinaten im R R 3 f : (0, ∞) × (0, 2π) ×R −→ (R2 \{[0, ∞) × {0}}) × R {z } | Polarkoordinaten z (r, ϕ, z) 7→ (r cos ϕ, r sin ϕ, z) 6 r • P z ϕ • y + x Zylinderkoordinaten Beispiel 3: Kugelkoordinaten im R3 π π f : (0, ∞) × (− , ) × (0, 2π) −→ R3 \([0, ∞) × {0} × R) 2 2 (r, u, v) 7→ (r cos v cos u, r sin v cos u, r sin u) 234 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen z 6 r v P • - u • y + x Kugelkoordinaten Satz 6.14 Ist f : U ⊂ Rn −→ V ⊂ Rn ein Diffeomorphismus, so ist für alle x0 ∈ U die Abbildung Df (x0 ) : Rn −→ Rn ein Isomorphismus und es gilt (Df (x0 ))−1 = (Df −1 )(f (x0 )). Beweis: Da f ◦ f −1 = idV und f −1 ◦ f = idU gilt, folgt nach der Kettenregel Df (f −1 (y0 ))Df −1 (y0 ) = D(id)(y0 ) = idRn und Df −1 (f (x0 ))Df (x0 ) = D(id)(x0 ) = idRn . Ist nun y0 = f (x0 ), so folgt Df −1 (y0 ) = (Df (x0 ))−1 . ⊓ ⊔ Bemerkung: Für Funktionen in R gilt: Ist U ⊂ R offen und zusammenhängend, f : U −→ R eine C 1 –Abbildung und f ′ (x) 6= 0 für alle x ∈ U , so ist V = f (U ) ⊂ R offen und zusammenhängend, f : U −→ f (U ) bijektiv und ein Diffeomorphismus. In höheren Dimensionen gilt dies nicht! Beispiel 6.10 Wir betrachten die Abbildung f : R2 −→ R2 mit f (x, y) := (ex cos y, ex sin y). Dann ist f eine C 1 –Abbildung und wir können det(Df (x, y)) berechnen: x e cos y −ex sin y det(Df (x, y)) = det = e2x > 0. ex sin y ex cos y Folglich ist Df (x, y) : R2 −→ R2 ein Isomorphismus für alle (x, y) ∈ R2 . Aber f ist nicht injektiv. Somit existiert f −1 nicht global sondern nur lokal. 6.4 Der Satz über die Umkehrabbildung 235 Wir wollen nun untersuchen, unter welchen Bedingungen eine C 1 –Abbildung f : Rn −→ Rn eine lokale Umkehrfunktion besitzt. Lemma 6.11. Sei f : U ⊂ Rn −→ Rn eine C 1 –Abbildung, W ⊂ U ein Würfel und es gelte ∂fi ≤ M ∀u ∈ W. (u) ∂xj Dann folgt 3 kf (b) − f (a)k ≤ n 2 M kb − ak ≤ n2 M kb − ak ∀a, b ∈ W. Beweis: Es gilt fi (b) − fi (a) = n X j=1 (fi (b1 , . . . , bj , aj+1 , . . . , an ) − fi (b1 , . . . , bj−1 , aj , . . . , an )). Wenden wir den Mittelwertsatz von Lagrange auf die Funktion fi in der j–ten Variablen an, so erhalten wir ein ξj ∈ [aj , bj ] mit fi (b) − fi (a) = n X j=1 (bj − aj ) ∂fi (b1 , . . . , bj−1 , ξj , aj+1 , . . . , an ) . ∂xj | {z } ∈W Daraus folgt |fi (b) − fi (a)| ≤ n X j=1 |bj − aj | · M ≤ n · M · kb − ak und damit kf (b) − f (a)k = n X i=1 2 |fi (b) − fi (a)| 3 2 = n M kb − ak. ! 21 ≤ p n · n2 · M 2 · kb − ak2 ⊓ ⊔ Satz 6.15 (Satz über die Umkehrabbildung) Sei U ⊂ Rn offen, f : U −→ Rn von der Klasse C k , k ≥ 1, x0 ∈ U und es gelte det(Df (x0 )) 6= 0, das heißt Df (x0 ) ist Isomorphismus. Dann existieren offene Umgebungen Ũ von x0 und offene Umgebungen Ṽ von f (x0 ), so dass gilt (1) Ṽ = f (Ũ ), (2) f|Ũ : Ũ −→ Ṽ ist bijektiv, (3) (f|Ũ )−1 : Ṽ −→ Ũ ist C k –Abbildung. 236 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen Beweis: (1) OBdA kann man Df (x0 ) = id annehmen: Betrachten wir die lineare, bijektive Abbildung L := Df (x0 )−1 : Rn −→ Rn . Gilt der Satz für L ◦ f : U −→ Rn , so gilt er auch für f (lineare Abbildungen sind C ∞ ) und es gilt D(L ◦ f )(x0 ) = DL(f (x0 )) ◦ Df (x0 ) = L ◦ Df (x0 ) = id. (2) Sei f : U −→ Rn eine C 1 –Abbildung und Df (x0 ) = id, das heißt ∂fi ∂xj (x0 ) = δij . Wir wählen einen Würfel K mit x0 ∈ Int(K) ⊂ K ⊂ U , so dass gilt (i) det(Df (x)) 6= 0 ∀x ∈ K, ∂fi ∂fi (ii) ∂xj (x) − ∂xj (x0 ) < 2n1 2 ∀x ∈ K, ∀i, j ∈ {1, . . . , n}. Im Folgenden zeigen wir, dass f auf K injektiv ist. Wir betrachten dazu die Abbildung g(x) = f (x) − x. Dann ist g eine C 1 –Abbildung und es folgt ∂gi ∂fi ∂fi ∂fi 1 ∂xj (x) = ∂xj (x) − δij = ∂xj (x) − ∂xj (x0 ) < 2n2 ∀x ∈ K. Aus dem Lemma 6.11 folgt dann 1 1 · kb − ak = kb − ak ∀a, b ∈ K. 2n2 2 Mit Hilfe der Dreiecksungleichung erhalten wir dann kg(b) − g(a)k < n2 · kb − ak − kf (b) − f (a)k ≤ kf (b) − b − (f (a) − a)k = kg(b) − g(a)k ≤ 1 kb − ak. 2 oder kurz kb − ak ≤ 2kf (b) − f (a)k ∀a, b ∈ K. (∗) Somit ist f auf K injektiv. Da x0 ∈ Int(K) ist, gilt insbesondere, dass f (x0 ) 6∈ f (∂K). (3) Definition der Umgebung Ṽ (f (x0 )): Da K kompakt ist, ist auch ∂K kompakt. Aus der Stetigkeit von f folgt dann, dass f (∂K) kompakt ist. Wegen f (x0 ) 6∈ f (∂K) folgt inf{kf (x0 ) − f (x)k | x ∈ ∂K} = d > 0. Wir definieren nun die Umgebung Ṽ (f (x0 )) := {y ∈ Rn | ky − f (x0 )k < d2 }. Damit erhalten wir ky − f (x0 )k < ky − f (x)k ∀ y ∈ Ṽ , x ∈ ∂K. (∗∗) f d x f (x0 ) x0 U K f (x) f (K) f (∂K) Ve 6.4 Der Satz über die Umkehrabbildung 237 (4) Definition der Umgebung Ũ(x0 ): Die Behauptung ist, dass für alle y ∈ Ṽ genau ein x ∈ Int(K) mit f (x) = y existiert. Die Eindeutigkeit wurde bereits in (2) gezeigt. Sei nun y ∈ Ṽ gegeben. Wir betrachten die Abbildung gy : K −→ R. x 7→ gy (x) = ky − f (x)k2 = hy − f (x), y − f (x)i Da K kompakt und gy stetig ist, nimmt gy auf K das absolute Minimum an. Da nach (∗∗) gy (x0 ) < gy (x) für alle x ∈ ∂K gilt, liegt das absolute Minimum nicht auf ∂K. Das heißt, es existiert ein u0 ∈ Int(K), in dem gy sein absolutes Minimum annimmt. Wir zeigen nun, dass f (u0 ) = y gilt. Es ist 0 = Dgy (u0 ) = −2Df (u0 )(y − f (u0 )) = −2hy − f (u0 ), grad f (u0 )i. | {z } 6=0 Da u0 ∈ Int(K) und Df (u0 ) ein Isomorphismus ist, folgt y = f (u0 ). Wir setzen nun Ũ := (Int(K)) ∩ f −1 (Ṽ ). Dann ist Ũ eine offene Umgebung von x0 und f|Ũ : Ũ −→ Ṽ ist bijektiv. (5) Wir zeigen nun, dass (f|Ũ )−1 : Ṽ −→ Ũ stetig ist. Aus (∗) erhalten wir die Ungleichung kf −1 (x) − f −1 (y)k ≤ 2kx − yk ∀ x, y ∈ Ṽ . Folglich ist f −1 auf Ṽ Lipschitz-stetig, also stetig. (6) Es ist zu zeigen, dass f −1 : Ṽ −→ Ũ differenzierbar ist. Sei dazu y = f (x) ∈ Ṽ , x ∈ Ũ und Lx := Df (x). Es genügt zu zeigen, dass f −1 in y differenzierbar ist und dass −1 Df −1 (y) = L−1 . x = (Df (x)) Da f in x differenzierbar ist, gilt für x + h ∈ Ũ f (x + h) − f (x) = Lx (h) + o(h) wobei lim h→0 ko(h)k khk = 0. Daraus folgt −1 L−1 x (f (x + h) − f (x)) = h + Lx (o(h)). Sei y1 = f (x + h). Dann ist f −1 (y1 ) − f −1 (y) = x + h − x = h und es folgt −1 L−1 x (y1 − y) = h + Lx (o(h)). −1 −1 Daraus erhält man f −1 (y1 ) − f −1 (y) − L−1 x (y1 − y) = −Lx (o(h)). Da Lx −1 linear ist, gilt kLx (z)k ≤ Ckzk für alle z. Folglich ist 238 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen lim y1 →y kf −1 (y1 ) − f −1 (y) − L−1 x (y1 − y)k ky1 − yk ko(h)k ko(h)k = C lim ≤ lim C y1 →y h→0 kf (x + h) − f (x)k ky1 − yk khk ko(h)k · = C lim h→0 khk kf (x + h) − f (x)k {z } | ko(h)k = 0. ≤ 2C lim h→0 khk ≤2 nach (∗) Somit ist f −1 differenzierbar und es gilt Df −1 (f (x)) = (Df (x))−1 . (7) Es ist zu zeigen, dass wenn f ∈ C k gilt, auch f −1 ∈ C k ist. Sei dazu f = (f1 , . . . , fn ) : Ũ −→ Ṽ , f −1 = (g1 , . . . , gn ) : Ṽ −→ Ũ . Dann gilt fi (g1 (y), . . . , gn (y)) = yi . Mit der Kettenregel erhalten wir wegen n X ∂gk ∂fi −1 (f (y)) · (y) = δij ∂xk ∂yj k=1 dass −1 ∂fi −1 ∂gk (y) = (f (y) ∂yj ∂xk ik kj gilt. Aus der Formel für die inverse Matrix folgt dann, dass ∂fi −1 (y)) ∂xk (f −1 1 ∂gk ∂yj für alle i, k ∈ {1, . . . , n} eine rationale Funktion Qkj von ist. Da f −1 stetig ∞ 1 und Qkj ∈ C ist, folgt aus f ∈ C , dass f ∈ C ist. Ist f ∈ C 2 , so −1 2 folgt f ∈ C , denn in der zweiten Ableitung von f −1 sind nur Ableitungen bis zur Ordnung 2 von f und Ableitungen der Ordnung 1 von f −1 enhalten (usw). ⊓ ⊔ Folgerung 6.3 Sei U ⊂ Rn offen, f : U −→ Rn eine C 1 –Abbildung und für alle x ∈ U sei Df (x) ein Isomorphismus. Dann gilt (1) f (U ) ist offen. (2) Ist f zusätzlich injektiv, so ist f : U −→ f (U ) ein Diffeomorphismus. Beweis: (1) Nach dem Umkehrsatz existiert für alle S x ∈ U eine Umgebung f (Ux ) offen. Ux , so dass f (Ux ) offen ist. Somit ist auch f (U ) = x∈U (2) Ist f injektiv, so ist f : U −→ f (U ) bijektiv. Folglich ist f|Ux : Ux −→ f (Ux ) ein Diffeomorphismus für alle Ux ⊂ U und daher f : U −→ f (U ) ein Diffeomorphismus. ⊓ ⊔ 6.5 Implizite Funktionen 239 6.5 Implizite Funktionen 1) Wir betrachten eine “Fläche” im R3 , die durch eine Gleichung gegeben ist: M = {(x, y, z) ∈ R3 | F (x, y, z) = 0}, 2 2 wie z.B. die Sphäre (x2 +y 2 +z 2 −1 = 0), das Paraboloid ( xa2 + yb2 −z = 0) oder 2 2 2 das Hyperboloid ( xa2 + yb2 − zc2 − 1 = 0). Sei p ∈ M . Kann man M lokal um p als Graph einer Funktion darstellen ? Existiert z.B. eine Funktion z = z(x, y) mit F (x, y, z(x, y)) = 0, d.h. graph(z) = M (lokal) ? Falls ja, kann man mit Hilfe des Gradienten dieser Funktion leicht den Tangentialraum Tp M an den Punkt p bestimmen. (−→ Übungsaufgabe) grad F (p) p graph z 2) Wir betrachten das lineare Gleichungssystem f1 (x) = a11 x1 + . . . + a1n xn = 0 .. .. .. . . . fm (x) = am1 x1 + . . . + amn xn = 0. (∗) Das lässt sich auch schreiben als Ax⊤ = 0 wobei a11 . . . a1n .. A = ... . am1 . . . amn . und x⊤ der transponierte Vektor zu x = (x1 , x2 , . . . , xn ) ∈ Rn ist. Sind die Spalten (a1 , . . . , an ) von A linear unabhängig, so ist das Gleichungssystem mit den Variablen x1 , . . . , xm auflösbar, d.h., es existieren lineare Funktionen x1 = x1 (xm+1 , . . . , xn ), .. .. . . xm = xm (xm+1 , . . . , xn ), die (∗) lösen. Verallgemeinerung auf beliebige Gleichungssysteme Gegeben sei eine beliebige C k -Funktion f : Rn −→ Rm , m ≤ n. Wir betrachten das Gleichungssystem 240 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen f1 (x1 , . . . , xn ) = 0, f2 (x1 , . . . , xn ) = 0, .. . fm (x1 , . . . , xn ) = 0, d.h. (x1 , . . . , xn ) = 0. Kann man dieses Gleichungssystem nach einer oder mehreren Variablen auflösen ? D.h., 1) Existiert eine Abbildung ϕ : Rn−m −→ Rm , so dass f (x1 , . . . , xn−m , ϕ1 (x1 , . . . , xn−m ), . . . , ϕm (x1 , . . . , xn−m )) = 0 | {z } {z } | =:y1 =:ym gilt? 2) Ist ϕ eindeutig bestimmt? 3) Falls f differenzierbar ist und ϕ existiert, ist dann auch ϕ differenzierbar? Beispiel 6.11 Wir betrachten die Abbildung f (x, y) = 0 f : R2 −→ R (x, y) 7→ f (x, y) = x2 + y 2 − 1 x 2 2 Die Gleichung √ für ϕ(x) lautet dann x + ϕ(x) − 1 = 0, das heißt 2 ϕ(x) = ± 1 − x . Somit ist ϕ nicht eindeutig bestimmt und nur lokal auf [ − 1, 1] definiert. Beispiel 6.12 Wir betrachten die Abbildung xn f ≡0 f : Rn −→ R (x1 , . . . , xn ) 7→ f (x1 , . . . , xn ) = x21 + . . . + x2n−1 Dann existiert kein ϕ mit f (x1 , . . . , xn−1 , ϕ(x)) = 0. {z } | x Rn−1 6.5 Implizite Funktionen 241 Beispiel 6.13 Wir betrachten die Abbildung f : R2 −→ R (x, y) 7→ f (x, y) = x − y 3 Dann löst ϕ(x) = differenzierbar. √ 3 x die Gleichung f (x, ϕ(x)) = 0, aber ϕ ist in x = 0 nicht Satz 6.16 (Satz über implizite Funktionen) Sei U ⊂ R n × Rm (x1 ,...,xn ) (y1 ,...,ym ) offen und f : U −→ Rm eine C 1 –Abbildung. Sei (a, b) ∈ U ein Punkt mit 1) f (a, b) = 0, d.h., es existiert eine Lösung (a, b) von f (x, y) = 0 und 2) ∂f ∂f ∂f1 1 1 ∂y1 ∂y2 . . . ∂ym . .. .. (a, b) =: det ∂f ⊤ (a, b) ∂f ⊤ (a, b) . . . ∂f ⊤ (a, b) 6= 0. . det . . . ∂y1 ∂y2 ∂ym ∂fm ∂fm ∂fm . . . ∂y1 ∂y2 ∂ym Dann existieren eine offene, zusammenhängende Umgebung A(a) ⊂ Rn von a und eine eindeutig bestimmte Abbildung ϕ : A −→ Rm mit i) f (x, ϕ(x)) = 0 und ii) ϕ(a) = b, d.h., in einer Umgebung des Punktes (a, b) ist die Lösungsmenge der Gleichung f (x, y) = 0 der Graph der Funktion ϕ. S1 b a Weiterhin gilt: iii) ϕ : A −→ Rm ist differenzierbar. iv) Falls f ∈ C k ist, so ist auch ϕ ∈ C k und −1 ∂ϕl ∂fk ∂fk ◦ (x) = − (x, ϕ(x)) (x, ϕ(x)) . ∂xi ∂yl ∂xi {z } | {z } | {z } | ∈Rm×n ∈Rm×m ∈Rm×n Beweis: 1) Existenz von ϕ (Auflösung der Gleichung f (x, y) = 0 nach (y1 , . . . , ym ): Wir definieren F : U ⊂ Rn × Rm −→ Rn × Rm durch F (x, y) = (x, f (x, y)). Dann ist F eine C 1 -Funktion und nach Vorausetzung ist 242 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen 1n det(DF (a, b)) = det (∗) ∂f1 ∂y1 0 ... ∂fm ∂y1 ... .. . ∂f1 ∂ym .. (a, b) 6= 0 . ∂fm ∂ym Nach dem Satz über die Umkehrabbildung (Satz 6.15) existieren eine offene Umgebung Ũ(a, b) ⊂ U und eine offene Umgebung Ṽ ⊂ Rn × Rm von F (a, b) = (a, 0), so dass F|Ũ : Ũ −→ Ṽ ein C 1 -Diffeomorphismus ist. Da (a, 0) ∈ Ṽ ist, können wir eine zusammenhängende offene Umgebung A(a) ⊂ Rn und einen offenen Würfel (−ε, ε)m ⊂ Rm wählen, so dass V ′ := A × (−ε, ε)m ⊂ Ṽ ist. Sei nun U ′ := F −1 (V ′ ) ⊂ Ũ ⊂ Rn × Rm . Dann ist F|U ′ : U ′ −→ V ′ ein C k -Diffeomorphismus. Wir betrachten F −1 : V ′ −→ U ′ ⊂ Rn × Rm mit F −1 =: (F1 , F2 ). Dann erhalten wir ↑ Rn ↑ Rm Def. (x, y) = F F −1 (x, y) = F (F1 (x, y), F2 (x, y)) = (F1 (x, y), f (F1 (x, y), F2 (x, y))). Damit gilt F1 (x, y) = x f (x, F2 (x, y)) = y, ∀ (x, y) ∈ V ′ . (∗) Weiterhin gilt F (a, b) = (a, f (a, b)) = (a, 0) und daher (a, b) = F −1 (a, 0) = (F1 (a, 0), F2 (a, 0)) = (a, F2 (a, 0)). Also ist b = F2 (a, 0). (∗∗) Wir definieren nun ϕ : A ⊂ Rn −→ Rm durch ϕ(x) = F2 (x, 0). Dann ist ϕ(a) = b wegen (∗∗) und f (x, ϕ(x)) = 0 wegen (∗) für alle x ∈ A. 2) Eindeutigkeit von ϕ. Angenommen ϕ̃ : A ⊂ Rn −→ Rm wäre eine weitere Funktion mit ϕ̃(a) = b und f (x, ϕ̃(x)) = 0 für alle x ∈ A. Dann wäre einerseits Def. F (x, ϕ(x)) = (x, f (x, ϕ(x))) = (x, 0), aber andererseits wäre auch Def. F (x, ϕ̃(x)) = (x, f (x, ϕ̃(x))) = (x, 0). Da F auf Ũ injektiv ist, folgt ϕ(x) = ϕ̃(x) für alle x ∈ A. 6.5 Implizite Funktionen 243 3) Wenn f eine C k -Funktion ist, dann ist nach Definition auch F eine C k Funktion und daher nach dem Umkehrsatz auch F −1 C k . Nach Definition ist dann auch F2 C k und wegen ϕ(x) = F2 (x, 0) ist auch ϕ eine C k -Funktion. Da f mindestens C 1 ist, ist ϕ auf jeden Fall differenzierbar. 4) Zur Formel für die partiellen Ableitungen: Wir wenden die Kettenregel für partielle Ableitungen an auf f (x, ϕ(x)) = f (x1 , . . . , xn , ϕ1 (x1 , . . . , xn ), . . . , ϕm (x1 , . . . , xn )) = 0 und erhalten ∂ (fk (x, ϕ(x))) ∂xi n m X ∂fk ∂xj X ∂fk ∂ϕl = (x, ϕ(x)) · (x, ϕ(x)) · (x) + ∂x ∂x ∂y ∂xi j i l j=1 |{z} l=1 0= =δij = ∂fk (x, ϕ(x)) + ∂xi m X ∂fk l=1 ∂yl (x, ϕ(x)) · ∂ϕl (x), ∂xi oder in Matrixschreibweise ∂fk ∂ϕl ∂fk (x, ϕ(x)) = (x, ϕ(x)) ◦ (x) . − ∂xi ∂yl ∂xi Daher gilt für die Ableitungen von ϕ −1 ∂fk ∂fk ∂ϕl (x) = − (x, ϕ(x)) (x, ϕ(x)) . ◦ ∂xi ∂yl ∂xi ⊓ ⊔ Beispiel 6.14 Wir betrachten die Funktion f : R2 −→ R mit f (x, y) = x2 + y 2 − 1. Dann erhalten wir {(x, y) ∈ R2 | f (x, y) = 0} = S 1 und ∂f ∂y = 2y. Man kann den Satz über implizite Funktionen auf (x0 , y0 ) ∈ S 1 und y0 6= 0 anwenden. √ (1) Ist y0 > 0, so existiert ϕ : (−1, 1) −→ R, ϕ(x) := 1 − x2 , so dass f (x, ϕ(x)) = 0 und ϕ(x0 ) = y0 . √ (2) Ist y0 < 0, so existiert ϕ : (−1, 1) −→ R, ϕ(x) = − 1 − x2 , so dass wie in (1) f (x, ϕ(x)) = 0 und g(x0 ) = y0 . 244 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen Anwendung Erinnerung: Der Tangentialraum Tp M an einen Punkt p der Fläche M ⊂ Rn ist folgendermaßen definiert: Tp M := {v ∈ Rn | ∃ differenzierbare Kurve γ : (−ε, ε) → M mit γ(0) = p und γ ′ (0) = v}. Satz 6.17 Sei F : U ⊂ Rn → R eine differenzierbare Funktion und Mc = {x ∈ U | F (x) = c} ⊂ Rn eine Niveaufläche von F . Ist grad F (p) 6= 0 für alle p ∈ Mc , so gilt für den Tangentialraum Tp Mc = grad F (p)⊤ = {v ∈ Rn | hv, grad F (p)i = 0} für alle p ∈ Mc . Beweis: Sei p ∈ Mc . Nach Voraussetzung ist grad F (p) 6= 0. Deshalb existiert ∂F (p) 6= 0. OBdA sei dies die n-te Koordinate, es sei eine Koordinate xj mit ∂x j also xj = xn (sonst kann man die Koordinaten umsortieren). Wir definieren p̂ durch p = (p̂, pn ) und x̂ durch x = (x̂, xn ). Nach dem Satz über implizite Funktionen kann man F (x) = c nach der Variable xn auflösen, d.h., es existieren eine Umgebung A(p̂) und eine differenzierbare Funktion ϕ : A(p̂) → R mit F (x1 , . . . , xn−1 , ϕ(x1 , . . . , xn−1 )) = c, ∀ x̂ ∈ A(p̂). Daher existiert eine Umgebung M̂c (p) ⊂ Mc mit M̂c (p) = graph(ϕ) = {(x̂, ϕ(x̂)) | x̂ ∈ A} und aufgrund der lokalen Definition des Tangentialraums durch Kurven gilt ÜA Tp Mc = Tp M̂c = {(v̂, vn ) | v̂ ∈ Rn−1 , vn = hv̂, grad ϕi} = {(v1 , . . . , vn−1 , n−1 X i=1 | ∂ϕ (p̂))}. ∂xi {z } vi · vn Wir werden nun zeigen, dass v = (v1 , . . . , vn ) genau dann in Tp Mc enthalten ist, wenn hv, grad F (p)i = 0 ist. Wie im Beweis von Satz 6.16 folgt aus der Kettenregel ∂F ∂F ∂ϕ (p) · 1 + (p) · (b p) = 0, ∂xi ∂xn ∂xi bzw. 6.5 Implizite Funktionen 245 ∂F ∂ 1 · (b p) = − ∂F (p) ∂xi ∂xi ∂x (p) n für alle i = 1, . . . , n − 1. Eingesetzt in den obigen Ausdruck für vn ergibt sich vn = n−1 X i=1 Daraus folgt vi · n−1 X ∂ϕ ∂F 1 vi · (p̂) = − ∂F (p). · ∂xi ∂xi ∂x (p) i=1 n n−1 0 = vn · Also gilt X ∂F 1 vi · (p) = hv, grad F (p)i. + ∂F ∂x (p) i ∂xn i=1 Tp Mc = {v ∈ Rn | hv, grad F (p)i = 0}. ⊓ ⊔ Beispiel 6.15 Kann man die Gleichung f (x, y, z) = x2 + y 2 + z 2 + 3xyz + x3 z 2 + yz 4 = 1 in einer Umgebung von p = (0, 0, 1) nach z auflösen ? Wie sieht grad z(0, 0) aus ? Genauer: Existiert eine differenzierbare Funktion z(x, y) mit z(0, 0) = 1, f (x, y, z(x, y)) = 1, und falls ja, was ist grad z(0, 0) = ∂z ∂z (0, 0), ∂y ) ( ∂x (∗) ? 1) Wir berechnen die partielle Ableitung von f nach z ∂f (x, y, z) = 2z + 3xy + 2zx3 + 4yz 3 ∂z Also ist ∂f ∂z (0, 0, 1) = 2 6= 0. Da auch f (0, 0, 1) = 1 gilt, existiert also eine Funktion z : U (0, 0) ⊂ R2 → R mit (∗). 2) Mit Hilfe der in Satz 6.16,iv) angegebenen Formel folgt für den Gradienten von z an der Stelle (x, y) = (0, 0) ∂z ∂z grad z(0, 0) = (0, 0), (0, 0) ∂x ∂y −1 ∂f ∂f ∂f =− (0, 0, 1) (0, 0, 1), (0, 0, 1) · ∂z ∂x ∂y 1 = − 2x + 3xy + 3x2 z, 2y 2 + 3xz + z 4 (0, 0, 1) 2 1 = 0, − 2 246 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen 3) Wir betrachten nun die Hyperfläche M = {f (x, y, z) = 1}. grad f = 2x + 3yz + 3x2 z 2 , 2y + 3xz + z 4 , 2z + 3xy + 2x3 z + 4yz 3 . Also ist grad f (0, 0, 1) = (0, 1, 2). Daher ist grad f (x, y, z) 6= 0 in einer Umgebung von p = (0, 0, 1) und der Tangentialraum Tp M an M im Punkt p ist die Menge aller Vektoren v ∈ R3 , die orthogonal zu grad f (0, 0, 1) sind: Tp M := {v ∈ R3 | hv, (0, 1, 2)i = 0} 1 0 = span 0 , 2 0 −1 Es gibt aber auch eine andere Möglichkeit, Tp M zu bestimmen: Wie wir gesehen haben, ist M in einer Umgebung des Punktes p = (0, 0, 1) als Graph der Funktion z : U (0, 0) ⊂ R2 → R darstellbar. Der Tangentialraum Tp M ist nun charakterisiert durch v Tp M = {(v1 , v2 , v3 ) | v1 , v2 ∈ R, v3 = h 1 , grad z(0, 0)i} v2 1 = {(v1 , v2 , − v2 ) | v1 , v2 ∈ R} 2 1 0 = span 0 , 2 . 0 −1 6.6 Extrema unter Nebenbedingungen Sei f : U ⊂ Rn −→ R eine Funktion. Oft benötigt man das Extremwertverhalten von f , wenn die Variablen einer Nebenbedingung unterworfen sind. Sei zum Beispiel K ⊂ U ⊂ R3 ein Gegenstand und f : U → R eine Temperaturverteilung. Dann können wir untersuchen, welches die größte Temperatur ist, die auf K angenommen wird und in welchem Punkt aus K dieser Maximalwert angenommen wird, dh. wir suchen max{f (x) | x ∈ K}. Die Nebenbedingungen seien in der Form eines Gleichungssystems g1 (x1 , . . . , xn ) = 0 .. . gm (x1 , . . . , xn ) = 0 gegeben, d.h. die Nebenbedingungen seien charakterisiert durch die Nullstellenmenge der Funktion g = (g1 , . . . , gm ) : U ⊂ Rn −→ Rm . 6.6 Extrema unter Nebenbedingungen 247 Definition 6.12. f nimmt in einem Punkt p ∈ Ng := {x ∈ U | g(x) = 0} ein lokales Maximum (Minimum) unter der Nebenbedingung g(x) = 0 an, falls ein ε > 0 existiert, so dass f (x) ≤ f (p) (f (x) ≥ f (x0 )) ∀ x ∈ K(p, ε) ∩ Ng . Erinnerung: Hat f : U ⊂ Rn −→ R, f ∈ C 1 , ein lokales Extremum in p ∈ U , so ist grad f (p) = 0. Satz 6.18 (Notwendige Bed. für Extrema unter Nebenbedingungen) Seien f : U ⊂ Rn −→ R und g : U ⊂ Rn −→ Rm , m ≤ n, C 1 -Funktionen und p ∈ U mit ∂gj (p) = m. rang (Dg(p)) = rang ∂xi Hat f in p ein lokales Extremum unter der Nebenbedingung g(x) = 0, dann existieren Konstanten λ1 , . . . , λm ∈ R, so dass grad f (p) = λ1 grad g1 (p) + . . . + λm grad gm (p) gilt. Die (λ1 , . . . , λm ) heißen Lagrange–Multiplikatoren. Beweis: Da rg(Dg(p)) = m ist, können wir OBdA voraussetzen, dass ∂g1 det ∂x1 (p) ... ∂gm ∂x1 (p) ... .. . ∂g1 ∂xm (p) .. . 6= 0, ∂gm ∂xm (p) ist. (Anderenfalls ordnen wir die (x1 , . . . , xn ) so um, dass die ersten m Spalten von Dg(p) linear unabhängig sind.) Dann hat das lineare Gleichungssystem m X v=1 λv · ∂f ∂gv (p) = (p), ∂xi ∂xi i = 1, . . . , m, (1) genau eine Lösung (λ1 , . . . , λm ) ∈ Rm . Dies ist ein Teil (er enthält die ersten m der insgesamt n Komponenten von grad f ) der gesuchten Gleichung grad f (p) = m X v=1 λv · grad gv (p) (∗). Es ist noch zu zeigen, dass (1) auch für die Komponenten i = m + 1, . . . , n erfüllt ist. Wir definieren p =: (p̂, p′ ) mit p̂ = (p1 , . . . , pm ) und p′ = (pm+1 , . . . , pn ) und analog x =: (x̂, x′ ) mit x̂ = (x1 , . . . , xm ) und x′ = (xm+1 , . . . , xn ). Nach dem Satz über implizite Funktionen kann man 248 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen g(x1 , . . . , xm , xm+1 , . . . , xn ) = 0 | {z } | {z } x′ x̂ in einer Umgebung A(p′ ) nach x1 , . . . , xm auflösen, d.h., es existieren C 1 Funktionen ϕ1 , . . . , ϕm =: ϕ : A(p′ ) −→ Rm mit g(ϕ1 (xm+1 , . . . , xn ), . . . , ϕm (xm+1 , . . . , xn ), xm+1 , . . . , xn ) = 0 und ϕ(p′ ) = p̂. Dann gilt nach der Kettenregel für 0= m X ∂gv xi i=1 bzw. (p) · ∂ ∂xµ ∂ϕi ′ ∂gv (p ) + (p), ∂xµ xµ m X ∂gv ∂gv ∂ϕi ′ (p) = − (p) · (p ). xµ xi ∂xµ i=1 (2) Wir betrachten nun die folgende Funktion F : A(p′ ) → R F (xm+1 , . . . , xn ) := f (ϕ1 (x′ ), . . . , ϕm (x′ ), xm+1 , . . . , xn ). {z } | x′ Nach Voraussetzung hat f in p = (ϕ(p′ ), p′ ) ein lokales Extremum und daher F in p′ ein lokales Extremum. Folglich ist grad F (p′ ) = 0 und mit der Kettenregel folgt m 0= bzw. X ∂f ∂F ′ ∂ϕi ′ ∂f (p ) = (p) · (p ) + (p) = 0, ∂xµ ∂x ∂x ∂x i µ µ i=1 m X ∂f ∂f ∂ϕi ′ (p) = − (p) · (p ), ∂xµ ∂xi ∂xµ i=1 ∀ µ = m + 1, . . . , n. ∀ µ = m + 1, . . . , n. (3) Mit (1) und (2) nacheinander in (3) eingesetzt, ergibt sich m m XX ∂gv ∂ϕi ′ ∂f (p) = − λv · (p) · (p ) ∂xµ ∂x ∂x i µ i=1 v=1 = m X v=1 λv · ∂gv (p) ∂xµ ∀ µ = m + 1, . . . , n. Die letzte Gleichung und Gleichung (1) zusammen liefern grad f (p) = m X v=1 λv · grad gv (p). ⊓ ⊔ 6.6 Extrema unter Nebenbedingungen 249 Anwendung Wir betrachten die C 1 -Funktion g : U ⊂ Rn → Rm , m ≤ n und einen Punkt p ∈ Ng = {x ∈ U | g(x) = 0}, so dass rang(Dg(p)) = m ist. Sei ein lokaler Extremwert von f : U ⊂ Rn −→ R unter der Nebenbedingung g(x) = 0, so existiert ein (λ1 , . . . , λm ) ∈ Rm , so dass (p1 , . . . , pn , λ1 , . . . , λm ) ∈ Rn × Rm | {z } p eine Lösung des folgenden Gleichungssystems ist m X ∂gv ∂f λv · (p) = (p) ∀ j = 1, . . . , n ∂xj ∂xj v=1 g1 (p) = 0, .. . gm (p) = 0. Dieses Gleichungssystem mit n + m–Gleichungen und n + m–Unbekannten heißt Lagrangesches Gleichungssystem. Betrachtet man die Funktion F (x1 , . . . , xn , λ1 , . . . , λm ) := f (x) − m X λi gi (x), i=1 dann ist das Lagrangesche Gleichungssystem äquivalent zum Gleichungssystem ∂F (p, λ) = 0 ∀i = 1, . . . , n, ∂xi ∂F (p, λ) = 0, ∀j = 1, . . . , m. (∗). ∂λj Man findet also die lokalen Extrema von f unter der Nebenbedingung g(x) = 0 unter den Lösungen des Lagrangeschen Gleichungssystems (∗). Aber nicht jede Lösung (p, λ) des Lagrangeschen Gleichungssystems liefert ein lokales Extremum p von f unter der Nebenbedingung g(x) = 0. Man muss für jede Lösung (p, λ) des Lagrangeschen Gleichungssystems extra untersuchen, ob p tatsächlich ein lokales Extremum ist. Ist die Nullstellenmenge Ng = {x ∈ U | g(x) = 0} kompakt, so existieren max f|Ng und min f|Ng . Somit müssen zwei der Lösungen des Lagrangeschen Gleichungssystems diese Punkte liefern. 250 6 Differentialrechnung für Abbildungen mehrerer reeller Variablen Beispiel 6.16 Wir bestimmen Maxima und Minima von f (x, y) = x · y auf S 1 = {(x, y) ∈ R2 | x2 + y 2 = 1}. 1) Die Nebenbedingung lautet also g(x, y) = x2 + y 2 − 1 = 0 und wir erhalten ∂g ∂g , Dg = = (2x, 2y) 6= 0 auf S 1 . ∂x ∂y Daraus folgt rang(Dg)(p) = 1 für alle p ∈ S 1 . 2) Nun bestimmen wir die Lösungen des Lagrangeschen Gleichungssystems für die Funktion F (x, y, λ) := f (x, y) − λg(x, y) = x · y − λx2 − λy 2 + λ. Das Lagrangesche Gleichungssystem lautet daher ∂F = y − 2λx = 0 ∂x ∂F = x − 2λy = 0, ∂y ∂F = −x2 − y 2 + 1 = 0. ∂λ Wir multiplizieren die erste Gleichung mit x, die zweite Gleichung mit y und subtrahieren die zweite der entstehenden Gleichungen von der ersten. Das ergibt λx2 = λy 2 . λ muss ungleich 0 sein, denn sonst wäre (x, y) = (0, 0) 6∈ S 1 . Somit gilt x2 = y 2 und daher |x| = |y|. Mit der q g(x, y) = 0 q Nebenbedingung ergibt sich 2x2 = 2y 2 = 1. Folglich ist x = ± 12 und y = ± 12 . Damit sind die einzig möglichen Punkte für die lokalen Extrema 1 1 1 1 1 1 1 1 √ ,√ (x0 , y0 ) ∈ , √ , −√ , −√ , √ , −√ , −√ 2 2 2 2 2 2 2 2 mit den Funktionswerten 1 2 f (x, y) = − 1 2 (x, y) = √1 , √1 2 2 ± √12 , − √12 . (x, y) = ± Da S 1 kompakt ist, existieren max(f|S1 ) und min(f|S1 ). Somit ist 1 1 1 1 1 , −√ , −√ , und wird angenommen in √ , √ max(f|S1 ) = 2 2 2 2 2 1 1 1 1 1 und wird angenommen in − √ , √ min(f|S1 ) = − , √ , −√ . 2 2 2 2 2 Weitere lokale Extremwerte treten nicht auf. 6.6 Extrema unter Nebenbedingungen 251 Beispiel 6.17 Wir bestimmen den Punkt auf der Ebene E = {(x, y, z) ∈ R3 | z = x + y}, der den kleinsten Abstand zum Punkt P = (1, 0, 0) hat. Dazu betrachten wir das Quadrat der Abstandsfunktion f (x, y, z) := d((x, y, z), P )2 = k(x − 1, y, z)k2 = (x − 1)2 + y 2 + z 2 mit der Nebenbedingung g(x, y, z) = z − (x + y) = 0. Es gilt ∂g ∂g ∂g = (−1, −1, 1) 6= 0 ∀ (x, y, z) ∈ E. , , (Dg)(x, y, z) = ∂x ∂y ∂z Wir definieren die Abbildung F (x, y, z) := f (x, y, z) − λg(x, y) = f (x, y, z) − λ(z − (x + y)) = (x − 1)2 + y 2 + z 2 − λz + λx + λy. Dann ergibt sich als Lagrangesches Gleichungssystem (1) (2) (3) (4) ∂F ∂x ∂F ∂y ∂F ∂z ∂F ∂λ = 2(x − 1) + λ = 0 = 2y + λ = 0 = 2z − λ = 0 = x + y − z = 0. Aus den Gleichungen (2) und (3) folgt y + z = 0. Daher folgt aus der Nebenbedingung (4), dass y = − x2 gelten muss und daher λ = x, woraus x = 32 folgt. Die einzige Lösung des Lagrangeschen Gleichungssystems ist somit (x, y, z, λ) = 1 1 2 2 , − , , . Da E abgeschlossen ist, existiert ein Punkt Q ∈ E mit d(P, Q) = 3 3 3 3 d(P, E). Wir haben diesen Punkt Q = ( 32 , − 31 , 13 ) gefunden. Bemerkung: In diesem Beispiel ist die Nebenbedingung schon in expliziter Form gegeben als z = x + y. Dadurch könnte man hier auch einfacher vorgehen und die Nebenbedingung z = x + y gleich in die zu minimierende Funktion f (x, y, z) = (x − 1)2 + y 2 + z 2 einsetzen und dann das Minimum der entstehenden Funktion h(x, y) := f (x, y, x + y) = (x − 1)2 + y 2 + (x + y)2 untersuchen. 7 Integralrechnung für Funktionen einer reellen Variablen Die Integralrechnung wird durch zwei verschiedene Problemstellungen motiviert: 1. Die Umkehrung der Differentialrechnung: Gegeben sei f : I ⊂ R −→ E und gesucht wird F : I ⊂ R −→ E, so dass F ′ = f gilt. Wie kann man zum Beispiel den Bewegungsablauf F eines Massepunktes ermitteln, wenn man dessen Geschwindigkeit f kennt? 2. Wie kann man den Flächeninhalt von Teilmengen von Rn definieren und berechnen? 7.1 Stammfunktionen und ihre Berechnung Definition 7.1. Sei E ein normierter Vektorraum, I ⊂ R ein beliebiges Intervall und f : I ⊂ R −→ E eine Abbildung. Eine Abbildung F : I ⊂ R −→ E heißt Stammfunktion von f auf I, falls F differenzierbar ist und F ′ = f gilt. Satz 7.1 Sei F : I ⊂ R −→ E eine Stammfunktion von f : I ⊂ R −→ E. Dann ist F̃ : I ⊂ R −→ E genau dann eine Stammfunktion von f , wenn ein konstanter Vektor c ∈ E existiert, so dass gilt F̃ = F + c. Beweis: (⇐) Ist F̃ = F + c, so ist F̃ differenzierbar und es gilt F̃ ′ = F ′ = f . (⇒) Sei F̃ eine Stammfunktion von f . Dann ist F̃ − F differenzierbar und (F̃ − F )′ = 0. Mit dem Mittelwertsatz folgt dann, dass F̃ − F eine konstante Funktion ist. ⊓ ⊔ Definition 7.2. S(I; E) := {f : I ⊂ R −→ E | f besitzt eine Stammfunktion auf I}. 254 7 Integralrechnung für Funktionen einer reellen Variablen Beispiel 7.1 Die Existenz einer Stammfunktion ist vom Intervall I abhängig. Betrachten wir zum Beispiel die Funktion f : R −→ R x 7→ f (x) = ( 1 x 0 x 6= 0 x = 0. Auf R existiert keine Stammfunktion: Angenommen, F sei eine Stammfunktion von f auf R. Da (ln x)′ = x1 gilt, würde für F folgen F|(0,∞) = ln x + c, F|(−∞,0) = ln(−x) + ĉ, c, ĉ ∈ R. Wäre F auf ganz R definiert, so müsste F in x = 0 stetig sein, aber ln x konvergiert für x gegen 0 gegen −∞. Aber für jedes Intervall I mit 0 6= I ist F (x) = ln |x| + c eine Stammfunktion von f auf I. Bemerkung: Später (siehe Satz 7.10) werden wir zeigen, dass jede stetige Funktion f : [a, b] −→ E, wobei E ein Banachraum ist, eine Stammfunktion hat, das heißt C([a, b]; E) ⊂ S([a, b]; E). Definition 7.3. Sei f ∈ S(I; E). Unter dem unbestimmten Integral von f auf I versteht man die Menge aller Stammfunktionen von f . Bezeichnung: Z f (x) dx := {F : I ⊂ R −→ E | F Stammfunktion von f auf I} f heißt der Integrand und x die Integrationsvariable. Ist F eine StammfunkR tion von f , so benutzt man die Schreibweise f (x) dx = F (x) + c auf I. Beispiel 7.2 Ist f : I ⊂ R −→ E differenzierbar, so besitzt f ′ eine Stammfunktion, das heißt f ′ ∈ S(I; E) und es gilt Z f ′ (x) dx = f (x) + c auf I. 7.1 Stammfunktionen und ihre Berechnung 255 Wichtige Grundintegrale (Beweis durch Ableiten der Stammfunktion): (1) Z xα dx = (2) Z 1 dx = ln |x| + c auf (0, ∞) und (−∞, 0), x Z 1 xα+1 + c. Dies gilt für α ∈ N auf R, α ∈ −N\{−1} auf α+1 (−∞, 0) sowie (0, ∞) und α ∈ R\{Z} auf (0, ∞), ex dx = ex + c auf R, Z Z (4) cos x dx = sin x + c, sin x dx = − cos x + c auf R, Z Z (5) cosh x dx = sinh x + c, sinh x dx = cosh x + c auf R, (3) Z 1 dx = arctan x + c auf R, 1 + x2 ( Z 1 1 1 + x artanh(x) + c auf (−1, 1) (7) dx = ln +c= , 1 − x2 2 1 − x arcoth(x) + c auf (−∞, −1) ∪ (1, ∞) Z 1 √ dx = arsinh(x) + c auf R, (8) 1 + x2 Z 1 √ (9) dx = arcsin x + c auf (−1, 1), 1 − x2 ( Z p 1 arcosh(x) + c auf (1, ∞) √ (10) dx = ln |x + x2 − 1| + c = −arcosh(−x) + c auf (−∞, −1) x2 − 1 Z e(a+ib)x + c auf R für a + ib 6= 0, (11) e(a+ib)x dx = (a + ib) Z dx x−a (12) + c für b 6= 0, = ln |x − (a + ib)| + i · arctan (x − (a + ib)) b Z 1 1 dx =− + c für n ∈ N, n > 1. · (13) (x − (a + ib))n n − 1 (x − (a + ib))n−1 (6) Satz 7.2 (Rechenregeln für unbestimmte Integrale) (1) Sei f, g ∈ S(I; E), µ, λ ∈ R. Dann ist auch λf + µg ∈ S(I; E) und es gilt Z Z Z (λf (x) + µg(x)) dx = λ f (x) dx + µ g(x) dx. (2) Partielle Integration: Seien f, g : I ⊂ R −→ E differenzierbar und f · g ′ ∈ S(I; E). Dann gilt f ′ · g ∈ S(I; E) und 256 7 Integralrechnung für Funktionen einer reellen Variablen Z ′ f (x)g (x) dx + Z f ′ (x)g(x) dx = f (x)g(x) + c. (3) Substitutionsregel: g ∈ S(I; E) habe die Stammfunktion G, f : J ⊂ R −→ I ⊂ R sei differenzierbar. Dann hat (g ◦ f ) · f ′ : J ⊂ R −→ E die Stammfunktion G∗ = G ◦ f , das heißt Z Z g(f (x)) · f ′ (x) dx = g(y) dy y=f (x) . |{z} | {z } y dy (Formal schreibt man: y = f (x), dy = f ′ (x) dx.) (4) f = (f1 , f2 ) ∈ S(I; E1 × E2 ) gilt genau dann, wenn fi ∈ S(I; Ei ) für i ∈ {1, 2} ist, und es gilt dann Z Z Z f (x) dx = f1 (x) dx, f2 (x) dx . Beweis: Folgt aus den Rechenregeln für die Ableitung (Produktregel, Kettenregel, komponentenweises Differenzieren). ⊓ ⊔ Beispiel 7.3 Sei f : I ⊂ R −→ R eine differenzierbare Funktion ohne Nullstellen auf I. Dann gilt Z ′ f (x) dx = ln |f (x)|, f (x) denn nehmen wir die Substitution y = f (x), dy = f ′ (x) dx vor, so erhalten wir Z Z ′ dy f (x) dx = = ln |y|y=f (x) = ln |f (x)|. y=f (x) f (x) y So ist zum Beispiel Z Z π π sin x . dx = − ln (cos x) + c auf − , tan x dx = cos x 2 2 Beispiel 7.4 Gelgentlich ist das Einfügen einer 1 nützlich: Z Z Z part. Int. ln(x) dx = ln(x) · 1 dx = − ln′ (x) ·x dx + ln(x) · x + c | {z } 1 =x = −x + x · ln(x) + c auf (0, ∞). 7.1 Stammfunktionen und ihre Berechnung 257 Beispiel R dx 7.5 x x Um 1+e x zu berechnen, substituieren wir y = e , dy = e dx = y dx. Dann ist Z Z Z 1 1 1 1 dx dy y=ex = dy = − x 1+e 1+yy y 1+y = ln y − ln (y + 1) + cy=ex = |{z} ln ex − ln ex + 1 + c =x = x − ln ex + 1 + c auf R. Beispiel 7.6 R Wie wird In := sinn x dx berechnet? Z In = − sinn−1 x · cos′ x dx Z d part. Int. = − sinn−1 x · cos x + sinn−1 x · cos x dx dx Z n−1 = − sin x · cos x + (n − 1) sinn−2 x 1 − sin2 x dx = − sinn−1 x · cos x − (n − 1)In + (n − 1)In−2 . Es folgt n−1 1 sinn−1 x · cos x + In−2 für n ≥ 2. n n wobei I0 = x + c und I1 = − cos x + c ist. In = − Für Jn := R cosn x dx berechnet man analog Jn = 1 n−1 cosn−1 x · sin x + Jn−2 für n ≥ 2 n n mit J0 = x + c und J1 = sin x + c. Integrale rationaler Funktionen Seien P, Q ∈ C[z] Polynome, Q ≡ 6 0. Wir betrachten ein Intervall I ⊂ R, auf dem Q keine Nullstelle hat und definieren f : I ⊂ R −→ C. x 7→ f (x) := P (x) Q(x) Dann heißt f komplexe rationale Funktion. Sind speziell P, Q ∈ R[z] ⊂ C[z] Polynome über R, so heißt f reelle, rationale Funktion. Unser Ziel ist nun die Berechnung von R P (x) Q(x) dx. 258 7 Integralrechnung für Funktionen einer reellen Variablen Satz 7.3 (Fundamentalsatz der Algebra) Jedes komplexe Polynom Q ∈ C[z] vom Grad > 0 hat mindestens eine Nullstelle, das heißt, es existiert ein ξ ∈ C mit Q(ξ) = 0. Beweis: Sei Q ∈ C[z] mit Grad Q = n ≥ 1 gegeben. Dann gilt Q(z) = an z n + an−1 z n−1 + . . . + a1 z + a0 , an 6= 0, aj ∈ C ∀ j ∈ {1, . . . , n}. (1) Sei α > 0 gegeben. Zuerst zeigen wir, dass ein r > 0 existiert, so dass für e alle |z| ≥ r die Abschätzung |Q(z)| ≥ α gilt. Wir definieren dazu Q(x) durch a0 1 an−1 1 + ...+ Q(z) = an z n 1 + , z 6= 0. a z an z n | n {z } e =:Q(z) a0 + . . . + Sei nun β := 1 + an−1 an ≥ 1. Für |z| ≥ 2β folgt dann an a0 1 a0 1 an−1 an−1 1 e + . . . + + ...+ n ≤ |Q(z)| ≤ an |z| an |z| an an |z| ≤β· 1 1 ≤ . |z| 2 e Es folgt |1 + Q(x)| ≥ 1 2 und |Q(z)| = |an z n | · |1 + Q̃(z)| ≥ Setzen wir r := max{2β, 2α |an | n1 1 |an | · |z|n für alle |z| ≥ 2β. 2 }, dann folgt aus |z| ≥ r, dass |Q(z)| ≥ α gilt. (2) Wir zeigen, dass ein ξ ∈ C existiert, so dass Q(ξ) = 0. Sei A := {|Q(z)| | z ∈ C} ⊂ R. Da |Q(z)| ≥ 0 gilt, ist A von unten beschränkt. Somit existiert µ := inf A ≥ 0. Nach (1) existiert ein r > 0, so dass gilt |Q(z)| ≥ µ + 1 ∀ |z| ≥ r. Also ist µ = inf{|Q(z)| | z ∈ C} = inf{|Q(z)| | |z| ≤ r}. Da K(0, r) ⊂ C kompakt ist und die Funktion q : C −→ R z 7→ |Q(z)| stetig ist, existiert ein Minimum von q auf K(0, r), das heißt, es existiert ein ξ ∈ K(0, r) mit |Q(ξ)| = µ. Wir zeigen, dass Q(ξ) = 0 gilt. Wir nehmen an, dass Q(ξ) 6= 0 ist und betrachten das Polynom in z vom Grad n H(z) := Q(z + ξ) . Q(ξ) 7.1 Stammfunktionen und ihre Berechnung 259 Da |Q(ξ)| = min{|Q(z)| | z ∈ C} ist, gilt H(0) = 1 und |H(z)| ≥ 1 für alle z ∈ C, und es folgt H(z) = bn z n + . . . + bm z m + 1, bm 6= 0, m ≥ 1, bj ∈ C ∀ j ∈ {m, . . . , n}. m| der Norm 1 existiert ein ψ ∈ R, so dass Für die komplexe Zahl w := − |bbm imψ imψ gilt w = e , das heißt bm e = −|bm |. Wir betrachten nun H auf den komplexen Zahlen der Form z = ̺ · eiψ mit ̺ > 0. Dann gilt |H(̺ · eiψ )| ≤ |bn | · ̺n + . . . + |bm+1 | · ̺m+1 + |1 + bm ̺m · eimψ | . | {z } =|1−|bm |·̺m | Sei nun ̺ so klein gewählt, dass ̺m < damit 1 |bm | ist. Dann ist 1 − |bm |̺m > 0 und |H(̺ · eiψ )| ≤ 1 − |bm | · ̺m + |bm+1 | · ̺m+1 + . . . + |bn | · ̺n = 1 − ̺m (|bm | − |bm+1 | · ̺ − . . . − |bn | · ̺n−m ). {z } | >0 für ̺ hinreichend klein Somit ist |H(̺ · eiψ )| < 1 für hinreichend kleine ̺. Dies ist ein Widerspruch zu |H(z)| ≥ 1 für alle z ∈ C. Somit ist unsere Annahme falsch und Q(ξ) = 0. ⊓ ⊔ Satz 7.4 (Zerlegungssatz für komplexe Polynome) Sei Q ∈ C[z] ein Polynom vom Grad n ≥ 1 und seien ξ1 , . . . , ξm ∈ C alle verschiedenen Nullstellen von Q. Dann gilt Q(z) = an z n + . . . + a1 z + a0 = an (z − ξ1 )ν1 · (z − ξ2 )ν2 · . . . · (z − ξm )νm , wobei νj ∈ N eindeutig bestimmte natürliche Zahlen sind und n = ν1 +. . .+νm . Bemerkung: νj heißt die Vielfachheit der Nullstelle ξj . Q hat genau n Nullstellen (gezählt mit Vielfachheit). Beweis: Sei Q(ξ1 ) = 0. Wir betrachten das Polynom qk (z) := z k−1 + z k−2 · ξ1 + . . . + z · ξ1k−2 + ξ1k−1 . Dann gilt z k − ξ1k = (z − ξ1 ) · qk (z) und folglich Q(z) = Q(z) − Q(ξ1 ) = a1 (z − ξ1 ) + a2 (z 2 − ξ12 ) + . . . + an (z n − ξ1n ) = (a1 q1 (z) + . . . + an qn (z)) · (z − ξ1 ) =: Q1 (z) · (z − ξ1 ), mit deg(Q1 ) = n − 1. Ist n − 1 ≥ 1, so hat Q1 eine weitere Nullstelle und wir können einen weiteren Linearfaktor von Q abspalten. Dies funktioniert n–mal. ⊓ ⊔ 260 7 Integralrechnung für Funktionen einer reellen Variablen Satz 7.5 (Partialbruchzerlegung komplexer rationaler Funktionen) P (z) Sei f (z) = Q(z) eine komplexe, rationale Funktion, wobei P, Q ∈ C[z] Polynome mit deg(P ) < deg(Q) sind. Q habe die verschiedenen Nullstellen ξ1 , . . . , ξm mit der Vielfachheit ν1 , . . . , νm . Dann existieren Konstanten cjk ∈ C für alle j ∈ {1, . . . , m}, k ∈ {1, . . . , νj }, so dass gilt f (z) = νj m X X j=1 k=1 m X cjk = k (z − ξj ) j=1 cjνj cj1 cj2 + + ...+ z − ξj (z − ξj )2 (z − ξj )νj . Beweis: Wir führen den Beweis durch Induktion nach deg(Q). Ind.–Anfang: Sei deg(Q) = 1. Da nach Voraussetzung deg(P ) < deg(Q) gilt, ist deg(P ) = 0 und somit P ≡ a0 =konstant. Ist ξ1 Nullstelle von Q, so era0 , das heißt c11 := ab10 . halten wir f (z) = b1 (z−ξ 1) e e ≤ n−1 Ind.–Voraussetzung: Die Behauptung sei für alle fe = P mit deg(Q) e Q bewiesen. P Ind.–Behauptung: Die Behauptung gilt für f = Q mit deg(Q) = n. Ind.–Beweis: Sei ξ1 eine Nullstelle von Q mit Vielfachheit ν1 . Dann folgt Q(z) = (z − ξ1 )ν1 · S(z), wobei S(z) ∈ C[z] mit deg(S) = n − ν1 < n und (ξ1 ) S(ξ1 ) 6= 0 gilt. Sei a := PS(ξ . Dann gilt 1) P (z) P (z) − a · S(z) a . (∗) = − Q(z) (z − ξ1 )ν1 (z − ξ1 )ν1 · S(z) Nach Definition von a gilt P (ξ1 ) − aS(ξ1 ) = 0. Ist P − aS ≡ 0, so gilt die Behauptung. Sei nun P − aS 6≡ 0. Dann kann man nach dem Zerlegungssatz den Linearfaktor (z − ξ1 ) abspalten, das heißt P (z) − aS(z) = (z − ξ1 )S̃(z). Es folgt e S(z) a P (z) (∗) + . = ν 1 Q(z) (z − ξ1 ) (z − ξ1 )ν1 −1 · S(z) Da deg(S(z) · (z − ξ1 )ν1 −1 ) = deg(S) + ν1 − 1 = n − 1 ist, kann man nach Ind.–Voraussetzung den zweiten Summanden entsprechend der Behauptung zerlegen. Da Q(z) = (z − ξ1 )ν1 S(z) kommen alle Nullstellen von Q vor und ξ1 mit einer Vielfachheit kleiner. ⊓ ⊔ Bemerkung(Methoden zur Berechnung der Koeffizienten in der Partialbruchzerlegung): Sei f komplexe, rationale Funktion, das heißt m f (z) = νj cjk P (z) X X . = Q(z) j=1 (z − ξj )k (∗∗) k=1 (1) Multiplizieren wir f (z) mit Q(z), so können wir durch Koeffizientenvergleich die Konstanten cjk für j ∈ {1, . . . , m}, k ∈ {1, . . . , νj } berechnen. 7.1 Stammfunktionen und ihre Berechnung 261 (2) Indem wir n spezielle Werte für z einsetzen und das dadurch entstehende lineare Gleichungssystem für cjk lösen, erhalten wir ebenfalls die Koeffizienten. (3) Multiplizieren wir (∗∗) mit (z − ξj )νj , so erhalten wir P (z) νj · (z − ξj ) . cjνj = lim z→ξj Q(z) Die restlichen Koeffizienten lassen sich wie in (1) oder (2) berechnen oder wir betrachten e cjνj P (z) (∗∗) S(z) , = − ν j e Q(z) (z − ξj ) Q(z) das heißt, Q̃ hat ξj als (νj − 1)–fache Nullstelle. Dann lassen sich die cjνj −1 analog bestimmen. Beispiel 7.7 Wir betrachten die komplexe rationale Funktion f (z) = z+1 P (z) = . z4 − z3 + z2 − z Q(z) Dann sind offensichtlich ξ1 = 0, ξ2 = 1 Nullstellen von Q und es folgt (z 4 − z 3 + zz2 ) Q(z) = = z 2 + 1. z(z − 1) (z 2 − z) Somit sind die weiteren Nullstellen von Q gleich ±i und es gilt f (z) = c1 c2 c3 c4 + + + . z z−1 z−i z+i Zur Berechnung der Koeffizienten wenden wir Methode (3) an, das heißt 1 z+1 = = −1, c1 = lim z→0 (z − 1)(z − i)(z + i) −1 · (−i) · i z+1 c2 = lim = 1. z→1 z(z − i)(z + i) Durch analoges Rechnen erhält man c3 = i 2 und c4 = − 2i . Somit gilt 1 1 i i f (z) = − + + − . z z − 1 2(z − i) 2(z + i) Satz 7.6 (Partialbruchzerlegung von reellen rationalen Funktionen) Seien P, Q ∈ R[z] Polynome mit reellen Koeffizienten, deg(Q) > deg(P ). (1) Ist ξ ∈ C eine echt–komplexe Nullstelle von Q mit der Vielfachheit ν, so 262 7 Integralrechnung für Funktionen einer reellen Variablen ist auch ξ eine Nullstelle von Q mit der Vielfachheit ν, das heißt: Die reellen Nullstellen von Q sind x1 , . . . , xs mit Vielfachheit µ1 , . . . , µs . Die echt-komplexen Nullstellen von Q sind ξ1 , . . . , ξr mit Vielfachheit ν1 , . . . , νr ξ1 , . . . , ξr mit Vielfachheit ν1 , . . . , νr , mit n = µ1 + . . . + µs + 2(ν1 + . . . + νr ). (2) Die Partialbruchzerlegung von f (z) = f (z) = µj s X X j=1 k=1 ν r l XX cjk + k (z − xj ) l=1 k=1 P (z) Q(z) hat die Form: Alk Alk + (z − ξl )k (z − ξl )k , cjk ∈ R. Beweis: (1) Sei ξ ∈ C eine echt–komplexe Nullstelle von Q und Q ∈ R[z]. Dann ist Q(ξ) = 0 und Q(ξ) = 0 = Q(ξ). Folglich ist ξ Nullstelle von Q. Spaltet man (z − ξ)(z − ξ) von Q ab, so folgt durch die Betrachtung des Restpolynoms die Behauptung. (2) Aus der Partialbruchzerlegung folgt für x ∈ R, x 6= xj s f (x) = µj r ν l XX P (x) X X cjk + = Q(x) j=1 (x − xj )k k=1 l=1 k=1 Blk Alk + (x − ξl )k (x − ξl )k . Da f (x) = f (x) ist, gilt für x 6= xj , ξj , ξj X j,k X cjk + (x − xj )k l,k Blk Alk + (x − ξl )k (x − ξ)k = X j,k X cjk + k (x − xj ) l,k Alk Blk + (x − ξl )k (x − ξl )k . Nun erhält man aus dem Identitätssatz für Potenzreihen: Seien λ1 , . . . , λm verschiedene komplexe Zahlen, ajk ∈ C und für alle x ∈ R mit x 6= λj (j ∈ {1, . . . , m}) gelte νj m X X ajk = 0. (x − λj )k j=1 k=1 Daraus folgt ajk = 0. Die Anwendung dieses Identitätssatzes liefert cjk = cjk ∈ R und Alk = Blk . ⊓ ⊔ 7.1 Stammfunktionen und ihre Berechnung 263 Anwendung auf die Berechnung des Integrals rationaler Funktionen (1) Seien P, Q ∈ C[z], N S(Q)∩I = ∅ und f eine komplexe, rationale Funktion auf I, das heißt f : I ⊂ R −→ C P (x) . x 7→ Q(x) R Gesucht ist f (x) dx auf I. (a) Dividieren wir P durch Q so erhalten wir den Rest P2 ∈ C[z] mit deg(P2 ) < deg(Q), das heißt, es gilt f (x) = P1 (x) + P2 (x) . Q(x) 2 (x) vor. (b) Nun nehmen wir die Partialbruchzerlegung von PQ(x) (c) Auf I gilt Z 1 x−a + ln |x − ξ| + c für ξ = a + ib, b 6= 0, dx = i arctan x−ξ b Z 1 dz = ln |x − ξ| + c für ξ ∈ R, z−ξ Z 1 1 1 dx = − + c für n ∈ N, n > 1. (x − ξ)n n − 1 (x − ξ)n−1 R Folglich kann man f (x) dx vollständig berechnen. (2) Seien P, Q ∈ R[z], N S(Q) ∩ I = ∅ und f eine reelle rationale Funktion auf I, das heißt f : I ⊂ R −→ R P (x) x 7→ . Q(x) Wir nehmen die gleichen Schritte vor wie in (1) und fassen am Schluss die komplexen Ausdrücke zu einem reellen zusammen. Dann gilt mit ξ ∈ C echt– komplex und ξ = a + bi Z Z 1 x−a x−a 1 dx = c i arctan + c i arctan c dx + c x−ξ b −b x−ξ +c ln |x − ξ| + c ln |x − ξ|. Wegen |x − ξ| = |x − ξ| gilt c ln |x − ξ| + c ln |x − ξ| = 2Re(c) · ln p (x − a)2 + b2 . 264 7 Integralrechnung für Funktionen einer reellen Variablen = − arctan x−a folgt daher b x−a x−a x−a + ci arctan = −2Im(c) arctan . ci arctan b −b b Mit arctan x−a −b Daraus folgt Z p x−a c c + dx = 2Re(c)·ln (x − a)2 + b2 −2Im(c)·arctan x−ξ b x−ξ und Z c c + (x − ξ)k (x − ξ)k 1 dx = − k−1 =− 1 k−1 Beispiel 7.8 Berechnung des Integrals von f (x) = c c + (x − ξ)k−1 (x − ξ)k−1 c(x − ξ)k−1 + c(x − ξ)k−1 (x2 − 2x · a + |ξ|2 )k−1 + const. + const. 2x3 +2x2 +2x−2 : (x2 +1)2 Q(x) = (x2 + 1)2 = (x − i)2 (x + i)2 . Folglich sind ξ1 = i und ξ2 = −i zweifache Nullstellen von Q und es folgt c21 c11 c12 c22 + f (z) = + + 2 (z − i) (z − i) (z + i) (z + i)2 3 2 −2i − 2 + 2i − 2 2z + 2z + 2z − 2 = =1 c12 = lim 2 z→i (z + i) 4i2 2z 3 + 2z 2 + 2z − 2 2i − 2 − 2i − 2 c22 = lim = = 1. 2 z→−i (z − i) 4i2 Setzen wir dann zum Beispiel x = 0, x = 1, erhalten wir ein Gleichungssystems für c11 , c21 . Dann ist c11 = c21 = 1. Oder wir multiplizieren mit Q(x) und nehmen einen Koeffizientenvergleich vor: 2x3 + 2x2 + 2x − 2 = c11 (x − i)(x + i)2 + 1 · (x + i)2 + c21 (x − i)2 (x + i) +1 · (x − i)2 . R Folglich ist c11 = c21 = 1. Nun können wir f (x) dx berechnen: Z Z Z 1 1 1 1 dx + dx f (x) dx = + + (x − i) (x + i) (x − i)2 (x + i)2 p 1 1 = 2 ln x2 + 1 − − + const. auf R (x − i) (x + i) | {z } =− x22x +1 = 2 ln p x2 + 1 − 2x + const. auf R. +1 x2 7.1 Stammfunktionen und ihre Berechnung 265 Bemerkung: Oft lassen sich Integrale durch Substitution auf Integrale rationaler Funktionen zurückführen. Seien u1 , . . . , un : I ⊂ R −→ C Funktionen. Dann definieren wir P αn 1 αi1 ...in uα 1 · . . . · un α , αI , βI ∈ C. R(u1 , . . . , un ) := P βi1 ...in uβ1 1 · . . . · uβnn β R Verschiedene Integrale der Form R(.) dx und oft geeignete Substitutionen: R (1) R(eaxq ) dx. Geeignete Substitution: y = eax . q R n ax+b (2) R(x, n ax+b cx+d ) dx Geeignete Substitution: y = cx+d . R (3) R(cos x, sin x) dx. Geeignete Substitution: y = tan x2 . Ist R(u, v) = R(−u, −v), so ist eine geeignete Substitution y = tan x. R (4) R(cosh x, sinh x) dx. Geeignete Substitution: y = tanh x2 . Alternativ kann man die Hyperbelfunktionen durch eix darstellen und dann (1) anwenden. √ R . Dann (5) R(x, ax2 + bx + c) dx. Geeignete Substitution: y = √ax+b 2 weiter substitutieren t = sinh y, t = cosh y oder t = cos y. |b −ax| Nicht jedes Integral ist durch eine elementare Funktion darstellbar, auch wenn die Stammfunktion Rexistiert. p Zum Beispiel sind elliptische Integrale, das heißt Integrale der Form R(x, P (x)) dx, wobei P (x) Polynom vom Grad 3 oder 4 ohne mehrfache Nullstellen ist, nicht durch eine elementare Funktion darstellbar. Definition 7.4. Sei f ∈ S(I; E) und a, b ∈ I. Sei F : I ⊂ R −→ E eine Stammfunktion von f . Unter dem bestimmten Integral von f von a nach b versteht man den Vektor (bzw. für E = R oder C die Zahl): Zb a f (x) dx := F (b) − F (a) ∈ E. Bezeichnung: F (b) − F (a) =: F (x)|ba 266 7 Integralrechnung für Funktionen einer reellen Variablen Satz 7.7 (Rechenregeln für das bestimmte Integral) (1) Sei f ∈ S(I; E) und a, b ∈ I. Dann gilt Za Zb f (x) dx = 0, a a f (x) dx = − Za Zb f (x) dx, f (x) dx+ a b Zc f (x) dx = b Zc f (x) dx. a (2) Seien f, g ∈ S(I; E), λ, µ ∈ R (C) und a, b ∈ I. Dann gilt λ Zb f (x) dx + µ a Zb g(x) dx = a Zb (λf (x) + µg(x))(x) dx. a (3) Sei f ∈ S(I, E1 × E2 ) und f = (f1 , f2 ). Dann gilt b Zb Z Zb f (x) dx = f1 (x) dx, f2 (x) dx . a a a (4) Partielle Integration: Seien f, g : I ⊂ R −→ E differenzierbar, a, b ∈ I, f · g ′ ∈ S(I; E). Dann gilt Zb ′ f (x)g (x) dx + a Zb f ′ (x)g(x) dx = f (b)g(b) − f (a)g(a). a (5) Substitutionsregel: Sei g ∈ S(I; E) und f : J ⊂ R −→ I ⊂ R differenzierbar. Dann gilt Zb ′ g(y) dy. g(f (x))f (x) dx = a f Z(b) f (a) ⊓ ⊔ Beweis: Folgt aus Satz 7.2. Beispiel 7.9 Es ist für n ∈ N, n > 1 π Z2 0 n sin x dx = ( 1·3·...·(2k−1) 2·4·...·2k 2·4·...·2k 3·5·...·(2k+1) Beweis: Wir wissen, dass für In = In = − R · π 2 sinn x dx gilt I0 = x, I1 = − cos x, und n−1 1 sinn−1 x · cos x + · In−2 n n Somit erhalten wir n = 2k n = 2k + 1. für n ∈ N, n > 1. 7.2 Das Riemannsche Integral In (0) = n−1 · In−2 (0), n und In π = n−1 · In−2 n 2 und π = π , 2 sowie I1 (0) = −1, I0 (0) = 0, I0 Daraus folgt 2 2 267 π I1 π 2 = 0. 2k − 1 (2k − 1)(2k − 3) · I2k−2 (0) = · I2k−4 (0) 2k (2k)(2k − 2) (2k − 1)(2k − 3) · . . . · 3 · 1 · I0 (0) = 0. = ... = 2k(2k − 2) · . . . · 2 I2k (0) = Analog findet man I2k und es folgt π 2 = π (2k − 1) · . . . 3 · 1 π (2k − 1) · . . . 3 · 1 = · I0 2k · . . . · 4 · 2 2 2k · . . . · 4 · 2 2 I2k+1 (0) = I2k+1 π 2 (2k) · . . . · 4 · 2 · I1 (0) (2k + 1)(2k − 1) · . . . · 3 · 1 | {z } =−1 π (2k) · . . . · 4 · 2 = 0. · I1 = (2k + 1)(2k − 1) · . . . · 3 · 1 | {z2 } =0 7.2 Das Riemannsche Integral Wie kann man Teilmengen A ⊂ R2 einen sinnvollen Flächeninhalt µ(A) ⊂ R+ ∪ {∞} zuordnen? Bedingungen: (1) µ(A) ≥ 0, (2) µ([a1 , b1 ] × . . . × [an , bn ]) = n Q (bi − ai ), i=1 (3) Int(A1 ) ∩ Int(A2 ) = ∅ ⇒ µ(A1 ∪ A2 ) = µ(A1 ) + µ(A2 ), (4) A ⊂ B ⇒ µ(A) ≤ µ(B). 268 7 Integralrechnung für Funktionen einer reellen Variablen Wir betrachten Teilmengen A ⊂ Rn der Form Diese Teilmengen kann man zerlegen in Teile der Form f (x) a b Nun versuchen wir den Flächeninhalt von Mengen der Form A = {(x, y) ∈ R2 | x ∈ [a, b], 0 ≤ y ≤ f (x)}, wobei f : [a, b] −→ R+ ∪ {0} ist, zu definieren. Definition 7.5. Sei I = [a, b] ⊂ R ein kompaktes Intervall. Unter einer Zerlegung von I versteht man eine Menge von Punkten P = {x0 , x1 , . . . , xn } mit a = x0 < . . . < xn = b. Dann heißt Ik := [xk−1 , xk ] k–tes Teilintervall von P, L(Ik ) := xk − xk−1 Länge von Ik und kPk := maxk∈{1,...,n} L(Ik ) Norm der e heißt Verfeinerung der Zerlegung P (P e ≥ P), Zerlegung P. Eine Zerlegung P e e falls zu jedem Teilintervall Iµ von P ein Teilintervall Iν von P mit Ieµ ⊂ Iν existiert. Wir definieren im Folgenden das Riemannsche Integral für Funktionen f : [a, b] −→ E, wobei E Banachraum über R oder C ist. Definition 7.6. Sei f : [a, b] −→ E eine Funktion, P = {x0 , . . . , xn } eine Zerlegung von [a, b] und ξ = (ξ1 , . . . , ξn ) ∈ Rn ein Tupel von Zahlen mit ξk ∈ Ik für alle k ∈ {1, . . . , n}. Dann heißt S(f, P, ξ) := n X k=1 f (ξk ) · L(Ik ) Riemannsche Summe für f bzgl. der Zerlegung P und der Stützstellen ξ = (ξ1 , . . . , ξn ). Definition 7.7. Sei f : [a, b] −→ E. Der Vektor e ∈ E heißt Grenzwert aller Riemannschen Summen für f , falls für alle ε > 0 eine Zerlegung Pε existiert, so dass gilt kS(f, P, ξ) − ek < ε ∀ P ≥ Pε und für alle Stützstellen ξ von P. 7.2 Das Riemannsche Integral 269 Bezeichnung: e := lim S(f, P, ξ) P Bemerkung: Der Grenzwert der Riemannschen Summen ist, falls er existiert, eindeutig bestimmt. Beweis: Seien e1 , e2 ∈ E zwei Vektoren mit e1 = lim S(f, P, ξ) und e2 = P lim S(f, P, ξ). Sei ε > 0. Dann gilt P ε 2 ε ∃ P2 : kS(f, P, ξ) − e2 k ≤ 2 ∃ P1 : kS(f, P, ξ) − e1 k ≤ ∀P ≥ P1 , ∀P ≥ P2 . Sei P0 die Zerlegung von [a, b], die durch die Teilpunkte von P1 und P2 gebildet wird, dass heißt, P0 := P1 ∪ P2 . Dann gilt P0 ≥ P1 und P0 ≥ P2 . Sei nun ξ0 eine beliebige Stützstelle von P0 . Dann erhalten wir ε ε ke1 − e2 k ≤ kS(f, P0 , ξ0 ) − e1 k + kS(f, P0 , ξ0 ) − e2 k ≤ + = ε. 2 2 ⊓ ⊔ Da ε beliebig ist, folgt e1 = e2 . Definition 7.8. Eine Abbildung f : [a, b] −→ E heißt Riemann-integrierbar über [a, b], falls die Riemannschen Summen für f einen Grenzwert besitzen. Bezeichnung: Mit (R) − Zb a f (x) dx := lim S(f, P, ξ) P bezeichnen wir das Riemann-Integral von f über [a, b]. Bemerkung: (1) Wir werden in Abschnitt 7.3 zeigen, dass jede stetige Funktion f : [a, b] −→ E eine Stammfunktion hat und Riemann-integrierbar ist, und dass (R) − Zb a f (x) dx = Zb f (x) dx a R gilt. Wir lassen deshalb Rim Folgenden (R)− vor dem weg. In den Abschnitten 7.2 und 7.3 sei mit immer das Riemann–Integral gemeint. (2) Ist f : [a, b] −→ R Riemann–integrierbar, f ≥ 0 und A gegeben durch A := {(x, y) ∈ R2 | a ≤ x ≤ b, 0 ≤ y ≤ f (x)}. Dann entspricht µ(A) = Rb a f (x) dx dem Flächeninhalt von A. 270 7 Integralrechnung für Funktionen einer reellen Variablen Beispiel 7.10 Wir betrachten die Funktion −1 f (x) = 0 1 x ∈ [ − 1, 0) x=0 x ∈ (0, 1]. f ist Riemann–integrierbar, hat aber keine Stammfunktion. Bemerkung: Jede Treppenfunktion ist Riemann–integrierbar. Vereinbarung: Ist f eine beliebige Funktion und sind a, b ∈ R mit a < b gegeben, so gelte (R) − Za f (x) dx := 0, (R) − a Za f (x) dx := −(R) − b Zb f (x) dx. a Bezeichnung: Wir bezeichnen die Menge aller Riemann–integrierbaren Funktionen von [a, b] in E mit R([a, b]; E). Satz 7.8 Ist f : [a, b] −→ E Riemann–integrierbar, so ist f beschränkt. Beweis: Sei e := Rb a f (x) dx. Nach Definition existiert eine Zerlegung P von [a, b], so dass für beliebige Stützstellen ξ von P gilt kS(f, P, ξ) − ek < 1. Sei Iν ein Teilintervall von P und ξµ ∈ Iµ fix für µ 6= ν. Dann definieren wir X Mν := f (ξµ )L(Iµ ) ∈ E. µ6=ν Für jedes x ∈ Iν gilt kf (x) · L(Iν ) + Mν − ek < 1. Daraus folgt |kf (x)k − 1 Mν − e kMν − ek k< | < kf (x) + , L(Iν ) L(Iν ) L(Iν ) | {z } | {z } =a =r das heißt, kf (x)k liegt im Intervall [a − r, a + r). Folglich gilt für alle x ∈ Iν kf (x)k < Sei nun M := x ∈ [a, b]. kMν − ek 1 1 + = (1 + kMν − ek). L(Iν ) L(Iν ) L(Iν ) 1 max (1 ν∈{1,...,n} L(Iν ) + kMν − ek). Dann ist kf (x)k ≤ M für alle ⊓ ⊔ 7.2 Das Riemannsche Integral 271 Satz 7.9 (Cauchy–Integrierbarkeitskriterium) Sei f : [a, b] ⊂ R −→ E, E Banachraum. Dann gilt f ∈ R([a, b]; E) genau dann, wenn zu jedem ε > 0 e eine Zerlegung Pε von [a, b] existiert, so dass für beliebige Verfeinerungen P, P e e von Pε und Stützstellen ξ, ξ von P bzw. P gilt e < ε. e ξ)k kS(f, P, ξ) − S(f, P, Beweis: (1) Sei f ∈ R([a, b]; E) und ε > 0 gegeben. Dann existieren e ∈ E und Pε , so dass gilt ε ∀P ≥ Pε . kS(f, P, ξ) − ek < 2 e ≥ Pε . Dann gilt Seien P, P e ≤ kS(f, P, ξ) − ek + kS(f, P, e − ek ≤ ε. e ξ)k e ξ) kS(f, P, ξ) − S(f, P, (2) Für jedes ε > 0 existiere eine Zerlegung Pε von [a, b], so dass für beliebige e gilt Verfeinerungen P, P̃ von Pε und Stützstellen ξ, ξe von P bzw. P e < ε. e ξ)k kS(f, P, ξ) − S(f, P, Es ist zu zeigen, dass f ∈ R([a, b]; E) ist. Sei εn > 0 eine Folge, die gegen 0 konvergiert. Nach Voraussetzung folgt dann e < εn e ξ)k ∀n ∈ N ∃ Pn : kS(f, P, ξ) − S(f, P, e ≥ Pn . (∗) ∀ P, P Wir bilden nun sukzessive die folgenden Zerlegungen Un von [a, b]: U1 := P1 , U2 := P1 ∪ P2 = U1 ∪ P2 , U3 := P1 ∪ P2 ∪ P3 = U2 ∪ P3 , . . . , Un := P1 ∪ . . . ∪ Pn = Un−1 ∪ Pn . Folglich ist Pn ≤ Un ≤ Un+1 ≤ . . .. Zu jeder Zerlegung Un wählen wir nun ein Tupel von Stützstellen ξn . Sei ε > 0 gegeben. Dann existiert ein n0 ∈ N mit εn0 < 2ε für alle n0 ≥ n, so dass gilt kS(f, Un , ξn ) − S(f, Um , ξm )k < εn0 < ε 2 ∀ n, m ≥ n0 . (∗∗) Folglich bilden die Vektoren {S(f, Un , ξn )}∞ n=1 eine Cauchy–Folge im Banachraum E. Da E vollständig ist, existiert e := lim S(f, Un , ξn ). Gehen wir in n→∞ (∗∗) mit m gegen ∞, so folgt ε ∀n ≥ n0 . 2 Sei nun P eine beliebige Zerlegung mit P ≥ Un0 . Dann ist wegen kS(f, Un , ξn ) − ek < kS(f, P, ξ) − ek ≤ kS(f, P, ξ) − S(f, Un0 , ξn0 )k + kS(f, Un0 , ξn0 ) − ek (∗) ≤ εn0 + die Funktion f ∈ R([a, b], E). ε < ε, 2 ⊓ ⊔ 272 7 Integralrechnung für Funktionen einer reellen Variablen Satz 7.10 Sei E ein Banachraum. Dann ist jede stetige Abbildung f : [a, b] ⊂ R −→ E Riemann-integrierbar. Beweis: Da f stetig und [a, b] kompakt ist, ist f gleichmäßig stetig, das heißt, für alle ε > 0 existiert ein δ > 0, so dass für alle x1 , x2 ∈ [a, b] gilt |x1 − x2 | < δ ⇒ kf (x1 ) − f (x2 )k < ε . 2(b − a) Sei P0 eine Zerlegung von [a, b] mit kP0 k < δ. Dann gilt für alle Pe ≥ P0 = {x0 , x1 , . . . , xn }, wobei Pe = {y0 , y1 , . . . , yN } die xi enthält, Folgendes e ξ) e − S(f, P0 , ξ0 )k = k kS(f, P, =k ≤ = N X l=1 N X l=1 f (ξel )(yl − yl−1 ) − n X k=1 f (ξk )(xk − xk−1 )k (f (ξel ) − f (ξkl ))(yl − yl−1 )k für diejenigen ξk mitIel ⊂ Ik N X l=1 kf (ξel ) − f (ξkl )k(yl − yl−1 ) {z } | ε < 2(b−a) ε ε · (b − a) = . 2(b − a) 2 ee e P Seien nun P, ≥ P0 . Dann gilt ee ee ee ee e ξ)k e ≤ kS(f, P, kS(f, P, ξ) − S(f, P, ξ) − S(f, P0 , ξ)k e − S(f, P0 , ξ)k e ξ) +kS(f, P, < ε. Nach Satz 7.9 ist f Riemann–integrierbar. ⊓ ⊔ Satz 7.11 Sei f ∈ R([a, b]; E) und {Pn } eine Folge von Zerlegungen von [a, b] mit kPn k −→ 0. Die Stützstellen von Pn seien ξn . Dann gilt Zb a f (x) dx = lim S(f, Pn , ξn ). n→∞ Beweis: Nach Satz 7.8 ist f beschränkt, das heißt, kf (x)k ≤ M für alle x ∈ [a, b]. Sei ε > 0 fix. Dann existiert ein P0 , so dass für alle P ≥ P0 gilt Rb kS(f, P, ξ) − ek < 2ε , wobei e = a f (x) dx ist. Die Zerlegung P0 habe r Teilintervalle. Da kPn k gegen 0 konvergiert, existiert ein n0 ∈ N, so dass gilt 7.2 Das Riemannsche Integral 2 M r kPn k < ε 2 273 ∀ n ≥ n0 . Seien J1 , J2 , . . . , Jl diejenigen Teilintervalle von Pn für n ≥ n0 , die nicht in P0 ∪ Pn vorkommen, das heißt diejenigen, die durch Punkte von P0 zerlegt werden. Dann ist l ≤ r. Wir fügen nun zu den Stützstellen ξn von Pn neue Stützstellen hinzu, so dass Stützstellen von ξen von P0 ∪ Pn entstehen. Damit erhalten wir für alle n ≥ n0 kS(f, Pn , ξn ) − S(f, Pn ∪ P0 , ξen )k ≤ 2M < ε . 2 l X v=1 L(Jl ) ≤ 2M lkPnk ≤ 2M rkPn k Da Pn ∪ P0 ≥ P0 ist, folgt für n ≥ n0 kS(f, Pn , ξn ) − ek ≤ kS(f, Pn , ξn ) − S(f, Pn ∪ P0 , ξen )k +kS(f, Pn ∪ P0 , ξen ) − ek ε ε ≤ + = ε. 2 2 Somit ist lim S(f, Pn , ξn ) = e. ⊓ ⊔ n→∞ Bemerkung Satz 7.11 ist gut geeignet, um (1) Rechenregeln für Riemann–Integrale zu beweisen, (2) Abschätzungen für Summen auf Abschätzungen für Integrale zu übertragen, (3) Grenzwerte zu berechnen. Beispiel 7.11 Zu (3): Wir wollen den Grenzwert n X kα 1 1 α + 2 α + . . . + nα = lim · , α+1 n→∞ n→∞ n nα n lim α>0 k=1 berechnen. Sei f (x) := xα auf [0, 1] und Pn = {0, n1 , n2 , . . . , n−1 n , 1}. Dann ist k kα 1 f ( n ) = nα und kPn k = n konvergiert gegen 0 für n gegen ∞. Somit erhalten wir unter Benutzung der Stetigkeit von f und Satz 7.18 (siehe unten) Z1 0 n f (x) dx = X 1 = lim f α + 1 n→∞ k=1 1 k · . n n Satz 7.12 (Rechenregeln für das Riemann–Integral) 274 7 Integralrechnung für Funktionen einer reellen Variablen (1) Seien f, g ∈ R([a, b]; E) und µ, λ ∈ K. Dann ist µf + λg ∈ R([a, b]; E) und es gilt Zb Zb Zb (µf + λg)(x) dx = µ f (x) dx + λ g(x) dx. a a a (2) Ist E = C und f ∈ R([a, b]; C), so ist auch f ∈ R([a, b]; C) und es gilt Zb f (x) dx = a Zb f (x) dx. a (3) Ist f ∈ R([a, c]; E) ∪ R([c, b]; E), so ist f ∈ R([a, b]; E) und es gilt Zb f (x) dx = a Zc f (x) dx + a Zb f (x) dx. c (4) Ist f ∈ R([a, b]; E), [α, β] ⊂ [a, b], so ist f ∈ R([α, β]; E). q (5) Sei E = E1 × E2 mit der Produktnorm k(e1 , e2 )k := ke1 k2E1 + ke2 k2E2 versehen und sei f = (f1 , f2 ) : [a, b] −→ E1 × E2 . Dann ist f ∈ R([a, b]; E) genau dann, wenn fi ∈ R([a, b]; Ei ) ist für i ∈ {1, 2} und es gilt b Zb Z Zb f (x) dx = f1 (x) dx, f2 (x) dx . a a a (6) Seien f, g ∈ R([a, b]; E), f ≤ g. Dann gilt Zb f (x) dx ≤ a Zb g(x) dx. a (7) Seien f, g ∈ R([a, b]; E). Stimmen f und g auf einer dichten Teilmenge von [a, b] überein, so gilt Zb Zb f (x) dx = g(x) dx. a a (8) Ist f ∈ C([a, b]; E), dann gilt k Zb a f (x) dxk ≤ Zb a kf (x)k dx ≤ kf k∞ · (b − a). Dies ist die Fundamentalungleichung für Riemann–Integrale. 7.2 Das Riemannsche Integral 275 ⊓ ⊔ Beweis: Übungsaufgabe. Satz 7.13 Sei {fn } mit fn : [a, b] −→ E eine Folge Riemann–integrierbarer Funktionen und konvergiere {fn } gleichmäßig gegen f . Dann ist f Riemann– integrierbar und es gilt Zb f (x) dx = lim n→∞ a Zb fn (x) dx. a Beweis: Da {fn } gleichmäßig gegen f konvergiert, existiert für alle ε > 0 ein n0 ∈ N, so dass für alle n ≥ n0 und für alle x ∈ [a, b] kf (x) − fn (x)k < 1 ε · . (∗) 4 b−a gilt. (1) Wir zeigen, dass f ∈ R([a, b]; E) gilt. Da fn0 ∈ R([a, b]; E) ist, existiert e ≥ P0 eine Zerlegung P0 , so dass für alle Zerlegungen P, P gilt. Damit folgt e ξ)k e < kS(fn0 , P, ξ) − S(fn0 , P, ε . 2 e e ξ)k kS(f, P, ξ) − S(f, P, e e ξ)k ≤ kS(f, P, ξ) − S(fn0 , P, ξ)k + kS(fn0 , P, ξ) − S(fn0 , P, e − S(f, P, e e ξ) e ξ)k +kS(fn0 , P, X X ε ≤ k (f (ξk ) − fn0 (ξk ))L(Ik )k + + k (f (ξel ) − fn0 (ξel ))L(Iel )k 2 k (∗) ≤ 2· l 1 ε ε · · (b − a) + = ε. 4 b−a 2 Folglich ist f ∈ R([a, b]; E). (2) Sei {Pm } eine Folge von Zerlegungen, {kPm k} konvergiere gegen 0 und ξm seien Stützstellen von Pm . Dann folgt mit Satz 7.11 ∀m ≥ m0 : k Zb f (x) dx − S(f, Pm , ξm )k < ε , 4 a ∀m ≥ m0 (n) : k Zb a fn (x) dx − S(fn , Pm , ξm )k < ε . 4 276 7 Integralrechnung für Funktionen einer reellen Variablen Sei nun n ≥ n0 und m ≥ max{m0 , m0 (n)}. Dann folgt k Zb a f (x) dx − ≤k Zb a fn (x) dxk a f (x) dx − S(f, Pm , ξm )k + kS(f, Pm , ξm ) − S(fn , Pm , ξm )k +k Zb a ≤ Zb fn (x) dx − S(fn , Pm , ξm )k ε ε ε + + < ε. 4 4 4 Somit gilt lim Rb n→∞ a fn (x) dx = Rb ⊓ ⊔ f (x) dx. a Folgerung 7.1 Falls die Funktionen fn ∈ R([a, b]; E) sind und f (x) = ∞ P fn (x) gleichmäßig konvergent ist, so ist f ∈ R([a, b]; E) und es gilt n=1 Zb ∞ Z X b f (x) dx = a fn (x) dx. n=1 a Anwendung auf die Integralberechnung Oft sind Integrale nicht durch elementare Funktionen auszudrücken, wie zum Beispiel elliptische Integrale. Dann kann man sie durch eine Reihendarstellung näherungsweise berechnen. Beispiel 7.12 Wir betrachten die Funktion f (x) = √ 1 1−k2 sin2 x für k 2 < 1 und möchten π I = R2 f (x) dx zumindest näherungsweise berechnen. I existiert, da f (x) ein 0 stetige Funktion ist. Für |y| < 1 gilt 1 1·3 2 1·3·5 3 1 √ y − y ± ... =1− y+ 2 2·4 2·4·6 1+y und daher 1·3 4 4 1 1 p k sin x + . . . = 1 + k 2 sin2 x + 2 2 2·4 2 1 − k sin x 7.2 Das Riemannsche Integral 277 Diese Reihe hat für |k| < 1 eine konvergente Majorante (die Reihe mit dem 1 ). Nach dem Weierstraßschen Majorantenkriterium ist die Grenzwert √1−k 2 Reihe gleichmäßig konvergent. Mit Satz 7.13 folgt daher π π I = Z2 0 = dx p = 1 − k 2 sin2 x Z2 0 π 2 ∞ Z X 1 · 3 · . . . · (2n − 1) 2n 2n k sin x dx dx + 2 · 4 · . . . · (2n) n=1 0 π ∞ π X 1 · 3 · . . . · (2n − 1) 2n + k 2 n=1 2 · 4 · . . . · (2n) π = 2 1+ Z2 sin2n x dx 0 2 ∞ X 1 · 3 · . . . · (2n − 1) n=1 2 · 4 · . . . · (2n) k 2n ! . Wir leiten nun spezielle Integrierbarkeitskriterien für reellwertige Funktionen her. Sei f : [a, b] −→ R eine beschränkte Funktion und P = {x0 , . . . , xn } eine Zerlegung von [a, b]. Wir definieren mk := inf{f (x) | x ∈ Ik } und Mk := sup{f (x) | x ∈ Ik } sowie S(f, P) := S(f, P) := n X k=1 n X k=1 mk · L(Ik ) Untersumme von f bzgl. P, Mk · L(Ik ) Obersumme von f bzgl. P. Offensichtlich folgt dann: (1) Sind ξ beliebige Stützstellen von P, so gilt S(f, P) ≤ S(f, P, ξ) ≤ S(f, P). e ≥ P, so folgt (2) Gilt P e ≤ S(f, P) e ≤ S(f, P) ≤ sup f · (b − a). inf f · (b − a) ≤ S(f, P) ≤ S(f, P) e e beliebige Zerlegungen. Dann gilt S(f, P) ≤ S(f, P). (3) Seien P, P Folglich existieren Zb f (x) dx := sup S(f, P) unteres Riemann Integral, Zb f (x) dx := inf S(f, P) oberes Riemann-Integral a a P P 278 7 Integralrechnung für Funktionen einer reellen Variablen und es gilt Zb f (x) dx ≤ a Zb f (x) dx. a Satz 7.14 (Riemannsches Integrierbarkeitskriterium) Sei f : [a, b] −→ R beschränkt. Dann gilt (1) f ∈ R([a, b]; R) genau dann, wenn für alle ε > 0 eine Zerlegung P existiert mit S(f, P) − S(f, P) < ε. (2) f ∈ R([a, b]; R) genau dann, wenn Zb f (x) dx = Rb a f (x) dx = Rb f (x) dx, a a und es gilt dann Zb f (x) dx = a Rb f (x) dx. a Beweis: (1) (⇒) Sei f ∈ R([a, b]; R). Nach Satz 7.9 existiert dann für alle ε > 0 eine Zerlegung P mit e < S(f, P, ξ) − S(f, P, ξ) ε , 2 (∗) wobei ξ, ξe beliebige Stützstellen sind, so dass gilt f (ξk ) ≥ f (ξek ). Wir wählen nun {ξkn } und {ξekn }, so dass für n gegen ∞ f (ξkn ) gegen Mk und f (ξekn ) gegen mk konvergieren. Dann folgt mit (∗) S(f, P) − S(f, P) ≤ ε < ε. 2 (⇐) Für alle ε > 0 existiere eine Zerlegung P0 , so dass gilt S(f, P0 ) − S(f, P0 ) < ε. Für P ≥ P0 und beliebige Stützstellen ξ gilt S(f, P0 ) ≥ S(f, P) ≥ S(f, P, ξ) ≥ S(f, P0 ) und daher e ≤ S(f, P0 ) − S(f, P0 ) < ε ∀ P, P e ξ)| e ≥ P0 . |S(f, P, ξ) − S(f, P, Nach Satz 7.9 ist dann f ∈ R([a, b]; R). (2) (⇒) Sei f ∈ R([a, b]; R). Nach Teil (1) existiert dann eine Folge {Pn } mit S(f, Pn ) − S(f, Pn ) < 1 . n 7.2 Das Riemannsche Integral 279 Es gilt aber auch S(f, Pn ) ≤ Zb f (x) dx ≤ a und damit Zb f (x) dx − a Zb Zb a f (x) dx ≤ S(f, Pn ). f (x) dx < 1 n ∀n ∈ N a woraus folgt Zb f (x) dx = a Rb (⇐) Ist andererseits a f (x) dx = e mit Zerlegungen P, P ε S(f, P) > e − , 2 Zb f (x) dx. a Rb a f (x) dx = e, so existieren für alle ε > 0 e < e + ε. und S(f, P) 2 e − S(f, P) < ε. Sei nun P0 = P ∪ P̃. Dann gilt Folglich ist S(f, P) e − S(f, P) < ε. S(f, P0 ) − S(f, P0 ) ≤ S(f, P) Somit ist f ∈ R([a, b]; R). ⊓ ⊔ Unser Ziel ist es nun, zu zeigen, dass f : [a, b] −→ R genau dann Riemann– integrierbar ist, wenn f beschränkt und “fast überall” stetig ist. Definition 7.9. Eine Teilmenge A ⊂ R hat das Lebesgue–Maß Null (Symbol µ(A) = 0), wenn für alle ε > 0 eine Folge von Intervallen I1 , I2 , . . . existiert, so dass gilt (1) A ⊂ (2) ∞ X ∞ [ Int(In ), n=1 L(In ) < ε. n=1 Bemerkung Offensichtlich gilt dann Folgendes (1) Ist B ⊂ A und µ(A) = 0, so ist auch µ(B) = 0. (2) Sei A ⊂ [a, b] eine Nullmenge, d.h., A hat das Lebesque-Maß Null. Dann ist [a, b]\A ⊂ [a, b] eine dichte Teilmenge. (Angenommen, [a, b]\A wäre nicht dicht. Dann gäbe es ein offenes Intervall (c, d) ⊂ A mit L(c, d) = d − c = ε. Dann aber ließe A sich nicht durch Intervalle, deren Gesamtlänge kleiner als ε ist, überdecken. 280 7 Integralrechnung für Funktionen einer reellen Variablen (3) Es gilt µ({x}) = 0. Satz 7.15 (1) Seien A1 , A2 , . . . ⊂ R Mengen vom Lebesgue–Maß Null. Dann ist ∞ [ µ n=1 An ! = 0. (2) Jede abzählbare Menge A ⊂ R hat Lebesgue–Maß Null. Beweis: (1) Sei ε > 0. Da µ(An ) = 0 für alle n ∈ N gilt, existieren Intervalle In1 , In2 , . . . mit ∞ ∞ X [ ε L(Ini ) < i . Int(Ini ), und An ⊂ 2 i=1 i=1 Daraus folgt A= ∞ [ n=1 An ⊂ ∞ [ ∞ [ Int(Ini ) i=1 n=1 | {z } abzählbar und ∞ X ∞ X n=1 i=1 L(Ini ) < ε · (2) Folgt aus (1), da µ({x}) = 0. ∞ X 1 1 1 =ε· · i 2 2 1− i=1 1 2 = ε. ⊓ ⊔ Satz 7.16 (Lebesguesches Integrierbarkeitskriterium) f ∈ R([a, b]; R) genau dann, wenn gilt (1) f ist beschränkt. (2) Die Menge der Unstetigkeitsstellen von f hat das Maß Null, das heißt, f ist “fast überall stetig”. Beweis: (⇐) Sei f : [a, b] ⊂ R −→ R beschränkt und fast überall stetig, das heißt |f (x)| < c für alle x ∈ [a, b] und A := {x0 ∈ [a, b] | f in x0 nicht stetig} hat Lebesgue–Maß Null. Sei ε > 0. Dann existieren Intervalle J1 , J2 , . . ., so dass ∞ ∞ [ X A⊂ Int(Jn ), und L(Jn ) < ε. n=1 n=1 Wir betrachten die Oszillation von f in x0 ∈ [a, b]: 7.2 Das Riemannsche Integral 281 o(f, x0 ) := lim (sup{f (x) | |x − x0 | < δ} − inf{f (x) | |x − x0 | < δ}) . δ→0+ Es gilt, dass f in x0 genau dann stetig ist, wenn o(f, x0 ) = 0 ist. Das heißt, für x0 ∈ [a, b]\A existiert ein δ(x0 ), so dass gilt sup{f (x) | |x − x0 | < δ(x0 )} − inf{f (x) | |x − x0 | < δ(x0 )} < ε. Die Familie U = {Int(Jn ) | n ∈ N} ∪ {K(x0 , δ(x0 )) | x0 ∈ [a, b]\A} ist eine offene Überdeckung der kompakten Menge [a, b]. Somit existiert eine endliche Teilüberdeckung U ∗ = {Int(Jn1 ), . . . , Int(JnN ), K(x1 , δ(x1 )), . . . , K(x̺ , δ(x̺ ))} von [a, b]. Wir wählen eine Zerlegung P = {x0 , x1 , . . . , xn } von [a, b], deren Teilintervalle Ik in Int(Jnj ) oder in K(xi , δ(xi )) liegen für i ∈ {1, . . . , ̺}, j ∈ {1, . . . , N }. Nun sei J ∗ die Menge der Teilintervalle, die in einem Jnj liegen und J ∗∗ bestehe aus den restlichen Teilintervallen von P. Dann gilt wegen |f (x)| ≤ c die folgende Ungleichung X X S(f, P) − S(f, P) = (Mk − mk ) L (Ik ) + (Mk − mk ) L (Ik ) Ik ∈J ∗ ≤ 2c X L (Ik ) +ε Ik ∈J ∗ | {z <ε } Nach Satz 7.14 ist dann f ∈ R([a, b]; R). X Ik ∈J ∗∗ Ik ∈J ∗∗ | L (Ik ) = (2c + (b − a)) · ε. {z <b−a } (⇒) Sei f ∈ R([a, b]; R). Dann ist f beschränkt und es bleibt zu zeigen, dass µ(A) = 0 gilt. Sei Aε := {x ∈ [a, b] | o(f, x) ≥ ε}. Da f in x genau dann stetig ist, wenn o(f, x) = 0, folgt A = A1 ∪ A 12 ∪ A 13 ∪ . . .. Nach Satz 7.15 genügt es zu zeigen, dass µ(A n1 ) = 0 ist für alle n ∈ N. Sei n fix und ε > 0 gegeben. Nach Voraussetzung existiert dann eine Zerlegung P mit S(f, P) − S(f, P) < ε . 2n Sei J ∗ die Menge der Teilintervalle Ik von P mit Int(Ik ) ∩ A n1 6= ∅. Nach Definition der Oszillation folgt dann für x0 ∈ Ik ∩ A n1 Mk − mk = sup f|Ik − inf f|Ik ≥ o(f, x0 ) ≥ 1 . n Daraus folgt X 1 X ε . L (Ik ) ≤ (Mk − mk ) L (Ik ) ≤ S(f, P) − S(f, P) < n 2n ∗ ∗ Ik ∈J Ik ∈J 282 7 Integralrechnung für Funktionen einer reellen Variablen m P L(Iek ) < Außerdem wählen wir Intervalle Iek um die Teilungspunkte von P mit ε 2. A k=1 Nach Wahl von J ∗ folgt dann 1 n ⊂ [ Ik ∈J ∗ Int(Ik ) ∪ m [ k=1 Folglich ist µ(A n1 ) = 0. Int(Iek ), X und L(Ik )+ Ik ∈J ∗ m X k=1 L(Iek ) < ε ε + = ε. 2 2 ⊓ ⊔ Folgerung 7.2 (1) Ist f : [a, b] −→ R eine beschränkte Funktion mit abzählbar vielen Unstetigkeitsstellen, so ist f Riemann–integrierbar. (2) Ist f : [a, b] −→ R eine monotone Funktion, so ist f Riemann-integrierbar. (3) Sei f : [a, b] −→ Rn . Dann ist f ∈ R([a, b]; Rn ) genau dann, wenn f beschränkt und fast überall stetig ist, wobei für f = (f1 , . . . , fn ) gilt f ∈ R([a, b]; Rn ) ⇔ fi ∈ R([a, b]; R), f ∈ C([a, b]; Rn ) ⇔ fi ∈ C([a, b], R). Analoges gilt für Funktionen mit Werten in Cn . (4) Ist f ∈ R([a, b]; Rn ), so ist auch kf k ∈ R([a, b]; R) und es gilt k Zb a f (x) dxk ≤ Zb a kf (x)k dx. (5) Sind f, g ∈ R([a, b]; C), so ist auch f · g ∈ R([a, b]; C). (6) Ist f ∈ R([a, b]; Rn ) und h ∈ C(Rn ; Rm ), so ist h ◦ f ∈ R([a, b]; Rm ). Beispiel 7.13 Sei f : [0, 1] −→ R gegeben durch ( f (x) = 1 0 x rational x irrational. f ist in keinem Punkt aus [0, 1] stetig und f 6∈ R([a, b]; R). Später führen wir das Lebesgue–Integral ein und werden sehen, dass f Lebesgue–integrierbar ist. 7.3 Hauptsatz der Differential- und Integralrechnung Alle in diesem Abschnitt auftretenden Integrale sind als Riemann–Integrale aufzufassen. Satz 7.17 Sei f : [a, b] ⊂ R −→ E stetig. Wir definieren F : [a, b] ⊂ R −→ E Rx durch F (x) := f (t) dt. Dann gilt a 7.3 Hauptsatz der Differential- und Integralrechnung 283 (1) F : [a, b] −→ E ist Lipschitz-stetig, (2) F ist differenzierbar und es gilt F ′ = f . Beweis: (1) Da f ∈ C([a, b]; E) ⊂ R([a, b]; E), ist F definiert. Es gilt mit Satz 7.12 kF (x) − F (y)k = k ≤| Zx a Zy x f (t) dt − Zy f (t) dtk = k a Zy f (t) dtk x kf (t)k dt| ≤ |y − x| · kf k∞ . (2) Sei ε > 0. Da f in x0 ∈ [a, b] stetig ist, existiert ein δ > 0, so dass für alle t mit |t − x0 | < δ gilt, dass kf (t) − f (x0 )k < ε ist (∗). Also ist Zt 1 F (t) − F (x0 ) − f (x0 ) = · f (u) du − f (x0 ) t − x0 t − x 0 x0 t Z 1 (f (u) − f (x0 )) du = t − x0 x0 ≤ (∗) ≤ 1 |t − x0 | Zt x0 kf (u) − f (x0 )k du 1 · ε|t − x0 | = ε |t − x0 | für alle |t − x0 | < δ. Folglich ist lim t→x0 F (t) − F (x0 ) = F ′ (x0 ) = f (x0 ). t − x0 Bemerkung Ist dim E < ∞, so gilt ⊓ ⊔ (1) Ist f ∈ R([a, b]; E), so ist F Lipschitz-stetig. (2) Ist f in x0 stetig, so ist auch F in x0 stetig. Satz 7.18 (Hauptsatz der Differential- und Integralrechnung) f : [a, b] ⊂ R −→ E sei stetig. Dann gilt (1) F (x) := (R) − Rx a f (t) dt ist diejenige Stammfunktion von f mit F (a) = 0. 284 7 Integralrechnung für Funktionen einer reellen Variablen (2) Ist Fe : [a, b] −→ E eine beliebige Stammfunktion von f , so gilt (R) − Zb a f (t) dt = Fe (b) − Fe(a) = Z b f (t) dt . | a {z } best. Integral Das heißt, jede stetige Funktion hat eine Stammfunktion und für jede stetige Funktion stimmt das Riemann–Integral mit dem bestimmten Integral überein. Beweis: (1) folgt aus Satz 7.17. (2) Sei Fe eine beliebige Stammfunktion von f . Dann ist Fe = F + e, wobei e konstant ist. Somit ist Fe (a) = e und es folgt Zb a f (t) dt = Fe(b) − Fe (a) = F (b) + e − (F (a) + e) = F (b) = (R) − Zb f (t) dt. a ⊓ ⊔ Anwendung: Als Anwendung beweisen wir zwei Eigenschaften der Zahl π. (1) Die Zahl π ist irrational. Es genügt zu zeigen, dass π 2 irrational ist. Angenommen, π 2 wäre rational. Dann würden a, b ∈ N existieren, so dass π 2 = ab gilt. Wir wählen ein n ∈ N n so groß , dass 2a n! < 1 (∗) gilt und betrachten die Funktion 2n 1 n 1 X n f (x) := x (1 − x) = ck xk , n! n! k=n ck ∈ Z. Ist v < n oder v > 2n, so gilt f (v) (0) = 0. Ist v ∈ {n, . . . , 2n}, so ist f (v) (0) = v! (v) (0) ∈ Z für alle v ∈ N0 . Da f (x) = f (1 − x) gilt, ist n! cv ∈ Z. Folglich ist f (v) auch f (1) ∈ Z für alle v ∈ N0 . Wir betrachten die Funktion F (x) := bn π 2n f (x) − π 2n−2 f (2) (x) + π 2n−4 f (4) (x) − . . . + (−1)n f (2n) (x) . Da nach Annahme π 2(n−k) = an−k bn−k gilt, sind auch F (0), F (1) ∈ Z und es gilt d (F ′ (x) sin πx − πF (x) cos πx) = (F (2) (x) + π 2 F (x)) sin πx dx = bn π 2n+2 f (x) sin πx = an π 2 f (x) sin πx. Daraus folgt 7.3 Hauptsatz der Differential- und Integralrechnung I := π Z1 285 an f (x) sin πx dx 0 1 = (F ′ (1) sin π − πF (1) cos π − F ′ (0) sin 0 + πF (0) cos 0) π = F (1) + F (0) ∈ Z. Da auf (0, 1) die Abschätzung 0 < f (x) < πan 0<I < n! Z1 gilt, folgt sin πx dx = 0 | 1 n! {z 2 =π 2an (∗) < 1. n! } Dies aber widerspricht I ∈ Z. Folglich ist π 2 irrational. (2) Wir wollen die Wallissche Formel definieren wir π An := Z2 n sin x dx = 0 π 2 = lim n→∞ ( 1·3·...·(2k−1) π 2·4·...·(2k) 2 2·4·...·(2k) 1·3·...·(2k+1) Qn 4k2 k=1 4k2 −1 beweisen. Dazu n = 2k ≥ 2 (∗∗) n = 2k + 1 ≥ 3. Für x ∈ [0, π2 ] gilt sin2n+2 x ≤ sin2n+1 x ≤ sin2n x. Da sinn stetig ist, gilt auerdem π π Z2 Z2 sinn x dx = (R) − sinn x dx. 0 0 Aus der Monotonie des Riemann–Integrals folgt A2n+2 ≤ A2n+1 ≤ A2n . Daraus folgt mit (∗∗) 1 = lim n→∞ A2n A2n+1 A2n+2 2n + 1 ≥ lim ≥ lim = lim = 1. n→∞ A2n n→∞ A2n n→∞ 2n + 2 A2n Wir haben also in der Tat in der letzten Ungleichung überall ein Gleichheitszeichen. Damit folgt 2 · 4 · . . . · (2n) 2 · 4 · . . . · (2n) 2 A2n+1 (∗∗) = lim · · n→∞ 1 · 3 · . . . · (2n + 1) 1 · 3 · . . . · · · (2n − 1) π A2n n Y (2k)2 2 = lim · . n→∞ (2k + 1)(2k − 1) π 1 = lim n→∞ k=1 Folglich gilt π 2 = lim n→∞ Qn (2k)2 k=1 (2k+1)(2k−1) . 286 7 Integralrechnung für Funktionen einer reellen Variablen 7.4 Der Mittelwertsatz der Integralrechnung Satz 7.19 (1. Mittelwertsatz der Integralrechnung) Sei f : [a, b] −→ R stetig, g : [a, b] −→ R Riemann–integrierbar und g ≥ 0. Dann existiert ein ξ ∈ [a, b] mit Zb Zb f (x)g(x) dx = f (ξ) · g(x) dx. a Beweis: 1. Fall: Sei Rb a g(x) dx = 0. Es ist zu zeigen, dass dann Rb f (x)g(x) dx = 0 gilt. a a Da f : [a, b] −→ R stetig und [a, b] kompakt ist, existieren m := min f und M := max f . Es folgt m · g(x) ≤ f (x) · g(x) ≤ M · g(x) Nach Integration ergibt sich 0 = Rb ∀ x ∈ [a, b]. (∗) f (x)g(x) dx. a 2. Fall: Sei Rb g(x) dx > 0. Dann gilt nach (∗) a m≤ Rb f (x)g(x) dx a Rb g(x) dx ≤ M. a Sei m := f (xmin ), M := f (xmax ). Da f stetig ist, folgt aus dem Zwischenwertsatz, dass ein ξ ∈ [xmin , xmax ] ⊂ [a, b] existiert, so dass gilt f (ξ) = Rb f (x)g(x) dx a Rb . g(x) dx a ⊓ ⊔ Folgerung 7.3 Ist f : [a, b] −→ R stetig, dann existiert ein ξ ∈ [a, b], so dass gilt Zb f (x) dx = f (ξ) · (b − a). a Beweis: Folgt aus Satz 7.19 mit g ≡ 1. ⊓ ⊔ 7.4 Der Mittelwertsatz der Integralrechnung Folgerung 7.4 Sei f : [a, b] −→ R stetig, f ≥ 0 und f ≡ 0. Rb 287 f (x) dx = 0. Dann ist a Beweis: Sei c ∈ [a, b] fixiert. Wir betrachten Folgen (xn ), (yn ) mit a ≤ xn < c < yn ≤ b und xn −→ c, yn −→ c. Da f : [xn , yn ] −→ R stetig ist und f ≥ 0 ist, gilt Zb Zyn 0 ≤ f (x) dx ≤ f (x) dx = 0. a xn Daraus folgt 0= Zyn xn f (x) dx = f (ξn )(yn − xn ), ξn ∈ [xn , yn ]. Folglich ist f (ξn ) = 0. Lassen wir n gegen ∞ laufen, so konvergiert ξn gegen c. Da f stetig ist, konvergiert daher f (ξn ) gegen f (c). Folglich ist f (c) = 0. ⊓ ⊔ Satz 7.20 (2. Mittelwertsatz der Integralrechnung) Sei f : [a, b] −→ R stetig, g : [a, b] −→ R monoton wachsend und stetig differenzierbar. Dann existiert ein ξ ∈ [a, b], so dass gilt Zb f (x)g(x) dx = g(a) a Zξ f (x) dx + g(b) a Zb f (x) dx. ξ Beweis: Sei F eine Stammfunktion von f mit F (a) = 0. Da g monoton wachsend und differenzierbar ist, gilt g ′ ≥ 0. Wenden wir den 1. MWS der Integralrechnung auf F · g ′ an, so erhalten wir ein ξ ∈ [a, b], so dass gilt Zb a ′ F (x)g (x) dx = F (ξ) · Zb a g ′ (x) dx = F (ξ) · (g(b) − g(a)), (∗) Da F eine Stammfunktion von f ist, gilt Zb f (x)g(x) dx = a Mit (∗) folgt nun Zb a F (x)g(x) dx = F (x)g(x) ba − ′ Zb a F (x)g ′ (x) dx. 288 7 Integralrechnung für Funktionen einer reellen Variablen Zb a f (x)g(x) dx = F (b)g(b) − F (a)g(a) + F (ξ)g(a) − F (ξ)g(b) = g(a)(F (ξ) − F (a)) + g(b)(F (b) − F (ξ)) Zξ Zb = g(a) f (x) dx + g(b) f (x) dx. a ξ ⊓ ⊔ Beispiel 7.14 Sei 0 < a < b < ∞. Dann gilt lim n→∞ Zb sin nx dx = 0. x a Beweis: Es genügt zu zeigen, dass b Z sin(rx) 4 dx ≤ x ra a für alle r > 0 gilt. Setzen wir f (x) = sin rx und g(x) = − x1 , dann folgt mit dem 2. Mittelwertsatz − Zb a sin (rx) 1 dx = − x a Zξ a sin (rx) dx − 1 b Zb sin (rx) dx ξ ξ b 1 1 cos (rx) + cos (rx) . = ar br a ξ Daraus folgt sofort b Z sin (rx) 1 1 dx ≤ | cos (rξ) − cos (ar)| + | cos (rb) − cos (rξ)| {z } br | {z } x ar | a ≤2 2 2 4 ≤ + < . ar br ar ≤2 ⊓ ⊔ 7.5 Parameterabhängige Integrale 289 7.5 Parameterabhängige Integrale Wir werden nun untersuchen, wann Integral und Ableitung vertauschbar sind. Satz 7.21 Sei [a, b] ⊂ R ein kompaktes Intervall, U ⊂ Rn offen, f : [a, b] × U ⊂ Rn+1 −→ R eine stetige Funktion. Sei F : U −→ R definiert durch F (x) := Zb f (t, x) dt. a Dann gilt (1) F : U ⊂ Rn −→ R ist stetig. ∂f ∂f und ist ∂x : [a, b] × U −→ R stetig, so ist F : U −→ R nach (2) Existiert ∂x i i xi stetig differenzierbar und es gilt ∂F (x) = ∂xi Zb a ∂f (t, x) dt. ∂xi Beweis: F ist definiert, da f (., x) stetig ist. (1) Sei x ∈ U fixiert und W (x) ⊂ U eine kompakte Umgebung von x. Nach Voraussetzung ist f|[a,b]×W stetig. Da [a, b] × W kompakt ist, ist f|[a,b]×W gleichmäßig stetig, das heißt, für alle ε > 0 existiert ein δ > 0, so dass für alle t ∈ [a, b] und für alle |h| < δ gilt |f (t, x + h) − f (t, x)| < ε . |b − a| Es folgt b Z Zb |F (x + h) − F (x)| = f (t, x + h) − f (t, x) dt ≤ |f (t, x + h) − f (t, x)| dt a ≤ Zb a a ε dt = ε. |b − a| Folglich ist F stetig in x und es gilt Zb f (t, x) dt = F (x) = lim F (x + h) = lim h→0 a h→0 Zb a = Zb a lim f (t, x + h) dt. h→0 f (t, x + h) dt 290 7 Integralrechnung für Funktionen einer reellen Variablen (2) Sei x ∈ U fixiert, h ∈ R hinreichend klein. Wir definieren g : [a, b] × U × (−ε, ε) −→ R (t, x, h) 7→ g(t, x, h) := ( f (t,x+hei )−f (t,x) h ∂f ∂xi (t, x) h 6= 0 h = 0. Für h 6= 0 ist g stetig, da f stetig ist. Die Funktion g ist auch für h = 0 stetig, denn wenden wir den Mittelwertsatz der Differentialrechnung an, so erhalten wir ∂f g(t, x, h) = (t, x + ϑh · hei ) für ein ϑh ∈ [0, 1]. ∂xi ∂f stetig. Somit konvergiert x+ϑh hei gegen x0 , wenn Nach Voraussetzung ist ∂x i (x, t, h) gegen (x0 , t0 , 0) geht und es folgt g(x, t, h) = ∂f ∂f (t, x + ϑh hei ) −→ (t0 , x0 ) = g(t0 , x0 , 0). ∂xi ∂xi Folglich ist g auch für h = 0 stetig. Wenden wir nun (1) auf g an, so erhalten wir ∂F F (x + hei ) − F (x) (x) = lim = lim h→0 h→0 ∂xi h = lim h→0 Zb a = Zb a g(t, x, h) dt = | {z } stetig Zb Zb f (t, x + hei ) − f (t, x) dt h a lim g(t, x, h) dt = h→0 a Zb g(t, x, 0) dt a ∂f (t, x) dt. ∂xi ⊓ ⊔ Sei f : [a, b] × [c, d] ⊂ R2 −→ R stetig differenzierbar und seien g0 , g1 : [c, d] ⊂ R −→ [a, b] ⊂ R differenzierbar. Wir betrachten die Abbildung G : [c, d] ⊂ R −→ R, definiert durch G(x) := gZ 1 (x) f (t, x) dt. g0 (x) Wie kann man die Ableitung von G berechnen? Sind g0 , g1 konstant, so kann man dazu Satz 7.21 verwenden. Satz 7.22 Die Abbildung G : [c, d] ⊂ R −→ R ist differenzierbar und es gilt 7.5 Parameterabhängige Integrale ′ G (x) = gZ 1 (x) 291 ∂f (t, x) dt + g1′ (x)f (g1 (x), x) − g0′ (x)f (g0 (x), x). ∂x g0 (x) Beweis: Wir betrachten die Abbildungen F (x) := Zb f (t, x) dt, F0 (y, x) := a Zy f (t, x) dt, F1 (y, x) := a Zb f (t, x) dt y Dann gilt G(x) = F (x) − F0 (g0 (x), x) − F1 (g1 (x), x). (1) Nach Satz 7.21 existiert F ′ (x) und es gilt ′ F (x) = Zb ∂f (t, x) dt. ∂x a (2) Nach dem Hauptsatz der Differential- und Integralrechnung ist F0 (y, x) für 0 festes x eine Stammfunktion von f (·, x). Das heißt, für x fest gilt ∂F ∂y (y, x) = f (y, x). Nach Satz 7.21 gilt außerdem für festes y ∂F0 (y, x) = ∂x Zy ∂f (t, x) dt. ∂x a Aus der Kettenregel folgt ∂F0 ∂F0 d (F0 (g0 (x), x)) = (g0 (x), x))g0′ (x) + (g0 (x), x)) dx ∂y ∂x = f (g0 (x), x)g0′ (x) + gZ 0 (x) ∂f (t, x) dt. ∂x a (3) Analog gilt d (F1 (g1 (x), x)) = −f (g1 (x), x)) · g1′ (x) + dx Zb ∂f (t, x) dt. ∂x g1 (x) Insgesamt erhalten wir ′ G (x) = gZ 1 (x) ∂f (t, x) dt + g1′ (x) · f (g1 (x), x) − g0′ (x) · f (g0 (x), x). ∂x g0 (x) ⊓ ⊔ 292 7 Integralrechnung für Funktionen einer reellen Variablen 7.6 Uneigentliche Riemannsche Integrale Sei f : [a, ∞) −→ E eine Abbildung und sei f auf jedem kompakten Intervall Rx [a, x] Riemann–integrierbar. Dann kann man F (x) := f (t) dt bilden. a Definition 7.10. f : [a, ∞) ⊂ R −→ E heißt auf [a, ∞) uneigentlich Riemann–integrierbar, falls Z∞ f (t) dt := lim x→∞ a Zx a f (t) dt ∈ E Ra existiert. Analog definiert man −∞ f (t) dt für eine Funktion f : (−∞, a] −→ R, die auf jedem Intervall [x, a] Riemann–integrierbar ist. Definition 7.11. Sei f : R −→ E auf jedem kompakten Intervall Riemann– integrierbar. Dann R∞ R 0 heißt f auf R uneigentlich Riemann–integrierbar, falls f (t) dt und f (t) dt existieren. Wir verwenden die Bezeichnung 0 −∞ Z∞ f (t) dt := −∞ Z0 f (t) dt + −∞ Z∞ f (t) dt. 0 Bemerkung: Für die uneigentlichen Integrale gelten die gleichen Rechenregeln wie für die Riemann–Integrale, zum Beispiel Additivität, partielle Integration, usw. Beispiel 7.15 R∞ 0 sin t dt existiert nicht, denn es gilt Zx 0 sin t dt = − cos x + cos 0 = − cos x + 1 und lim cos x existiert nicht. x→∞ Beispiel 7.16 Es gilt Z∞ 0 dx 1 · 3 · . . . · (2n − 3) π = · . (1 + x2 )n 2 · 4 · . . . · (2n − 2) 2 Zum Beweis betrachten wir Rx 0 1 (1+t2 )n dt. Mit der Substitution t = cot ϕ = und dt = −(1 + cot2 ϕ) dϕ erhalten wir cos ϕ sin ϕ 7.6 Uneigentliche Riemannsche Integrale Zx 0 arccot(x) Z 1 dt = − (1 + t2 )n arccot(0) Daraus folgt π π Z2 Z2 1 dϕ = (1 + cot2 ϕ)n−1 arccot(x) arccot(x) 293 1 + cot2 ϕ n dϕ. 1 + cot2 ϕ sin2 ϕ sin2 ϕ + cos2 ϕ n−1 dϕ π Z2 = (sin ϕ)2n−2 dϕ. arccot(x) Wegen arccot(x) → 0 für x → ∞ folgt Z∞ π 1 dx = (1 + x2 )n Z2 (sin ϕ)2n−2 dϕ = 0 0 1 · 3 · . . . · (2n − 3) π · . 2 · 4 · . . . · (2n − 2) 2 Sei nun f : (a, b) ⊂ R −→ E eine Abbildung, die auf jedem Intervall [α, β] ⊂ (a, b) Riemann–integrierbar ist. Definition 7.12. f heißt auf (a, b) uneigentlich Riemann–integrierbar, falls die Grenzwerte Zx0 Zβ lim f (t) dt, lim f (t) dt β→b− α→a+ α x0 für ein beliebiges aber festes x0 ∈ (a, b) existieren. Wir verwenden die Bezeichnung Zb Zx0 Zβ f (t) dt := lim+ f (t) dt + lim− f (t) dt. α→a a β→b α x0 Beispiel 7.17 (Die Gamma–Funktion (Verallgemeinerung von n!)) Sei x ∈ R+ gegeben. Die Gamma–Funktion ist definiert durch Γ (x) := Z∞ tx−1 e−t dt. 0 Dieses Integral konvergiert: (1) Für t > 0 gilt 0 < tx−1 e−t < tx−1 und es folgt 294 7 Integralrechnung für Funktionen einer reellen Variablen 0< Z1 t x−1 −t e α dt ≤ Z1 1 αx 1 1 1 < tx−1 dt = [ tx ]α = − x x x x α (x, α > 0). R1 Da g(α) = α tx−1 e−t dt bei α −→ 0 monoton wachsend und durch schränkt ist, existiert der Grenzwert lim α→0 Z1 t x−1 −t e Z1 dt = t (2) Es gilt tx−1 e−t = M > 0, so dass et · be- tx−1 e−t dt. 0 α x+1 1 x 1 t2 und lim x+1 t t→∞ tx−1 e−t ≤ 1 t2 = 0. Das heißt, es existiert ein et ∀ t ≥ M. Daraus folgt Zβ t x−1 −t e dt ≤ M Da h(β) = Rβ M Zβ 1β 1 1 dt = [ − ]M ≤ . 2 t t M M tx−1 e−t dt bei β −→ ∞ monoton wachsend und durch 1 M be- schränkt ist, existiert Z∞ t x−1 −t e dt = lim β→∞ M Zβ tx−1 e−t dt. M Folglich gilt Z∞ 0 t x−1 −t e dt = lim α→0 Z1 α t x−1 −t e dt + ZM t x−1 −t e dt + lim 1 β→∞ Zβ tx−1 e−t dt = Γ (x). M Satz 7.23 (Eigenschaften der Γ –Funktion) Γ hat folgende Eigenschaften (1) Γ (x + 1) = x · Γ (x) ∀x > 0, (2) Γ (1) = 1, (3) Γ (n) = (n − 1)! ∀n ∈ N, das heißt, die Γ –Funktion verallgemeinert die Fakultät, (4) Γ ist logarithmisch–konvex, das heißt ln Γ ist konvex, n!·nx (Gaußsche Definition der Γ –Funktion), (5) Γ (x) = lim x(x+1)·...·(x+n) n→∞ √ 1 (6) Γ ( 2 ) = π. 7.6 Uneigentliche Riemannsche Integrale 295 Beweis: (1) Es gilt Γ (x+1) = Z∞ x −t t e dt = Z∞ 0 0 −t ′ x −t (e ) dt = Z∞ 0 x·tx−1 ·e−t dt = x·Γ (x), ∀ x > 0. (2) Es gilt Γ (1) = Z∞ 0 1 + e0 = 1. t→∞ et e−t dt = −e−t |∞ 0 = − lim (3) folgt aus (1) und (2) durch Induktion. (4) Wir zeigen, dass die Γ –Funktion logarithmisch–konvex ist. Dazu ist zu zeigen, dass für x ∈ (0, 1) gilt ln Γ (x · a + (1 − x) · b) ≤ x · ln Γ (a) + (1 − x) ln Γ (b) ∀ a, b ∈ R+ , bzw., dass gilt Γ (x · a + (1 − x) · b) ≤ Γ (a)x · Γ (b)1−x ∀ x ∈ (0, 1), a, b ∈ R+ . Wir benutzen nun die Hölder–Ungleichung für Integrale. Zr ε f (t)g(t) dt ≤ wobei p, q > 0 und 1 p + 1 q 1 p + = 1. Sei f (t) := t Zr ε t a b p + q −1 e −t 1 q Zr ε q1 p1 r Z f (t)p · g(t)q , ε = 1 gelten. Sei p = a−1 p e − pt dt ≤ und g(t) := t Zr ε t a−1 −t e x dt 1 x, b−1 q e q= − qt Z 1 1−x , das heißt, es gilt . Dann folgt r t b−1 −t e ε dt 1−x . Lassen wir nun ε gegen 0 und r gegen ∞ konvergieren, so erhalten wir Γ (xa + (1 − x)b) ≤ Γ (a)x · Γ (b)1−x . (5) Für x = 1 ist die angegebene Formel offensichtlich erfüllt. Sei nun x ∈ (0, 1). Dann gilt für alle n ∈ N, dass (n + x) = (1 − x)n + x(n + 1) ist. Daher ist Γ (n + x) ≤ Γ (n)1−x · Γ (n + 1)x = Γ (n)1−x · Γ (n)x · nx = (n − 1)! · nx (∗) 296 7 Integralrechnung für Funktionen einer reellen Variablen Des Weiteren gilt für x ∈ (0, 1) und n ∈ N, dass n + 1 = x(n + x) + (1 − x)(n + 1 + x) ist und folglich Γ (n + 1) ≤ Γ (n + x)x · Γ (n + 1 + x)1−x = Γ (n + x) · (n + x)1−x . Es folgt n!(n + x)x−1 ≤ Γ (n + x) (∗∗) Nach (1) gilt Γ (n + x) = Γ (x) · x · (x + 1) · . . . · (x + n − 1). Mit (∗) und (∗∗) folgt dann n!(n + x)x−1 (n − 1)!nx ≤ Γ (x) ≤ x(x + 1) · . . . · (x + n − 1) x(x + 1) · . . . · (x + n − 1) | | {z } {z } =:an (x) =:bn (x) und damit an (x) n(n + x)x−1 = lim = lim n→∞ bn (x) n→∞ n→∞ nx = 1. lim n+x n x−1 x x−1 1+ n→∞ n = lim Daher ist (n − 1)!nx n→∞ x(x + 1) · . . . · (x + n − 1) n!nx x+n = lim n→∞ x(x + 1) · . . . · (x + n) n | {z } Γ (x) = lim n!nx = lim n→∞ x(x + 1) · . . . · (x + n) −→1 ∀x ∈ (0, 1). Somit gilt die Formel aus (5) für x ∈ (0, 1]. Es bleibt zu zeigen, dass, falls (5) für x gilt, (5) auch für x + 1 erfüllt ist. Die Formel aus (5) gelte nun für ein x. Dann folgt n! nx ·x n→∞ x(x + 1) · . . . · (x + n) x+1+n n! nx+1 · = lim n→∞ (x + 1) · . . . · (x + 1 + n) n } | {z Γ (x + 1) = x · Γ (x) = lim x+1 = lim n→∞ (6) Aus (5) folgt n! n . (x + 1) · . . . · (x + 1 + n) −→1 7.6 Uneigentliche Riemannsche Integrale 297 √ n! n 1 = lim 1 1 Γ n→∞ ( + 1) · . . . · ( 1 + n) 2 2 2 2 √ n! n = lim . n→∞ (1 − 1 )(2 − 1 ) · . . . · (n − 1 )(n + 1 ) 2 2 2 2 Daher folgt mit der Wallisschen Formel 2 n Y 1 k2 n · (n!)2 Q Γ = 2 · lim = lim 1 n 1 1 1 n→∞ n→∞ (n + ) · 2 k2 − k=1 (k − 2 )(k + 2 )) 2 2 k=1 π = 2· . 2 √ Somit gilt Γ ( 12 ) = π. 1 4 ⊓ ⊔ Zusammenhang zwischen der Konvergenz von Reihen und der Existenz uneigentlicher Integrale Satz 7.24 Sei f : [a, ∞) −→ R stetig, positiv und monoton fallend. Dann existiert der Grenzwert N Z+1 N X lim f (a + n) − f (x) dx =: (∗) N →∞ n=0 a und es gilt 0 ≤ (∗) ≤ f (a). Insbesondere konvergiert wenn das uneigentliche Integral R∞ f (x) dx existiert. ∞ P f (a + n) genau dann, n=0 a Beweis: Da f monoton fallend ist, gilt f (a + n + 1) ≤ f (x) ≤ f (a + n) ∀ x ∈ [a + n, a + n + 1]. Folglich ist f (a + n + 1) ≤ a+n+1 Z a+n f (x) dx ≤ f (a + n) (∗) und N X f (a + n + 1) = n=0 N +1 X n=1 f (a + n) ≤ a+N Z +1 a Sei nun bN := N X n=0 f (a + n) − f (x) dx ≤ a+N Z +1 N X n=0 f (x) dx. a f (a + n). (∗∗) 298 7 Integralrechnung für Funktionen einer reellen Variablen Da f positiv ist, gilt mit (∗∗) 0 ≤ bN ≤ N X n=0 f (a + n) − N +1 X n=1 f (a + n) = f (a) − f (a + N + 1) ≤ f (a). Desweiteren gilt bN = bN −1 + f (a + N ) − a+N Z +1 f (x) dx ≥ bN −1 a+N {z | ∀ N ∈ N. } ≥0 wegen (∗) Folglich ist {bN } eine monoton wachsende, beschränkte Folge. Somit existiert b = lim bN und es gilt 0 ≤ b ≤ f (a). ⊓ ⊔ N →∞ Beispiel 7.18 ∞ P Die Riemannsche Zeta–Funktion ζ(x) := n=1 1 nx . Wir wissen bereits, dass ζ(x) für x > 1 konvergiert und für x ≤ 1 divergiert. Mit Hilfe von Satz 7.24 können P wir nun einen neuen Beweis dafür angeben: ∞ Sei f (t) := t1x . Dann ist ζ(x) = k=0 f (1 + k). Die Funktion f ist monoton fallend auf [1, ∞) und es gilt Z∞ 1 1 dt = lim r→∞ tx Zr t −x dt = lim r→∞ 1 Folglich existiert R∞ 1 1 tx dt = 1 x−1 1 t−x+1 |r1 −x + 1 für x > 1, aber = R∞ 1 1 ( lim (1 − r1−x )). x − 1 r→∞ 1 tx dt existiert nicht für x ≤ 1. Aus Satz 7.24 folgt nun, dass ζ(x) genau dann konvergiert, wenn x > 1 ist und 1 0 ≤ ζ(x) − ≤ 1. x−1 gilt. Beispiel 7.19 (Die Euler–Konstante.) Behauptung: Es existiert CEuler 1 1 := lim 1 + + . . . + − ln(n) , n→∞ 2 n das heißt, die Partialsummen der harmonischen Reihe wachsen wie ln(n). Zum Beweis betrachten wir die Funktion f (t) = 1t auf [1, ∞). f ist monoton fallend und f ≥ 0. Folglich gilt nach Satz 7.24, dass CEuler existiert und 7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete 0 ≤ lim N →∞ gilt. | N −1 X n=0 f (1 + n) − {z ZN 1 299 1 dx ≤ f (1) = 1 x } 1 −ln(N )) (1+ 12 +...+ N 7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete Definition 7.13. Sei I ⊂ R ein beliebiges Intervall. Eine parametrisierte Kurve im Rn ist eine stetige Abbildung γ : I −→ Rn . γ(t) Wir betrachten also mit γ : I −→ Rn nicht nur das Bild der Kurve, sondern auch, wie die Kurve (z.B. mit welcher Geschwindigkeit) durchlaufen wird. Wir werden nun untersuchen, wie man die Länge der Kurve γ bestimmen kann. Sei P = {x0 < x1 < . . . < xm } eine Zerlegung von I = [a, b]. Dann gibt L(γ, P) := m X k=1 kγ(xk ) − γ(xk−1 )k • γ(x1 ) • γ(a) γ(x2 ) • • γ(b) • γ(x3 ) die Länge des durch P definierten Polygonzuges über γ(x0 ), γ(x1 ), . . . , γ(xm ) e ≥ P, dass L(γ, P) e ≥ L(γ, P) an. Nach der Dreiecksungleichung folgt aus P gilt. Definition 7.14. Eine Kurve γ : [a, b] −→ Rn heißt rektifizierbar, falls L(γ) := sup{L(γ, P)} P existiert. L(γ) heißt Länge von γ. 300 7 Integralrechnung für Funktionen einer reellen Variablen Beispiel 7.20 Ist γ : [a, b] −→ Rn Lipschitz-stetig, so ist γ rektifizierbar, denn es gilt für alle t, s ∈ [a, b], dass kγ(t) − γ(s)k ≤ L(t − s) ist. Folglich ist für alle Zerlegungen P L(γ, P) = m X k=1 kγ (xk ) − γ (xk−1 ) k ≤ L m X k=1 (xk − xk−1 ) = L(b − a). Beispiel 7.21 Nicht jede stetige Kurve ist rektifizierbar. Zum Beispiel ist γ : [0, 1] → R2 , ( t ∈ (0, 1] t, t · cos πt γ(t) := 0 t=0 stetig, schwankt aber bei t → 0 zu oft hin und her und ist deshalb nicht rektifizierbar (Übungsaufgabe). 0, 5 f (x) = x cos 0, 2 0, 4 0, 6 0, 8 π x 1 −0, 5 −1 Definition 7.15. Sei f : [a, b] → R eine Funktion. f heißt von beschränkter Variation , falls eine Konstante C existiert, so dass für jede Zerlegung P = {a = x0 , x1 , . . . , xm = b} von [a, b] gilt V (f, P) := m X k=1 kf (xk ) − f (xk−1 ) k ≤ C. 7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete 301 V (f, P) misst also wie stark die Funktion f schwankt. Weiterhin definieren wir die totale Variation von f V f := supV (f, P). P Man kann folgendes zeigen: Satz 7.25 γ : [a, b] → Rn ist genau dann rektifizierbar, wenn jede Komponente von γ eine beschränkte Variation hat. Definition 7.16. Eine parametrisierte Kurve γ : I −→ Rn heißt genau dann von der Klasse C k bzw. C k –Kurve, wenn γ k–mal stetig differenzierbar ist. Sei γ : I −→ Rn eine C 1 –Kurve. γ heißt genau dann regulär, wenn γ ′ (t) 6= 0 für alle t ∈ I gilt. Definition 7.17. Sei Γ ⊂ Rn eine Teilmenge. Eine parametrisierte Kurve γ : I −→ Rn mit Im(γ) = Γ heißt Parametrisierung von Γ . Beispiel 7.22 Die Kurve γ : [0, 2π] −→ R2 ≃ C, gegeben durch γ(t) = (r cos t, r sin t) = reit , beschreibt den Kreis vom Radius r. Beispiel 7.23 Die Schraubenkurve γ : R −→ R3 , gegeben durch γ(t) = (r cos t, r sin t, ct), beschreibt die Bewegung eines Punktes, der sich mit konstanter Winkelgeschwindigkeit auf einem Zylinder vom Radius r nach oben bewegt. c · 2π 6 ? Für C 1 –Kurven γ : [a, b] −→ Rn kann man L(γ) mit Hilfe des Riemann– Integrals berechnen. Satz 7.26 Sei γ : [a, b] −→ Rn eine C 1 –Kurve. Dann ist γ rektifizierbar und es gilt Zb L(γ) = kγ ′ (t)k dt. | {z } a stetig Bemerkung: Infinitesimal gilt also: Weg = b Geschwindigkeit · Zeit. Beweis: (1) Da γ eine C 1 -Funktion ist, ist γ auch Lipschitz-stetig und damit rektifiRb zierbar (siehe Beispiel 7.20). Wir zeigen zuerst, dass L(γ) ≤ a kγ ′ (s)k ds gilt. Sei P = {a = x0 < x1 < . . . < xm = b} eine beliebige Zerlegung von [a, b]. Da γ differenzierbar ist, gilt dann 302 7 Integralrechnung für Funktionen einer reellen Variablen L(γ, P) = ≤ m X k=1 kγ(xk ) − γ(xk−1 )k = m Zxk X k=1x k−1 ′ kγ (s)k ds = Zb m X Zxk k γ ′ (s) dsk k=1 x k−1 kγ ′ (s)k ds. a Also ist L(γ) = sup L(γ, P) ≤ P Zb kγ ′ (s)k ds, (∗). a (2) Nun zeigen wir, dass in (∗) Gleichheit gilt. Wir betrachten dazu die Hilfsfunktion l : [a, b] → [0, L(γ)], t 7→ l(t) := L γ|[a,t] = sup L γ|[a,t] , P . P Sei t ∈ [a, b), h > 0 und t + h ∈ [a, b]. Dann ist L γ|[t,t+h] ≥ γ(t + h) kγ(t + h) − γ(t)k {z } | kürzeste Länge zw. den EP γ(t) Wir wenden (∗) auf γ|[t,t+h] an und erhalten kγ(t + h) − γ(t)k ≤ L γ|[t,t+h] t+h Z ≤ kγ ′ (s)k ds. t Es gilt L γ|[a,b] = L γ|[a,t] + L γ|[t,b] und daher L γ|[t,t+h] = L γ|[a,t+h] − L γ|[a,t] = l(t + h) − l(t). Deshalb ist t+h Z γ(t + h) − γ(t) 1 l(t + h) − l(t) ≤ kγ ′ (s)k ds ≤ h h h t 1 = (F (t + h) − F (t)) , h wobei F die Stammfunktion von γ bezeichnet. Durch Limesbildung lim folgt h→0 nun l(t + h) − l(t) kγ ′ (t)k ≤ lim ≤ F ′ (t) = kγ ′ (t)k. h→0 h Also ist 7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete 303 l(t + h) − l(t) = kγ ′ (t)k. h→0 h l′ (t) = lim Nun folgt sofort L(γ) = l(b) − l(a) = Zb ′ l (t) dt = a Zb a kγ ′ (t)k dt. ⊓ ⊔ Definition 7.18. Sei I ⊂ R ein beliebiges Intervall und γ : I −→ Rn eine C 1 –Kurve. Dann heißt Z L(γ) := kγ ′ (t)k dt, I Länge von γ. Hierbei handelt es sich unter Umständen um ein uneigentliches Integral. Definition 7.19. Sei γ : I ⊂ R → Rn stückweise C 1 , d.h., γ ist stetig und es existieren endlich viele Punkte a = t0 < t1 < t2 < . . . < tm = b, tj ∈ I, so dass γ auf (ti , ti+1 ) C 1 ist. Dann nennen wir L(γ) := m Ztk X k=1t k−1 kγ ′ (s)k ds Länge von γ. Beispiel 7.24 (Kreislinie) Wir betrachten die Kreislinie γ : [0, 2π] −→ R2 , definiert durch γ(t) = (r cos t, r sin t). Dann ist γ ′ (t) = (−r sin t, r cos t) und kγ ′ (t)k = r. Folglich erhalten wir für die Länge L(γ) = Z2π r dt = 2πr. 0 Für die Kurve γ(t) = (cos t, sin t) mit t ∈ [0, φ] ergibt sich L(γ) = Zφ 0 1 dt = φ. γ(t) t r 304 7 Integralrechnung für Funktionen einer reellen Variablen Beispiel 7.25 (Schraubenlinie) Wir betrachten die Schraubenlinie γ : [0, 2π] −→ R3 , gegeben durch γ(t) = (r cos t, r sin t, ct). Dann ist γ ′ (t) = √ (−r sin t, r cos t, c) und kγ ′ (t)k = r2 + c2 . Folglich erhalten wir für die Länge der Schraubenlinie bei √ einer Umdrehung L(γ) = 2π r2 + c2 . γ(2π) c γ(0) r Beispiel 7.26 (Umfang der Ellipse) Eine Ellipse wird durch Punkte (x, y) ∈ R3 2 2 beschrieben, für die gilt xa2 + yb2 = 1, wobei a, b ∈ R\{0} sind. Es gelte a > b und es sei 2 k 2 := 1 − ab 2 < 1. Wir parametrisieren die Ellipse durch die Kurve γ : [0, 2π) −→ R2 mit γ(t) = (a cos t, b sin t). Dann gilt γ ′ (t) = (−a sin t, b cos t), kγ ′ (t)k = und wir erhalten y b γ(t) t ax p a2 sin2 t + b2 cos2 t, Z2πp Z2πr b2 2 2 sin t + 2 cos t dt = a L(γ) = a 1 − k 2 cos2 t dt. a 0 0 Dies ist ein elliptisches Integral, das heißt, es ist nicht√ durch elementare Funktionen ausdrückbar. Durch Reihenentwicklung von 1 − x (wie in Beispiel 7.12) erhalten wir ∞ 1 X 1 · 3 · . . . · (2j − 1) 2 (−1)j k 2j L(γ) = 2a 1 + · π . j 2 · 4 · . . . · (2j) j=1 Falls a = b = r ist (es sich also um eine Kreisbahn handelt), folgt k = 0 und damit L(γ) = 2πr. Beispiel 7.27 (Länge eines Graphen) Sei f : [a, b] → Rn eine C 1 –Kurve und Γ = graph(f ) = {(x, f (x)) ⊂ Rn+1 } ihr Graph. Rn Γ a b Wir parametrisieren den Graphen Γ durch die Kurve γ : [a, b] → R γ(x) := (x, f (x)). Dann ist x n+1 mit 7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete γ ′ (x) = (1, f ′ (x)) = (1, f1′ (x), . . . , fn′ (x)), und 305 p kγ ′ (x)k = 1 + kf ′ (x)k2 , Zb p Zb q ′ 2 1 + f1′ (x)2 + . . . + fn′ (x)2 dx L(γ) = 1 + kf (x)k dx = a a Beispiel 7.28 (In Polarkoordinaten gegebene Kurven) Sei γ(t) = r(t)eiϕ(t) = (r(t) cos ϕ(t), r(t) sin ϕ(t)) ∈ C. Dann ist γ ′ (t) = (r′ (t) cos ϕ(t) − r(t) sin ϕ(t) · ϕ′ (t), r′ (t) sin ϕ(t) + r(t) cos ϕ(t) · ϕ′ (t)) und kγ ′ (t)k = p r′ (t)2 + r(t)2 · ϕ′ (t)2 . Damit ergibt sich für die Länge der Kurve L(γ) = Zb p r′ (t)2 + r(t)2 · ϕ′ (t)2 dt. a Ist hingegen ϕ der Parameter der Kurve, also γ(ϕ) = r(ϕ)eiϕ mit r = r(ϕ), so ist Zϕ2 p r′ (ϕ)2 + r(ϕ)2 dϕ. L(γ) = ϕ1 Zum Beispiel gilt für die logarithmische Spirale mit r(ϕ) = ecϕ , c ∈ R, Z2πp c2 + 1 · ecϕ dϕ L(γ) = 0 p 1 2πc = c2 + 1 · e −1 . c reiϕ r ϕ 306 7 Integralrechnung für Funktionen einer reellen Variablen Eigenschaften der Länge von C 1 -Kurven Sei γ : I ⊂ R −→ Rn eine C 1 –Kurve und Γ := Im(γ) das Bild von γ. Man kann Γ auf verschiedene Weisen (z.B. mit unterschiedlicher Geschwindigkeit) durchlaufen: Definition 7.20. Sei γ : I ⊂ R −→ Rn eine C 1 –Kurve und τ : Ib → I eine Parametertransformation, d.h., ein C 1 -Diffeomorphismus. Dann heißt Umparametrisierung von γ. γ b := γ ◦ τ : Ib → Rn Es gilt also Γ = Im(γ) = Im(b γ ). Sinnvollerweise sollten geometrische Eigenschaften wie die Länge der Kurve nicht von der Parametrisierung abhängen, so wie die Länge eines Weges unabhängig davon ist, wie schnell man ihn zurücklegt. Satz 7.27 Sei γ : [a, b] → Rn eine C 1 –Kurve. 1) Ist γ b = γ ◦ τ : [b a, bb] → Rn eine Umparametrisierung von γ, so gilt L(γ) = L(b γ ). 2) Ist R : Rn → Rn eine Euklidische Bewegung, d.h., R(x) = Ax + x0 mit A ∈ O(n), x0 ∈ Rn , so gilt L(γ) = L(R ◦ γ). Beweis: 1) Aus γ b(s) = γ(τ (s)) folgt γ b′ (s) = γ ′ (τ (s)) · τ ′ (s) und damit Zbb Zbb ′ γ (s) ds = γ ′ (τ (s)) · |τ ′ (s)| ds. L (b γ ) = b b a b a Wir substituieren t := τ (s). Dann ist dt = τ ′ (s)ds. b = a und a) Falls τ ′ (s) > 0 ist, ist τ monoton wachsend, d.h., es gilt τ (a) b = b. Weiterhin ist |τ ′ (s)| = τ (s) und es folgt τ (b) Zb L (b γ ) = γ ′ (t)dt = L(γ). a b = b und τ (b) b = a. b) Falls τ ′ (s) < 0 ist, ist τ monoton fallend, d.h., es gilt τ (a) ′ Weiterhin ist |τ (s)| = −τ (s) und es folgt Za Zb ′ L (b γ ) = − γ (t)dt = γ ′ (t)dt = L(γ). b a 2) Sei die Kurve δ : [a, b] → Rn definiert durch δ(t) := R · γ(t) = Aγ(t) + x0 . Dann ist δ ′ (t) = Aγ ′ (t) und daher 7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete kδ ′ (t)k = kAγ ′ (t)k = kγ ′ (t)k, 307 da A ∈ O(n). ⊓ ⊔ Also ist L(δ) = L(γ). Definition 7.21. Sei γ : I ⊂ R −→ Rn eine C 1 –Kurve. γ heißt regulär, falls γ ′ (t) 6= 0 für alle t ∈ I gilt. Reguläre Kurven besitzen in jedem Punkt eine Tangente. γ ′ (t) T ant γ = γ(t) + Rγ ′ (t) γ(t) Imγ = Γ Oft wählt man Parametrisierungen, bei denen die Kurve mit konstanter Geschwindigkeit durchlaufen wird, z.B. mit der Geschwindigkeit 1, d.h. kγ ′ (t) = 1k. Definition 7.22. Eine C 1 -Kurve γ : I ⊂ R → Rn+1 heißt “durch ihre Bogenlänge parametrisiert”, falls L γ|[α,β] = β − α, ∀ [α, β] ⊂ I. Satz 7.28 1) Die Kurve γ : I → Rn ist genau dann durch ihre Bogenlänge parametrisiert, wenn kγ ′ (t)k ≡ 1 ist für alle t ∈ I. 2) Ist γ : I → Rn eine reguläre Kurve, so existiert eine Umparametrisierung γ b = γ ◦ τ mit kγ ′ (t)k ≡ 1 für alle t ∈ I (d.h., γ b ist durch ihre Bogenlänge parametrisiert). Beweis: 1) (=⇒) Wie im Beweis von Satz 7.26 betrachten wir die Hilfsfunktion l : [a, b] → [0, L(γ)], t 7→ l(t) := L γ|[a,t] = Zt kγ ′ (s)k ds. a Dann gilt nach Voraussetzung l(t) = t − a und offensichtlich ist l′ (t) = 1. Andererseits ist nach dem Hauptsatz der Differential- und Integralrechnung l′ (t) = kγ ′ (t)k. Daraus folgt kγ ′ (t)k = 1 für alle t ∈ I. (⇐=) Wenn kγ ′ (t)k = 1 ist für alle t ∈ I, dann ist 308 7 Integralrechnung für Funktionen einer reellen Variablen L γ[α,β] = Zβ kγ ′ (t)k dt = β − α ∀ [α, β] ∈ I, α n d.h., γ : I → R ist durch ihre Bogenlänge parametrisiert. 2) Wir betrachten wieder die Hilfsfunktion l aus 1). Wenn γ regulär ist, dann ist l′ (t) = kγ ′ (t)k > 0 und l ist stetig differenzierbar und streng monoton wachsend. Deshalb existiert eine differenzierbare Umkehrfunktion τ von l τ : [0, L] → [a, b] s 7→ τ (s) und es gilt τ ′ (s) = 1 l′ (τ (s)) mit l(τ (s) = s) > 0. Sei γ b := γ ◦ τ . Dann gilt γ b′ (s) = γ ′ (τ (s)) · τ ′ (s) = γ ′ (τ (s)) γ ′ (τ (s)) = . l′ (τ (s)) kγ ′ (τ (s))k Also ist kb γ ′ (s)k ≡ 1. ⊓ ⊔ Der Flächeninhalt ebener Gebiete Definition 7.23. Eine stetige Kurve γ : [a, b] → Rn heißt • • geschlossen, falls γ(a) = γ(b) gilt. einfach, falls γ : (a, b) → Rn injektiv ist. Eine einfache geschlossene Kurve γ : [a, b] → R2 heißt positiv-orientiert, falls sie entgegen dem Uhrzeigersinn durchlaufen wird. Sei nun γ : [a, b] → R2 eine einfache, geschlossene und positiv-orientierte Kurve: n=2 Γ = Im γ Ω γ(a) = γ(b) Sei Ω das von Γ := Im(γ) umschlossene Gebiet. Wie berechnet man dann seinen Flächeninhalt Area(Ω) ? 7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete 309 Satz 7.29 Sei γ : [a, b] → R2 eine (stückweise) C 1 -Kurve, einfach, geschlossen und positiv-orientiert. Sei Ω ⊂ R2 das von Γ := Im(γ) umschlossene Gebiet. Weiterhin seien x, y : [a, b] → R die Koordinatenfunktionen von γ, d.h., γ(t) =: (x(t), y(t)). Dann gilt Area(Ω) = − Zb y(t)x′ (t) dt. a Da γ geschlossen ist, folgt mit partieller Integration Area(Ω) = Zb 1 y (t)x(t) dt = 2 ′ Zb (x(t)y ′ (t) − y(t)x′ (t)) dt. a a Area(Ω) wird also durch die Randkurve ausgedrückt. Dies ist ein Spezialfall des Satzes von Stokes. Beweis: 1) Wir betrachten zunächst Kurven γ, bei denen das Bild der Kurve aus zwei zur y-Achse parallelen Geraden und zwei Bögen, die Graphen von Funktionen f1 , f2 sind, besteht. f1 , f2 > 0 f1 (x) γ (t1 ) γ(a) = γ(b) Ω γ (t3 ) γ (t2 ) f2 (x) x1 x2 Nach Definition des Riemann–Integrals ist Area(Ω) = Zx2 x1 f1 (x) dx − Zx2 f2 (x) dx. (∗) x1 Für die obige Kurve γ(t) = (x(t), y(t)) gilt (x(t), f1 (x(t))) , (x , y(t)) , 1 (x(t), y(t)) = (x(t), f2 (x(t))) , (x2 , y(t)) , t ∈ [a, t1 ] t ∈ [t1 , t2 ] t ∈ [t2 , t3 ] t ∈ [t3 , b]. 310 7 Integralrechnung für Funktionen einer reellen Variablen Die Koordinatentransformation x = x(t), dx = x′ (t)dt mit x1 = x(t1 ) und x2 = x(a) liefert für das erste Integral in (∗) Zx2 Za f1 (x) dx = f1 (x(t)) · x′ (t) dt = − t1 x1 Zt1 y(t)x′ (t) dt. a Analog ergibt sich mit x = x(t), dx = x′ (t)dt sowie x1 = x(t2 ) und x2 = x(t3 ) für das zweite Integral in (∗) Zx2 f2 (x) dx = x1 Zt3 y(t)x′ (t) dt. t2 Damit ergibt sich insgesamt t Z1 Zt3 Zb ′ ′ Area(Ω) = − y(t)x (t) dt + y(t)x (t) dt = − y(t)x′ (t) dt, a t2 a da x(t) = const für t ∈ [t1 , t2 ] und t ∈ [t3 , b]. 2) Wir betrachten nun den allgemeinen Fall. E γ (t4 ) γ (t5 ) Ω1 γ (t8 ) Ω6 Ω2 Ω3 γ (t1 ) Ω γ(a) = γ(b) 7 γ (t13 ) Ω4 Ω5 γ (t11 ) γ (t9 ) KS geeignet legen Beh.: Man kann Ω in eine endliche Zahl von Gebieten zerlegen, die die Form aus 1) haben. Sei E die y-Achse und Γ liege im positiven Quadranten. Wir betrachten die stetig differenzierbare Abbildung ̺(t) = dist(E, γ(t)) = x(t). Da das Intervall [a, b] kompakt ist, hat ̺ nur endlich viele lokale Maxima und Minima. Wie zeichnen in diesen Punkten, wie im Bild dargestellt, die zu E parallelen Geraden. Dann zerlegt sich Ω in Gebiete der Form 1). Wenn x′ (t) 6= 0 ist, ist x′ > 0 oder x′ < 0. Daher ist x(t) zwischen den 7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete 311 kritischen Punkten von x(t) monoton wachsend oder monoton fallend. Deshalb existiert eine Umkehrfunktion t = t(x) und die Teilstücke von γ sind Graphen einer Funktion: γ(t) = (x(t), y(t)) mit y = y(t) = y(t(x)) =: f (x). Nun können wir die Fläche von Ω leicht berechnen: Area(Ω) = m X Area (Ωi ) i=1 =− Zt1 ′ y(t)x (t) dt + a Zb ′ y(t)x (t) dt + t13 + Zt3 =− y(t)x′ (t) dt t1 y(t)x′ (t) dt + . . . t12 Zb Zt2 y(t)x′ (t) dt, a wobei wir im letzten Schritt benutzt haben, dass alle Parameterabschnitte [ti , ti+1 ] genau einmal auftreten. ⊓ ⊔ Folgerung 7.5 Ist die Randkurve γ in Polarkoordinaten gegeben, d.h., γ(t) = r(t)eiϕ(t) = (r(t) cos ϕ(t), r(t) sin ϕ(t)), so ist 1 Area(Ω) = 2 Zb r2 (t)ϕ′ (t) dt. a Folgerung 7.6 (Leibnitzsche Sektorformel) Das Gebiet Ω sei begrenzt durch die Strahlen Lα und Lβ mit den Winkeln α bzw. β zur x-Achse und eine Kurve r = r(ϕ), wobei der Winkel ϕ streng monoton wachsend ist. r(ϕ)eiϕ Lβ γ (t2 ) Ω β α Lα γ (t1 ) γ(a) = γ(b) Dann gilt 1 Area(Ω) = 2 Zβ α r2 (ϕ) dϕ. 312 7 Integralrechnung für Funktionen einer reellen Variablen Beweis: Wir parametrisieren die Randkurve durch γ(t) = r(t)eiϕ(t) , t ∈ [a, b], t ∈ [a, t1 ] α, ϕ(t) = ϕ(t), t ∈ [t1 , t2 ] β, t ∈ [t2 , b] Aus Folgerung 7.5 erhalten wir 1 Area(Ω) = 2 Zt2 r2 (t)ϕ′ (t) dϕ. t1 Da α und β konstant sind und ϕ auf [t1 , t2 ] monoton wachsend ist, ist ϕ′ (t) > 0. Deshalb existiert eine Umkehrfunktion t = t(ϕ) und wir können r in Abhängigkeit von ϕ darstellen: r = r(ϕ). Mit dϕ = ϕ′ (t)dt folgt 1 Area(Ω) = 2 Zβ r2 (ϕ) dϕ. α ⊓ ⊔ Beispiel 7.29 (Flächeninhalt einer Ellipse) Sei Ω die von einer Ellipse mit den Halbachsen a und b eingeschlossene Fläche. y b x2 a2 + y2 b2 ≤1 Ω a x Wir parametrisieren die Ellipse durch die Kurve γ(t) = (a cos t, b sin t) =: (x(t), y(t)) mit t ∈ [0, 2π]. Dann ist nach Satz 7.29 1 Area(Ω) = 2 Z2π 0 1 (x(t)y (t) − y(t)x (t)) dt = 2 ′ ′ Z2π 0 ab· cos2 t + sin2 t dt = πab. 7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete 313 Beispiel 7.30 (Flächeninhalt der Sternkurve (Astroide)) Ein Kreis vom Radius r = R4 rolle auf der Innenseite eines Kreises vom Radius R entlang. P r Ω P P R Der Weg, den der feste Punkt P während des Rollens zurücklegt, wird Astroide 2 2 2 genannt und ist bestimmt durch die Gleichung x 3 + y 3 = R 3 . Wir können 3 3 die Astroide parametrisieren durch γ(t) = R cos t, sin t . Dann folgt für den Flächeninhalt des Gebietes Ω, das durch die Astroide begrenzt wird 1 Area(Ω) = R2 2 Z2π 3 2 R 2 Z2π 3 = R2 2 Z2π 3 2 R 8 Z2π 0 = 0 cos3 t · 3 sin2 t · cos t + 3 cos2 t · sin t · sin3 t dt sin2 t cos2 t cos2 t + sin2 t dt 3 (sin t cos t) dt = R2 2 2 0 = Z2π 0 sin2 2t dt, 2 1 sin 2t dt 2 x := 2t, dx = 2dt 0 3 2 = R 16 Z4π 0 π 3 2 sin2 x dx = R ·8 16 Z2 0 | sin2 x dx = {z ÜA π = 4 } 3 2 πR . 8 314 7 Integralrechnung für Funktionen einer reellen Variablen Beispiel 7.31 (Archimedische Spirale) Die archimedische Spirale ist in Polarkoordinaten gegeben durch die Kurve γ(t) = r(t)eiϕ(t) = (r(t) cos ϕ(t), r(t) sin ϕ(t)) ∈ C, wobei r(ϕ) = c ϕ mit einer Konstanten c ∈ R ist. π c 2 2πc πc Ω Nach der Leibnitzschen Sektorformel ist dann 1 Area(Ω) = 2 Z2π 1 r (ϕ) dϕ = c2 2 2 Z2π 0 0 ϕ2 dϕ = 1 2 1 3 4 c · 8π = π 3 c2 . 2 3 3 Beispiel 7.32 (Kleeblatt) Der Rand des n-blättrigen Kleeblatts ist gegeben durch die Kurve γ(t) = r(t)eiϕ(t) = (r(t) cos ϕ(t), r(t) sin ϕ(t)) ∈ C, mit r(ϕ) = R · | sin n2 ϕ |, wobei ϕ ∈ [0, 2π] und R ∈ R ist. n=4 n=3 r r r(ϕk ) = 0 genau dann, wenn n2 ϕk = kπ mit k ∈ N ist, d.h., wenn ϕk = 0, 2π · n1 , 2π · n2 , . . . , 2π · n−1 n gilt. r(ϕ) = r genau dann, wenn n2 ϕ = π2 + kπ gilt, wobei k ∈ N ist. Beh.: Unabhängig von der Anzahl n der einzelnen Blätter ist die Fläche des von der Kurve γ umschlossenen Gebietes Kn halb so groß wie die Fläche der Kreisscheibe vom Radius R, d.h., 7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete Area (Kn ) = 1 2 πR 2 für alle n. Nach der Leibnitzschen Sektorformel ist 1 Area (Kn ) = R2 2 Z2π sin2 0 2 1 = R2 · 2 n n ϕ dϕ, 2 t := n n , dt = dϕ 2 2 Zπ Znπ 1 R2 2 sin t dt = · n sin2 t dt = πR2 . n 2 0 0 315 Sachverzeichnis −A, 8 A ∩ B, IX A · B, 8 A \ B, IX A + B, 8 A ∪ B, IX A ⊂ M , IX A × B, IX B[f ]n (x), 164 C, 26 C(R, C)per , 173 C(R, R)per , 172 C(X, R), 166 C k , 225 C k (U, R), 225 C (k) (U ; E), 183 Cn , 34 C ∞ (U ; E), 183 Df , 212 E, 93 E(z), 113 E[x], 163 F (x)|ba , 265 HP (A), 51 HP (xn ), 56 Hfx0 , 230 Int(A), 43, 50 Iso(A), 52 K(x, ε), 42 K(z0 , R), 111 L(I), 10 L(γ), 299, 301 Mc , 218 Ng , 247 O, 201 PC , 172 PCper , 174 PR , 171 PRper , 173 R, 111 R, 10 R, 166 Rn , 34 S(f, P, ξ), 268 T (f, x0 ), 203 Tn (f, x0 ), 203 Tp Mc , 219 Tx0 (x), 176 V , 87 V (f, P), 300 X, 39 az , 116 arccos, 159 arccot, 159 arcosh, 161 arcoth, 161 arcsin, 159 arctan, 159 arg(z), 30 arsinh, 161 artanh, 161 cl(A), 47 cos, 154 cosh, 160 cot, 158 coth, 161 318 Sachverzeichnis d, A × A40 d, 39 d(p, q), 39 d∞ , 162 e, 65, 114 ez , 114 exp, 114 f ′ , 175 f ′′ , 183 f ′ (x0 ), 175 f + h, 145 f (n) , 183 fn −→ f , 143 fn ⇉ f , 143 grad f , 217 graph(f ), 176 i, 27 inf A, 13 lim xn , 54 n→∞ lim f (a), 119 a→x lim f (a), 124 a→x+ lim f (a), 124 a→x− lim inf, 64 lim sup, 64 ln, 115 max A, 14 min A, 14 n!, 3 o, 201 p + Tp Mc , 219 sin, 154 sinh, 160 sup A, 13 tan, 158 tanh, 161 x über k, 4 xq , 24 xn , 19 xn −→ x, 54 n→∞ xn −→ x, 54 α y , 228 z, 28 Γ , 306 Ω, 308 α!, 228 ∂A, 50 π, 156 (−∞, a), 10 (−∞, a], 10 (A | B), 11 (λ · f )(x), 162 Rb (R) − , 269 a (a, ∞), 10 (a, b), 10 (a, b], 10 (f + h)(x), 162 (xnj )∞ j=1 , 56 (xn ), 53 (xn )∞ n=1 , 53 [V, +, ·], 87 [K, +, ·], 8 [x], 184 h·, ·i, 91 hx, yi, 35 [a, ∞), 10 [a, b), 10 [a, `x´b], 10 `xk´, 4 ,4 0 :=, IX :↔, IX ⇔, IX ⇒, IX ∅, IX ∃!, IX ∃, IX ∀, IX ∂f (u), 222 ∂xi ∂k f , 224 ∂xi1 ···∂xi k dn f , 183 dxn df (x Rdx 0 ), 175 R af (x) dx, 254 f (t) dt, 292 −∞ R∞ , 292 a Rb , 265 a ≤, 9 ∇a f (x0 ), 213 n Q xi , 8 i=1 ♯A, IX ≃, 140 Sachverzeichnis √ n x, 23 n P ,8 i=1 ∞ P n=0 ∞ P fn , 146 xk , 93 k=1 Abel–Dirichlet–Kriterium, 101 Abelscher Grenzwertsatz, 149 abgeschlossen, 48 Ableitung, 175 der inversen Abbildung, 179 erste, 175 n-te, 183 partielle, 222 Abschluss einer Menge, 47 absolut–konvergente Reihe, 94 Abstand, 39 Euklidischer, 36 Abstandsfunktion, 39 abzählbar, 16 Additionstheoreme, 154, 158, 160, 161 äquivalente Normen, 89 äußerer Punkt, 50 alternierende harmonische Reihe, 102 angeordneter Körper, 9 Anordnungsaxiom der reellen Zahlen, 9 Approximationssatz von Stone–Weierstraß(1), 168 von Stone–Weierstraß(2), 170 Weierstraßscher, 164 archimedische Spirale, 313 Archimedisches Axiom der reellen Zahlen, 14 Arcuscosinus, 159 Arcuscotangens, 159 Arcussinus, 159 Arcustangens, 159 Areacosinus hyperbolicus, 161 Areacotangens hyperbolicus, 161 Areasinus hyperbolicus, 161 Areatangens hyperbolicus, 161 arithmetisches Mittel, 25 Astroide, 313 Banach’scher Fixpunktsatz, 141 Banachraum, 89 Bernoullische Ungleichung, 21 319 Bernstein–Polynom, 164 beschränkt, 12 von oben, 12 von unten, 12 beschränkte Folge, 54 beschränkte Teilmenge, 54 beschränkter Variation, Funktion von, 300 bestimmt divergent, 62 bestimmtes Integral, 265 Betrag einer komplexen Zahl, 28 Betrag einer reellen Zahl, 10 bijektive Abbildung, 16 Binomialkoeffizient, 4 Binomialreihe, 208 Binomischer Satz, 20 Bogenlänge, durch ihre ∼ parametrisierte Kurve, 307 bogenzusammenhängend, 137 Cantorsches Diagonalisierungsverfahren, 17 Cantorsches Diskontinuum, 79 Cauchy–Bedingung, 69 Cauchy–Folge, 69 Cauchy–Kriterium, 94 Cauchy–Produkt von Reihen, 105 Cauchy–Schwarzsche Ungleichung, 35, 91 Cauchy-Integrierbarkeitskriterium, 271 Cauchysches Verdichtungskriterium, 103 C k –Diffeomorphismus, 232 C k -Funktion, 225 C k –Kurve, 301 Cosinus, 153 Cosinus hyperbolicus, 160 Cotangens, 158 Cotangens hyperbolicus, 161 Dedekindscher Schnitt von R, 11 Diagonalisierungsverfahren von Cantor, 17 dichte Teilmenge, 52 Diffeomorphismus, 232 Differential, 212 differenzierbar, 175, 211 Differenzierbarkeit hinreichende Bedingung für, 222 320 Sachverzeichnis Differenzmenge, IX disjunkte Mengen, IX disjunkte Vereinigung, IX diskrete Metrik, 40 diskreter metrischer Raum, 40 divergente Folge, 53 divergente Reihe, 94 Dreiecksungleichung, 10, 28, 35, 39 einfache Kurve, 308 Ellipse Flächeninhalt, 312 Umfang, 304 endliche Teilüberdeckung, 79 ε–Kugel, 42 Euklidischer Abstand, 36 Euler–Konstante, 298 Eulersche Formel, 154 Eulerzahl, 65 Exponentialfunktion, komplexe, 114 Extrema unter Nebenbedingungen, 247 notwendige Bedingungen für, 247 Fakultät, 3 Fixpunktsatz, Banach’scher, 141 Floh und Kamm-Menge, 137 Folge, 53 bestimmt divergente, 62 der Partialsummen, 93 divergente, 53 konvergente, 53 monoton fallende, 64 monoton wachsende, 64 monotone, 64 uneigentlich konvergente, 62 Folge, nach ±∞ strebend, 62 folgenkompakt, 75 folgenstetig, 126 folgenstetig in einem Punkt, 126 Fundamentalsatz der Algebra, 33, 258 Fundamentalungleichung, 274 Funktionenreihe, 146 Gaußklammer-Funktion, 184 Gaußsche Zahlenebene, 29 geometrische Reihe, 22, 96 geometrische Summe, 22 geometrisches Mittel, 25 geschlossene Kurve, 308 glatte Abbildung, 183 gleichmäßig konvergente Folge von Abbildungen, 143 Funktionenreihe, 146 gleichmäßig stetig, 133 gleichmächtige Mengen, 19 Gradient, 217 Graph Länge eines, 304 Grenzfunktion, 143 Grenzwert Eindeutigkeit, 54 einer Folge, 53 einer Funktion, 119 linksseitiger, 124 rechtsseitiger, 124 uneigentlicher, 62 Grenzwert aller Riemannschen Summen, 268 Grenzwerte Vertauschbarkeit, 144 Grenzwertsatz, Abelscher, 149 Häufungspunkt einer Folge, 56 Häufungspunkt einer Menge, 51 höchstens abzählbar, 17 harmonische Reihe, 95 alternierende, 102, 207 Hauptsatz der Differential- und Integralrechnung, 283 Hebbare Unstetigkeitsstelle, 128 Hessesche Form, 230 Hilbertraum, 92 homöomorph, 140 Homöomorphismus, 140 homogen, 25 Hyperbelfunktionen, 160 Identitätssatz für Potenzreihen, 151 imaginäre Achse, 29 imaginäre Einheit, 27 implizite Funktionen Satz über, 241 Induktion, vollständige, 2 induzierte Metrik, 40 Infimum, 12 injektive Abbildung, 16 innerer Punkt, 43 Integral Sachverzeichnis bestimmtes, 265 unbestimmtes, 254 Integrand, 254 Integration partielle, 255, 266 Integrationsvariable, 254 Integrierbarkeitskriterium Cauchysches, 271 Lebesguesches, 280 Riemannsches, 278 Intervall abgeschlossenes, 10 halboffenes, 10 Länge, 10 offenes, 10 Intervallschachtelung, 15 isolierter Punkt, 52 Isometrie, 41 isometrische metrische Rüme, 41 K-Vektorraum, 87 Körper, 8 angeordneter, 9 vollständiger angeordneter, 12 Körperaxiom der reellen Zahlen, 8 kartesisches Produkt metrischer Räume, 41 Kettenregel, 178, 215 für partielle Ableitungen, 227 Kleeblatt, 314 kleiner gleich, 9 kompakte Menge, 80 komplexe Potenz der Eulerzahl, 114 komplexe rationale Funktion, 257 komplexe Zahl, 26 n-te Wurzel geometrische Bedeutung, 33 Argument, 30 Betrag, 28 geometrische Interpretation, 29 n-te Wurzel, 32 trigonometrische Darstellung, 30 komplexe Zahlen Dreiecksungleichung, 28 geometrische Deutung der Addition, 30 geometrische Deutung der Multiplikation, 30 komplexe Zahlenebene, 29 321 konjugiert komplex, 28 konkave Funktion, 189 Kontinuumshypothese, 19 kontrahierende Abbildung, 141 Kontraktion, 141 konvergente Folge, 53 konvergente Reihe, 94 Konvergenzkreis einer Potenzreihe, 111 Konvergenzradius, 111, 112 konvexe Funktion, 189 konvexe Menge, 137 Koordinatentransformation, 233 Kreislinie, 303 kritischer Punkt, 229 k-te partielle Ableitung, 224 Kugelkoordinaten, 233 Kurve durch ihre Bogenlänge parametrisierte, 307 einfache, 308 geschlossene, 308 in Polarkoordinaten, 305 parametrisierte, 299 positiv-orientierte, 308 reguläre, 301, 307 Kurve von der Klasse C k , 301 L’Hospitalsche Regeln, 193 Länge einer C 1 -Kurve, 303 einer rektifizierbaren Kurve, 299 einer stückweisen C 1 -Kurve, 303 eines Intervalls, 268 Lagrange-Multiplikatoren, 247 Lagrangesches Gleichungssystem, 249 Landau-Symbole, 201 Lebesgue–Maß Null, 279 Lebesgue-Zahl einer Überdeckung, 83 Lebesguesches Integrierbarkeitskriterium, 280 Leibnitz–Kriterium für alternierende Reihen, 102 Leibnitz-Reihe, 103 Leibnitzsche Sektorformel, 311 Leibnizformel, 200 limes inferior, 64 limes superior, 64 Linearisierung, 212 linksseitiger Grenzwert, 124 322 Sachverzeichnis Lipschitz–Konstante, 133 lipschitzstetig, 133 logarithmische Spirale, 305 Logarithmus natürlicher, 115 lokaler Extremwert hinreichende Bedingung, 209 lokales Maximum, 185, 229 lokales Minimum, 185, 229 Luftlinienabstand, 40 Mächtigkeit, größere, 19 Machinsche Formel, 200 Majorantenkriterium, 97 Majorantenkriterium, Weierstraßsches , 147 Mannheimer-Metrik, 40 Maximum, 14 lokales, 229 Maximum,lokales, 185 Metrik, 39 der franzosischen Eisenbahn, 40 diskrete, 40 durch Skalarprodukt erzeugte, 92 induzierte, 40 metrische Räume isometrische, 41 kartesisches Produkt, 41 metrischer Raum, 39 abgeschlossene Teilmenge, 48 dichte Teilmenge, 52 diskreter, 40 innerer Punkt, 43 kompakter, 80 offene Teilmenge, 45 Rand einer Teilmenge, 50 separabler, 78 total beschränkter, 77 Vervollständigung, 72 zusammenhängender, 84 Minimum, 14 lokales, 185, 229 Mittelwertsatz der Integralrechnung erster, 286 zweiter, 287 für Funktionen mehrerer Veränderlicher, 220 für Vektorfunktionen, 191 von Lagrange, 187 monoton fallende Folge, 64 monoton fallende Funktionenfolge, 144 monoton wachsende Folge, 64 monoton wachsende Funktionenfolge, 144 monotone Folge, 64 Multiindex, 228 Ordnung eines, 228 Nebenbedingungen, 246 Niveaufläche, 218 Norm, 87 durch Skalarprodukt erzeugte, 92 Norm der Zerlegung eines Intervalls, 268 Norm eines Vektors, 35 Normen äquivalente, 89 normierter Vektorraum, 87 n-te Ableitung, 183 Nullfolge, 60 oberes Riemann-Integral, 278 Obersumme, 277 offen, 45 offene Überdeckung, 79 offenen Menge, 83 Ordnung, reflexive, 9 Parametertransformation, 306 parametrisierte Kurve, 299 Parametrisierung einer Kurve, 301 Partialbruchzerlegung komplexer rationaler Funktionen, 260 reeller rationaler Funktionen, 261 Partialsumme, 93 Partialsummen, Folge der, 93 partielle Ableitung, 222 der Ordnung k, 224 höherer Ordnung, 224 partielle Ableitungen Kettenregel, 227 Vertauschbarkeit, 225 partielle Integration, 255, 266 pi Berechnung, 199 π, 156 Polarkoordinaten, 233 Sachverzeichnis in ∼ gegebene Kurve, 305 polynomiale Funktion, 131 positiv-orientierte Kurve, 308 Positivität, 39 Potenz, 19 mit rationalem Exponent, 24 Potenz, komplexe, 116 der Eulerzahl, 114 Potenzreihe, 110 Prinzip der Intervallschachtelung, 15 Produkt von Mengen, IX Produktmetrik, 41 Produktregel, 177 punktweise konvergente Folge von Abbildungen, 143 Funktionenreihe, 146 Quotientenkriterium, 99 Quotientenregel, 177 Rand einer Menge, 50 Randpunkt einer Menge, 50 rationale Funktion, 131, 257 rechtsseitiger Grenzwert, 124 reell–analytisch, 202 reelle Zahlen, 6 Anordnungsaxiom, 9 Körperaxiom, 8 Vollständigkeitsaxiom, 11 reelle, rationale Funktion, 257 reflexive Ordnung, 9 reguläre Kurve, 301, 307 regulärer Punkt, 219 Reihe, 93 absolut–konvergente, 94 divergente, 94 geometrische, 96 harmonische, 95 konvergente, 94 Partialsumme, 93 Wert einer Reihe, 94 rektifizierbare Kurve, 299 Restglied, 204 Richtungsableitung, 213 Riemann–integrierbar uneigentlich, 292 uneigentlich , 293 Riemann-Integral, 269 Riemann-integrierbar, 269 323 Riemannsche Summe, 268 Riemannsche Zeta–Funktion, 298 Riemannscher Umordnungssatz, 109 Riemannsches Integrierbarkeitskriterium, 278 Satz über die Stetigkeit der inversen Abbildung, 140 die Umkehrabbildung, 235 implizite Funktionen, 241 Satz von Bolzano/Weierstraß, 63 Borel, 205 Cantor für folgenkompakte metrische Räume, 78 Dini, 144 Heine, 139 Heine/Borel, 82 Rolle, 186 Schwarz, 225 Weierstraß, 138 Schnittzahl von (A | B), 11 Schranke obere, 12 untere, 12 Schraubenlinie, 304 Sektorformel,Leibnitzsche, 311 separabler Raum, 78 Sinus, 153 Sinus hyperbolicus, 160 Skalarprodukt, 35, 91 Spirale,archimedische, 313 Spirale,logarithmische, 305 Sprungstelle, 128 Stammfunktion, 253 Standardmetrik, 39 sternförmige Menge, 137 Sternkurve, 313 stetig, 126 stetig differenzierbar, 183 n–mal, 183 stetig in einem Punkt, 126 Substitutionsregel, 256, 266 Summenregel, 177 Supremum, 12 surjektive Abbildung, 16 Symmetrie, 39 324 Sachverzeichnis Tangens, 158 Tangens hyperbolicus, 161 Tangente, 176 Tangentialebene, 219 Tangentialraum, 219 Tangentialvektoren, 219 Taylorformel mehrdimensionale, 228 Taylorpolynom, 203 Taylorreihe, 203 Teilüberdeckung, 79 endliche, 79 Teilfolge, 56 Teilintervall, 268 Topologie, 83 topologischer Raum, 83 total beschränkte Menge, 77 total beschränkter metrischer Raum, 77 trigonometrische Funktionen, 153 trigonometrisches Polynom komplexes, 173 reelles, 172 überabzählbar, 17 Überdeckung Lebesgue-Zahl einer, 83 offene, 79 Überdeckungssatz von Heine/Borel, 82 Umgebung eines Punktes, 53 Umkehrfunktion Ableitung der, 234 Umkehrsatz, 235 Umordnung von Reihengliedern, 107 Umordnungssatz, 107, 108 Umparametrisierung einer Kurve, 306 unbestimmtes Integral, 254 uneigentlich konvergente Folge, 62 uneigentlich Riemann–integrierbar, 292, 293 uneigentlicher Grenzwert, 62, 122 Unstetigkeitsstelle 2. Art, 128 hebbare, 128 Sprungstelle, 128 Unteralgebra, 166 unteres Riemann Integral, 278 Untersumme, 277 Vektor Norm, 35 Vektoren, 34 Vektorraum, 87 normierter, 87 Verallgemeinerter Mittelwertsatz der Differentialrechnung von Cauchy, 187 Verdichtungskriterium Cauchysches, 103 Verfeinerung der Zerlegung eines Intervalls, 268 Vertauschbarkeit von Grenzwerten, 144 Vervollständigung metrischer Räume, 71 Vielfachheit einer Nullstelle, 259 vollständige Induktion, 2 vollständiger angeordneter Körper, 12 vollständiger metrischer Raum, 69 Vollständigkeitsaxiom der reellen Zahlen, 11 Weg, 137 wegezusammenhängend, 137 Weierstraßscher Approximationssatz, 164 Weierstraßsches Majorantenkriterium, 147 Wendepunkt, 190 Wert einer Reihe, 94 Wurzel, n-te, 23 Wurzelkriterium, 98 Zentrum einer Potenzreihe, 110 Zerlegung eines Intervalls, 268 Zerlegungssatz für komplexe Polynome, 259 Zeta–Funktion Riemannsche, 298 zusammenhängende Teilmenge, 84 zusammenhängender metrischer Raum, 84 Zusammenhangskomponente, 86 zweimal differenzierbar, 183 zweite Ableitung, 183 Zwischenwertsatz, 136 Zylinderkoordinaten, 233