Einführung in die Analysis Prof. Dr. René Grothmann 2016 2 Vorwort Es handelt sich bei diesem Skript nur um eine Zusammenfassung der Vorlesung. Beweise und Beispiele wurden auf ein Minimum reduziert. Auch eine Einführung in die Mengenlehre fehlt, ebenso wie Aufgaben. Es mag zwar inhaltliche Grundlage einer Vorlesung sein, kann aber nicht wörtlich übernommen werden. Wir behandeln grob die folgenden Stoffgebiete. • Grundlagen der Mathematik, Mengenlehre und Logik. • Definition und Eigenschaften der reellen Zahlen. • Konvergenz, Folgen, Reihen und Stetigkeit. • Differential- und Integralrechnung einer Variablen. • Exponentialfunktionen und trigonometrische Funktionen. • Komplexe Zahlen, Potenzreihen. • Topologie des Rn , Konvergenz und Stetigkeit. • Differential- und Integralrechnung mehrere Variablen. • Umkehrsätze und lokale Auflösbarkeit. Der Zugang zu den reellen Zahlen ist axiomatisch. Es wurde darauf geachtet, die Grundlagen zwar präzise, aber so elegant und effektiv wie möglich zu behandeln. Konstruktiven Beweisen wurde Vorrang gegeben. Das Skript ist für den Bachelorstudiengang oder das Lehramt Gymnasium geeignet. Der behandelte Stoff ist Grundlage jeder Vorlesung in den ersten zwei Semestern eines Mathematikstudiums. Die Vorlesungen werden sich aber letztlich deutlich durch die Auswahl der Übungsaufgaben, das Gleichgewicht zwischen Beweis und Beispiel, und die Präsentation der Grundlagen der Mathematik unterscheiden. Man muss sich darüber im Klaren sein, dass die Vorkenntnisse der Studierenden sehr beschränkt sind. Dies gilt insbesondere für die Grundlagen der Mathematik und das korrekte logische Formulieren und Schließen. Es gilt aber auch für Inhalte, die Dozenten für selbstverständlich gegeben halten. Es ist keine schlechte Idee, sich über die Vorkenntnisse der Studierenden durch einen Vortest ein Bild zu machen. Auch muss unbedingt eine weit über das Skript hinaus gehende Einführung in die Mengenlehre und die Logik gegeben werden. Dies kann natürlich auch in der parallelen Vorlesung zur Linearen Algebra geschehen. 3 4 Der in den zwei Semestern zu präsentierende Stoff ist umfangreich und methodisch schwierig. Man muss daher genau prüfen, an welchen Stellen man in die Tiefe gehen kann. Im Allgemeinen ist der Erwerb einer großen Breite von Kenntnissen und Fertigkeiten zu präferieren, ohne jedoch den Erwerb von methodisch logischer Kompetenz zu vernachlässigen. Angesichts dieser doppelten Belastung wäre eine dreisemestrige oder sogar viersemestrige Ausbildung in Analysis wünschenswert. Das würde auch die Möglichkeit geben, speziellere Themen, wie etwa Differentialgleichungen, Topologie oder Maße, auf der Grundvorlesung in einem Guss aufzubauen. Hinsichtlich der Methodik des Lernens sind Vorlesungen und Übungen immer noch die Mittel der Wahl. Ziel der Vorlesung ist nicht das Transferieren eines Skripts, sondern die Erklärung, Deutung und Gewichtung des Stoffes. Skripte stehen in großer Anzahl im Netz zur Verfügung. Die Übungen sind heute aus Gründen der Prüfungsfairness und anderen juristischen Gründen nicht mehr verpflichtend. Es muss klar gemacht werden, dass sie einerseits der Einübung und andererseits der Prüfungsvorbereitung dienen. Ohne Beschäftigung mit den Übungen kann das Modul nicht erfolgreich absolviert werden. Als Selbsttest für die Studierenden und die Lehrenden empfehlen sich Probeklausuren, die wie im Ernstfall gestaltet und bewertet werden, aber sonst keine weiteren Auswirkungen haben. Als Prüfung ist eine Mischung aus mündlicher und schriftlicher Prüfung optimal. Bei einer reinen Klausurprüfung sollte die Klausur auch Aufgaben mit Definitionen oder Verständnisfragen enthalten. Es ist kein Problem, wenn sie Beweise aus der Vorlesung wiederholen lässt. Die Klausur sollte für alle Teilnehmer lösbar sein. Aufgaben, die das Erfinden eines neuen Tricks erfordern, gehören nicht in die Klausur, sondern als besonders gekennzeichnete Aufgaben in die Übungen. Man muss allerdings deutlich machen, dass diese Aufgaben schwer sind und eventuell nicht gelöst werden, obwohl sich die Beschäftigung mit den Aufgaben lohnt. Insgesamt ist es sehr schwer, den Aufbau von frustrierenden Erfahrungen des Scheiterns bei den Studierenden zu verhindern. Wie immer gelingt das am besten, wenn man die Studierenden an dem Punkt abholt, an dem sie am Beginn des Studiums stehen. Dazu kann und sollte die Vorlesung an Vorkenntnisse anknüpfen. Motivation kann aus konkreten Berechnungen, auch mit Computer-Unterstützung, gewonnen werden. Der Computer kann auch zur Visualisierung von Ergebnissen verwendet werden. Auf die Schwierigkeiten mit der logischen Argumentation sollte immer wieder eingegangen werden. Leider ist aber der Erfolg nicht garantierbar. Mit den besten Wünschen für ein gutes Gelingen, Eichstätt, 2016 R. Grothmann Inhaltsverzeichnis 1 Die reellen Zahlen 7 1.1 Die Körperaxiome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Die Anordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.3 Schranken und Intervalle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.4 Die Betragsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.5 Die Komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2 Folgen 7 21 2.1 Die natürlichen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.2 Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.3 Endliche und abzählbare Mengen . . . . . . . . . . . . . . . . . . . . . . . . . 24 2.4 Summen und Produkte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.5 Die rationalen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 3 Konvergenz 35 3.1 Grenzwert von Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.2 Vollständigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 3.3 Intervallschachtelung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.4 Häufungspunkte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 3.5 Uneigentliche Grenzwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 3.6 Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.7 Absolute Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 3.8 Dezimalbrüche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 3.9 Komplexe Folgen und Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 5 6 INHALTSVERZEICHNIS 4 Stetigkeit 57 4.1 Grenzwert von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 4.2 Rationale Funktionen 4.3 Der Zwischenwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 4.4 Extrema von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 4.5 Stetigkeit in metrischen Räumen . . . . . . . . . . . . . . . . . . . . . . . . . 69 5 Die Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 71 5.1 Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 5.2 Lokale Extrema und Monotonie . . . . . . . . . . . . . . . . . . . . . . . . . . 75 5.3 Die Tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 5.4 Die Kettenregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 5.5 Exponentialfunktion und Logarithmus . . . . . . . . . . . . . . . . . . . . . . 83 5.6 Der Satz von de l’Hospital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 5.7 Fixpunkte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 5.8 Konvexe Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 6 Integralrechnung 95 6.1 Das Riemann-Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 6.2 Der Hauptsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 6.3 Partielle Integration und Substitution . . . . . . . . . . . . . . . . . . . . . . 105 6.4 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 6.5 Allgemeine Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 7 Potenzreihen 113 7.1 Die Taylorreihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 7.2 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 7.3 Gleichmäßige Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 7.4 Trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 7.5 Partialbruchzerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 7.6 Die Stirlingsche Formel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 Kapitel 1 Die reellen Zahlen Die reellen Zahlen sind eine Menge, in der man addieren und multiplizieren kann, und in der die Elemente linear geordnet sind. Eine gute Veranschaulichung ist geometrisch mit Hilfe des Zahlenstrahls möglich, wobei zur Multiplikation die Ebene und die Strahlensätze zu Hilfe genommen werden können. Abbildung 1.1: Die Zahlengerade Wir führen die reellen Zahlen aber axiomatisch ein, anstatt sie aus den natürlichen Zahlen und den dort geltenden Rechenregeln zu konstruieren, wie das, wenn auch nicht ganz exakt, in der Schule gemacht wird. Eine mathematisch präzise Konstruktion würde sehr viel Zeit kosten und für Anfänger zu schwierig sein. Daher beginnen wir damit, die bekannten Rechenregeln und andere Axiome innerhalb der reellen Zahlen einfach festzulegen. Die Axiome der reellen Zahlen bestehen aus drei Gruppen. Wir werden sie nach und nach behandeln. • Die Axiome der Multiplikation und Addition (Körperaxiome) • Die Axiome der Anordnung • Das Vollständigkeitsaxiom und das Archimedische Axiom 1.1 Die Körperaxiome 1.1. Definition: Eine Menge K mit einer Addition “+” und einer Multiplikation “·” heißt Körper, wenn in ihr zwei Konstanten 0 6= 1 gegeben sind, und wenn die folgenden Rechengesetze gelten. 7 8 KAPITEL 1. DIE REELLEN ZAHLEN (1) Die Addition ist kommutativ, d.h. für alle a, b ∈ K a+b=b+a (2) Die Addition ist assoziativ, d.h. für alle a, b, c ∈ K (a + b) + c = a + (b + c) (3) 0 ist das neutrale Element der Addition, d.h. für alle a ∈ K. a+0=a (4) Für jedes a ∈ K existiert ein b ∈ K (das additive Inverse) mit a + b = 0. (5) Die Multiplikation ist kommutativ, d.h. a·b=b·a für alle a, b ∈ K (6) Die Multiplikation ist assoziativ, d.h. (a · b) · c = a · (b · c) für alle a, b, c ∈ K (7) 1 ist das neutrale Element der Multiplikation, d.h. a·1=a für alle a ∈ K. (8) Für jedes a ∈ K, a 6= 0, existiert ein b ∈ K (das multiplikative Inverse) mit a · b = 1. (9) Es gilt das Distributivgesetz. D.h. a · (b + c) = a · b + a · c für alle a, b, c ∈ K. Axiom I. Die reellen Zahlen sind ein Körper. Die Mengenlehre kennt keine Operatoren, sondern nur Abbildungen dort ist “+” eine Abbildung + : R2 → R Dies Abbildung bildet also ein Paar (a, b) auf eine reelle Zahl ab, die wir als a + b schreiben. Da Abbildungen eindeutig sind, ist also zu a, b ∈ R ein eindeutiges Element a + b ∈ R gegeben. Daher machen Schreibweisen wie (a + b) + c einen eindeutigen Sinn. 1.1. DIE KÖRPERAXIOME 1.2 Satz: 9 Es gilt a+b=a+c ⇔ b=c für alle a, b, c ∈ K. Ebenso a·b=a·c ⇔ b=c für alle a, b, c ∈ K, vorausgesetzt dass a 6= 0 ist. Die neutralen Elemente und die Inversen der Addition und der Multiplikation sind eindeutig bestimmt. 1.3 Satz: Ein Körper K ist nullteilerfrei. D.h., es gilt a · b = 0 ⇔ a = 0 oder b = 0 für alle a, b ∈ K. Aus diesem Grund kann 0 kein multiplikatives Inverses haben. 1.4. Definition: Wir schreiben das additive Inverse von a wie gewohnt als −a, und das multiplikative Inverse von a 6= 0 als a−1 = 1 = 1/a. a Außerdem schreiben wir wie üblich a − b := a + (−b), sowie a = a/b := a · b−1 . b Zwischen verschiedenen Variablen oder zwischen geklammerten Ausdrücken ist es außerdem üblich, den Malpunkt wegzulassen, also ab := a · b Natürlich setzen wir a2 = a · a etc. Außerdem brauchen wir die Klammern beim Addieren und Multiplizieren nicht immer zu schreiben. Wir definieren a + b + c = (a + b) + c = a + (b + c). Analog für die Multiplikation. 10 KAPITEL 1. DIE REELLEN ZAHLEN 1.5 Satz: In jedem Körper K gelten die aus der Schule bekannten Rechenregeln für die Addition und die Multiplikation. Zum Beispiel ist −0 = 0 und 1−1 = 1. Die Inversen der Inversen sind die Elemente selbst, also −(−a) = a und a−1 −1 =a für alle a ∈ K, für alle a ∈ K, a 6= 0. Außerdem −(a + b) = (−a) + (−b) für alle a, b ∈ K, und (ab)−1 = a−1 b−1 für alle a, b ∈ K, a, b 6= 0. Außerdem (−a)(−b) = −(a · (−b)) = ab für alle a, b ∈ K. Ebenso hat man die üblichen Rechenregeln für Brüche, z.B. ac a c · = , b d bd a/b ad = , c/d bc a c ad ± bc ± = , b d bd a ac = b bc für alle a, b, c, d, für die diese Brüche definiert sind. Natürlich gelten auch die binomischen Formeln (a ± b)2 = a2 ± 2ab + b2 , (a + b)(a − b) = a2 − b2 für alle a, b ∈ K. 1.6. Beispiel: Es gilt für x ∈ R x2 = 1 ⇔ x = 1 oder x = −1 Denn zum einen ist 12 = 1 · 1 = 1 und (−1)2 = 12 = 1. Zum anderen folgt aus x2 = 1 0 = x2 − 1 = (x − 1)(x + 1). Aufgrund des obigen Satzes 3 folgt x − 1 = 0 oder x + 1 = 0, also die Behauptung. (1) Das für uns wichtigste Beispiel für einen Körper ist R, der Körper der reellen Zahlen. (2) Aber für viele Rechnungen reicht der Körper Q der rationalen Zahlen aus. Er ist die Teilmenge von R, die aus Brüchen der Form n/m mit m ∈ N und n ∈ Z besteht. Wir werden Q später genauer betrachten. (3) Es gibt aber auch den Körper C der komplexen Zahlen, der eine Obermenge von R ist. Dazu später mehr. (4) Praktisch wichtig und interessant sind auch Körper mit nur endlich vielen Elementen. So ist etwa der Körper K = {0, 1}, der nur die beiden notwendigen Elemente 0 und 1 enthält ein Körper. Man rechnet dort 1 + 1 = 0. Allgemeiner sind endliche Körper die Primzahlrestkörper, die nicht Thema der Analysis sind. 1.2. DIE ANORDNUNG 1.2 11 Die Anordnung 1.7. Definition: Ein angeordneter Körper ist ein Körper K, in dem eine Relation a < b definiert ist. Diese Anordnung muss die folgenden Rechenregeln erfüllen. (1) Die Anordnung ist transitiv, d.h. a < b und b < c ⇒ a < c für alle a, b, c ∈ K. (2) Die Anordnung ist vollständig, d.h. für je zwei Elemente a, b ∈ K gilt genau eine der folgenden drei Beziehungen a < b, a = b, b < a. (3) Die Anordnung ist verträglich mit der Addition, d.h. a<b ⇒ a+c<b+c für alle a, b, c ∈ K. (4) Die Anordnung ist verträglich mit der Multiplikation mit positiven Zahlen, d.h. a < b und 0 < c ⇒ ac < bc. Axiom II. Die reellen Zahlen sind ein angeordneter Körper. Mengentheoretisch ist eine Relation eine Teilmenge von R2 , also eine Menge von Paaren (a, b), für die die Relation gilt. Eine Abbildung ist in der Mengenlehre eine Relation mit der Eigenschaft, dass für jedes a genau ein b existiert, so dass (a, b) in der Relation ist. 1.8. Definition: Selbstverständlich schreiben wir wie üblich a > b : ⇔ b < a, a ≤ b : ⇔ a < b oder a = b. a ≥ b : ⇔ a > b oder a = b. Außerdem a < b < c ⇔ a < b und b < c für alle a, b, c ∈ K etc. Man beachte, dass in Bedingung (2) gefordert wird, dass genau eine der Beziehungen gilt. Es folgt daraus zum Beispiel a ≤ b und b ≤ a ⇔ a = b für alle a, b ∈ K. 12 KAPITEL 1. DIE REELLEN ZAHLEN 1.9 Satz: In einem angeordneten Körper K gelten die aus der Schule gewohnten Rechenregeln für die Ungleichung. Zum Beispiel gilt a < 0 ⇔ −a > 0 für alle a ∈ K oder allgemeiner a < b ⇔ −a > −b für alle a, b ∈ K Eine negative Multiplikation dreht die Ungleichung herum, also a < b und 0 > c ⇒ ac > bc für alle a, b, c ∈ K für alle a, b, c ∈ K. Ungleichungen kann man addieren, also für alle a, b, c, d ∈ K a < b und c < d ⇒ a + c < b + d. Bei der Multiplikation von Ungleichungen muss man vorsichtiger sein. Es gilt aber zum Beispiel 0 < a < b und 0 < c < d ⇒ ac < bd. Aus der Schule ist bekannt, wann ein Produkt positiv und wann es negativ ist. Es gilt für alle a, b ∈ K ab > 0 ⇔ a, b < 0 oder a, b > 0 Insbesondere folgt daraus a2 > 0 für alle a ∈ K, a 6= 0, also insbesondere 1 = 12 > 0. Für das multiplikative Inverse gilt a>0 ⇔ 1 >0 a für alle a ∈ K, a 6= 0. 1.10. Beispiel: Man hat 0 < a < b ⇒ 0 < a2 < b2 Die Umkehrung gilt wegen (−b)2 = b2 nicht. Wenn a2 = c ist, so ist auch (−a)2 = c, und a und −a sind die beiden einzigen Lösungen von x2 = c (siehe Beispiel 6). Eine reelle Zahl hat deswegen höchstens zwei Quadratwurzeln. Wir wissen aber noch nicht, ob jede Zahl c > 0 eine Quadratwurzel hat. In der Tat ist dies auch in Q nicht der Fall. (1) Unser wichtigstes Beispiel ist wieder R, die Menge der reellen Zahlen. (2) Aber auch Q ist als Teilkörper von R angeordnet. (3) Die endlichen Körper und auch der Körper C der komplexen Zahlen lassen sich nicht anordnen. 1.3. SCHRANKEN UND INTERVALLE 13 Abbildung 1.2: y = x2 1.3 Schranken und Intervalle 1.11. Definition: (1) Sei K ein angeordneter Körper und M ⊆ K eine Teilmenge von K. Dann heißt m ∈ K obere Schranke von M , m≥x für alle x ∈ M . M heißt nach oben beschränkt, wenn es eine obere Schranke von M gibt. Falls die obere Schranke m Element von M ist, so heißt sie Maximum von M . Wenn m das Maximum von M ist, so schreiben wir m = max M, oder m = max x. x∈M (2) Analog definieren wir eine untere Schranke von M und das Minimum von M . (3) M heißt beschränkt, wenn es nach oben und unten beschränkt ist. Als Abkürzung dafür, dass m obere Schranke von M ist, ist auch m≥M üblich. Dies ist so zu lesen, dass m≥x für alle x ∈ M gilt. Für eine beschränkte Menge M gibt es also c, d ∈ K mit c ≤ M ≤ d. 1.12. Definition: Für a, b in einem angeordneten Körper K sind, so definieren wir die Teilmengen [a, b] := {x ∈ K : a ≤ x ≤ b}, ]a, b[ := {x ∈ K : a < x < b}, 14 KAPITEL 1. DIE REELLEN ZAHLEN und in nahe liegender Weise die Mischformen [a, b[ und ]a, b]. [a, b] heißt abgeschlossenes Intervall, und ]a, b[ offenes Intervall. Die Mischformen heißen halboffene Intervalle. Wir definieren außerdem die abgeschlossenen, nicht beschränkten Intervalle [a, ∞[:= {x ∈ A : x ≥ a}, ] − ∞, a] := {x ∈ A : x ≤ a}, sowie die offenen Intervalle ]a, ∞[ und ] − ∞, a[. Wir schreiben auch R = ] − ∞, ∞[ als Intervall. Ein Intervall in R ist eine der hier angegebenen Mengen oder die leere Menge. Für a > b sind die Intervalle [a, b] etc. leer. Offenbar a = min[a, b] = min [a, ∞[, b = max[a, b] = max ] − ∞, b]. Aber das offene Intervall ]a, b[ hat weder ein Minimum, noch ein Maximum. 1.13. Definition: Eine obere Schranke m einer nicht leeren Teilmenge M ⊆ K eines angeordneten Körpers heißt Supremum von M , wenn sie die kleinste obere Schranke von M ist, d.h., jedes Element m̃ < m ist keine obere Schranke mehr. Analog ist das Infimum einer Menge M die größte untere Schranke von M . Wir schreiben sup M, inf M oder sup x, x∈M inf x x∈M für das Infimum und das Supremum, sofern es existiert. Falls M nicht nach oben, bzw. nicht nach unten beschränkt ist, so existiert kein eigentliches Supremum bzw. Infimum. Wir schreiben dennoch sup M = ∞, inf M = −∞. Supremum und Infimum der leeren Menge sind nicht definiert. Infimum und Supremum sind eindeutig, wenn sie existieren. Jedes Maximum ist ein Supremum. Aber umgekehrt ist ein Supremum nur Maximum, wenn es in der Menge liegt. Aus unserem Axiom III für Vollständigkeit wird folgern, dass beschränkte, nicht leere Teilmengen in R immer ein Supremum und ein Infimum haben. 1.14 Satz: Sei a < b. Dann gilt a = inf ]a, b[, b = sup ]a, b[. Analoges gilt für ]a, ∞[ und ] − ∞, a[. Wenn a, b in einem Intervall I liegen, so folgt [a, b] ⊆ I. Umgekehrt haben nur Intervalle diese Eigenschaft. Wir können das erst beweisen, wenn die Vollständigkeit von R sichergestellt ist. 1.4. DIE BETRAGSFUNKTION 1.4 15 Die Betragsfunktion Wichtig für die Konvergenz in R ist der Begriff des Abstands zweier Punkte. Wir benötigen dazu zunächst die aus der Schule bekannte Betragsfunktion. 1.15. Definition: Für x ∈ R definieren wir ( |a| := a −a für a ≥ 0, für a < 0. |a| heißt der Betrag von a. Die Funktion 1 sign (a) := 0 −1 für a > 0, für a = 0, für a < 0 heißt das Vorzeichen von a. Abbildung 1.3: y = |x| Offenbar gilt a = sign (a) · |a| und natürlich |a| ≥ a für alle a ∈ R. 1.16 Satz: Es gilt |a| ≥ 0 und |a| = 0 ⇔ a = 0 für alle a ∈ R. Außerdem |ab| = |a| · |b|, 16 KAPITEL 1. DIE REELLEN ZAHLEN sowie die Dreiecksungleichung |a + b| ≤ |a| + |b| und die Ungleichung ||a| − |b|| ≤ |a − b| für alle a, b ∈ R. 1.17. Definition: Mit Hilfe der Betragsfunktion definieren wir eine Abstandsfunktion d(a, b) := |a − b|. für a, b ∈ R. Wir verwenden diese Schreibweise hier nur der Deutlichkeit halber, und werden in Zukunft einfach |a − b| für den Abstand schreiben. 1.18 Satz: Die eben definierte Abstandsfunktion ist eine Metrik auf R. Sie ist nicht negativ, d.h. d(a, b) ≥ 0 für alle a, b ∈ R sowie positiv definit, d.h. d(a, b) = 0 ⇔ a = b. Außerdem ist sie symmetrisch, d.h. d(a, b) = d(b, a) für alle a, b ∈ R. Und es gilt die Dreiecksungleichung d(a, c) ≤ d(a, b) + d(b, c) für alle a, b, c ∈ R. Jede Menge mit solch einer Metrik heißt metrischer Raum. 1.19. Definition: Wir benötigen später den Begriff der -Umgebung eines Punktes U (a) := {x ∈ R : |x − a| < } der für ≥ 0 und a ∈ R definiert ist. In R ist natürlich U (a) = ]a − , a + [. Solche Umgebungen lassen sich aber in jedem metrischen Raum definieren. 1.5. DIE KOMPLEXEN ZAHLEN 17 1.20 Satz: Offene Intervalle sind offene Mengen. D.h. für jedes x in einem offenen Intervall I gibt es ein x > 0, so dass Ux (x) = ]x − x , x + x [ ⊆ I ist. Es gibt natürlich noch andere offene Mengen in R. So ist etwa die Vereinigung zweier oder mehr offener Intervalle wieder offen. 1.5 Die Komplexen Zahlen Wir wollen einen Körper konstruieren, der den Körper R als Teilkörper enthält, und außerdem ein Element i mit i2 = −1 enthält. Wenn C ein solcher Körper ist, so muss C alle Elemente der Form z = a + bi, a, b ∈ R enthalten. Es muss gelten (a + ib) + (c + id) = (a + c) + i(b + d) (a + ib) · (c + id) = (ac − bd) + i(ad + bc). Damit ist klar, wie die Körperoperationen für diese Elemente definiert werden müssen. Wegen der Eindeutigkeit der neutralen Elemente müssen 0, 1 ∈ R ⊆ C auch die neutralen Elemente in R sein. Die Inversen von a + ib berechnen sich zu −(a + ib) = (−a) + i(−b) 1 a b = 2 −i 2 a + ib a + b2 a + b2 Damit ist klar dass die Teilmenge der Elemente a + ib von C wieder ein Körper bildet, und wir können C auf diese Elemente beschränken. 1.21 Satz: Definiert man auf R2 = {(a, b) : a, b ∈ R} die Operationen (a, b) + (c, d) = (a + c, b + d) (a, b) · (c, d) = (ac − bd, ad + bc), 18 KAPITEL 1. DIE REELLEN ZAHLEN Abbildung 1.4: Die komplexe Zahlenebene C so wird der R2 zu einem Körper, den wir den Körper der komplexen Zahlen C nennen. 1.22. Definition: Wir betten R als Teilmenge in C ein, indem wir für alle a ∈ R a = (a, 0) identifizieren. Außerdem setzen wir i = (0, 1). Mit diesen Bezeichnungen lassen sich alle Elemente von C eindeutig in der Form z = a + ib, a, b ∈ R schreiben. Man nennt a den Realteil von z und b den Imaginärteil von z a = Re (z), b = Im (z). 1.23. Definition: Für z = a + ib ∈ C schreiben wir |z| = p a2 + b2 . 1.5. DIE KOMPLEXEN ZAHLEN 19 Den Abstand zweier komplexer Zahlen z, w ∈ C definieren wir durch d(z, w) := |z − w|. Außerdem setzen wir die konjugiert komplexe Zahl von z = a + ib gleich z = a − ib. Damit gilt |z|2 = zz, sowie z 1 = 2. z |z| Der Betrag und der Abstand stimmen für z ∈ R mit den reellen Definitionen überein. Wir definieren wieder die -Umgebung von z wie in jedem metrischen Raum durch U (z) := {w ∈ C : d(z, w) < }. Im Fall von C ist dies nach dem Satz von Pythagoras das Innere eines Kreises mit Radius um z. 1.24 Satz: C wird mit dieser Abstandsfunktion zu einem metrischen Raum (siehe Satz und Definition 18). C lässt sich nicht anordnen. Denn wir wissen, dass in jedem angeordneten Körper i2 = −1 > 0 gelten müsste. Andererseits ist in jedem angeordneten Körper 1 = 12 > 0. 20 KAPITEL 1. DIE REELLEN ZAHLEN Kapitel 2 Folgen Es ist intuitiv klar, was unter eine Folge a1 , a2 , a3 , . . . von reellen Zahlen zu verstehen ist. Allerdings benötigen wir zur Konstruktion von Folgen und auch zum Beweis von komplizierteren Eigenschaften von Folgen das Induktionsprinzip. Wir müssen uns daher zunächst mit den wesentlichen Eigenschaften der natürlichen Zahlen beschäftigen. Wir werden Folgen auch verwenden, um die Vollständigkeit von R per Axiom zu fordern. 2.1 Die natürlichen Zahlen Intuitiv sind die natürlichen Zahlen diejenigen Elemente von R, die man durch Zählen 1, 2, 3, . . . , also durch die Abbildung n 7→ n + 1 ausgehend von 1 erreichen kann. Die Elemente, die man auf diese Weise nicht erreicht, sollen nicht zu N gehören. Wir fassen diese Vorstellung etwas genauer in Worte. 2.1. Definition: Eine Teilmenge N ⊆ R heißt induktiv, wenn 1 ∈ N ist und für alle n∈R n∈N ⇒ n+1∈N gilt. Die Menge N ist die kleinste induktive Teilmenge von R, d.h. N = {n ∈ R : n ist in jeder induktiven Teilmenge von R} In der Sprache der Mengenlehre kann man N als Schnittmenge aller induktiven Teilmengen von R definieren. Wir bezeichnen die Elemente von N als natürliche Zahlen. Man definiert außerdem N0 = N ∪ {0}. Die Menge N enthält nach unserer Definition die 0 nicht, wie wir gleich sehen werden. 21 22 KAPITEL 2. FOLGEN 2.2 Satz: In N gilt das Prinzip der vollständigen Induktion. D.h., wenn eine Aussage für 1 gilt, und wenn man zeigen kann, dass aus der Gültigkeit der Aussage für n ∈ N auch die Gültigkeit für n + 1 ∈ N folgt, so gilt die Aussage für alle n ∈ N. Beweis: Nach Voraussetzung ist die Menge M = {x ∈ R : x ∈ N und die Aussage gilt für x} 2 induktiv. Sie umfasst also N. 2.3 Satz: Es gilt n≥1 für alle n ∈ N. Außerdem n + m ∈ N, nm ∈ N für alle n, m ∈ N, und n>m ⇒ n−m∈N für alle n, m ∈ N. Wenn n ∈ N ist, dann enthält das Intervall ]n, n + 1[ kein Element von N. Beweis: Der Beweis dieser Aussagen verwendet das Prinzip der vollständigen Induktion. Wir führen das anhand der ersten Aussage ausführlich vor. Zu zeigen ist n ≥ 1 für alle n ∈ N. Die Aussage gilt für n = 1, womit der sogenannte Induktionsanfang gemacht ist. Die Aussage gelte für n, also n ≥ 1. Das bezeichnet man als Induktionsvoraussetzung. Wegen 1 ≥ 0 folgt dann n + 1 ≥ 1. Damit gilt die Aussage auch für n + 1. Dies ist der Induktionsschluss. Damit ist die Aussage bewiesen. Die zweite Aussage beweisen wir für festes m ∈ N per Induktion nach n. Für n = 1 ist offenbar 1+m = m+1 ∈ N. Der Induktionsschluss ist ebenfalls nicht schwierig. Sei n+m ∈ N. Dann gilt (n + 1) + m = (n + m) + 1 ∈ N, Die Aussage für das Produkt gilt für n = 1 wegen 1 · m = m ∈ N. Außerdem folgt aus nm ∈ N und der schon bewiesenen Aussage für Summen (n + 1)m = nm + m ∈ N. Wir beweisen die nächste Aussage zunächst für m = 1. Sei also n > 1, n ∈ N. Falls dann n−1∈ / N wäre, so wäre N \ {n} induktiv. Dies widerspricht n ∈ N. Also folgt n − 1 ∈ N. 2.2. FOLGEN 23 Danach verwenden wir Induktion nach n für festes m ∈ N, m > 1. Für n = 1 ist nichts zu zeigen. Die Behauptung gelte für n und es sei n + 1 > m. Da wir schon bewiesen haben, dass m − 1 ∈ N ist, und wegen n+1>m ⇒ n>m−1 folgt also (n + 1) − m = n − (m − 1) ∈ N. Sei x ∈ ]n, n + 1[ für ein n ∈ N. Angenommen, x ∈ N. Dann würde nach dem eben Bewiesenen x − n ∈ N folgen. Dies ist aber nicht möglich, weil x − n < 1 ist. 2 2.2 Folgen Wie schon gesagt, ist der Begriff der Folge intuitiv klar. Man hat einfach für jedes n ∈ N ein an ∈ R, also eine Abbildung n 7→ an . 2.4. Definition: Sei M eine Menge. Eine Abbildung a : N → M heißt Folge in M . Wir schreiben meist an := a(n). Die gesamte Folge wird als (an )n∈N bezeichnet. Wir werden auch einfach von der Folge der an , n ∈ N, sprechen. 2.5. Definition: Eine Folge in M kann induktiv definiert werden. Wir legen dabei x1 ∈ M irgendwie fest, und nehmen an, dass xn+1 mit Hilfe der vorigen Folgenglieder x1 , . . . , xn und n ∈ N eindeutig bestimmt werden kann. Man nennt solche Folgen auch rekursiv definierte Folgen. Im Spezialfall ist etwa xn+1 = g(xn ) mit einer Abbildung g. Auf diese Weise wird eine Folge eindeutig definiert. Der Beweis dieser Bemerkung ist formal etwas schwierig, da die Formulierung “xn+1 kann aus x1 , . . . , xn und n eindeutig bestimmt werden” mengentheoretisch formuliert werde müsste. Wir gehen darauf in diesem Skript nicht weiter ein. Man kann die Induktion auch mit x0 beginnen. Die Folge ist dann für alle n ∈ N0 definiert. 2.6. Definition: Die Folge der Fakultäten n!, n ∈ N, ist induktiv durch 0! = 1! = 1, (n + 1)! = n! · (n + 1) definiert. Die Folge der Potenzen xn , n ∈ N, ist für x ∈ R und n ∈ N0 induktiv durch x0 = 1, xn+1 = xn · x definiert. Man beachte, dass mit dieser Definition 00 = 1 definiert wird, aber 0n = 0 für alle n ∈ N. Die Definition x0 = 1 für alle x ∈ R, auch für x = 0, wird sich als praktisch herausstellen. 24 KAPITEL 2. FOLGEN 2.7 Satz: Für x ∈ N und n, m ∈ N0 gilt xn+m = xn xm , Für x, y ∈ N und n ∈ N0 gilt m (xn ) = xnm . n (xy) = xn y n . Beweis: Die Beweise verwenden die vollständige Induktion. Zum Beispiel gilt xn+0 = xn = xn · 1 = xn x0 . Im Induktionsschluss (Induktion nach m) haben wir unter Verwendung der Definition und der Induktionsvoraussetzung xn+(m+1) = x(n+m)+1 = xn+m x = xn xm x = xn xm+1 . Im Induktionsschluss der zweiten Behauptung muss man die erste verwenden. 2 2.8. Beispiel: Es gibt auch zweigliedrige rekursiv gegebene Folgen. So ist die FibonacciFolge durch x0 = 0, xn+1 = xn + xn−1 x1 = 1, für alle n ∈ N gegeben. Da man zur Berechnung von xn+1 zwei vorherige Glieder braucht, ist es nötig, die ersten beiden Folgenglieder vorzugeben. Man kann durch vollständige Induktion beweisen, dass √ !n ! √ !n 1 1− 5 1+ 5 xn = √ − 2 2 5 für alle n ∈ N0 gilt. 2.9. Beispiel: Man zeigt per Induktion (1 + x)n ≥ 1 + nx für alle x ≥ −1 und n ∈ N0 . Dies ist die Ungleichung von Bernoulli. 2.3 Endliche und abzählbare Mengen 2.10. Definition: Für n ∈ N definieren wir das Anfangsstück von N {1, . . . , n} := {m ∈ N : 1 ≤ m ≤ n}. Eine Menge M heißt endlich, wenn sie leer ist oder wenn es eine bijektive Abbildung f : {1, . . . , n} → M 2.3. ENDLICHE UND ABZÄHLBARE MENGEN 25 für ein n ∈ N gibt. In diesem Fall schreiben wir für die Mächtigkeit vom M |M | := n. Die Mächtigkeit der leeren Menge ist 0. Eine Menge M heißt abzählbar, wenn es eine bijektive Abbildung f :N→M gibt. Wir können daher endliche Mengen als M = {x1 , . . . , xn } schreiben. Dabei ist x : {1, . . . , n} → M eine bijektive Abbildung. Wir nennen das eine Aufzählung von M . Bei anderen Autoren umfassen abzählbare Mengen auch die endlichen Mengen. Wir verwenden aber den Begriff “abzählbar oder endlich”. 2.11 Satz: Die Mächtigkeit einer endlichen Menge ist eindeutig bestimmt. Beweis: Wenn M zwei Mächtigkeiten m und n hat, so gibt es bijektive Abbildungen f1 : {1, . . . , n} → M, f2 : M → {1, . . . , m} Daher ist f = f2 ◦ f1 eine bijektive Abbildung mit f : {1, . . . , n} → {1, . . . , m} Zu zeigen ist, dass daraus n = m folgt. Wir verwenden Induktion nach n. Für n = 1 folgt m = 1, da sonst 1 oder 2 kein Urbild hätte. Die Behauptung gelte für n, und f : {1, . . . , n + 1} → {1, . . . , m} sei bijektiv. Dann kann nicht m = 1 gelten, da sonst f (1) = f (2) wäre. Sei f (u) = m. f˜ : {1, . . . , n} → {1, . . . , m − 1} durch f˜(k) = ( f (k), k 6= u, f (n + 1), k = u. Man überlegt sich, dass f˜ wieder bijektiv ist, und daher per Induktionsannahme n = m − 1 gilt. Es folgt n + 1 = m. 2 26 KAPITEL 2. FOLGEN 2.12 Satz: Eine nicht leere, endliche Teilmenge M ⊆ R hat ein Maximum und ein Minimum. Beweis: Dieser Satz lässt sich leicht durch Induktion über die Mächtigkeit von M beweisen. Für |M | = 1 ist die Behauptung ohnehin klar, da M dann nur ein Element enthält. Für |M | = 2 lässt sie sich ebenfalls leicht beweisen. Außerdem haben wir max{x1 , . . . , xn+1 } = max {max{x1 , . . . , xn }, xn+1 } . Daher folgt aus der Existenz des Maximums für n-elementige Mengen und für Mengen mit 2 Elementen die Existenz für n + 1-elementige Mengen. 2 2.13 Satz: (1) Eine abzählbare Menge ist nicht endlich. (2) Teilmengen von endlichen Mengen sind endlich und haben keine größere Mächtigkeit als die gesamte Menge. (3) Teilmengen von abzählbaren Mengen sind endlich oder abzählbar. (4) Die Vereinigung von endlich vielen endlichen Mengen ist endlich. Für paarweise disjunkte endliche Mengen A1 , . . . , An (d.h. der Schnitt von je zwei dieser Mengen ist leer) gilt |A1 ∪ . . . ∪ An | = |A1 | + . . . + |An |. (5) Für endliche Mengen A, B gilt |A ∪ B| = |A| + |B| − |A ∩ B|. (6) Das Bild f (M ) einer endlichen Menge M unter einer Abbildung f ist endlich. (7) Das Bild f (M ) einer abzählbaren Menge M unter einer Abbildung f ist endlich oder abzählbar. (8) Die Vereinigung von abzählbar vielen abzählbaren Mengen ist abzählbar. Beweis: (1) Wenn M abzählbar und auch endlich wäre, so gäbe es bijektive Abbildungen g : {1, . . . , n} → M, f : M → N. für ein n ∈ N. Dann wäre f ◦ g : {1, . . . , n} → N bijektiv. Es genügt also zu zeigen, dass N nicht endlich ist. Das kann aber nicht sein. Sonst hätte aber nach dem vorigen Satz N ein Maximum n, was wegen n + 1 ∈ N nicht möglich ist. 2.3. ENDLICHE UND ABZÄHLBARE MENGEN 27 (2) Sei N endlich und M ⊆ N . Wir beweisen per vollständiger Induktion, dass M dann endlich ist und |M | ≤ |N | gilt. Die Aussage ist für |N | = 1 klar. Dann gilt M = ∅ oder M = N . Für |N | = n + 1 sei N = {x1 , . . . , xn+1 }. eine Aufzählung von N . Falls dann xn+1 ∈ M , so setzen wir M̃ = M \ {xn+1 } Nach Induktionsvoraussetzung ist M̃ endlich und |M̃ | ≤ |{x1 , . . . , xn }| = n. Sei etwa M̃ = {y1 , . . . , yk } mit k ≤ n eine Aufzählung von M̃ . Setzt man yk+1 = xn+1 , so erhält man eine Aufzählung M = {y1 , . . . , yk+1 } und |M | = k + 1 ≤ n + 1. Falls xn+1 ∈ / M ist, so ist der Induktionsschluss noch einfacher. (3) Es genügt wieder, den Fall N = N zu betrachten. Sei M ⊆ N und sei M nicht endlich. Dann setzen wir induktiv m1 = min M, und für u ∈ N mu+1 = min (M \ {nm1 , . . . , nmu }) Man beachte, dass die Menge, über die das Minimum genommen wird, nie leer ist, weil M nicht endlich ist. Außerdem haben wir m ∈ M \ {nm1 , . . . , nmu } ⇒ m > nmu . (Beweis per vollständiger Induktion). Also gilt mu+1 > mu für alle u ∈ N. Es folgt per vollständiger Induktion mu ≥ u. Aus diesen beiden Bedingungen folgt, dass jedes m ∈ M in der Folge (mu )u∈N vorkommt. Daher ist M = {m1 , m2 , . . .} eine Aufzählung von M und M abzählbar. (4) A1 und A2 seien disjunkte Mengen. Man kann dann leicht bijektive Abbildungen f1 : {1, . . . , n1 } → A1 , f2 : {1, . . . , n2 } → A2 zu einer bijektiven Abbildung f : {1, . . . , n1 + n2 } → A1 ∪ A2 zusammensetzen. Es folgt, dass A1 ∪ A2 endlich sind, und |A1 ∪ A2 | = |A1 | + |A2 |. 28 KAPITEL 2. FOLGEN Wenn A1 oder A2 leer sind, so gilt das auch. Die Behauptung für allgemeine n folgt daraus per vollständiger Induktion. Wenn A1 und A2 endlich sind, so sind A1 und A2 \ A1 disjunkt, und sie haben dieselbe Vereinigung. Also ist A1 ∪ A2 endlich. Die allgemeine Aussage folgt per Induktion nach n. (5) Da A \ B, B \ A und A ∩ B disjunkte Mengen sind, folgt |A ∪ B| = |A \ B| + |B \ A| + |A ∩ B|. Da A ∩ B und A \ B disjunkt sind, haben wir |A| = |A ∩ B| + |A \ B|. Analog for B. Insgesamt folgt die Behauptung. (6) Wenn M endlich ist, f : M → N eine Abbildung, so beweist man wieder leicht durch Induktion nach |M |, dass f (M ) endlich ist. (7) Wenn M abzählbar ist, M = {m1 , m2 , . . .} (mit bijektivem m : N → M ) und f : M → N eine Abbildung, so definieren wir für x ∈ f (M ) g(x) = min{k : f (mk ) = x}. Dann ist g : f (M ) → N injektiv. Wenn die Menge g(f (M )) ⊆ N endlich ist, so ist daher f (M ) endlich, und wenn g(f (M )) abzählbar ist, so ist f (M ) abzählbar. (8) Es sei für alle m ∈ N Am = {a1,m , a2,m , . . .} Dann tauchen alle Elemente von A = A1 ∪ A2 ∪ . . . unter den Elementen a1,1 , a1,2 , a2,1 , a1,3 , a2,2 , a3,1 , a1,4 , a2,3 , a3,2 , a4,1 , ... auf. Aufgrund von (7) ist daher A endlich oder abzählbar. Wenn eines der Ak abzählbar ist, dann ist A als Obermenge ebenfalls abzählbar, da es dann gemäß (3) nicht endlich sein kann. 2 2.14 Satz: Jede nicht-leere Teilmenge M ⊆ N hat ein Minimum. Beweis: Sei n ∈ M . Dann ist M̃ = {1, . . . , n} ∩ M als Teilmenge einer endlichen Menge endlich. Die Menge M̃ hat daher ein Minimum, das dann auch ein Minimum von M ist. 2 2.4. SUMMEN UND PRODUKTE 29 Aus diesem Satz folgt das Abstiegsprinzip. Es besagt, dass eine Folge (mn )n∈N von natürlichen Zahlen mit mn+1 ≥ mn für alle n ∈ N (monoton fallend) letztlich konstant sein muss. Es gibt also ein N ∈ N mit mn = mN für alle n ≥ N . Man kann einfach das Minimum aller Folgenglieder als mN nehmen. 2.15. Definition: Analog zur Definition einer Folge definieren wir ein Tupel von Elementen einer Menge als eine Abbildung a : {1, . . . , n} → M Wir schreiben für das Tupel einfach (a1 , . . . , an ). Die Menge aller Tupel wird als Produktraum M n bezeichnet. Also M n = {(m1 , . . . , mn ) : mk ∈ M für k = 1, . . . , n} Das Tupel (a1 , . . . , an ) ist etwas anderes als die Menge {a1 , . . . , an }. Denn erstens kommt es beim Tupel auf die Reihenfolge an, und zweitens werden Wiederholungen beachtet. Dasselbe gilt für den Unterschied von Folgen und abzählbaren Mengen. Zwar kann man jede abzählbare Menge M als Bild einer Folge M = {a1 , a2 , a3 , . . .} schreiben, aber dies ist dennoch verschieden von der Folge (an )n∈N , bei der Wiederholungen von Folgengliedern wichtig sind. 2.4 Summen und Produkte Dieser Abschnitt dient hauptsächlich dazu, eine wichtige Schreibweise für Summen und Produkte von endlich oder abzählbar vielen Elementen in R zu definieren. Auf die Dauer ist die Schreibweise a1 + . . . + an , zu unpräzise und auch zu platzgreifend. Außerdem werden einige oft verwendete Resultate über Summen hergeleitet. 2.16. Definition: Wir definieren für n ∈ N n X ak := a1 + . . . + an k=1 n Y k=1 ak := a1 · . . . · an 30 KAPITEL 2. FOLGEN Man kann diese Schreibweisen exakt mit induktiver Definition einführen. Also etwa 1 X ak = a1 k=1 n+1 X ak = k=1 n X ! ak + an+1 . k=1 Man kann die Summe auch für n = 0 definieren (leere Summe). Dann muss sie den Wert 0 bekommen. Das leere Produkt hat den Wert 1. Die Summe und das Produkt kann auch mit einem anderen Index anfangen, also etwa n X ak := am + am+1 + . . . + an k=m für n ≥ m. Für n < m wird die Summe als 0 definiert, das Produkt als 1. 2.17. Beispiel: Die Fakultät und die Potenz schreiben sich als n! = n Y k, xn = k=1 n Y x. k=1 2.18. Beispiel: (1) Man zeigt mit vollständiger Induktion n X k = 1 + ... + n = k=1 n(n + 1) 2 für alle n ∈ N. Dies ist die arithmetische Summe. (2) Ebenso die geometrische Summe n X xk = 1 + x + . . . + xn = k=0 1 − xn+1 1−x für alle x 6= 1 und n ∈ N0 . 2.19. Definition: Für n ∈ R und m ∈ N0 definieren wir den Binomialkoeffizient n m = n · (n − 1) · . . . · (n − (m − 1)) 1 = m! m! Im Fall m = 0 ist das Produkt leer, und es gilt daher n =1 0 für alle n ∈ R. n Y k=n−m+1 k. 2.4. SUMMEN UND PRODUKTE 2.20 Satz: 31 Für n, m ∈ N0 , 0 ≤ m ≤ n, gilt n = m n! . m!(n − m)! Außerdem gilt für alle n ∈ R, m ∈ N0 n m + n m+1 = n+1 . m+1 Dieser Sachverhalt führt zum Pascalschen Dreieck n=0 n=1 n=2 n=3 n=4 .. . m = 0 m = 1 m = 2 m = 3 m = 4 ... 1 1 1 1 2 1 1 3 3 1 1 4 6 4 1 Dabei ist jedes Element die Summe des links und direkt über ihm stehenden Elementes. Wir setzen außerhalb des Dreiecks die Werte auf 0. 2.21 Satz: Es gilt die Binomialentwicklung (a + b)n = n X n k=0 k ak bn−k für alle a, b ∈ R und n ∈ N. Beweis: Der Beweis erfolgt natürlich durch vollständige Induktion nach n. Wir verwenden Im Induktionsschritt Verallgemeinerungen des Distributivgesetzes, die man ebenfalls per Induktion beweisen kann. (a + b)n+1 = (a + b) · (a + b)n n X n k n−k = (a + b) · a b k k=0 =a· n X n k=0 = k n X n k=0 k ak bn−k + b · ak+1 bn−k + n X n k=0 n X n k=0 k k ak bn−k ak bn+1−k . 32 KAPITEL 2. FOLGEN Nun kann man die erste Summe durch Ersetzen von k = k̃ − 1 umschreiben. n X n k=0 k ak+1 bn−k = n+1 X n X n n ak̃ bn+1−k̃ = ak̃ bn+1−k̃ + an+1 . k̃ − 1 k̃ − 1 k̃=1 k̃=1 Spaltet man den Index k = 0 von der zweiten Summe in gleicher Weise ab und verwendet den vorigen Satz, so folgt die Behauptung. 2 2.22 Satz: Schreibt man P(M ) := {T : T ⊆ M } für die Potenzmenge von M , so gilt für endliche Mengen M |P(M )| = 2|M | . Eine endliche Menge der Mächtigkeit n hat 2n verschiedene Teilmengen, und n m verschiedene Teilmengen der Mächtigkeit m, 0 ≤ m ≤ n. Beweis: Sei |M | = n. Wir beweisen die erste Behauptung per Induktion nach n. Für n = 0 ist M leer und hat nur die leere Menge als Teilmenge. Für M = 1, hat M die 2 Teilmengen ∅ und M . Sei M = {x1 , . . . , xn+1 } eine Aufzählung von M . Für T ⊆ M̃ = {x1 , . . . , xn } sind dann T und T ∩ {xn+1 } zwei verschiedene Teilmengen von M . Alle Teilmengen von M lassen sich umgekehrt auf diese Weise aufteilen. Also hat M doppelt so viele Teilmengen wie M̃ . Nach Induktionsannahme |P(M )| = 2|P(M̃ ))| = 2 · 2n = 2n+1 . Den zweiten Teil beweisen wir ebenfalls durch vollständige Induktion nach n. Für n = 1 ist die Behauptung für m = 0 und m = 1 klar. Sei wieder M = {x1 , . . . , xn+1 } eine Aufzählung von M . Für m = 0 gibt es wieder nur die leere Teilmenge. Sonst lassen sich die m-elementigen Teilmengen von M in Teilmengen aufteilen, die xn+1 enthalten oder nicht enthalten. Per Induktion folgt die Behauptung wieder aus dem vorigen Satz. 2 2.5. DIE RATIONALEN ZAHLEN 2.5 33 Die rationalen Zahlen Das Rechnen mit Brüchen ist aus der Schule bekannt, etwa in der Form von Dezimalbrüchen. Wir werden hier nur die wichtigsten Eigenschaften des Körpers der rationalen Zahlen festhalten. Die Besprechung der Dezimalbrüche heben wir uns auf, bis wir die Konvergenz zur Verfügung haben. 2.23. Definition: Wir definieren die Menge der ganzen Zahlen Z := {m ∈ R : m ∈ N oder m = 0 oder −m ∈ N}, sowie die Menge der rationalen Zahlen Q := { m : m ∈ Z und n ∈ N}. n Beides sind natürlich Teilmengen von R. 2.24 Satz: Die Summe, die Differenz und das Produkt von ganzen Zahlen ist wieder eine ganze Zahl. Die ganzen Zahlen bilden einen kommutativen Ring. D.h., es gelten alle Körperaxiome bis auf die Existenz des multiplikativen Inversen. 2.25 Satz: Die rationalen Zahlen bilden einen angeordneten Körper. Es gibt zwischen Q und R noch weitere Körper. Zum Beispiel erfüllt auch √ K := {a + b 2 : a, b ∈ Q} die Axiome eines angeordneten Körpers und es gilt Q ⊂ K ⊂ R. 2.26 Satz: Die rationalen Zahlen sind abzählbar. Beweis: Die ganzen Zahlen sind als Vereinigung zweier abzählbarer Mengen abzählbar. Daher sind auch die Brüche mit festem Nenner n ∈ N abzählbar. Die abzählbare Vereinigung dieser Brüche ist Q. 2 Wir können erst später zeigen, dass R nicht abzählbar (überabzählbar) ist. 34 2.27 Satz: KAPITEL 2. FOLGEN Es gibt in Q keine Quadratwurzel von 2. Beweis: Wir beweisen das durch Widerspruch. Angenommen 2 p = 2, q p, q ∈ N. Eine Zahl n ∈ Z heißt gerade, wenn n/2 ∈ Z ist, sonst ungerade. Falls p und q beide gerade sind, so kürzen wir den Bruch durch 2. Die Zahlen werden dabei kleiner. Nimmt man p und q minimal mit der obigen Eigenschaft, so muss also p oder q ungerade sein. Es gilt nun p2 = 2q 2 . Wenn p ungerade ist, dann ist es auch p2 , wie man sich überlegt. Das ist aber offenbar nicht der Fall. Also ist q ungerade. Da dann p gerade ist, ist p/2 ∈ N, also auch p2 /4 ∈ N. Also p2 q2 = ∈ N. 2 4 Aber q 2 ist ungerade, weil q ungerade ist. Das kann also nicht sein. Wir haben einen Widerspruch, so dass die Annahme falsch sein muss, dass es eine Quadratwurzel von 2 in Q gibt. 2 Gerade Zahlen n ∈ Z haben offenbar die Darstellung n = 2m mit einem m ∈ Z. Ungerade Zahlen haben die Darstellung n = 2m + 1 mit einem m ∈ Z. Kapitel 3 Konvergenz Konvergenz ist einer der wesentlichen Grundbegriffe der Analysis. Sie wird in der Schule meist anschaulich mit Hilfe des Begriffs der “beliebigen Annäherung” eingeführt. Wir präzisieren hier diesen Begriff. Außerdem wollen wir mit Grenzwerten rechnen lernen. Dieses Kapitel untersucht zunächst die Konvergenz von Folgen und Reihen. Den Grenzübergang bei Funktionen werden wir im nächsten Kapitel kennen lernen. 3.1 Grenzwert von Folgen Was bedeutet es, dass sich eine reelle Folge a1 , a2 , . . . einem Wert a ∈ R “beliebig annähert”? Dazu kann es nicht genügen, dass einzelne Folgenglieder gleich a werden oder gar nur in der Nähe von a liegen, sondern es müssen alle Folgenglieder ab einen gewissen Index in beliebig kleinem, vorgegebenem Abstand zu a liegen. 3.1. Definition: Die (an ∈ R)n∈N konvergiert genau dann gegen a ∈ R, wenn es zu jedem (beliebig kleinen) > 0 ein N ∈ N gibt, so dass |an − a| < für alle n ≥ N . Im Fall der Konvergenz bezeichnen wir a als den Grenzwert der Folge und schreiben a = lim an . n→∞ Wir schreiben auch an → a für n → ∞. Man zeigt, dass die Konvergenz der Folge äquivalent dazu ist, dass für alle > 0 außerhalb der Umgebung (a − , a + ) nur endlich viele Folgenglieder liegen. In der Tat kann man N wie folgt währen. N = max {n : an ∈ / ]a − , a + [} + 1. 35 36 3.2 Satz: KAPITEL 3. KONVERGENZ Der Grenzwert einer Folge ist eindeutig, wenn er existiert. Beweis: Angenommen die Folge (an )n∈N habe die beiden Grenzwerte a und ã. Sei a < ã. Dann existieren N1 , N2 ∈ N mit ã − a 2 ã − a |ã − an | < 2 |a − an | < für alle n ≥ N1 , für alle n ≥ N2 , Für N = max{N1 , N2 } und n ≥ N gilt dann a < an < a + ã − a a + ã ã − a = = ã − < an < ã. 2 2 2 2 Dies ist nicht möglich. Die Konvergenz und der Grenzwert einer Folge ändert sich offensichtlich nicht, wenn man endlich viele Folgenglieder ändert oder weglässt. Wenn die Folge (an )n∈N konvergiert und φ:N→N eine bijektive Abbildung ist, so ist konvergiert die umgeordnete Folge (aφ(n) )n∈N gegen denselben Wert. Denn man kann für die umgeordnete Folge N wie folgt wählen. N = max {φ−1 (m) : am ∈ / ]a − , a + [} + 1. Konvergente Folgen sind offenbar beschränkt. Außerdem gilt offenbar lim an = 0 ⇔ lim |an | = 0 n→∞ n→∞ Ohne weitere Axiome können wir nur sehr einfache Beispiele für konvergente Folge geben. So ist etwa jede Folge (an )n∈N konvergent, die ab einem gewissen Glied konstant ist, d.h. es gibt ein N ∈ N mit an = a für alle n ≥ N . Für die intuitiv gewünschten Aussagen 1 =0 n→∞ n lim benötigt man, dass die Folge nicht durch ein > 0 nach unten beschränkt ist. Äquivalent dazu ist das Archimedische Prinzip, das besagt, dass die natürlichen Zahlen N nicht in R nach oben beschränkt sind. Wir werden dies im nächsten Abschnitt aus unserem Axiom III für Vollständigkeit folgern. Man beachte allerdings, dass die Folge (1/n)n∈N durch keine rationale Zahl nach unten beschränkt sein kann. Ohne das Archimedische Prinzip klafft also die Definition der Konvergenz in R und Q möglicherweise auseinander. 3.3. Definition: Wenn (an )n∈N eine Folge ist, und (nm )m∈N eine Folge in N mit n1 < n2 < n3 < . . . 3.1. GRENZWERT VON FOLGEN 37 Dann heißt die Folge (anm )m∈N eine Teilfolge von (an )n∈N . Sie besteht also aus den Folgengliedern an1 , an2 , an3 , . . . 3.4 Satz: Jede Teilfolge einer konvergenten Folge konvergiert gegen denselben Wert. 3.5. Beispiel: Die Folge ((−1)n )n∈N 1, −1, 1, −1, . . . hat die konstante Folge (1)n∈N als Teilfolge. Dazu setzt man mn = 2n. Ebenso hat sie die konstante Folge (−1)n∈N als Teilfolge. Sie kann also gar nicht konvergieren. 3.6. Beispiel: Wenn für eine Folge (an )n∈N die Folge der geraden und die Folge der ungeraden Folgenglieder gegen denselben Wert konvergieren, also lim a2n = lim a2n+1 = a n→∞ n→∞ so konvergiert die gesamte Folge ebenfalls gegen a. Dies ergibt sich aus der Tatsache, dass jedes n ∈ N entweder gerade oder ungerade ist. Außerhalb von ]a − , a + [ liegen also insgesamt nur endlich viele Folgenglieder. 3.7 Satz: (1) Seien (an )n∈N , (bn )n∈N reelle Folgen. Dann kann man “+”, “−” und “·” mit dem Grenzwert vertauschen, also lim (an ± bn ) = lim an + lim bn n→∞ n→∞ lim an bn = lim an · lim bn . n→∞ n→∞ n→∞ n→∞ Die Grenzwerte auf der linken Seite existieren, wenn die Grenzwerte auf der rechten Seite existieren. Falls bn 6= 0 ist für alle n ∈ N und lim bn 6= 0, so gilt auch lim an an = n→∞ . n→∞ bn lim bn lim n→∞ (2) Wenn (an )n∈N , (bn )n∈N , konvergente Folgen sind und an ≤ bn für alle n ∈ N, so gilt lim an ≤ lim bn . n→∞ n→∞ (3) Wenn (an )n∈N , (bn )n∈N , (cn )n∈N Folgen sind mit an ≤ bn ≤ cn für alle n ∈ N 38 KAPITEL 3. KONVERGENZ und die Folgen (an )n∈N , (cn )n∈N gegen denselben Grenzwert konvergieren, also lim an = lim cn , n→∞ n→∞ so konvergiert auch die Folge (bn )n∈N gegen denselben Grenzwert. Dieses Prinzip nennt man das Sandwich-Prinzip. Beweis: (1) Wir zeigen hier nur die Aussage für die Multiplikation und die Division. Sei lim an = a, lim bn = b. Die konvergente Folge der an beschränkt, etwa durch C > 0. Man hat also mit der Dreiecksungleichung |an bn − ab| = |(an bn − an b) + (an b − ab)| ≤ |an | · |bn − b| + |b| · |an − a| ≤ C ˙|bn − b| + |b| · |an − a|. Sei > 0. Wir wählen dann (im Fall b 6= 0) N1 ∈ N, N2 ∈ N so dass 2C |an − a| < 2|b| für alle n ≥ N1 , |bn − b| < für alle n ≥ N2 . (Der Fall b = 0 ist noch einfacher.) Dann gilt also |an bn − ab| < C + |b| = 2C 2|b| für alle n ≥ N := max{N1 , N2 }. Wir beweisen nun für bn 6= 0 für alle n ∈ N und bn → b 6= 0 1 1 = . n→∞ bn b lim Zunächst gilt 1 − 1 = |bn − b| bn b |bn | · |b| Weiter gibt es ein N1 ∈ N mit |b − bn | > |b| 2 für alle n ≥ N1 . Daraus folgt |bn | > |b| 2 für alle n ≥ N1 . Es folgt 1 − 1 < |bn − b| · 2 . bn b |b|2 Man wählte also N2 ≥ N1 so, dass |bn − b| < |b|2 2 für alle n ≥ N2 3.2. VOLLSTÄNDIGKEIT 39 gilt. Die Aussage für die Division von Folgen ist dann ebenfalls bewiesen. Denn an bn = an · 1 . bn (2) Konvergiere an → a und bn → b. Zu zeigen ist a ≤ b. Angenommen a > b. Dann wählen wir N1 , N2 ∈ N mit a−b 2 a−b |bn − b| < 2 |an − a| < für alle n ≥ N1 , für alle n ≥ N2 . Für N := max{N1 , N2 } folgt nun ein Widerspruch, wegen a+b a−b ⇒ aN > , 2 2 a−b a+b |bN − b| < ⇒ bN < . 2 2 |aN − a| < Aber andererseits gilt nach Voraussetzung aN ≤ bN . (3) Konvergiere an → c, bn → c. Die Behauptung folgt sehr einfach aus c − < an < c + , c − < bn < c + ⇒ c − < cn < c + 2 für > 0. 3.2 Vollständigkeit Wir komplettieren in diesem Abschnitt die Axiome der reellen Zahlen. Es gibt dafür eine Reihe von Möglichkeiten. Unser Axiom hat den Vorteil, praktisch wichtig zu sein und auch einfach zu formulieren. 3.8. Definition: Eine Folge (an )n∈N in R heißt monoton wachsend, wenn an+1 ≥ an für alle n ∈ N gilt. Wenn hier immer an+1 > an gilt, so nennt man die Folge streng monoton wachsend. Entsprechend definiert man (streng) monoton fallende Folgen. Eine Folge heißt nach oben beschränkte Folge, wenn es ein c ∈ R gibt, so dass an ≤ c für alle n ∈ N gilt (analog für eine nach unten beschränkte Folge). Axiom III. In R konvergiert jede monoton wachsende, nach oben beschränkte Folge. Dann konvergiert auch jede monoton fallende, nach unten beschränkte Folge. Dies folgt aus den Rechenregeln für Grenzwerte, wenn man die Folge der an durch die Folge der −an ersetzt. 40 3.9 Satz: KAPITEL 3. KONVERGENZ Die Menge N ist in R nicht nach oben beschränkt. Es gilt lim n→∞ 1 = 0. n Beweis: Falls N nach oben beschränkt wäre, so würde die streng monoton wachsende Folge (n)n∈N konvergieren, also n → a ∈ R. Es folgt a − 1 < N < a für ein N ∈ N. Wir haben dann aber n > a + 1 für alle n ≥ N + 2. Daher kann diese Folge nicht konvergieren. 2 Es folgt, dass es zu a ∈ R, b > 0 und x ∈ R stets ein n ∈ N gibt mit a + bn > x Dies ist ein Gedanke, den schon Archimedes formulierte. Man nennt R deswegen archimedisch angeordnet. 3.10. Definition: Wir definieren den ganzzahligen Anteil einer reellen Zahl x > 0 als bxc = max{n ∈ N : n ≤ x}. Man beachte, dass die Menge, über die das Maximum genommen wird, endlich ist, da N nicht beschränkt ist. Es gilt dann 0 ≤ x − bxc < 1. und bxc ∈ N. x − bxc heißt gebrochener Anteil von x. 3.11 Satz: Für |q| < 1 gilt lim q n = 0. n→∞ Für |q| > 1 konvergiert die Folge (q n )n∈N nicht. Beweis: Aus der Binomialentwicklung folgt die Ungleichung von Bernoulli (1 + x)n ≥ 1 + nx für alle x ≥ 0, n ∈ N. Es folgt, dass q n nicht beschränkt ist für q = 1 + x > 1. Außerdem n 1 1 1/n 1 = ≤ = →0 0≤ (1 + x)n 1+x 1 + nx 1/n + x für x > 0 aufgrund der Rechenregeln für Grenzwerte. Es folgt q n → 0 für 0 < q < 1. Für −1 < q < 0 gilt |q|n = |q n |. Daher konvergiert auch in diesem Fall q n → 0. 2 3.12. Beispiel: Die Folge an = 1 1+ n n , n ∈ N, 3.3. INTERVALLSCHACHTELUNG 41 ist streng monoton wachsend und nach oben durch 3 beschränkt. Sie konvergiert also gegen einen Grenzwert, den man Eulersche Zahl e nennt. Also n 1 e := lim 1 + n→∞ n Es ist e = 2.71828 . . . 3.3 Intervallschachtelung 3.13 Satz: Als Intervallschachtelung bezeichnen wir eine Folge von nicht-leeren Intervallen [an , bn ] im angeordneten Körper R mit [an+1 , bn+1 ] ⊆ [an , bn ] für alle n ∈ N und lim (bn − an ) = 0. n→∞ Für solche Intervallschachtelungen gibt es genau ein x ∈ R, das in allen Intervallen liegt und es gilt x = lim an = lim bn . n→∞ n→∞ Beweis: Die beiden Folgen der an und bn sind dann monoton wachsend, bzw. monoton fallend. Denn an ≤ an+1 ≤ bn+1 ≤ bn für alle n ∈ N. Sie sind daher auch beide beschränkt und konvergieren. Wir haben 0 = lim (bn − an ) = lim bn − lim an . n→∞ n→∞ n→∞ Also konvergieren die Folgen gegen einen gemeinsamen Grenzwert x ∈ R. Man zeigt ak ≤ bn für alle k, n ∈ N. Daher gilt x ≤ bn für alle n ∈ N. Analog x ≥ an für alle n ∈ N. Also liegt x in allen Intervallen. Falls x̃ ebenfalls in allen Intervallen liegt, so muss gelten x = lim an ≤ x̃ ≤ lim bn = x. n→∞ n→∞ 2 Also x = x̃. 3.14. Beispiel: Mit Hilfe der√Intervallschachtelung kann man numerische Näherungen berechnen. Zur Berechnung von 2 starten wir etwa mit dem Intervall [a0 , b0 ] = [1, 2]. 42 KAPITEL 3. KONVERGENZ Wir wissen a20 < 2 < b20 . Nun berechnen wir in jedem Schritt mn = 1 (an + bn ). 2 Dies ist die Mitte des Intervalls [an , bn ]. Wir setzen nun ( [an , mn ] falls m2n ≥ 2, [an+1 , bn+1 ] := [mn , bn ] falls m2n < 2. Man erhält für alle n ∈ N [an+1 , bn+1 ] ⊂ [an , bn ] 1 bn − an = n 2 Dies ist eine Intervallschachtelung. Der Grenzwert sei x, also lim an = lim bn = x. n→∞ n→∞ Aus den Rechenregeln für Grenzwerte folgt lim a2n = lim b2n = x2 . n→∞ n→∞ Wir haben nun aufgrund der Konstruktion a2n ≤ 2 ≤ b2n für alle n ∈ N Es folgt aus dem Sandwich-Prinzip x2 = lim a2n = 2. n→∞ √ √ Wir haben damit die Existenz von 2 ∈ R bewiesen. Es gilt 2 ∈ / Q. Das verwendete numerische Verfahren heißt Bisektionsverfahren. Es liefert die Folge der Mittelwerte mn 1.5, 1.25, 1.375, 1.4375, 1.40625, 1.421875, 1.4140625, 1.41796875, 1.416015625 √ Der auf 16 Stellen genaue Wert für 2 ist 1.414213562373095. Dafür benötigt man allerdings 54 Schritte. Es gibt aber auch sehr viel schnellere Verfahren. √ Für alle a ≥ 0 existiert ein eindeutiges x ≥ 0 mit x2 = a, das wir mit a bezeichnen und √ Quadratwurzel von a nennen. Alle Lösungen der Gleichung x2 = a sind damit durch a √ und − a gefunden. Die Quadratwurzel kann analog zum obigen Beispiel durch Intervallschachtelung berechnet werden. Ein wichtiges Prinzip ist, dass im Fall an → a > b ein N ∈ N existiert mit an > b für alle n > N . Wenn der Grenzwert einer Folge positiv ist, so ist die Folge ab einem Index positiv, ja sie ist sogar ab einem gewissen Index durch ein c > 0 nach unten beschränkt. 3.4. HÄUFUNGSPUNKTE 43 3.15 Satz: Jede nach oben (bzw. nach unten) beschränkte, nicht leere Teilmenge M ⊆ R hat ein Supremum (bzw. ein Infimum). Beweis: Wir konstruieren eine Intervallschachtelung [an , bn ], n ∈ N mit der Eigenschaft, dass bn jeweils obere Schranke von M ist, und an nicht. Dazu muss man jeweils überprüfen, ob a n + bn mn = 2 obere Schranke von M ist oder nicht. Der Grenzwert der Schachtelung ist dann Supremum von M . 2 3.4 Häufungspunkte Die Folge (−1)n konvergiert zwar nicht, sie nimmt aber die Werte ±1 je unendlich oft an. Die Frage ist, ob sich nicht konvergente, aber beschränkte Folgen immer so verhalten. 3.16. Definition: Sei an , n ∈ N, eine reelle Folge. Ein Punkt a ∈ R heißt Häufungspunkt der Folge, wenn es zu jedem > 0 und jedem N ∈ N ein n > N gibt mit |a − an | < . Es müssen also in jeder noch so kleinen Umgebung von a unendlich viele Folgenglieder liegen. Das unterscheidet Häufungspunkte von Grenzwerten, wo in jeder noch so kleinen Umgebung von a alle bis auf endlich viele Folgenglieder liegen. Ein Punkt a ist genau dann Häufungspunkt einer Folge, wenn es eine Teilfolge gibt, die gegen a konvergiert. Um diese Teilfolge für einen Häufungspunkt a zu konstruieren, setzen wir m1 = 1 und mn+1 = min {n > mn : |a − an | < n1 }. Man beachte, dass die Menge, über die das Minimum genommen wird, eine nicht-leere Teilmenge von N ist, weil a ein Häufungspunkt der Folge der an ist. Umgekehrt ist recht einfach zu zeigen, dass der Grenzwert einer Teilfolge Häufungspunkt der Folge ist. 3.17 Satz: (Bolzano-Weierstraß) Jede beschränkte Folge in R hat einen Häufungspunkt. Beweis: Man konstruiert eine Intervallschachtelung von Intervallen [an , bn ], so dass jedes Intervall unendlich viele Folgenglieder enthält. Der Grenzwert der Intervallschachtelung ist dann Häufungspunkt der Folge. 2 Diese Bedingung wird gerne als Ersatz für unser Axiom III genommen. Aus dem Satz von Bolzano-Weierstraß folgt sofort, dass jede monoton wachsende, beschränkte Folge konvergiert. Denn sie enthält eine konvergente Teilfolge und muss daher selbst konvergieren. 44 KAPITEL 3. KONVERGENZ Die Umkehrung haben wir gerade mit Intervallschachtelung bewiesen. Sie kann aber auch anders beweisen werden. Man kann nämlich zeigen, dass jede Folge eine monotone Teilfolge (wachsend oder fallend) enthält. 3.5 Uneigentliche Grenzwerte Es ist in diesem Zusammenhang sinnvoll ±∞ als Grenzwert zuzulassen. Mit Einschränkungen können wir sogar mit ∞ rechnen. Wir können R allerdings nicht einfach um diese Punkte erweitern, da ∞ − ∞ etc. nicht definiert wäre. 3.18. Definition: Eine Folge von an ∈ R, n ∈ N, konvergiert uneigentlich gegen ∞, wenn es zu jedem (beliebig großen) c > 0 ein Nc ∈ N gibt mit an ≥ c für alle n ≥ Nc . Wir schreiben lim an = ∞. n→∞ Analog definieren wir uneigentliche Konvergenz gegen −∞. Der Zusatz “uneigentlich” wird gelegentlich weggelassen. Uneigentliche konvergente Folgen werden aber, wie alle anderen nicht konvergenten Folgen, als divergente Folgen bezeichnet. 3.19 Satz: (1) Eine Folge an positiver Zahlen konvergiert genau dann uneigentlich gegen ∞, wenn die Folge 1/an gegen 0 konvergiert. (2) an konvergiert genau dann uneigentlich gegen ∞, wenn −an uneigentlich gegen −∞ konvergiert. Beim Rechnen mit Grenzwerten kann man also a a = =0 ∞ −∞ für alle a ≥ 0 setzen. Allerdings kann man nicht 1/0 = ∞ setzen, wie die Folge an = (−1)n n zeigt, deren Kehrwert 1/an nicht einmal uneigentlich konvergiert. Natürlich kann man aber ∞·∞=∞+∞=∞ verwenden. Aber auf keinen Fall darf man einfach ∞ − ∞ = 0 setzen! 3.20. Beispiel: Durch geeignetes Kürzen der Brüche zeigt man n−1 = 1, n→∞ n + 1 lim n−1 = 0, n→∞ n2 + 1 lim n2 − 1 = ∞. n→∞ n + 1 lim 3.6. REIHEN 45 3.21 Satz: Eine Teilmenge M ⊆ R ist genau dann ein Intervall, wenn für alle a, b gilt a, b ∈ M ⇒ [a, b] ⊆ M. Intervalle sind also die einzigen Teilmengen von R, die mit je zwei Punkten auch die Strecke zwischen den Punkten enthalten. Solche Mengen heißen konvexe Mengen. Insbesondere ist der Schnitt von Intervallen wieder ein Intervall. Beweis: Intervalle haben diese Eigenschaft, wie man für jeden Typ von Intervall mit Hilfe der Eigenschaften der Anordnung überprüfen muss. Sei umgekehrt M eine nicht-leere Menge mit dieser Eigenschaft. Dann setzen wir a = inf M, b = sup M, wobei a = −∞ und b = ∞ zugelassen sei. Mit den Randpunkten a und b wird dann ein Intervall I definiert, mit oder ohne Einschluss von a und b. Offenbar gilt dann M ⊆ I. Sei umgekehrt x ∈ I. Falls x = a oder x = b ist, so folgt x ∈ M aus der Konstruktion. Aufgrund der Eigenschaften des Supremums gibt es ansonsten a1 , b1 ∈ M mit a < a 1 < x < b1 < b Es folgt aufgrund der verlangten Eigenschaft von M x ∈ [a1 , b1 ] ⊆ M. 2 Also x ∈ M . 3.6 Reihen 3.22. Definition: Sei ak , k ∈ N, eine Folge in R. Dann kann man die Folge der Partialsummen n X sn = ak k=1 bilden. Diese Folge von immer länger werdenden Summen nennt man eine Reihe. Wenn die Reihe (uneigentlich) konvergiert so schreiben wir für den Grenzwert ∞ X ak := lim k=1 n→∞ n X ak . k=1 Bisweilen wird allerdings für die Reihe selbst, also für die Folge der Partialsummen, diese Notation verwendet, obwohl die Reihe nicht konvergiert. Man nennt dies dann auch eine formale Reihe. 3.23. Beispiel: Ein wichtiges Beispiel ist die geometrische Reihe. Es gilt für |x| ≤ 1 ∞ X k=1 xk = 1 , 1−x und diese Reihe konvergiert auch nur für |x| < 1. 46 3.24 Satz: KAPITEL 3. KONVERGENZ Wenn die Reihe ∞ X ak k=1 konvergiert, so gilt lim ak = 0. k→∞ 3.25. Beispiel: Die Umkehrung ist falsch. Es gilt ∞ X 1 =∞ k k=1 Diese Reihe, die man harmonische Reihe nennt, konvergiert also nicht, sondern nur uneigentlich. Dies beweist man mit Hilfe des Verdichtungskriterium von Cauchy, das besagt, dass für eine monoton fallende Folge a1 ≥ a2 ≥ . . . > 0 von positiven Zahlen die Reihe ∞ X ak k=1 genau dann konvergiert, wenn die Reihe ∞ X 2k a2k k=1 konvergiert. In unserem Beispiel ist die verdichtete Reihe ∞ X 2k k=1 2k =∞ offenbar divergent (uneigentlich konvergent gegen ∞). Die Reihe ∞ X 1 k2 k=1 konvergiert dagegen. Denn ihre Verdichtung ist die geometrische Reihe für x = 1/2. 3.26 Satz: Sei ak , k ∈ N, eine Folge in R. Wenn an monoton fällt und lim ak = 0 k→∞ ist, so konvergiert die alternierende Reihe ∞ X (−1)k ak . k=1 3.7. ABSOLUTE KONVERGENZ 47 Man nennt dieses Konvergenzkriterium das Leibniz-Kriterium. Beweis: Wir betrachten die Folge der geraden und die Folge der ungeraden Partialsummen. s2n = 2n X ak , s2n+1 = k=1 2n+1 X ak . k=1 Es gilt für alle n ∈ N s2n+2 − s2n = a2n+2 − a2n+1 ≤ 0, s2n+1 − s2n−1 = −a2n+1 + a2n ≥ 0, s2n+2 − s2n+1 = a2n+2 ≥ 0. Also s2n−1 ≤ s2n+1 ≤ s2n+2 ≤ s2n Die Folge der ungeraden Partialsummen ist also streng monoton wachsend und beschränkt, und die Folge der geraden Partialsummen ist streng monoton fallend und beschränkt. Beide konvergieren daher gegen denselben Wert. Also konvergiert die Reihe. 2 Es ist wichtig, dass die Reihe monoton fällt. Ein Beispiel ist die nicht konvergente LeibnizReihe mit 1 , k gerade, ak = k 0, k ungerade. 3.7 Absolute Konvergenz 3.27. Definition: Sei ak , k ∈ N, eine reelle Folge. Eine Reihe ∞ X ak k=1 konvergiert absolut, wenn ∞ X |ak | k=1 konvergiert, wenn also ∞ X |ak | < ∞ k=1 gilt. Eine Reihe konvergiert absolut genau dann, wenn die Folge der Partialsummen beschränkt ist. Denn diese Folge ist ja eine monoton wachsende Folge, die genau dann konvergiert, wenn sie beschränkt ist. 48 3.28 Satz: KAPITEL 3. KONVERGENZ Jede absolut konvergente Reihe konvergiert. Ziel dieses Abschnittes ist, diesen Satz zu beweisen. Wir werden dazu den Begriff einer Cauchy-Folge benötigen. 3.29. Definition: Eine Folge sn , n ∈ N, reeller Zahlen heißt Cauchy-Folge, wenn für jedes > 0 ein N ∈ N existiert mit |sn − sm | < für alle n, m > N Äquivalent dazu ist, dass es zu jedem (beliebig kleinen) > 0 ein x ∈ R gibt, so dass alle, bis auf endlich viele Folgenglieder in der -Umgebung von x liegen, d.h. es gibt ein N > 0 mit |x − sn | < für alle n ≥ N . Man bemerke, dass x von abhängt. Dies ist der Unterschied zur Definition des Grenzwertes, und x ist auch nicht unbedingt der Grenzwert der Folge. Es folgt daraus, dass jede konvergente Folge Cauchy-Folge ist. 3.30 Satz: In R konvergiert jede Cauchy-Folge. Beweis: Eine Cauchy-Folge (an )n∈N ist offenbar beschränkt und hat daher einen Häufungspunkt a. Sei > 0 und N/2 wie in der Definition der Cauchy-Folgen. Da a Häufungspunkt ist, existiert ein N ∈ N, N ≥ N mit |aN − a| < 2 Es folgt |an − a| ≤ |an − aN | + |aN − a| < 2 für alle n ≥ N/2 . Damit ist die Konvergenz bewiesen. Dieser Satz, zusammen mit dem Axiom von Archimedes, ist äquivalent zu unserem Vollständigkeitsaxiom. Er ist auch äquivalent dazu, dass alle absolut konvergenten Reihen konvergieren. Beweis: Wir beweisen schließlich den Satz über absolut konvergente Reihen. Die Reihe ∞ X ak k=1 sei absolut konvergent. Man zeigt dann, dass die Folge der Partialsummen eine Cauchy-Folge ist. Denn es gilt für n < m m m m n m n X X X X X X ak − ak = ak ≤ |ak | = |ak | − |ak | . k=1 k=1 k=n+1 k=n+1 k=1 k=1 3.7. ABSOLUTE KONVERGENZ 49 Nun ist konvergiert die absolut genommene Reihe ∞ X |ak | k=1 und die Folge ihrer Partialsummen ist daher eine Cauchy-Folge. Also haben wir nun, dass auch die Folge der Partialsummen der Reihe selbst eine Cauchy-Folge ist und daher konvergiert. 2 3.31 Satz: (Majoranten-Kriterium) Wenn eine Reihe ∞ X ak k=1 absolut konvergiert, und für die Folge bk , k ∈ N, ein K ∈ N existiert mit |bk | ≤ |ak | für alle k ≥ K ∈ N, dann konvergiert auch ∞ X bk k=1 absolut. Man sagt die Reihe majorisiert die andere Reihe. Beweis: Die Folge der Partialsummen sN = N X |bk | ≤ k=K N X |ak |, N ≥ K, k=K 2 ist dann offenbar beschränkt. 3.32. Beispiel: Es gilt n X k=1 n X 1 = k(k + 1) k=1 1 1 − k k+1 =1− 1 n+1 Man bezeichnet solche Summen als Teleskop-Summen. Aus diesem Grund konvergiert die Reihe und es gilt ∞ X 1 = 1. k(k + 1) k=1 Aus dem Majorantenkriterium folgt, dass auch alle Reihen der Form n X σk k=1 k2 50 KAPITEL 3. KONVERGENZ mit beliebigen |σk | ≤ 1 konvergieren. Insbesondere konvergiert die Reihe n X 1 , k2 k=1 für die die Konvergenz allerdings auch aus dem Cauchyschen Verdichtungskriterium folgt. Für σk = (−1)k folgt die Konvergenz (aber nicht die absolute Konvergenz) auch aus dem Leibnizkriterium. Es gilt umgekehrt ein Minoranten-Kriterium. Wenn ak , bk , k ∈ N, reelle Folgen sind mit 0 ≤ ak ≤ bk und für alle k ≥ K ∈ N ∞ X ak = ∞, k=1 so gilt auch ∞ X bk = ∞. k=1 3.33 Satz: Sei ak , k ∈ N, eine Folge in R, ak 6= 0 für alle k ≥ K ∈ N. Wenn es ein q ∈ R gibt, so dass |ak+1 | <q<1 |ak | für alle k ≥ K gilt, so konvergiert die Reihe ∞ X ak k=0 absolut. Dieses Kriterium nennt man das Quotienten-Kriterium für Reihen. Es ist insbesondere erfüllt, wenn |ak+1 | lim <1 k→∞ |ak | ist. Im Fall |ak+1 | lim >1 k→∞ |ak | divergiert die Reihe. Falls der Grenzwert gleich 1 ist, so kann man keine Aussage treffen. 3.34. Beispiel: Die Reihen ∞ X k m xk k=0 konvergieren für alle m ∈ N0 und alle |x| < 1. In diesem Fall gilt nämlich |ak+1 | = |x| < 1. k→∞ |ak | lim Für |x| > 1 kann man auf Divergenz schließen, weil die Glieder der Reihe nicht gegen 0 gehen. Im Vorgriff auf die Diskussion der k-ten Wurzel beweisen wir hier den folgenden Satz. 3.8. DEZIMALBRÜCHE 3.35 Satz: 51 Wenn für eine Folge ak , k ∈ N, ein q ∈ R existiert mit p k |ak | < q < 1 für alle k ≥ K ∈ N, dann konvergiert die Reihe ∞ X ak k=0 absolut. Man nennt dieses Kriterium das Wurzel-Kriterium. Falls der Grenzwerte von p k |ak | existiert, gelten analoge Aussagen wie beim Quotientenkriterium. Der Beweis ist sehr einfach. Aber die Verwendung hängt davon ab, ob man die k-te Wurzel abschätzen kann. 3.8 Dezimalbrüche 3.36. Definition: Eine Reihe der Form bn . . . b0 .a1 a2 a3 . . . := n X bk 10k + k=0 ∞ X ak 10−k k=1 mit ak , bk ∈ {0, 1, . . . , 9} heißt Dezimalentwicklung. Analog gibt es auch die Entwicklung in andere Basen als 10. Alle Dezimalentwicklungen konvergieren, da sie monoton wachsende, nach oben beschränkte Folgen darstellen. Es gilt nämlich mit Hilfe der geometrischen Reihe ∞ X ak 10−k ≤ k=1 ∞ X k=1 9 · 10−k = 9 1 · 1 = 1. 10 1 − 10 Allerdings haben verschiedene Dezimalentwicklungen den gleichen Grenzwert. So gilt etwa ∞ X 9 · 10−k = 0.999 . . . = 1.000 . . . = 1 k=1 3.37 Satz: Zu jedem x > 0 gibt es eine Dezimalentwicklung, die gegen x konvergiert. Dabei kann man verhindern, dass es ein N ∈ N gibt, so dass ak = 9 für alle k ≥ N gilt. Wenn man das tut, ist die Entwicklung sogar eindeutig bestimmt. 52 KAPITEL 3. KONVERGENZ Beweis: Zum Beweis sei zunächst 0 < x < 1. Wir zeigen zunächst die Eindeutigkeit. Sei x= ∞ X ak 10−k . k=1 Dann gilt 10x = a0 + ∞ X ak+1 10−k k=1 und ∞ X ak+1 10 −k ≤ k=1 ∞ X 9 · 10−k = 1. k=1 Wegen der Annahme, dass nicht alle ak+1 = 9 sind, gilt sogar <. Es muss daher gelten a0 = b10xc. a0 ist daher eindeutig bestimmt. Wiederholt man dieses Argument für 10x − a0 , so folgt induktiv, dass alle ak eindeutig bestimmt sind. Um die Darstellung zu erhalten, definieren wir rekursiv x0 = x, und an+1 = b10xn c, xn+1 = 10xn − an+1 . Es gilt dann an ∈ {0, 1, . . . , 9} für alle n ∈ N. Außerdem zeigt man per Induktion x = a1 10−1 + . . . + an 10−n + xn 10−n . Wegen 0 ≤ xn < 1 konvergiert diese Folge mit n → ∞. Wir erhalten, wie gewünscht, x= ∞ X ak 10−k . k=1 Für x > 1 finden wir ein minimales n ∈ N mit x < 10n . Gemäß dem schon bewiesenen Teil existieren ãk ∈ {0, . . . , 9} mit ∞ X 10−n x = ãk 10−k . k=1 n Multiplikation der Summe mit 10 ergibt die gewünschte Darstellung. Die Eindeutigkeit der Darstellung zeigt man auf die gleiche Weise. 2 Aus dem Satz folgt sofort, dass die Menge der rationalen Zahlen dicht in R ist. Mit Hilfe dieses Satzes kann man aber auch beweisen, dass die Menge der reellen Zahlen überabzählbar ist (Cantorsches Diagonal-Argument). 3.38 Satz: Die Menge der reellen Zahlen R ist nicht abzählbar. 3.9. KOMPLEXE FOLGEN UND REIHEN 53 Beweis: Sonst müsste auch ]0, 1[ abzählbar sein. Sei xn = ∞ X ak,n 10−k k=1 mit ak,n ∈ {0, . . . , 9} eine Abzählung, wobei wir die unendliche Wiederholung von 9 für jedes xn vermeiden. Wir setzen ( 1, ak,k = 6 1 ak = 2, ak,k = 1. und x= ∞ X ak 10−k . k=1 Dann ist x 6= xn für alle n ∈ N. Aber x ∈ ]0, 1[. 3.9 2 Komplexe Folgen und Reihen 3.39. Definition: In einen metrischen Raum M mit Metrik d definieren wir die Konvergenz der Folge (xn )n∈N gegen x durch xn → x ⇔ d(xn , x) → 0. Wir definieren, dass (xn )n∈N Cauchy-Folge sein soll, wenn es zu jedem > 0 ein N ∈ N gibt mit d(xn , xm ) < für alle n, m ≥ N . Im Folgenden sei C mit der Metrik d(z, w) := |z − w| ausgestattet. 3.40 Satz: (1) Sei (zn )n∈N eine Folge in C. Dann gilt zn → z ⇔ Re (zn ) → Re (z) und Im (zn ) → Im (z) In C hat jede beschränkte Folge eine Häufungspunkt. (2) Eine komplexe Folge ist genau dann Cauchy-Folge, wenn die Folge der Realteile und die Folge der Imaginärteile Cauchy-Folgen in R sind. In C konvergiert jede Cauchy-Folge. Beweis: Der Beweis von (1) folgt aus den Abschätzungen |Re (zn ) − Re (z)| ≤ |zn − z|, |Im (zn ) − Im (z)| ≤ |zn − z|, sowie |zn − z| = Analog folgt die Aussage (2). p |Re (zn ) − Re (z)|2 + |Im (zn ) − Im (z)|2 . 2 Einen metrischen Raum, in dem jede Cauchy-Folge konvergiert, heißt vollständiger metrischer Raum. 54 KAPITEL 3. KONVERGENZ 3.41 Satz: In C konvergiert jede absolut konvergente Reihe. Es gilt das MajorantenKriterium, das Quotienten-Kriterium und das Wurzel-Kriterium für Reihen. Die Beweise sind eigentlich nur Wiederholungen derselben Beweise für R. 3.42. Definition: Wir definieren exp(z) := ∞ X zk k=0 k! für alle z ∈ C. Diese Reihe konvergiert für alle z ∈ C absolut. Wir nennen diese Funktion die Exponentialfunktion. 3.43 Satz: (Umordnungssatz für Reihen) Sei ∞ X ak k=1 eine absolut konvergente Reihe in C oder R und π:N→N bijektiv. Dann konvergiert auch ∞ X aπ(k) k=1 absolut. Außerdem gilt ∞ X ∞ X ak = aπ(k) . k=1 k=1 Beweis: Die absolute Konvergenz folgt einfach aus N X |aπ(k) | ≤ k=1 für alle N ∈ N. Sei s= ∞ X |ak | < ∞ k=1 ∞ X ak , k=1 sπ = ∞ X aπ(k) . k=1 Um s = sπ zu zeigen, wählen wir zu > 0 ein K ∈ N mit ∞ X k=K+1 |aπ(k) | < 3.9. KOMPLEXE FOLGEN UND REIHEN 55 Nun gilt für M ≥ max{π(a1 ), . . . , π(aK )} die Abschätzung M ∞ K X X X ak − |aπ(k) | < aπ(k) ≤ k=1 k=K+1 k=1 Also, mit M → ∞, |s − K X aπ(k) | < k=1 Daraus folgt mit K → ∞ |s − sπ | < . 2 Da dies für alle > 0 gilt, folgt s = sπ . Die absolute Konvergenz ist hier notwendig. Wenn eine Reihe konvergiert, aber nicht absolut konvergiert, so kann man sie so umordnen, dass sie gegen jeden Wert s ∈ R konvergiert. 3.44 Satz: Seien n X a= ak , b= k=0 n X bk k=1 absolut konvergente Reihen. Dann konvergiert auch das Cauchy-Produkt ! ∞ ∞ k X X X al bk−l = (a0 bN + . . . + aN b0 ), k=0 N =0 l=0 und zwar gegen das Produkt ab. Beweis: Die Folge sN = N X ! |ak | · k=0 N X ! |bk | k=0 X = |ak bl | 0≤k,l≤N konvergiert. Aus dem Umordnungssatz folgt, dass jede Reihe die alle Produkte ak bl enthält, absolut konvergiert. Insbesondere konvergiert das Causchy-Produkt absolut. Nun gilt tN = N X k=0 ! ak · N X ! bk = k=0 X ak bl → ab. 0≤k,l≤N Es folgt tN +1 = t0 + N X n=0 (tn+1 − tn ) = a0 b0 + N X (a0 bn + . . . + an bn + . . . + an b0 ) → ab n=1 Das Cauchy-Produkt ist nun eine Umordnung dieser Reihe und konvergiert daher gegen denselben Grenzwert. 2 56 KAPITEL 3. KONVERGENZ 3.45 Satz: Für die Exponentialfunktion gilt exp(z + w) = exp(z) · exp(w) für alle z ∈ C. Beweis: Wir bilden das Cauchy-Produkt der Exponentialreihe für z und w. ez ew = k ∞ X k ∞ ∞ X X z l wk−l 1 X k l k−l X (z + w)k = zw = = ez+w . l!(k − l)! k! l k! k=0 l=0 l=0 k=0 k=0 2 Dies ist die fundamentale Identität der Exponentialfunktion. Aufgrund der Definition gilt exp(0) = 1, und exp(x) > 1 + x für alle x > 0. (1) Außerdem haben wir exp(x) · exp(−x) = exp(0) = 1 und daher exp(x) 6= 0 für alle x ∈ R, sowie exp(−x) = 1 . exp(x) Damit und mit (1) folgt sofort exp(x) > 0 für alle x ∈ R. lim exp(x) = ∞, x→∞ lim exp(x) = 0. x→−∞ Außerdem ist exp streng monoton steigend. Denn es gilt für x1 < x2 exp(x2 ) = exp(x1 ) · exp(x2 − x1 ) > exp(x1 ) wegen exp(x2 − x1 ) > 1. Wir werden später zeigen, dass exp(1) = e = lim n→∞ 1+ 1 n n gilt, obwohl man das mit der Binomialentwicklung des Produkts (1 + 1/n)n auch direkt beweisen kann. Wir schreiben dann auch ez := exp(z). Für n ∈ Z folgt, dass diese Definition mit der alten Definition von en übereinstimmt. Kapitel 4 Stetigkeit Wir erweitern nun den Konvergenzbegriff auf Funktionen und werden dadurch in die Lage versetzt, den Begriff “Stetigkeit” exakt zu fassen. Dieser Begriff wird in der Schule meist anschaulich anhand der fehlenden Sprünge im Funktionsgraphen beschrieben. Abbildung 4.1: Stetigkeit und Unstetigkeit In der Abbildung ist die Funktion für x = −1 stetig. Für x = 0 hat sie einen Grenzwert von rechts und einen anderen Grenzwert von links. In x = 1 hat sie nur einen Grenzwert von rechts. 4.1 Grenzwert von Funktionen Der Grenzwert einer Funktion bei Annäherung an einen Punkt kann mit Hilfe von Folgen oder mit dem -δ-Kriterium beschrieben werden. Wenn M der Definitionsbereich der Funktion ist, so wollen wir allerdings nur Grenzwerte in Punkten definieren und berechnen, die in M oder am Rand von M liegen. 4.1. Definition: Ein Punkt a liegt im Abschluss einer Menge M ⊆ R, wenn es eine 57 58 KAPITEL 4. STETIGKEIT Folge in M gibt, die gegen a konvergiert. Die Menge aller Punkt im Abschluss heißt die abgeschlossene Hülle von M . Sie wird mit M oder besser mit closure (M ) bezeichnet. M heißt abgeschlossen, wenn M = closure (M ) gilt. Für uns sind zunächst hauptsächlich Intervalle interessant. Dort gilt zum Beispiel closure (]a, b[) = [a, b]. Die Randpunkte a, b liegen also im Abschluss des offenen Intervalls, aber nicht im offenen Interval selbst 4.2. Definition: (1) Sei M ⊆ R und f :M →R eine Funktion. Sei a im Abschluss von M . Dann heißt b der Grenzwert von f bei Annäherung an a, in Zeichen b = lim f (x), x→a wenn für jede Folge (an )n∈N mit Elementen an ∈ M gilt, dass lim an = a ⇒ lim f (an ) = b. n→∞ n→∞ (2) Die Funktion f heißt stetig in a ∈ M , wenn lim f (x) = f (a) x→a gilt. Es muss also für jede Folge (an )n∈N mit Elementen an ∈ M gelten lim an = a ⇒ lim f (an ) = f (a). n→∞ n→∞ Die Funktion f heißt stetig in M , wenn sie in allen Punkten a ∈ M stetig ist. (3) Man sagt auch einfach, eine Funktion f : D → R sei stetig. Damit ist gemeint, dass f auf dem Definitionsbereich D von f stetig ist. Abbildung 4.2: y = sign(x) 4.1. GRENZWERT VON FUNKTIONEN 59 4.3. Beispiel: Die Funktion f (x) = x2 , f : R → R, ist stetig. Denn es gilt nach den Regeln für Grenzwerte an → a ⇒ a2n → a2 = f (a). Die Funktion sign : R → R, die durch −1, sign(x) = 0, 1, x < 0, x = 0, x>0 definiert ist, ist in x = 0 nicht stetig. Denn es gibt Folgen (an )n∈N , die gegen 0 konvergieren, für die aber f (an ) nicht gegen 0 konvergiert. 4.4 Satz: Sei f : M → R eine Funktion, und a im Abschluss von M ⊆ R. Genau dann ist f stetig in a, wenn es zu jedem > 0 ein δ > 0 gibt, so dass für alle x ∈ M gilt |x − a| < δ ⇒ |f (x) − f (a)| < . Man nennt dieses Kriterium -δ-Kriterium. Beweis: Nehmen wir an, f sei stetig in a. Sei weiter > 0. Wenn es nun kein δ > 0 mit der gewünschten Eigenschaft gibt, dann existiert für jedes n ∈ N ein xn ∈ M mit |xn − a| < 1 , n |f (xn ) − f (a)| ≥ . Denn δ = 1/n erfüllt das Kriterium ja für kein n ∈ N. Also xn → a, f (xn ) 6→ f (a). Dies ist ein Widerspruch zur angenommenen Stetigkeit von f . Es gelte umgekehrt das -δ-Kriterium, und an → a für eine Folge mit an ∈ M . Sei > 0. Dann existiert δ > 0 gemäß dem Kriterium. Es existiert dann ein N = N (δ ) ∈ N, so dass |an − a| < δ für alle n ≥ N gilt. Folglich gilt |f (an ) − f (a)| < für alle n ≥ N Damit haben wir zu > 0 ein N (abhängig von ) gefunden, wie es in der Definition der Konvergenz der Folge von f (an ) gegen f (a) gefordert wird. Also f (an ) → f (a). 2 4.5. Beispiel: Das -δ-Kriterium ist in gewisser Weise konstruktiver. Man kann oft für Funktion bei gegebenem > 0 einen möglichst großen Wert für δ > 0 durch Rechnen bestimmen. Als einfaches√Beispiel wählen wir f (x) = x2 , f : R → R. Für a = 0 und > 0 wählt man einfach δ = . Wir haben dann wie gewünscht √ |x − 0| = |x| < δ = ⇒ |f (x) − f (0)| = x2 < . 60 KAPITEL 4. STETIGKEIT Sei nun a = 2. Es gilt |f (x) − f (a)| = |x2 − a2 | = |x + a| · |x − a|. Dann gilt für |x − 2| < 1 sicher |x + 2| < 5. Es folgt die Ungleichung |f (x) − f (2)| ≤ 5|x − 2|. Man kann also zu > 0 δ = min{ , 1} 5 wählen. Dann gilt für |x − 2| < δ ≤ 1 sicher |x + 2| < 3 und daher |f (x) − f (2)| < 5δ ≤ . Sei f : M → R eine Funktion und a ∈ M . Dann definieren wir in nahe liegender Weise lim x→a,x6=a f (x). f ist genau dann stetig, wenn dieser Grenzwert gleich f (a) ist. 4.6 Satz: Man kann auch beim Grenzwert von Funktionen “+”, “−” und “·” mit dem Limes vertauschen. Also lim (f (x) ± g(x)) = lim f (x) ± lim g(x) x→a x→a x→a lim (f (x) · g(x)) = lim f (x) · lim g(x) x→a x→a x→a Der Grenzwert auf der linken Seite existiert, falls die Grenzwerte auf der rechten Seite existieren. Falls g(x) 6= 0 für alle x ∈ M ist, und auch der Grenzwert bei Annäherung an a nicht 0 ist, so gilt lim f (x) f (x) lim = x→a x→a g(x) lim g(x) x→a Beweis: Der Satz folgt unmittelbar aus dem Satz für Summen, Differenzen, Produkte und Quotienten von Folgen. 2 Wenn lim g(x) 6= 0 x→a ist, so gibt es aufgrund des -δ-Kriteriums eine -Umgebung von x, wo g(x) 6= 0 ist. Da es beim Grenzübergang im Wesentlichen nur auf diese Umgebung ankommt, so gilt dann also die Aussage des Satzes über den Quotienten von Funktionen. Es folgt, dass Summen, Differenzen, Produkte und Quotienten von stetigen Funktionen stetig sind. Bei Quotienten f /g muss man beachten, dass sie nur stetig sind, wo g(x) 6= 0 ist. 4.1. GRENZWERT VON FUNKTIONEN 61 Es ist einfach zu zeigen, dass die Hintereinanderausführung von stetigen Funktionen stetig ist. Denn offenbar lim f (g(x)) = f lim g(x) = f (g(a)), x→a x→a falls g in a und f in g(a) stetig sind. 4.7. Beispiel: (1) Seien a < b < c und f : ]a, b[ → R g : ]b, c[ → R stetig. Dann gibt es genau dann eine stetige Fortsetzung von f und g auf das Intervall ]a, c[, wenn lim f (x) = lim g(x) x→b x→b ist. Dabei handelt es sich eigentlich um einseitige Grenzwerte, was man auch durch lim f (x) = lim g(x) x↑a x↓a andeutet. Auf diese Weise kann man stückweise gegebene stetige Funktionen zu einer stetigen Funktion zusammensetzen, wenn die Übergänge die richtigen Grenzwerte aufweisen. (2) Ebenso ist jede Funktion f : M → R in a ∈ M stetig, wenn lim f (x) = lim f (x) x↑a x↓a gilt. (3) Wenn eine Funktion in a nicht definiert ist, so kann man sie stetig nach a im Abschluss von M eindeutig fortsetzen, wenn lim f (x) x→a existiert. 4.8. Definition: (1) Ganz analog zu den Folgen definieren wir uneigentliche Grenzwerte von Funktionen. Es gilt also lim f (x) = ∞ x→a genau dann, wenn es zu jedem c > 0 ein > 0 gibt mit |x − a| < ⇒ f (x) > c. Ganz analog zu den einseitigen Grenzwerten definieren wir auch die uneigentlichen einseitigen Grenzwerte lim f (x) = ∞, lim f (x) = ∞. x↑a x↓a Ebenso definieren wir in naheliegender Weise die uneigentlichen Grenzwerte gegen −∞. (2) In nahe liegender Weise definieren wir Grenzwerte für x → ∞, wenn es eine Folge im Definitionsbereich gibt, die gegen ∞ konvergiert. Die Aussage lim f (x) = ∞ x→∞ 62 KAPITEL 4. STETIGKEIT Abbildung 4.3: Die Funktion f (x) = 1/x, f : R \ {0} → R. bedeutet also, dass es zu jedem c > 0 ein d > 0 gibt mit x ≥ d ⇒ f (x) ≥ c. 4.9. Beispiel: Es gilt (uneigentlich) 1 = −∞ x↑a x − a 1 lim =∞ x↓a x − a lim Aber lim x→a 1 = ∞. (x − a)2 Zum Beweis schätzt man etwa ab 1 1 |x − 0| < c = √ ⇒ 2 > c. x c Damit ist zu c > 0 ein c > 0 gefunden, das der Definition der uneigentlichen Konvergenz genügt. Allgemein gilt 1 lim = x→a (x − a)k ( ∞, −∞, Analog lim xk = ∞ x→∞ k gerade, k ungerade. 4.2. RATIONALE FUNKTIONEN 63 für alle k ∈ N und ( k lim x = x→−∞ 4.2 ∞, −∞, k gerade, k ungerade. Rationale Funktionen Polynome sind die einfachsten Funktionen. Zur Auswertung muss man lediglich addieren und multiplizieren. Bei rationalen Funktion kommt eine Division dazu. 4.10. Definition: (1) Ein reelles Polynom ist eine Funktion der Form n p(x) = a0 + a1 x + . . . + an x = n X a k xk . k=0 mit a0 , . . . , an ∈ R. Wenn an 6= 0 ist, so heißt n der Grad von p und wird mit deg(p) bezeichnet. (2) Eine reelle rationale Funktion ist der Quotient zweier reeller Polynome r(x) = p(x) . q(x) und ist definiert in allen Punkten, in denen q(x) 6= 0 ist. Die Koeffizienten eines Polynoms, und damit auch sein Grad, sind eindeutig bestimmt. Sei nämlich an xn + . . . + a1 x + a0 = ãn xn + . . . + ã1 x + ã0 für alle x ∈ R, so folgt an + an−1 a0 ãn−1 ã0 + . . . + n = ãn + + ... + n x x x x für alle x ∈ R, x 6= 0. Nimmt auf beiden Seiten den Grenzwert x → ∞, so folgt an = ãn . Per Induktion folgt die Behauptung. 4.11 Satz: Polynome sind überall stetig. Ein reelles Polynom p hat höchstens deg(p) Nullstellen. Man kann die Nullstellen aus p ausdividieren und erhält ein Polynom p̃ ohne Nullstellen, also p(x) = (x − x1 ) · . . . · (x − xk )p̃(x) für alle x ∈ R wobei x1 , . . . , xk Nullstellen von p sind, und deg(p̃) = deg(p) − k. Dabei können Nullstellen mehrfach vorkommen, also mit höherer Vielfachheit. 64 KAPITEL 4. STETIGKEIT Beweis: Wir zeigen per Induktion nach n zunächst, dass sich eine Nullstelle a ∈ R eines Polynoms p vom Grad n aus dem Polynom ausdividieren lässt. Wir müssen dazu nachweisen, dass es ein Polynom pn+1 vom Grad n − 1 gibt mit p(x) = (x − a)p̂(x) für alle x ∈ R Sei p wie in der Definition und p(a) = 0. Dann ist q(x) = p(x) − an xn−1 (x − a) ein Polynom vom Grad n − 1 und es gilt q(a) = 0. Falls n = 1 ist, so ist q konstant gleich 0 und p(x) = an (x − a) wie verlangt mit q̃(x) = an . für n > 1 haben wir nach Induktionsvoraussetzung p(x) = q(x) + an xn+1 (x − a) = q̃(x)(x − a) + an xn−1 (x − a) mit einen Polynom q vom Grad n − 2. Es folgt die Behauptung mit p̂(x) = q(x) + an xn+1 . Per Induktion folgt nun, dass es in der Tat ein p̃ ohne Nullstellen gibt, wie es im Satz verlangt wird. Angenommen, p hat n Nullstellen x1 , . . . , xn . Dann haben wir nach dem bisher Bewiesenen p(x) = an (x − x1 ) . . . (x − xn ). Das Polynom hat also keine weiteren Nullstellen. 2 Rationale Funktion sind stetig in allen Punkten, in denen sie definiert sind. 4.12 Satz: Dann gilt (1) Sei p ein Polynom mit höchstem Koeffizienten an > 0 und Grad n > 0. lim p(x) = ∞, x→∞ und ( lim p(x) = x→−∞ ∞ −∞ falls n gerade ist, falls n ungerade ist. (2) Sei r = p/q eine rationale Funktion, p(a) > 0 und a eine Nullstelle der Vielfachheit k von q. Dann gilt lim r(x) = ∞ x↓a und ( ∞ lim r(x) = x↑a −∞ falls k gerade ist, falls k ungerade ist. Wenn auch der Zähler p(x) eine Nullstelle in a hat, so muss man zunächst die rationale Funktion kürzen. 4.3. DER ZWISCHENWERTSATZ 65 Beweis: Wir haben also p(x) = an xn + . . . + a1 x + a0 mit an > 0, n > 0. Folglich lim x→∞ p(x) = an > 0. xn Also gibt es ein d > 0, so dass für x > d p(x) an ≥ > 0. xn 2 Das heißt p(x) ≥ cxn für ein c > 0 und alle x > d. Da aber lim cxn = ∞ x→∞ für alle c > 0 gilt, folgt somit auch lim p(x) = ∞. x→∞ Für x → −∞ ist der Beweis analog. Für (2) schreiben 1 1 = q(x) (x − a)k q̃(x) mit einem Polynom q̃(x) mit q̃(a) 6= 0. Die Behauptung folgt dann ebenfalls. 4.3 2 Der Zwischenwertsatz Der folgende Satz ist eines der wesentlichen Hilfsmittel in der Analysis. 4.13 Satz: Sei f : [a, b] → R stetig c ∈ R und f (a) ≤ c ≤ f (b). Dann existiert ein ξ ∈ [a, b] mit f (ξ) = c. Dieser Satz heißt Zwischenwertsatz. Beweis: Der Beweis kann konstruktiv durch eine Intervallschachtelung zur Berechnung von ξ geführt werden. Ausgehend von [a0 , b0 ] = [a, b] 66 KAPITEL 4. STETIGKEIT konstruiert man Intervalle [an , bn ] mit den Eigenschaften f (an ) ≤ c, f (bn ) ≥ c, [an+1 , bn+1 ] ⊆ [an , bn ], bn − an bn+1 − an+1 = . 2 Nach dem Satz 3.13 über die Intervallschachtelungen gibt es einen gemeinsamen Grenzwert ξ von an und bn . Da f stetig ist, folgt lim f (an ) = lim f (bn ) = f (ξ), n→∞ n→∞ und daraus folgt f (ξ) = lim f (an ) ≤ c, n→∞ f (ξ) = lim f (bn ) ≥ c, n→∞ 2 also f (ξ) = c. Natürlich gilt dasselbe auch im Fall f (a) ≥ c ≥ f (b). 4.14 Satz: Das stetige Bild eines Intervalls ist ein Intervall. Beweis: Sei f : I → R stetig, und J = f (I). Seien nun d1 , d2 ∈ J mit d1 < d2 , also etwa f (a1 ) = d1 , f (a2 ) = d2 , a1 , a2 ∈ I. Wir zeigen [d1 , d2 ] ⊆ J, woraus gemäß Satz 21 die Behauptung folgt. Sei dazu c ∈ [d1 , d2 ]. Wir können a1 < a2 annehmen. Dann gilt [a1 , a2 ] ⊂ I, weil I ein Intervall ist. f ist also auf [a1 , a2 ] definiert und stetig. Aus dem Zwischenwertsatz folgt sofort, dass ein ξ ∈ [a1 , a2 ] existiert mit f (ξ) = c. Folglich gilt c ∈ f (I) = J. 2 4.15 Satz: Sei I ein Intervall in R, und f : I → R streng monoton (wachsend oder fallend) und stetig. Dann gibt es eine Umkehrfunktion f −1 : f (I) → I, die ebenfalls stetig ist. Wenn I ein offenes Intervall ist, so ist f (I) ebenfalls ein offenes Intervall, und wenn I ein abgeschlossenes, beschränktes Intervall ist, so gilt das auch für f (I). 4.3. DER ZWISCHENWERTSATZ 67 Beweis: Da eine streng monotone fallende bzw. wachsende Funktion injektiv ist, existiert f −1 auf f (I), und diese Funktion ist ebenfalls streng monoton fallend bzw. wachsend. Wir wissen auch, dass f (I) ein Intervall ist. Wir können uns auf streng monoton wachsende Funktionen beschränken. Sei > 0. Falls f (x) = y ist und x im Innern von I, so gilt wegen der strengen Monotonie von f f (x − ) < y = f (x) < f (x + ). Wir wählen ein δ > 0, so dass f (x − ) < y − δ < y = f (x) < y + δ < f (x + ). Es folgt für alle ỹ ∈ f (I) |ỹ − y| < δ ⇒ f (x − ) < ỹ < f (x + ) ⇒ x − < f −1 (ỹ) < x + ⇒ |f −1 (ỹ) − x| < Falls x der rechte Randpunkt von I ist, so wählen wir δ > 0 mit f (x − ) < y − δ < y = f (x) Analog, falls x der linke Randpunkt von I ist. Der Beweis geht in diesen Fällen analog. Sei I ein offenes Intervall. Dann sind alle Punkte inneren Punkte von I und aus den obigen Überlegungen folgt, dass auch J = f (I) ein offenes Intervall ist. Sei I = [a, b] ein abgeschlossenes und beschränktes Intervall. Dann gilt aufgrund des Zwischenwertsatzes und der Monotonie f (I) = [f (a), f (b)]. Also ist auch das Bild ein abgeschlossenes und beschränktes Intervall. Abbildung 4.4: f (x) = (x2 − 1)/(x2 + 1) 2 68 KAPITEL 4. STETIGKEIT 4.16. Beispiel: Die Funktion x2 − 1 x2 + 1 ist in [0, ∞[ stetig und streng monoton wachsend. Es gilt f (x) = f ([0, ∞[) = [−1, 1[ Die Umkehrfunktion berechnet sich zu f −1 r (y) = 1+y . 1−y für alle −1 ≤ y < 1. 4.17. Beispiel: (1) Die Funktionen f (x) = xn sind auf [0, ∞[ monoton wachsend und stetig. Außerdem gilt f (0) = 0, sowie lim f (x) = ∞. x→∞ Es folgt f [0, ∞[ = [0, ∞[. Also gibt es eine Umkehrfunktion, die wir als n-te Wurzel bezeichnen. Wir schreiben √ n y = y 1/n := f −1 (y). (2) Die Funktion f (x) = x3 − x ist auf [1, ∞[ streng monoton wachsend. Aber die Umkehrfunktion f −1 : [0, ∞[→ [1, ∞[ ist nicht so leicht zu berechnen (Formel von Cardano). 4.4 Extrema von Funktionen Für die Praxis ist oft wichtig zu wissen, wo eine Funktion maximal wird. Man rechnet solche Maxima mit Ableitungen aus. Aber ihre Existenz wollen wir schon hier beweisen. 4.18. Definition: Sei f : M → R eine Funktion (M eine beliebige Menge). Dann heißt a ∈ M Maximalpunkt von f , wenn f (a) ≥ f (x) für alle x ∈ M gilt. Der Wert f (a) = max f (M ) wird als Maximum von f auf M bezeichnet. Falls M ⊆ R ist, so heißt a lokaler Maximalpunkt, wenn f Maximalpunkt auf einer Umgebung von a U (a) ∩ M ist (für ein > 0). Analog definieren wir (lokale) Minima. Die Minima und Maxima zusammengenommen nennt man Extrema von f . 4.5. STETIGKEIT IN METRISCHEN RÄUMEN 69 4.19 Satz: (1) Sei M abgeschlossen und beschränkt, sowie f : M → R stetig in M . Dann besitzt f einen Maximalpunkt und einen Minimalpunkt in M . (2) Das stetige Bild eines abgeschlossenen, beschränkten Intervalls [a, b] ist ein abgeschlossenes, beschränktes Intervall [c, d]. Beweis: Sei s = sup f (M ), wobei eventuell s = ∞ ist. Dann existiert eine Folge (xn )n∈N mit lim f (xn ) = s. n→∞ Im Fall von s = ∞ ist dieser Grenzwert uneigentlich. Weil M beschränkt ist, ist die Folge beschränkt und hat eine konvergente Teilfolge (xk(n) )n∈N , die gegen ein x ∈ M konvergiert, weil M abgeschlossen ist. Es folgt aus der Stetigkeit von f f (x) = lim f (xk(n) ) = s. n→∞ Also ist s < ∞ und x ist Maximalpunkt von f auf M , weil f (x) das Supremum von f (M ) ist. Zum Beweis von (2) beachten wir, dass das stetige Bild eines Intervalls nach Satz 4.13 ein Intervall ist, das nach dem Teil (1) sein Supremum und sein Infimum enthalten muss. 2 Wenn M diese Bedingungen nicht erfüllt ist, so braucht kein Extremalpunkt zu existieren, selbst wenn f stetig ist. Beispielsweise hat die rationale Funktion f (x) = x2 − 1 x2 + 1 zwar den Minimalpunkt 0, aber keinen Maximalpunkt, obwohl f (R) sogar beschränkt ist. Es gilt nämlich f (R) = [−1, 1[. 4.5 Stetigkeit in metrischen Räumen Wir erinnern an die Definition einer Metrik aus 1.18. Die Definition der Stetigkeit und des Grenzwertes von Funktionen lässt sich unmittelbar auf metrische Räume, und insbesondere auf C übertragen. 4.20. Definition: Seien A, B metrische Räume, deren Metriken wir beide mit d bezeichnen, sowie a ∈ A. Dann ist f : A → B in a ∈ A stetig genau dann, wenn für jedes > 0 ein δ > 0 existiert mit d(x, a) < δ ⇒ d(f (x), f (a)) < . 70 KAPITEL 4. STETIGKEIT Der Abschluss M einer Teilmenge M ⊆ A ist die Menge aller möglichen Grenzwerte von Folgen aus M . Wenn a ∈ M ist, so definieren wir b ∈ B als Grenzwert b = lim f (x) x→a genau dann, wenn die Funktion f stetig auf M ∪ {a} mit f (a) = b erweiterbar ist. Die Konvergenz kann äquivalent durch Folgen definiert werden. Dazu muss für jede Folge (xn )n∈N gelten xn → a ⇒ f (xn ) → b. 4.21. Beispiel: Sei A ⊆ C. Dann ist f : A → C genau dann stetig, wenn die Funktionen Re (f ), Im (f ) : A → R stetig sind. Man beachte allerdings, dass zn → z in C bedeutet, dass sich die komplexen Zahlen “aus allen Richtungen” an z annähern können. Auch in C nimmt jede stetige Funktion f : C → R auf einer abgeschlossenen und beschränkten Menge ihre Extrema an. Wir werden darauf aber erst später eingehen. Kapitel 5 Die Ableitung Wir sind nun in der Lage, das von Newton und Leibniz entdeckte Kalkül der Analysis, nämlich die Ableitung, exakt zu fassen. Die Rechenregeln (Calculus) der Differenzialrechung und ihrer Umkehrung, der Intergralrechung, sind es, die die Analysis so mächtig machen. Abbildung 5.1: f (x) = x2 und Tangente in x = 1 5.1 Differenzierbarkeit Anschaulich ist die Ableitung einer reellen Funktion in einem Punkt a die Steigung der Tangenten am Funktionsgraph im Punkt (a, f (a)). Wir fassen diesen Gedanken in der folgenden 71 72 KAPITEL 5. DIE ABLEITUNG Definition exakt. Dazu bemerken wir, dass die Steigung der Geraden durch die Punkte (x, f (x)), (t, f (t)), die beide auf dem Funktionsgraphen von f liegen, gleich f (t) − f (x) ∆y = t−x ∆x ist (siehe Abbildung). Diese Steigung wird als Sekantensteigung bezeichnet und die Gerade als Sekante (Schneidende). Geht dann t → x, so wird die Sekante zur Tangente (Berührende). Abbildung 5.2: Sekante und Tangente (x = 0.1, t = 0.15) 5.1. Definition: (1) Sei f : I → R eine Funktion, I ein offenes Intervall. Dann heißt der Grenzwert f (t) − f (x) f 0 (x) := lim t→x,t6=x t−x für x ∈ I die Ableitung von f in x, falls er existiert. In diesem Fall heißt f differenzierbar in x. Wir schreiben auch d f (x) = f 0 (x). dx Diese Schreibweise ist insbesondere dann praktisch, wenn für f (x) ein Rechenausdruck in x gesetzt wird. 5.1. DIFFERENZIERBARKEIT 73 (2) Falls f überall in I differenzierbar ist, so heißt f differenzierbare Funktion. Falls dann die Ableitungsfunktion f 0 stetig ist, so heißt f stetig differenzierbar. (3) Falls f 0 wieder in x differenzierbar ist, so schreibt man für die Ableitung f 00 (x) oder f 00 (x) = d2 f (x). dx2 f heißt in diesem Fall zweimal differenzierbar, und f 00 heißt die zweite Ableitung von f . Analog definieren wir n-mal (stetig) differenzierbare Funktionen, und schreiben für die Ableitung f (n) . (4) In nahe liegender Weise definieren wir die einseitige Ableitung für eine Funktion f : [a, b] → R in a und b, als f 0 (a) = f (x) − f (a) , x↓a,x6=a x−a lim f 0 (b) = f (x) − f (b) . x↑b,x6=b x−b lim Bisweilen werden diese einseitigen Ableitungen als 0 f+ (a), 0 f− (b) gekennzeichnet. 5.2 Satz: Jede in einem Punkt differenzierbare Funktion ist stetig in diesem Punkt. Beweis: Da die Sekantensteigung in x stetig durch f 0 (x) fortsetzbar ist, muss sie beschränkt sein. Also existiert ein > 0 und ein C > 0 mit f (t) − f (x) t−x ≤C für alle t mit |x − t| < , wo f (t) definiert ist. Es folgt |f (t) − f (x)| ≤ C|t − x| für solche t. Daraus folgt die Stetigkeit von f in x. 2 Die Umkehrung ist falsch, wie schon die Funktion |x| zeigt. Ableitungen bekommen nun ihre Mächtigkeit dadurch, dass man sie leicht algebraisch ausrechnen kann. 5.3 Satz: Seien f, g : I → R differenzierbare Funktionen, I ein offenes Intervall, x ∈ I. Dann ist auch f ± g und f · g in x differenzierbar und es gilt d (f (x) ± g(x)) = f 0 (x) ± g 0 (x), dx d (f (x) · g(x)) = f 0 (x)g(x) + f (x)g 0 (x). dx 74 KAPITEL 5. DIE ABLEITUNG Falls g(x) 6= 0, so ist auch f /g in x differenzierbar und es gilt d f (x) g(x)f 0 (x) − f (x)g 0 (x) . = dx g(x) g(x)2 Der Satz gilt auch für einseitige Ableitungen. Beweis: Die Regel für die Summen und Differenzen ist leicht zu beweisen. Wir beweisen die Produktregel. Es gilt für t ∈ I f (t)g(t) − f (x)g(x) g(t) − g(x) f (t) − f (x) = f (t) + g(x) . t−x t−x t−x Für t → x folgt die Behauptung aus der Differenzierbarkeit von f und g und der Stetigkeit von f in x. Wir beweisen nun die Quotientenregel. Dazu genügt es wegen der Produktregel, die Funktion 1/g(x) abzuleiten. Für t ∈ I, g(t) 6= 0, gilt 1 g(x) − g(t) 1 g(t) − g(x) 1/g(t) − 1/g(x) = =− . t−x g(t)g(x) t−x g(t)g(x) t−x Man beachte, dass es wegen der Stetigkeit von g und g(x) 6= 0 eine -Umgebung von x gibt, wo g(t) 6= 0 ist. Für t → x folgt d 1 g 0 (x) =− . dx g(x) g(x)2 Die Quotientenregel folgt nun aus der Produktregel wegen d 1 1 g 0 (x) f 0 (x)g(x) − f (x)g 0 (x) f (x) = f 0 (x) − f (x) = . 2 dx g(x) g(x) g(x) g(x)2 2 5.4 Satz: Es gilt d n x = nxn−1 . dx für alle n ∈ Z, n 6= 0 oder x 6= 0. Beweis: Für n ∈ N folgt der Satz folgt aus der Produktregel per vollständiger Induktion nach n, denn er gilt für n = 1 und d n+1 d x = (x xn ) = xn + x n xn−1 = (n + 1)xn . dx dx Für n < 0 folgt der Satz aus der Quotientenregel wegen d 1 −(−n)x−n−1 d n x = = = n x−n−1 x2n = nxn−1 . dx dx x−n (x−n )2 5.2. LOKALE EXTREMA UND MONOTONIE 75 Für n = 0 und x 6= 0 gilt der Satz ebenfalls, da x0 = 1 in diesem Fall konstant ist und daher die Ableitung 0 hat. 2 Damit sind alle Polynome differenzierbar und alle rationalen Funktionen, wo sie definiert sind. Für Polynome gilt d (a0 + a1 x + . . . + an xn ) = a1 + 2a2 x + . . . + nan xn−1 . dx 5.2 Lokale Extrema und Monotonie Um den Zusammenhang zwischen Ableitung, Monotonie und lokalen Extrema aufzuklären, benötigen wir den wichtigen Mittelwertsatz der Differenzialrechnung. Zunächst beweisen wir ein notwendiges Kriterium für lokale Extremalpunkte, das uns das rechnerische Auffinden von lokalen Extrema ermöglicht. 5.5 Satz: (Notwendiges Kriterium für lokale Extremalpunkte) Sei f : I → R differenzierbar, I ein offenes Intervall, und x ∈ I eine lokale Extremalstelle (Minimalstelle oder Maximalstelle) von f . Dann gilt f 0 (x) = 0. Beweis: Sei x eine lokale Maximalstelle. Dann gibt es ein > 0 mit f (x) ≥ f (t) für alle |t − x| < , t ∈ I. Es folgt f (t) − f (x) ≥0 t−x für alle |t − x| < , t ∈ I, t < x. Also f 0 (x) ≥ 0. Analog folgt f 0 (x) ≤ 0 wenn man t > x betrachtet. Insgesamt also f 0 (x) = 0. 2 Die Umkehrung ist falsch, wie die Funktion x3 zeigt. Außerdem gilt der Satz offenbar nicht für Randpunkte von Intervallen. 5.6. Beispiel: Dieser Satz kann verwenden werden, um Extrema von Funktionen zu berechnen. Wir betrachten die Funktion f (x) = x3 − x auf [−1, 1] (siehe Abbildung). Aufgrund des Satzes über die Extrema von stetigen Funktionen muss f eine Maximalstelle und eine Minimalstelle in [−1, 1] haben. Um diese Stellen zu finden, suchen wir zunächst lokale Extrema in ] − 1, 1[. Diese Stellen müssen die Bedingung f 0 (x) = 0 erfüllen. Wir finden die Punkte r 1 x1,2 = ± ≈ ±0.57735, 3 die auch tatsächlich im Intervall ] − 1, 1[ liegen. 76 KAPITEL 5. DIE ABLEITUNG Abbildung 5.3: f (x) = x3 − x Schließlich vergleichen wir die Werte in diesen sogenannten kritischen Punkten x1/2 mit den Werten in den Randpunkten von [−1, 1], wo der Satz von Rolle nicht gilt. Also vergleichen wir f (−1), f (x1 ), f (x2 ), f (1) und finden auf diese Weise die Extrema in [−1, 1]. Insgesamt erhalten wir 1 1 f ([−1, 1]) = [f − √ , f √ ]. 3 3 Der folgende Satz von Rolle ist ein Spezialfall des Mittelwertsatzes, den wir im Beweis des Mittelwertsatzes benötigen. 5.7 Satz: (Satz von Rolle) Sei f : [a, b] → R stetig und auf ]a, b[ differenzierbar, a < b. Dann existiert ein ξ ∈ ]a, b[ mit f 0 (ξ) = 0. Beweis: Falls f auf [a, b] konstant ist, so ist die Ableitung überall auf ]a, b[ gleich 0. Ansonsten existiert eine Extremalstelle ξ von f in ]a, b[, also im Innern des Intervalls. Nach dem obigen Kriterium gilt f 0 (ξ) = 0. 2 Einer der wichtigsten Sätze der Analysis ist der folgende Mittelwertsatz. Wir beweisen gleich noch eine nützliche Version, die als 2. Mittelwertsatz bezeichnet wird. 5.8 Satz: (Mittelwertsatz) (1) Sei f : [a, b] → R stetig und in ]a, b[ differenzierbar, a < b. Dann gibt es ein ξ ∈ ]a, b[ mit f (b) − f (a) f 0 (ξ) = b−a 5.2. LOKALE EXTREMA UND MONOTONIE 77 (2) Seien f, g : [a, b] → R stetige Funktionen, die in ]a, b[ differenzierbar sind. Sei außerdem g(a) 6= g(b) und g 0 (x) 6= 0 für alle x ∈ ]a, b[. Dann gibt es ein ξ ∈ ]a, b[ mit f 0 (ξ) f (a) − f (b) = . g 0 (ξ) g(a) − g(b) Beweis: Es genügt den 2. Mittelwertsatz zu beweisen, da der 1. Mittelwertsatz ein Spezialfall mit g(x) = x ist. Wir definieren die Funktion h(x) = (f (x) − f (b)) − f (a) − f (b) · (g(x) − g(b)) g(a) − g(b) h ist ebenfalls in ]a, b[ differenzierbar und in [a, b] stetig. Außerdem gilt h(a) = h(b) = 0. Nach dem Satz von Rolle gibt es ein ξ ∈ ]a, b[ mit h0 (ξ) = 0. Daraus folgt die Behauptung wegen f (b) − f (a) 0 · g (ξ) 0 = h0 (ξ) = f 0 (ξ) − g(b) − g(a) 2 und g 0 (ξ) 6= 0. Die Bedingung g 0 (x) 6= 0 für alle x ∈ ]a, b[ ist notwendig. Dazu betrachten wir f (x) = x2 , g(x) = x3 , a = −1, b = 1. In der Tat existiert kein Punkt ξ ∈ ]a, b[, in dem f 0 (ξ)/g 0 (ξ) definiert ist, und für den der Mittelwertsatz gültig wäre. Es folgt aus dem Mittelwertsatz ! |f (b) − f (a)| ≤ 0 sup |f (ξ)| · |a − b| ξ∈]a,b[ Die Gleichheit gilt hier genau dann, wenn f 0 (ξ) konstant ist. Dieser Satz hilft oft, eine Funktion in einem Intervall abzuschätzen. 5.9 Satz: (Satz über monotone Funktionen) (1) Sei f : I → R differenzierbar, I ein offenes Intervall. Genau dann ist f 0 (x) ≥ 0 für alle x ∈ I, wenn f in I monoton wachsend ist. Eine analoge Bedingung gilt für monoton fallende Funktionen. (2) Falls f 0 (x) > 0 für alle x ∈ I ist, so ist f streng monoton wachsend auf I. Die Umkehrung ist falsch. Beweis: Dass f 0 (x) ≥ 0 (bzw. f 0 (x) > 0) für die Monotonie (bzw. die strenge Monotonie) hinreichend ist, folgt sofort aus dem Mittelwertsatz. Dass es auch notwendig ist, folgt aus der Betrachtung des Differentialquotienten f 0 (x) = lim t→x, t6=x f (t) − f (x) . t−x 78 KAPITEL 5. DIE ABLEITUNG Die Funktion x 7→ x3 ist streng monoton wachsend. Die Ableitung in 0 ist aber gleich 0. 2 Um lokale oder absolute Extremalstellen einer Funktion f auf einem Intervall zu finden, kann man die Monotonie-Intervalle der Funktion studieren. Dazu bestimmt man die kritischen Punkte, also die Lösungen von f 0 (x) = 0. Wenn f 0 stetig ist, dann kann f 0 in Intervallen ohne kritischen Punkt das Vorzeichen nicht wechseln. Die Funktion ist also in den Intervallen zwischen den kritischen Punkten und den Rändern streng monoton. 5.10. Beispiel: (1) Eine Parabel ist ein reelles Polynom vom Grad 2 p(x) = ax2 + bx + c mit a 6= 0. Die Parabel hat für a > 0 ein absolutes Minimum auf R in x0 = − b . 2a Für a > 0 ist sie auf ] − ∞, x0 ] streng monoton fallend, und auf [x0 , ∞[ streng monoton steigend, wie man an der Ableitung p0 (x) = 2ax + b = 2a(x − x0 ) sieht. Für a < 0 ist x0 ein Maximum, und die Monotonie ist genau umgekehrt. Für a = 0 ist die Funktion eine Gerade. (2) Wir betrachten wieder f (x) = x3 − x und setzen das obige Beispiel fort. Da f 0 nur zwei Nullstellen in R hat und stetig ist, muss es in den verbleibenden drei Intervallen √ √ √ √ ] − ∞, −1/ 3[, ] − 1/ 3, 1/ 3[, ]1/ 3, ∞[ streng monoton sein. In diesen Intervallen wächst, fällt und wächst die Funktion abwechselnd, wie man durch Einsetzen von Punkten herausfindet. Beachtet man die Grenzwerte lim f (x) = −∞, x→−∞ lim f (x) = ∞, x→∞ √ √ und die Funktionswerte in −1/ 3 und 1/ 3 so wissen daher, dass x1 ein lokales Maximum, und x2 ein lokales Minimum ist. Beide sind aber keine absoluten Extremalstellen. 5.11 Satz: (Hinreichendes Kriterium für lokale Extremalpunkte) Sei f : I → R differenzierbar, I ein offenes Intervall, sowie in x ∈ I zweimal differenzierbar. Es gelte f 0 (x) = 0, f 00 (x) < 0. Dann hat f in x eine lokale Maximalstelle. Wenn statt dessen f 00 (x) > 0 gilt, so liegt eine lokale Minimalstelle vor. Beweis: Es gilt wegen f 0 (x) = 0 f 0 (t) − f 0 (x) f 0 (t) = lim t→x t→x t − x t−x 0 > f 00 (x) = lim 5.3. DIE TANGENTE 79 Daraus folgt, dass ein > 0 existiert, so dass f 0 in ]x − , x[ streng monoton wächst und in ]x, x + [ streng monoton fällt. 2 Dieser Satz ist bei der Suche nach globalen Extrema nicht sehr hilfreich, und selbst für lokale Extrema ist der Vergleich der Funktionswerte meist einfacher. Das Resultat ist eher theoretischer Natur. Stattdessen sollte man Monotonie-Intervalle und die Werte oder Grenzwerte in den Randpunkten verwenden. Dieses Vorgehen ist Teil einer Kurvendiskussion. Es ist allerdings leicht einzusehen, dass f : I → R, I ein offenes Intervall, in x eine globale Maximalstelle (bzw. Minimalstelle) hat, wenn f 00 (x) < 0 (bzw. f 00 (x) > 0) für alle x ∈ I gilt. Im obigen Satz fordern wir das nur in dem einen Punkt x. Dies genügt aber schon für eine lokale Extremalstelle. Ein lokales Maximum (Minimum) einer differenzierbaren Funktion f : R → R ist ein absolutes Maximum (Minimum), wenn f 0 nur eine Nullstelle hat, das heißt, wenn f nur einen kritischen Punkt hat. Denn sei x0 der einzige kritische Punkt und ein lokales Maximum. Falls dann x0 < x1 , f (x0 ) < f (x1 ), so existiert x0 < x2 < x1 , f (x2 ) ≤ f (x0 ) < f (x1 ), weil x0 ein lokales Maximum ist. Falls f (x2 ) < f (x0 ) ist, so existiert x0 < x2 < x3 < x1 , f (x3 ) = f (x0 ) nach dem Zwischenwertsatz. Nach dem Satz von Rolle existiert x0 < x4 < x2 , f 0 (x4 ) = 0. Das war aber ausgeschlossen. Falls f (x2 ) = f (x0 ) ist, so folgt derselbe Widerspruch. Der Fall x1 < x0 geht genauso. Analog behandelt man ein Minimum. 5.3 Die Tangente 5.12. Definition: Sei f : I → R in x ∈ I differenzierbar, I ein offenes Intervall Die Gerade Tx (t) = f (x) + f 0 (x)(t − x) bezeichnet man als Tangente an f im Punkt x. Die Tangente ist dadurch charakterisiert, dass sie die einzige Gerade ist, für die Tx (x) = f (x), Tx0 (x) = f 0 (x) ist. 5.13. Beispiel: In Abbildung 5.1 ist die Funktion f (x) = x2 dargestellt, sowie die Tangente in x = 0.1. Sie hat allgemein die Gleichung Tx (t) = x2 + 2x(t − x). 80 KAPITEL 5. DIE ABLEITUNG Für x = 0.1 bedeutet dies T (t) = 0.01 + 0.2(t − 0.1) = 0.02t − 0.01 Die Sekante in zwei Punkten x1 , x2 hat übrigens die Gleichung Sx1 ,x2 (t) = f (x1 ) + f (x2 ) − f (x1 ) (t − x1 ). x2 − x1 Man kann die Ableitung auch als f 0 (x) = lim h→0, h6=0 f (x + h) − f (x) h definieren. 5.14 Satz: Sei f : I → R, I ein offenes Intervall und U (x) = ]x − , x + [ ⊆ I. Dann ist f in x genau dann differenzierbar, wenn es eine für |h| < definierte Funktion Rx (h) und ein m ∈ R gibt mit f (x + h) = f (x) + m · h + Rx (h), so dass gilt Rx (h) = 0. h Man bezeichnet dies als Tangenten-Definition der Differenzierbarkeit. Im Falle der Existenz gilt m = f 0 (x). lim h→0, h6=0 Beweis: Die Gleichung ist für h 6= 0 äquivalent zu f (x + h) − f (x) Rx (h) −m= . h h Wenn f also in x differenzierbar ist, so erfüllt das auf diese Weise definierte Rx die Bedingung, und umgekehrt. 2 Falls f differenzierbar ist, so gilt also f (t) − Tx (t) = Rx (t − x). Das bedeutet, dass die Funktion f (t) − Tx (t) für t → x schneller gegen 0 geht als h = t − x. Geometrisch bedeutet das, dass sich die Funktionen f und Tx in x “tangieren” (berühren). Für eine differenzierbare Funktion gibt es nur eine tangierende Gerade. Alle tangierenden Geraden müssen die Form g(t) = f (x) + f 0 (x)(t − x) haben. 5.4 Die Kettenregel Wir betrachten hier die Ableitung der Hintereinanderausführung zweier Funktionen. 5.4. DIE KETTENREGEL 5.15 Satz: 81 Seien f :I→J g:J →R in x bzw. f (x) differenzierbare Funktionen, wobei I und J offene Intervalle seien, x ∈ I. Dann ist auch g ◦ f in x differenzierbar und es gilt d g(f (x)) = g 0 (f (x)) · f 0 (x). dx Diese Formel wird auch als Nachdifferenzieren oder Kettenregel bezeichnet. Beweis: Man hat für t, x ∈ I, y 6= x, im Fall von f (t) 6= f (x) g(f (t)) − g(f (x)) g(f (t)) − g(f (x)) f (t) − f (x) = · . t−x f (t) − f (x) t−x Sei tn → x eine Folge in I \{x}. Falls dann f (tn ) 6= f (x) für n ≥ N gilt, so folgt f (tn ) → f (x) aus der Stetigkeit von f und daher lim n→∞ g(f (tn )) − g(f (x)) = g 0 (f (x)) · f 0 (x). tn − x (1) Andernfalls folgt für eine Teilfolge (tnk )k∈N dieser Folge f (tnk ) = f (x) für alle k und daher g(f (tnk )) − g(f (x)) = 0. k→∞ tnk − x lim Aber dann gilt auch f (tnk ) − f (x) = 0. k→∞ t nk − x f 0 (x) = lim 2 Man hat also wieder (1). 5.16. Beispiel: Anstatt p(x) = (x2 +x+1)2 auszumultiplizieren und dann zu differenzieren, erhalten mit f (x) = x2 + x + 1 und g(t) = t2 p0 (x) = 5.17 Satz: d g(f (x) = 2(x2 + x + 1)(2x + 1). dx Sei f : I → R differenzierbar, I ein offenes Intervall, und f 0 (x) > 0 für alle x ∈ I Dann ist f streng monoton wachsend auf I und hat eine Umkehrfunktion f −1 : f (I) → I, 82 KAPITEL 5. DIE ABLEITUNG die ebenfalls differenzierbar ist. Für die Ableitung gilt 0 f −1 (y) = 1 f 0 (x) wobei f (x) = y sei. Der Satz gilt analog im Fall f 0 (x) < 0 für alle x ∈ I. Beweis: Wir wissen schon, dass f streng monoton wachsend und daher J = f (I) ein offenes Intervall ist. Wir wissen auch, dass es daher eine Umkehrfunktion f −1 wie im Satz verlangt gibt. Wir müssen noch zeigen, dass diese Umkehrfunktion differenzierbar ist. Sei y ∈ J, x = f −1 (y), und (sn )n∈N eine Folge in J \ {y} mit sn → y, und sei tn = f −1 (sn ). Dann gilt f −1 (sn ) − f −1 (y) tn − x 1 = → 0 sn − y f (tn ) − f (x) f (x) 2 Daraus folgt die Behauptung. 5.18. Beispiel: Die Funktion g(x) = ist sie differenzierbar und es gilt √ x ist die Umkehrung von f (x) = x2 auf ]0, ∞[. Also d√ 1 1 = √ y= dy 2x 2 y wobei y = f (x) = x2 ist. Die Kettenregel gilt auch mit einseitigen Ableitungen. Sei Dazu f : I → J, g:J →R wie im Satz über die Hintereinanderausführung, aber x ein Randpunkt von I, und f in x einseitig differenzierbar. Dann gilt der Satz ebenfalls, wobei g ◦ f natürlich auch nur einseitig in x differenzierbar ist. Analog kann f (x) ein Randpunkt von J sein, und g in J einseitig differenzierbar. Dann gilt der Satz ebenfalls. Wenn x im Innern von I liegt, so ist g ◦ f dann in x differenzierbar. 5.19. Beispiel: Wir nehmen f : R → [0, ∞[, g : [0, ∞[ → R, f (x) = x2 , √ g(x) = x. Dann ist g(f (x)) = |x| in x = 0 nicht differenzierbar. Der Grund ist, dass g im Randpunkt 0 nicht differenzierbar ist. Die Differenzierbarkeit im Rand ist also offenbar notwendig, wenn g(I) auch Randpunkt von J enthält. 5.5. EXPONENTIALFUNKTION UND LOGARITHMUS 5.5 83 Exponentialfunktion und Logarithmus Diese beiden Funktionen sind zentrale Hilfsmittel in der Analysis. Ziel dieses Abschnittes ist es, Exponenten der Form ax für a > 0 definieren zu können. Diese Exponenten sollen die Gleichung ax+y = ax · ay erfüllen, wie dies auch die Funktionen an , n ∈ Z, tun. Außerdem soll a0 = 1, a1 = 1 sein. Die Umkehrfunktion loga ist dann für a 6= 1 definiert und erfüllt automatisch die entsprechende Gleichung loga (xy) = loga (x) + loga (y), sowie loga (1) = 0, loga (a) = 1. Wir werden unser Ziel mit Hilfe der Exponentialfunktion und dessen Umkehrung, dem Logarithmus naturalis (natürlichem Logarithmus) erreichen. 5.20 Satz: (1) Für die Exponentialfunktion aus 3.42 gilt exp(0) = 1 und die Funktionalgleichung exp(x + y) = exp(x) · exp(y) für alle x, y ∈ R Also insbesondere exp(x) 6= 0 und exp(−x) = 1 exp(x) für alle x ∈ R für alle x ∈ R. (2) Es gilt exp(x) > 0 für alle x ∈ R (3) Die Exponentialfunktion ist differenzierbar und exp0 (x) = exp(x) für alle x ∈ R (4) exp ist streng monoton wachsend. (5) Es gilt exp(x) ≥ 1 + x für alle x ∈ R. Also insbesondere lim exp(x) = ∞. x→∞ sowie lim exp(x) = 0. x→−∞ 84 KAPITEL 5. DIE ABLEITUNG Beweis: (1), (2) und (4) wurden bereits in 3.45 und der darauf folgenden Bemerkung gezeigt. Zum Beweis von (3) beachten wir exp(x + h) − exp(x) exp(h) − 1 = exp(x) h h ∞ X hk = exp(x) (k + 1)! k=0 Eine einfache Abschätzung zeigt lim h→0 ∞ X k=0 hk = 1. (k + 1)! Daraus folgt (3). (5) folgt mit Hilfe einer Kurvendiskussion von f (x) = exp(x) − (1 + x). Abbildung 5.4: Esponentialfunktion und Logarithmus 5.21. Definition: Die Umkehrfunktion von exp : R → ]0, ∞[ ist ln : ]0, ∞[ → R. Sie heißt natürlicher Logarithmus. 2 5.5. EXPONENTIALFUNKTION UND LOGARITHMUS 5.22 Satz: 85 (1) ln(y) ist für y > 0 definiert, streng monoton wachsend, und es gilt lim ln(y) = −∞, lim ln(y) = ∞. y→∞ y↓0 (2) ln0 (y) = 1 y für alle y > 0. (3) Es gilt die Funktionalgleichung ln(y1 y2 ) = ln(y1 ) + ln(y2 ) für alle y1 , y2 > 0, insbesondere ln 1 = − ln(y) y für alle y ∈ R. Beweis: (1) ist eine Folgerung aus der Definition als Umkehrfunktion von exp. (2) folgt aus dem Satz über die Ableitung der Umkehrfunktion. Denn d 1 1 1 ln(y) = = = 0 dy exp (x) exp(x) y mit exp(x) = y. 2 (3) folgt aus der Funktionalgleichung für exp. Jede auf R differenzierbar Funktion mit den Eigenschaften f (0) = 1, f 0 (x) = f (x) für alle x ∈ R (1) ist identisch mit der Exponentialfunktion. Zum Beweis betrachten wir h(x) = f (x) . exp(x) Es folgt h0 (x) = f 0 (x) exp(x) − f (x) exp0 (x) =0 exp(x)2 für alle x ∈ R Aus dem Mittelwertsatz folgt, dass h konstant ist. Wegen h(0) = 1 folgt h(x) = exp(x) für alle x ∈ R. Wenn man nun ax für a > 0 definieren will und dabei die üblichen Rechenregeln für das Potenzieren erhalten will, insbesondere m (an ) = anm , dann muss gelten x ax = eln(a) = ex·ln(a) . 86 KAPITEL 5. DIE ABLEITUNG Dies verwenden wir als Definition und zeigen, dass dann die üblichen Rechenregeln erfüllt werden. Die Umkehrfunktion von ax wild Logarithmus zur Basis a genannt, loga (y). 5.23. Definition: (1) Für a > 0, x ∈ R definieren wir ax = exp(x · ln(a)). Insbesondere also ex = exp(x) (2) Für a > 0, a 6= 1, y > 0 definieren wir loga (y) = ln(y) . ln(a) Abbildung 5.5: ax für a = 2 und a = 1/2 5.24 Satz: (1) Die Funktion x 7→ ax ist für a > 1 streng monoton wachsend, und für 0 < a < 1 streng monoton fallend. Sie bildet in beiden Fällen R auf ]0, ∞[ bijektiv ab. Ihre Umkehrfunktion ist loga . (2) Es gilt für a > 0 ax1 +x2 = ax1 · ax2 für alle x, y ∈ R, sowie (3) Für a > 0 und x, y ∈ R gilt a0 = 1, a1 = a. x2 ax1 x2 = (ax1 ) . 5.5. EXPONENTIALFUNKTION UND LOGARITHMUS 87 (4) Für a > 0 gilt d x a = ln(a) · ax dx für alle x ∈ R (5) Die Funktion y 7→ loga (y) ist für a > 1 streng monoton wachsend, und für a < 1 streng monoton fallend. Sie bildet in beiden Fällen ]0, ∞[ auf R bijektiv ab. Ihre Umkehrfunktion ist x 7→ ax . (6) Für a > 0, a 6= 1, gilt loga (y1 y2 ) = loga (y1 ) + loga (y2 ) für alle y1 , y2 > 0 sowie loga (1) = 0, loga (a) = 1. (7) Für a > 0, a 6= 1, y1 > 0, y2 ∈ R gilt loga (y1y2 ) = y2 loga (y1 ). (8) Für a > 0, a 6= 1 gilt 1 d loga (y) = dy y ln(a) für alle y > 0. Beweis: Die meisten Beweise sind einfache Rechnungen oder folgen unmittelbar aus den Definitionen oder schon bewiesenen Sätzen über die Exponentialfunktion und den Logarithmus. Um zum Beispiel zu beweisen, dass die Funktionen x 7→ ax und die Funktion y 7→ loga (y) für a > 0, a 6= 1 Umkehrfunktionen zueinander sind, rechnet man ln(y) aloga (y) = e ln(a) ln(a) = y, loga (ax ) = ln(ax ) x ln(a) = = x. ln(a) ln(a) Zu (3): x2 (ax1 ) x2 x1 ln(a)) ) = ex1 ln(a) = ex2 ln(e = ex1 x2 ln(a) = ax1 x2 . Oder (6): eloga (y1 )+loga (y2 ) = eloga (y1 )) eloga (y2 ) = y1 y2 . Nimmt man den Logarithmus auf beiden Seiten, so folgt (6). log1 macht keinen Sinn, weil 1x konstant gleich 1 ist. 2 88 5.25 Satz: KAPITEL 5. DIE ABLEITUNG Für alle a ∈ R gilt lim x→∞ 1+ a x = ea . x Beweis: Man hat a x a ln(1 + a/x) − ln(1) ln 1 + = x ln 1 + =a· x x a/x Wegen ln0 (1) = 1 folgt a x = a. lim ln 1 + x→∞ x Wegen der Stetigkeit von exp folgt a x lim 1 + = ea . x→∞ x 2 Insbesondere gilt n 1 e = lim 1 + = exp(1). n Also ex = exp(x ln(e)) = exp(x). Die Exponentialfunktion wird oft verwendet, um Wachstum zu modellieren. Falls ein Kapital oder eine andere Menge zur Zeit t0 gleich C ist, so setzt man K(t) = Ceλ(t−t0 ) . Das Wachstum nach einer Zeiteinheit ist dann K(t + 1) = eλ K(t) Das entspricht einem Zinssatz in Prozent P gemäß 1+ P = eλ . 100 Stellt man etwa die Frage, wann sich ein Kapital bei einem Zinssatz P verdoppelt, so kann hat K(t + x) 2= = eλx K(t) Also ln(2) . λ Man kann nun Näherungsweise eλ = 1 + λ für kleine λ setzen, und damit λ = P/100. Damit erhält man die Näherungsformel 70 . x≈ P x= 5.6. DER SATZ VON DE L’HOSPITAL 5.6 89 Der Satz von de l’Hospital Dieser Satz erlaubt die Berechnung von Grenzwerten von Brüchen, deren Zähler und Nenner gegen 0 oder gegen ∞ gehen durch Differenzieren. 5.26 Satz: (1) Seien f, g : ]a, b[ → R differenzierbare Funktionen. Es gelte lim f (x) = lim g(x) = 0, x↓a x↓a oder lim f (x) = ±∞, x↓a lim g(x) = ±∞. x↓a 0 Außerdem sei vorausgesetzt, dass g (x) 6= 0 für alle x ∈ ]a, b[ ist. Dann gilt lim x↓a f (x) f 0 (x) = lim 0 , x↓a g (x) g(x) (1) sofern der Grenzwert auf der rechten Seite existiert. Natürlich gilt derselbe Satz analog für b und x ↑ b. (2) Der Satz gilt auch, wenn a = −∞ oder b = ∞ ist. (3) Der Satz gilt auch, wenn der Grenzwert uneigentlich gleich ±∞ ist. Beweis: Sei zunächst der Grenzwert von Zähler und Nenner gleich 0. Dann können wir f und g stetig auf a fortsetzen mit f (a) = g(a) = 0. Aus dem zweiten Mittelwertsatz folgt für ein ξx ∈ ]a, x[ f (x) f (x) − f (a) f 0 (ξx ) = = g(x) g(x) − g(a) g 0 (ξx ) . Mit x → a folgt die Behauptung, da dann auch ξx → a gilt. Seien nun die Grenzwerte ±∞. Sei a < y < x < b. Es gilt dann für ein ξx,y ∈ ]y, x[ f (y) 1 − f (x)/f (y) f (y) − f (x) f 0 (ξx,y ) · = = g(y) 1 − g(x)/g(y) g(y) − g(x) g 0 (ξx,y ) Die rechte Seite geht mit x → a gegen einen Grenzwert η, unabhängig von der Wahl von y. Mit y → a geht aber der zweite Faktor links gegen 1. Es folgt die Behauptung. (2) Dieser Fall kann durch f˜(x) = f (1/x) und g̃(x) = g(1/x) auf (1) zurück geführt werden. (3) Falls etwa die rechte Seite in (1) gegen 0 geht, so geht der Kehrwert von oben gegen 0. Die Behauptung folgt auf diese Weise ebenfalls. 2 Man achte stets genau darauf, ob die Voraussetzungen des Satzes auch wirklich erfüllt sind. Sonst rechnet man sehr leicht fehlerhaft. 5.27. Beispiel: Man berechnet ln(x) 1/x = lim = 0. x→∞ 1 x→∞ x lim 90 KAPITEL 5. DIE ABLEITUNG Den Satz von de l’Hospital kann man deswegen anwenden, weil der Zähler und der Nenner den Grenzwert ∞ haben, und weil der Grenzwert des Quotienten der Ableitungen existiert. Es folgt √ ln(n) n lim n = lim exp = 1. n→∞ n→∞ n √ Man zeigt durch eine Diskussion der Funktion ln(x)/x, dass die Folge n n ab n = 3 streng monoton fällt. 5.7 Fixpunkte Der Mittelwertsatz kann auch zum Beweis der Konvergenz einer rekursiv gegebenen Folge verwendet werden. Sei g : [a, b] → R stetig und in ]a, b[ differenzierbar, und xF ∈ ]a, b[ ein Fixpunkt von g, also g(xF ) = xF Wir definieren eine Folge durch xn+1 = g(xn ) für alle n ∈ N0 x0 ∈ ]a, b[. Dann gilt xn+1 − xF = g(xn ) − g(xF ) = g 0 (ξ)(xn − xF ). Wenn dann zum Beispiel 0 ≤ g 0 (ξ) < 1 für alle ξ ∈ ]a, b[ gilt, ist die Folge (xn )n∈N streng monoton fallend im Falle von x0 > xF und streng monoton wachsend im Falle von x0 < xF . Außerdem ist sie in jedem Fall durch xF beschränkt. Sie konvergiert also gegen ein x ∈ [a, b]. Wegen x = lim xn = lim xn+1 = lim g(xn ) = g(x) n→∞ n→∞ n→∞ ist der Grenzwert ebenfalls Fixpunkt von g. Wegen |xF − x| = |g(xF ) − g(x)| = |f 0 (ξ)| |xF − x| < |xF − x| folgt, dass die Folge gegen xF konvergiert. Falls −1 < g 0 (ξ)| ≤ 0 für alle ξ ∈ ]a, b[ ist, so kann man ähnlich argumentieren, wenn etwa xF = (a+b)/2 ist. In diesem Fall wechselt xn − xF in jedem Schritt das Vorzeichen. 5.28. Beispiel: Wir definieren xn+1 1 = 2 2 xn + = g(xn ), xn 5.8. KONVEXE FUNKTIONEN und x0 = 2. xF = √ 91 √ 2 ist ein Fixpunkt von g. Es gilt für x ∈ ] 2, 2[ 1 1 2 0 0 < g (x) = 1− 2 < . 2 x 2 Daraus folgt gemäß der obigen Überlegung lim xn = n→∞ Man erhält auch √ 2. √ 1 |x0 − 2|. n 2 √ In der Tat konvergiert diese Folge jedoch wegen g 0 ( 2) = 0 noch wesentlich schneller. |xn − √ 2| ≤ Wenn mit den obigen Bezeichnungen |g 0 (xF )| > 1 für eine stetig differenzierbare Funktion g gilt, so kann die rekursive Folge nur konvergieren, wenn zufällig xn = xF für ein n ∈ N wird. Jede stetige Funktion g : [a, b] → [a, b] hat einen Fixpunkt. Dies ist eine einfach zu beweisende Version des Browerschen Fixpunktsatz in einer Dimension. Man wendet den Zwischenwertsatz auf h(x) = g(x) − x an. Wir zeigen später, dass eine Funktion f : A → A auf einer abgeschlossenen Menge A ⊆ R, für die es ein γ < 1 gibt mit |f (x1 ) − f (x2 )| < γ|x1 − x2 | für alle x1 , x2 ∈ A einen eindeutigen Fixpunkt in A hat (Banachscher Fixpunktsatz). Solche Funktionen heißen kontrahierend. 5.8 Konvexe Funktionen Die Entscheidung, ob eine Funktion konvex oder konkav ist, beschreibt nicht nur die Form einer Funktion, sondern sie erlaubt auch überraschende Abschätzungen der Funktion. 5.29. Definition: Sei I ein Intervall in R. Eine Funktion f : I → R heißt konvex in I, wenn gilt f (λx1 + µx2 ) ≤ λf (x1 ) + µf (x2 ) für alle x1 , x2 ∈ I und λ, µ ∈ R mit λ, µ ≥ 0, λ + µ = 1. Im Fall “≥” spricht man von einer konkaven Funktion. Wenn f links von einem Punkt x konvex, und rechts von einem Punkt konkav ist oder umgekehrt, so nennt man x einen Wendepunkt von x. Die Gerade f (x2 ) − f (x1 ) x2 − x1 ist die Sekante durch f in x1 und x2 . Die Tatsache, dass f konvex ist, besagt nun sx1 ,x2 (x) = f (x1 ) + (x − x1 ) sx1 ,x2 (x) ≥ f (x) wenn dies für alle x1 , x2 ∈ I gilt. für alle x ∈ [x1 , x2 ], 92 KAPITEL 5. DIE ABLEITUNG Abbildung 5.6: Konvexe Funktion 5.30 Satz: Sei I ein Intervall und f : I → R zweimal differenzierbar im Innern, am Rand stetig. Dann gilt f 00 (ξ) ≥ 0 für alle ξ im Innern von I genau dann, wenn f konvex in I ist. Analog ist f genau dann konkav, wenn hier “≤” gilt. Beweis: Sei x1 , x2 ∈ I, sowie x ∈ I ein weiterer Punkt, x1 < x < x2 . Dann betrachtet man die Hilfsfunktion h(t) = (f (t) − sx1 ,x2 (t))(x − x1 )(x − x2 ) − (f (x) − sx1 ,x2 (x))(t − x1 )(t − x2 ), wobei sx1 ,x2 die Sekante durch f in x1 und x2 ist. Es gilt h(x1 ) = h(x2 ) = h(x) = 0. Nach dem Satz von Rolle, zweimal angewendet, gibt es ein ξ ∈ ]x1 , x2 [ mit h00 (ξ) = 0. Es gilt wegen s00x1 ,x2 = 0 h00 (t) = f 00 (t)(x − x1 )(x − x2 ) − 2(f (x) − sx1 ,x2 (x)). Also f 00 (ξ) (x − x1 )(x − x2 ), 2 Wenn also f 00 (ξ) > 0 für alle ξ ∈, so ist f konvex. f (x) − sx1 ,x2 (x) = Sei umgekehrt f konvex, und 0 < f 00 (ξ) = lim x1 ↑ξ f 0 (ξ) − f 0 (x1 ) f 0 (x2 ) − f 0 (ξ) = lim . x2 ↓ξ ξ − x1 x2 − ξ 5.8. KONVEXE FUNKTIONEN 93 für ein ξ im Innern von I. Dann gibt es x1 < ξ < x2 im Innern von I mit f 0 (x1 ) > f 0 (ξ) > f 0 (x2 ). (1) Wir betrachten h(t) = sx1 ,x2 (t) − f (t). für t ∈ [x1 , x2 ]. Weil f konvex ist, gilt h(t) ≥ 0 für alle t ∈ [x1 , x2 ]. Es gilt offenbar auch h(x1 ) = h(x2 ) = 0. Also h0 (x1 ) ≥ 0, h0 (x2 ) ≤ 0. Nun ist h0 (t) = f (x1 ) − f (x2 ) − f 0 (t). x1 − x2 Also wegen (1) h0 (x1 ) < h0 (ξ) < h0 (x2 ). 2 Dies ist ein Widerspruch. 5.31. Beispiel: Die Wurzelfunktion ist konkav auf ]0, ∞[. Also √ √ 1 + λh ≥ 1 + λ( 1 + h − 1) für alle λ ∈ [0, 1] und 1 + h ∈ ]0, ∞[. Denn die Sekante in 1 und 1 + h lautet √ t−1 g(t) = 1 + (t − 1) . t−1 Einsetzen von t = 1 + λh ergibt die obige Gleichung. Wenn f 00 > 0 im Intervall ist, so gilt nach demselben Beweis f (λx + µy) < λf (x) + µf (y) für alle λ, µ > 0 mit λ + µ = 1, also f < g in ]x, y[. Solche Funktionen heißen (strikt konvex. Strikt konvexe Funktionen können Stellen haben, in denen die zweite Ableitung gleich 0 wird. Für die Tangente Tx (z) an f im Punkt x beweist man analog f (t) − T (t) = − f 00 (ξ) (t − x)2 , 2 Aus f 00 ≥ 0 in I folgt also f ≤ T . Eine konvexe Funktion liegt also unterhalb ihrer Tangenten. Entsprechend liegt eine konkave Funktion oberhalb jeder Tangenten. 94 KAPITEL 5. DIE ABLEITUNG Kapitel 6 Integralrechnung In diesem Kapitel behandeln wir das Riemann-Integral in einer Variablen. Schon aus der Schule ist bekannt, dass das Integral mit Hilfe der Umkehrung der Ableitung berechnet werden kann. Wir werden diesen Satz und diverse, daraus folgende Rechenregeln für Integrale hier herleiten. 6.1 Das Riemann-Integral Die Idee des Riemann-Integrals ist es, die Fläche unter dem Graphen einer positiven Funktion durch Treppenfunktionen von oben und von unten anzunähern. Abbildung 6.1: Treppenfunktion 6.1. Definition: (1) Sei [a, b] ein Intervall. Eine Funktion T : [a, b] → R heißt Treppenfunktion auf [a, b], wenn es eine Unterteilung a = x0 < x1 < . . . < xn = b 95 96 KAPITEL 6. INTEGRALRECHNUNG des Intervalls gibt, so dass T auf ]xk−1 , xk [ für alle k = 1, . . . , n konstant ist. Wir definieren b Z T (t) dt := n X a T (ξk )(xk − xk−1 ) i=1 mit irgendwelchen Punkten ξk ∈ ]xk , xk−1 [ für alle k = 1, . . . , n. Man nennt δ = max (xk − xk−1 ) 1≤k≤n die Feinheit der Unterteilung. (2) Für eine beschränkte Funktion f : [a, b] → R und eine Treppenfunktion T auf [a, b] mit R T ≤ f heißt T eine Untersumme von f . Das Unterintegral von f ist das Supremum aller Untersummen. Also Z b Z b f (t) dt := sup{ T (t) dt : T ≤ f ist Treppenfunktion}. a a Analog definieren wir das Oberintegral Z b Z f (t) dt := inf{ a b T (t) dt : T ≥ f ist Treppenfunktion}. a (3) Eine beschränkte Funktion f : [a, b] → R heißt Riemann-integrierbar, wenn ihr Oberintegral gleich dem Unterintegral ist. In diesem Fall setzen wir Z b b Z f (t) dt = f (t) dt := a Z b f (t) dt. a a Wir müssen uns auf beschränkte Funktionen zurück ziehen, weil sonst kein Ober- oder kein Unterintegral existieren würde. Das Integral einer Treppenfunktion hängt nicht von der Unterteilung ab, mit der es definiert ist. Man überlegt sich dazu, dass eine feinere Unterteilung derselben Treppenfunktion das gleiche Integral hat. Seien etwa xk−1 = x̃u < x̃u+1 < . . . < x̃v = xk die Unterteilungspunkte der feineren Unterteilung, die in [xk−1 , xk ] liegen. Dann gilt für ηj ∈ ]x̃j−1 , xj [ v X j=u+1 T (ηj )(x̃j − x̃j−1 ) = T (ξk ) v X (x̃j − x̃j−1 ) = T (ξk )(xk − xk−1 ), j=u+1 Weil T auf [xk−1 , xk ] konstant ist. Das gesamte Integral von T auf [a, b] bleibt daher ebenfalls gleich. Da es zu je zwei Unterteilungen einer gemeinsame, feinere Unterteilung gibt, folgt die Behauptung. 6.1. DAS RIEMANN-INTEGRAL 97 Es gibt eine andere Art, das Treppenfunktionen und deren Integral zu definieren. Dazu definieren wir die charakteristische Funktion einer Menge M ⊆ R als ( 1, x ∈ M, χM (x) = 0, x ∈ / M. Treppenfunktionen sind dann im Wesentlichen (bis auf endlich viele Punkte) Summen mit der Darstellung m X T (x) = αk χ[ak ,bk [ k=1 mit αk ∈ R und reellen, halboffenen Intervallen [ak , bk [. Für diese Treppenfunktion definieren wir Z b m X T (t) dt = αk (bk − ak ), a k=1 wobei [a, b] ein Intervall sei, dass alle Intervalle enthält. Auch hier muss man nachweisen, dass das Integral nicht von der Darstellung der Treppenfunktion als Summe abhängt. Das Argument dazu ist dasselbe wie das Argument, das wir oben verwendet haben. Es gilt für jede beschränkte Funktion f : [a, b] → R b Z b Z f (t) dt ≤ f (t) dt. a a Um das zu zeigen, muss man die Monotonie des Integrals für Treppenfunktionen zeigen, also Z b Z T1 (t) dt ≤ a b T2 (t) dt a für Treppenfunktionen T1 ≤ T2 . Dazu wählt man wieder eine gemeinsame, feinere Unterteilung. Damit ist die Behauptung offensichtlich. Zum Beweis der Riemann-Integrierbarkeit genügt es daher, für jedes > 0 eine Untersumme U und eine Obersumme O zu finden, so dass O − U < . Natürlich genügt damit auch eine Folge von Untersummen Un und eine Folge von Obersummen On von f mit lim On − Un = 0. n→∞ 6.2. Beispiel: (1) Jede Treppenfunktion ist Riemann-integrierbar, insbesondere die konstante Funktion f = c, und es gilt Z b c dt = c(b − a). a (2) Die Funktion f (x) = x ist auf [a, b] Riemann-integrierbar. Dazu konstruiert man Untersummen und Obersummen mit gleichem Punktabstand hn = (b − a)/n (äquidistante Unterteilung). a = x0 < x1 = a + hn < . . . < xn = b = a + nhn 98 KAPITEL 6. INTEGRALRECHNUNG Sei Un eine maximale Untersumme mit dieser Unterteilung, so gilt Un = hn (a + (a + hn ) + . . . + (a + (n − 1)hn )) 1 = hn na + h2n (n − 1)n 2 1 a2 b2 → (b − a)a + (b − a)2 = − , 2 2 2 wobei die Konvergenz für n → ∞ gemeint ist. Die minimale Obersumme On , die ebenso konvergiert wird, konvergiert gegen denselben Wert. Sie unterscheidet sich nur um On − Un = nh2n = (b − a)2 /n → 0. Das das Unterintegral das Supremum der Untersummen, und das Oberintegral das Infimum der Obersummen ist, müssen beide gleich sind. Die Funktion ist also Riemann-Integrierbar und Z b a2 b2 − . t dt = 2 2 a Abbildung 6.2: Unter- und Obersumme für monotone Funktion 6.3 Satz: Jede monotone, beschränkte Funktion f : [a, b] → R ist Riemann-integrierbar. Beweis: Sei f monoton wachsend. Wir wählen wie im obigen Beispiel eine äquidistante Unterteilung und die maximale Untersumme Un = n−1 X k=0 f (a + khn ) · hn 6.1. DAS RIEMANN-INTEGRAL 99 sowie die minimale Obersumme On = n X f (a + khn ) · hn . k=1 (hn = (b − a)/n). Dann gilt On − Un = (f (b) − f (a)) · hn → 0 2 mit n → ∞. Wählt man für f : [a, b] → R eine Unterteilung a = x0 < . . . < xn = b. und Punkte ξk ∈ [xk−1 , xk ], so heißt S= n X f (ξk )(xk − xk−1 ) k=1 eine Riemannsche Zwischensumme der Feinheit h = max (xk − xk−1 ). 1≤k≤n Es gilt natürlich n X Ck (xk − xk−1 ) ≤ S ≤ k=1 n X Dk (xk − xk−1 ) k=1 mit Ck = inf f ([xk−1 , xk ]), Dk = sup f ([xk−1 , xk ]) und man kann durch Wahl der ξk Riemannsche Zwischensummen konstruieren, die beiden Summen beliebig nahe kommen. Abbildung 6.3: Riemannsche Zwischensumme für f (x) = √ 1 − x2 auf [−1, 1] 100 6.4 Satz: KAPITEL 6. INTEGRALRECHNUNG (Riemannsche Zwischensummen) Eine Funktion f : [a, b] → R ist genau dann Riemann-integrierbar, wenn jede Folge von Riemannschen Zwischensummen, deren Feinheiten gegen 0 konvergiert, gegen denselben Wert konvergiert. In diesem Fall ist der Wert natürlich das Riemann-Integral von f auf [a, b]. Beweis: Sei f Riemann-integrierbar, also insbesondere beschränkt, etwa −C ≤ f ≤ C. Dann existieren zu > 0 Treppenfunktionen T1 ≤ f ≤ T2 mit Z b (T2 (t) − T1 (t)) dt < . a Sei m die maximale Anzahl der Intervalle in den beiden Unterteilungen. Sei Sn = n X f (ξk )(x̃k − x̃k−1 ) k=1 weiter eine Riemannsche Zwischensumme auf einer Unterteilung mit Feinheit hn und n Intervallen. Alle, bis auf maximal m der Intervalle ]xk−1 , xk [ sind dann Teilmengen der Unterteilungen von T1 bzw. T2 . Daher gilt T1 (ξk ) ≤ f (ξk ) ≤ T2 (ξk ) für alle bis auf maximal m der Indizes k. Es folgt Z b Z T1 (t) dt − 2Cmhn ≤ Sn ≤ a b T2 (t) dt + 2Cmhn . a Für eine Folge von solchen Riemannschen Zwischensummen mit hn → 0 gibt es daher ein N ∈ N mit Z b |Sn − f (t) dt| < 2 a für n > N . Es gelte umgekehrt die Konvergenz der Riemannschen Zwischensummen gegen einen festen Wert η. Dann muss f beschränkt sein, weil sonst die Zwischensummen beliebig groß oder klein gewählt werden könnten. Sei > 0. Sei Sn eine Folge Riemannscher Zwischensummen mit Feinheiten, die gegen 0 konvergieren. Es ist dann zu gegebenem > 0 möglich, eine Folge von Riemannschen Zwischensummen Un auf derselben Unterteilung zu konstruieren, so dass Z b Un − ≤ f (t) dt a gilt. Dazu wählt man die Zwischenpunkt jeweils nahe genug am Infimum der Funktion auf den Teilintervallen und vergleicht mit einer Treppenfunktion, die jeweils gleich dem Infimum ist. Es folgt aus der Voraussetzung Z b η−≤ f (t) dt. a 6.1. DAS RIEMANN-INTEGRAL 101 Analog zeigt man b Z η+≥ f (t) dt. a Es folgt, dass f Riemann-Integrierbar ist, und η das Riemann-Integral von f auf [a, b]. 2 6.5 Satz: (1) Das Integral ist mit “+” und “−” vertauschbar. D.h., wenn f, g : [a, b] → R Riemann-integrierbar sind, so sind es auch f ± g und Z b Z b Z b (f (t) ± g(t)) dt = f (t) dt ± g(t) dt. a a a Das heißt, Integral und Summe sind vertauschbar. (2) Eine Konstante kann aus dem Integral herausgezogen werden. D.h., wenn f : [a, b] → R Riemann-integrierbar ist, so ist es auch λf für jedes λ ∈ R und es gilt Z b Z b λf (t) dt = λ f (t) dt. a a Dies wird, zusammen mit Punkt (1), als Linearität des Integrals bezeichnet. (3) Wenn f, g : [a, b] → R Riemann-integrierbar sind und f (t) ≤ g(t) für alle t ∈ [a, b] gilt (“f ≤ g”), so gilt Z b b Z f (t) dt ≤ a g(t) dt. a Dies wird als Monotonie des Integrals bezeichnet. Beweis: Alle diese Aussagen folgen sofort mit Hilfe von Riemannschen Zwischensummen. 2 Die Eigenschaften dieses Satzes zusammen mit der Normierung Z b 1 dt = b − a a legen das Integral eindeutig fest. Es sind diese Eigenschaften, die man später auf eine möglichst große Klasse von Funktionen erweitern will. Wenn möglich, möchte man dabei noch zusätzlich die Vertauschung von Integral und Summe für unendliche Summen erreichen (σ-Additivität). 6.6. Definition: Wir setzen für b < a Z b Z f (t) dt = − a wenn dieses Integral existiert. a f (t) dt, b 102 KAPITEL 6. INTEGRALRECHNUNG 6.7 Satz: Sei f : I → R, I ein Intervall. Dann gilt für alle a, b, c ∈ I, für die die Integrale existieren, Z b Z c Z c f (t) dt + f (t) dt = f (t) dt. a b a Wenn die Integrale links existieren, so existiert auch das Integral rechts und umgekehrt. Beweis: Es genügt, den Fall a < b < c zu betrachten, da man die anderen Fälle durch Sortieren der Grenzen darauf zurückführen kann. f ist auf I genau dann beschränkt, wenn es auf [a, b] und [b, c] beschränkt ist. Sei f auf [a, c] integrierbar. Dann existieren zu > 0 Treppenfunktionen mit T1 ≤ f ≤ T2 und Z c (T2 (t) − T1 (t)) dt < . a Diese Treppenfunktion bilden, eingeschränkt auf [a, b] und [b, c] auch Unter- und Obersummen von f auf diesen Intervallen. Wegen T2 − T1 ≥ 0 gilt auch Z b Z c (T2 (t) − T1 (t)) dt < , (T2 (t) − T1 (t)) dt < . a b Aus diesem Grund ist f auch auf [a, b] und [b, c] integrierbar. Umgekehrt kann man aus Ober- und Untersummen auf beiden Teil-Intervallen eine Oberund Untersumme auf [a, c] konstruieren, und damit zeigen, dass das Integral auf [a, b] existiert, wenn das Integral auf den Teil-Intervallen existiert. Für Treppenfunktionen ist die Identität sofort klar. Wir nehmen dazu eine feinere Unterteilung, die den Punkt b enthält. Aufgrund der Definition folgt die Identität nun auch für beliebige Riemann-integrierbare Funktionen f . 2 Es gilt also unter den entsprechenden Voraussetzungen Z b Z c Z a Z f (t) dt + f (t) dt + f (t) dt = a 6.2 b c a f (t) dt = 0. a Der Hauptsatz Der Hauptsatz der Differenzial- und Integralrechnung besagt, dass die Integralrechnung die Umkehrung der Differenzialrechung ist. Er gilt für stetige Funktionen. Wir werden zunächst nachweisen, dass alle stetigen Funktionen integrierbar sind. 6.8. Definition: Sei M ⊆ R. Eine Funktion f : M → R heißt gleichmäßig stetig auf M , wenn es zu jedem > 0 ein δ > 0 gibt, so dass gilt |x − y| < δ ⇒ |f (x) − f (y)| < 6.2. DER HAUPTSATZ 103 für alle x, y ∈ M . Dies ist fast wie die Definition von Stetigkeit in x. Nur hängt dort δ von x und ab. Hier soll es nur von abhängen. 6.9. Beispiel: (1) Die Funktion f (x) = 1/x, definiert auf ]0, 1[ ist auf diesem Intervall nicht gleichmäßig stetig. (2) Für differenzierbare Funktionen f : [a, b] → R kann man δ in Abhängigkeit von berechnen. Denn es gilt |f (x) − f (y)| = |f 0 (ξ)| |x − y| ≤ |x − y| max |f 0 (ξ)|. ξ∈]a,b[ 6.10 Satz: Jede stetige Funktion f : [a, b] → R ist gleichmäßig stetig. Beweis: Angenommen nicht. Dann gibt es zu einem > 0 kein solches δ, also Folgen xn , yn in [a, b] mit 1 |xn − yn | < , |f (xn ) − f (yn )| ≥ . (1) n Wenn x ∈ [a, b] ein Häufungspunkt von xn ist, so entsteht sofort ein Widerspruch zur Stetigkeit von f in x. Sei nämlich (xkn )n∈N eine Teilfolge, die gegen x konvergiere. Dann konvergiert wegen (1) auch (ykn )n∈N gegen x. Also, wegen der Stetigkeit von f , auch lim f (xkn ) = lim f (ykn ) = f (x). n→∞ n→∞ 2 Dies ist ein Widerspruch zu (1). 6.11 Satz: (Hauptsatz der Differential und Integralrechnung) (1) Jede stetige Funktion f : [a, b] → R ist Riemann-integrierbar. (2) Sei f : [a, b] → R stetig und Z F (x) = x f (t) dt. a Dann ist F : [a, b] → R nach x differenzierbar (an den Rändern einseitig) und es gilt F 0 (x) = f (x). Man nennt F eine Stammfunktion von f . (3) Je zwei Stammfunktionen einer stetige Funktion f : ]a, b[ → R unterscheiden sich nur durch eine Konstante, F1 = F2 + c. 104 KAPITEL 6. INTEGRALRECHNUNG (4) Seien f, F : [a, b] → R stetig, und F 0 (x) = f (x) für alle x ∈ ]a, b[. Dann gilt Z b f (t) dt = F (b) − F (a). a Beweis: (1) Dies folgt aus der gleichmäßigen Stetigkeit. Sei dazu > 0. Wir wählen δ > 0 gemäß der gleichmäßigen Stetigkeit, sowie n ∈ N mit b−a < δ. n Nun definieren wir Treppenfunktionen T1 ≤ f ≤ T2 auf der Unterteilung x0 = a < x1 = a + h < . . . < xn = a + nh = b indem wir T1 (x) = min f (t), t∈[xk−1 ,xk ] T2 (x) = max f (t) t∈[xk−1 ,xk ] für alle x ∈ [xk−1 , xk ] setzen. Dann folgt b Z (T2 (t) − T1 (t)) dt < · (b − a). a Es folgt die Riemann-Integrierbarkeit von f . (2) Sei x ∈ [a, b[. Es gilt min f [x, x + h] ≤ f (t) ≤ max f [x, x + h] für alle t ∈ [x, x + h]. Links und rechts stehen konstante Funktionen auf [x, x + h]. Daraus folgt aufgrund der Monotonie des Integrals Z x+h h min f [x, x + h] ≤ f (t) dt x Z x+h Z f (t) dt − = a x f (t) dt a = F (x + h) − F (x) ≤ h max f [x, x + h]. Wegen der Stetigkeit von f in x folgt F (x + h) − F (x) = f (x). h→0,h>0 h lim Es folgt die Behauptung für die rechtsseitige Ableitung. Analog beweist man die linksseitige Ableitung. Daraus folgt die Differenzierbarkeit von F in x ∈ ]a, b[. (3) Es folgt sofort aus dem Mittelwertsatz, dass eine differenzierbare Funktion, deren Ableitung auf ]a, b[ überall gleich 0 ist, auf [a, b] konstant sein muss. Daher muss die Differenz zweier Stammfunktionen konstant sein. 6.3. PARTIELLE INTEGRATION UND SUBSTITUTION 105 (4) Die in (2) definierte Funktion F ist Stammfunktion von f und stetig in [a, b]. Es gilt per Definition Z b F (a) = 0, F (b) = f (t) dt. a Also gilt die verlangte Gleichung für diese Stammfunktion. Alle anderen Stammfunktionen, die in [a, b] stetig sind, unterscheiden sich nur durch eine Konstante. Für sie folgt der Satz ebenfalls. 2 Man schreibt x=b F (b) − F (a) = [F (x)]x=a . Außerdem schreibt man, etwas salopp, Z F (x) := f (x) dx + c für alle Stammfunktionen von f . Das Integral ohne die Grenzen beschreibt also eine beliebige Stammfunktion von f und wird unbestimmtes Integral genannt. 6.12. Beispiel: (1) Wir erhalten Z xn dx = 1 xn+1 + c n+1 für alle n ∈ N0 und damit für Polynome Z x2 xn+1 (a0 + a1 x + . . . + an xn ) dx = C + a0 x + a1 + . . . + an . 2 n+1 (2) Für die Funktionen x−n , n ∈ Z, erhalten wir das Integral bis auf den Fall n = −1 wie oben. Für n = −1 müssen wir x 6= 0 voraussetzen. Also n+1 Z x + c, n 6= −1, n x dx = n + 1 ln |x| + c, n = −1, x 6= 0. Man beachte für x < 0 d d 1 1 ln |x| = ln(−x) = − = = x−1 dx dx −x x 6.3 Partielle Integration und Substitution 6.13 Satz: Seien f, g : [a, b] → R stetige Funktionen, die in ]a, b[ differenzierbar seien, und deren Ableitungen stetig auf [a, b] fortgesetzt werden können. Dann gilt Z b 0 f (t)g(t) dt = a x=b [f (x)g(x)]x=a Z − a b f (t)g 0 (t) dt. 106 KAPITEL 6. INTEGRALRECHNUNG Man bezeichnet diese Art zu rechnen als partielle Integration, da man ja nur die Stammfunktion des einen Faktors f 0 ermitteln muss. Wir können dies als unbestimmtes Integral in der Form Z Z 0 f (x)g(x) dt = f (x)g(x) − f (x)g 0 (x) dx schreiben. Beweis: Der Satz folgt sofort aus dem Hauptsatz und der Produktregel. 2 6.14. Beispiel: (1) Es gilt Z Z x x xe dx = xe − ex dx = (x − 1)ex + c. Dazu haben wir ex integriert, und x differenziert. In der Tat ist (x−1)ex eine Stammfunktion von xex . (2) Es gilt Z Z ln(x) dx = x ln(x) − 1 dx = x (ln(x) − 1) + c. Dazu haben wir die Konstante 1 integriert, und ln(x) differenziert. 6.15 Satz: Sei f : [a, b] → R stetig. Sei außerdem g : [c, d] → [a, b] eine stetige, in ]c, d[ differenzierbare Funktion, deren Ableitung auf [c, d] stetig fortsetzbar sei. Dann gilt Z g(d) Z d f (t) dt = f (g(s))g 0 (s) ds. g(c) c Dies bezeichnet man als Substitution, da praktisch t = g(s) substituiert wird. Beweis: Wenn F gemäß dem Hauptsatz eine Stammfunktion von f ist, so ist aufgrund der Kettenregel und der (eventuell einseitigen) Differenzierbarkeit von F in allen Punkten g(s), s ∈ ]c, d[ d F (g(s)) = f (g(s))g 0 (s) für alle s ∈ ]c, d[. ds Die Stammfunktion F (g(s)) ist nun aber stetig auf [c, d] fortsetzbar. Aus dem Hauptsatz folgt Z g(d) Z d t=g(d) s=d f (t) dt = [F (t)]t=g(c) = [F (g(s))]s=c = f (g(s))g 0 (s) ds. g(c) c 2 Man beachte, dass sich die Grenzen bei der Substitution ändern. Als Merkregel kann man die Substitution t = g(s) so durchführen, dass man ersetzt t 7→ g(s), dt 7→ d g(s) ds, ds s = d 7→ t = g(d), s = c 7→ t = g(c). 6.4. UNEIGENTLICHE INTEGRALE 107 Mit unbestimmten Integralen geschrieben, lautet der Satz Z Z f (t) dt = f (g(s))g 0 (s) ds + c, wobei t = g(s) nach dem Integrieren zu substituieren ist, und wieder als Merkregel dt 7→ d g(s) ds ds geändert wird. Dies kann man auch als dt ds ds dt = ausdrücken, wobei wir allerdings dafür in dieser Vorlesung keine präzise mathematische Grundlegung haben. Bei der Substitution muss man genau aufpassen, dass f in allen Punkten g(s) definiert ist. Sonst ist das Ergebnis falsch. 6.16. Beispiel: (1) Meist wendet man die Substitution von rechts nach links an. Mit g(s) = s2 + 1 = t gilt beispielsweise Z 0 1 √ Z s s2 + 1 ds = 1 2 h√ it=2 √ 1 √ dt = t = 2 − 1. t=1 2 t Als unbestimmtes Integral Z Z p √ s 1 √ dt = t + c = s2 + 1 + c. √ ds = 2 t s2 + 1 Man beachte die Rück-Substitution t = s2 + 1, sowie die Merkregel dt/ds = 2s. (2) Mit stetigem f : R → R und g(s) = s + d folgt b Z Z b−d f (t) dt = a f (s + d) ds a−d Bei dieser Formel kann man eigentlich auf Stetigkeit verzichten. Sie folgt lediglich durch Betrachtung von Riemannschen Zwischensummen. 6.4 Uneigentliche Integrale Das Riemann-Integral ist in der bisherigen Form an beschränkte Funktionen auf beschränkten, abgeschlossenen Intervallen gebunden. Um mehr damit anfangen zu können, erweitern wir es nun. 6.17. Definition: (1) Sei f : ]a, b] → R auf jedem abgeschlossenen Teilintervall Riemannintegrierbar. Dann definieren wir Z b Z b f (t) dt := lim f (t) dt, a →0 a+ 108 KAPITEL 6. INTEGRALRECHNUNG sofern dieser Grenzwert existiert. Analog für Intervalle [a, b[. (2) Sei f : [a, ∞[ → R auf jedem abgeschlossenen Teilintervall Riemann-integrierbar. Dann definieren wir Z c Z ∞ f (t) dt, f (t) dt := lim c→∞ a a sofern dieser Grenzwert existiert. Analog für ] − ∞, b]. Diese Integrale werden als uneigentliche Integrale bezeichnet. 6.18. Beispiel: (1) Z ∞ x=c 1 −1 dx = lim = 1. c→∞ x2 x x=1 1 x=1 −1 1 = ∞. dx = lim →0 x2 x x= 1 (2) Z 0 Dieses Integral existiert also nur im Sinne der uneigentlichen Grenzwerte. Auf beidseitigen offenen Intervallen muss man die Grenzwerte auf jeder Seite einzeln nehmen. Also Z ∞ Z b f (t) dt = lim lim f (t) dt. a→−∞ b→∞ −∞ a Nimmt man statt dessen Z a lim f (t) dt, a→∞ −a so erhält man den Hauptwert des Integrals. Es kann sein, dass der Hauptwert existiert, die einzelnen Grenzwerte jedoch nicht. Wenn jedoch das uneigentliche Integral existiert, so ist es gleich dem Hauptwert. Ist die Funktion positiv, so kann man zeigen, dass aus der Existenz des Hauptwertes die Existenz des uneigentlichen Integrals folgt. Falls das beidseitig uneigentliche Integral existiert, so gilt Z ∞ Z a f (t) dt = −∞ Z f (t) dt + ∞ f (t) dt −∞ a unabhängig von der Wahl von a ∈ R. Analoges gilt für das uneigentliche Integral auf offenen Intervallen. Außerdem gilt Z ∞ Z f (t) dt = lim −∞ lim b→∞ a→−∞ b f (t) dt. a 6.5. ALLGEMEINE FUNKTIONEN 109 6.19 Satz: Sei f : [1, ∞[ → R eine monoton fallende stetige, positive Funktion. Dann konvergiert die Reihe ∞ X f (k) k=1 genau dann, wenn ∞ Z f (t) dt < ∞ 1 ist. Beweis: In der Tat ist n−1 X Z n f (k) ≥ f (t) dt, 1 k=1 Denn auf der linken Seite steht einer Untersumme des Integrals. Ebenso n X Z n f (k) ≤ f (t) dt. 1 k=2 Aus diesen beiden Abschätzungen folgt die Behauptung. 2 6.20. Beispiel: (1) Es gilt Z ∞ 1 1 dx = ∞. x Daher divergiert die Reihe ∞ X 1 . k k=1 (1) Es gilt Z 2 ∞ x=∞ 1 −1 1 dx = = < ∞. x log(x)2 log x x=2 log 2 Daher konvergiert die Reihe ∞ X k=1 6.5 1 . k log(k)2 Allgemeine Funktionen Für allgemeine, nicht unbedingt stetige Funktionen kann man einige Existenzaussagen machen. Meist ist die Funktion allerdings stückweise stetig, so dass man das Integral aus den Stücken berechnen kann. 110 KAPITEL 6. INTEGRALRECHNUNG 6.21 Satz: Sei f : [a, b] → R Riemann-integrierbar. Dann sind auch die Funktionen f+ = max{f, 0}, f− = − min{f, 0}, |f |, f2 Riemann-integrierbar. Falls g : [a, b] → R ebenfalls Riemann-integrierbar ist, so sind auch die Funktionen f g, max{f, g}, min{f, g} Riemann-integrierbar. Es gilt Z Z b b |f (t)| dt. f (t) dt ≤ a a Beweis: Die Aussage für f+ folgt aus der Betrachtung von Unter- und Obersummen. Bildet man die entsprechenden positiven Anteile von Treppenfunktionen T1 ≤ f ≤ T2 , so wird die Differenz der Integrale kleiner. Es gilt f− = f+ − f , |f | = f+ + f− . Die Aussage für f 2 folgt aus T22 − T12 = (T2 − T1 )(T2 + T1 ). Für eine positive Riemann-Integrierbare Funktion verwendet man dann Treppenfunktionen 0 ≤ T1 ≤ f ≤ T2 . Es gilt aber allgemein 2 2 f 2 = f+ + f− . Es gilt auch 1 ((f + g)2 − f 2 − g 2 ), 2 fg = sowie 1 1 (f + g + |f − g|), min{f, g} = (f + g − |f − g|). 2 2 Die letzte Aussage folgt mit der Dreiecksungleichung aus |f | = f+ + f− , f = f+ − f− . max{f, g} = 2 6.22 Satz: Sei f : [a, b] → R stetig, und g : [a, b] → R Riemann-integrierbar mit g ≥ 0. Dann existiert ein ξ ∈ [a, b] mit Z f (ξ) b Z b g(t) dt = a f (t)g(t) dt. a Speziell existiert ein ξ ∈ ]a, b[ mit Z f (ξ) · (b − a) = b f (t) dt. a Dieser Satz heißt Mittelwertsatz der Integralrechnung. 6.5. ALLGEMEINE FUNKTIONEN 111 Beweis: Man hat wegen g ≥ 0 und der Monotonie des Integrals Z Z b Z b g(t) dt ≤ f (t)g(t) dt ≤ max f (x) min f (x) x∈[a,b] a x∈[a,b] a Im Fall b g(t) dt. a b Z g(t) dt = 0 a gilt wegen der Beschränktheit von f Z | b b Z f (t)g(t) dt| ≤ Z |f (t)g(t)| dt ≤ c a a b g(t) dt = 0. a Man kann also ξ ∈ ]a, b[ beliebig wählen. Andernfalls folgt die Aussage aus dem Zwischenwertsatz für f wegen min f (x) ≤ R b x∈[a,b] a b Z 1 f (t)g(t) dt ≤ max f (x). g(t) dt Der Wert in der Mitte wird also als f (ξ) für ein ξ ∈ [a, b] angenommen. Rb In der Tat kann man ξ ∈ ]a, b[ wählen. Im Fall Ungleichung in (1) eine Gleichheit gilt, so gilt Z b (1) x∈[a,b] a a 2 g = 0 ist das klar. Wenn in der ersten f (t) − min f (x) g(t) dt = 0. x∈[a,b] a Rb Rb Wegen a g > 0 gibt es aber eine Treppenfunktion 0 ≤ T ≤ g mit a T > 0. Es folgt, dass es a ≤ c < d ≤ b gibt mit für alle t ∈ ]c, d[, f (t) = min f (x) x∈[a,b] und ξ kann dann irgendwo im Intervall ]c, d[ gewählt werden. Man hat dann f (ξ) = min f (x) = R b x∈[a,b] a 1 g(t) dt Z b f (t)g(t) dt. a Dasselbe gilt, wenn die zweite Ungleichung eine Gleichheit ist. Wenn aber beide Ungleichungen keine Gleichheiten sind, so kann man sicher ξ ∈ ]x1 , x2 [ wählen, wobei x1 und x2 die Extremalstellen von f sind. 112 KAPITEL 6. INTEGRALRECHNUNG Kapitel 7 Potenzreihen Die numerische Berechnung von Integralen und Funktionen wie ln(x) und ex kann man am schnellsten mit Hilfe von Taylorreihen erreichen. 7.1 Die Taylorreihe Die Taylorreihe einer Funktion ist eine Reihe, deren Partialsummen im Funktionswert und in den Ableitungen bis zu einer gewissen Ordnung in einem gegebenen Punkt mit der Funktion übereinstimmen. Auf diese Weise hofft man, die Funktion möglichst genau zu approximieren. 7.1. Definition: Sei f : I → R in a ∈ R unendlich oft differenzierbar, wobei I ein Intervall ist und x im Innern von I liegt. Dann heißt die formale Reihe ∞ X f (k) (a) k=0 k! (x − a)k = f (a) + f 0 (a)(x − a) + f 00 (a) f 000 (a) (x − a)2 + (x − a)3 + . . . 2 6 die Taylorreihe von f im Punkt a. Die Partialsumme bis n heißt Taylorentwicklung n-ten Grades im Punkt a, und wir bezeichnen mit Rn (x) := f (x) − n X f (k) (a) k=0 k! (x − a)k das Restglied der Taylorentwicklung. Man beachte, dass wir hier (x − a)0 = 1 setzen. Man rechnet nach, dass für die Taylorentwicklung n-ten Grades pn gilt f (a) = pn (a), f 0 (a) = p0n (a), ..., f (n) (a) = p(n) n (a). Wir werden zeigen, dass pn das einzige Polynom n-ten Grades mit dieser Eigenschaft ist. Es kommt im Folgenden darauf an, das Restglied abzuschätzen. Das Restglied ist also durch f (x) = n X f (k) (a) k=0 k! 113 + Rn (x). 114 KAPITEL 7. POTENZREIHEN definiert. Insbesondere Rn+1 (x) = f (n+1) (a) + Rn (x). (n + 1)! (1) 7.2. Beispiel: (1) Die Taylorreihe von ex im Punkt a = 0 ist die Exponentialreihe ex = ∞ X 1 k x k! k=0 Wir wissen, dass die Reihe für alle x ∈ R gegen ex konvergiert. (2) Mit Hilfe der geometrischen Summe weist man nach, dass ∞ X 1 = xk 1−x für alle |x| < 1 k=0 ist. In der Tat ist dies die Taylorreihe der Funktion in a = 0. Sie wird geometrische Reihe genannt. Diese Taylorreihe konvergiert aber nicht mehr überall, wo die Funktion definiert ist, sondern nur in ] − 1, 1[. Abbildung 7.1: f (x) = 1/(1 − x) and T1 , T2 , T5 in a = 0 7.3 Satz: Sei f : I → R n + 1-mal stetig differenzierbar, I ein offenes Intervall mit a, x ∈ I. Dann gilt die Integraldarstellung des Restglieds Z x (x − t)n (n+1) Rn (x) = f (t) dt n! a 7.1. DIE TAYLORREIHE 115 bei der Entwicklung von f in a. Außerdem gibt es ein ξ zwischen a und x, so dass gilt Rn (x) = f (n+1) (ξ) (x − a)n+1 , (n + 1)! was man als Lagrange-Form des Restglieds bezeichnet. Beweis: Per Induktion nach n. Für n = 0 gilt f (x) = T0 (x) + R0 (x) = f (a) + R0 (x). Man erhält wie verlangt Z R0 (x) = f (x) − f (a) = x f 0 (t) dt. a Mittels partieller Integration erhält man Z a x t=x Z x (x − t)n (n+1) (x − t)n+1 (n+2) (x − t)n+1 (n+1) + f (t) dt = − f (t) f (t) dt. n! (n + 1)! (n + 1)! a t=a Das Restglied Rn habe also die gewünschte Darstellung. Dann folgt, wie in (1) verlangt, Rn+1 (x) = f (n+1) (a) (x − a)n+1 + Rn (x), (n + 1)! so dass auch Rn+1 die gewünschte Darstellung hat. Der Beweis der Lagrange-Darstellung folgt nun aus dem Zwischenwertsatz der Integralrechnung 6.22. Man kann diese Darstellung jedoch alternativ auch folgendermaßen herleiten. Dazu definieren wir die Hilfsfunktion h(t) = (f (t) − Tn (t)) · (x − a)n+1 − (t − a)n+1 · (f (x) − Tn (x)). im Intervall [a, x] (bzw. [x, a]). Diese Funktion hat eine (n + 1)-fache Nullstelle in a und eine einfache Nullstelle in x. Durch (n + 1)-fache Anwendung des Satzes von Rolle sieht man, dass hn+1 (t) = f n+1 (t)(x − a)n+1 + (n + 1)! · (f (x) − Tn (x)) noch eine einfache Nullstelle ξ in ]a, x[ hat. Es folgt Rn (x) = f (x) − Tn (x) = f (n+1) (ξ) (x − a)n+1 . (n + 1)! Man beachte, dass ξ zwischen a und x liegt. Der Fall n = 0 ist uns schon bekannt. Denn es gilt nach dem Mittelwertsatz f (x) = f (a) + f 0 (ξ)(x − a). für ein ξ zwischen a und x. 2 116 KAPITEL 7. POTENZREIHEN Wenn f (n + 1)-mal stetig differenzierbar ist, so nimmt f (n+1) in einer Umgebung U von a ein Maximum an. Wir erhalten |Rn (x)| ≤ Cn |x − a|n+1 für alle x ∈ U . Dies schreibt man auch in der Form |Rn (x)| = O(|x − a|n+1 ) (x → a) Es gilt für n-mal stetig differenzierbare Abbildungen f f (n) (a) f (n) (ξ) (x − a)n + Rn (x) = Rn−1 (x) = (x − a)n n! n! mit einem ξ zwischen a und x. Also Rn (x) = (f (n) (ξ) − f (n) (a)) Wir erhalten also lim x→a (x − a)n . n! |Rn (x)| = 0, |x − a|n was man auch in der Form |Rn (x)| = o(|x − a|n ) (x → a) schreibt. Man bezeichnet die Notationen O(η(x)) und o(η(x)) auch als Landau-Symbole. 7.4. Beispiel: Die Taylorreihe von f (x) = (1 + x)α , α ∈ R, bei der Entwicklung um 0 lautet ∞ X α k x , k k=0 mit α α(α − 1) · . . . · (α − (k − 1)) = . k k! für k ∈ N und α = 1. 0 Man beachte, dass diese Reihe für α ∈ N0 abbricht und dann mit der Binomialreihe übereinstimmt. Aus dem Quotientenkriterium folgt leicht, dass die Reihe für alle |x| ≤ 1 konvergiert Die Reihe konvergiert für alle |x| < 1 in der Tat gegen f (x), wie man mit Hilfe des Integralrestgliedes beweist. 7.2 Potenzreihen Wir untersuchen nun Reihen vom Typ der Taylorreihen etwas allgemeiner. Insbesondere werden wir herausfinden, dass sich diese Reihen gliedweise differenzieren und integrieren lassen, wenn sie konvergieren. 7.5. Definition: Eine formale Reihe der Form ∞ X k=0 ak (x − a)k 7.2. POTENZREIHEN 117 mit a, x ∈ R oder a, x ∈ C heißt Potenzreihe um a. Dabei ist (ak )k∈N eine Folge in R oder C. Die Taylorreihen sind Potenzreihen. Also sind die Ergebnisse dieses Abschnittes auf reelle Taylorreihen anwendbar. 7.6. Definition: Für eine Folge von an , n ∈ N, definieren wir den Limes superior als das Supremum aller Häufungspunkte der Folge, wobei wir die Häufungspunkte ±∞ zulassen. Analog definieren wir den Limes inferior als das Infimum aller Häufungspunkte. Wir schreiben lim sup an , lim inf an . n→∞ n→∞ Jede reelle Folge hat einen Häufungspunkt, wenn man ±∞ zulässt. 7.7 Satz: Sei s = lim sup p k |ak |. k→∞ Dann konvergiert die Potenzreihe ∞ X ak (x − a)k k=0 für alle 1 s Sie konvergiert nicht für alle |x − a| > r. r heißt der Konvergenzradius der Potenzreihe. |x − a| < r := Beweis: Es gilt q k |ak (x − a)k | = p k |ak | · |x − a|. Der Satz folgt daher unmittelbar aus dem Wurzelkriterium. Wenn etwa |x − a| < r = ist, so gibt es ein 0 < ρ < 1 und K ∈ N mit p |(x − a) k |ak || < ρ 1 s für alle k > K. Es folgt |ak (x − a)k | < ρk und damit die Konvergenz nach dem Majorantenkriterium. Wenn aber |x − a| > r = 1 s ist, so folgt, dass die Glieder der Reihe nicht gegen 0 konvergieren. Die Fälle s = 0 oder s = ∞ werden auf ähnliche Weise behandelt. 2 118 KAPITEL 7. POTENZREIHEN Es gilt für den Konvergenzradius also r= 1 1 p = lim inf p , k k k→∞ |ak | lim sup |ak | k→∞ wobei wir in diesem Fall 1/0 = ∞ und 1/∞ = 0 setzen. Diese Formel für den Konvergenzradius heißt Formel von Cauchy und Hadamard. 7.8. Beispiel: (1) Die Reihen ∞ X k m xk k=0 haben für alle m ∈ Z den Konvergenzradius 1. (2) Da die Exponentialreihe für alle x ∈ R konvergiert, muss ihr Konvergenzradius ∞ sein. Wir schließen daraus r k 1 = 0. lim sup k! k→∞ Daraus folgt lim k→∞ √ k k! = ∞. Für komplexe Potenzeihen gilt der Satz über den Konvergenzradius ganz analog. In diesem Fall konvergieren die Potenzreihen innerhalb eines Kreises mit Radius r um den Entwicklungspunkt. 7.3 Gleichmäßige Konvergenz Ziel dieses Abschnittes ist es, Potenzreihen zu differenzieren und zu integrieren. Wie sich herausstellt, ist dies innerhalb des Konvergenzradius problemlos möglich. 7.9. Definition: Eine Folge fn : X → R von Funktionen heißt auf X ⊆ R gleichmäßig konvergent gegen eine Funktion f : X → R, wenn die Folge kf − fn k := sup |f (x) − fn (x)| x∈X für n → ∞ gegen 0 konvergiert. Die Größe kf − fn k bezeichnet den maximalen Abstand der Funktionen. Man nennt krk die Supremums-Norm vom r auf X. Wenn die Funktionen stetig sind und X ein kompaktes Intervall, ist das Supremum natürlich ein Maximum. Äquivalent zur gleichmäßigen Konvergenz ist, dass es zu jedem > 0 ein N ∈ N gibt mit |f (x) − fn (x)| < für alle n ≥ N , x ∈ X. 7.10. Beispiel: Die Funktionen f (x) = xn konvergieren auf [0, a] für alle a < 1 gleichmäßig gegen 0, aber nicht auf [0, 1]. 7.3. GLEICHMÄSSIGE KONVERGENZ 7.11 Satz: 119 Der gleichmäßige Grenzwert einer Folge von stetigen Funktionen ist stetig. Beweis: Sei x ∈ X und fn → f auf X gleichmäßig. Wir fixieren > 0. Dazu gibt es ein N ∈ N, so dass |f (t) − fn (t)| < 3 für alle n ≥ N und t ∈ X. Da fn stetig ist, existiert ein δ > 0 mit |t − x| < δ ⇒ |fN (t) − fN (x)| < 3 für alle t ∈ X. Mit der Dreiecksungleichung folgt |f (t) − f (x)| ≤ |f (t) − fN (t)| + |fN (t) − fN (x)| + |fN (x) − f (x)| < 2 für alle t ∈ X mit |t − x| < δ. Der gleiche Satz gilt auch für reell- oder komplex-wertigen Folgen von Funktionen auf X ⊆ C. Er gilt in der Tat in beliebigen metrischen Räumen. Dort definiert man die gleichmäßige Konvergenz von Funktionen durch kf − fn kX = sup d(f (x), fn (x)) → 0. x∈X 7.12 Satz: Die Potenzreihe ∞ X ak (x − a)k k=0 konvergiere in einem Punkt mit |x − a| = r. Dann konvergiert sie für ρ < r im Intervall [a − ρ, a + ρ] gleichmäßig. Das heißt die Folge der Funktionen Sn (x) = n X ak (x − a)k k=0 konvergiert gleichmäßig auf diesem Intervall. Falls die Konvergenz in diesem Punkt absolut ist, so konvergiert die Reihe sogar in [a−r, a+r] gleichmäßig. Der Satz gilt auch in C, wobei die Intervalle durch entsprechende Kreise zu ersetzen sind. Beweis: Da die Reihe in x konvergiert, erhalten wir lim ak rk = 0. k→∞ 120 KAPITEL 7. POTENZREIHEN Denn eine Reihe kann nur konvergieren, wenn ihre Glieder gegen 0 gehen. Seien die Glieder insbesondere durch C > 0 absolut beschränkt. Dann gilt für |t − a| < ρ |ak (t − a)k | ≤ C ρ k r Es folgt die Konvergenz gegen eine Funktion f (t) für |t − a| < ρ aus dem MajorantenKriterium. Für die gleichmäßige Konvergenz berechnen wir ∞ X k |f (t) − Sn (t)| = ak (t − a) ≤ k=n+1 ∞ X |ak (t − a)k | k=n+1 ∞ X ≤C ρ k r k=n+1 = ρ n+1 r C . 1 − ρ/r Es folgt kf − Sn k[a−ρ,a+ρ] → 0. Falls die Potenzreihe in x absolut konvergiert, so verwenden wir statt dessen die Abschätzung |f (t) − Sn (t)| ≤ ∞ X |ak | · |t − a|k ≤ ∞ X |ak | · |x − a|k k=n+1 k=n+1 2 und erhalten dasselbe Ergebnis. Es folgt für den Konvergenzradius nochmals r = sup {|x − a| : Die Potenzreihe konvergiert in x} Dies gilt sowohl in R als auch in C. 7.13 Satz: Wenn die Folge der Riemann-integrierbaren Funktionen fn : [a, b] → R gleichmäßig gegen f : [a, b] → R konvergiert, so ist f auch Riemann-integrierbar, und es folgt Z b Z b lim fn (t) dt = f (t) dt. n→∞ a a Das heißt, Integration und Grenzübergang sind vertauschbar. Beweis: Zunächst ist offenbar f wieder beschränkt, da es sonst nicht gleichmäßiger Limes einer Folge von beschränkten Funktionen sein kann. Sei > 0. Dann existiert ein N ∈ N mit kf − fn k[a,b] ≤ 7.3. GLEICHMÄSSIGE KONVERGENZ 121 für alle n ≥ N . Zu fN gibt es Treppenfunktionen T1 ≤ fN ≤ T̃2 mit Z (T2 (t) − T1 (t)) dt < . a,b Es folgt T̃1 = T1 − < f < T̃2 + = T̃2 Und Z b (T̃2 (t) − T̃1 (t)) dt < + 2 · (b − a). a Auf diese Weise folgt, dass f Riemann-integrierbar ist. Außerdem erhalten wir gemäß Satz 6.21 Z Z Z b b b |fn (t) − f (t)| dt < · (b − a). fn (t) dt − f (t) ≤ a a a 2 für alle n ≥ N . 7.14 Satz: Sei f (x) = ∞ X ak (x − a)k k=0 eine Potenzreihe mit Konvergenzradius r > 0, wobei wir r = ∞ zulassen. Dann ist f in x mit |x − a| < r differenzierbar und es gilt 0 f (x) = ∞ X kak (x − a)k−1 . k=1 Für die Stammfunktion F von f mit F (a) = 0 gilt Z x f (t) dt = F (x) := a ∞ X ak (x − a)k+1 . k+1 k=0 Diese Potenzreihen haben ebenfalls den Konvergenzradius r. Man kann also eine Potenzreihe gliedweise differenzieren und integrieren. Beweis: Die Formel für das Integral folgt sofort aus der gleichmäßigen Konvergenz durch Integrieren der Partialsummen. Die Potenzreihe, die für f 0 angegeben ist, hat den gleichen Konvergenzradius und konvergiert gleichmäßig in [a−ρ, a+ρ] für ρ < r, wie man mit Hilfe der Formel für den Konvergenzradius sieht. Durch Integrieren erkennt man, dass f eine Stammfunktion der Reihe ist. Es folgt die Behauptung. 2 122 KAPITEL 7. POTENZREIHEN 7.15. Beispiel: (1) Es gilt ∞ X n kxk = x k=1 d X k d 1 x x =x = dx dx 1 − x (1 − x)2 k=1 für |x| < 1. (2) Es gilt ∞ X xk k=1 k = ∞ Z X k=0 x k ∞ X x Z t dt = 0 0 ! t Z k x dt = 0 k=0 1 dt = ln 1−t 1 1−x . für |x| < 1. Die Reihe konvergiert aufgrund des Leibniz-Kriteriums auch für x = −1, aber nicht für x = 1. 7.16 Satz: (Abelscher Grenzwertsatz) Eine Potenzreihe f (x) = ∞ X ak (x − a)k k=0 habe den Konvergenzradius r > 0. Wenn die Reihe in a + r konvergiert, so konvergiert sie in diesem Punkt gegen eine stetige Fortsetzung der Funktion f . Beweis: Zur Vereinfachung der Notation nehmen wir a = 0 und r = 1 an. Der allgemeine Satz kann auch darauf zurückgeführt werden. Es ist dann lim f (x) = x↑1 ∞ X ak k=0 zu zeigen. Wir definieren die Partialsummen dieser Reihe in x = 1 als Sk = k X aj . j=0 Diese Folge konvergiert gegen S= ∞ X aj . j=0 Es gilt für |x| < 1 f (x) = (1 − x) ∞ X k=0 Sk xk . 7.3. GLEICHMÄSSIGE KONVERGENZ 123 Denn n X k=0 S k xk − n X n−1 X Sk xk+1 = a0 + k=0 Sk+1 xk+1 − k=0 n−1 X = a0 + n−1 X Sk xk+1 − Sn xn+1 k=0 ak+1 xk+1 − Sn xn+1 k=0 = n X ak xk − Sn xn+1 → f (x). k=0 Wir folgern daraus für |x| < 1 S − f (x) = (1 − x) ∞ X (S − Sk )xk = (1 − x) k=0 mit rk = ∞ X ∞ X rk xk k=0 aj → 0 (k → ∞). j=k+1 Wir erhalten daraus für N ∈ N mit Hilfe der geometrischen Reihe |S − f (x)| ≤ |1 − x| N X |rk | + max |rk |. k=0 k≥N +1 Bei gegebenem > 0 lässt sich daher ein δ > 0 finden, so dass gilt |x − 1| < δ ⇒ |S − f (x)| ≤ . Setzt man f (1) = S, so ist dies also eine stetige Fortsetzung von f nach 1 und S ist der Grenzwert der Potenzreihe in x = 1. 2 Studiert man den Beweis etwas genauer, so stellt man fest, dass die Reihe in [a − ρ, a + r] gleichmäßig konvergiert. 7.17. Beispiel: Aufgrund dieses Satzes konvergiert die Reihe im vorigen Beispiel in x = −1 gegen ∞ X 1 (−1)k = ln k 2 k=1 gilt. In x = 1 konvergiert die Reihe nur uneigentlich gegen ∞, und in der Tat gilt ja auch 1 lim ln = ∞. x↑1 1−x 7.18. Beispiel: Leider liefert der Satz die folgende Identität von Euler ∞ X 1 π2 = 6 k2 k=1 124 KAPITEL 7. POTENZREIHEN nicht auf einfache Weise. Wir erhalten durch Integration der schon hergeleiteten Reihe (dividiert durch x) lediglich Z x ∞ X − ln(1 − t) xk = dt 2 k t 0 k=1 für |x| < 1. Das Integral ist aber nicht elementar auswertbar. Jedoch erhält man durch zweifache Integration (ohne Division durch x) ∞ X k=1 xk+1 = x + ln(1 − x) · (1 − x). k (k + 1) Für x → 1 ist der Grenzwert auf der rechten Seite gleich 1. Und in der Tat ∞ X k=1 1 = 1. k (k + 1) Wir haben dies bereits als Beispiel einer Teleskop-Summe erkannt. Denn 1 1 1 = − . k (k + 1) k k+1 Es bleibt noch zu beweisen, dass die Taylorreihe die eindeutig gegebene Potenzreihe ist, die gegen eine Funktion konvergiert. 7.19 Satz: Die Potenzreihe f (x) = ∞ X ak (x − a)k k=0 habe den Konvergenzradius r > 0. Dann stimmt sie mit der Taylorreihe von f überein. D.h. es gilt f (k) (a) ak = k! für alle k ∈ N. Beweis: Wir berechnen dazu lediglich alle Ableitungen in x = a. Dazu kann man gemäß dem obigen Satz x = a in die gliedweise abgeleitete Reihe einsetzen. Das konstante Glied der n-fach abgeleiteten Reihe ist dann gleich f (n) (a). Also f (n) (a) = n! · an . 2 Es folgt die Behauptung. 7.20. Beispiel: Es gilt für alle x ∈ R exp(x2 ) = ∞ X x2k k=0 k! . 7.4. TRIGONOMETRISCHE FUNKTIONEN 125 Daher steht auf der rechten Seite die Potenzreihe von 2 f (x) = ex . Wir erhalten f (k) (0) = 0, k ungerade, (2j)! , j! k = 2j. Beispielsweise ist 2 f (4) (x) = (16x4 + 28x2 + 12)ex . In der Tat f (4) (0) = 7.4 4! = 12. 2! Trigonometrische Funktionen Da wir nun die Theorie der Potenzreihen zur Verfügung haben, können wir sehr elegant die Sinus- und die Kosinus-Funktion einführen, sowie die Zahl π definieren. Abbildung 7.2: Sinus und Kosinus 7.21. Definition: Wir setzen cos(x) := ∞ X (−1)k k=0 (2k)! x2k ∞ X (−1)k 2k+1 sin(x) := x (2k + 1)! k=0 126 KAPITEL 7. POTENZREIHEN Diese Funktionen heißen Sinus und Kosinus. Es folgt aus der Reihendarstellung der Exponentialfunktion exp(z) = exp(z) und deswegen | exp(ix)| = 1 für alle x ∈ R. Setze man z = ix in die Reihe ein, so erhält man cos(x) = Re (exp(ix)), sin(x) = Im (exp(ix)). Es ist allerdings immer noch nicht klar, ob dies geometrisch Sinn macht. Das können wir erst begründen, wenn wir die Bogenlänge des Kreisbogens von (1, 0) nach (cos(x), sin(x)) berechnen können. Aufgrund der Reihendarstellung sieht man sofort sin(0) = 0, cos(0) = 1, sowie sin(−x) = − sin(x), cos(−x) = cos(x) für alle x ∈ R. 7.22 Satz: (1) Es gilt sin0 (x) = cos(x), cos0 (x) = − sin(x) für alle x ∈ R. Zudem gelten die trigonometrischen Identitäten sin(x)2 + cos(x)2 = 1, sin(x + y) = sin(x) cos(y) + cos(x) sin(y), cos(x + y) = cos(x) cos(y) − sin(x) sin(y) für alle x, y ∈ R. Beweis: Die Ableitungen folgen durch Differenzieren der Potenzreihen. Aufgrund der Fundamentalgleichung für die komplexe Exponentialfunktion gilt 1 = e0 = eix e−ix = (cos(x) + i sin(x))(cos(x) − i sin(x)) = cos(x)2 + sin(x)2 . Die anderen beiden Identitäten erhält man durch Berechnen von exp(i(x + y)) 2 Man kann diese Identitäten auch allein aus der Funktionalgleichung und den Ableitungseigenschaften herleiten. Differenziert man sin2 + cos2 , so wird die Ableitung 0. Die Funktion muss daher konstant sein. Einsetzen von x = 0 ergibt die erste Identität. Ebenso zeigt man die Identitäten sin(x + y) sin(x) + cos(x + y) cos(x) = cos(y), − sin(x + y) cos(x) + cos(x + y) sin(x) = − sin(y) 7.4. TRIGONOMETRISCHE FUNKTIONEN 127 durch Differenzieren nach x für festes y. Die anderen beiden Identitäten folgen daraus mit der Cramerschen Regel. 7.23. Definition: Die Zahl π ist die kleinste positive Nullstelle von sin(x). D.h. π = inf{x : sin(x) = 0, x > 0}. Wegen der Stetigkeit von sin ist sin(π) = 0. Man beachte, dass für |x| < 1 die Sinusreihe eine alternierende Reihe ist. Es folgt x− x3 ≤ sin(x) ≤ x 6 für alle 0 ≤ x ≤ 1. Also ist π > 1. Man rechnet mit der Reihe nach, dass sin(3) > 0 und sin(4) < 0 ist. Es gilt in der Tat π = 3.1415 . . . Abbildung 7.3: Sinus und Kosinus als Funktionen 7.24 Satz: (1) Die Funktion cos ist in [0, π] streng monoton fallend, in [π, 2π] streng monoton wachsend und es gilt cos(0) = 1, cos(π) = −1. cos hat im Intervall [0, π] genau eine Nullstelle in π/2. (2) Die Funktion sin ist in [0, π/2] streng monoton wachsend, und in [π/2, π] streng monoton fallend. Es gilt sin(0) = 0, sin(π/2) = 1, sin(π) = 0. (3) Es gilt für alle x ∈ R für alle k ∈ Z. sin(x + π) = − sin(x), cos(x + π) = − cos(x), sin(x + 2kπ) = sin(x), cos(x + 2kπ) = cos(x). 128 KAPITEL 7. POTENZREIHEN (4) Es gilt π ) = cos(x), 2 π cos(x + ) = − sin(x). 2 sin(x + (5) Es gilt sin(−x) = − sin(x), cos(−x) = cos(x). Also ist sin eine ungerade und cos eine gerade Funktionen. Beweis: (1) Da sin0 = cos, ist cos und sin(x) > 0 für alle x ∈ [0, π], folgt, dass die Funktion cos in [0, π] streng monoton fällt. Wegen sin(x)2 + cos(x)2 = 1 und sin(0) = 0, sin(π) = 0, muss cos(0) = 1 und cos(π) = −1 gelten. Außerdem gilt cos(2x) = cos(x)2 − sin(x)2 = 1 − 2 sin(x)2 = 2 cos(x)2 − 1. Es folgt cos(π/2) = 0. (2) Die Monotonie folgt wegen sin0 = cos. Wegen cos(π/2) = 0 folgt auch sin(π/2) = 1. (3) Man verwendet die trigonometrischen Identitäten. Etwa sin(x + π) = sin(x) cos(π) + cos(x) sin(π) = − sin(x), und die entsprechende Identität für cos(x+π). Daraus folgt die zweite Behauptung zunächst für k = 1. Per Induktion folgt sie für alle k ∈ N. Andererseits haben wir nun für k ∈ N sin(x − 2kπ) = sin(x − 2kπ + 2kπ) = sin(x). (4) Diese Gleichungen folgen wieder mit Hilfe der geometrischen Identitäten. (5) Diese Gleichungen können direkt aus der Reihe abgelesen werden. 2 Eine Funktion f : R → R mit f (x + ka) = f (a) für alle x ∈ R und k ∈ Z nennt man a-periodisch. Sinus und Kosinus, sowie die daraus abgeleiteten trigonometrischen Funktionen, sind also 2π-periodische Funktionen. Wegen der Symmetrieeigenschaften von sin und cos genügt es, die Funktionen auf [0, π/2] berechnen zu können. Dort konvergieren die Reihen gut genug. Men benötigt dennoch etwa 10 Glieder der Reihe. Da die Reihe alterniert kann man das nächste Folgenglied als Abschätzung verwenden. Wir erhalten 10 X (−1)k x2k+1 (π/2)21 < 10−15 . ≤ sin(x) − (2k + 1)! 21! k=0 7.4. TRIGONOMETRISCHE FUNKTIONEN 129 für x ∈ [0, π/2]. Die Punkte mπ sind für m ∈ Z die Nullstellen des Sinus. Die ungeraden Vielfachen von π/2, also die Punkte x = (2m + 1) π 2 für alle m ∈ Z, sind die Nullstellen des Kosinus. 7.25 Satz: Sei x, y ∈ R mit x2 + y 2 = 1. Dann gibt es genau ein t ∈ [0, 2π[ mit x = cos(t), y = sin(t). Folglich lässt sich jeder Punkt (x, y) ∈ R2 (x, y) 6= (0, 0) eindeutig als (x, y) = (r cos(t), r sin(t)) mit r > 0 und t ∈ [0, 2π[ schreiben. Jedes z ∈ C, z 6= 0 lässt sich eindeutig in der Form z = reit mit r > 0 und t ∈ [0, 2π[ schreiben. Beweis: Wir nehmen zunächst den Fall 0 ≤ y ≤ 1. Wir wählen nun nach dem Zwischenwertsatz ein t ∈ [0, π] mit cos(t) = x. Wegen x2 + y 2 = 1, cos(t)2 + sin(t)2 = 1 muss nun y = ± sin(t) gelten. Wegen y > 0 und sin(t) > 0 folgt x = cos(t), y = sin(t). Im Fall −1 ≤ y < 0 wählen wir t ∈]π, 2π[ mit cos(t) = x. Dann folgt dasselbe. Wir schließen daraus, dass für |z| = 1 ein t ∈ [0, 2π[ existiert mit z = eit = cos(t) + i sin(t). Die Eindeutigkeit kann durch genauere Betrachtung der obigen Auswahl aus der strengen Monotonie des cos in den betrachteten Intervallen geschlossen werden. Es ist aber auch folgendes Argument möglich. Angenommen 0 ≤ t1 < t2 < 2π, eit1 = eit2 . Dann folgt mit t = t2 − t1 eit = 1, t ∈ ]0, 2π[. 130 KAPITEL 7. POTENZREIHEN Man erhält cos(t) = 1, was nicht möglich ist. Sei z ∈ C, z 6= 0. Dann definieren wir r = |z|, z̃ = z . |z| 2 Wegen |z̃| = 1 folgt die Behauptung. Es gilt eiπ = −1. 7.26. Definition: Wo sin und cos streng monoton wachsend sind, haben sie eine Umkehrfunktion. Gewöhnlich definiert man die Umkehrfunktionen auf folgende Weise. sin : [−π/2, π/2] → [−1, 1], cos : [0, π] → [−1, 1], Definiert man dann für x2 + y 2 = 1 ( t= arcsin : [−1, 1] → [−π/2, π/2], arccos : [−1, 1] → [0, π]. arccos(x), y ≥ 0, 2π − arccos(x), y < 0, so gilt x = cos(t), y = sin(t). 7.27. Definition: Wir definieren den Tangens tan(x) := sin(x) cos(x) in allen Punkten, in denen cos(x) 6= 0 ist. Man berechnet tan0 (x) = 1 . cos(x)2 tan ist also zwischen je zwei Definitionslücken streng monoton wachsend. Außerdem gilt lim tan(x) = −∞, x↓−π/2 lim tan(x) = ∞. x↑π/2 Daher hat tan eine Umkehrfunktion i π πh arctan : R → − , . 2 2 Es gilt arctan0 (y) = mit y = tan(x). 1 1 = cos(x)2 = cos(arctan(y)) = tan0 (x) 1 + y2 7.5. PARTIALBRUCHZERLEGUNG 7.5 131 Partialbruchzerlegung Dies ist eine Technik, mit der man Integrale von rationalen Funktionen berechnen kann. Wir werden uns auf Beispiele beschränken. 7.28. Beispiel: (1) Gesucht ist Z 1 dx x2 − 1 auf den Intervallen ] − ∞, −1[, ] − 1, 1[, ]1, ∞[, wo diese Funktion wohldefiniert ist. Eine Partialbruchzerlegung ist nun eine Darstellung der Form A B 1 = + . x2 − 1 x+1 x−1 Es folgt durch Ausmultiplizieren und Koeffizientenvergleich A = 1/2, B = −1/2. Also Z 1 1 1 = ln(x + 1) − ln(x − 1) + c. x2 − 1 2 2 Natürlich kann die Konstante c in jedem Teilintervall anders gewählt werden, und man erhält dennoch eine Stammfunktion. (2) Analog erhält man x+1 1−x 1 = 2 + . x(x2 + 1) x +1 x Es folgt Z 1 1 dx = arctan(x) − ln(x2 + 1) + ln(|x|) + c = ln x(x2 + 1) 2 r x+1 + c. x+1 Allerdings funktioniert das im folgenden Beispiel nicht mehr. Man kommt auf andere Art zum Ziel. Z Z 1 x 1 1 dx = − dx = ln(|x|) + ln(x2 + 1) + c. x(x2 + 1) x x2 + 1 2 (3) Man berechnet Z x2 1 dx +x+1 2 =√ 3 Z 1 2 2 dx = √ arctan(y) + c = √ arctan y2 + 1 3 3 mit Hilfe der Substitution x= 1 √ (2x + 1) + c 3 1 √ ( 3y − 1). 2 Damit kann man auch kompliziertere Nenner behandeln. Die meisten dieser Integrale stehen allerdings in Formelsammlungen bereit. 132 7.6 KAPITEL 7. POTENZREIHEN Die Stirlingsche Formel Große Fakultäten n! sind ebenso wie große Binomialkoeffizienten nicht leicht zu berechnen. Die Stirlingsche Formel bietet eine Approximation, die für viele Zwecke genau genug ist. Zum Beweis der Formel benötigen wir eine Produktdarstellung von π von Wallis. Insgesamt wendet dieses Kapitel die bisher erlangten Kenntnisse trickreich an. 7.29. Definition: Wir sagen, dass ein Produkt ∞ Y bk k=1 konvergiert, wenn die Folge der Partialprodukte gegen einen Wert b 6= 0 konvergiert. 7.30 Satz: Sei (ak )k∈N eine Folge von positiven reellen Zahlen oder eine Folge von negativen reellen Zahlen. Dann konvergiert das Produkt ∞ Y (1 + ak ) k=1 genau dann, wenn die Reihe ∞ X ak k=1 konvergiert. Beweis: Wir nehmen zunächst ak > 0 für alle k ∈ N an. Es gilt ln n Y ! (1 + ak ) = k=1 n X ln(1 + ak ) ≤ k=1 n X ak . k=1 wegen ln(1 + x) ≤ x für alle x > 0. Wenn die Summe also konvergiert, so ist die Folge der Partialprodukte beschränkt und strikt monoton wachsend. Das Produkt konvergiert also. Wenn umgekehrt das Produkt konvergiert, so ist konvergiert die Summe ∞ X ln(1 + ak ). k=1 Es folgt ak → 0. Wegen ln(1 + x) ≥ x/2 für 0 ≤ x ≤ 1 folgt aus dem Majorantenkriterium, dass auch die Reihe konvergieren muss. Sei nun (ak )k∈N eine Folge von negativen Zahlen. Das Produkt kann dann nur konvergieren, wenn ak → 0 gilt. Wegen 1 ak |ak | =1− =1+ 1 + ak 1 + ak 1 − |ak | konvergiert der Kehrwert des Produktes genau dann, wenn die angegebene Reihe konvergiert. Alternativ kann man für diesen Fall das Argument leicht modifiziert wiederholen. 2 7.6. DIE STIRLINGSCHE FORMEL 7.31 Satz: 133 Es gilt ∞ Y π 4k 2 = . 2 4k 2 − 1 k=1 Diese Darstellung nennt man das Wallissche Produkt. Beweis: Wir definieren für n > 0 π Z sin(x)n dx. cn := 0 Dann erfüllen diese Zahlen die Rekursionsformel c0 = π, c1 = 2, cn = n−1 cn−2 n für n ≥ 2. Folglich n Y 2k − 1 , 2k c2n = π c2n+1 = 2 n Y k=1 k=1 2k . 2k + 1 Es gilt aufgrund der Rekursionsformel lim n→∞ c2n+2 = 1. c2n Wegen der Monotonie der Folge cn folgt lim n→∞ c2n+1 = 1. c2n 2 Man erhält nun das Wallissche Produkt. 7.32 Satz: Es gilt n! ∼ √ 2πn n n . e Dabei bedeutet an ∼ bn , dass an /bn → 1 konvergiert. Man nennt die Folgen asymptotisch gleich. Die Asymptotik für n! heißt Stirlingsche Formel. Beweis: Sei gk die lineare Funktion, die ln(x) in k und k+1 interpoliert. Mittels zweimaliger partieller Integration stellt man für rk (x) = ln(x) − gk (x) fest Z k+1 Z k+1 00 (x − k)(k + 1 − x)rk (x) dx = rk (x) dx. k k Wegen der Konkavität von ln ist rk > 0. Wegen rk00 (x) = 1/x2 ist Z 0< k+1 rk (x) dx = k −rk00 (ξ) 1 ≤ . 12 12k 2 134 KAPITEL 7. POTENZREIHEN Also existiert ∞ Z X k=1 k k+1 Z ln(x) dx − rk (x) dx = lim n→∞ n 0 n−1 X ! gk (x) dx k=1 n−1 X 1 = lim n ln(n) − n + 1 − (ln(k + 1) + ln(k)) n→∞ 2 k=1 ln(n) . = lim n ln(n) − n + 1 − ln(n!) + n→∞ 2 ! Folglich existiert auch der Grenzwert c > 0 von n! e n cn = √ . n n Es gilt √ c2n 22n (n!)2 2 √ √ c = lim = lim = 2π n→∞ c2n n→∞ (2n)! n mit Hilfe des Wallisschen Produktes. 2 Index -δ-Kriterium, 59 -Umgebung, 16 (Abelscher Grenzwertsatz, 122 äquidistante Unterteilung, 97 überabzählbar, 33, 52 abgeschlossen, 58 abgeschlossene Hülle, 58 abgeschlossenes Intervall, 14 Ableitung, 72 Ableitungsfunktion, 73 Abschluss, 57 absolut, 47 Abstiegsprinzip, 29 abzählbar, 25 additive Inverse, 8 alternierende, 46 Anfangsstück, 24 angeordneter Körper, 11 archimedisch angeordnet, 40 arithmetische Summe, 30 assoziativ, 8 Aufzählung, 25 Dreiecksungleichung, 16 einseitige Ableitung, 73 einseitige Grenzwerte, 61 endlich, 24 Eulersche Zahl, 41 Exponentialreihe, 114 Exponentialfunktion, 54, 83 Extrema, 68 Fakultäten, 23 Feinheit, 96 Fibonacci, 24 Fixpunkt, 90 Folge, 23 formale, 45 fortsetzen, 61 Fortsetzung, 61 beschränkt, 13 beschränkte Folge, 39 Betrag, 15 Binomialentwicklung, 31 Binomialkoeffizient, 30 Bisektionsverfahren, 42 ganzen Zahlen, 33 ganzzahligen Anteil, 40 gebrochener Anteil, 40 geometrische, 45 geometrische Reihe, 114 geometrische Summe, 30 gerade, 128 gleichmäßig, 102 gleichmäßig konvergent, 118 gliedweise, 121 Grenzwert, 35, 58 Calculus, 71 Cantorsches Diagonal-Argument, 52 Cauchy und Hadamard, 118 Cauchy-Folge, 48 Cauchy-Produkt, 55 charakteristische Funktion, 97 Häufungspunkt, 43 halboffene Intervalle, 14 harmonische Reihe, 46 Hauptsatz, 103 Hauptwert, 108 Hintereinanderausführung, 80 Dezimalentwicklung, 51 differenzierbar, 72 Distributivgesetz, 8 divergente Folgen, 44 Imaginärteil, 18 Induktionsanfang, 22 Induktionsschluss, 22 Induktionsvoraussetzung, 22 135 136 induktiv, 21, 23 Infimum, 14 Integraldarstellung, 114 Intervallschachtelung, 41 Körper, 7 Körper der komplexen Zahlen, 18 kürzen, 64 Kettenregel, 81 kommutativ, 8 konjugiert komplexe Zahl, 19 konkaven, 91 Konvergenzradius, 117 konvergiert, 35 konvex, 91 konvexe Mengen, 45 Kosinus, 126 kritischen Punkten, 76 Kurvendiskussion, 79 INDEX Nullstellen, 63 nullteilerfrei, 9 obere Schranke, 13 Oberintegral, 96 offene Mengen, 17 offenes Intervall, 14 Partialsummen, 45 partielle Integration, 106 Pascalschen Dreieck, 31 Polynom, 63 positiv definit, 16 Potenzen, 23 Potenzmenge, 32 Potenzreihe, 117 Produktraum, 29 Quadratwurzel, 42 Quotienten-Kriterium, 50 Lagrange-Form, 115 Landau-Symbole, 116 Leibniz-Kriterium, 47 Limes inferior, 117 Limes superior, 117 Linearität, 101 Logarithmus naturalis, 83 Logarithmus zur Basis, 86 lokaler, 68 rationale Funktion, 63 rationalen Zahlen, 33 Realteil, 18 Reihe, 45 rekursiv, 23 Restglied, 113 Riemann-integrierbar, 96 Riemannsche Zwischensumme, 99 Ring, 33 Mächtigkeit, 25 Majoranten-Kriterium, 49 majorisiert, 49 Maximalpunkt, 68 Maximum, 13, 68 Metrik, 16 metrischer Raum, 16 Minimum, 13 Minoranten-Kriterium, 50 Mittelwertsatz, 75, 76, 110 monoton wachsend, 39 Monotonie, 101 Monotonie-Intervalle, 78 multiplikative Inverse, 8 Sandwich-Prinzip, 38 Satz von Rolle, 76 Sekante, 72, 91 Sekantensteigung, 72 Sinus, 126 stückweise, 61 Stammfunktion, 103 stetig, 58 stetig differenzierbar, 73 streng monoton wachsend, 39 strikt konvex, 93 Substitution, 106 Supremum, 14 symmetrisch, 16 nach oben beschränkt, 13 Nachdifferenzieren, 81 natürliche Zahlen, 21 natürlicher Logarithmus, 84 neutrale Element, 8 Tangens, 130 Tangente, 72 Tangenten-Definition, 80 Taylorentwicklung, 113 Taylorreihe, 113 INDEX Teilfolge, 37 Teleskop-Summen, 49 transitiv, 11 Treppenfunktion, 95 trigonometrischen Identitäten, 126 Tupel, 29 Umkehrfunktion, 66 Umordnungssatz für Reihen, 54 unbestimmtes Integral, 105 uneigentlich, 44 uneigentliche, 61, 108 uneigentlichen, 108 ungerade, 128 Ungleichung von Bernoulli, 24, 40 untere Schranke, 13 Unterintegral, 96 Untersumme, 96 Unterteilung, 95 Verdichtungskriterium von Cauchy, 46 vertauschbar, 120 verträglich, 11 Vielfachheit, 63 vollständig, 11 vollständigen Induktion, 22 vollständiger metrischer Raum, 53 Vorzeichen, 15 Wendepunkt, 91 Wurzel, 68 Wurzel-Kriterium, 51 zweimal differenzierbar, 73 zweite Ableitung, 73 Zwischenwertsatz, 65 137