Analysis I Oliver Goertsches Philipps-Universität Marburg Skript zur Vorlesung im Sommersemester 2016 2 Inhaltsverzeichnis 1 Folgen 1.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . 1.2 Reelle Zahlen . . . . . . . . . . . . . . . . . . . . . 1.3 Konvergenz reeller Zahlenfolgen . . . . . . . . . . . 1.4 Supremum und Infimum, Maximum und Minimum 1.5 Metrische Räume . . . . . . . . . . . . . . . . . . . 1.6 Cauchy-Folgen . . . . . . . . . . . . . . . . . . . . 1.7 Vervollständigung . . . . . . . . . . . . . . . . . . . 1.8 Folgerungen aus der Vollständigkeit von R . . . . . 1.8.1 Existenz von Supremum und Infimum . . . 1.8.2 Existenz k-ter Wurzeln . . . . . . . . . . . . 1.8.3 Der Satz von Bolzano-Weierstraß . . . . . . 1.9 Mehr Beispiele von Grenzwerten . . . . . . . . . . 1.10 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . 1.11 Normierte Räume . . . . . . . . . . . . . . . . . . . 1.12 Topologische Räume . . . . . . . . . . . . . . . . . 1.13 Kompaktheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 5 7 13 14 19 21 25 25 26 27 27 29 31 36 37 2 Reihen 2.1 Konvergente Reihen . . . . . 2.2 Absolute Konvergenz . . . . . 2.3 Weitere Konvergenzkriterien . 2.4 Klammerung und Umordnung 2.5 Das Cauchyprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 41 44 45 48 50 3 Stetigkeit 3.1 Stetige Abbildungen . . . . . . . . . . . . . . 3.2 Stetige Abbildungen auf R . . . . . . . . . . . 3.3 Varianten der Stetigkeit . . . . . . . . . . . . 3.4 Stetige Funktionen auf kompakten Räumen . 3.5 Äquivalenz von Normen auf Rn . . . . . . . . 3.6 Konvergenz von Funktionenfolgen . . . . . . . 3.7 Funktionenreihen . . . . . . . . . . . . . . . . 3.8 Potenzreihen . . . . . . . . . . . . . . . . . . 3.9 Trigonometrische Funktionen und die Zahl π. 3.10 Der Fundamentalsatz der Algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 53 57 62 63 64 66 68 71 76 80 . . . . . 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 INHALTSVERZEICHNIS 4 Differentialrechnung 4.1 Die Ableitung . . . . . . . . . . . . . . . . . . . . 4.2 Stetige Differenzierbarkeit . . . . . . . . . . . . . 4.3 Lokale Extrema . . . . . . . . . . . . . . . . . . . 4.4 Der Mittelwertsatz . . . . . . . . . . . . . . . . . 4.5 Die Regel von de l’Hospital . . . . . . . . . . . . 4.6 Differenzierbarkeit und gleichmäßige Konvergenz 4.7 Differenzierbarkeit von Potenzreihen . . . . . . . 4.8 Taylorentwicklung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 81 85 87 88 90 91 93 95 Kapitel 1 Folgen 1.1 Einleitung Eine grundlegende Schwierigkeit dieser Einleitung, wie auch der gesamten Vorlesung, ist, dass sie sich an verschiedene Hörerkreise richtet. Nicht nur befinden sich unter Ihnen Bachelor- und Lehramtsstudierende, Mathematik-, Wirtschaftsmathematik-, Physik- und Studierende anderer Fächer – die größte didaktische Hürde besteht darin, dass sich viele von Ihnen bereits mindestens im zweiten Semester befinden, und damit sowohl die Lineare Algebra I als auch die Grundlagenvorlesung bereits gehört haben, für andere dies aber das erste Semester ist. Das ist insofern problematisch, dass diese Vorlesung den Stoff der Grundlagenvorlesung verwendet. Genauer gesagt baut unser Stoff auf Logik und Mengenlehre, einigen grundlegenen Begriffen wie Relationen und Abbildungen, sowie auf der Kenntnis der wichtigsten Zahlbereiche – der natürlichen, der ganzen, der rationalen und der reellen Zahlen – auf. Wir werden hier kurz einige Resultate der Grundlagenvorlesung über reelle Zahlen zusammenfassen und im Folgenden benutzen. Diejenigen von Ihnen, für die dieses Sommersemester das erste Semester ist, müssen daher etwas geduldiger sein und manche Resultate zunächst als gegeben hinnehmen; im Laufe des Semesters werden Sie diese dann in der parallel laufenden Grundlagenvorlesung genauer kennenlernen. Haben Sie Geduld - im nächsten Semester haben Sie dafür in der Linearen Algebra I genau den Vorteil, den die momentanen Zweitsemester nun in der Analysis I haben. 1.2 Reelle Zahlen In diesem Abschnitt werden wir die Resultate aus der Grundlagenvorlesung über die reellen Zahlen zusammenfassen. Dort wurden sukzessive die bekannten Zahlbereiche aus den natürlichen Zahlen N = {0, 1, 2, . . .} konstruiert: Zunächst die ganzen Zahlen Z = {. . . , −2, −1, 0, 1, 2, . . .}, und dann aus diesen die rationalen Zahlen Q = { ab | a ∈ Z, b ∈ Z \ {0}}. Der schwierigste Schritt bestand darin, aus den rationalen Zahlen die reellen Zahlen R zu konstruieren. Die genaue Konstruktion ist im Moment für uns nicht relevant; wir werden später darauf zurückkommen. Stattdessen listen wir hier die für uns wichtigen Eigenschaften der reellen Zahlen auf – die Ihnen größtenteils aber bereits aus der Schule 5 6 KAPITEL 1. FOLGEN bekannt sein sollten. Es gibt eine Abbildung + : R × R −→ R; (a, b) 7−→ a + b, genannt Addition, so dass folgende Bedingungen gelten: 1. (Kommutativität der Addition) Für alle a, b ∈ R gilt a + b = b + a. 2. (Assoziativität der Addition) Für alle a, b, c ∈ R gilt a+(b+c) = (a+b)+c. 3. (Existenz der Null) Es gibt ein Element 0 ∈ R, so dass für alle a ∈ R gilt, dass a + 0 = 0 + a = a. 4. (Existenz additiv inverser Elemente) Für alle a ∈ R gibt es ein eindeutiges Element b ∈ R, so dass a + b = b + a = 0. Wir bezeichnen es mit −a. Es gibt eine Abbildung · : R × R −→ R; (a, b) 7−→ a · b, genannt Multiplikation, so dass folgende Bedingungen erfüllt sind: 1. (Kommutativität der Multiplikation) Für alle a, b ∈ R gilt a · b = b · a. 2. (Assoziativität der Multiplikation) Für alle a, b, c ∈ R gilt a·(b·c) = (a·b)·c. 3. (Existenz der Eins) Es gibt ein Element 1 ∈ R, so dass 1 6= 0 und so dass für alle a ∈ R gilt, dass a · 1 = 1 · a = a. 4. (Existenz multiplikativ inverser Elemente) Für alle a ∈ R \ {0} gibt es ein eindeutiges Element b ∈ R, so dass a · b = b · a = 1. Wir bezeichnen es mit a−1 oder a1 . 5. (Distributivgesetz) Für alle a, b, c ∈ R gilt a · (b + c) = a · b + a · c. All diese Eigenschaften zusammengenommen besagen, dass die Menge R, zusammen mit den Verknüpfungen + und ·, einen Körper bilden. In der Grundlagenvorlesung werden weitere Eigenschaften der reellen Zahlen gezeigt, beispielsweise dass R ein geordneter Körper ist. Dies bedeutet zunächst, dass es eine Relation ≤ auf R gibt, so dass folgende Bedingungen erfüllt sind: 1. Für alle a ∈ R gilt a ≤ a. 2. Falls für a, b, c ∈ R gilt, dass a ≤ b und b ≤ c, so folgt a ≤ c. 3. Falls für a, b ∈ R gilt, dass a ≤ b und b ≤ a, so folgt a = b. 4. Für alle a, b ∈ R gilt a ≤ b oder b ≤ a. Diese Bedingungen besagen, dass ≤ eine sogenannte Totalordnung ist. Die Relation ≤ macht R zu einem geordneten Körper, da sie in folgendem Sinne mit der Körperstruktur von R verträglich ist: 1. Für alle a, b, c ∈ R, so dass a ≤ b gilt auch, dass a + c ≤ b + c. 2. Für alle a, b ∈ R, so dass 0 ≤ a und 0 ≤ b, gilt 0 ≤ a · b. (Das Produkt nichtnegativer reeller Zahlen ist nichtnegativ.) 1.3. KONVERGENZ REELLER ZAHLENFOLGEN 7 Wir schreiben für a ≤ b auch b ≥ a, sowie a < b (oder b > a), falls a ≤ b und a 6= b. Wir führen eine Notation für folgende wichtige Teilmengen der reellen Zahlen ein: für a < b sei [a, b] = {x ∈ R | a ≤ x ≤ b}, (a, b) = {x ∈ R | a < x < b}, [a, b) = {x ∈ R | a ≤ x < b}, (a, b] = {x ∈ R | a < x ≤ b}. sowie Für a ∈ R setzen wir desweiteren [a, ∞) = {x ∈ R | a ≤ x}, (a, ∞) = {x ∈ R | a < x} und (−∞, a] = {x ∈ R | x ≤ a}, (−∞, a) = {x ∈ R | x < a}. Man beachte, dass die Symbole ∞ und −∞ für uns im Moment keine alleinstehende Bedeutung haben. All diese Mengen nennen wir Intervalle (auch R selbst nennen wir ein Intervall); solche der Form [a, b] nennen wir abgeschlossene Intervalle, solche der Form (a, b) offene. Die der Form [a, b) und (a, b] heißen halboffene Intervalle. Die restlichen Typen nennen wir uneigentliche Intervalle. Mit Hilfe der Kleinergleich-Relation können wir auch den Betrag einer reellen Zahl definieren: es ist für a ∈ R ( a falls 0 ≤ a |a| := −a sonst. Der Betrag erfüllt einige Eigenschaften: es gilt |a · b| = |a| · |b| für alle reellen Zahlen a, b sowie |1/a| = 1/|a| für alle a ∈ R \ {0}. Weiterhin gilt die Dreiecksungleichung: für alle a, b ∈ R gilt |a + b| ≤ |a| + |b|. Die Kleinergleich-Relation ermöglicht es uns auch, vom Maximum und Minimum zweier (oder endlich vieler) reeller Zahlen zu sprechen: sind a1 , . . . , an ∈ R, so sei max{a1 , . . . , an } = ai , wenn i ein Index ist, so dass ai ≥ aj für alle j = 1, . . . , n. Analog ist min{a1 , . . . , an } = ai , wenn i ein Index ist, so dass ai ≤ aj für alle j = 1, . . . , n. Weiterhin gilt, dass R nicht bloß ein geordneter Körper, sondern ein archimedisch geordneter Körper ist. Das bedeutet: Für alle a ∈ R existiert eine natürliche Zahl n ∈ N, so dass a ≤ n. Alle bislang aufgeführten Eigenschaften der reellen Zahlen gelten auch für die in R enthaltenen rationalen Zahlen Q = { ab | a ∈ Z, b ∈ Z \ {0}}: auch Q ist ein archimedisch geordneter Körper. Die Eigenschaft, die Q von R unterscheidet, ist, dass R vollständig ist; diese Eigenschaft wurde in der Grundlagenvorlesung des letzten Semesters behandelt, die Vollständigkeit von R aber nicht bewiesen. Darauf werden wir später noch zurückkommen. 1.3 Konvergenz reeller Zahlenfolgen Zwei der zentralen Begriffe der Analysis sind der Begriff der Konvergenz und der Grenzwertbegriff. In diesem Abschnitt werden wir diese Konzepte im Kontext der reellen Zahlen betrachten. Auch dies wurde zum Teil bereits in der Grundlagenvorlesung des letzten Semesters behandelt. Wir definieren zunächst allgemein: 8 KAPITEL 1. FOLGEN Definition 1.3.1. Es sei X eine Menge. Dann ist eine Folge in X eine Abbildung a : N → X. Wir schreiben an := a(n) und sprechen von der Folge (an )n∈N = (a0 , a1 , a2 , . . .). Die Elemente an nennen wir die Folgenglieder der Folge (an ). In einer beliebigen Menge haben wir keinen Begriff des Abstands zwischen zwei Elementen zur Verfügung. Damit ist es auch nicht möglich, Konzepte wie Grenzwert oder Konvergenz zu definieren. Betrachten wir jedoch die reellen Zahlen R, so können wir zu zwei Zahlen x, y ∈ R die Zahl |x − y| als Abstand von x und y interpretieren. Damit können wir definieren: Definition 1.3.2. Es sei (an )n∈N eine Folge reeller Zahlen. 1. Es sei a ∈ R. Wir sagen, dass die Folge (an ) gegen a konvergiert, falls gilt: ∀ ε ∈ R, ε > 0 ∃ n0 ∈ N ∀n ≥ n0 : |a − an | < ε. 2. Falls eine Zahl a ∈ R existiert, so dass (an ) gegen a konvergiert, so sagen wir, dass die Folge (an ) konvergiert. 3. Falls die Folge (an ) nicht konvergiert, so sagen wir, dass sie divergiert. Ebenso wichtig wie die formale Definition eines Begriffs ist die Anschauung dahinter: weshalb ist dieser Begriff so definiert wie er es ist? Der Konvergenzbegriff, mag er auch auf den ersten Blick abschreckend, da sehr formal, wirken, ist sehr intuitiv: die Konvergenz einer reellen Folge gegen eine Zahl a soll bedeuten, dass sie sich a schlussendlich immer weiter annähert. Das bedeutet: Wenn wir ein noch so kleines Intervall um a betrachten, so wird die Folge ab irgendeinem Folgenglied komplett in diesem Intervall liegen. Beispiel 1.3.3. 1. Wir betrachten die Folge an = n1 und behaupten, dass sie gegen 0 konvergiert. Dafür sei ε > 0 beliebig vorgegeben. Da R ein archimedisch geordneter Körper ist, gibt es eine natürliche Zahl n0 , so dass n0 > 1ε , d.h. n10 < ε. Dann gilt für alle n ≥ n0 : |0 − an | = | − 1 1 1 |= ≤ < ε. n n n0 Es folgt, dass an gegen 0 konvergiert. 2. Wir behaupten, dass die Folge an = n divergiert. Dafür müssen wir für jedes a ∈ R begründen, dass an nicht gegen a konvergiert. Wir fixieren also a ∈ R und müssen zeigen, das ∃ ε > 0 ∀ n0 ∈ N ∃n ≥ n0 : |a − an | ≥ ε. Wir setzen ε = 1. Es sei n0 ∈ N gegeben; zu finden ist also eine Zahl n ≥ n0 , so dass |a − an | = |a − n| = |n − a| ≥ 1. Wir wissen, dass es eine natürliche Zahl n1 gibt, so dass n1 > a + 1; dann sei n = max{n0 , n1 }. Es folgt, da n ≥ n1 > a, dass n − a > 0, also gilt |n − a| = n − a ≥ n1 − a > 1. Folgen, die wie im ersten dieser Beispiele gegen 0 konvergieren, erhalten einen speziellen Namen: 1.3. KONVERGENZ REELLER ZAHLENFOLGEN 9 Definition 1.3.4. Es sei (an )n∈N eine Folge reeller Zahlen, die gegen 0 konvergiert. Dann heißt (an )n∈N eine Nullfolge. Nun, da wir die Konvergenz einer Folge reeller Zahlen (an ) gegen eine reelle Zahl a definiert haben, sind wir versucht, von a als dem Grenzwert der Folge (an ) zu sprechen. Aber Achtung: wenn wir hier einen bestimmten Artikel verwenden, behaupten wir implizit, dass eine Folge reeller Zahlen höchstens einen Grenzwert besitzt! Dies ist intuitiv richtig – aber muss zunächst bewiesen werden: Lemma 1.3.5. Es sei (an )n∈N eine Folge reeller Zahlen, und a, b ∈ R, so dass (an ) sowohl gegen a als auch gegen b konvergiert. Dann gilt a = b. Beweis. Es sei ε > 0 beliebig. Da (an ) gegen a konvergiert, gibt es ein n0 ∈ N, so dass für alle n ≥ n0 gilt, dass |a − an | < 2ε . Da die Folge auch gegen b konvergiert, gibt es ein n1 ∈ N, so dass für alle n ≥ n1 gilt, dass |b − an | < 2ε . Nun setzen wir n = max{n0 , n1 } das Maximum der beiden natürlichen Zahlen n0 und n1 . Dann folgt aus der Dreiecksungleichung: |a − b| = |a − an + an − b| = |(a − an ) + (an − b)| ≤ |a − an | + |an − b| < ε ε + = ε. 2 2 Da ε als beliebige positive reelle Zahl gewählt war, folgt, dass |a − b| = 0, und damit, dass a = b. Da wir nun gesehen haben, dass eine Folge reeller Zahlen gegen höchstens eine reelle Zahl konvergieren kann, definieren wir: Definition 1.3.6. Es sei (an )n∈N eine gegen a ∈ R konvergente Folge reeller Zahlen. Dann nennen wir a den Grenzwert der Folge (an ). Wir bezeichnen ihn mit limn→∞ an . Bemerkung 1.3.7. Man beachte: die reelle Zahl limn→∞ an darf erst dann verwendet werden, wenn die Konvergenz der Folge (an ) gezeigt ist, andernfalls ist der Ausdruck limn→∞ an noch nicht definiert. Lemma 1.3.8. Es sei (an ) eine konvergente Folge reeller Zahlen. Dann gibt es ein C > 0, so dass |an | < C für alle n ∈ N. Beweis. Es sei (an ) eine Folge reeller Zahlen mit limn→∞ an = a ∈ R. Nach Definition der Konvergenz gibt es ein n0 ∈ N, so dass |a − an | < 1 für alle n ≥ n0 . Für solche n folgt |an | = |an − a + a| ≤ |an − a| + |a| < |a| + 1. Setzen wir D := max{|am | | m ∈ N, m < n0 }, so folgt für alle n ∈ N, dass |an | < C := max{|a| + 1, D + 1}. Für Grenzwerte gelten einige Rechenregeln: Satz 1.3.9. Es seien (an )n∈N und (bn )n∈N konvergente Folgen reeller Zahlen. Dann gilt: 1. Die Folge (an + bn )n∈N ist ebenfalls konvergent, und es gilt limn→∞ (an + bn ) = limn→∞ an + limn→∞ bn . 10 KAPITEL 1. FOLGEN 2. Die Folge (an ·bn )n∈N ist ebenfalls konvergent, und es gilt limn→∞ (an ·bn ) = (limn→∞ an ) · (limn→∞ bn ). Bemerkung 1.3.10. Man beachte: die reelle Zahl limn→∞ an darf erst dann verwendet werden, wenn die Konvergenz der Folge (an ) gezeigt ist, andernfalls ist limn→∞ an noch nicht definiert. Beweis. Zu 1.: Es sei ε > 0 beliebig vorgegeben. Da (an ) gegen den Grenzwert a := limn→∞ an konvergiert, gibt es ein n0 ∈ N, so dass für alle n ≥ n0 gilt, dass |a − an | < 2ε . Genauso gibt es n1 ∈ N, so dass für alle n ≥ n1 gilt, dass |b − bn | < 2ε , wobei b = limn→∞ bn . Für alle n ≥ max{n0 , n1 } folgt damit aus der Dreiecksungleichung, dass ε ε |a + b − an − bn | ≤ |a − an | + |b − bn | < + = ε. 2 2 Wir haben gezeigt, dass (an + bn ) gegen a + b konvergiert. Zu 2.: Nach Lemma 1.3.8 gibt es C > 0, so dass |an | < C für alle n ∈ N. Weiterhin können wir (eventuell nach Vergrößerung von C) annehmen, dass |b| < C. Es sei nun ε > 0 vorgegeben. Es gibt natürliche Zahlen n0 ∈ N, so dass ε ε für alle n ≥ n0 , sowie n1 ∈ N, so dass |b − bn | < 2C für n ≥ n1 . |a − an | < 2C Für alle n ≥ max{n0 , n1 } gilt dann |an bn − ab| = |an bn − an b + an b − ab| = |an (bn − b) + (an − a)b| ≤ |an ||bn − b| + |an − a||b| ε ε <C· + · C = ε, 2C 2C unter Verwendung der Dreiecksungleichung und der obigen Ungleichungen. Satz 1.3.11. Es seien (an )n∈N und (bn )n∈N zwei konvergente Folgen reeller Zahlen mit limn→∞ bn 6= 0. Dann gibt es ein n0 ∈ N, so dass bn 6= 0 für alle n ≥ n0 . Weiterhin konvergiert die Folge der Quotienten (an /bn )n≥n0 , mit Grenzwert an limn→∞ an lim = . n→∞ bn limn→∞ bn Beweis. Es genügt, den Spezialfall, dass (an ) die konstante Folge an = 1 ist, zu betrachten – der allgemeine Fall folgt dann mit Satz 1.3.9, indem man die Glieder der Quotientenfolge als Produkt an · (1/bn ) schreibt. Da b := limn→∞ bn 6= 0, gibt es ein n0 ∈ N, so dass |b − bn | < |b|/2 für alle n ≥ n0 . Damit ist nach der in den Übungen bewiesenen umgekehrten Dreiecksungleichung |bn | = |b − (b − bn )| ≥ |b| − |b − bn | ≥ |b|/2 > 0 für diese n. Nun sei ε > 0 vorgegeben. Es gibt ein n1 ∈ N, so dass |b − bn | < ε|b|2 2 für alle n ≥ n1 . Damit gilt für alle n ≥ max{n0 , n1 }, dass 2 1 − 1 = 1 |b − bn | < 2 · ε|b| = ε. bn 2 b |bn ||b| |b| 2 Es folgt, dass limn→∞ 1 bn = 1b . 1.3. KONVERGENZ REELLER ZAHLENFOLGEN Beispiel 1.3.12. Wir betrachten die Folge an := an = 2n2 +3n+7 7n2 +10n . 11 Es gilt 2 + 3/n + 7/n2 ; 7 + 10/n der Zähler dieses Ausdrucks geht für n → ∞ gegen 2, der Nenner gegen 7. Nach Satz 1.3.11 folgt limn→∞ an = 27 . Sehr nützlich ist die folgende, als Sandwichsatz bekannte Aussage: Satz 1.3.13. Es seien (an ) und (bn ) zwei konvergente Folgen mit limn→∞ an = limn→∞ bn =: a. Weiterhin sei (cn ) eine Folge, so dass an ≤ cn ≤ bn für alle n. Dann ist auch cn konvergent, mit limn→∞ cn = a. Beweis. Es sei ε > 0 beliebig vorgegeben. Dann existiert ein n0 ∈ N, so dass für alle n ≥ n0 gilt, dass |a − an | < ε und |a − bn | < ε. (Man wähle als n0 das Maximum der beiden entsprechenden Zahlen für die Folgen (an ) und (bn )). Wir behaupten, dass für alle n ≥ n0 auch |a − cn | < ε. Es sei n ≥ n0 . Wir betrachten zunächst den Fall, dass cn ≥ a. In diesem Fall gilt |a − cn | = cn − a ≤ bn − a = |bn − a| < ε. Im Fall, dass cn ≤ a, gilt aber auch |a − cn | = a − cn ≤ a − an = |a − an | < ε. Damit haben wir gezeigt, dass auch cn gegen a konvergiert. Oft wird dieser Satz in dem Fall angewendet, dass eine der beiden Folgen an und bn konstant ist. Als nächstes betrachten wir als Beispiele einige Folgen, zeigen deren Konvergenz und bestimmen ihre Grenzwerte. Für eines dieser Beispiele brauchen wir folgendes Hilfsmittel: Satz 1.3.14 (Bernoullische Ungleichung). Für alle x ∈ R mit x ≥ −1 und alle n ∈ N gilt (1 + x)n ≥ 1 + nx. Beweis. Wir beweisen diese Aussage per vollständiger Induktion. Sie gilt für n = 0, da (1 + x)0 = 1 = 1 + 0 · x für alle x ≥ −1. Es gelte die Behauptung nun für n ∈ N; wir zeigen sie für n+1. Da 1+x ≥ 0, und damit auch (1 + x)n ≥ 0, folgt (1 + x)n+1 = (1 + x)(1 + x)n ≥ (1 + x)(1 + nx) = 1 + (n + 1)x + nx2 ≥ 1 + (n + 1)x. Dies zeigt die Behauptung. Beispiel 1.3.15. 1. Es sei p ∈ N, p ≥ 1. Dann ist die Folge (1/np ) eine Nullfolge. Den Fall p = 1 haben wir bereits in Beispiel 1.3.3 betrachtet. Den Fall p ≥ 2 zeigt man per Induktion, da es sich bei der betrachteten Folge um das p-fache Produkt der Folge (1/n) mit sich selbst handelt; nach Satz 1.3.9 konvergiert dann auch dieses gegen 0. 12 KAPITEL 1. FOLGEN 2. Es sei q ∈ R mit |q| < 1. Dann ist die Folge (q n ) eine Nullfolge: Für q = 0 ist nichts zu zeigen; wir betrachten den Fall 0 < |q| < 1. Dann ist 1 |q| = 1 + h für ein h > 0. Da nach der Bernoullischen Ungleichung (Satz 1.3.14) gilt, dass (1 + h)n ≥ 1 + nh, folgt |q n | = |q|n = 1 1 1 ≤ < . (1 + h)n 1 + nh nh Ist nun ε > 0 beliebig gegeben, so finden wir, da h > 0, ein n0 ∈ N mit 1 n0 > hε > 0. Dann gilt für alle n ≥ n0 , dass |q n | < 1 1 ≤ < ε. nh n0 h Es folgt, dass (q n ) eine Nullfolge ist. 3. Es sei q ∈ R mit |q| < 1. Dann gilt limn→∞ (1 − q) n X qi = i=0 n X qi − i=0 n X Pn i=0 qi = 1 1−q : da q i+1 = 1 − q n+1 , i=0 gilt also an := n X i=0 qi = 1 − q n+1 . 1−q Es folgt an − 1 |q|n+1 = . 1−q |1 − q| Wir haben oben gesehen, dass (|q|n+1 ) eine Nullfolge ist. Damit ist auch 1 die Multiplikation dieser Folge mit dem festen Wert |1−q| eine Nullfolge. 1 Wir haben gezeigt, dass an − 1−q eine Nullfolge ist, was äquivalent zur Behauptung ist. 4. Es gilt limn→∞ 1+2+···+n = 12 . Denn: der Zähler lässt sich als 1 + 2 + · · · + n2 n = n·(n+1) schreiben, und damit gilt 2 n · (n + 1) n+1 1 1 1 + 2 + ··· + n = = = + ; 2 2 n 2n 2n 2 2n 1 da ( 2n ) eine Nullfolge ist, folgt die Behauptung. Warnung: Man könnte versucht sein wie folgt zu rechnen: lim n→∞ 1 + 2 + ··· + n 1 n = ( lim 2 ) + · · · + ( lim 2 ) = 0 + · · · + 0 = 0; n→∞ n n→∞ n n2 dies ist aber falsch! In Satz 1.3.9 haben wir gesehen, dass die Summe zweier konvergenter Folgen wieder konvergent ist, und der Grenzwert der Summe die Summe der Grenzwerte ist. Dies gilt dann induktiv auch für eine Summe endlich vieler konvergenter Folgen; in unserem jetzigen Beispiel variiert die Anzahl der Summanden aber mit dem Folgenindex! 1.4. SUPREMUM UND INFIMUM, MAXIMUM UND MINIMUM 13 Zum Schluss dieses Abschnitts erwähnen wir noch, dass wir verschiedene Formen der Divergenz unterscheiden können: Definition 1.3.16. Es sei (an ) eine Folge reeller Zahlen. Dann sagen wir, dass a gegen +∞ divergiert, wenn für alle C > 0 ein n0 ∈ N existiert, so dass an > C für alle n ≥ n0 . Man schreibt auch limn→∞ an = +∞. Wir sagen, dass a gegen −∞ divergiert, wenn für alle C > 0 ein n0 ∈ N existiert, so dass an < −C für alle n ≥ n0 . Man schreibt auch limn→∞ an = −∞. Beispiel 1.3.17. Die Folge an = n divergiert gegen +∞. Die Folge an = −n divergiert gegen −∞. Die Folge an = (−1)n n divergiert zwar, aber weder gegen +∞ noch gegen −∞. 1.4 Supremum und Infimum, Maximum und Minimum Definition 1.4.1. 1. Eine Teilmenge M ⊂ R heißt nach unten beschränkt, wenn es eine Zahl a ∈ R gibt, so dass für alle x ∈ M gilt, dass a ≤ x. Jede solche Zahl a heißt eine untere Schranke von M . 2. Eine Teilmenge M ⊂ R heißt nach oben beschränkt, wenn es eine Zahl b ∈ R gibt, so dass für alle x ∈ M gilt, dass x ≤ b. Jede solche Zahl b heißt eine obere Schranke von M . 3. Eine Teilmenge M ⊂ R heißt beschränkt, wenn sie nach unten und nach oben beschränkt ist. Ist a eine untere Schranke von M ⊂ R, so ist auch jede kleinere Zahl als a eine untere Schranke von M . Analog gilt: ist b eine obere Schranke, so auch jede größere Zahl als b. Definition 1.4.2. Es sei M ⊂ R eine Teilmenge. 1. Ist a ∈ R eine untere Schranke von M , so dass jede größere Zahl als a keine untere Schranke von M ist, so nennen wir a größte untere Schranke oder Infimum von M . 2. Ist b ∈ R eine obere Schranke von M , so dass jede kleinere Zahl als b keine obere Schranke von M ist, so nennen wir b kleinste obere Schranke oder Supremum von M . Infimum und das Supremum einer Teilmenge sind, sofern sie existieren, eindeutig. Denn: ist a Infimum von M ⊂ R, so kann eine größere Zahl als a nach Definition des Infimums keine untere Schranke von M , und damit erst recht kein Infimum von M sein. Ist a0 < a, so ist a0 zwar ebenfalls eine untere Schranke von M , aber es gibt nun eine größere Zahl als a0 (nämlich a), die auch eine untere Schranke von M ist, weswegen a0 kein Infimum von M ist. Analog argumentiert man, um die Eindeutigkeit des Supremums einer Teilmenge von R zu zeigen. Natürlich ist eine Teilmenge M ⊂ R, die ein Infimum besitzt, nach unten beschränkt, und die Existenz eines Supremums impliziert die Beschränkung nach 14 KAPITEL 1. FOLGEN oben. Später werden wir, unter Benutzung der Vollständigkeit von R, zeigen, dass jede beschränkte Teilmenge von R Supremum und Infimum besitzt. Man beachte, das das Infimum bzw. das Supremum einer Teilmenge M ⊂ R nicht unbedingt in M liegen muss. Beispielsweise ist 0 das Infimum der Menge { n1 | n ∈ N}. Definition 1.4.3. Es sei M ⊂ R eine Teilmenge und a ∈ M so, dass a ≤ x für alle x ∈ M . Dann nennen wir a das Minimum von M . Analog nennen wir ein b ∈ M , so dass x ≤ b für alle x ∈ M das Maximum von M . Existiert das Maximum (bzw. Minimum) einer Teilmenge M ⊂ R, so ist dieses gleichzeitig das Supremum (bzw. Infimum) von M . Definition 1.4.4. Wir nennen eine Folge (an ) reeller Zahlen (nach oben/unten) beschränkt, wenn die Menge {an | n ∈ N} die entsprechende Eigenschaft hat. Lemma 1.3.8 besagt: Lemma 1.4.5. Jede konvergente Folge reeller Zahlen ist beschränkt. 1.5 Metrische Räume Dem Begriff der Konvergenz lässt sich in weitaus allgemeineren Situationen als für Folgen in den reellen Zahlen Sinn verleihen. Der Begriff des metrischen Raumes erlaubt Abstandsbetrachtungen in viel allgemeinerem Kontext: Definition 1.5.1. Ein metrischer Raum ist eine Menge X, zusammen mit einer Abstandsfunktion (auch Metrik genannt), d.h. einer Abbildung d : X × X → R≥0 , die folgende Bedingungen erfüllt: 1. Für x, y ∈ X gilt genau dann d(x, y) = 0 wenn x = y 2. Es gilt d(x, y) = d(y, x) für alle x, y ∈ X 3. Es gilt die Dreiecksungleichung: für alle x, y, z ∈ X gilt d(x, z) ≤ d(x, y) + d(y, z). Beispiel 1.5.2. 1. Die reellen Zahlen R, zusammen mit der Abstandsfunktion d(x, y) := |x − y| bilden einen metrischen Raum. 2. Ist (X, d) ein metrischer Raum, und Y ⊂ X eine Teilmenge, so wird Y mit der Abstandsfunktion d|Y ×Y : Y × Y → R≥0 zu einem metrischen Raum. Wir nennen d|Y ×Y auch die induzierte Metrik auf Y . 3. Ist X eine beliebige Menge, so definiert ( 0 x=y d(x, y) := 1 x= 6 y. eine Metrik auf X, die sogenannte diskrete Metrik. 1.5. METRISCHE RÄUME 15 4. Auf Rn , der Menge der n-Tupel reeller Zahlen, ist durch d(x, y) := ||x − y||2 := n X (xi − yi )2 !1/2 i=1 für x = (x1 , . . . , xn ) und y = (y1 , . . . , yn ) ∈ Rn , eine Metrik definiert. Man beachte, dass wir die Existenz der Wurzel einer reellen Zahl erst viel später aus der Vollständigkeit von R folgern werden. Dass dies eine Metrik ist, werden wir dann in Satz 1.11.11 beweisen. 5. Wir betrachten R2 und fixieren einen Punkt Paris ∈ R2 . Für x, y ∈ R2 sei dann d0 (x, y) = ||x − y||2 , falls x, y und Paris auf einer Geraden liegen, und d0 (x, y) = ||x − Paris||2 + ||y − Paris||2 , falls nicht. In einer Übungsaufgabe werden wir sehen, dass dies wirklich eine Metrik auf R2 definiert, die sogenannte Französische Eisenbahnmetrik. (Motivation: die kürzeste Verbindung zwischen zwei Orten in Frankreich führt immer über Paris.) 6. Es seien (X, dX ) und (Y, dY ) metrische Räume. Dann definiert d((x1 , x2 ), (y1 , y2 )) := d(x1 , y1 ) + d(x2 , y2 ) eine Metrik auf X ×Y . Wir nennen (X ×Y, d) das Produkt der metrischen Räume X und Y . Die in 1.3.2 gegebene Definition der Konvergenz einer Folge reeller Zahlen lässt sich nun auf Folgen in einem metrischen Raum übertragen: Definition 1.5.3. Es sei (X, d) ein metrischer Raum und (xn )n∈N eine Folge in X. 1. Es sei x ∈ X. Wir sagen, dass die Folge (xn ) gegen x konvergiert, falls gilt: ∀ ε > 0 ∃ n0 ∈ N ∀n ≥ n0 : d(x, xn ) < ε. 2. Falls x ∈ X existiert, so dass (xn ) gegen x konvergiert, so sagen wir, dass die Folge (xn ) konvergiert. 3. Falls die Folge (xn ) nicht konvergiert, so sagen wir, dass sie divergiert. Die in Lemma 1.3.5 bewiesene Aussage über die Eindeutigkeit des Grenzwerts einer konvergenten Folge gilt auch für Folgen in metrischen Räumen. Der Beweis ist eine Übungsaufgabe. Lemma 1.5.4. Es sei (X, d) ein metrischer Raum. Es seien (xn )n∈N eine Folge in X, und x, y ∈ X, so dass (xn ) sowohl gegen x als auch gegen y konvergiert. Dann gilt x = y. Beispiel 1.5.5. Es sei d die diskrete Metrik auf einer Menge X. Dann ist eine Folge (xn ) in X genau dann konvergent, wenn es ein n0 ∈ N gibt, ab dem die Folge konstant ist. 16 KAPITEL 1. FOLGEN Definition 1.5.6. Es sei X ein metrischer Raum, x0 ∈ X und ε > 0. Dann heißt Bε (x0 ) = {x ∈ X | d(x, x0 ) < ε} der ε-Ball um x. Definition 1.5.7. Es sei X ein metrischer Raum und A ⊂ X eine Teilmenge. Wir nennen A beschränkt, wenn es ein C > 0 und ein x ∈ X gibt, so dass A ⊂ BC (x). Eine Folge (an ) in X heißt beschränkt, wenn die Menge {an } beschränkt ist. Man beachte: in einem allgemeinen metrischen Raum ergibt es keinen Sinn, von Beschränkung nach oben oder unten zu sprechen. Lemma 1.5.8. Jede konvergente Folge in einem metrischen Raum ist beschränkt. Beweis. Es sei (an ) eine konvergente Folge in einem metrischen Raum X, mit limn→∞ an = a. Es gibt ein n0 ∈ N, so dass für alle n ≥ n0 gilt, dass d(a, an ) < 1. Setzen wir C := max{d(a, a0 ), . . . , d(a, an0 −1 ), 1}, so gilt d(a, an ) ≤ C für alle n ∈ N. Es folgt, dass {an } ⊂ BC+1 (a). Definition 1.5.9. Es sei (X, d) ein metrischer Raum. 1. Eine Teilmenge U ⊂ X heißt offen in X, wenn für alle x ∈ U ein ε > 0 existiert, so dass Bε (x) ⊂ U . 2. Eine Teilmenge A ⊂ X heißt abgeschlossen in X, wenn X \ A offen in X ist. Lemma 1.5.10. Es sei (X, d) ein metrischer Raum, x ∈ X und ε > 0. Dann ist Bε (x) offen in X. Beweis. Es ist zu zeigen, dass für alle y ∈ Bε (x) ein δ > 0 existiert, so dass Bδ (y) ⊂ Bε (x). Setzen wir δ = ε − d(x, y), so folgt für z ∈ Bδ (y) aus der Dreiecksungleichung, dass d(x, z) ≤ d(x, y) + d(y, z) < d(x, y) + δ = ε. Proposition 1.5.11. Es sei (X, d) ein metrischer Raum. Dann gilt: 1. ∅ und X sind offen in X. 2. Es seien S Ui , i ∈ I, in X offene Mengen (I eine beliebige Indexmenge). Dann ist i∈I Ui ebenfalls offen in X. Tn 3. Es seien U1 , . . . , Un in X offene Mengen. Dann ist i=1 Ui ebenfalls offen in X. Beweis. Es ist offensichtlich, dass ∅ und X offen in X sind. Für Teil 2. seien S Ui , i ∈ I, in XSoffene Mengen; wir möchten zeigen, dass i∈I Ui offen in X ist. Dafür sei x ∈ i∈I Xi beliebig. Es gibt also ein j ∈ I, so dass S x ∈ Xj . Da Xj in X offen ist, gibt es also ein ε > 0, so dass Bε (x) ⊂ Xj ⊂ i∈I Xi . Dies zeigt Teil 2. Für T Teil 3. seien endlich viele in X offene Mengen U1 , . . . , Un gegeben. Es n sei x ∈ i=1 Ui . Damit ist x in jeder der Mengen Ui enthalten, und es gibt also Zahlen εi > 0, so dass Bεi (x) ⊂ Ui . Setzen wir ε = min{ε Tn1 , . . . , εn }, so erhalten wir für alle i, dass Bε (x) ⊂ Bεi (x) ⊂ Ui , also Bε (x) ⊂ i=1 Ui . 1.5. METRISCHE RÄUME 17 Beispiel 1.5.12. 1. Wir betrachten den metrischen Raum R mit dem Standardabstand. Für a, b ∈ R, a < b, ist das offene Intervall (a, b) := {x ∈ R | a < x < b} offen in R. Um dies einzusehen, sei x ∈ (a, b) beliebig; setzen wir dann ε := min{|x − a|, |x − b|}, so gilt Bε (x) = {y ∈ R | |y − x| < min{|x − a|, |x − b|}} ⊂ (a, b). Genauso sind die linksseitig unendlichen offenen Intervalle (−∞, b) := {x ∈ R | x < b} und die rechtsseitig unendlichen offen Intervalle (a, ∞) := {x ∈ R | a < x} offen in R. 2. Wir betrachten weiterhin R. Die abgeschlossenen Intervalle [a, b] := {x ∈ R | a ≤ x ≤ b}, wobei a, b ∈ R, a < b, sind abgeschlossen in R, denn das Komplement R \ [a, b] = (−∞, a) ∪ (b, ∞) ist Vereinigung von in R offener Mengen und damit in R offen. Dasselbe gilt für die linksseitig unendlichen abgeschlossenen Intervalle (−∞, b] := {x ∈ R | x ≤ b} und die rechtsseitig unendlichen abgeschlossenen Intervalle [a, ∞) := {x ∈ R | a ≤ b}. 3. Sind a, b ∈ R, a < b, so nennen wir (a, b] = {x ∈ R | a < x ≤ b} und [a, b) = {x ∈ R | a ≤ x < b} halboffene Intervalle. Diese sind weder offen noch abgeschlossen in R. 4. Die Begriffe Offenheit und Abgeschlossenheit hängen stark vom umgebenden Raum ab. Es sei X = (0, ∞) ⊂ R, versehen mit der durch die Standardmetrik induzierten Metrik. Dann ist (0, 1] zwar nicht in R abgeschlossen, aber in X, da X \ (0, 1] = (1, ∞) offen in X ist. Lemma 1.5.13. Es sei X ein metrischer Raum und A ⊂ X eine Teilmenge. Dann ist A genau dann abgeschlossen in X, wenn der Grenzwert jeder Folge in A, die in X konvergiert, bereits in A liegt. Beweis. Es sei A ⊂ X abgeschlossen, d.h. X \ A sei offen. Es sei (an ) nun eine Folge in A, die in X konvergiert, d.h. limn→∞ an =: x ∈ X existiert. Falls x ∈ / A, so existiert, da X \ A offen ist, ein ε > 0, so dass Bε (x) ⊂ X \ A. Das widerspricht aber der Tatsache, dass die Folgenglieder der Folge (an ) dem Grenzwert x beliebig nahe kommen und darüber hinaus in A liegen. Umgekehrt gelte nun, dass A ⊂ X die Eigenschaft hat, dass der Grenzwert jeder Folge in A, die in X konvergiert, bereits in A liegt. Wir müssen zeigen, dass X \ A offen ist. Wäre X \ A nicht offen, so gäbe es ein x ∈ X \ A, so dass für alle n ∈ N gilt, dass B n1 (x) ∩ A 6= ∅. Wir können also ein xn ∈ B n1 (x) ∩ A wählen. Die Folge (xn ) konvergiert dann nach Konstruktion in X gegen x, was ein Widerspruch zur angenommenen Eigenschaft von A ist. Definition 1.5.14. Es sei X eine Menge und (xn )n∈N eine Folge in X. Sind n0 < n1 < n2 < · · · natürliche Zahlen, so nennen wir (xnk )k eine Teilfolge von (xn ). Man zeigt leicht per Induktion: sind n0 < n1 < n2 < · · · natürliche Zahlen, so ist nk ≥ k für alle k. Lemma 1.5.15. Es sei (X, d) ein metrischer Raum und (xn )n∈N eine konvergente Folge in X, mit limn→∞ xn = x. Dann konvergiert auch jede Teilfolge von (xn ) gegen denselben Grenzwert x. Beweis. Es sei (xnk )k eine Teilfolge der gegen x konvergenten Folge (xn ). Es sei ε > 0 gegeben. Da (xn ) gegen x konvergiert, gibt es N ∈ N, so dass für alle 18 KAPITEL 1. FOLGEN k ≥ N gilt, dass |x − xk | < ε. Für diese k gilt aber auch |x − xnk | < ε, da nk ≥ k ≥ N . Beispiel 1.5.16. 1. Es sei ( an = 1 n n n gerade n ungerade. Die Teilfolge a2n ist eine Teilfolge der Nullfolge ( n1 )n∈N und damit ebenfalls eine Nullfolge. Die Teilfolge a2n+1 divergiert jedoch. Damit konvergiert (an ) selbst nicht. 2. Wir betrachten die Folge an := (−1)n + n1 . Wir sehen, dass die Teilfolge 1 1 gegen 1 konvergiert, die Teilfolge a2n+1 = −1 + 2n+1 aber a2n = 1 + 2n gegen −1. Damit ist (an ) selbst nicht konvergent. Wir sehen, dass es passieren kann, dass lediglich Teilfolgen einer Folge gegen einen Grenzwert konvergieren, nicht die gesamte Folge. Das führt uns zu folgendem Begriff: Definition 1.5.17. Es sei (X, d) ein metrischer Raum und (xn )n∈N eine Folge in X. Dann nennen wir x ∈ X einen Häufungspunkt der Folge (xn ), falls gilt: ∀ ε ∈ R, ε > 0 ∀ n ∈ N ∃ N ≥ n : d(x, xN ) < ε. Es ist sinnvoll, diese Definition mit Definition 1.5.3 zu vergleichen: während die Definition der Konvergenz verlangt, dass für jedes noch so kleine Intervall um den Grenzwert gilt, dass alle bis auf endlich viele Folgenglieder in diesem Intervall liegen, wird hier weniger verlangt: es muss lediglich beliebig große n geben, so dass xn in diesem Intervall liegt. Genauer: Lemma 1.5.18. Es sei (X, d) ein metrischer Raum, (xn )n∈N eine Folge in X, und x ∈ X. Dann ist x genau dann ein Häufungspunkt von (xn ), wenn es eine Teilfolge von (xn ) gibt, die gegen x konvergiert. Beweis. Es sei x ein Häufungspunkt der Folge (xn ). Es sei n ∈ N beliebig. Sind n0 , . . . , nk bereits gewählt, so existiert, da x ein Häufungspunkt ist, eine 1 natürliche Zahl nk+1 > nk , so dass d(x, xnk+1 ) < k+1 . Dann konvergiert die Teilfolge (xnk )k gegen x: es sei ε > 0 beliebig. Dann existiert ein k ∈ N, so dass 1 1 1 k < ε. Für alle K ≥ k gilt dann d(x, xnK ) < K ≤ k < ε. Umgekehrt sei (xnk )k eine konvergente Teilfolge der Folge (xn ). Es sei x ihr Grenzwert. Wir behaupten, dass x ein Häufungspunkt von (xn ) ist. Es sei dafür ε > 0 und n ∈ N beliebig vorgegeben. Da (xnk )k gegen x konvergiert, gibt es ein k0 ∈ N, so dass d(x, xnk ) < ε für alle k ≥ k0 . Da wir k ≥ k0 so groß wählen können, dass auch nk ≥ n, haben wir überprüft, dass x ein Häufungspunkt ist. Beispiel 1.5.19. Wir betrachten noch einmal Beispiel 1.5.16: die erste Folge hat als einzigen Häufungspunkt 0, konvergiert aber nicht gegen 0; die zweite Folge hat die beiden Häufungspunkte −1 und 1. 1.6. CAUCHY-FOLGEN 1.6 19 Cauchy-Folgen Wir wissen, dass die Folge (1/n)n als Folge in R gegen 0 konvergiert. Wir können diese Folge aber auch als Folge im metrischen Raum R \ {0} betrachten; dort konvergiert sie nicht. Dies liegt aber nun nicht in der Folge (1/n)n begründet, sondern lediglich in der Tatsache, dass 0 kein Element des Raumes R \ {0} ist. Auch im Raum R \ {0} hat die Folge (1/n)n noch die Eigenschaft, dass die Folgenglieder mit wachsendem Index immer näher rücken“, im Sinne der ” folgenden Definition: Definition 1.6.1. Es sei (X, d) ein metrischer Raum. Dann heißt eine Folge (xn )n∈N in X eine Cauchy-Folge, falls gilt: ∀ ε ∈ R, ε > 0 ∃ n0 ∈ N ∀n, m ∈ N, n, m ≥ n0 : d(xn , xm ) < ε. Bemerkung 1.6.2. In der Grundlagenvorlesung des letzten Semesters wurden zwei Typen von Cauchy-Folgen definiert: Cauchy-Folgen in R und CauchyFolgen in Q. Betrachten wir R als metrischen Raum, mit der Standardmetrik d(x, y) = |x − y|, so ist die Definition einer Cauchy-Folge in R ein Spezialfall unserer jetzigen Definition. Cauchy-Folgen in Q sind aus zwei Gründen etwas subtiler. Der erste Grund ist der Folgende: in der Grundlagenvorlesung wurden die reellen Zahlen aus den rationalen Zahlen mit Hilfe des Begriffs der CauchyFolge konstruiert – deshalb durften die reellen Zahlen in der Definition noch nicht verwendet werden, und ε musste als rationale Zahl angenommen werden. Da es aber a posteriori zu jeder reellen Zahl ε > 0 immer auch eine rationale Zahl ε0 mit 0 < ε0 < ε gibt, macht dies keinen Unterschied. Um diese Subtilität zu umgehen, könnten wir die Bedingung, eine Cauchy-Folge zu sein, auch folgendermaßen formulieren: ∀ N ∈ N ∃ n0 ∈ N ∀n, m ∈ N, n, m ≥ n0 : d(xn , xm ) < 1 . N (1.6.1) Der zweite Punkt ist der, dass wir die reellen Zahlen auch bereits in der Definition eines metrischen Raumes verwendet haben: die Abstandsfunktion ist eine Abbildung nach R≥0 . Wollen wir die reellen Zahlen nun erst konstruieren, so haben wir den Begriff eines metrischen Raumes noch nicht zur Verfügung. Wir können aber, auch wenn wir den Standpunkt einnehmen, dass wir die reellen Zahlen noch nicht kennen, trotzdem auf Q die Abbildung d : Q × Q → Q≥0 ; (x, y) 7→ |x − y| betrachten, und dann auf Q Cauchy-Folgen über die Bedingung (1.6.1) definieren, oder äquivalent über ∀ ε ∈ Q, ε > 0 ∃ n0 ∈ N ∀n, m ∈ N, n, m ≥ n0 : d(xn , xm ) < ε. Dies ist genau die Definition aus dem letzten Semester; der einzige Unterschied ist der, dass wir in dieser Situation nicht von Q als metrischem Raum sprechen dürfen. Es gilt: Lemma 1.6.3. Es sei (X, d) ein metrischer Raum. Dann ist jede in X konvergente Folge eine Cauchy-Folge. 20 KAPITEL 1. FOLGEN Beweis. Es sei (xn ) eine in X konvergente Folge, mit limn→∞ xn = x. Es sei ε > 0 beliebig. Dann existiert ein n0 ∈ N, so dass für alle n ≥ n0 gilt, dass d(x, xn ) < 2ε . Es folgt für alle n, m ≥ n0 : d(xn , xm ) ≤ d(xn , x) + d(x, xm ) < ε ε + = ε; 2 2 d.h. (xn ) ist eine Cauchy-Folge. Die Umkehrung gilt nicht. Beispiel 1.6.4. Es sei X = R \ {0} ⊂ R. Dann ist die Folge an = Cauchy-Folge in X, die aber in X nicht konvergiert. 1 n eine Um ein interessanteres Beispiel anzugeben, beweisen wir eine Aussage für reelle Zahlenfolgen, für die wir folgende Definition brauchen: Definition 1.6.5. Es sei (an ) eine Folge reeller Zahlen. Dann nennen wir (an ) 1. monoton wachsend, wenn an+1 ≥ an für alle n ∈ N. 2. streng monoton wachsend, wenn an+1 > an für alle n ∈ N. 3. monoton fallend, wenn an+1 ≤ an für alle n ∈ N. 4. streng monoton fallend, wenn an+1 < an für alle n ∈ N. Ist (an ) monoton wachsend oder monoton fallend, so sagen wir, dass (an ) monoton ist. Ist (an ) streng monoton wachsend oder streng monoton fallend, so sagen wir, dass (an ) streng monoton ist. Satz 1.6.6. Es sei (an ) eine beschränkte Folge reeller Zahlen, die zusätzlich entweder monoton wachsend oder monoton fallend ist. Dann ist (an ) eine CauchyFolge. Beweis. Wir betrachten nur den Fall, dass (an ) monoton wachsend ist, und nehmen an, dass (an ) keine Cauchy-Folge ist. Es gibt also ein ε > 0, so dass für alle k0 ∈ N natürliche Zahlen k, l ≥ n0 existieren mit |ak − al | ≥ ε. Etwas informell: beliebig spät in der Folge gibt es Folgenglieder, die mindestens Abstand ε zueinander haben. Wir konstruieren nun eine unbeschränkte Teilfolge von (an ), im Widerspruch zur Annahme, dass (an ) beschränkt ist. Wir starten mit zwei Folgengliedern an0 und an1 mit n0 < n1 und an1 − an0 ≥ ε. Nun wissen wir, dass es nach n1 wieder zwei solche Folgenglieder gibt: es gibt n2 und n3 , so dass n1 < n2 < n3 und an3 − an2 ≥ ε. Wir setzen diese Konstruktion fort und erhalten eine Teilfolge (ank )k der monoton wachsenden Folge (an ), so dass an2l+1 − an2l ≥ ε für alle l. Induktiv folgt aus der Monotonie: an2l+1 − an0 ≥ (l + 1) · ε, d.h. diese Teilfolge kann nicht beschränkt sein. Beispiel 1.6.7. Es sei a eine positive rationale Zahl. Wir möchten explizit √ eine Folge √ in Q definieren, die die Eigenschaft hat, in R gegen a zu konvergieren. Ist a selbst keine rationale Zahl (z.B. für a = 2), so haben wir damit eine Cauchy-Folge in Q konstruiert, die in Q nicht konvergiert. (Man beachte, dass wir strenggenommen die Existenz der Quadratwurzel einer positiven reellen 1.7. VERVOLLSTÄNDIGUNG 21 Zahl noch nicht bewiesen haben – wir werden erst noch sehen, wie sie aus der Vollständigkeit von R folgt.) Wir betrachten folgende rekursiv definierte Folge: x0 sei eine beliebige positive rationale Zahl. Ist xn bereits definiert, so setzen wir 1 a xn+1 = xn + . 2 xn Die Motivation für diese Definition ist die folgende: ist x2n ≥ a, d.h. xn ist 2 √ 2 eine obere Abschätzung von a, so ist xan = xa2 ≤ a, d.h. xan ist eine unn √ tere Abschätzung von a. Wir definieren xn+1 als arithmetisches Mittel dieser Werte. Wir zeigen, dass x2n ≥ a für alle n ≥ 1: 2 2 1 1 a a 2 −a= ≥ 0. xn+1 − a = xn + xn − 4 xn 4 xn Daraus folgt aber auch, dass die Folge ab n = 1 monoton fallend ist, denn 1 a 1 xn − xn+1 = xn − = (x2 − a) ≥ 0. 2 xn 2xn n Da die Folge also monoton und beschränkt ist, folgt aus Satz 1.6.6, dass sie eine Cauchy-Folge (in Q) ist. Nehmen wir nun an, die Folge (xn ) würde konvergieren, mit Grenzwert x, so würde dieser die folgende Gleichung erfüllen: a 1 a 1 x+ , (1.6.2) x = lim xn+1 = lim xn + = n→∞ n→∞ 2 xn 2 x also x2 = a. Da es keine rationale Zahl x mit x2 = 2 gibt, stellt dies also z.B. für a = 2 einen Widerspruch dar; für a = 2 kann die Folge (in Q) nicht konvergieren. Später werden wir aber sehen, dass diese Folge in R durchaus konvergiert! Dann kann man diese Folge verwenden, um die Existenz von Quadratwurzeln in R zu zeigen. Definition 1.6.8. Ein metrischer Raum (X, d) heißt vollständig, wenn jede Cauchy-Folge in X konvergiert. Der metrische Raum Q ist also nicht vollständig. 1.7 Vervollständigung In diesem Abschnitt kommen wir auf die Vollständigkeit der reellen Zahlen zurück – dazu betrachten wir die Konstruktion der reellen Zahlen aus den rationalen Zahlen; gleichzeitig behandeln wir aber auch eine viel allgemeinere Konstruktion der Vervollständigung. Es sei (X, d) ein metrischer Raum und C = {(xn )n∈N | (xn ) ist eine Cauchy-Folge} Auf C definieren wir wie folgt eine Relation: Es gelte für (xn ), (yn ) ∈ C: (xn ) ∼ (yn ) :⇐⇒ (d(xn , yn ))n∈N ist eine Nullfolge. (1.7.1) 22 KAPITEL 1. FOLGEN Lemma 1.7.1. Die Relation ∼ ist eine Äquivalenzrelation. Beweis. Die Reflexivität ist offensichtlich, da d(x, x) = 0 für alle x ∈ X. Die Symmetrie ist auch klar, da d symmetrisch ist. Zur Transitivität: es seien (xn ), (yn ) und (zn ) Cauchy-Folgen, so dass (d(xn , yn ))n und (d(yn , zn ))n Nullfolgen sind. Da 0 ≤ d(xn , zn ) ≤ d(xn , yn ) + d(yn , zn ) → 0 für n → ∞, folgt aus Satz 1.3.13, dass auch (d(xn , zn ))n eine Nullfolge ist. Wir setzen X := C/∼ . (1.7.2) Wir haben eine natürliche Abbildung X → X, die einem Element x ∈ X die konstante Folge x zuordnet. Diese Abbildung ist injektiv, da für x, y ∈ X mit x 6= y gilt, dass d(x, y) > 0. Die Idee hinter dieser Konstruktion ist die folgende: gibt es in einem metrischen Raum (X, d) Cauchy-Folgen, die nicht konvergieren, so fügen wir künstlich Elemente zu X hinzu, die als Grenzwerte dieser Cauchy-Folgen fungieren. Formal betrachten wir die Cauchy-Folgen selbst (bzw. Äquivalenzklassen dieser) als Elemente des Raumes X: ist (xn ) eine Cauchy-Folge in X, so wird (xn ) sowohl eine Cauchy-Folge in X definieren (für jedes n entspricht xn der Äquivalenzklasse der konstanten Folge xn ) als auch ein Element von X (als Äquivalenzklasse der Folge (xn ) selbst). Um in X von Cauchy-Folgen sprechen zu können, müssen wir auf X eine Abstandsfunktion definieren, und dann zeigen, dass der Raum X, den wir als Vervollständigung von X bezeichnen, wirklich vollständig ist (dies wird nicht offensichtlich sein, da es ja in X weitere Cauchy-Folgen geben könnte, die nicht von Cauchy-Folgen in X induziert sind). Vorher betrachten wir aber noch einmal den Fall von Q genauer, den einige von Ihnen bereits im letzten Semester kennengelernt haben. Die reellen Zahlen werden aus Q folgendermaßen konstruiert: R = {(xn )n∈N | (xn ) ist eine Cauchy-Folge in Q}/∼ , wobei die Äquivalenzrelation ∼ wie in (1.7.1) definiert ist. Bemerkung 1.7.2. Unsere Formulierung ist ein wenig anders als in der Grundlagenvorlesung des letzten Semesters, um den Begriff des Vektorraumes zu vermeiden, den die Sommersemesteranfänger noch nicht kennengelernt haben. Die Idee ist dieselbe. Bemerkung 1.7.3. In der Grundlagenvorlesung dieses Semesters werden die reellen Zahlen anders konstruiert, mittels sogenannter Dedekindscher Schnitte. Eine weitere gebräuchliche Konstruktion verwendet das Prinzip der Intervallschachtelung. Welche Konstruktion man verwendet ist irrelevant, denn es gilt: sind K und L zwei vollständige, archimedisch geordnete Körper, so existiert eine Abbildung ϕ : K → L, die die gesamte Struktur von K und L respektiert, d.h. die ϕ(1) = 1 und ϕ(a + b) = ϕ(a) + ϕ(b), ϕ(a · b) = ϕ(a) · ϕ(b) für alle a, b ∈ K erfüllt (d.h. die Körperstruktur wird erhalten), sowie ϕ(a) ≤ ϕ(b), wann immer a ≤ b für zwei Elemente a, b ∈ K (d.h. die Ordnungsrelation wird erhalten). Man sagt: je zwei vollständige, archimedisch geordnete Körper sind isomorph. 1.7. VERVOLLSTÄNDIGUNG 23 Haben wir nun also R als Menge definiert, so können wir Addition und Multiplikation von Q übertragen: für Cauchy-Folgen (xn ), (yn ) in Q definiert man [(xn )] + [(yn )] = [(xn + yn )] sowie [(xn )] · [(yn )] = [(xn · yn )], zeigt, dass diese Abbildungen wohldefiniert sind, und R zu einem Körper machen. Weiterhin macht man R zu einem archimedisch geordneten Körper, indem man für Cauchy-Folgen (xn ), (yn ) in Q definiert: es gelte genau dann [(xn )] ≤ [(yn )] wenn entweder [(xn )] = [(yn )] oder es ein ε > 0, ε ∈ Q, sowie ein n0 ∈ N gibt, so dass xn + ε < yn für alle n ≥ n0 . All dies wurde in der Grundvorlesung behandelt. Mit Hilfe dieser Ordnungsrelation erhalten wir ( auch wie üblich die Betrwirkx x>0 . Damit ergibt auch lichagsfunktion |·| : R → R: für x ∈ R ist |x| = −x x ≤ 0 der Begriff der Cauchy-Folge in R Sinn, und wir können uns der Frage zuwenden, ob R vollständig ist, d.h. ob alle Cauchy-Folgen in R konvergieren. Diese Aussage wurde in der Grundlagenvorlesung zwar erwähnt, aber nicht bewiesen. Dies holen wir nun nach, aber beweisen die Aussage direkt für die allgemeine Vervollständigung eines metrischen Raumes mit. Dafür definieren wir auf X wie in (1.7.2) eine Abstandsfunktion d: für zwei Cauchy-Folgen (xn ) und (yn ) im metrischen Raum X beobachten wir, dass nach der in den Übungen (für R; der Beweis für allgemeine metrische Räume geht analog) gezeigten Vierecksungleichung gilt, dass |d(xn , yn ) − d(xm , ym )| ≤ d(xn , xm ) + d(yn , ym ), und dass deswegen (d(xn , yn )) auch eine Cauchy-Folge (in R) darstellt. Da wir zeigen werden, dass R vollständig ist, existiert also d([(xn )], [(yn )]) := lim d(xn , yn ). n→∞ Lemma 1.7.4. (X, d) ist ein metrischer Raum. Beweis. Nach Definition nimmt d nur nichtnegative Werte an. Seien (xn ) und (yn ) Cauchy-Folgen, so dass d([(xn )], [(yn )]) = 0, d.h. limn→∞ d(xn , yn ) = 0. Nach Definition sind die Cauchy-Folgen (xn ) und (yn ) damit äquivalent, d.h. es gilt [(xn )] = [(yn )]. Die Symmetrie ist offensichtlich: es gilt d([(xn )], [(yn )]) = limn→∞ d(xn , yn ) = limn→∞ d(yn , xn ) = d([(yn )], [(xn )]) für alle Cauchy-Folgen (xn ) und (yn ). Zur Dreiecksungleichung: es seien (xn ), (yn ) und (zn ) Cauchy-Folgen in X. Dann gilt wegen der Dreiecksungleichung in X, dass für alle n d(xn , zn ) ≤ d(xn , yn ) + d(yn , zn ). Die drei reellen Folgen (d(xn , yn ))n , (d(xn , yn ))n und (d(yn , zn ))n sind konvergent. Damit folgt d([(xn )], [(zn )]) = lim d(xn , zn ) n→∞ ≤ lim d(xn , yn ) + d(yn , zn ) n→∞ = lim d(xn , yn ) + lim d(yn , zn ) n→∞ n→∞ = d([(xn )], [(yn )]) + d([(yn )], [(zn )]). 24 KAPITEL 1. FOLGEN Definition 1.7.5. Wir nennen (X, d) die Vervollständigung von X. Direkt aus der Definition der Abstandsfunktion folgt, dass die natürliche Inklusion X → X abstandserhaltend ist, d.h. es gilt für alle x, y ∈ X, dass d(x, y) = d(x, y), wobei wir auf der rechten Seite x und y als die Äquivalenzklassen der entspechenden konstanten Folgen betrachten. Lemma 1.7.6. Es sei (xn ) eine Cauchy-Folge in X. Wir betrachten (xn ) als Folge in X, d.h. fassen jedes xn als konstante Folge auf. Dann konvergiert (xn ) in X gegen das Element [(xn )] ∈ X. Beweis. Zu zeigen ist: für alle ε > 0 gibt es ein n0 ∈ N, so dass für alle m ≥ m0 gilt, dass limn→∞ d(xn , xm ) = d([(xn )n ], xm ) < ε. Da (xn ) aber eine CauchyFolge ist, gibt es ein n0 ∈ N, so dass für alle n, m ≥ n0 gilt, dass d(xn , xm ) < 2ε . Im Grenzwert n → ∞ gilt dann immer noch die Ungleichung < ε. Dieselbe Aussage gilt auch für Q und R, mit demselben Beweis. Das Lemma impliziert, dass X dicht in X ist (und Q dicht in R): für alle ε > 0 und alle a ∈ X gibt es ein x ∈ X, so dass d(x, a) < ε (wobei wir x vermöge der natürlichen Inklusion X → X als Element von X auffassen). Nun beweisen wir die folgenden beiden Sätze gleichzeitig: Satz 1.7.7. R ist vollständig. Satz 1.7.8. Die Vervollständigung X eines metrischen Raumes X ist vollständig. Beweis. Um die Notation einheitlich zu machen, schreiben wir im Beweis des ersten Satzes auch X = Q und X = R. In Q setzen wir auch d(x, y) = |x − y|, und in R schreiben wir d(x, y) = |x − y|. Es sei (an ) eine Cauchy-Folge in X. Wie wir oben gezeigt haben, existiert für jedes n ∈ N ein xn ∈ X ⊂ X mit d(an , xn ) < n1 . Wir behaupten zunächst, dass (xn ) eine Cauchy-Folge in X darstellt: es sei ε > 0 beliebig vorgeben. Da (an ) eine Cauchy-Folge ist, gibt es n0 ∈ N, so dass für alle n, m ≥ n0 gilt, dass d(an , am ) < 3ε . Dann gilt für alle natürlichen Zahlen n, m ≥ max{n0 , 3ε }, dass d(xn , xm ) = d(xn , xm ) ≤ d(xn , an ) + d(an , am ) + d(am , xm ) < ε. | {z } | {z } | {z } 1 <n ≤ 3ε < 3ε < 3ε Damit ist (xn ) eine Cauchy-Folge in X. Nach Lemma 1.7.6 konvergiert diese Folge in X, mit Grenzwert [(xn )]. Wir behaupten nun, dass auch die ursprüngliche Folge (an ) gegen denselben Grenzwert konvergiert. Es sei wieder ε > 0 vorgegeben. Dann existiert ein m0 ∈ N, so dass für alle m ≥ m0 gilt, dass d([(xn )], xm ) < 2ε . Für alle m ≥ max{m0 , 2ε } gilt dann d([(xn )], am ) ≤ d([(xn )], xm ) + d(xm , am ) < ε. | {z } | {z } < 2ε Dies zeigt die Behauptung. 1 <n ≤ 2ε 1.8. FOLGERUNGEN AUS DER VOLLSTÄNDIGKEIT VON R 1.8 1.8.1 25 Folgerungen aus der Vollständigkeit von R Existenz von Supremum und Infimum Satz 1.8.1. Es sei (an ) eine beschränkte, monoton wachsende Folge reeller Zahlen. Dann ist (an ) konvergent, und es gilt, dass limn→∞ an das Supremum der Menge {an | n ∈ N} ist. Ist (an ) beschränkt und monoton fallend, dann konvergiert (an ) ebenfalls, und es gilt, dass limn→∞ an das Infimum der Menge {an | n ∈ N} ist. Beweis. Wir zeigen nur die erste Aussage, die zweite zeigt man analog. In Satz 1.6.6 haben wir gesehen, dass eine monoton wachsende, beschränkte Folge reeller Zahlen eine Cauchy-Folge ist. Da R vollständig ist, ist (an ) also konvergent. Wir zeigen, dass der Grenzwert a := limn→∞ an gleichzeitig das Supremum der Folge (an ) darstellt. Gäbe es ein m ∈ N, so dass am > a, so gäbe es ein ε > 0, so dass am > a + ε. Da (an ) monoton wachsend ist, würde diese Ungleichung auch für alle k > m gelten, was einen Widerspruch zur Konvergenz der Folge gegen a darstellen würde. Damit ist a eine obere Schranke der Folge (an ). Eine kleinere obere Schranke der Folge (an ) als a kann es aber nicht geben: für alle b < a gibt es, da (an ) gegen a konvergiert, ein n, so dass an > b. Satz 1.8.2. Jede nichtleere, nach unten beschränkte Teilmenge M ⊂ R besitzt ein Infimum. Jede nichtleere, nach oben beschränkte Teilmenge M ⊂ R besitzt ein Supremum. Beweis. Wir zeigen nur die erste Aussage; die zweite beweist man analog. Es sei M ⊂ R eine nach unten beschränkte Menge. Hat M ein Minimum, so ist dieses das Infimum von M , und sind wir fertig. Wir nehmen nun an, dass M kein Minimum besitzt. Wir konstruieren nun eine monoton fallende Folge (xn ) von Elementen aus M , die die Eigenschaft hat, dass ihr Grenzwert x eine untere Schranke von M ist. Dieser Grenzwert x ist damit notwendigerweise das Infimum von M : gäbe es nämlich eine größere untere Schranke von M als x, so könnte x nicht Grenzwert von Elementen aus M sein. Wir konstruieren die Folge (xn ) parallel zu einer weiteren, monoton wachsenden, Folge (an ), so dass jedes an eine untere Schranke von M ist, und an < xn für alle n. Es sei x0 ∈ M beliebig, und a0 eine beliebige untere Schranke von M . Da M nach Annahme kein Minimum besitzt, gilt a0 < x0 . Es seien nun a0 , . . . , an n sowie x0 , . . . , xn bereits konstruiert. Wir betrachten nun das Element an +x , 2 das arithmetische Mittel von an und xn . Falls dieses eine untere Schranke von n M ist, so setzen wir an+1 := an +x > an und xn+1 := xn . Diese beiden Zahlen 2 n erfüllen wieder die verlangten Eigenschaften. Ist an +x keine untere Schranke 2 n von M , so sei xn+1 ein beliebiges Element aus M , das kleiner ist als an +x , und 2 an+1 := an . Wieder erfüllen beide Zahlen die gesuchten Eigenschaften. Nach Konstruktion sind beide Folgen beschränkt und monoton (die eine fallend, die andere wachsend) und damit, da R vollständig ist, konvergent. Weiterhin gilt, dass |xn − an | ≤ 12 |xn−1 − an−1 | ≤ · · · ≤ 21n |x0 − a0 | → 0 für n → ∞. Damit sind die Grenzwerte dieser beiden Folgen identisch. Da an für alle n eine untere Schranke von M ist, ist aber auch limn→∞ an eine untere Schranke von M. 26 KAPITEL 1. FOLGEN Definition 1.8.3. Für eine nach unten beschränkte Teilmenge M ⊂ R bezeichnen wir das Infimum von M mit inf M ; ist M nach oben beschränkt, so bezeichnen wir das Supremum von M mit sup M . Der obige Beweis zeigt: für eine nichtleere, nach unten bzw. oben beschränkte Teilmenge M ⊂ R existiert eine Folge von Elementen von M , die gegen inf M bzw. sup M konvergiert. Definition 1.8.4. Ist (an ) eine nach unten beschränkte Folge, so nennen wir inf{an | n ∈ N} auch das Infimum der Folge (an ), und bezeichnen es mit inf n∈N an . Analog nennen wir, sofern (an ) nach oben beschränkt ist, sup{an | n ∈ N} das Supremum der Folge (an ), und bezeichnen es mit supn∈N an . 1.8.2 Existenz k-ter Wurzeln Satz 1.8.5. Es sei x ≥ 0 eine reelle Zahl und k ∈ N, k ≥ 1. Dann existiert eine eindeutige nichtnegative reelle Zahl y, so dass y k = x. Beweis. Wir zeigen zunächst die Eindeutigkeit: angenommen, es gäbe y, y 0 ≥ 0, so dass y k = y 0k = x. Dann gilt 0 = y k − y 0k = (y k−1 + y k−2 y 0 + · · · + yy 0k−2 + y 0k−1 )(y − y 0 ). Einer der beiden Faktoren muss also verschwinden. Der erste ist aber eine Summe nichtnegativer reeller Zahlen, und kann damit nur verschwinden, wenn alle Summanden einzeln gleich Null sind; ist das der Fall, so gilt bereits y k−1 = y 0k−1 = 0, was nur sein kann, wenn y = y 0 = 0. Andernfalls verschwindet der zweite Faktor, was ebenfalls bedeutet, dass y = y 0 . Für die Existenz definieren wir M := {z ∈ R | z k ≤ x}. Da 0 ∈ M , ist M nicht leer. Weiterhin ist M nach oben beschränkt, da für alle z ∈ M gilt, dass z k ≤ x < x + 1 ≤ (x + 1)k (Potenzen einer Zahl ≥ 1 sind mindestens so groß wie diese Zahl) und damit z < x + 1 (wäre z ≥ x + 1, so wäre auch z k ≥ (x + 1)k ). Damit existiert nach Satz 1.8.2 das Supremum y := sup M von M . Wir behaupten, dass y die Gleichung y k = x erfüllt. Da es eine Folge von Elementen aus M gibt, die gegen y = sup M konvergiert, erfüllt y auf jeden Fall die Gleichung y k ≤ x. Nehmen wir nun an, dass y k < x gilt, dann behaupten wir, dass es ein ε > 0 gibt, so dass auch (y + ε)k ≤ x gilt, und damit auch y + ε ∈ M , was ein Widerspruch dazu ist, dass y = sup M . Auf jeden Fall werden wir ε ≤ 1 wählen, und berechnen mit Hilfe des binomischen Lehrsatzes aus der Grundlagenvorlesung: ! k k X X k i k−i k i−1 k−i k k k (y + ε) = y + εy =y +ε· ε y i i i=1 i=1 ! k X k k−i k ≤y +ε· y i i=1 | {z } =:C = y k + ε · C, wobei wir betonen, dass C eine von ε unabhängige Zahl ist. Wählen wir nun k C·(x−y k ) k k k ε = min{1, x−y = y k +x−y k = C }, dann folgt (y+ε) ≤ y +ε·C ≤ y + C x. 1.9. MEHR BEISPIELE VON GRENZWERTEN 27 Definition 1.8.6. Für x ≥ 0 und k ∈ N, k ≥ 1, nennen wir die eindeutige nichtnegative reelle Zahl y mit y k = x die k-te Wurzel von x, und bezeichnen √ k sie mit x oder auch x1/k . √ √ Für k = 2 schreiben wir auch einfach x anstatt 2 x. Bemerkung 1.8.7. Die Existenz von Wurzeln lässt sich auch anders zeigen, aber immer unter Verwendung der Vollständigkeit von R. Wir erinnern an die rekursiv definierte Cauchy-Folge rationaler Zahlen (xn ) aus Beispiel 1.6.7. Da R vollständig ist, wissen wir nun, dass sie in R konvergiert, und mit demselben Argument wie√dort sehen wir, dass der Grenzwert x die Gleichung x2 = a erfüllt. Wir können a also als Grenzwert der Folge (xn ) definieren. Die k-te Wurzel ist streng monoton: ist 0 ≤ x < y und k ∈ N, k ≥ 1, so gilt auch x1/k < y 1/k (denn wäre x1/k ≥ y 1/k , so würde auch x = (x1/k )k ≥ (y 1/k )k = y gelten). Wir können nun auch Potenzen nichtnegativer reeller Zahlen mit beliebigen rationalen Exponenten definieren: für x ≥ 0 und p/q ∈ Q, wobei q ≥ 1 und p ∈ Z, setzen wir xp/q = (x1/q )p , was identisch ist zu (xp )1/q . Es gilt xa+b = xa · xb für x ≥ 0 und a, b ∈ Q. 1.8.3 Der Satz von Bolzano-Weierstraß Satz 1.8.8 (Satz von Bolzano-Weierstraß). Jede beschränkte Folge reeller Zahlen besitzt eine konvergente Teilfolge (und damit einen Häufungspunkt). Beweis. Es sei (an ) eine beschränkte Folge reeller Zahlen. Wir definieren induktiv eine monoton wachsende Folge (bk ), eine monoton fallende Folge (ck ), und eine Teilfolge (ank ) von (an ), so dass bk ≤ ank ≤ ck für alle k, und so, dass limk→∞ bk = limk→∞ ck . Es sei b0 eine untere Schranke, c0 eine obere Schranke dieser Folge, und n0 := 0. Sind bk , ck und nk bereits definiert, so gehen wir wie folgt vor: wir betrachten bk +ck k unendlich viele das arithmetische Mittel bk +c 2 . Liegen zwischen bk und 2 k Folgenglieder der Folge (an ), so setzen wir bk+1 := bk , ck+1 := bk +c und 2 nk+1 > nk sei eine natürliche Zahl, so dass bk+1 ≤ ank+1 ≤ ck+1 (diese existiert, da es ja unendlich viele Folgenglieder der Folge (an ) in diesem Intervall gibt, also insbesondere eines später als ank ). Andernfalls muss es unendlich viele k k und ck geben; wir setzen bk+1 := bk +c Folgenglieder zwischen bk +c 2 2 , ck+1 := ck und nk+1 > nk sei so, dass bk+1 ≤ ank+1 ≤ ck+1 . Nun argumentieren wir ähnlich wie im Beweis von Satz 1.8.2: die Folgen (bk ) und (ck ) sind beschränkt und monoton (eine wachsend, eine fallend), und damit in R konvergent. Da sich der Abstand ck − bk in jedem Schritt halbiert, müssen die Grenzwerte identisch sein. Insbesondere folgt nach Satz 1.3.13, dass auch die Folge (ank ) konvergiert. 1.9 Mehr Beispiele von Grenzwerten Nun können wir einige weitere konvergente Folgen und ihre Grenzwerte betrachten: √ 1. Es sei p ∈ N. Dann ist die Folge (1/ p n) eine Nullfolge: Es sei ε > 0 beliebig. Dann ist auch εp > 0, und es gibt daher, da ( n1 ) eine Nullfolge 28 KAPITEL 1. FOLGEN ist, ein n0 ∈ N, so dass für alle n ≥ n0 gilt, dass | n1 | = n1 < εp . Da x 7→ 1 streng monoton wachsend ist, folgt, dass √ p n < ε für all diese n. √ p x √ 2. Es gilt limn→∞ n n = 1: Es√sei ε > 0 beliebig. Wir müssen zeigen, dass ein n0 ∈ N existiert, so√dass | n n − 1| < ε für alle n ≥ n0 . Dafür beobachten √ wir zunächst, dass √n n − 1 ≥ 0 für alle n. (Andernfalls, d.h. wäre n n < 1, n so wäre auch n = n n < 1.) Wir berechnen mit Hilfe des binomischen Lehrsatzes √ n = (1 + ( n n − 1))n n √ n √ n √ =1+ ( n n − 1) + ( n n − 1)2 + · · · + ( n n − 1)n 1 2 n n √ n · (n − 1) √ ≥1+ ( n n − 1)2 = 1 + ( n n − 1)2 2 2 wobei wir im vorletzten Schritt die restlichen Summanden weggelassen haben (die nach unserer Vorüberlegung sämtlich positiv sind). √ 2(n−1) Es folgt ( n n − 1)2 ≤ n·(n−1) = n2 , und damit √ n | n − 1| = √ n √ 2 n−1≤ √ . n (1.9.1) √ Nach dem ersten Beispiel handelt es sich bei ( √n2 ) um eine Nullfolge. Aus √ (1.9.1) und Satz 1.3.13 folgt, dass auch ( n n − 1) eine Nullfolge ist. √ 3. Wir betrachten die Folge an := n c, für eine reelle Zahl √ c > 0, und behaupten, dass limn→∞ = 1. Für n√> c gilt, dass an ≤ n n, und wir haben im letzten Beispiel gezeigt, dass n n gegen 1 konvergiert. Für n > 1c gilt, q 1 dass n1 < c, und also an ≥ n n1 = √ n n ; auch diese Folge konvergiert gegen 1. Nach Satz 1.3.13 folgt, dass auch (an ) konvergent ist, mit limn→∞ = 1. √ √ 4. Wir betrachten die Folge an := n 17n + 19n . Es gilt an ≤ n 19n + 19n = √ √ n 2 · 19 → 19 für n → ∞. Andererseits gilt an ≥ n 19n = 19. Nach dem Sandwichsatz 1.3.13 folgt, dass (an ) konvergent ist, mit Grenzwert 19. 5. Wir betrachten die Folge an := (1 + n1 )n , und behaupten, dass sie konvergent ist. Dafür zeigen wir, dass sie beschränkt ist und monoton wächst; aus Satz 1.8.1 folgt dann die Konvergenz. Die Beschränkung nach oben folgt mit dem binomischen Lehrsatz: n n X X 1 n n 1 n · (n − 1) · · · · · (n − k + 1) 1 (1 + ) = 1 + = 1 + · k k n k n 1 · ··· · k n k=1 k=1 n n n−1 X X X 1 nk 1 1 ≤1+ · = 1 + = 1 + 2k−1 nk 2k−1 2k k=1 k=1 1 − 1/2n 1 =1+ <1+ = 3. 1 − 1/2 1/2 k=0 1.10. KOMPLEXE ZAHLEN 29 Die strenge Monotonie sieht man wie folgt ein: Für m < n gilt m m X X 1 m m · (m − 1) · · · · · (m − k + 1) m 1 = 1 + (1 + ) = 1 + k m k! · mk k m k=1 k=1 m X 1 2 k−1 1 =1+ 1· 1− 1− · ··· · 1 − k! m m m k=1 m X 1 1 2 k−1 <1+ 1· 1− 1− · ··· · 1 − k! n n n k=1 n m X X 1 n 1 n 1 < 1 + = (1 + )n . =1+ k k k n n k n k=1 k=1 Mit Hilfe von Satz 1.8.1 folgt, dass (an ) gegen eine reelle Zahl konvergiert. (Da die Folge monoton wächst, ist sie trivialerweise auch nach unten beschränkt.) Wir definieren e := limn→∞ an , und nennen e die Eulersche Zahl. Angenähert hat e den Wert e = 2, 7182818284 . . .. 1.10 Komplexe Zahlen Manche von Ihnen kennen die komplexen Zahlen C bereits aus der Schule, weitere aus der Grundlagenvorlesung. Die Motivation, komplexe Zahlen einzuführen, besteht darin, dass die Gleichung x2 + 1 = 0 in R keine Lösung besitzt. Die Idee der Konstruktion von C ist nun die, ein Element zu R hinzuzufügen (genannt i, die komplexe Einheit), das eine Lösung dieser Gleichung darstellt. Da C wieder ein Körper sein soll, gelangen wir zu folgender Definition: Wir definieren folgende Verknüpfungen auf R2 : (a, b) + (c, d) := (a + c, b + d), (a, b) · (c, d) := (ac − bd, ad + bc). Weiterhin sei i := (0, 1) ∈ R2 , so dass sich jedes Element aus R2 in der Form a + ib, mit a, b ∈ R, schreiben lässt. In dieser Form lauten die Verknüpfungen (a + ib) + (c + id) = (a + c) + i(b + d), (a + ib) · (c + id) = (ac − bd) + i(ad + bc), d.h. die Addition ist gewöhnliches komponentenweises Addieren, die Multiplikation ist einfaches Ausmultiplizieren, unter Berücksichtigung der Konvention i2 = −1. Es ist hilfreich, sich komplexe Zahlen als Elemente der Ebene R2 vorzustellen; die Addition ist dann die eventuell bereits aus der Schule bekannte Vektoraddition. In diesem Kontext nennt man R2 auch komplexe Ebene, oder Gaußsche Zahlenebene. Man zeigt (siehe Grundlagenvorlesung), dass R2 , mit diesen Verknüpfungen, einen Körper bildet, mit mit 1 = 1 + i0 als Einselement und 0 = 0 + i0 als Nullelement. Definition 1.10.1. Diesen Körper nennen wir den Körper der komplexen Zahlen und bezeichnen ihn mit C. Es ist R als {a + i0 | a ∈ R} in C enthalten. Eine komplexe Zahl der Form ib, wobei b ∈ R, nennen wir (rein) imaginär. Man beachte, dass das Quadrat einer imaginären Zahl eine nichtpositive reelle Zahl ist. Wir wiederholen kurz, wie das inverse Element einer komplexen Zahl 6= 0 aussieht: dafür ist es hilfreich, folgende natürliche Abbildung einzuführen: 30 KAPITEL 1. FOLGEN Definition 1.10.2. Die komplexe Konjugation ist die Abbildung C → C; z 7→ z̄, wobei wir für z = a + ib setzen: z̄ = a − ib. Geometrisch, d.h. in der Gaußschen Zahlenebene stellt die Konjugation die Spiegelung an der reellen Geraden dar. Definition 1.10.3. Der Betrag einer √ komplexen Zahl ist folgendermaßen definiert: für a + ib ∈ C ist |a + ib| := a2 + b2 ∈ R. Lemma 1.10.4. Für alle z ∈ C gilt z · z̄ = |z|2 . Beweis. Wir rechnen nach: für z = a + ib gilt z · z̄ = (a + ib)(a − ib) = (a2 + b2 ) + i(ab − ab) = |z|2 . Insbesondere ist bemerkenswert: das Produkt einer komplexen Zahl z mit der zu z konjugierten komplexen Zahl ist immer eine nichtnegative reelle Zahl! Damit haben wir auch das multiplikative Inverse einer komplexen Zahl bestimmt: Korollar 1.10.5. Für z ∈ C, z 6= 0, gilt z −1 = z̄ |z|2 . Es gelten weitere Rechenregeln für die komplexe Konjugation und den Betrag: Lemma 1.10.6. Es seien z, w ∈ C. Dann gilt: 1. z + w = z̄ + w̄ und z · w = z̄ · w̄. 2. |z · w| = |z||w| 3. Es gilt die Dreiecksungleichung: |z + w| ≤ |z| + |w|. Beweis. Wir schreiben z = a + ib und w = c + id. Dann gilt z + w = (a + c) + i(b + d) = (a + c) − i(b + d) = (a − ib) + (c − id) = z̄ + w̄. Da z · w = (a + ib)(c + id) = (ac − bd) + i(ad + bc) = (ac − bd) − i(ad + bc) und z̄ · w̄ = (a − ib)(c − id) = (ac − bc) − i(ad + bc), folgt auch der zweite Teil der ersten Aussage. Der zweite Teil ist äquivalent zu |z · w|2 = |z|2 |w|2 , d.h. zu zw · zw = z z̄ww̄, was nach dem ersten Teil erfüllt ist. Da der Betrag einer komplexen Zahl immer eine nichtnegative reelle Zahl ist, ist die zu zeigende Dreiecksungleichung äquivalent zu |z + w|2 ≤ (|z| + |w|)2 , was wiederum mit Hilfe von Lemma 1.10.4 zu z z̄ + ww̄ + z w̄ + wz̄ = (z + w)(z̄ + w̄) ≤ |z|2 + 2|z||w| + |w|2 = z z̄ + 2|z||w| + ww̄ äquivalent ist. Kürzen der Terme, die auf beiden Seiten auftreten, resultiert in der äquivalenten Ungleichung z w̄ + wz̄ ≤ 2|z||w|. 1.11. NORMIERTE RÄUME 31 Ist die linke Seite negativ, so ist die Ungleichung erfüllt. Ist sie nicht negativ, so ist sie äquivalent zu (z w̄ + wz̄)2 ≤ 4|z|2 |w|2 = 4z z̄ww̄. Diese Ungleichung ist aber äquivalent zu (z w̄ − wz̄)2 ≤ 0. Die komplexe Zahl u = z w̄ − wz̄ erfüllt nun aber ū = −u, d.h. sie ist rein imaginär – damit ist ihr Quadrat in der Tat nichtpositiv. 1.11 Normierte Räume Da wir nun k-te Wurzeln zur Verfügung haben, können wir eine wichtige Beispielklasse metrischer Räume konstruieren. Definition 1.11.1. Wir betrachten V = Rn oder Cn , die Menge der n-Tupel reeller oder komplexer Zahlen (v1 , . . . , vn ). Eine Norm auf V ist eine Abbildung || · || : V −→ R≥0 ; v 7−→ ||v||, die folgende Bedingungen erfüllt: 1. Definitheit: Für alle v ∈ V gilt genau dann ||v|| = 0, wenn v = 0. 2. Homogenität: Für alle v ∈ V und a ∈ R bzw. C gilt ||a · v|| = |a| · ||v||. 3. Dreiecksungleichung: Für alle v, w ∈ V gilt ||v + w|| ≤ ||v|| + ||w||. In dieser Definition haben wir die Addition zweier Elemente aus V benutzt: (v1 , . . . , vn ) + (w1 , . . . , wn ) := (v1 + w1 , . . . , vn + wn ) für alle (v1 , . . . , vn ), (w1 , . . . , wn ) ∈ V , sowie die skalare Multiplikation: für a ∈ R oder C und v = (v1 , . . . , vn ) ∈ V ist a · v := (av1 , . . . , avn ). Bemerkung 1.11.2. Für diejenigen, die wissen, was ein Vektorraum ist: in Definition 1.11.1 kann Rn durch einen beliebigen reellen oder komplexen Vektorraum V ersetzt werden. Das Paar (V, ||·||) wird dann als normierter Vektorraum bezeichnet. Wir werden gleich einige Beispiele für Normen geben; um zu zeigen, dass es sich in diesen Beispielen wirklich um Normen handelt, benötigen wir die sogenannte Minkowski-Ungleichung. Diese leiten wir nun mit Hilfe der Hölderschen Ungleichung her, die wiederum aus der Youngschen Ungleichung folgt. Für den Beweis der Youngschen Ungleichung brauchen wir aber eine Verallgemeinerung der Bernoullischen Ungleichung für rationale Exponenten, die wir nun aus der gewöhnlichen Bernoullischen Ungleichung herleiten. Satz 1.11.3 (Bernoullische Ungleichung mit rationalen Exponenten). Für alle x ∈ R mit x ≥ −1 und alle p ∈ Q, p ≥ 1, gilt (1 + x)p ≥ 1 + px. 32 KAPITEL 1. FOLGEN Beweis. Für n ∈ N, n ≥ 1, und eine reelle Zahl y > −n berechnen wir n+1 y y n+1 1 + n+1 1 + n+1 y = · 1 + n 1 + ny n 1 + ny n+1 n · (n + 1 + y) y = · 1+ (n + 1) · (n + y) n n+1 (n + 1) · (n + y) − y y = · 1+ (n + 1) · (n + y) n n+1 y y . = 1− · 1+ (n + 1) · (n + y) n y Nun behaupten wir, dass die Voraussetzung y > −n impliziert, dass − (n+1)·(n+y) > −1, d.h. dass wir auf die rechte Seite des erhaltenen Ausdrucks die Bernoullische y > Ungleichung mit ganzzahligen Exponenten anwenden können: − (n+1)·(n+y) 2 −1 ist äquivalent zu y < (n + 1)(n + y) = n + n + y + ny = n(n + 1 + y) + y, was wahr ist, da n + 1 + y > 0. Anwenden von Satz 1.3.14 ergibt also n+1 y 1 + n+1 y y n+y n ≥ 1 − 1 + · = 1, = n y n + y n n + y n 1+ n d.h. y 1+ n+1 n+1 y n . ≥ 1+ n Per Induktion über n sehen wir: für alle natürlichen Zahlen m ≥ n und alle reellen Zahlen y > −n gilt y m y n 1+ ≥ 1+ . m n Für x = y/m (d.h. eine beliebige reelle Zahl > −n/m) folgt m n (1 + x)m ≥ 1 + x . n Anwenden der n-ten Wurzel ergibt (1 + x)m/n ≥ 1 + m x, n (1.11.1) was genau die behauptete Ungleichung ist, allerdings nur für Zahlen x > −n/m; Ist −1 < x ≤ −n/m, so ist aber die linke Seite von (1.11.1) positiv, die rechte Seite aber negativ, und die Ungleichung damit trivialerweise erfüllt. Satz 1.11.4 (Youngsche Ungleichung). Es seien p, q > 1 rationale Zahlen mit 1 ap bq 1 p + q = 1, und a, b ≥ 0 reelle Zahlen. Dann gilt a · b ≤ p + q . Beweis. Wir setzen u = ap und v = bq . Dann ist zu zeigen, dass u1/p · v 1/q ≤ u v p + q . Es gilt u1/p v 1/q = u1/p v 1−1/p = (u/v)1/p v, 1.11. NORMIERTE RÄUME 33 so dass die zu zeigende Ungleichung zu (u/v)1/p ≤ u/v 1 + p q äquivalent ist. Es sei x so, dass 1 + p · x = u/v. Dann ist also zu zeigen, dass (1 + px)1/p = (u/v)1/p ≤ 1 + px 1 u/v 1 + = + = 1 + x. p q p q Dies ist aber wiederum zu (1 + x)p ≥ 1 + px äquivalent, was aufgrund der Bernoullischen Ungleichung mit rationalen Exponenten 1.11.3 eine wahre Aussage ist (man beachte, dass x > −1, da u/v > 0). Satz 1.11.5 (Höldersche Ungleichung). Es seien p, q > 1 rationale Zahlen mit 1 1 n p + q = 1. Dann gilt für (z1 , . . . , zn ), (w1 , . . . , wn ) ∈ C : n X |zi wi | ≤ i=1 n X !1/p |zi | p · i=1 n X !1/q q |wi | . i=1 |zi | |wi | P P 1/p ≥ 0 und bi := 1/q ≥ 0. Dann ( nj=1 |zj |p ) ( nj=1 |wj |q ) folgt aus der Youngschen Ungleichung Pn Pn n n X X api bqi 1 i=1 |zi |p 1 i=1 |wi |q 1 1 ai bi ≤ + = Pn + Pn = + = 1, p q p q p q p q |z | |w | j j=1 j j=1 i=1 i=1 Beweis. Wir setzen ai := was äquivalent zur Behauptung ist. Für den Fall p = q = 2 erhalten wir den wichtigen Spezialfall: Korollar 1.11.6 (Cauchy-Schwarzsche Ungleichung). Es gilt für (z1 , . . . , zn ), (w1 , . . . , wn ) ∈ Cn : !1/2 n !1/2 n n X X X |zi wi | ≤ |zi |2 |wi |2 . i=1 i=1 i=1 Satz 1.11.7 (Minkowskische Ungleichung). Es seien (z1 , . . . , zn ), (w1 , . . . , wn ) ∈ Cn , sowie p ∈ Q, p ≥ 1. Dann gilt !1/p !1/p !1/p n n n X X X p p p |zi + wi | ≤ |zi | + |wi | i=1 i=1 i=1 Beweis. Für p = 1 folgt die Behauptung sofort aus der Dreiecksungleichung für komplexe Zahlen: n X i=1 |zi + wi | ≤ n X |zi | + |wi | = i=1 n X i=1 |zi | + n X |wi |. i=1 Sei also nun p > 1. Schreiben wir si := (zi + wi )p−1 , dann gilt, wieder unter Benutzung der Dreiecksungleichung, |zi + wi |p = |zi + wi | · |zi + wi |p−1 = |zi + wi | · |si | ≤ |zi | · |si | + |wi | · |si | = |zi · si | + |wi · si |. (1.11.2) 34 KAPITEL 1. FOLGEN Es sei q > 1 so, dass p1 + 1q = 1. Dann folgt aus der Ungleichung (1.11.2) und der Hölderschen Ungleichung n X p |zi + wi | ≤ i=1 n X |zi · si | + n X |wi · si | i=1 !1/p n !1/q n X X p q |zi | |si | i=1 i=1 !1/p n n i=1 ≤ = X |zi |p X + i=1 + n X i=1 !1/p |wi |p · i=1 !1/p |wi | p n X n X !1/q q |si | i=1 !1/q |si |q (1.11.3) i=1 Nun ist aber |si |q = |zi + wi |(p−1)·q = |zi + wi |pq−q = |zi + wi |p , da p1 + 1q = 1. Wir ersetzen |si |q auf der rechten Seite von (1.11.3) mit Hilfe dieser Gleichung, Pn −1/q multiplizieren dann auf beiden Seiten mit ( i=1 |zi + wi |p ) und erhalten somit !1−1/q !1/p !1/p n n n X X X p p p |zi + wi | ≤ |zi | + |wi | . i=1 i=1 i=1 Da 1 − 1/q = 1/p, haben wir die Behauptung gezeigt. Beispiel 1.11.8. ist durch 1. Die Standardnorm oder 2-Norm auf V = Rn bzw. Cn ||v||2 := n X !1/2 |vi | 2 i=1 für v = (v1 , . . . , vn ) ∈ V definiert. Wir müssen überprüfen, dass es sich wirklich um eine Norm handelt – tun dies aber direkt für eine allgemeinere Norm: 2. Wir definieren für p ∈ N, p ≥ 1 die p-Norm auf Rn bzw. Cn : für v = (v1 , . . . , vn ) setzen wir ||v||p := n X !1/p |vi | p . i=1 Die Definitheit und die Homogenität sind klar; die Dreiecksungleichung lautet wie folgt: für v = (v1 , . . . , vn ) und w = (w1 , . . . , wn ) ist zu zeigen, dass !1/p !1/p !1/p n n n X X X p p p |vi − wi | ≤ |vi | + |wi | . i=1 i=1 i=1 Dies ist aber die Minkowski-Ungleichung 1.11.7, angewandt auf (v1 , . . . , vn ) und (−w1 , . . . , −wn )! Umgekehrt gilt also: die Minkowski-Ungleichung ist nichts anderes als die Ungleichung ||v + w||p ≤ ||v||p + ||w||p . 1.11. NORMIERTE RÄUME 35 3. Die ∞-Norm oder Maximumsnorm auf Rn bzw. Cn ist folgendermaßen definiert: wir setzen für v = (v1 , . . . , vn ): ||v||∞ := max{|v1 |, . . . , |vn |}. Auch dies stellt eine Norm dar: die Definitheit gilt, da v genau dann 0 ist, wenn vi = 0 für alle i, was wiederum genau dann gilt, wenn das Maximum der Zahlen |v1 |, . . . , |vn | gleich 0 ist. Für jede Zahl a ∈ R bzw. C und für alle i und j gilt genau dann |vi | ≤ |vj |, wenn |avi | = |a||vi | ≤ |a||vj | = |avj |. Damit ist ||av||∞ = |a| · ||v||∞ . Die Dreiecksungleichung gilt ebenfalls: für alle v = (v1 , . . . , vn ) und w = (w1 , . . . , wn ) sowie alle i = 1, . . . , n gilt |vi + wi | ≤ |vi | + |wi | ≤ ||v||∞ + ||w||∞ , und damit auch ||v + w||∞ = maxi {|vi + wi |} ≤ ||v||∞ + ||w||∞ . Beispiel 1.11.9. Wir betrachten auf Rn+1 die 2-Norm || · ||2 und definieren S n := {x ∈ Rn+1 | ||x||2 = 1} und versehen S n mit der durch Rn+1 induzierten Metrik. Diesen metrischen Raum nennen wir die n-dimensionale Sphäre. Bemerkung 1.11.10. Die Hölder-Ungleichung lässt sich prägnanter mit Hilfe der p-Normen schreiben: Sind v = (v1 , . . . , vn ), w = (w1 , . . . , wn ) ∈ Cn und 1 1 p + q = 1, so gilt ||(v1 w1 , . . . , vn wn )||1 ≤ ||v||p · ||w||q . Satz 1.11.11. Es sei || · || eine Norm auf V = Rn bzw. Cn . Definieren wir d : V × V → R≥0 durch d(v, w) := ||v − w||, so ist (V, d) ein metrischer Raum. Beweis. Wir müssen die drei Bedingungen überprüfen, die d zu einer Abstandsfunktion machen: Für alle v, w ∈ V gilt aufgrund der Definitheit der Norm genau dann d(v, w) = ||v − w|| = 0, wenn v − w = 0, d.h. wenn v = w. Außerdem gilt aufgrund der Homogenität der Norm d(v, w) = ||v − w|| = ||(−1)(w − v)|| = | − 1| · ||w − v|| = ||w − v|| = d(w, v). Die Dreiecksungleichung ergibt sich aus der Dreicksungleichung der Norm: für alle u, v, w ∈ V gilt d(u, w) = ||u − w|| = ||u − v + v − w|| ≤ ||u − v|| + ||v − w|| = d(u, v) + d(v, w). Satz 1.11.12. Rm , versehen mit der durch irgendeine Norm induzierte Metrik, ist vollständig. Diesen Satz werden wir später allgemein beweisen; jetzt zeigen wir ihn nur für die Maximumsnorm. Beweis. Es sei d die durch || · ||∞ induzierte Metrik auf Rm . Es sei (xn )n eine Cauchy-Folge in Rm , d.h. für alle ε > 0 existiert ein k0 , so dass für k, l ≥ k0 gilt, dass ||xk − xl ||∞ = maxi {|xki − xli | | i = 1, . . . , m} < ε. Insbesondere gilt dann für jedes i separat |xki − xli | < ε, so dass auch jede der Komponentenfolgen 36 KAPITEL 1. FOLGEN (xni )n eine Cauchy-Folge in R ist. Da R vollständig ist, konvergieren diese; es sei xi = limn→∞ xni . Wir behaupten, dass (xn ) gegen (x1 , . . . , xm ) konvergiert: dafür sei ε > 0 vorgegeben. Es gibt für jedes i = 1, . . . , m eine Zahl ni , so dass für n ≥ ni gilt, dass |xni − xi | < ε. Für n ≥ max{n1 , . . . , nm } gilt dann auch ||xn − x||∞ < ε. Wir haben gezeigt, dass limn→∞ xn = x. Beispiel 1.11.13. Betrachten wir auf C die Abstandsfunktion d(z, w) = |z −w|, so wird C zu einem metrischen Raum. In der Tat folgt die Dreiecksungleichung für d sofort aus der Dreiecksungleichung für den Betrag komplexer Zahlen, die wir in Lemma 1.10.4 gezeigt haben. Man beachte auch, dass | · | identisch zur Standardnorm auf R2 ist. Insbesondere folgt damit aus Satz 1.11.12, dass C vollständig ist; wir werden dies aber auch jetzt schon separat in den Übungen beweisen. 1.12 Topologische Räume Der Begriff des metrischen Raumes lässt sich weiter abstrahieren, zum Begriff des topologischen Raumes: wir nehmen die in Proposition 1.5.11 gezeigten Eigenschaften offener Mengen nun als Definition: Definition 1.12.1. Es sei X eine Menge. Eine Familie O ⊂ P(X) von Teilmengen von X, genannt in X offene Mengen, heißt eine Topologie auf X, wenn gilt: 1. ∅ und X sind in X offen, 2. Die beliebige Vereinigung von in X offener Mengen ist wieder offen in X, und 3. Der endliche Durchschnitt von in X offener Mengen ist wieder offen in X. Ist O eine Topologie auf X, so nennen wir die Elemente aus O in X offene Mengen. Das Paar (X, O) heißt ein topologischer Raum. Oft lässt man die Topologie O in der Notation weg, und spricht von X selbst als topologischem Raum. Beispiel 1.12.2. 1. Jeder metrische Raum (X, d) ist auf natürliche Weise ein topologischer Raum: Als Topologie wählen wir die Menge aller Teilmengen von X, die nach Definition 1.5.9 offen in X sind. Wir nennen diese Topologie die von d induzierte Topologie auf X. 2. Nicht zu jedem topologischen Raum (X, O) gibt es eine Metrik d : X × X → R, so dass O die von d induzierte Topologie ist. Um dies zu sehen, beobachten wir, dass es in einem metrischen Raum zu je zwei Punkten x und y eine offene Menge U gibt, so dass x ∈ U , aber y ∈ / U . (Man wähle als U zum Beispiel einen Ball um x vom Radius d(x, y).) Andererseits können wir auf jeder Menge X die sogenannte Klumpentopologie definieren: diese ist durch O = {∅, X} definiert. Hat X nun mindestens zwei Elemente, so erfüllt sie nicht die obige Bedingung. 1.13. KOMPAKTHEIT 37 3. Es sei X ein topologischer Raum und Y ⊂ X eine Teilmenge. Dann erbt Y wie folgt eine Topologie: Eine Teilmenge U ⊂ Y sei offen in Y , wenn es eine in X offene Menge V ⊂ X gibt, so dass V ∩ Y = U . Wir nennen diese Topologie die Teilraumtopologie auf Y ⊂ X, oder die durch X auf Y induzierte Topologie. In einer Übungsaufgabe haben wir gezeigt: ist (X, d) ein metrischer Raum und Y ⊂ X eine Teilmenge, die wir mit der induzierten Metrik versehen, dann sind die in Y offenen Teilmengen genau diejenigen der Form V ∩ Y , wobei V ⊂ X offen in X ist. Die durch die induzierte Metrik gegebene Topologie ist also genau die durch die Topologie von X auf Y induzierte Topologie. Topologische Räume gehören zum mathematischen Teilgebiet der Topologie, und nur eher am Rande zur Analysis. Sie werden in dieser Vorlesung daher eine untergeordnete Rolle spielen; wir erwähnen sie der Vollständigkeit halber, und weil es instruktiv ist zu sehen, welche Sachverhalte nur von den offenen Mengen eines metrischen Raumes abhängen, und welche die konkrete Gestalt der Abstandsfunktion benutzen. Obwohl man in einem topologischen Raum nicht vom Abstand zweier Punkte sprechen kann, ergibt der Begriff der Konvergenz auch in topologischen Räumen Sinn: Definition 1.12.3. Es sei X ein topologischer Raum, (xn ) eine Folge in X, sowie x ∈ X. Dann sagen wir, dass (xn ) gegen x konvergiert, wenn für jede in X offene Menge U , die x enthält, ein n0 ∈ N existiert, so dass für n ≥ n0 gilt, dass xn ∈ U . Ist die Topologie von X durch eine Metrik d induziert, so stimmt diese Definition mit der üblichen Definition der Konvergenz überein: dies liegt daran, dass ε-Bälle in X offen sind, und dass zu jeder offenen Menge U mit x ∈ U ein ε > 0 existiert, so dass x ∈ Bε (x) ⊂ U . Ein Indiz, dass sich topologische Räume anders als metrische Räume verhalten, zeigt das folgende Beispiel: Beispiel 1.12.4. Es sei X eine Menge, versehen mit der Klumpentopologie und (xn ) eine Folge in X. Dann konvergiert (xn ) gegen jedes Element aus X: für die einzige nichtleere in X offene Menge X gilt natürlich, dass sie alle Folgenglieder der Folge enthält. Die in metrischen Räumen gültige Eindeutigkeit des Grenzwerts einer konvergenten Folge gilt also in allgemeinen topologischen Räumen nicht. Man sollte also in diesem Kontext davon absehen, Ausdrücke der Form limn→∞ xn zu verwenden, da diese keine wohldefinierten Elemente des Raumes sind. 1.13 Kompaktheit Definition 1.13.1. Eine offene Überdeckung eines topologischen Raumes X ist eine Familie {Ui | i ∈S I} von in X offener Mengen Ui , wobei I eine beliebige Indexmenge ist, so dass i∈I Ui = X. 38 KAPITEL 1. FOLGEN Definition 1.13.2. Ein topologischer Raum X heißt kompakt, wenn jede offene Überdeckung von X eine endliche Teilüberdeckung besitzt: für jede offene Überdeckung {Ui | i ∈ I} gibt es endlich viele Indizes i1 , . . . , in ∈ I, so dass Sn X = k=1 Uik . Definition 1.13.3. Ein topologischer Raum X heißt folgenkompakt, wenn jede Folge in X eine konvergente Teilfolge besitzt. Wir erinnern daran, dass die Bedingung an eine Folge, eine konvergente Teilfolge zu besitzen, äquivalent dazu ist, einen Häufungspunkt zu haben. Beispiel 1.13.4. 1. Wir betrachten das abgeschlossenes Intervall [a, b] ⊂ R, für a < b, mit der Standardtopologie (induziert durch die Standardmetrik von R). Nach dem Satz von Bolzano-Weierstraß besitzt jede Folge in [a, b] eine konvergente Teilfolge. Der Satz von Bolzano-Weierstraß besagt also, dass [a, b] ein folgenkompakter metrischer Raum ist. 2. R, mit der Standardtopologie, ist nicht folgenkompakt, da die Folge an = n keine konvergente S Teilfolge besitzt. R ist auch nicht kompakt, da die offene Überdeckung R = n∈N (n, n + 2) keine endliche Teilüberdeckung besitzt. Satz 1.13.5. Es sei (X, d) ein metrischer Raum. Dann ist X genau dann kompakt, wenn X folgenkompakt ist. Beweis. Es sei X ein kompakter metrischer Raum, und (xn ) eine Folge in X. Wir müssen zeigen, dass (xn ) eine konvergente Teilfolge besitzt. Wir nehmen an, dies sei nicht der Fall. Dann finden wir zu jedem y ∈ X eine offene Menge Uy ⊂ X mit y ∈ Uy , so dass Uy nur endlich viele Folgenglieder der Folge (xn ) enthält (d.h. genauer: so dass es nur endlich viele natürliche Zahlen n gibt, so S dass xn ∈ Uy ). Da für alle y ∈ X gilt, dass y ∈ Uy ⊂ y∈X Uy , bilden die Uy eine offene Überdeckung von X. Diese besitzt aufgrund der Kompaktheit von X eine endliche Teilüberdeckung X = Uy1 ∪ . . . ∪ Uyl . Jede der Mengen Uyi enthält aber nach Konstruktion nur endlich viele der Folgenglieder von (xn ), weswegen nun also auch X nur endlich viele Folgenglieder enthielte – ein Widerspruch. Die Rückrichtung ist schwieriger. Es sei X ein folgenkompakter metrischer Raum und {Ui | i ∈ I} eine offene Überdeckung von X. Wir zeigen zunächst folgende Behauptung: es gibt ein ε > 0, so dass für jedes x ∈ X ein i ∈ I existiert, so dass Bε (x) ⊂ Ui . (Wichtig: es ist klar, dass es für jedes x und jedes i ein solches ε gibt – die Behauptung ist aber, dass wir ein globales ε mit dieser Eigenschaft finden.) Wir nehmen das Gegenteil an: dann gibt es für jedes n ∈ N ein xn ∈ X, so dass B n1 (xn ) in keiner der Mengen Ui enthalten ist. Da X folgenkompakt ist, hat die Folge (xn ) eine konvergente Teilfolge yk := xnk → z ∈ X. Da nk ≥ k und damit n1k ≤ k1 , gilt B n1 (xnk ) ⊂ B k1 (yk ), und damit liegen die Bälle B k1 (yk ) k erst recht in keiner der Mengen Ui . Nun gilt aber z ∈ Ui für ein i ∈ I, und damit gibt es ein ε > 0, so dass Bε (z) ⊂ Ui . Da (yk ) gegen z konvergiert, gibt es ein k0 ∈ N, so dass für alle k ≥ k0 gilt, dass d(yk , z) < 2ε . Nun sei k > max{k0 , 2ε } eine natürliche Zahl; dann gilt B k1 (yk ) ⊂ B 2ε (yk ) ⊂ Bε (z) ⊂ Ui , wobei die Inklusion B 2ε (yk ) ⊂ Bε (z) aus d(z, yk ) < 2ε und der Dreiecksungleichung folgt. Dies widerspricht unserer Konstruktion der Folge (yk ). 1.13. KOMPAKTHEIT 39 Als zweiten Schritt zeigen wir nun die Behauptung, dass wir für jedes δ > 0 den folgenkompakten metrischen Raum X durch endlich viele Bälle der Form Bδ (x), mit x ∈ X, überdecken können. Wäre dies nicht der Fall, so konstruieren wir folgendermaßen eine Folge in X: es sei x0 ∈ X beliebig. Sind x0 , . . . , xn bereits konstruiert, so betrachten wir Bδ (x0 ) ∪ . . . ∪ Bδ (xn ). Nach Annahme ist diese offene Menge nicht ganz X. Wir können also xn+1 ∈ X außerhalb dieser Menge (und ansonsten beliebig) wählen. Nach Konstruktion hat xn+1 von jedem der Punkte x0 , . . . , xn einen Abstand von mindestens δ. Die so konstruierte Folge (xn ) hat also die Eigenschaft, dass je zwei Folgenglieder xn und xm mindestens Abstand δ haben. Solch eine Folge kann aber keine konvergente Teilfolge besitzen; ein Widerspruch zur Folgenkompaktheit von X. Nun kombinieren wir im letzten Schritt die ersten beiden Schritte: zuerst sei ε > 0 so, dass für jedes x ∈ X ein i ∈ I existiert, so dass Bε (x) ⊂ Ui . Mit Hilfe des zweiten Schrittes überdecken wir X durch endlich viele ε-Bälle: X = Bε (x1 )∪. . .∪Bε (xn ). Jeder dieser endlich vielen Bälle liegt aber in einer der Mengen Ui ; damit ist X auch durch endlich viele der Mengen Ui überdeckt. Bemerkung 1.13.6. Für allgemeine topologische Räume sind die Begriffe Kompaktheit und Folgenkompaktheit nicht äquivalent. Leider ist es nicht einfach, Gegenbeispiele zu konstruieren, so dass wir hier darauf verzichten. Der Begriff der Kompaktheit ist strukturell anders als der der Offenheit oder der Abgeschlossenheit. Offenheit und Abgeschlossenheit einer Teilmenge sind relative Begriffe, die vom umgebenden Raum abhängen: in Beispiel 1.5.12 haben wir das Beispiel (0, 1] betrachtet, das als Teilmenge von (0, ∞) abgeschlossen ist, als Teilmenge von R jedoch nicht. Kompaktheit ist jedoch erst einmal eine Eigenschaft eines topologischen Raumes selbst, nicht einer Teilmenge. Trotzdem können wir definieren: Definition 1.13.7. 1. Es sei A ⊂ X eine Teilmenge eines topologischen Raumes. Dann ist eine offene Überdeckung von S A ⊂ X eine Familie von in X offenen Mengen Ui , i ∈ I, so dass A ⊂ i∈I Ui . 2. Es sei X ein topologischer Raum. Dann nennen wir eine Teilmenge K ⊂ X kompakt, wenn jede offene Überdeckung von K ⊂ X eine endliche Teilüberdeckung besitzt. Lemma 1.13.8. Es sei K ⊂ X eine Teilmenge eines topologischen Raumes. Dann ist K genau dann als Teilmenge von X kompakt, wenn K als topologischer Raum, versehen mit der durch X induzierten Teilraumtopologie, kompakt ist. Beweis. Wir müssen für den Beweis S nur zwei Dinge beobachten: zum einen induziert jede Überdeckung K ⊂ i∈I Ui der Teilmenge K ⊂ X auch eine Überdeckung des topologischen Raumes K: Wir setzen Vi := Ui ∩ K; nach Definition der Teilraumtopologie sind die Vi in K offen. Wir erhalten also eine S offene Überdeckung K = i∈I Vi von K. S Starten wir umgekehrt mit einer offenen Überdeckung K = i∈I Vi des topologischen Raumes K, so können wir aufgrund der Definition der TeilraumtopoloS gie in X offene Mengen Ui wählen, so dass Ui ∩ K = Vi . Dann gilt K ⊂ i∈I Ui , d.h. die Ui bilden eine offene Überdeckung der Teilmenge K ⊂ X. 40 KAPITEL 1. FOLGEN Satz 1.13.9. Eine kompakte Teilmenge eines metrischen Raumes ist abgeschlossen und beschränkt. Beweis. Es sei K eine kompakte Teilmenge eines metrischen Raumes X. Wäre K nicht abgeschlossen, so gäbe es nach Lemma 1.5.13 eine Folge in K, die in X konvergiert, deren Grenzwert aber nicht in K läge. Aufgrund der Kompaktheit von K müsste diese Folge aber eine in K konvergente Teilfolge besitzen. Dies kann aber nicht sein, wenn ihr Grenzwert nicht in K liegt. Wir nehmen an, K sei nicht beschränkt. Es sei x ∈ X fixiert. Da K nicht beschränkt ist, gibt es zu jedem n ∈ N ein an ∈ K, so dass d(x, an ) > n. Insbesondere ist also die Folge (an ) nicht beschränkt; genauer ist sogar keine Teilfolge von (an ) beschränkt. Damit kann (an ) keine konvergente Teilfolge besitzen, was einen Widerspruch zur Folgenkompaktheit von K darstellt. Korollar 1.13.10. Eine Teilmenge K ⊂ R ist genau dann kompakt, wenn sie beschränkt und abgeschlossen ist. Beweis. Der soeben bewiesene Satz zeigt, dass eine kompakte Teilmenge von R beschränkt und abgeschlossen ist. Ist umgekehrt K ⊂ R beschränkt und abgeschlossen, so hat jede Folge in K aufgrund des Satzes von Bolzano-Weierstrass eine in R konvergente Teilfolge, deren Grenzwert dann aufgrund der Abgeschlossenheit von K auch in K liegt. Damit ist K folgenkompakt. Beispiel 1.13.11. Diese Äquivalenz gilt nicht für allgemeine metrische Räume: Es sei X eine unendliche Menge, versehen mit der diskreten Metrik. Dann ist X selbst beschränkt und in X abgeschlossen. Der Raum X ist jedoch nicht kompakt: es sei (xn ) eine Folge in X mit paarweise verschiedenen Gliedern (eine solche existiert, da X unendlich ist). Dann gilt d(xn , xm ) = 1 für alle n 6= m, so dass (xn ) keine konvergente Teilfolge haben kann. Korollar 1.13.12. Jede kompakte Teilmenge K ⊂ R besitzt Maximum und Minimum. Beweis. Es sei K ⊂ R eine kompakte Teilmenge. Dann ist K abgeschlossen und beschränkt. Da K beschränkt ist, gibt es, wie in Abschnitt 1.8.1 gezeigt, eine Folge in K, die gegen das Supremum von K konvergiert. Da K abgeschlossen ist, ist dieses Supremum, als Grenzwert einer Folge in K, ebenfalls in K; es handelt sich also um das Maximum von K. Für das Minimum von K argumentiert man analog. Kapitel 2 Reihen 2.1 Konvergente Reihen Reihen sind spezielle Arten von Folgen reeller oder komplexer Zahlen: Definition 2.1.1. Es sei (an ) eine Folge reeller (oder komplexer) Zahlen. Dann nennen wir die Folge (sk ), wobei sk = k X an , n=0 die Folge der Partialsummen. Man nennt diese Folge auch die Reihe über die an . Falls dieP Folge (sk ) konvergiert, so bezeichnen wir ihren Grenzwert mit ∞ demPSymbol n=0 an . Diesen Grenzwert nennt man auch den Wert der Rei∞ he n=0 an . P∞ Mit der Reihe n=0 an wird auch oft etwas ungenau die Folge der Partialsummen selbst bezeichnet. Man spricht also von der Konvergenz bzw. der P∞ Divergenz der Reihe n=0 an . P∞ 1 konvergiert. Denn es gilt für die k-te Beispiel 2.1.2. Die Reihe n=1 n(n+1) Partialsumme sk : X k k k k+1 X X 1 1 1 1 X1 1 sk = = − = − =1− n(n + 1) n n + 1 n n n + 1 n=1 n=1 n=1 n=2 P ∞ 1 1 und damit, da ( n+1 ) eine Nullfolge ist, n=1 n(n+1) = limk→∞ sk = 1. P∞ Beispiel 2.1.3. Es sei z ∈ C mit |z| < 1. Dann nennen wir die Reihe n=0 z n eine geometrische Reihe. Die Folge der Partialsummen haben wir bereits früher betrachtet: es ist k X 1 − z k+1 zk = (2.1.1) 1−z n=0 P∞ k+1 1 und damit n=0 z n = limk→∞ 1−z = 1−z . 1−z Man beachte: für |z| > 1 gilt die Gleichung 2.1.1 immer noch, aber die rechte Seite z, aufgefasst als Folge in k, divergent. In der Gleichung P∞ istn für solche 1 n=0 z = 1−z ergibt die rechte Seite zwar auch für solche z Sinn, die linke aber nicht! 41 42 KAPITEL 2. REIHEN Wir haben Reihen als spezielle Folgen definiert; ist umgekehrt eine Folge (sk ) gegeben, so können wir eine Folge (an ) wie folgt definieren: a0 := s0 , sowie Pk an := sn − sn−1 . Dann gilt sk = n=0 an für alle k, d.h. die Folge (sk ) ist die Reihe über die an . Wir sehen also: Folgen und Reihen sind im Prinzip ein und dasselbe Konzept, nur aus einem anderen Blickwinkel betrachtet – der Grund, warum wir hier Reihen separat betrachten, ist der, dass viele Folgen in der Analysis natürlicherweise als Reihen auftreten. Da R und C vollständig sind, gilt der folgende Satz, der manchmal als Cauchy-Kriterium der Konvergenz einer Reihe bezeichnet wird: P∞ Satz 2.1.4. Eine Reihe n=0 an reeller oder komplexer Zahlen konvergiert genau dann, wenn die Folge ihrer Partialsummen eine Cauchy-Folge bildet, d.h. wenn für alle ε >P 0 ein n0 ∈ N existiert, so dass für alle n ≥ n0 und alle q ∈ N, q q ≥ 1, gilt, dass | i=1 an+i | < ε. Satz 1.8.1 impliziert sofort das folgende Kriterium für die Konvergenz von Reihen mit nichtnegativen Gliedern: P∞ Satz 2.1.5. Eine Reihe n=0 an mit reellen, nichtnegativen Gliedern an konvergiert genau dann, wenn die Folge ihrer Partialsummen beschränkt ist. P∞ Bemerkung 2.1.6. Es folgt aus dem Cauchy-Kriterium: P∞Eine Reihe n=0 an konvergiert genau dann, wenn die abgeschnittene Reihe n=m an für irgend ein m ≥ 0 konvergiert. P∞ Satz 2.1.7. Es sei n=0 an eine konvergente P∞ Reihe. Dann sind sowohl die Folge (an ) als auch die Folge (rk ), wobei rk = n=k+1 an , Nullfolgen. Beweis. Wir zeigen zunächst, dass (an ) eine Nullfolge ist. Dafür wenden wir das Cauchy-Kriterum wie folgt an: für gegebenes ε > 0 gibt es ein n0 ∈ N, so dass für alle n ≥ n0 gilt, dass |an+1 | < ε. (Wir setzen q = 1 in der Notation von Satz 2.1.4.) Das bedeutet gerade, dass P∞an eine Nullfolge ist. P∞ Die Konvergenz der Reihe n=0 an impliziert, dass rk = n=k+1 an wohldefiniert ist. Um zu zeigen, dass (rk ) eine Nullfolge ist, wenden wir ebenfalls das Cauchy-Kriterium an: für gegebenes Pq ε > 0 gibt es ein k0 ∈ N, so dass für alle k ≥ k0 und alle q ≥ 1 gilt, dass | i=1 ak+i | < ε/2. Für den Grenzwert q → ∞ P∞ folgt |rk | = | i=1 ak+i | ≤ ε/2 < ε. P∞ Beispiel 2.1.8. Die harmonische Reihe n=1 n1 konvergiert nicht, obwohl die Folge der Reihenglieder (1/n) eine Nullfolge ist. Um dies einzusehen, betrachten wir für jedes k die 2k -te Partialsumme s2k der harmonischen Reihe und klammern wie folgt: i+1 k−1 2X 2k X X 1 1 s2k = =1+ n n i n=1 i=0 n=2 +1 1 1 1 1 1 1 1 1 1 =1+ + + + + + + + ··· + + · · · + . 2 3 4 5 6 7 8 2k−1 + 1 2k Wir schätzen in jeder Klammer jeden Summanden gegen den kleinsten Summanden in der Klammer ab und erhalten i+1 2X n=2i +1 1 1 2i 1 ≥ (2i+1 − 2i ) · i+1 = i+1 = , n 2 2 2 2.1. KONVERGENTE REIHEN 43 so dass wir k 2 erhalten. Die Folge der Partialsummen ist also unbeschränkt und kann daher nicht konvergieren. s2k ≥ 1 + Beispiel 2.1.9. Als Anwendung der Divergenz der harmonischen Reihe betrachten wir folgendes Problem: wir möchten (identische, quaderförmige) Holzklötze der Länge l so versetzt aufeinanderstapeln, dass der oberste Klotz möglichst weit über den untersten herausragt. Wir bezeichnen mit dn den horizontalen Abstand der äußeren Kante des obersten Klotzes zum n-ten Klotz. Insbesondere: d1 = 0. Der Schwerpunkt eines Klotzes liegt genau in der Mitte des Klotzes; damit liegt der Schwerpunkt des n-ten Klotzes genau an der Stelle dn + l/2. Der Gesamtschwerpunkt der ersten n Klötze liegt daher bei ! n l 1 X di + . n i=1 2 Damit der Stapel nicht umfällt, müssen wir garantieren, dass dieser Gesamtschwerpunkt über dem n + 1-ten Klotz liegt, d.h. dass obiger Ausdruck ≥ dn+1 ist. Wir möchten den Überhang der Klötze maximieren, und setzen die Klötze daher so aufeinander, dass ! n n l l 1X 1 X di + = + di . dn+1 = n i=1 2 2 n i=1 So ist gesichert, dass der Turm nicht umfällt. Damit ist aber n n−1 1X 1 X di − di n i=1 n − 1 i=1 ! n−1 X 1 1 1 = di − + dn n n − 1 n i=1 ! n−1 X 1 1 =− di + dn n · (n − 1) i=1 n 1 l 1 =− dn − + dn n 2 n l . = 2n dn+1 − dn = Es ist also dn+1 = dn + l l = ··· = 2n 2 1 1 1 1 + + + ··· + . 2 3 n Da die harmonische Reihe divergiert, divergiert auch die Folge (dn ). Wir sehen, dass wir einen beliebig großen Überhang erzeugen können, ohne dass der Turm umfällt. P∞ P∞ Satz 2.1.10. Es seien n=0 an und n=0 bnPzwei konvergente Reihen mit ∞ reellen P oder komplexen Gliedern. Dann ist P∞ P∞ auch n=0 (an + bn ) konvergent, und ∞ es gilt n=0 (an + bn ) = n=0 an + n=0 bn . 44 KAPITEL 2. REIHEN P∞ Beweis. Die Folge der Partialsummen der Reihe n=0 (an + bn ) ist gleich der Summe der Folgen der Partialsummen der ursprünglichen Reihen ist. Da die Summe zweier konvergenter Folgen wieder konvergent, mit Summe der Grenzwerte als Grenzwert, ist, folgt die Behauptung sofort. P∞ Genauso leicht zeigt man: ist n=0 an eine konvergente P∞ Reihe mit reellen oder komplexen Gliedern, und b ∈ R oder C, so ist auch n=0 ban konvergent, P∞ P∞ und es gilt n=0 ban = b n=0 an 2.2 Absolute Konvergenz P∞ Definition 2.2.1. Eine Reihe Zahlen heißt n=0 an reeller oder komplexer P∞ absolut konvergent, wenn die Reihe der Absolutbeträge n=0 |an | konvergiert. P∞ Satz 2.2.2. Eine absolut konvergente an reeller oder komplexer P∞ Reihe Pn=0 ∞ Zahlen ist konvergent, und es gilt | n=0 an | ≤ n=0 |an |. Beweis. Wenden wir das Cauchy-Kriterium auf die Reihe der Absolutbeträge an, so erhalten wir: für vorgegebenes ε > 0 gibt es n0 ∈ N, so dass für alle Pq n ≥ n0 und alle q ≥ 1 gilt, dass i=1 |an+i | < ε. Nach der Dreiecksungleichung gilt nun aber auch q q X X an+i ≤ |an+i | < ε, i=1 i=1 P∞ so dass die Reihe n=0 an nach dem Cauchy-Kriterium konvergiert. Für die Ungleichung beobachten wir, dass für alle N ∈ N gilt, dass N N X X an ≤ |an |. n=0 n=0 Sowohl die rechte als auch die linke Seite dieser Ungleichung konvergiert für N → ∞, so dass gilt: ∞ N ∞ N N X X X X X |an |. an = lim an = lim an ≤ lim |an | = N →∞ n→∞ N →∞ n=0 n=0 n=0 n=0 n=0 Satz 2.2.3 (Leibnizkriterium). Es sei (an ) eine monoton P∞ fallende Nullfolge (insbesondere an ∈ R). Dann ist die alternierende Reihe n=0 (−1)n an konvergent. Beweis. Wir betrachten die Folge (sk ) der Partialsummen der alternierenden P∞ Pk n n Reihe n=0 (−1) an . Betrachten wir die Teilfolge n=0 (−1) an , d.h. sk = (s2k ), so sehen wir: s2k+2 = s2k − a2k+1 + a2k+2 ≤ s2k für alle k, da die Folge (an ) monoton fallend, und damit −a2k+1 + a2k+2 ≤ 0 ist. Weiterhin ist s2k = (a0 − a1 ) + (a2 − a3 ) + · · · + (a2k−2 − a2k−1 ) + a2k ≥ a2k ≥ 0, 2.3. WEITERE KONVERGENZKRITERIEN 45 da alle Klammern aufgrund der Monotonie von (an ) nichtnegative reelle Zahlen sind. Es handelt sich bei (s2k ) also um eine monoton fallende, beschränkte Folge, die damit konvergieren muss. Genauso zeigt man, dass die Teilfolge (s2k+1 ) konvergieren muss. Weiterhin gilt s2k+1 = s2k − a2k+1 , und damit, da (an ) eine Nullfolge ist, limk→∞ s2k+1 = limk→∞ s2k . Wir haben die Folge (sk ) also durch zwei Teilfolgen ausgeschöpft, die beide denselben Grenzwert besitzen. Es folgt, dass auch sk gegen diesen Grenzwert konvergiert. P∞ Beispiel 2.2.4. Die Reihe n=1 (−1)n n1 ist nicht absolut konvergent, da die entsprechende Reihe der Absolutbeträge gerade die harmonische Reihe ist. Da (1/n) aber eine Nullfolge ist, konvergiert sie nach dem Leibnizkriterium. 2.3 Weitere Konvergenzkriterien P∞ Satz 2.3.1 (Majorantenkriterium). Es sei n=0 cn eine konvergente Reihe mit reellen, nichtnegative Gliedern cn . Sind an ∈ C, so dass |an | ≤ cn für alle n, so P∞ ist die Reihe n=0 an absolut konvergent. PN PN P∞ Beweis. Für alle N ∈ N gilt n=0 |aP n| ≤ n=0 cn ≤ n=0 cn . Damit ist die ∞ Folge der Partialsummen der Reihe n=0 |an | beschränkt, und die (absolute) Konvergenz folgt direkt aus Satz 2.1.5. P∞ Satz 2.3.2 (Wurzelkriterium). Es sei eine Reihe n=0 an mit reellen oder komplexen Gliedern gegeben. Falls ein 0 < C < 1 und ein n0 ∈ N existiert, so dass p n |an | ≤ C P∞ für alle n ≥ n0 , dann ist die Reihe n=0 an absolut konvergent. P∞ Beweis. In der gegebenen Situation ist die geometrische Reihe n=0 C n konn vergent, da C < 1. Nach Annahme P∞gilt |an | ≤ C für alle n ≥ n0 , so dass die absolute Konvergenz der Reihe aus dem Majorantenkriterium 2.3.1 n=0 an P ∞ folgt. (Die absolute Konvergenz der Reihe n=0 an ist äquivalent zur absoluten P∞ Konvergenz der Reihe n=n0 an .) Oft wird das Wurzelkriterium mit Hilfe des sogenannten Limes superior formuliert. Um ihn zu definieren, erinnern wir daran, dass wir in den Übungen gezeigt haben, dass die Menge der Häufungspunkte einer Folge reeller Zahlen eine abgeschlossene Teilmenge von R ist. Ist (an ) nun eine beschränkte Folge reeller Zahlen, so ist die Menge ihrer Häufungspunkte abgeschlossen und beschränkt (sowie nichtleer nach dem Satz von Bolzano-Weierstraß), und besitzt somit Maximum und Minimum. Definition 2.3.3. Ist (an ) eine beschränkte Folge reeller Zahlen, so bezeichnen wir den größten Häufungspunkt von (an ) als den Limes superior der Folge (an ); in Zeichen lim supn→∞ an . Analog bezeichnet man den kleinsten Häufungspunkt von (an ) als den Limes inferior der Folge (an ); in Zeichen lim inf n→∞ an . p Dann lautet das wenn lim supn→∞ n |an | < 1, dann konPWurzelkriterium: ∞ vergiert die Reihe n=0 an absolut. Insbeondere konvergiert die Reihe also abp n solut, wenn limn→∞ |an | existiert und echt kleiner als 1 ist. 46 KAPITEL 2. REIHEN P∞ Bemerkung 2.3.4. Ist für eine Reihe n=0 an mit reellen oder komplexen p n Gliedern lim supn→∞ |an | > 1, so kann die Reihe nicht konvergieren, da die Folge (an ) dann keine Nullfolge bilden kann. p Das Wurzelkriterium trifft im Fall, dass lim supn→∞ n |an | = 1, keine Aussage. Beispiel 2.3.5. P∞ n1. Wir betrachten für z ∈ C mit |z| < 1 die geometrische Konvergenz dieser Reihe folgt auch aus dem WurReihe n=0 z . Diep zelkriterium: es ist n |z n | = |z| < 1, sogar unabhängig von n. (Dieses Beispiel ist etwas tautologisch, da das Wurzelkriterium ja gerade über den Vergleich mit einer geometrischen Reihe bewiesen wurde.) P∞ 1 die alternierende 2. Wir betrachten die harmonische Reihe n=0 n sowie q P∞ n 1 n1 harmonische Reihe n=0 (−1) n . Es gilt limn→∞ n = 1, andererseits wissen wir, dass die alternierende harmonische Reihe konvergiert, die harmonische Reihe p jedoch divergiert. Wir sehen also, dass die Bedingung lim supn→∞ n |an | = 1 keine Aussage über die Konvergenz oder Divergenz einer Reihe impliziert. P∞ Satz 2.3.6 (Quotientenkriterium). Es sei eine Reihe n=0 an mit reellen oder komplexen Gliedern gegeben. Falls ein 0 < C < 1 und ein n0 ∈ N existiert, so dass an+1 an ≤ C, P∞ für alle n ≥ n0 , so konvergiert die Reihe n=0 an absolut. Beweis. In der gegebenen Situation gilt für alle n ≥ n0 |an | |an0 +1 | |an0 +2 | |an | ≤ C n−n0 , = · · ··· · |an0 | |an0 | |an1 | |an−1 | also |an | ≤ (|an0 | · C −n0 )C n . Die absolute Konvergenz folgt also wie beim Wurzelkriterium aus dem Majorantenkriterium, diesmal angewandt auf das Produkt P∞ der geometrischen Reihe n=0 C n mit der Konstanten |an0 |C −n0 . Auch dieses Kriterium kann man äquivalent mit Hilfe des Limes Superior P∞ formulieren: ist lim supn→∞ aan+1 < 1, so konvergiert die Reihe n=0 an abso n lut. Beispiel 2.3.7. Warnung: Anders als beim Wurzelkriterium gilt nicht, dass aus P∞ an+1 lim supn→∞ an > 1 folgt, dass die Reihe n=0 an divergiert. Wir betrachten P∞ zum Beispiel die Reihe n=0 an , wobei ( an = 1 2n 1 2n−2 n gerade n ungerade. q q √ p n 1 Da n 21n = 12 und n 2n−2 = 2 4 → 12 für n → ∞, gilt limn→∞ n |an | = 12 < 1, P weswegen die Reihe n→∞ an nach dem Wurzelkriterium absolut konvergiert. 2.3. WEITERE KONVERGENZKRITERIEN 47 Andererseits gilt für gerades n, dass an+1 2n = n−1 = 2, an 2 während für ungerades n gilt, dass 1 an+1 2n−2 = n+1 = . an 2 8 Damit ist lim supn→∞ aan+1 = 2 > 1, obwohl die Reihe, wie oben gezeigt, konn vergiert. Beispiel 2.3.8. Wir betrachten für ein festes x ∈ C die Reihe ∞ X xn n! n=0 und zeigen mit Hilfe des Quotientenkriteriums, dass sie absolut konvergent ist: n Setzen wir an := xn! , so gilt an+1 xn+1 n! |x| = · an (n + 1)! xn = n + 1 . 1 Für n ≥ 2|x| gilt also aan+1 ≤ 2 < 1, so dass das Quotientenkriterium anwendn bar ist. Wir definieren ∞ X xn ; ex := exp(x) := n! n=0 die Reihe xn n=0 n! P∞ nennen wir die Exponentialreihe. Insbesondere ist e = e1 = ∞ X 1 . n! n=0 Man beachte, dass wir n in Abschnitt 1.9 die Eulersche Zahl e anders, nämlich als e = limn→∞ 1 + n1 definiert haben. In den Übungen werden wir sehen, dass diese Definitionen übereinstimmen. P∞ Satz 2.3.9 (Cauchyscher Verdichtungssatz). Eine Reihe n=0 an mit reellen, nichtnegativen, monotonP fallenden Gliedern an ist genau dann konvergent, wenn ∞ die ,,verdichtete” Reihe n=0 2n a2n konvergiert. P∞ Beweis. Es konvergiere die Reihe n=0 an gegen einen Wert s. Da die Folge (an ) monoton fallend ist und aus nichtnegativen Gliedern besteht, gilt s ≥ a1 + a2 + (a3 + a4 ) + (a5 + a6 + a7 + a8 ) + · · · + (a2n−1 +1 + · · · + a2n ) 1 ≥ a1 + a2 + 2a4 + 4a8 + · · · + 2n−1 a2n , 2 Pn also i=0 2i a2i ≤ 2s. Damit konvergiert die verdichtete Reihe nach Satz 2.1.5. 48 KAPITEL 2. REIHEN P∞ Es konvergiere nun umgekehrt die verdichtete Reihe i=0 2i ai gegen einen Wert r. Für n ∈ N und k, so dass 2k ≥ n, schätzen wir nun umgekehrt ab: n X ai ≤ a1 + (a2 + a3 ) + (a4 + · · · + a7 ) + · · · + (a2k + · · · + a2k+1 −1 ) i=1 ≤ a1 + 2a2 + 4a4 + · · · + 2k a2k ≤ r, und wieder folgt die Konvergenz aus Satz 2.1.5. Beispiel 2.3.10. Wir für a ∈ Q die Konvergenz der allgemeinen Puntersuchen ∞ 1 harmonischen Reihe mit Hilfe des Cauchyschen Verdichtungssatzes. n=1 na Der Satz besagt, dass die Konvergenz dieser Reihe zur Konvergenz der Reihe ∞ X n ∞ X 1 = 2 (2n )a 2a−1 n=1 n=1 n 1 1 < 1, und damit handelt es sich bei der äquivalent ist. Für a > 1 gilt 2a−1 Reihe auf der rechten Seite um eine konvergente geometrische Reihe. Für a ≤ 1 1 ist 2a−1 ≥ 1, und damit divergiert die Reihe. Dasselbe gilt also auch für die allgemeine harmonische Reihe. 2.4 Klammerung und Umordnung Der folgende Satz besagt, dass man in einer konvergenten Reihe die Glieder beliebig klammern darf, solange man die Reihenfolge der Glieder beibehält: P∞ Satz 2.4.1. Es sei eine konvergente Reihe n=0 an mit reellen oder komplexen Gliedern gegeben. Es seien Pnkweiterhin 0 ≤ n1 < n2 < n3 < · · · gegebene natürliche Zahlen und bk := n=n a für jedes k. Dann konvergiert auch P∞ P∞k−1 +1 nP∞ die Reihe k=0 bk , und es gilt k=0 bk = n=0 an . P∞ Beweis. Die Konvergenz der Reihe n=0 an ist gleichbedeutend mit der KonPm vergenz der Folge der Partialsummen sm := n=0 an . Die l-te Partialsumme P∞ Pl Pnl der Reihe k=0 bk ist aber gleich k=0 bk = n=0 an = snl , d.h. die Folge der Partialsummen der Reihe über die bk ist eine Teilfolge der Folge (sm ). Eine Teilfolge einer konvergenten Folge ist aber konvergent, mit demselben Grenzwert. Man beachte, dass es problematischer ist, eine vorhandene Klammerung P∞ P∞ wegzulassen: Betrachten wir die Reihe k=0 bk = k=0 (1 − 1), d.h. bk = 1 − 1 = 0, so ist diese natürlich trivialerweise konvergent. Die gegebene Klammerung dürfen wir aber nicht weglassen – tun wir dies, so erhalten wir die Reihe P∞ n n=0 an , mit an = (−1) , die divergiert (da (an ) keine Nullfolge ist). Um eine vorhandene Klammerung wegzulassen, muss man die Konvergenz der dann entstehenden Reihe noch separat zeigen. Als nächstes wenden wir uns der Frage zu, ob die Reihenfolge der Glieder einer Reihe einen Einfluss auf die Konvergenz einer Reihe, und auf denP Wert einer ∞ konvergenten Reihe, hat. Wir betrachten Umordnungen einer Reihe n=0 an in folgendem Sinn: ist f : N → N eine bijektive Abbildung und bn := af (n) , so 2.4. KLAMMERUNG UND UMORDNUNG 49 P∞ betrachten wir die Reihe n=0 bn und uns, ob diese genau dann konverPfragen ∞ giert, wenn die ursprüngliche Reihe n=0 an konvergiert, und wenn ja, ob sie denselben Wert hat. P∞ Definition 2.4.2. Eine konvergente Reihe n=0 an mit reellen oder komplexen Gliedern heißt P unbedingt konvergent, wenn für jede Bijektion f : NP→ N gilt, ∞ ∞ dass die Reihe n=0 bn , mit bn := af (n) , ebenfalls konvergiert, mit n=0 bn = P∞ a . n n=0 Eine konvergente, aber nicht unbedingt konvergente Reihe heißt bedingt konvergent. Satz 2.4.3. Eine absolut konvergente Reihe mit reellen oder komplexen Gliedern ist auch unbedingt konvergent. P∞ Beweis. Es sei n=0 an eine absolut konvergente Reihe mit reellen oder komplexen Gliedern, f : N → N eine Bijektion und bn := af (n) für alle n. Wir bezeichPk Pk nen die Folgen der Partialsummen mit sk := n=0 an und rk := n=0 bn = Pk f (n) . n=0 aP ∞ Da n=0 |an | nach Voraussetzung konvergiert, existiert für jedes ε > 0 ein N ∈ N, so dass für alle p ≥ 1 gilt, dass |aN +1 | + · · · + |aN +p | < ε. (2.4.1) Da f eine Bijektion ist, sind die Zahlen 0, 1, . . . , N im Bild von f ; damit finden wir also eine Zahl K, so dass {0, 1, . . . , N } ⊂ {f (0), f (1), . . . , f (K)}. Es gilt automatisch, dass K ≥ N . Für k ≥ K ≥ N treten also die Zahlen a0 , a1 , . . . , aN sowohl in der Summe sk auf, als auch in der Summe rk . Es folgt, dass für solche k N +p X sk − rk = δi ai i=N +1 für ein p ≥ 1, wobei δi jeweils entweder −1, 0 oder 1 ist. Damit folgt mit (2.4.1) |sk − rk | ≤ N +p X |ai | < ε, i=N +1 was bedeutet, dass (sk − rk ) eine Nullfolge ist. Da s nach Voraussetzung konvergiert, konvergiert also auch rk , und zwar gegen denselben Grenzwert. Als nächstes beweisen wir eine sehr starke Umkehrung dieses Satzes für Reihen von reellen Zahlen: Satz 2.4.4 (Riemannscher Umordnungssatz). Eine konvergente, aber nicht absolut konvergente Reihe mit reellen Gliedern ist bedingt konvergent. Es gilt in diesem Fall sogar: für jede vorgegebene reelle Zahl gibt es eine Umordnung der Reihe, die gegen diese reelle Zahl konvergiert. P∞ Beweis. Wir müssen nur die zweite Aussage zeigen. Es sei n=0 an eine konvergente Reihe reeller Zahlen, die nicht absolut konvergiert. Wir nehmen ohne Beschränkung der Allgemeinheit an, dass an 6= 0 für alle n. Wir setzen − + − a+ , an ≥ 0 n := max{an , 0} und an := max{−an , 0}. Für alle n gilt dann anP ∞ − − + − sowie die Gleichungen an = an − an und |an | = an + an . Die Reihen n=0 a+ n 50 KAPITEL 2. REIHEN P∞ − und n=0 P an sind notwendigerweise divergent: wäre eine dieser Reihen konver∞ − + gent, P z.B. n=0 a+ n , dann auch die andere, da an = an − an . Dann wäre aber ∞ + auch n=0 |an | als Summe der Reihen über die an und die a− n konvergent, in Widerspruch zu unserer Annahme. Wir definieren nun die Folge (pn ) als die Folge, die aus der Folge (a+ n ) entsteht, wenn man alle Nullen streicht. Genauso − definieren wir diePFolge (qn ) durch P∞ Streichung der Nullen in der Folge (an ). ∞ Auch die Reihen n=0 pn und n=0 qn sind divergent. Es gilt: jedes Glied an entspricht entweder einem pk oder einem −qk . Es sei nun P∞eine reelle Zahl G vorgegeben. Wir konstruieren eine Umordnung der Reihe n=0 an wie folgt: Es gibt einen kleinsten Index n0 , so dass n0 X pn > G n=0 (ist G negativ, so ist n0 = 0). Dann gibt es einen kleinsten Index n1 , so dass n0 X pn + n=0 n1 X −qn < G. n=0 Wir fahren mit dem kleinsten Index n2 > n0 fort, so dass n0 X n=0 pn + n1 X −qn + n2 X pn > G (2.4.2) n=n0 +1 n=0 P∞ usw. Die entstehende Reihe ist eine Umordnung der Reihe n=0 an . Der Abstand zwischen G und den Partialsummen der neuen Reihe lässt sich folgendermaßen abschätzen: z.B. in (2.4.2) gilt ! n2 n1 n0 X X X pn − G ≤ pn2 −qn + pn + n=0 n=0 n=n0 +1 aufgrund der Minimalität von n2 : würde die umgekehrte Ungleichung gelten, so wäre schon nach Addition von pn2 −1 ein Wert > G entstanden. So können wir alle Partialsummen durch immer spätere Folgenglieder pn bzw. qn abschätzen; da diese aufgrund der Konvergenz der ursprünglichen Reihe Nullfolgen bilden, folgt die Konvergenz der Folge der Partialsummen der neu konstruierten Reihe gegen G. 2.5 Das Cauchyprodukt Multiplizieren wir Pnein Produkt der Form (a0 + · · · + an ) · (b0 + · · · + bn ) aus, so erhalten wir i,j=0 ai bj . In dieser Doppelsumme ist es, da wir es nur mit endlich vielen Summanden zu tun haben, unerheblich, in welcher Reihenfolge wir sie aufaddieren. Problematischer wird es, wenn wir die analoge Fragestellung für Reihen betrachten. In Anbetracht der Resultate des letzten Abschnittes ist der folgende Satz jedoch nicht überraschend: P∞ P∞ Satz 2.5.1. Es seien n=0 an und n=0 bn absolut konvergente Reihen mit reellen oder komplexen Gliedern. Wir setzen für jedes n ∈ N cn := n X k=0 ak bn−k = a0 bn + a1 bn−1 + · · · + an−1 b1 + an b0 . 2.5. DAS CAUCHYPRODUKT Dann ist auch die Reihe 51 P∞ n=0 cn absolut konvergent, und es gilt ! ! ∞ ∞ ∞ X X X cn = an · bn . n=0 n=0 (2.5.1) n=0 Beweis. Wir bezeichnen die Partialsummen der auftretenden Reihen P∞ mit den entsprechenden Großbuchstaben: die N -te Partialsumme der Reile n=0 cn lautet dann N X X CN := cn = ak bl . n=0 Andererseits gilt für AN := PN k,l≥0, k+l≤N n=0 an und BN := X AN B N = PN n=0 bn , dass a k bl . 0≤k,l≤N Wir stellen uns die Summationsindizes als Teilmengen von N × N vor. Setzen wir Qn := {(k, l) ∈ N × N | k, l ≤ N } und ∆N := {(k, l) ∈ N × N | k + l ≤ N }, so erhalten wir X CN = a k bl (k,l)∈∆N und X AN BN = ak bl . (k,l)∈QN Mit ÃN , B̃N und C̃N bezeichnen wir die Partialsummen der Reihen über die PN entsprechenden Beträge, z.B. ÃN = n=0 |an |. Dann gilt X ÃN B̃N = |ak ||bl |. (k,l)∈QN Es gilt QbN/2c ⊂ ∆N , also QN \ ⊂ QN \ QbN/2c und damit folgt wegen AN B N − C N = X ak bl (k,l)∈QN \∆N die Ungleichung X |AN BN − CN | = ak bl (k,l)∈QN \∆N X ≤ |ak ||bl | (k,l)∈QN \∆N ≤ X |ak ||bl | (k,l)∈QN \QbN/2c = ÃN B̃N − ÃbN/2c B̃bN/2c . (2.5.2) P∞ P∞ Da die Reihen n=0 an und n=0 bn nach Voraussetzung absolut konvergent sind, existieren die Grenzwerte limN →∞ ÃN und limN →∞ B̃N . Sie stimmen mit 52 KAPITEL 2. REIHEN den Grenzwerten limN →∞ ÃbN/2c und limN →∞ B̃bN/2c überein, weswegen die rechte Seite in (2.5.2) gegen 0 konvergiert. Damit folgt die im Satz behauptete Formel (2.5.1). P∞ Es bleibt, die Aussage über die absolute Konvergenz der Reihe n=0 cn zu beweisen. Dafür beobachten wir, dass C̃N = N X |cn | ≤ n=0 X |ak ||bl | ≤ (k,l)∈∆N X |ak ||bl | = ÃN B̃N . (k,l)∈Qn Da P∞limN →∞ ÃN B̃N existiert, folgt, dass auch limN →∞ C̃N existiert. Damit ist n=0 cn absolut konvergent. Korollar 2.5.2. Für alle x, y ∈ C gilt exp(x + y) = exp(x) · exp(y). Für alle 1 . x ∈ C gilt exp(−x) = exp(x) Beweis. Da die Exponentialreihe (siehe Beispiel 2.3.8) absolut konvergent ist, gilt nach Satz 2.5.1 ! ! ∞ ∞ ∞ X X X yn xn · = cn , (2.5.3) exp(x) · exp(y) = n! n! n=0 n=0 n=0 wobei cn = n X xk k=0 n y n−k 1 X n k n−k (x + y)n · = · . x y = k! (n − k)! n! n! k k=0 Damit ist die rechte Seite von (2.5.3) gleich exp(x + y). Die zweite folgt, indem wir in der ersten x = y einsetzen und exp(0) = 1 verwenden. Kapitel 3 Stetigkeit 3.1 Stetige Abbildungen Eine Abbildung zwischen metrischen Räumen soll stetig heißen, wenn eine kleine Änderung des Arguments nur in einer kleinen Änderung des Funktionswerts resultiert. Wir haben zwei Möglichkeiten, dies zu formalisieren. Die erste lautet wie folgt: Definition 3.1.1. Eine Abbildung f : X → Y zwischen metrischen Räumen heißt stetig in einem Punkt x ∈ X, wenn für alle ε > 0 ein δ > 0 existiert, so dass f (Bδ (x)) ⊂ Bε (f (x)). Die Abbildung f heißt stetig, wenn sie in jedem Punkt x ∈ X stetig ist. Etwas ausführlicher: f ist in x0 stetig, wenn für alle ε > 0 ein δ > 0 existiert, so dass für alle x ∈ X mit d(x, x0 ) < δ gilt, dass d(f (x), f (x0 )) < ε. Die zweite Möglichkeit benutzt Folgen: Definition 3.1.2. Eine Abbildung f : X → Y zwischen metrischen Räumen heißt folgenstetig in einem Punkt x ∈ X, wenn für jede Folge (xn ) in X mit limn→∞ xn = x gilt, dass limn→∞ f (xn ) = f (x). Die Abbildung f heißt folgenstetig, wenn sie in jedem Punkt x ∈ X folgenstetig ist. Satz 3.1.3. Es sei f : X → Y eine Abbildung zwischen metrischen Räumen und x ∈ X. Dann ist f genau dann stetig in x, wenn f folgenstetig in x ist. Insbesondere ist f genau dann stetig, wenn f folgenstetig ist. Beweis. Es sei f stetig in x und (xn ) eine Folge in X, die gegen x konvergiert. Es sei ε > 0 vorgegeben. Dann gibt es, da f stetig in x ist, ein δ > 0, so dass f (Bδ (x)) ⊂ Bε (f (x)). Da (xn ) gegen x konvergiert, gibt es ein n0 ∈ N, so dass d(x, xn ) < δ für alle n 6= n0 . Für diese n gilt also auch d(f (x), f (xn )) < ε. Wir haben gezeigt, dass die Folge (f (xn )) gegen f (x) konvergiert. Für die Rückrichtung nehmen wir an, dass f nicht in x stetig ist, d.h. es ein ε > 0 gibt, so dass für alle δ > 0 ein z ∈ X existiert, so dass zwar d(x, z) < δ, aber d(f (x), f (z)) ≥ ε. Insbesondere gibt es zu jedem N ∈ N ein xn , so dass d(x, xn ) < n1 , aber d(f (x), f (xn )) ≥ ε. Die Folge (xn ) konvergiert also gegen x, aber die Folge (f (xn )) nicht gegen f (x). 53 54 KAPITEL 3. STETIGKEIT Beispiel 3.1.4. 1. Es sei X ein metrischer Raum und f = idX : X → X die identische Abbildung, d.h. f (x) = x für alle x ∈ X. Wann immer (xn ) eine konvergente Folge mit Grenzwert x ∈ X ist, dann ist auch (f (xn )) = (xn ) konvergent, mit Grenzwert f (x) = x. Damit ist f stetig. 2. Allgemeiner sei Y ⊂ X eine Teilmenge eines metrischen Raumes mit der induzierten Metrik. Dann ist die Inklusion Y → X; y 7→ y stetig. 3. Es seien X und Y metrische Räume und y0 ∈ Y . Dann ist die konstante Abbildung f : X → Y , gegeben durch f (x) = y0 , stetig. Es sei nämlich (xn ) eine in X konvergente Folge, mit Grenzwert x. Dann ist (f (xn )) die konstante Folge y0 , die natürlich gegen y0 = f (x) konvergiert. 4. Die Betragsfunktion | · | : C → R (oder R → R) ist stetig: es sei a ∈ C und ε > 0 gegeben. Wir setzen δ = ε. Ist nun b ∈ C mit |a − b| < δ = ε, dann ist ||a| − |b|| ≤ |a − b| < ε, d.h. | · | ist in a stetig. ( 0 x<0 5. Wir betrachten die Abbildung f : R → R; x 7→ und behaupten, 1 x ≥ 0. dass sie in 0 nicht stetig ist. Denn für ε = 21 und ein beliebig vorgegebenes δ > 0 gibt es ein x ∈ R mit |x − 0| < δ, aber |f (x) − 1| ≥ ε: setzen wir x = − 2δ , so gilt |x| = 2δ < δ, aber |f (− 2δ ) − 1| = |0 − 1| = 1 ≥ 21 . Mittels Folgen argumentiert man so: die Folge (an ), definiert durch an = − n1 , erfüllt an → 0, aber (f (an )) ist konstant Null, konvergiert also nicht gegen f (0) = 1. 6. Allgemeiner betrachten wir für eine Teilmenge A ⊂ X eines metrischen Raumes die charakteristische Funktion χA : X → R, die durch χA (x) = ( 1 x∈A definiert ist. Man zeigt: χA ist genau dann stetig, wenn A in 0 x∈ /A X offen und abgeschlossen ist. Wir sagen, dass ein metrischer Raum X zusammenhängend ist, wenn eine Teilmenge von X, die zugleich offen und abgeschlossen ist, schon gleich ∅ oder X sein muss. Es folgt: ist X ein zusammenhängender Raum und A ⊂ X weder leer noch der ganze Raum X, so ist χA unstetig. ( 0 x≤0 7. Es sei f : R → R; x 7→ und behaupten, dass sie stetig ist. Da x x>0 Stetigkeit in einem Punkt x nur von der Funktion in einer offenen Menge um x abhängt, ist die Stetigkeit in jedem Punkt x0 6= 0 offensichtlich. (Entweder stimmt die Funktion in einer offenen Menge mit der konstanten Nullfunktion überein, oder mit der Funktion x 7→ x.) Es bleibt, die Stetigkeit in x0 = 0 zu zeigen. Dafür sei ε > 0 gegeben. Wir behaupten, dass für |x − x0 | = |x| < δ := ε gilt, dass |f (x) − f (x0 )| = |f (x)| < ε. Dies ist aber klar, da f (x) entweder gleich x ist, so dass die Ungleichung nach Wahl von x gilt, oder gleich 0 ist, in welchem Fall sogar |f (x)| = 0 ist. 8. Es sei (X, d) ein metrischer Raum. Wir betrachten (X × X, d0 ) als metrischen Raum wie in Beispiel 1.5.2. Dann ist die Abstandsfunktion d : 3.1. STETIGE ABBILDUNGEN 55 X × X → R stetig: es seien (x, y) ∈ X × X sowie ε > 0 gegeben. Mit δ := ε gilt für alle (x0 , y 0 ) ∈ X × X mit d0 ((x, y), (x0 , y 0 )) < δ, dass |d(x, y) − d(x0 , y 0 )| ≤ d(x, x0 ) + d(y, y 0 ) = d0 ((x, y), (x0 , y 0 )) < δ = ε. Es folgt, dass d stetig ist. 9. Wir zeigen, dass exp : C → C stetig ist. Zuerst zeigen wir die Stetigkeit in 0: Dafür notieren wir, dass für jedes z ∈ C mit |z| ≤ 1 und jedes n ∈ N gilt, dass ∞ ∞ ∞ X X 1 z n X |z|n ≤ ≤ · |z| = (e − 1) · |z|, | exp(z) − 1| = n! n! n! n=1 n=1 n=1 wobei wir im vorletzten Schritt benutzt haben, dass |z|n−1 ≤ 1, da |z| ≤ 1. Ist nun (zn ) eine Nullfolge in C, so gilt, dass | exp(zn )−exp(0)| = | exp(zn )− 1| ≤ (e − 1) · |zn |, also konvergiert die Folge (exp(zn )) gegen exp(0) = 1. Damit ist die Exponentialfunktion stetig in 0. Nun sei (zn ) eine konvergente Folge in C mit Grenzwert z. Dann gilt exp(zn ) = exp(zn − z + z) = exp(zn − z) exp(z); da zn − z gegen 1 konvergiert, konvergiert diese Folge also gegen exp(z). Damit ist exp in z stetig. Man kann die Stetigkeit einer Abbildung auch mit Hilfe eines allgemeineren Grenzwertbegriffs formulieren: Definition 3.1.5. Es sei f : X → Y eine Abbildung zwischen metrischen Räumen , p ∈ X und a ∈ Y . Falls für jede Folge (xn ) in X\{p} mit limn→∞ xn = p gilt, dass limn→∞ f (xn ) = a, so schreiben wir lim f (x) = a. x→p Bemerkung 3.1.6. Man beachte, dass in dieser Definitions der Funktionswert f (p) vollkommen irrelevant ist. Beispielsweise erfüllt die Funktion f : R → ( 0 x 6= 0 R; f (x) = , dass limx→0 f (x) = 0, obwohl f (0) 6= 0. Dieser Grenz1 x=0 wertbegriff ergibt insbesondere auch Sinn für Funktionen, die nur auf X \ {p} definiert sind. Es gibt Autoren, die diese Limes-Schreibweise anders verwenden, und verlangen, dass die Bedingung in Definition 3.1.5 für alle Folgen (xn ) in X gilt. Es ist dann in der Definition automatisch a = f (p). Mit dieser Grenzwertdefinition ist die (Folgen)-Stetigkeit einer Abbildung f : X → Y in einem Punkt p ∈ X nun äquivalent zu der Bedingung lim f (x) = f (p). x→p (3.1.1) 56 KAPITEL 3. STETIGKEIT Satz 3.1.7. Es seien X ein metrischer Raum und f, g : X → C zwei stetige Funktionen. Dann sind auch f + g : X −→ C; x 7−→ f (x) + g(x) und f · g : X −→ C; x 7−→ f (x) · g(x) stetig. Beweis. Dies folgt sofort daraus, dass Summe und Produkt konvergenter Folgen komplexer Zahlen wieder konvergent sind, mit Grenzwert gleich der Summe bzw. dem Produkt der entsprechenden Grenzwerte. Beispiel 3.1.8. Wir wissen, dass die identische Abbildung C → C stetig ist. Durch mehrfache Anwendung von Satz 3.1.7 folgt, dass auch C → C; x 7→ xk stetig ist. Es folgt, wieder durch Anwendung von Satz 3.1.7, Pn dass Polynomfunktionen, d.h. Abbildungen f : C → C der Form f (x) = k=0 ak xk für gewisse a0 , . . . , an ∈ C, stetig sind. Satz 3.1.9. Es seien X ein metrischer Raum und f, g : X → C zwei stetige Abbildungen. Weiterhin sei x0 ∈ X, so dass g(x0 ) 6= 0. Dann gibt es ein δ > 0, so dass g(x) 6= 0 für alle x ∈ δ(x0 ), und die Funktion f (x) f : Bδ (x0 ) −→ C; x 7−→ g g(x) ist stetig. Beweis. Da g in x0 stetig ist, gibt es zu ε = g(x0 )| < ε für alle x ∈ Bδ (x0 ). Es folgt, dass |g(x0 )| 2 ein δ > 0, so dass |g(x) − |g(x)| = |g(x) − g(x0 ) + g(x0 )| ≥ |g(x0 )| > |g(x) − g(x0 )| ≥ 2ε − ε = ε > 0 für alle x ∈ Bδ (x0 ). Die Stetigkeit der Abbildung fg auf Bδ (x0 ) folgt nun, da der Quotient zweier konvergenter Folgen mit Grenzwert der Nennerfolge ungleich 0 wieder konvergent ist, mit Grenzwert gleich dem Quotienten der Grenzwerte. Satz 3.1.10. Eine Abbildung f : X → Y zwischen metrischen Räumen ist genau dann stetig, wenn das Urbild f −1 (U ) einer jeden in Y offenen Menge U ⊂ Y offen in X ist. Beweis. Es sei f : X → Y eine stetige Abbildung zwischen metrischen Räumen und U ⊂ Y offen. Wir müssen zeigen, dass f −1 (U ) offen in X ist. Es sei dafür x ∈ f −1 (U ) beliebig. Da U offen ist, gibt es ein ε > 0, so dass Bε (f (x)) ⊂ U . Da f stetig in x ist, gibt es also ein δ > 0, so dass f (Bδ (x)) ⊂ Bε (f (x)) ⊂ U . Das bedeutet, dass Bδ (x) ⊂ f −1 (U ), was zeigt, dass f −1 (U ) offen ist. Es gelte nun umgekehrt, dass f −1 (U ) für jede in Y offene Menge U offen in X ist. Es sei x ∈ X beliebig; wir zeigen, dass f stetig in x ist. Dafür sei ε > 0 beliebig. Da Bε (f (x)) offen in Y ist, ist nach Voraussetzung f −1 (Bε (f (x))) eine offene Menge in X, die außerdem x enthält. Damit gibt es ein δ > 0, so dass Bδ (x) ⊂ f −1 (Bε (f (x))), d.h. so, dass f (Bδ (x)) ⊂ Bε (f (x)). 3.2. STETIGE ABBILDUNGEN AUF R 57 Satz 3.1.11. Es seien f : X → Y und g : Y → Z stetige Abbildungen zwischen metrischen Räumen. Dann ist auch die Komposition g ◦ f : X → Z stetig. Beweis. Wir verwenden die Charakterisierung der Stetigkeit aus Satz 3.1.10. Für jede in Z offene Menge U ist (g ◦ f )−1 (U ) offen in X: da g stetig ist, ist g −1 (U ) offen in Y , und da f stetig ist, dann auch f −1 (g −1 (U )) = (g ◦ f )−1 (U ) offen in X. Korollar 3.1.12. Es sei f : X → Y eine stetige Abbildung zwischen metrischen Räumen und Z ⊂ X eine Teilmenge, die wir mit der induzierten Metrik versehen. Dann ist die Einschränkung f |Z : Z → Y auch stetig. Beweis. Die Einschränkung f |Z ist nach Definition die Verknüpfung der Inklusion Z → X mit f . Dass die Inklusion stetig ist, haben wir in Beispiel 3.1.4 beobachtet; damit folgt die Behauptung aus Satz 3.1.11. Bemerkung 3.1.13. Es ist möglich, die Konzepte der Stetigkeit für Abbildungen zwischen topologischen Räumen zu verallgemeinern. Der Begriff der Folgenstetigkeit lässt sich wörtlich übernehmen, da wir einen Begriff von Konvergenz einer Folge in einem topologischen Raum haben. Da der Begriff der Stetigkeit die Abstandsfunktion benutzt, lässt dieser sich nicht direkt übertragen; die äquivalente Charakterisierung in Satz 3.1.10 benutzt aber lediglich den Begriff der offenen Menge, der in einem allgemeinen topologischen Raum verfügbar ist. Dies nimmt man als Motivation, eine Abbildung f : X → Y zwischen topologischen Räumen als stetig zu definieren, wenn das Urbild f −1 (U ) einer jeden in Y offenen Menge U ⊂ Y offen in X ist. Eine Abbildung f : X → Y zwischen topologischen Räumen ist nun aber im Allgemeinen nicht genau dann stetig, wenn sie folgenstetig ist – ein weiteres Indiz dafür, dass sich allgemeine topologische Räume viel pathologischer verhalten können als metrische Räume. 3.2 Stetige Abbildungen auf R Für Funktionen f : R → R können wir, ähnlich wie in Definition 3.1.5, weitere Typen von Limiten definieren: Definition 3.2.1. Es sei f : R → R eine Funktion. Falls eine Zahl a ∈ R existiert, so dass für jede Folge (xn ), die gegen +∞ (bzw. −∞) divergiert, gilt, dass limn→∞ f (xn ) = a, so schreiben wir limx→+∞ f (x) = a (bzw. limx→−∞ f (x) = a. Falls für jede Folge (xn ), die gegen +∞ divergiert, gilt, dass (f (xn )) gegen +∞ (bzw. −∞ divergiert), so schreiben wir limx→+∞ f (x) = ∞ (bzw. limx→−∞ f (x) = −∞). Entsprechendes definieren wir für −∞ statt +∞. Man kann diese Bedingungen auch ohne Folgen formulieren. Zum Beispiel gilt genau dann limx→+∞ f (x) = a, wenn gilt: Für alle ε > 0 gibt es ein C > 0, so dass für alle x > C gilt, dass |f (x) − a| < ε. Definition 3.2.2. Es sei f : R → R eine Funktion, p ∈ R und a ∈ R. Falls für alle ε > 0 ein δ > 0 existiert, so dass für alle x ∈ (p − δ, p) gilt, dass |f (x) − a| < ε, so schreiben wir limx%p f (x) = a. Falls für alle ε > 0 ein δ > 0 existiert, so dass für alle x ∈ (p, p + δ) gilt, dass |f (x) − a| < ε, so schreiben wir limx&p f (x) = a. 58 KAPITEL 3. STETIGKEIT Man zeigt: f ist genau dann stetig in p, wenn limx%p f (x) = limx&p f (x) = f (p). Satz 3.2.3 (Zwischenwertsatz). Es seien a, b ∈ R, a < b, und f : [a, b] → R stetig, so dass f (a) ≤ f (b). Dann gibt es für jede reelle Zahl u ∈ [f (a), f (b)] ein x ∈ [a, b], so dass f (x) = u. Gilt stattdessen, dass f (a) ≥ f (b), so gilt dieselbe Aussage für alle u ∈ [f (b), f (a)]. Beweis. Es sei M := {x ∈ [a, b] | f (x) < u}. Da M ⊂ [a, b], ist M beschränkt und besitzt, da M außerdem nicht leer ist, also nach Satz 1.8.2 ein Supremum s. Es gibt eine Folge (xn ) von Elementen von M , die gegen s konvergiert. Da f (folgen)stetig ist und f (xn ) < u für alle n, folgt also, dass f (s) = limn→∞ f (xn ) ≤ u. Wir behaupten, dass f (s) = u. Ist dies nicht der Fall, so ist f (s) < u. Wir setzen ε := u − f (s); da f stetig ist, gibt es δ > 0, so dass für alle x ∈ [a, b] mit |s − x| < δ gilt, dass |f (s) − f (x)| < ε. Insbesondere ist f (x) < u für alle solche x, weswegen folgt, dass (s − δ, s + δ) ⊂ M . Dies ist ein Widerspruch dazu, dass s das Supremum von M ist. Der zweite Teil des Satzes folgt, indem wir den ersten auf −f und −u anwenden. Korollar 3.2.4. Jede reelle Polynomfunktion von ungeradem Grad hat eine reelle Nullstelle. Beweis. Es sei f (x) = ad xd + ad−1 xd−1 + · · · + a1 x + a0 eine reelle Polynomfunktion, wobei d ungerade ist und ad 6= 0. Wir können annehmen, dass ad > 0 (ansonsten ersetzen wir f durch −f ; dies dürfen wir, da die Nullstellen von f und −f identisch sind). Für n ∈ N gilt a1 a0 ad−1 f (n) = nd ad + + · · · + d−1 + d ; n n n der Ausdruck in der Klammer geht für n → ∞ gegen ad > 0. Da (nd ) gegen +∞ divergiert, folgt, dass es eine Zahl N ∈ N gibt, so dass f (N ) > 0. Wir betrachten weiterhin a1 a0 ad−1 + · · · + d−1 − d . f (−n) = −nd ad − n n n Auch hier geht der Klammerausdruck für n → ∞ gegen ad > 0. Da (−nd ) gegen −∞ divergiert, folgt, dass es eine Zahl M ∈ N gibt, so dass f (−M ) < 0. Aus dem Zwischenwertsatz, angewandt auf die stetige Abbildung f |[−M,N ] : [−M, N ] → R, folgt nun, dass es ein x ∈ [−M, N ] gibt, so dass f (x) = 0. Korollar 3.2.5. Ist I ⊂ R ein Intervall und f : I → R stetig, so ist auch das Bild f (I) ein Intervall. Beweis. Eine Teilmenge J ⊂ R ist genau dann ein Intervall, wenn für je drei reellen Zahlen x < y < z mit x, z ∈ J auch y ∈ J gilt. Es seien also x = f (a), z = f (c) ∈ f (I), für a, c ∈ I, sowie y so, dass x < y < z. Nach dem Zwischenwertsatz, angewandt auf f |[a,c] , folgt, dass es b ∈ [a, c] gibt, so dass f (b) = y. Damit ist y ∈ f (I). 3.2. STETIGE ABBILDUNGEN AUF R 59 Ist f : X → Y eine bijektive Abbildung (zwischen Mengen), so können wir die Umkehrabbildung f −1 : Y → X zu f betrachten. Sind X und Y metrische Räume und f : X → Y stetig, so muss die Umkehrabbildung nicht unbedingt stetig sein, wie das folgende Beispiel zeigt: Beispiel 3.2.6. In Beispiel 3.9.11 werden wir sehen, dass die Abbildung f : [0, 1) → S 1 ; t 7→ e2πit stetig und bijektiv ist, aber die Umkehrabbildung von f nicht stetig ist. Für Definition 3.2.7. Eine Funktion f : I → R, wobei I ⊂ R ein Intervall ist, heißt 1. monoton wachsend, wenn für alle x, y ∈ I mit x < y gilt, dass f (x) ≤ f (y). 2. streng monoton wachsend, wenn für alle x, y ∈ I mit x < y gilt, dass f (x) < f (y). 3. monoton fallend, wenn für alle x, y ∈ I mit x < y gilt, dass f (x) ≥ f (y). 4. streng monoton fallend, wenn für alle x, y ∈ I mit x < y gilt, dass f (x) > f (y). Ist f monoton wachsend oder monoton fallend, so nennen wir f monoton. Ist f streng monoton wachsend oder streng monoton fallend, so nennen wir f streng monoton. Wir notieren, dass eine streng monotone Funktion automatisch injektiv ist. Satz 3.2.8. Es sei I ⊂ R ein Intervall und f : I → R eine stetige, streng monoton wachsende (oder fallende) Funktion. Dann bildet f das Intervall I bijektiv auf das Intervall J := f (I) ab, und die Umkehrfunktion f −1 : J → I ist ebenfalls stetig und streng monoton wachsend (oder fallend). Beweis. Es reicht, den Fall zu betrachten, dass f : I → R streng monoton wachsend ist; im anderen Fall betrachten wir −f und wenden den ersten Fall an. Nach Korollar 3.2.5 ist J := f (I) wieder ein Intervall. Da f als streng monotone Funktion injektiv ist, bildet f das Intervall I bijektiv auf J ab. Wir können dahher die Umkehrfunktion f −1 : J → I betrachten. Wir zeigen, dass f −1 wieder streng monoton wachsend ist: es seien x, y ∈ J mit x < y. Wir müssen zeigen, dass f −1 (x) < f −1 (y). Wäre jedoch f −1 (x) ≥ f −1 (y), so wrde, da f streng monoton wachsend ist, folgen, dass x = f (f −1 (x)) ≥ f (f −1 (y)) = y, was der Annahme, dass x < y ist, widerspricht. Nun zeigen wir, dass f −1 stetig ist. Dafür geben wir uns eine konvergente Folge (xn ) in J vor, mit x = limn→∞ xn ∈ J. Wir definieren zwei weitere Folgen in J wie folgt: für alle n ∈ N sei yn := inf{xm | m ≥ n} und zn := sup{xm | m ≥ n}. Nach Konstruktion gilt yn ≤ xn ≤ zn ; weiterhin ist yn eine monoton wachsende und zn eine monoton fallende Folge. Gilt |x − xn | < ε für alle n ≥ n0 , so folgt aus der Definition der beiden neu konstruierten Folgen, dass |x − yn | ≤ ε und |x − zn | ≤ ε für n ≥ n0 . Es folgt also, dass sowohl (yn ) als auch (zn ) gegen x konvergieren. Da (yn ) und f −1 monoton wachsend sind, folgt, dass 60 KAPITEL 3. STETIGKEIT die Folge (f −1 (yn )) auch monoton wachsend ist. Da yn ≤ x für alle n, ist f −1 (yn ) ≤ f −1 (x), so dass (f −1 (yn )) auch eine beschränkte Folge ist. Daher folgt aus dem Satz 1.8.8 von Bolzano-Weierstrass, dass (f −1 (yn )) konvergiert. Da f stetig ist, folgt f ( lim f −1 (yn )) = lim f (f −1 (yn )) = lim yn = x, n→∞ n→∞ n→∞ d.h. limn→∞ f −1 (yn ) = f −1 (x). Da f −1 monoton wachsend ist und (zn ) monoton fallend, ist auch (f −1 (zn )) monoton fallend. Wie argumentieren analog wie bei der Folge (yn ) und erhalten, dass auch die Folge (f −1 (zn )) konvergent ist, mit Grenzwert f −1 (x). Die Situation ist nun wie folgt: es gilt für alle n, dass f −1 (yn ) ≤ f −1 (xn ) ≤ −1 f (zn ), und die beiden äußeren Folgen konvergieren gegen f −1 (x). Nach dem Sandwichsatz 1.3.13 konvergiert auch f −1 (xn ) gegen f −1 (x), was die Stetigkeit von f −1 in x zeigt. Definition 3.2.9. Eine stetige, bijektive Abbildung f : X → Y zwischen metrischen Räumen, so dass die Umkehrabbildung f −1 : Y → X ebenfalls stetig ist, heißt ein Homöomorphismus. Wir haben also gezeigt: eine auf einem Intervall I definierte, stetige, streng monotone Funktion f : I → R, definiert einen Homöomorphismus auf ihr Bild f (I). Beispiel 3.2.10. Wir betrachten für k ∈ N, k ≥ 1, die Abbildung (0, ∞) → (0, ∞); x 7→ xk . Diese Abbildung ist eine stetige und streng monoton wachsende k (sind 0 < x < y, so ist 0 < x/y < 1 und damit auch 0 < (x/y) = xk /y k < 1) √ k Bijektion. Damit ist die Umkehrfunktion, die durch x 7→ x gegeben ist, auch stetig und streng monoton wachsend. Als weiteres Beispiel betrachten wir die Einschränkung der Exponentialabbildung auf die reelle Achse. Wir zeigen: Satz 3.2.11. Die stetige Abbildung exp : R → (0, ∞) ist streng monoton wachsend und bijektiv. Es gilt 0 < ex < 1 für x < 0 und 1 < ex < ∞ für x > 0. Weiterhin gilt für jedes α ∈ Q: ex = +∞. x→∞ xα Beweis. Da für x > 0 alle Reihenglieder der Exponentialreihe positiv sind, gilt lim ex = 1 + ∞ X xn >1 n! n=1 für solche x. Ist x < 0, so ist ex = e−(−x) = 1/e−x ∈ (0, 1), da dann e−x ∈ (1, ∞). Die strenge Monotonie von exp folgt, da für x < y gilt, dass ex > 0 und y−x e > 1, und daher ey = ex+y−x = ex ey−x > ex . Die Grenzwertaussage ist für α < 0 klar, also betrachten wir den Fall α ≥ 0. Es sei n eine natürliche Zahl > α. Dann ist ex > xn+1 (n + 1)! und daher ex x ex > > . xα xn (n + 1)! 3.2. STETIGE ABBILDUNGEN AUF R 61 x Daraus folgt limn→∞ xeα = +∞. Für α = 0 ergibt sich insbesondere die Aussage limx→∞ ex = +∞. Daraus folgt limx→−∞ ex = limx→∞ e1x = 0. Dies impliziert, dass exp : R → (0, ∞) bijektiv ist. Wir haben gezeigt, dass exp : R → (0, ∞) streng monoton, stetig und bijektiv ist. Damit erhalten wir, dass die Umkehrabbildung auch streng monoton und bijektiv ist: Definition 3.2.12. Wir bezeichnen die Umkehrabbildung von exp : R → (0, ∞) mit ln : (0, ∞) → R und nennen sie den natürlichen Logarithmus. Sie ist stetig und streng monoton wachsend. Korollar 2.5.2 liefert folgende Aussage über den natürlichen Logarithmus: Lemma 3.2.13. Es gilt für alle x, y ∈ (0, ∞): ln(xy) = ln x + ln y sowie ln x = ln x − ln y. y Beweis. Es seien x, y ∈ (0, ∞). Dann gilt wegen Korollar 2.5.2 exp(ln x + ln y) = exp(ln x) exp(ln y) = xy. 1 Durch Anwenden von ln folgt die erste Gleichung. Da exp(− ln y) = exp(ln y) = 1 1 y , folgt − ln y = ln y , was in Kombination mit der ersten Gleichung die zweite zeigt. Lemma 3.2.14. Es gilt für a ∈ R, a > 0, und r ∈ Q, dass ar = er ln a . Beweis. Wir zeigen die Aussage zunächst für eine rationale Zahl r der Form r = 1/q, mit q ∈ N, q ≥ 1; wir wollen also verifizieren, dass a1/q = e(1/q)·ln a . Dafür müssen wir zeigen, dass die q-te Potenz dieser Ausdrücke gleich sind: mit Hilfe von Korollar 2.5.2 berechnen wir (e(1/q)·ln a )q = eq·(1/q)·ln a = eln a = a. Nun schreiben wir r = p/q, wobei p ∈ Z und q ≥ 1, und berechnen, wieder mit Korollar 2.5.2: ar = ap/q = (a1/q )p = (e(1/q)·ln a )p = e(p/q)·ln a = er ln a . Diese Aussage nehmen wir als Motivation, Potenzen auch für reelle Exponenten zu definieren: Definition 3.2.15. Es sei a ∈ R, a > 0, und r ∈ R. Wir definieren ar := er ln a . 62 KAPITEL 3. STETIGKEIT 3.3 Varianten der Stetigkeit Die Stetigkeit einer Abbildung f : X → Y zwischen metrischen Räumen ist punktweise definiert: f ist genau dann stetig, wenn gilt: ∀ x0 ∈ X ∀ ε > 0 ∃ δ > 0 ∀ x ∈ X (d(x, x0 ) < δ =⇒ d(f (x), f (x0 )) < ε. Wichtig ist hierbei: δ darf sowohl von ε als auch vom Punkt x0 abhängen. Verlangen wir stattdessen, dass δ von x0 unabhängig ist, so gelangen wir zu folgender Definition: Definition 3.3.1. Es sei f : X → Y eine Abbildung zwischen metrischen Räumen. Dann heißt f gleichmäßig stetig, wenn gilt: ∀ ε > 0 ∃ δ > 0 ∀ x, x0 ∈ X (d(x, x0 ) < δ =⇒ d(f (x), f (x0 )) < ε). Man beachte, dass es keinen Sinn ergibt, davon zu sprechen, dass eine Abbildung gleichmäßig stetig in einem Punkt ist – diese Definition ist ihrer Natur nach globaler. Sofort aus den Definitionen folgt: Satz 3.3.2. Eine gleichmäßig stetige Abbildung f : X → Y zwischen metrischen Räumen ist stetig. Beispiel 3.3.3. Wir betrachten die stetige Abbildung f : R → R; x 7→ x2 und behaupten, dass sie nicht gleichmäßig stetig ist. Wir setzen ε = 1 und geben uns ein δ > 0 vor. Wir müssen x, x0 ∈ R finden, so dass |x − x0 | < δ, aber |x2 −x02 | ≥ 1. Wir versuchen den Ansatz x0 = x+δ/2, mit x > 0, und berechnen 2 δ2 δ δ2 2 2 02 |x − x | = x − x + = −xδ − = xδ + 2 4 4 ist x nun eine beliebige positive reelle Zahl, die größer als 1 δ δ2 2 02 |x − x | > − δ+ = 1. δ 4 4 1 δ − δ 4 ist, so folgt Wir wissen bereits, dass stetige Abbildungen zwischen metrischen Räumen folgenstetig sind. Insbesondere bilden sie konvergente Folgen auf konvergente Folgen ab. Der folgende Satz behandelt die analoge Frage für Cauchy-Folgen: Satz 3.3.4. Es sei f : X → Y eine gleichmäßig stetige Abbildung zwischen metrischen Räumen und (xn ) eine Cauchy-Folge in X. Dann ist (f (xn )) eine Cauchy-Folge in Y . Beweis. Es sei ε > 0 beliebig. Es sei δ > 0 so, dass für alle x, x0 ∈ X mit d(x, x0 ) < δ folgt, dass d(f (x), f (x0 )) < ε. Da (xn ) eine Cauchy-Folge in X ist, gibt es ein n0 ∈ N, so dass für alle n, m ≥ n0 gilt, dass d(xn , xm ) < δ. Für solche n, m gilt dann d(f (xn ), f (xm )) < ε, d.h. die Folge (f (xn )) ist eine Cauchy-Folge in Y . Beispiel 3.3.5. Die Aussage des Satzes ist für allgemeine stetige Abbildungen falsch: Wir betrachten die stetige Abbildung f : (0, 1] → R; x 7→ 1/x, sowie die Cauchy-Folge (1/n) in (0, 1]. Da f (1/n) = n, ist die Bildfolge (f (1/n)) divergent. Es folgt also aus Satz 3.3.4, dass die Abbildung f nicht gleichmäßig stetig sein kann. 3.4. STETIGE FUNKTIONEN AUF KOMPAKTEN RÄUMEN 63 Eine weitere, viel stärkere Form der Stetigkeit ist durch folgende Definition gegeben: Definition 3.3.6. Es sei f : X → Y eine Abbildung zwischen metrischen Räumen und K ∈ R, K ≥ 0. Dann heißt f Lipschitzstetig mit Lipschitzkonstante K, wenn für alle x, x0 ∈ X gilt, dass d(f (x), f (x0 )) ≤ K · d(x, x0 ). Wir können uns diese Definition für Funktionen f : R → R anhand des (x0 )| ist die Steigung der Graphen von f veranschaulichen: der Quotient |f (x)−f |x−x0 | Gerade zwischen den Punkten (x, f (x)) und (x0 , f (x0 )). Die Lipschitzstetigkeit von f besagt nun gerade, dass diese Steigungen durch eine globale Konstante K beschränkt sind. Satz 3.3.7. Eine Lipschitzstetige Abbildung f : X → Y zwischen metrischen Räumen ist gleichmäßig stetig (und damit auch stetig). Beweis. Es sei f : X → Y Lipschitzstetig mit Lipschitzkonstante K. Es sei ε > 0 beliebig. Wir setzen δ = ε/K. Dann gilt für alle x, x0 ∈ X mit d(x, x0 ) < δ = ε/K, dass d(f (x), f (x0 )) ≤ K · d(x, x0 ) < K · (ε/K) = ε. √ Beispiel 3.3.8. Wir betrachten die Funktion f : R≥0 → R; x 7→ x. In den Übungen werden wir sehen, dass sie gleichmäßig stetig ist; sie ist aber nicht Lipschitzstetig. Es ist nämlich der Ausdruck √ √ | x − x0 | 1 √ = √ 0 |x − x | | x + x0 | für x, x0 ∈ R≥0 , x 6= x0 , nicht durch eine Konstante beschränkt. Betrachten wir √ jedoch die Einschränkung (c, ∞) → R; x 7→ x, für ein c > 0, so ist diese Lipschitzstetig: es gilt dann nämlich √ √ | x − x0 | 1 1 √ = √ ≤ √ . 0 0 |x − x | 2 c | x+ x| für alle x, x0 > c mit x 6= x0 . 3.4 Stetige Funktionen auf kompakten Räumen Satz 3.4.1. Es sei f : X → Y eine stetige Abbildung zwischen metrischen Räumen, wobei X kompakt sei. Dann ist f gleichmäßig stetig. Beweis. Wir nehmen an, f sei nicht gleichmäßig stetig, d.h. es gibt ein ε > 0, so dass für alle δ > 0 Elemente x, x0 mit d(x, x0 ) < δ und d(f (x), f (x0 )) ≥ ε existieren. Wir betrachten δ = n1 und finden also Elemente xn , x0n mit d(xn , x0n ) < n1 und d(f (xn ), f (x0n )) ≥ ε. Da X kompakt ist, hat die Folge (xn ) eine konvergente Teilfolge (xnk ), die gegen ein Element x ∈ X konvergiert. Da d(xn , x0n ) < n1 , folgt, dass auch limk→∞ x0nk = x. Da f stetig ist, folgt, dass limk→∞ f (xnk ) = limk→∞ f (x0nk ) = f (x). Dies ist aber ein Widerspruch, da d(f (xnk ), f (x0nk )) ≥ ε für alle k. 64 KAPITEL 3. STETIGKEIT Satz 3.4.2. Es sei f : X → Y eine stetige Abbildung zwischen metrischen Räumen, wobei X kompakt sei. Dann ist der metrische Raum f (X) ebenfalls kompakt. S Beweis. Es sei f (X) ⊂ i∈I Ui eine offene Überdeckung von f (X). Wir müssen zeigen, dass sie eine endliche Teilüberdeckung zulässt. Da ist, ist f −1 (Ui ) S f stetig −1 −1 für jedes i ∈ I offen in X. Da f (f (X)) = X, ist i∈I f (Ui ) eine offene Überdeckung von X, die, da X kompakt ist, eine endliche Teilüberdeckung X = f −1 (Ui1 ) ∪ · · · ∪ f −1 (Uin ) besitzt. Dann ist f (X) = f (f −1 (Ui1 ) ∪ · · · ∪ f −1 (Uin )) ⊂ Ui1 ∪ · · · ∪ Uin ; wir haben eine endliche Teilüberdeckung von f (X) gefunden. Bemerkung 3.4.3. Dieser Satz gilt auch für topologische Räume; der Beweis ist derselbe. Als wichtigen Spezialfall erhalten wir: Korollar 3.4.4. Eine stetige Abbildung f : [a, b] → R nimmt Maximum und Minimum an, d.h. es gibt x0 , x1 ∈ [a, b], so dass f (x1 ) ≤ f (x) ≤ f (x0 ) für alle x ∈ [a, b]. Beweis. Das abgeschlossene Intervall [a, b] ist kompakt. Nach Satz 3.4.2 ist auch f ([a, b]) kompakt. Nach Korollar 1.13.12 besitzt f ([a, b]) Maximum und Minimum. 3.5 Äquivalenz von Normen auf Rn Definition 3.5.1. Zwei Normen ||·|| und |||·||| auf Rn heißen äquivalent, wenn es reelle Konstanten A, B > 0 gibt, so dass A|||x||| ≤ ||x|| ≤ B|||x||| für alle x ∈ Rn . Dies definiert eine Äquivalenzrelation auf der Menge der Normen auf Rn . Lemma 3.5.2. Äquivalente Normen auf Rn induzieren dieselbe Topologie. Beweis. Es seien || · || und ||| · ||| zwei äquivalente Normen auf Rn , d.h. es gebe reelle Konstanten A, B > 0, so dass A|||x||| ≤ ||x|| ≤ B|||x||| für alle x ∈ Rn . Bezeichnen wir mit Bε (0) den ε-Ball um 0 bezüglich || · || und mit Bε0 (0) den ε-Ball bezüglich ||| · |||, so gilt also 0 0 Bε/B (x) ⊂ Bε (x) ⊂ Bε/A (x). für alle x ∈ Rn und alle ε > 0. Dies zeigt, dass jede bezüglich || · || offene Menge in Rn auch offen bezüglich ||| · ||| ist, und umgekehrt. Wir beschäftigen uns nun mit dem folgenden Satz: Satz 3.5.3. Je zwei Normen auf Rn sind äquivalent. 3.5. ÄQUIVALENZ VON NORMEN AUF RN 65 Der Satz besagt, dass die durch eine Norm induzierte Topologie auf Rn von der Wahl der Norm unabhängig ist. Wir können also von in Rn offenen, abgeschlossenen, oder kompakten Teilmengen sprechen, ohne vorher eine Norm fixiert zu haben. Der Satz, dass alle Normen auf Rn äquivalent sind, impliziert auch, dass der Begriff einer beschränkten Teilmenge von Rn unabhängig von der gewählten Norm ist. Wir können also von einer beschränkten Teilmenge des Rn sprechen, ohne vorher eine Norm zu fixieren. Mit diesem Begriff gilt folgende Verallgemeinerung von Korollar 1.13.10: Satz 3.5.4 (Satz von Heine–Borel). Eine Teilmenge K ⊂ Rn ist genau dann kompakt, wenn sie abgeschlossen und beschränkt ist. Beweis. Da aus Satz 3.5.3 folgt, dass die Begriffe von offenen, abgeschlossenen, beschränkten und kompakten Teilmengen von Rn , unabhängig von der gewählten Norm sind, reicht es, den Satz für die Maximumsnorm zu beweisen. Man beachte: im Beweis von Satz 3.5.3 benutzen wir die Aussage des Satzes von Heine–Borel, wenn wir auf Rn die Maximumsnorm fixieren! In allgemeinen metrischen Räumen gilt, dass eine kompakte Teilmenge abgeschlossen und beschränkt ist. Es sei also K ⊂ Rn abgeschlossen und beschränkt, sowie (xk ) eine Folge in K. Wir schreiben xk = (xk1 , . . . , xkn ). Wir fixieren auf Rn die Maximumsnorm; bezüglich dieser gilt: eine Folge in Rn ist genau dann konvergent/Cauchy-Folge, wenn jede Komponentenfolge konvergent/CauchyFolge ist. Da (xk ) beschränkt ist, ist jede Komponentenfolge (xki )k beschränkt. Damit besitzt die erste Komponentenfolge (xk1 ) nach dem Satz von BolzanoWeierstraß 1.8.8 eine (in R) konvergente Teilfolge. Für diese Teilfolge hat nun die zweite Komponentenfolge eine konvergente Teilfolge, usw. Wir langen schlussendlich bei einer Teilfolge der ursprünglichen Folge (xk ) an, deren sämtliche Komponentenfolgen konvergieren. Damit konvergiert auch die Teilfolge. Da K abgeschlossen ist, liegt der Grenzwert in K. Es folgt nun der Beweis von Satz 3.5.3: Beweis von Satz 3.5.3. Es genügt zu zeigen, dass jede Norm || · || auf Rn zur Maximumsnorm || · ||∞ äquivalent ist. Pn Schreiben wir einen gegebenes Element x ∈ Rn als x = i=1 xi ei , wobei e1 = (1, 0, . . . , 0), . . . , en = (0, . . . , 0, 1), so folgt n ! n n X X X xi ei ≤ |xi |||ei || ≤ ||ei || · ||x||∞ , ||x|| = i=1 i=1 i=1 Pn d.h. mit B := i=1 ||ei || gilt die Ungleichung ||x|| ≤ B||x||∞ für alle x ∈ Rn simultan. Für die umgekehrte Ungleichung betrachten wir Rn als metrischen Raum bezüglich der durch ||·||∞ induzierten Metrik d∞ , und zeigen, dass die Abbildung || · || : Rn → R stetig ist. Es gilt | ||x|| − ||y|| | ≤ ||x − y|| ≤ B||x − y||∞ = Bd∞ (x, y). für alle x, y ∈ Rn , nach der Dreiecksungleichung und der oben gezeigen Ungleichung. Dies bedeutet, dass || · || Lipschitzstetig mit Lipschitzkonstante B ist, und insbesondere stetig. 66 KAPITEL 3. STETIGKEIT Weiterhin betrachten wir die Teilmenge K = {x ∈ Rn | ||x||∞ = 1} und behaupten, dass diese eine kompakte Teilmenge von Rn (bezüglich der Maximumsnorm) ist. Nach dem Satz von Heine–Borel für die Maximumsnorm reicht es dafür zu zeigen, dass K abgeschlossen und beschränkt ist. Die Beschränktheit von K ist klar, da K ⊂ B2 (0). Die Abgeschlossenheit von K folgt, da K = f −1 (1) das Urbild der abgeschlossenen Menge {1} ⊂ R unter der stetigen Abbildung f = || · ||∞ : Rn → R ist. Nach Satz 3.4.2 ist das Bild von K unter der stetigen Abbildung || · || wieder eine kompakte Teilmenge von R und besitzt damit ein Minimum. Es gibt also ein x0 ∈ Rn mit ||x0 ||∞ = 1, so dass A := ||x0 || = min{||x|| | ||x||∞ = 1}. Mit anderen Worten: für alle x ∈ Rn mit ||x||∞ = 1 gilt, dass ||x|| = ||x|| ≥ ||x0 || = A. ||x||∞ Diese Ungleichung gilt dann aber auch für alle x ∈ Rn mit x 6= 0, da wir x = ay |a|·||y|| ||x|| = |a|·||y|| = für ein y mit ||y||∞ = 1 schreiben können und erhalten, dass ||x|| ∞ ∞ ||y|| ||y||∞ ≥ A. Dies zeigt, dass ||x|| ≥ A||x||∞ für alle y ∈ Rn . Mit Hilfe dieses Satzes können wir nun den allgemeinen Beweis von Satz 1.11.12 geben: Beweis. Es sei || · || eine beliebige Norm auf Rn . Diese ist nach dem Satz äquivalent zur Maximumsnorm, d.h. es gibt Konstanten A, B > 0, so dass A||x||∞ ≤ ||x|| ≤ B||x||∞ (3.5.1) für alle x ∈ Rn . Ist (xn ) nun eine Cauchy-Folge bezüglich ||·|| (bzw. bezüglich der durch diese Norm induzierten Metrik), so ist (xn ) wegen der linken Ungleichung in (3.5.1) auch bezüglich ||·||∞ eine Cauchy-Folge. Für die Maximumsnorm haben wir Satz 1.11.12 bereits bewiesen, so dass (xn ) also bezüglich der Maximumsnorm gegen ein x ∈ Rn konvergiert. Wegen der rechten Ungleichung in (3.5.1) konvergiert (xn ) nun aber auch bezüglich || · || gegen x. Beispiel 3.5.5. Die n-dimensionale Sphäre S n = {x ∈ Rn+1 | ||x||2 = 1} ist kompakt: sie ist beschränkt und Urbild von 1 unter der stetigen Abbildung || · ||2 . 3.6 Konvergenz von Funktionenfolgen Definition 3.6.1. Für alle n ∈ N sei fn : X → Y eine Abbildung zwischen den metrischen Räumen X und Y . Wir sagen, dass (fn ) punktweise gegen die Abbildung f : X → Y konvergiert, wenn für alle x ∈ X die Folge (fn (x)) gegen f (x) konvergiert. Definition 3.6.2. Für alle n ∈ N sei fn : X → Y eine Abbildung zwischen den metrischen Räumen X und Y . Wir sagen, dass (fn ) gleichmäßig gegen die Abbildung f : X → Y konvergiert, wenn für alle ε > 0 ein n0 ∈ N existiert, so dass für alle n ≥ n0 gilt, dass d(fn (x), f (x)) < ε für alle x ∈ X 3.6. KONVERGENZ VON FUNKTIONENFOLGEN 67 Der Unterschied zwischen punktweiser und gleichmäßiger Konvergenz besteht darin, dass man die Zahl n0 (in Abhängigkeit von ε) bei gleichmäßiger Konvergenz für alle x ∈ X gleich wählen kann. Betrachten wir beispielsweise X = Y = R, so besagt die gleichmäßige Konvergenz einer Funktionenfolge (fn ) gegen eine Funktion f folgendes: für gegebenes ε > 0 betrachten wir den ε-Schlauch um den Graphen von f , d.h. die Menge {(x, y) ∈ R2 | |y − f (x)| < ε}. Die gleichmäßige Konvergenz besagt, dass wir für jedes ε > 0 einen Index n0 ∈ N finden, so dass für alle n ≥ n0 gilt, dass der Graph von fn komplett im ε-Schlauch um den Graphen von f verläuft. Beispiel 3.6.3. Wir betrachten die Funktionenfolge (fn ), wobei fn = χ[1/n+1,1/n] : R → R. Die Funktionenfolge (fn ) konvergiert punktweise gegen die Nullabbildung, aber nicht gleichmäßig (für jedes n gibt es einen Punkt x ∈ R, so dass fn (x) = 1, d.h. fn (x) hat Abstand 1 zum entsprechenden Funktionswert der Grenzfunktion. Definition 3.6.4. Für metrische Räume X und Y setzen wir C(X, Y ) := {f : X −→ Y stetig} und B(X, Y ) := {f : X −→ Y beschränkt}, wobei wir eine Abbildung f : X → Y beschränkt nennen, wenn ihr Bild f (X) eine beschränkte Teilmenge von Y ist. In den Übungen zeigen wir, dass für kompaktes X die Inklusion C(X, Y ) ⊂ B(X, Y ) gilt. Ebenfalls in den Übungen betrachten wir auf B(X, Y ) eine natürliche Metrik: Satz 3.6.5. Es seien X und Y metrische Räume. Dann wird B(X, Y ) mittels der Abstandsfunktion d∞ (f, g) := sup{dY (f (x), g(x)) | x ∈ X} zu einem metrischen Raum. Man beachte die Ähnlichkeit in der Notation zur Maximumsnorm || · ||∞ auf Rn . Haben wir es mit R- oder C-wertigen Abbildungen zu tun, so erhalten wir sogar eine Norm, wie wir auch in den Übungen sehen werden: Satz 3.6.6. Es sei X ein metrischer Raum. Dann wird durch ||f ||∞ := sup{|f (x)| | x ∈ X} eine Norm auf B(X, R) und B(X, C) definiert. Definition 3.6.7. Wir nennen || · ||∞ die ∞-Norm, oder die Supremumsnorm auf B(X, R) bzw. B(X, C). Man beachte: die durch || · ||∞ induzierte Metrik auf B(X, R) ist gerade d∞ . Nach Definition der gleichmäßigen Konvergenz und der Metrik d∞ auf B(X, Y ) ist die gleichmäßige Konvergenz einer Folge beschränkter Abbildungen (fn ) gegen eine Abbildung f ∈ B(X, Y ) gleichbedeutend damit, dass (fn ) bezüglich der Metrik d∞ gegen f konvergiert. Man beachte aber, dass der Begriff der gleichmäßigen Konvergenz trotzdem etwas allgemeiner ist, da er auch für nicht notwendigerweise beschränkte Abbildungen Sinn ergibt. 68 KAPITEL 3. STETIGKEIT Satz 3.6.8. Es sei fn : X → Y eine Folge stetiger Abbildungen, die gleichmäßig gegen eine Abbildung f : X → Y konvergiert. Dann ist auch f stetig. Beweis. Es sei x0 ∈ X beliebig, sowie ε > 0 vorgegeben. Da (fn ) gleichmäßig gegen f konvergiert, gibt es ein n0 ∈ N, so dass dY (f (x), fn (x)) < 3ε für alle n ≥ n0 und alle x ∈ X. Da fn0 in x0 stetig ist, finden wir ein δ > 0, so dass dY (fn0 (x), fn0 (x0 )) < 3ε wann immer dX (x, x0 ) < δ. Dann folgt für alle x ∈ X mit dX (x, x0 ) < δ, dass dY (f (x), f (x0 )) ≤ dY (f (x), fn0 (x)) + dY (fn0 (x), fn0 (x0 )) + dY (fn0 (x0 ), f (x0 )) ε ε ε < + + = ε. 3 3 3 Beispiel 3.6.9. Ein punktweiser Grenzwert stetiger Funktionen muss nicht stetig sein. Wir betrachten die Funktionen fn : [0, 1] → R; x 7→ xn . Diese ( Funktionenfolge konvergiert punktweise gegen die unstetige Funktion x 7→ 0 x ∈ [0, 1) . 1 x=1 Gleichmäßige Konvergenz ist eine globale Bedingung an eine Funktionenfolge und daher eine eher unnatürliche Forderung, um eine lokal definierte Eigenschaft an die Grenzfunktion wie Stetigkeit zu zeigen. Natürlicher in diesem Kontext ist der folgende Begriff der lokal gleichmäßigen Konvergenz. Wir sprechen von einer offenen Teilmenge U ⊂ X mit x ∈ U als einer offenen Umgebung des Punktes x. Definition 3.6.10. Es sei fn : X → Y eine Folge von Abbildungen zwischen den metrischen Räumen X und Y . Wir sagen, dass (fn ) lokal gleichmäßig gegen die Abbildung f : X → Y konvergiert, wenn es für alle x ∈ X eine offene Umgebung U ⊂ X von x gibt, so dass ( fn |U ) gleichmäßig gegen f |U konvergiert. Bei lokal gleichmäßiger Konvergenz gilt die Aussage von Satz 3.6.8 noch: Korollar 3.6.11. Es sei fn : X → Y eine Folge stetiger Abbildungen, die lokal gleichmäßig gegen f : X → Y konvergiert. Dann ist auch f stetig. Beweis. Es sei x ∈ X. Nach Definition der lokal gleichmäßigen Konvergenz gibt es eine offene Menge U ⊂ X mit x ∈ U , so dass die Funktionenfolge ( fn |U ) gleichmäßig gegen f |U konvergiert. Nach Satz 3.6.8 ist f |U also stetig. Insbesondere ist f in x stetig. Da x beliebig gewählt war, folgt, dass f stetig ist. 3.7 Funktionenreihen P∞ Es sei D ⊂ C eine Teilmenge. Wir betrachten Ausdrücke der Form n=0 fn , wobei fn : D → C stetige Funktionen sind. Wie bei gewöhnlichen Reihen ist eine solche Funktionreihe für uns nur eine Schreibweise für die entsprechende Folge der Partialsummen (die hier eine Funktionenfolge im Sinne des letzten Abschnitts ist). Wir fragen uns, wann eine solche Funktionenreihe eine stetige 3.7. FUNKTIONENREIHEN 69 Funktion auf D definiert. Wie in Satz 3.6.6 betrachten wir für eine beschränkte Funktion f : D → C die Supremumsnorm ||f ||∞ = sup{|f (z)| | z ∈ D} von f . P∞ Satz 3.7.1. Es sei n=0 fn eine Funktionenreihe, soP dass alle Funktionen fn : ∞ D → C stetig und beschränkt sind. Falls die Reihe n=0 ||fn ||∞ konvergiert, dann gilt: P∞ 1. Für alle z ∈ D ist die Reihe n=0 fn (z) absolut konvergent. P∞ 2. Die Folge der Partialsummen der Reihe n=0 fn konvergiert gleichmäßig P∞ gegen die stetige Funktion z 7→ n=0 fn (z). P∞ Beweis. Für jedes z ∈ D gilt |fn (z)| ≤ ||fn ||∞ und daher n=0 |fn (z)| ≤ P∞ ||f || . Da die Reihe der Supremumsnormen nach Voraussetzung konvern ∞ n=0 P∞ giert, konvergiert f (z) nach dem Majorantenkriterium absolut. Damit ist n n=0 P∞ F (z) = n=0 fn (z) eine wohldefinierte Funktion F : D → C. PN P∞ Sei ε > 0 beliebig und Fn (z) := k=0 fk (z). Da die Reihe P∞ k=0 ||fk ||∞ konvergiert, gibt es ein n0 ∈ N, so dass für alle n ≥ n0 gilt, dass k=n ||fk ||∞ < ε. Dann gilt für alle z ∈ D, dass ∞ ∞ ∞ X X X |F (z) − Fn (z)| = fk (z) ≤ |fk (z)| ≤ ||fk ||∞ < ε. k=n+1 k=n+1 k=n+1 Es konvergiert die Funktionenfolge (Fn ) also gleichmäßig gegen F . Nach Satz 3.6.8 ist F stetig. P∞ Wenn die Folge der Partialsummen der Reihe n=0 fn gleichmäßig P gegen ei∞ ne Funktion F konvergiert, dann sagen wir auch einfach, dass die Reihe n=0 fn gleichmäßig gegen F konvergiert. Beispiel Form P∞ an 3.7.2. Eine Dirichletsche Reihe ist eine Funktionenreihe ader n n=1 nx , wobei (an ) eine Folge reeller Zahlen ist. Jedes Reihenglied nx ist eine auf ganz R definierte, stetige Funktion. Wir untersuchen nun die allgemeine Dirichletsche Reihe P∞ auf Konvergenz. Man beachte: setzen wir x = 0, so erhalten wir die Reihe n=1 an , über deren Konvergenz wir nichts voraussetzen; die Konvergenz der Reihe hängt sowohl von der Folge (an ) als auch von x ∈ R ab. Wir behaupten: falls die Folge (an ) beschränkt (sagen wir durch eine Konstante C > 0) ist, so ist die obige Dirichletsche Reihe (mindestens) auf dem Intervall (1, ∞) absolut konvergent, und auf jedem Intervall der Form [b, ∞), wobei b > 1 beliebig, gleichmäßig konvergent. Für jedes n ist die Funktion x 7→ n1x monoton fallend. Betrachten wir die Einschränkung dieser Funktion auf ein Intervall der Form [b, ∞) mit b > 1, so ist die ∞-Norm dieser Einschränkung also gleich n1b . Setzen wir fn : [b, ∞) → R; x 7→ nanx , so ist die Reihe ∞ X n=1 ||fn ||∞ ∞ ∞ X X |an | 1 = ≤C b b n n n=1 n=1 konvergent (da wir sie gegen eine verallgemeinerte harmonische Reihe mit Exponent > 1 abgeschätzt P∞ haben, vgl. 2.3.10). Nach Satz 3.7.1 konvergiert die Dirichletsche Reihe n=1 nanx also auf [b, ∞) gleichmäßig, und definiert dort eine 70 KAPITEL 3. STETIGKEIT stetige Funktion. Damit definiert sie auf ganz (1, ∞) eine Funktion, gegen die sie immer noch lokal gleichmäßig konvergiert, und die somit auch stetig ist. Die berühmteste Dirichletsche Reihe erhalten wir, wenn wir die konstante Folge an = 1 betrachten: wir definieren die Funktion ζ : (1, ∞) → R durch ζ(x) := ∞ X 1 , nx n=1 und nennen sie die Riemannsche ζ-Funktion. Die Riemannsche ζ-Funktion ist ein zentrales Objekt der Zahlentheorie; wir möchten kurz andeuten, warum dies plausibel ist. 2 P∞Wir1 versuchen, für x > 1 den Ausdruck ζ(x) zu verstehen. Da die Reihe n=1 nx absolut konvergent ist, können wir Satz 2.5.1 verwenden und erhalten 2 ζ(x) = ∞ X 1 x n n=1 !2 = ∞ k−1 ∞ k−1 X X 1 X X 1 1 · = . x x l (k − l) (l · (k − l))x k=2 l=1 k=2 l=1 Es treten im Nenner alle möglichen Produkte zweier natürlicher Zahlen ≥ 1 genau einmal auf. Da alle auftretenden Reihen absolut konvergent sind, können wir diese Reihe folgendermaßen umsortieren: für jede natürliche Zahl n tritt der Summand n1x für jeden Teiler von n genau einmal auf. Definieren wir also für eine natürliche Zahl n ≥ 1: X τ (n) := 1, d|n so erhalten wir, dass für alle x > 1 ζ(x)2 = ∞ X τ (n) , nx n=1 was wieder eine Dirichletsche Reihe darstellt. Wir sehen, dass die ζ-Funktion in enger Beziehung zur zahlentheoretischen Funktion τ steht. Eine weitere Verbindung zur Zahlentheorie besteht in der folgenden bemerkenswerten Formel: es sei (p1 , p2 , p3 , . . .) = (2, 3, 5, . . .) die Folge der Primzahlen. Wir behaupten, dass für alle x > 1 gilt: N Y 1 . N →∞ 1 − p−x i i=1 ζ(x) = lim (3.7.1) Um dies einzusehen, verwenden wir die geometrische Reihe: für alle i ist 1 1 1 = 1 + x + 2x + · · · p p 1 − p−x i i i eine absolut konvergente Reihe. Wir können den Ausdruck mehrfaches Cauchy-Produkt betrachten: N Y 1 = 1 − p−x i i=1 1 1 1 + x + 2x + · · · p1 p1 Qn 1 i=1 1−p−x i also als 1 1 · · · · · 1 + x + 2x + · · · . pN pN 3.8. POTENZREIHEN 71 Multiplizieren wir dieses Cauchy-Produkt aus, so erhalten wir eine Reihe mit Summanden der Form n1x , wobei n über alle natürliche Zahlen läuft, in deren Primfaktorzerlegung nur die Primzahlen p1 , . . . , pN auftreten. Da jede natürliche Zahl eine eindeutige Primfaktorzerlegung besitzt, tritt jeder solche Summand auch genau einmal auf. Im Grenzwert für N → ∞ tritt also jeder Summand 1 nx , wobei n über alle natürlichen Zahlen läuft, genau einmal auf; wir erhalten die Riemannsche ζ-Funktion und haben Gleichung (3.7.1) gezeigt. Für x = 2 erhalten wir zum Beispiel die bemerkenswerte Gleichung ∞ X 1 1 = ζ(2) = ; −2 2 N →∞ n 1 − p i n=1 i=1 lim N Y später werden wir sehen, dass diese Reihe den exakten Wert 3.8 π2 6 annimmt. Potenzreihen Eine Potenzreihe um z0 ∈ C ist eine spezielle Funktionenreihe der Form ∞ X an (z − z0 )n , n=0 mit Koeffizienten an ∈ C. Jede Partialsumme dieser Funktionenreihe ist eine Polynomfunktion in der Variable z und daher stetig auf ganz C. Satz 3.8.1. Es sei eine Potenzreihe der Form ∞ X an (z − z0 )n n=0 gegeben. Weiterhin sei w ∈ C \ {0} so, dass die Folge (an (w − z0 )n ) beschränkt ist, d.h. es gebe ein C > 0, so dass |an (w z0 )n | ≤ C für alle n ∈ N. Dann konP− ∞ vergiert für jedes r < |w−z0 | die Reihe n=0 P an (z−z0 )n auf Br (z0 ) gleichmäßig ∞ gegen die stetige Funktion Br (z0 ) → C; z 7→ n=0 an (z − z0 )n . Beweis. Wir möchten das Konvergenzkriterium aus Satz 3.7.1 anwenden. Dazu sei fn : Br (z0 ) → C definiert durch fn (z) = an (z − z0 )n ; wir berechnen ||fn ||∞ = sup{|an (z − z0 )n | | z ∈ Br (z0 )} n n r r n n ≤C· . = |an |r = |an ||w − z0 | |w − z0 | |w − z0 | P∞ Da r <|w − z0 | und daher r/|w − z0 | < 1, konvergiert die Reihe n=0 C · n P∞ r . Nach dem Majorantenkriterium konvergiert die Reihe n=0 ||fn ||∞ |w−z0 | also absolut, weswegen Satz 3.7.1 anwendbar ist. P∞ Es gilt also: konvergiert die Reihe n=0 an (z − z0 )n für eine komplexe Zahl z = w, so auch für alle komplexen Zahlen, für die |z − z0 | < |w − z0 |. Es folgt sofort: 72 KAPITEL 3. STETIGKEIT Korollar 3.8.2. Es sei eine Potenzreihe der Form ∞ X an (z − z0 )n (3.8.1) n=0 gegeben. Dann existiert eine eindeutige Zahl 0 ≤ R ≤ ∞, so dass die Potenzreihe folgende Eigenschaften hat: 1. Sie konvergiert absolut für |z − z0 | < R. 2. Sie definiert auf BR (z0 ) = {z ∈ C | |z − z0 | < R} eine stetige Funktion, gegen die sie lokal gleichmäßig konvergiert. (Für R = ∞ sei BR (z0 ) = C.) 3. Sie konvergiert für kein z ∈ C mit |z − z0 | > R. Definition 3.8.3. Wir nennen durch Korollar 3.8.2 eindeutig gegebene Zahl R den Konvergenzradius der Potenzreihe. P∞ n Beispiel 3.8.4. 1. Die Exponentialreihe n=0 zn! konvergiert für jedes z ∈ C. Damit hat diese Potenzreihe den Konvergenzradius R = ∞. P∞ 2. Die Potenzreihe n=0 n!z n hat Konvergenzradius R = 0, da sie für kein z 6= 0 konvergiert. P∞ 3. Die geometrische Reihe n=0 z n hat Konvergenzradius 1: wir wissen, dass sie für |z| < 1 konvergiert, aber für |z| > 1 ist die Folge der Reihenglieder unbeschränkt. Der folgende Satz liefert eine explizite Formel zur Berechnung des Konvergenzradius einer Potenzreihe: Satz 3.8.5. Der Konvergenzradius einer Potenzreihe ∞ X an (z − z0 )n , n=0 ist gleich R= 1 lim supn→∞ p n |an | . (Ausnahmsweise setzen wir in diesem Ausdruck ∞ = 1 0 und 0 = 1 ∞ .) Beweis. Wir fixieren z ∈ C und wenden das Wurzelkriterium auf die Reihe P ∞ n n=0 an (z − z0 ) an: es ist lim sup p n |an (z − z0 )n | = |z − z0 | · lim sup n→∞ p n |an |; n→∞ die Reihe konvergiert absolut wenn dieser Ausdruck < 1 ist, und divergiert, 1 √ wenn er > 1 ist. Damit ist die eindeutige Zahl aus Korollar n lim supn→∞ 3.8.2. |an | 3.8. POTENZREIHEN 73 Beispiel 3.8.6. Wir betrachten die drei Potenzreihen ∞ X zn, n=0 ∞ X zn , n n=0 ∞ X zn . n2 n=0 Alle drei Reihen haben den Konvergenzradius 1, verhalten sich aber unterschiedlich auf dem Kreis {z ∈ C | |z| = 1}. Zum Beispiel divergiert die erste Reihe in den beiden Punkten ±1, die zweite konvergiert für z = −1 (nach dem Leibnizkriterium), divergiert aber für z = 1, die dritte konvergiert sowohl für z = −1 als auch für z = 1. Es gilt also: kennen wir den Konvergenzradius R einer Potenzreihe, so wissen wir, dass die Reihe für |z − z0 | < R absolut konvergiert und für |z − z0 | > R divergiert, aber wir wissen nichts über das Verhalten für |z − z0 | = R. Bemerkung 3.8.7. Wir bemerken, dass man den Konvergenzradius mit Hilfe des Quotientenkriteriums nicht in jedem Fall berechnen kann: wie das Beispiel 2.3.7 zeigt, folgt aus lim supn→∞ aan+1 > 1 nicht unbedingt, dass die Reihe n P∞ an+1 a divergiert. Existiert jedoch der Grenzwert lim n n→∞ n=0 an , so ist der P∞ n Konvergenzradius der Potenzreihe n=0 an (z − z0 ) gleich R= 1 . limn→∞ aan+1 n Potenzreihen können gliedweise addiert werden: P∞ P∞ Satz 3.8.8. Es seien f (z) = k=0 ak (z−z0 )k und g(z) = k=0 bk (z−z0 )k zwei Potenzreihen mitP Konvergenzradien Rf bzw. Rg . Dann ist der Konvergenzradius ∞ der Potenzreihe k=0 (ak + bk )(z − z0 )k mindestens gleich R := min{Rf , Rg }, und auf BR (z0 ) stellt sie die Funktion f + g dar. Weiterhin gilt: falls Rf 6= Rg , so ist ihr Konvergenzradius genau R. Beweis. Die Summe zweier konvergenter Reihen ist wieder eine konvergente Reihe, mitPWert gleich der Summe der Reihenwerte. Daraus folgt, dass die Po∞ tenzreihe k=0 (ak + bk )(z − z0 )k auf BR (z0 ) gegen f + g konvergiert. Dies zeigt die erste Aussage. Für die zweite nehmen wir ohne Beschränkung der Allgemeinheit an, dass R dass Rf < |w| < Rg . Dann divergiert die Reihe f P∞< Rg . Es seik w ∈ C, so P ∞ k a (w − z ) , die Reihe k 0 k=0 k=0 bk (w − z0 ) konvergiert aber. Da die Summe einer konvergenten und einer divergenten Reihe divergiert, folgt, dass der KonP∞ vergenzradius der Potenzreihe k=0 (ak + bk )(w − z0 )k kleiner sein muss als |w|. Da w beliebig mit der Eigenschaft Rf < |w| < Rg gewählt war, folgt, dass der Konvergenzradius gleich R sein muss. Natürlich gilt die letzte Schlussforderung nicht ohne die Voraussetzung die P∞ an k Konvergenzradien: man betrachte beispielsweise die Potenzreihen z und k=0 P∞ k k=0 −z : ihre Summe ist die konstante Potenzreihe 0, deren Konvergenzradius ∞ beträgt. Wir haben gezeigt, dass jede Potenzreihe eine auf einem offenen Ball definierte stetige Funktion definiert. Wir stellen uns nun die Frage, ob eine gegebene stetige Funktion auf mehrere Weisen durch eine Potenzreihe dargestellt werden kann. Der folgende Satz und das anschließende Korollar zeigen eine viel stärkere Aussage, die inbesondere besagt, dass das nicht geht: 74 KAPITEL 3. STETIGKEIT P∞ Satz 3.8.9 (Verschwindungssatz für Potenzreihen). Es sei f (z) = k=0 ak (z − z0 )k eine Potenzreihe mit Konvergenzradius R > 0. Falls es eine Folge (wn ) in BR (z0 ) \ {z0 } mit limn→∞ wn = z0 gibt, so dass f (wn ) = 0 für alle n, so gilt ak = 0 für alle k. Beweis. Es sei m ∈ N beliebig, und 0 < r < R. Wir beweisen zuerst, dass es eine (von m und r abhängende) Konstante C gibt, so dass ∞ X ak (z − z0 )k ≤ C(r, m) · |z − z0 |m k=m für alle z ∈ {w ∈ C | |w − z0 | ≤ r} gilt. Für jedes solche z berechnen wir, unter Verwendung der absoluten Konvergenz der Potenzreihe auf BR (z0 ): ∞ ∞ ∞ X X X k |ak ||z − z0 |k = |z − z0 |m ak (z − z0 ) ≤ |aj+m ||z − z0 |j k=m j=0 k=m ≤ |z − z0 |m · ∞ X |aj+m |rj . j=0 | {z =:C(r,m) } Wir nehmen nun an, dass nicht alle Koeffizienten ak verschwinden; sei m0 der kleinste Index, so dass am0 6= 0. Dann impliziert unsere Abschätzung, dass ∞ X m0 k |f (z) − am0 (z − z0 ) | = ak (z − z0 ) ≤ C(r, m0 + 1)|z − z0 |m0 +1 k=m0 +1 für alle z mit |z − z0 | ≤ r. Da die Folge (wn ) gegen z0 konvergiert, erfüllen ab einem gewissen Index alle Folgenglieder diese Bedingung, so dass also |am0 (wn − z0 )m0 | = |f (wn ) − am0 (wn − z0 )m0 | ≤ C(r, m0 + 1)|wn − z0 |m0 +1 , also |am0 | ≤ C(r, m0 + 1)|wn − z0 |. Für n → ∞ geht der rechte Ausdruck gegen 0, so dass notwendigerweise am0 = 0. Aus diesem Satz ergibt sich sofort: P∞ Korollar 3.8.10 (Identitätssatz für Potenzreihen). Es seien f (z) = k=0 an (z− P ∞ z0 )k und g(z) = k=0 bn (z − z0 )k zwei Potenzreihen um z0 mit Konvergenzradien Rf > 0 und Rg > 0. Falls es eine Folge (wn ) in BR (z0 ) \ {z0 }, wobei R = min{Rf , Rg }, gibt, sodass limn→∞ wn = z0 und f (wn ) = g(wn ) für alle n, so gilt ak = bk für alle k. Interessant ist die Frage, ob sich eine gegebene Funktion als Potenzreihe darstellen lässt. Wir definieren: Definition 3.8.11. Es sei f : U → C eine Funktion, wobei U ⊂ C eine offene Teilmenge ist, und z0 ∈ U . Wir sagen, dass f um z0 in eine Potenzreihe entwickelbar ist, wenn es ε > 0 gibt, so dass Bε (z0 ) = {z ∈ C | |z − z0 | < ε} ⊂ U , 3.8. POTENZREIHEN 75 P∞ sowie eine Potenzreihe n=0 an (z − z0 )n mit Konvergenzradius R ≥ ε, so dass die durch die Potenzreihe definierte Funktion auf Bε (z0 ) mit f übereinstimmt. Ist f um jeden Punkt von U in eine Potenzreihe entwickelbar, so nennen wir f analytisch. Für eine Funktion f : U → R, wobei U ⊂ R eine offene Teilmenge ist, und x0 ∈ U , definieren wir analog, dass f um x0 in eine Potenzreihe entwickelbar ist, wenn es ε > P 0 gibt, so dass Bε (x0 ) = {x ∈ R | |x − x0 | < ε} ⊂ U , sowie ∞ eine Potenzreihe n=0 an (x − x0 )n mit Konvergenzradius R ≥ ε, so dass die durch die Potenzreihe definierte Funktion auf Bε (x0 ) mit f übereinstimmt. Ist f um jeden Punkt von U in eine Potenzreihe entwickelbar, so nennen wir f (reell-)analytisch. Man beachte: ist eine reelle Funktion in einem Punkt x0 in eine Potenzreihe entwickelbar, so ist diese Potenzreihe automatisch auf einer Kreisscheibe in C definiert. Die Koeffizienten der Potenzreihe sind aufgrund des Identitätssatzes, obwohl die Funktion nur auf der reellen Achse definiert ist, eindeutig bestimmt. Beispiel 3.8.12. 1. Wir betrachten die (stetige, da ein Produkt(zweier nach 0 x≤0 Beispiel 3.1.4 stetiger Funktionen) Funktion f : R → R; x 7→ 2 x x > 0. Diese Funktion ist nicht analytisch, da sie um 0 nicht in eine Potenzreihe entwickelbar ist: Gäbe es eine Potenzreihe, die f auf einer offenen, die 0 enthaltenden, Menge beschreibt, so wäre diese nach dem Verschwindungssatz für Potenzreihen schon die triviale Potenzreihe. Diese stellt f aber auf keiner offenen Teilmenge, die die 0 enthält, dar. 1 . Wir kennen eine 2. Wir betrachten die Funktion f : C \ {1} → C; z 7→ 1−z Entwicklung dieser Funktion um z = 0, nämlich die geometrische Reihe: 0 P∞ Die Potenzreihe n=0 z n . Diese besitzt den Konvergenzradius 1 und P∞stellt die Funktion f auf B1 (0) dar. Wir betonen, dass die Potenzreihe n=0 z n im Bereich |z| > 1 nicht konvergiert, und daher auch in diesem Bereich nichts mit der Funktion f zu tun hat. Wir behaupten nun, dass f analytisch ist. Dafür sei z0 ∈ C \ {1} beliebig; wir suchen eine Entwicklung von f in eine Potenzreihe um z0 . Dafür schreiben wir f wie folgt: 1 1 1 = = 1−z 1 − z0 − (z − z0 ) (1 − z0 ) · 1 − z−z0 1−z0 und beobachten, dass sich dieser Ausdruck wieder in eine geometrische Reihe entwickeln lässt: er ist gleich n ∞ X z − z0 1 · . 1 − z0 n=0 1 − z0 0 Diese Reihe konvergiert für z−z 1−z0 < 1, d.h. genau für die z, für die |z − z0 | < |1 − z0 |: die größte Kreisscheibe, auf der diese Potenzreihe konvergiert, ist also genau die größte Kreisscheibe um z0 , die noch in C \ {1} enthalten ist. 76 KAPITEL 3. STETIGKEIT 3.9 Trigonometrische Funktionen und die Zahl π. Die Exponentialfunktion haben wir bereits kennengelernt: es ist ez = ∞ X zn , n! n=0 und wir wissen, dass ihr Konvergenzradius ∞ ist. In den Übungen haben wir außerdem den Sinus und Cosinus betrachtet: ∞ ∞ X X z 2n z 2n+1 , cos(z) = . sin(z) = (−1)n (−1)n (2n + 1)! (2n)! n=0 n=0 Wir haben gesehen, dass beide Reihen für alle z konvergierten; diese Potenzreihen haben also ebenfalls den Konvergenzradius ∞. Als Übungsaufgabe haben wir gezeigt: Lemma 3.9.1. Es gilt eiz = cos z + i sin z für alle z ∈ C. Korollar 3.9.2. Für alle x ∈ R gilt cos2 x + sin2 x = |eix | = 1. Insbesondere gilt | cos x| ≤ 1 und | sin x| ≤ 1. Beweis. Da eix = cos x + i sin x, gilt cos2 x + sin2 x = |eix |. Es ist aber |eix |2 = eix · eix = eix · e−ix = e0 = 1. Man beachte: wir haben benutzt, dass ez = ez , was aus der Stetigkeit der komplexen Konjugation folgt. Definition 3.9.3. Wir definieren S 1 := {z ∈ C | |z| = 1} und nennen diese Menge den Einheitskreis in C. Die Exponentialfunktion nimmt also, eingeschränkt auf die imaginäre Achse, nur Werte auf dem komplexen Einheitskreis an. Wir können Cosinus und Sinus auch mit Hilfe der komplexen Exponentialfunktion ausdrücken, wie wir ebenfalls in den Übungen gezeigt haben: Satz 3.9.4. Für z ∈ C gilt 1. cos z = eiz +e−iz 2 und sin z = eiz −e−iz 2i 2. cos(−z) = cos z und sin(−z) = − sin z. Satz 3.9.5. Es gelten die Additionstheoreme: Für z, w ∈ C gilt: cos(z + w) = cos z cos w − sin z sin w sin(z + w) = sin z cos w + sin w cos z. Beweis. Es gilt (eiz + e−iz )(eiw + e−iw ) + (eiz − e−iz )(eiw − e−iw ) 4 ei(z+w) + ei(z−w) + ei(w−z) + e−i(z+w) = 4 ei(z+w) − ei(z−w) − ei(w−z) + e−i(z+w) + 4 ei(z+w) + e−i(z+w) = = cos(z + w). 2 Eine analoge Rechnung zeigt die zweite Behauptung. cos z cos w − sin z sin w = 3.9. TRIGONOMETRISCHE FUNKTIONEN UND DIE ZAHL π. 77 Lemma 3.9.6. Für x ∈ (0, 2] ⊂ R gilt 1− x2 x2 x4 < cos x < 1 − + 2 2 24 und x3 < sin x < x. 6 Weiterhin ist der Cosinus im Intervall [0, 2] streng monoton fallend. x− Beweis. Wir fixieren x ∈ (0, 2] und schreiben den Cosinus wie folgt: ∞ ∞ 4n 2n X X x x4n+2 n x cos x = (−1) = − (2n)! n=0 (4n)! (4n + 2)! n=0 und behaupten, dass für die Reihenglieder der rechten Reihe ab n = 1 positiv ist: es ist x4n+2 x4n > , (4n)! (4n + 2)! denn (4n + 2)(4n + 1) > 4 ≥ x2 für alle n ≥ 1. Lassen wir also alle Glieder außer dem ersten in obiger Reihe weg, so erhalten wir x2 . 2 Für die andere Abschätzung fassen wir je zwei Glieder der Reihe ab n = 1 zusammen; da jedes Reihenglied der dann auftretenden Reihe positiv ist, können wir abschätzen: ∞ X x4n+2 x4n+4 x2 x4 cos x = 1 − − <1− + . (4n + 2)! (4n + 4)! 2 24 n=0 cos x > 1 − Die Aussage über den Sinus zeigt man analog. Für die Monotonieaussage betrachten wir x, y ∈ [0, 2] mit x < y und berechnen y−x x+y 2(ei(y−x)/2 − e−i(y−x)/2 )(ei(x+y)/2 − e−i(x+y)/2 ) −2 sin =− 2 2 (2i)2 eiy − e−ix − eix + e−iy = = cos y − cos x. 2 Da nach der Ungleichung für den Sinus aus diesem Lemma die beiden Sinusfaktoren auf der linken Seite dieser Gleichung positiv sind, folgt, dass cos y < cos x. Korollar 3.9.7. Es gibt genau eine reelle Zahl π ∈ [0, 4], so dass cos π2 = 0 und cos x 6= 0 für alle x ∈ [0, π2 ). Weiterhin gilt sin π2 = 1. Beweis. Es gilt cos 0 = 1, und nach Lemma 3.9.6 gilt cos 2 < 1 − 2 + 16 24 < 0. Damit hat cos nach dem Zwischenwertsatz 3.2.3 eine Nullstelle im Intervall [0, 2]. Da der Cosinus auf [0, 2] nach Lemma 3.9.6 auf [0, 2] streng monoton fallend ist, hat er dort nur genau eine Nullstelle. Wir bezeichnen diese mit π2 . iπ/2 −iπ/2 Es gilt nun 0 = cos π2 = e +e , also ist eiπ/2 eine rein imaginäre Zahl. 2 Da andererseits |eix | = 1 für alle x ∈ R, folgt, dass i sin π2 = eiπ/2 = ±i, also sin π2 = ±1. Nach Lemma 3.9.6 gilt aber, da π2 < 2, dass sin π2 > 0, weswegen sin π2 = 1 folgt. 78 KAPITEL 3. STETIGKEIT Lemma 3.9.8. Für alle z ∈ C gilt cos(z + π2 ) = − sin z und sin(z + π2 ) = cos z. Beweis. Dies folgt sofort aus den Additionstheoremen 3.9.5. Es folgt dann auch sofort, dass cos(z + π) = − cos z und sin(z + π) = − sin z für alle z ∈ C, sowie dass Cosinus und Sinus 2π-periodisch sind, in dem Sinne, dass cos(z + 2π) = cos z und sin(z + 2π) = sin z für alle z ∈ C. Lemma 3.9.9. Es sei z ∈ C. Dann gilt genau dann cos z = 0, wenn z = (k+ 21 )·π für ein k ∈ Z. Es gilt genau dann sin z = 0, wenn z = k·π für ein k ∈ Z. Insbesondere sind alle Nullstellen der komplexen Cosinus- und Sinusfunktion reell. Beweis. Wir zeigen die Aussage für den Cosinus; die Aussage für den Sinus folgt dann sofort aus der in Lemma 3.9.8 bewiesenen Gleichung cos(z + π2 ) = − sin z. iz −iz Es sei z ∈ C; dann gilt cos z = e +e . Dieser Ausdruck ist genau dann 2 0, wenn eiz = −e−iz . Schreiben wir z = x + iy für x, y ∈ R, so heißt das, dass eix · e−y = eix−y = −e−ix+y = −e−ix · ey . Nehmen wir den Betrag dieser Gleichung, so impliziert dies, dass ey = e−y . Da die Exponentialfunktion auf der reellen Achse streng monoton wachsend ist impliziert das, dass y = 0, d.h. die Nullstellen von cos sind rein reell. Nach Definition ist π/2 die einzige Nullstelle des Cosinus im Intervall [0, π/2]. Da π π cos( − x) = − sin(−x) = sin x = − cos( + x), 2 2 folgt, dass π/2 auch die einzige Nullstelle des Cosinus im Intervall [0, π] ist. Aufgrund der Eigenschaft cos(x + π) = − cos(x), folgt, dass die einzigen Nullstellen von cos im Intervall [0, 2π] die Werte π/2 und 3π/2 sind. Die Behauptung folgt nun aus der 2π-Periodizität von cos. Man vergleiche diese Aussage mit dem Verschwindungssatz für Potenzreihen 3.8.9: wir haben hier eine durch eine Potenzreihe definierte Funktion mit unendlich vielen Nullstellen gefunden, die nicht die konstante Nullfunktion ist. Dies widerspricht dem Verschwindungssatz nicht, da keine Teilfolge der Nullstellen konvergiert. Satz 3.9.10. Die Abbildung f : R → S 1 ; ϕ 7→ eiϕ ist 2π-periodisch, d.h. es gilt f (ϕ + 2π) = f (ϕ) für alle ϕ ∈ R. Sie bildet [0, 2π) stetig und bijektiv auf S 1 ab. Beweis. Die Abbildung R → C; ϕ 7→ eiϕ ist Komposition der (stetigen) Exponentialfunktion mit der Multiplikation mit i stetig. Sie nimmt nach Korollar 3.9.2 nur Werte in S 1 an. Versehen wir S 1 ⊂ C mit der induzierten Metrik, so wird die angegebene Abbildung f ebenfalls stetig. Die 2π-Periodizität von f folgt so: es ist e2πi = cos(2π) + i sin(2π) = 1. Damit ist f (ϕ + 2π) = eϕ+2πi = eϕ · e2πi = eϕ . Zur Injektivität: Es seien ϕ, ψ ∈ [0, 2π), so dass eiϕ = eiψ , d.h. 1 = ei(ϕ−ψ) = cos(ϕ − ψ) + i sin(ϕ − ψ). Damit ist ϕ − ψ eine Nullstelle des Sinus, also gilt nach Lemma 3.9.9, dass ϕ − ψ = kπ für ein k ∈ Z. Es gilt cos 0 = 1 und cos π = −1; da der Cosinus 2π-periodisch ist, folgt, dass ϕ − ψ ein ganzzahliges Vielfaches von 2π sein muss. Da aber ϕ, ψ ∈ [0, 2π), folgt, dass ϕ = ψ. Für die Surjektivität von f beobachten wir zunächst, dass 1 = e0 und −1 = iπ e im Bild von f liegen. Für alle Realteile x ∈ (−1, 1) gibt es genau zwei 3.9. TRIGONOMETRISCHE FUNKTIONEN UND DIE ZAHL π. 79 komplexe Zahlen z ∈ S 1 mit Re z = x gibt, für die dann der Imaginärteil automatisch ungleich 0 ist. Ist z eine dieser Zahlen, so ist z̄ die andere. Wir betrachten die Abbildung R → R; ϕ 7→ Re f (ϕ) = cos ϕ; sie schickt 0 auf 1 und π auf −1 und ist stetig; nach dem Zwischenwertsatz muss sie alle Werte zwischen 0 und 1 annehmen. Weiterhin ist der Imaginärteil von f (ϕ) für ϕ ∈ (0, π), d.h. sin ϕ, positiv; wir haben also gezeigt, dass die Abbildung f das Intervall [0, π] surjektiv auf den oberen Halbkreis abbildet. Nun gilt aber f (ϕ + π) = −f (ϕ), so dass f das Intervall [π, 2π] surjektiv auf den unteren Halbkreis abbildet. Insgesamt wird jeder Punkt auf S 1 durch f erreicht. Bemerkung 3.9.11. Die Abbildung [0, 2π) → S 1 ; x 7→ eix ist auch vom topologischen Standpunkt her interessant: es handelt sich um eine stetige, bijektive Abbildung zwischen zwei metrischen Räumen, deren Umkehrabbildung jedoch nicht stetig ist. In der Tat kann es nach Satz 3.4.2 keine stetige, bijektive Abbildung S 1 → [0, 2π) geben, da S 1 als abgeschlossene und beschränkte Teilmenge von C kompakt ist, [0, 2π) aber nicht kompakt. Als Korollar von Satz 3.9.10 erhalten wir die Polardarstellung einer komplexen Zahl: Korollar 3.9.12. Es sei z ∈ C \ {0}. Dann existiert eine eindeutige Zahl ϕ ∈ [0, 2π), so dass z = |z|eiϕ = |z|(cos ϕ + i sin ϕ). Beweis. Aus Satz 3.9.10 folgt, dass es eine eindeutige Zahl ϕ ∈ [0, 2π) gibt, so dass eiϕ = z/|z|. Schreiben wir eine komplexe Zahl z als z = |z|eiϕ , so nennt man ϕ das Argument oder die Phase von z. Mit Hilfe der Polardarstellung können wir eine geometrische Interpretation der Multiplikation zweier komplexer Zahlen geben: sind z = |z|eiϕ und w = |w|eiψ zwei komplexe Zahlen, so gilt zw = |z||w|eiϕ eiψ = |z||w|ei(ϕ+ψ) ; bei der Multiplikation zweier komplexer Zahlen werden die Beträge also multipliziert und die Argumente addiert. Eine wichtige Folgerung aus der Polardarstellung ist die Existenz k-ter Wurzeln einer komplexen Zahl: Definition 3.9.13. Es sei u ∈ C und k ∈ N, k ≥ 1. Eine komplexe Zahl w ∈ C heißt eine k-te Wurzel von u, wenn wk = u. Lemma 3.9.14. Es sei u ∈ C, u 6= 0, sowie k ∈ N, k ≥ 1. Dann besitzt u genau k paarweise verschiedene k-te Wurzeln. Mit anderen Worten: das Polynom z k − u besitzt genau k paarweise verschiedene Nullstellen in C. Beweis. Es gilt allgemein, dass ein (komplexes) Polynom vom Grad k höchstens k paarweise verschiedene Nullstellen haben. Es sei u ∈ C, u 6= 0. Wir müssen k paarweise verschiedene Wurzeln von u finden. Dafür schreiben wir u = |u|eiϕ für ein ϕ ∈ [0, 2π). Die paarweise verschiedenen komplexen Zahlen p i(ϕ+2πl) k |u|e k , l = 0, . . . , k − 1 p i(ϕ+2πl) sind k-te Wurzeln von u, da ( k |u|e k )k = |u|eiϕ+2πil = u. 80 KAPITEL 3. STETIGKEIT 3.10 Der Fundamentalsatz der Algebra Als Anwendung von Korollar 3.4.4 und der Polardarstellung einer komplexen Zahl beweisen wir nun: Satz 3.10.1 (Fundamentalsatz der Algebra). Jede komplexe Polynomfunktion von positivem Grad besitzt mindestens eine komplexe Nullstelle. Man beachte, dass wir einen Spezialfall dieses Satzes, für Polynome der Form z k − u, soeben in Lemma 3.9.14 bewiesen haben. Pn Beweis. Es sei f (z) = i=0 ai z i ein Polynom mit komplexen Koeffizienten ai , so dass n ≥ 1 und an 6= 0. Wir können ohne Beschränkungn der Allgemeinheit annehmen, dass an = 1. Es sei µ = inf z∈C |f (z)|. Für z ∈ C mit |z| = R gilt |a1 | |a0 | |an−1 | |an−2 | − · · · − − ; − |f (z)| ≥ Rn 1 − R R2 Rn−1 Rn für R → ∞ divergiert der rechte Ausdruck gegen ∞. Es gibt also ein R0 > 0, so dass |P (z)| > 2µ wann immer |z| > R0 . Es folgt, dass µ = inf z∈BR0 (0) |f (z)|. Da f und die Betragsfunktion stetige Funktionen sind, nimmt die Funktion BR0 (0) → R; z 7→ |f (z)| auf BR0 (0) ihr Minimum an; es gibt also ein z0 ∈ BR0 (0), so dass |f (z0 )| = µ. Wenn wir zeigen können, dass µ = 0, so sind wir fertig. Wir nehmen an, f (z0 ) sei ungleich 0, und setzen g(z) = f (z + z0 )/f (z0 ). Dann ist g eine nichtkonstante Polynomfunktion vom Grad n, die g(0) = 1 und |g(z)| = |f (z + z0 )|/|f (z0 )| ≥ 1 für alle z ∈ C erfüllt. Wir schreiben g(z) = 1 + bk z k + · · · + bn z n wobei bk 6= 0. Wir schreiben bk = |bk |eiϕ und setzen ψ = (−ϕ + π)/k, so dass eikψ bk = −e−iϕ bk = −|bk |. Für eine reelle Zahl r > 0, die so klein ist, dass rk |bk | < 1, gilt dann |1 + bk rk eikψ | = |1 − rk |bk || = 1 − rk |bk |, und deshalb |g(reiψ )| = |1 + bk rk eikψ + · · · + bn rn einψ | ≤ |1 + bk rk eikψ | + |bk+1 |rk+1 + · · · + |bn |rn = 1 − rk |bk | + |bk+1 |rk+1 + · · · + |bn |rn = 1 − rk (|bk | − |bk+1 |r − · · · − |bn |rn−k ). Der Ausdruck in der Klammer geht für r → 0 gegen |bk | > 0, und wird daher für kleines r positiv. Für ein solches r wird |g(reiψ )| also kleiner als 1, was ein Widerspruch zur Definition von g ist. Es muss also µ = 0 gelten. Man beachte: der Fundamentalsatz der Algebra ist nicht wirklich ein Satz der Algebra – für seinen Beweis haben wir den Begriff der Stetigkeit verwendet, der ein Begriff der Analysis ist. Per Induktion über den Grad des Polynoms folgt aus dem Fundamentalsatz der Algebra: Korollar 3.10.2. Jedes komplexe Polynom zerfällt in Linearfaktoren. Kapitel 4 Differentialrechnung 4.1 Die Ableitung Wir betrachten in diesem Kapitel Funktionen f : U → C, wobei U entweder eine offene Teilmenge von C oder von R ist. (Reellwertige Abbildungen sind in diesen Betrachtungen enthalten, da R ⊂ C.) Wir fixieren x0 ∈ U und betrachten die Abbildung U \ {x0 } −→ C; x 7−→ f (x) − f (x0 ) . x − x0 (4.1.1) Brüche dieser Form nennen wir auch Differenzenquotienten. Zur besseren Anschauung betrachte man den Spezialfall einer Funktion f : U → R, wobei U ⊂ R offen ist. Im Fall einer solchen Abbildung bezeichnet der Wert dieser Abbildung an x 6= x0 genau die Steigung der Sekante durch die Punkte (x0 , f (x0 )) und (x, f (x)). Definition 4.1.1. Es sei f : U → C, wobei U eine offene Teilmenge von R oder C ist. Wir sagen, dass f in x0 ∈ U differenzierbar ist, wenn der Grenzwert lim x→x0 f (x) − f (x0 ) x − x0 existiert. In diesem Fall bezeichnen wir diesen Grenzwert mit f 0 (x0 ). Wir nennen f 0 (x0 ) die Ableitung von f in x0 . Ist f in jedem Punkt x0 ∈ U differenzierbar, so sagen wir, dass f differenzierbar ist. Wir nennen f 0 : U → R; x 7→ f 0 (x) die Ableitung von f . Betrachten wir ein weiteres Mal den Spezialfall einer Funktion f : U → R, wobei U ⊂ R offen ist: ist f in x0 ∈ U differenzierbar, so bedeutet das, dass sich die Sekanten durch (x0 , f (x0 )) und (x, f (x)) beim Grenzübergang x → x0 einer Geraden durch (x0 , f (x0 )) mit Steigung f 0 (x0 ) annähern. Diese Gerade nennen wir die Tangente an den Graphen von f im Punkt (x0 , f (x0 )). Bemerkung 4.1.2. Bei auf offenen Teilmengen von C definierten Funktionen spricht man auch von komplexer Differenzierbarkeit. 81 82 KAPITEL 4. DIFFERENTIALRECHNUNG Ist f in x0 differenzierbar, so wird für a ∈ C die Abbildung ( f (x)−f (x0 ) x 6= x0 x−x0 U −→ C; x 7−→ a x = x0 genau dann stetig in x0 , wenn a = f 0 (x0 ). Ist f in x0 nicht differenzierbar, so gibt es kein solches a. Definition 4.1.3. Wir sagen, dass eine Funktion f : U → C zweimal differenzierbar ist, wenn f differenzierbar ist und die deshalb existente Ableitung f 0 : U → C ebenfalls differenzierbar ist. Wir bezeichnen mit f 00 : U → C die Ableitung von f 0 , und nennen sie die zweite Ableitung von f . Rekursiv definieren wir, dass f k-mal differenzierbar heißt, wenn f k −1-mal differenzierbar ist, und die (k − 1)-te Ableitung von f wiederum differenzierbar ist. Wir bezeichnen die k-te Ableitung von f mit f (k) : U → C. Ist f k-mal differenzierbar, für jedes k, so nennen wir f unendlich oft differenzierbar. Satz 4.1.4. Es sei f : U → C in x0 ∈ U differenzierbar. Dann ist f in x0 stetig. Insbesondere: ist f differenzierbar, so ist f stetig. Beweis. Es sei f in x0 differenzierbar. Wir zeigen die Folgenstetigkeit von f in x0 : es sei dafür (yn ) eine Folge in U , die gegen x0 konvergiert. Dann gilt f (yn ) − f (x0 ) = f (yn ) − f (x0 ) · (yn − x0 ); yn − x0 in diesem Ausdruck konvergiert der linke Faktor gegen f 0 (x0 ) und der rechte gegen 0; damit konvergiert das Produkt gegen 0. Es gilt also limn→∞ f (yn ) = f (x0 ), d.h. f ist folgenstetig in x0 . Die Umkehrung dieses Satzes gilt nicht, wie das folgende Beispiel zeigt: Definition 4.1.5. Wir betrachten die Betragsfunktion | · | : R → R; x 7→ |x|. Sie ist auf ganz R stetig; wir behaupten, dass sie in 0 nicht differenzierbar ist. Für x > 0 gilt |x| − |0| = 1, x−0 für x < 0 aber |x| − |0| = −1. x−0 Damit existiert limx→0 ferenzierbar. |x|−|0| x−0 nicht; die Betragsfunktion ist also in 0 nicht dif- Satz 4.1.6. Es seien f, g : U → C differenzierbar in x0 ∈ U . Dann gilt: 1. Es ist auch f + g in x0 differenzierbar, mit (f + g)0 (x0 ) = f 0 (x0 ) + g 0 (x0 ). 2. (Produktregel) Es ist auch f · g in x0 differenzierbar, mit (f · g)0 (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ). 3. (Quotientenregel) Gilt g(x0 ) 6= 0, so ist auch 0 0 0 f 0 )−f (x0 )g (x0 ) (x0 ) = f (x0 )g(xg(x . 2 g 0) f g in x0 differenzierbar, mit 4.1. DIE ABLEITUNG 83 Beweis. Für den ersten Teil betrachten wir für x ∈ U , x 6= x0 : (f + g)(x) − (f + g)(x0 ) f (x) − f (x0 ) g(x) − g(x0 ) = + . x − x0 x − x0 x − x0 Da nach Voraussetzung die Grenzwerte der beiden Summanden auf der rechten Seite für x → x0 existieren, existiert auch der Grenzwert der linken Seite. Die Funktion f + g ist also in x0 differenzierbar und es gilt (f + g)0 (x0 ) = f 0 (x0 ) + g 0 (x0 ). Für die Produktregel berechnen wir für x ∈ U , x 6= x0 : f (x)(g(x) − g(x0 )) + (f (x) − f (x0 ))g(x0 ) f (x)g(x) − f (x0 )g(x0 ) = x − x0 x − x0 g(x) − g(x0 ) f (x) − f (x0 ) = f (x) + g(x); x − x0 x − x0 der Grenzwert dieses Ausdrucks für x → x0 ist also, da f und g in x0 stetig sind, gleich f (x0 )g 0 (x0 ) + f 0 (x0 )g(x0 ). Es ist also f · g in x0 differenzierbar mit (f g)0 (x0 ) = f (x0 )g 0 (x0 ) + f 0 (x0 )g(x0 ). Für die Quotientenregel betrachten wir zuerst den Fall einer Funktion der Form g1 . Wir berechnen für x nahe bei x0 , so dass g(x) 6= 0: 1 g(x) − 1 g(x0 ) x − x0 1 = g(x)g(x0 ) g(x0 ) − g(x) x − x0 Der Grenzwert dieses Ausdrucks, für x → x0 , existiert; damit ist die Funktion 1 g in x0 differenzierbar, und ihre Ableitung stimmt mit ihm überein: 0 1 g 0 (x0 ) . (x0 ) = − g g(x0 )2 Der allgemeine Fall der Quotientenregel folgt nun aus diesem Spezialfall und der Produktregel: auch fg ist differenzierbar und es gilt 0 0 1 1 g 0 (x0 ) f (x0 ) = f · (x0 ) = f 0 (x0 ) − f (x0 ) g g g(x0 ) g(x0 )2 0 0 f (x0 )g(x0 ) − f (x0 )g (x0 ) = . g(x0 )2 Beispiel 4.1.7. Wir behaupten, dass (reelle oder komplexe) Polynomfunktionen differenzierbar sind. Es sei f (z) = an z n + an−1 z n−1 + · · · + a1 z + a0 , für a0 , . . . , an ∈ C. Wir behaupten, dass f 0 (z) = nan z n−1 +(n−1)an−1 z n−2 +· · · a1 . Aufgrund von Satz 4.1.6 reicht es, dies für Monome zu beweisen; da die Ableitung einer konstanten Funktion 0 ist, reicht es sogar, dies für eine Funktion der Form f (z) = z n zu zeigen. Wir beobachten, dass z n − z0n = (z n−1 + z n−2 z0 + · · · + zz0n−2 + z0n−1 )(z − z0 ) 84 KAPITEL 4. DIFFERENTIALRECHNUNG für alle z, z0 ∈ C, und daher f (z) − f (z0 ) z n − z0n = = (z n−1 + z n−2 z0 + · · · + zz0n−2 + z0n−1 ). z − z0 z − z0 Der Grenzwert dieses Ausdrucks für z → z0 existiert also und ist gleich f 0 (z0 ) = lim z→z0 f (z) − f (z0 ) z n − z0n = lim = nz0n−1 . z→z0 z − z0 z − z0 Da die Ableitung einer Polynom wieder eine Polynomfunktion ist, folgt: Polynome sind unendlich oft differenzierbar. Beispiel 4.1.8. In den Übungen werden wir sehen, dass die komplexe Konjugation C → C; z 7→ z̄ nicht komplex differenzierbar ist. In Satz 3.2.8 haben wir gezeigt, dass die Umkehrfunktion einer auf einem Intervall definierten streng monotonen und stetigen Abbildung f : I → R automatisch wieder stetig ist. Nun betrachten wir die analoge Fragestellung im Kontext der Differenzierbarkeit: Satz 4.1.9. Es sei I ⊂ R ein offenes Intervall, f : I → J := f (I) ⊂ R eine stetige, streng monotone Funktion. Ist f in einem Punkt x ∈ I differenzierbar mit f 0 (x) 6= 0, so ist f −1 im Punkt y := f (x) ∈ J differenzierbar, und es gilt (f −1 )0 (y) = 1 f 0 (x) = 1 f 0 (f −1 (y)) . Beweis. Es sei (yn ) eine Folge in J \ {y}, die gegen y konvergiert. Wir setzen xn := f −1 (yn ). Da f −1 nach Satz 3.2.8 stetig ist, gilt limn→∞ xn = x. Außerdem ist xn 6= x für alle n, da f −1 bijektiv ist. Es gilt f −1 (yn ) − f −1 (y) xn − x = = yn − y f (xn ) − f (x) 1 f (xn )−f (x) xn −x n→∞ −→ 1 f 0 (x) ; da die Folge (yn ) beliebig gewählt war, folgt, dass der Grenzwert (f −1 )0 (y) existiert und gleich f 01(x) ist. Beispiel 4.1.10. Es sei f : (0, ∞) → (0, ∞) gegeben durch f (x) = x2 . Diese Abbildung ist streng monoton und differenzierbar, mit f 0 (x) = 2x √ 6= 0 für alle x. Es folgt, dass die Umkehrabbildung g : (0, ∞) → (0, ∞); x 7→ x ebenfalls 1 1 1 differenzierbar ist, mit g 0 (x2 ) = 2x , d.h. g 0 (x) = 2√ = 21 x− 2 . x Beispiel 4.1.11. In den Übungen wurde gezeigt, dass die Exponentialfunktion exp : C → C differenzierbar ist, mit exp0 = exp. Wir betrachten nun die reelle Exponentialfunktion, die wie wir also nun wissen eine bijektive streng monotone differenzierbare Abbildung exp : R → (0, ∞) definiert. Ihre Ableitung ist, da sie mit exp selbst übereinstimmt, nirgends verschwindend, weswegen wir den Satz anwenden können, um zu schließen, dass ihre Umkehrabbildung, der natürliche Logarithmus ln : (0, ∞) → R, ebenfalls differenzierbar ist. Die Ableitung von ln berechnet sich mit Hilfe des Satzes folgendermaßen: ln0 (exp(x)) = exp10 (x) = 1 exp(x) , also 1 ln0 (x) = . x 4.2. STETIGE DIFFERENZIERBARKEIT 85 Satz 4.1.12. Es seien f : U → C und V → C Funktionen mit f (U ) ⊂ V . Es sei f in x0 ∈ U differenzierbar und g in y0 = f (x0 ) differenzierbar. Dann ist g ◦ f : U → C in x0 differenzierbar, mit (g ◦ f )0 (x0 ) = g 0 (f (x0 )) · f 0 (x0 ). Beweis. Wir definieren die Abbildung h : V → C durch ( g(y)−g(y0 ) y 6= y0 y−y0 h(y) = 0 g (y0 ) y = y0 . Da g nach Voraussetzung in y0 differenzierbar ist, ist h in y0 stetig. Weiterhin erfüllt h die Gleichung h(y)(y − y0 ) = g(y) − g(y0 ), für alle y ∈ V , also insbesondere h(f (x))(f (x) − f (x0 )) = (g ◦ f )(x) − (g ◦ f )(x0 ) für alle x ∈ U . Wir betrachten nun für x ∈ U , x 6= x0 : (g ◦ f )(x) − (g ◦ f )(x0 ) (f (x) − f (x0 )) x→x0 0 −→ g (f (x0 )) · f 0 (x0 ), = h(f (x)) x − x0 x − x0 wobei wir beim Grenzübergang benutzt haben, dass h in y0 stetig ist, sowie dass f in x0 differenzierbar ist. Es folgt, dass g ◦ f in x0 differenzierbar ist, mit der angegebenen Ableitung. Beispiel 4.1.13. Wir betrachten für r ∈ R \ {0} die Funktion f : (0, ∞) → (0, ∞); f (x) = xr = er ln x . Sie ist als Komposition differenzierbarer Funktionen differenzierbar und es folgt mit Hilfe der Kettenregel f 0 (x) = er ln x · 4.2 r xr =r = rxr−1 . x x Stetige Differenzierbarkeit Ist f eine differenzierbare Abbildung, so muss die Ableitung f 0 von f nicht wieder differenzierbar sein, wie das folgende Beispiel zeigt: ( 0 x≤0 Beispiel 4.2.1. Wir betrachten die Funktion f : R → R; x 7→ 2 x x > 0. und behaupten, dass sie differenzierbar ist, aber nicht zweimal differenzierbar. Die Differenzierbarkeit ist in jedem Punkt 6= 0 offensichtlich; wir zeigen also die Differenzierbarkeit in 0: dies tun wir, indem wir die relevanten einseitigen Grenzwerte bestimmen: es ist x2 − 0 f (x) − f (0) = lim = lim x = 0 x&0 x − 0 x&0 x&0 x−0 lim und lim x%0 f (x) − f (0) = 0, x−0 86 KAPITEL 4. DIFFERENTIALRECHNUNG also existiert die Ableitung von f in 0 und es gilt f 0 (0) = 0. Die Ableitung von f ist also die nicht differenzierbare Funktion ( 0 x≤0 0 f (x) = 2x x > 0. In diesem Beispiel war die Ableitung der differenzierbaren Funktion wenigstens noch stetig; auch dies ist im Allgemeinen jedoch nicht der Fall. Um ein Beispiel zu geben berechnen wir zunächst die Ableitung von Sinus und Cosinus: Beispiel 4.2.2. Wir behaupten, dass die Ableitung von f (z) = sin(z) gleich cos(z) ist. Dafür berechnen wir mit Hilfe eines Additionstheorems für z0 ∈ C und z = z0 + h ∈ C, h 6= 0: sin(z0 + h) − sin(z0 ) sin(z) − sin(z0 ) = z − z0 h sin(z0 )(cos(h) − 1) + sin(h) cos(z0 ) − sin(z0 ) = . h Der Grenzwert dieses Ausdrucks für z → z0 ist identisch zum Grenzwert der rechten Seite für h → 0. Wir berechnen, ähnlich wie in einer Übungsaufgabe auf dem 12. Blatt, den Grenzwert limh→0 cos(h)−1 : es gilt h cos(h) − 1 = ∞ X (−1)n n=1 h2n ; (2n)! P∞ 2n−1 Teilen durch h 6= 0 ergibt die Reihe n=1 (−1)n h(2n)! . Sie konvergiert für jedes h 6= 0, weswegen es sich um eine Potenzreihe mit Konvergenzradius ∞ handelt. Ihr Wert an der Stelle 0 ist 0; da Potenzreihen stetige Funktionen auf ihrem Konvergenzkreis definieren gilt also limh→0 cos(h)−1 = 0. Analog argumentieren h P∞ sin(h) h2n+1 wir, um zu zeigen, dass limh→0 h = 1: es gilt sin(h) = n=0 (−1)n (2n+1)! ; P∞ n h2n nach Teilen durch h erhalten wir die Potenzreihe n=0 (−1) (2n+1)! mit Konvergenzradius ∞, deren Wert 1 an der Stelle 0 mit dem gesuchten Grenzwert übereinstimmt. Insgesamt existiert also der gesuchte Grenzwert: es ist lim z→z0 sin(z) − sin(z0 ) cos(h) − 1 sin(h) = sin(z0 ) lim + cos(z0 ) lim = cos(z0 ); h→0 h→0 z − z0 h h wir haben gezeigt, dass die Ableitung des Sinus der Cosinus ist. Analog zeigt man, dass cos0 = − sin. Mit Hilfe der Ableitung des Sinus können wir nun ein Beispiel einer differenzierbaren Funktion geben, deren Ableitung nicht stetig ist: Beispiel 4.2.3. Wir betrachten die Funktion ( x2 sin f : R −→ R; x 7−→ 0 1 x x≥0 x<0 4.3. LOKALE EXTREMA 87 und behaupten, dass sie differenzierbar ist, aber f 0 nicht stetig. Differenzierbarkeit in allen Punkten ungleich 0 ist klar, da f dort lokal als Komposition stetiger Funktionen gegeben ist. Wir zeigen die Differenzierbarkeit in 0: es ist (0) = 0, und limx%0 f (x)−f x−0 f (x) − f (0) lim = lim x sin x&0 x&0 x−0 1 = 0, x da sin x1 auf ganz R beschränkt ist, und limx→0 x = 0. Es ist f also in 0 differenzierbar, mit f 0 (0) = 0. Für x > 0 berechnen wir: 1 1 1 1 1 f 0 (x) = 2x sin = 2x sin − x2 cos − cos . x x x2 x x Für x → 0 besitzt diese Funktion keinen Grenzwert: man betrachte z.B. die 1 2 Nullfolge xn = 2πn ; es gilt f 0 (xn ) = 2πn sin (2πn) − cos(2πn) = −1. Für die 2 1 0 sin(π/2 + 2πn) − cos(π/2 + Nullfolge yn = π/2+2πn gilt aber f (yn ) = π/2+2πn 2 2πn) = π/2+2πn → 0 für n → ∞. Damit existiert limx→0 f 0 (x) nicht, und f 0 ist in 0 nicht stetig. Definition 4.2.4. Eine Funktion f : U → C heißt k-mal stetig differenzierbar, wenn f k-mal differenzierbar ist und die k-te Ableitung f (k) : U → C stetig ist. Wir setzen für K = R oder C: C k (U, K) = {f : U −→ K | f ist k-mal stetig differenzierbar} Man sagt auch: f ist eine C k -Funktion. Wir setzen C ∞ (U, K) = {f : U −→ K | f ist unendlich oft differenzierbar} und nennen eine solche Funktion auch einfach eine C ∞ -Funktion. 4.3 Lokale Extrema Definition 4.3.1. Es sei f : (a, b) → R eine Funktion und x0 ∈ (a, b). Wir sagen, dass f in x0 ein lokales Maximum (bzw. ein lokales Minimum) besitzt, wenn es eine offene Umgebung V von x0 gibt, so dass f (x) ≤ f (x0 ) (bzw. f (x) ≥ f (x0 )) für alle x ∈ V ∩ (a, b). Ist x0 ∈ (a, b) ein lokales Minimum oder ein lokales Maximum, so sagen wir, dass x0 ein lokales Extremum von f ist. Satz 4.3.2. Es sei f : (a, b) → R eine Funktion und x0 ∈ (a, b) ein lokales Extremum von f . Ist f in x0 differenzierbar, so gilt f 0 (x0 ) = 0. Beweis. Wir betrachten den Fall, dass x0 ein lokales Maximum ist; der Fall, dass x0 ein lokales Minimum ist, geht analog. Es sei V eine offene Umgebung von x0 , so dass f (x) ≤ f (x0 ) für alle x ∈ (a, b) ∩ V . Für x ∈ (a, b) ∩ V mit x > x0 gilt dann, dass f (x) − f (x0 ) ≤ 0, x − x0 88 KAPITEL 4. DIFFERENTIALRECHNUNG da f (x) − f (x0 ) ≤ 0 und x − x0 > 0. Für x ∈ (a, b) ∩ V mit x < x0 gilt aber f (x) − f (x0 ) ≥ 0. x − x0 Da nach Definition der Differenzierbarkeit aber der Grenzwert der obigen Differenzenquotienten für x → x0 existiert, folgt, dass er sowohl ≤ 0, als auch ≥ 0 sein muss, also gleich 0. Das Verschwinden der Ableitung in einem Punkt ist nur eine notwendige Bedingung für die Existenz eines lokalen Extremums an diesem Punkt. Zum Beispiel verschwindet die Ableitung der Funktion f (x) = x3 in 0, obwohl die Funktion dort kein lokales Extremums hat. Satz 4.3.3. Es sei f : (a, b) → R eine differenzierbare, monoton wachsende (bzw. monoton fallende) Funktion. Dann gilt f 0 (x) ≥ 0 (bzw. f 0 (x) ≤ 0) für alle x ∈ (a, b). Beweis. Wir betrachten nur den Fall, dass f monoton wachsend ist. Es sei x0 ∈ (a, b) und x ∈ (x0 , b). Dann gilt f (x) ≥ f (x0 ) und also ist f (x) − f (x0 ) ≥ 0. x − x0 Der Grenzwert dieses Ausdrucks für x & x0 existiert und ist also ebenfalls ≥ 0. Dieser ist gleich der Ableitung f 0 (x0 ). 4.4 Der Mittelwertsatz Satz 4.4.1. Es sei f : [a, b] → R stetig und auf (a, b) differenzierbar. Dann gibt es ein ξ ∈ (a, b), so dass f (a) − f (b) f 0 (ξ) = . a−b Man beachte: im Fall dass f (a) = f (b) erhalten wir die Aussage, dass es einen Punkt ξ ∈ (a, b) gibt, so dass f 0 (ξ) = 0. Diese Aussage ist auch als Satz von Rolle bekannt. Beweis. Wir beweisen zuerst den Satz von Rolle: es sei also f : [a, b] → R stetig und in (a, b) differenzierbar, und es gelte f (a) = f (b). Falls f konstant ist, so sind wir fertig; wir nehmen also an, dass f nicht konstant ist. Da f auf dem kompakten Intervall [a, b] stetig ist, nimmt die Funktion f auf [a, b] ihr Maximum und ihr Minimum an. Da f (a) = f (b) und f nicht konstant ist, wird mindestens eines von beiden nicht an a oder b angenommen; es sei ξ ein solcher Extremalwert in (a, b). Dann gilt aber nach Satz 4.3.2, dass f 0 (ξ) = 0. Wir führen nun den Mittelwertsatz auf den Satz von Rolle zurück: wir verzichten auf die Voraussetzung, dass f (a) = f (b). Dann betrachten wir die (auf [a, b] stetige und auf (a, b) differenzierbare) Abbildung g(x) := f (x) − f (b) − f (a) (x − a). b−a 4.4. DER MITTELWERTSATZ 89 Für diese gilt g(a) = g(b) = f (a); wir finden also nach dem Satz von Rolle ein ξ ∈ (a, b), so dass g 0 (ξ) = 0. Es gilt aber g 0 (ξ) = f 0 (ξ) − f (b) − f (a) ; b−a das Verschwinden von g 0 (ξ) bedeutet also gerade, dass f 0 (ξ) = gewünscht. f (b)−f (a) b−a wie Korollar 4.4.2. Es sei f : [a, b] → R stetig und auf (a, b) differenzierbar. Weiterhin gebe es Konstanten S, T ∈ R, so dass S ≤ f 0 (x) ≤ T für alle x ∈ (a, b). Dann gilt für alle x1 , x2 ∈ [a, b] mit x1 ≤ x2 , dass R(x2 − x1 ) ≤ f (x2 ) − f (x1 ) ≤ T (x2 − x1 ). Beweis. Falls x1 = x2 , ist die Behauptung klar. Wir nehmen an, es gelte x1 < x2 . Wir wenden den Zwischenwertsatz auf die Einschränkung von f auf das Intervall [x1 , x2 ] an und erhalten, dass es ein ξ ∈ (x1 , x2 ) gibt, so dass f (x2 )−f (x1 ) = f 0 (ξ) ∈ [S, T ]. x2 −x1 Für den Spezialfall S = T = 0 erhalten wir folgende Aussage: Korollar 4.4.3. Es sei f : [a, b] → R stetig und in (a, b) differenzierbar, mit f 0 (x) = 0 für alle x ∈ (a, b). Dann ist f konstant. Als weitere Folgerung aus dem Mittelwertsatz können wir eine Umkehrung von Satz 4.3.3 zeigen: Satz 4.4.4. Es sei f : (a, b) → R eine differenzierbare Funktion. Wenn f 0 (x) ≥ 0 (bzw. f 0 (x) > 0, f 0 (x) ≤ 0, f 0 (x) < 0) für alle x ∈ (a, b), so ist f auf (a, b) monoton wachsend (bzw. streng monoton wachsend, monoton fallend, streng monoton fallend). Beweis. Wir betrachten nur den Fall, dass f 0 (x) ≥ 0 auf ganz (a, b); die anderen Fälle gehen analog. Wir nehmen an, f sei nicht monoton wachsend, d.h. dass es x1 < x2 gibt, so dass f (x1 ) > f (x2 ). Nach dem Mittelwertsatz gibt es ξ ∈ (x1 , x2 ), so dass f (x2 ) − f (x1 ) f 0 (ξ) = < 0, x2 − x1 was ein Widerspruch zur Voraussetzung ist. Als Korollar formulieren wir ein hinreichendes (aber nicht notwendiges) Kriterium für ein lokales Extremum: Korollar 4.4.5. Es sei f : (a, b) → R eine differenzierbare Funktion, und f 0 : (a, b) → R sei im Punkt x0 ∈ (a, b) differenzierbar. Es gelte f 0 (x0 ) = 0 und f 00 (x0 ) > 0 (bzw. f 00 (x0 ) < 0). Dann besitzt f in x0 ein lokales Minimum (bzw. Maximum). Beweis. Wir beweisen nur den Fall, dass f 00 (x0 ) > 0. Es gilt 0 < f 00 (x0 ) = lim x→x0 f 0 (x) − f 0 (x0 ) f 0 (x) = lim , x→x0 x − x0 x − x0 90 KAPITEL 4. DIFFERENTIALRECHNUNG also existiert ein ε > 0, so dass f 0 (x) >0 x − x0 für alle x mit 0 < |x − x0 | < ε. Es folgt: für alle x ∈ (x0 − ε, x0 ) gilt f 0 (x) < 0 und für alle x ∈ (x0 , x0 + ε) gilt f 0 (x) > 0. Nach Satz 4.4.4 folgt: f ist im Intervall (x0 − ε, x0 ) streng monoton fallend und im Intervall (x0 , x0 + ε) streng monoton wachsend. (Man sagt auch: x0 ist ein strenges lokales Minimum von f .) Beispiel 4.4.6. Die Funktion f (x) = x4 besitzt in 0 ein (strenges) lokales Minimum. Es verschwinden aber sowohl die erste als auch die zweite Ableitung von f in 0. 4.5 Die Regel von de l’Hospital Die Regel von de l’Hospital ist ein nützliches Hilfsmittel zur Berechnung von reellen Grenzwerten: Satz 4.5.1. Es seien f, g : (a, b) → R differenzierbare Funktionen, mit g 0 (x) 6= 0 für alle x ∈ (a, b). (Uneigentliche Intervalle sind erlaubt.) Wir nehmen an, dass 0 (x) der Grenzwert L := limx%b fg0 (x) existiert. (L = ±∞ ist erlaubt.) Falls entweder lim f (x) = lim g(x) = 0 x%b x%b oder lim f (x) = ±∞, x%b lim g(x) = ±∞ x%b dann gilt lim x%b f (x) = L. g(x) Eine analoge Aussage gilt, wenn wir stattdessen auf (a, b) definierte Funktionen und den Grenzwert x & a betrachten. Beweis. Wir betrachten den Fall, dass b eine reelle Zahl ist, und dass limx%b f (x) = limx%b g(x) = 0. Wir setzen f und g auf (a, b] stetig durch f (b) := 0 und g(b) := 0 fort. Es sei (xn ) eine Folge in (a, b), die gegen b konvergiert. Für alle n sei Hn (x) := f (x)g(xn ) − g(x)f (xn ). Die Funktion Hn ist differenzierbar auf (a, b), und es gilt Hn (xn ) = 0 sowie Hn (b) = f (b)g(xn ) − g(b)f (xn ) = 0. Nach dem Mittelwertsatz (bzw. dem Satz von Rolle) existiert ξn ∈ (xn , b), so dass 0 (xn ) (ξn ) 0 = Hn0 (ξn ) = f 0 (ξn )g(xn ) − g 0 (ξn )f (xn ), d.h. fg(x = fg0 (ξ . Da ξn ∈ (xn , b) n) n) und xn % b, konvergiert auch (ξn ) gegen b. Damit gilt nach Voraussetzung 0 (ξn ) (xn ) limn→∞ fg0 (ξ = L, also auch limn→∞ fg(x = L. Da die Folge (xn ) beliebig n) n) war, folgt die Behauptung. Die anderen Fälle können auf diesen zurückgeführt werden. Zum Beispiel 1 betrachten wir den Fall f (x) → ∞, g(x) → ∞. Dann sei F (x) = f (x) und 4.6. DIFFERENZIERBARKEIT UND GLEICHMÄSSIGE KONVERGENZ91 1 G(x) = g(x) , so dass limx%b F (x) = limx%b G(x) = 0. Anwendung des ersten Falls liefert f 0 (x) − f (x)2 g(x) F (x) F 0 (x) f 0 (x) g(x)2 , lim = lim = lim 0 = lim g0 (x) = lim 0 · lim x%b f (x) x%b G(x) x%b G (x) x%b − x%b g (x) x%b f (x)2 2 g(x) 0 (x) (x) was impliziert, dass limx%b fg(x) = limx%b fg0 (x) . Gilt f (x) → −∞ und/oder g(x) → −∞, so ersetzen wir f durch −f bzw. g durch −g und wenden den obigen Fall an. Betrachten wir statt den Grenzwerten x % b den Fall von Grenzwerten x & a, wobei a eine reelle Zahl ist, so ersetzen wir x 7→ f (x) und x 7→ g(x) durch die Funktionen x 7→ f (−x) und x 7→ g(−x) und wenden den ersten Fall an. Betrachten wir als Intervallgrenzen ±∞, so führen wir die neue Variable u = x1 ein, und berechnen z.B. im Fall b = ∞: f (x) f (1/u) −f 0 (1/u)u−2 f 0 (x) = lim 0 = lim = lim . 0 −2 x→∞ g(x) x→∞ g (x) u&0 g(1/u) u&0 −g (1/u)u lim Beispiel 4.5.2. Es gilt limx→∞ ln(x) = ∞ und limx→∞ nach der Regel von de l’Hospital: √ x = ∞. Damit gilt x−1 ln x lim √ = lim 1 −1/2 = lim 2x−1/2 = 0. x→∞ x x→∞ x→∞ x 2 Beispiel 4.5.3. Manchmal ist die Regel von de l’Hospital nicht direkt anwendbar: ex + e−x ex − e−x ex + e−x lim x = lim = lim = ··· x→∞ e − e−x x→∞ ex + e−x x→∞ ex − e−x führt zu keinem Ergebnis. Ersetzen wir in diesem Beispiel aber u = ex , dann gilt, wieder unter Anwendung der Regel von de l’Hospital: ex + e−x u + u−1 1 − u−2 = lim = lim = 1. x→∞ ex − e−x u→∞ u − u−1 u→∞ 1 + u−2 lim 4.6 Differenzierbarkeit und gleichmäßige Konvergenz Wir erinnern daran, dass wir gezeigt haben, dass die Grenzfunktion einer gleichmäßig konvergenten Funktionenfolge stetiger Funktionen automatisch stetig ist. Man könnte versucht sein zu glauben, dass ein analoger Satz für differenzierbare Funktionen gilt. Das folgende Beispiel zeigt jedoch, dass das nicht stimmt: q Beispiel 4.6.1. Wir betrachten die Funktionenfolge fn : R → R; x 7→ x2 + n1 . Da x2 + n1 immer positiv ist, ist fn als Komposition differenzierbarer Funktionen differenzierbar. 92 KAPITEL 4. DIFFERENTIALRECHNUNG Diese konvergiert gleichmäßig gegenq die in 0 nicht differenzierbare Betragsfunktion f (x) = |x|: für alle x ∈ R gilt x2 + n1 + |x| ≥ √1n , und daher 1 √ · n r 1 x2 + − |x| n ! ! 1 x2 + − |x| · n r ≤ r ! 1 1 x2 + + |x| = , n n weswegen also 1 ||fn − f ||∞ ≤ √ . n Dies impliziert, dass fn gleichmäßig gegen f konvergiert. Wir geben ein weiteres, sehr berühmtes Beispiel an: Beispiel 4.6.2. Es sei 0 < a < 1 und b eine ungerade natürliche Zahl, so dass ab ≥ 1. Wir betrachten die Funktionenreihe ∞ X an cos(bn πx). n=0 Wir wenden Satz 3.7.1 an, um zu zeigen, dass diese Funktionenreihe auf ganz n R gleichmäßig konvergiert: MitP fn (x) := an cos(b πx) gilt ||fn ||∞ = an , und da P∞ ∞ 0 < a < 1, handelt es sich bei n=0 ||fn ||∞ = n=0 an also um eine (konvergente) geometrische Reihe. Die Funktionenreihe definiert also auf ganz R eine stetige Funktion f : R → R. Sie wird eine Weierstraß-Funktion genannt. Ohne Beweis erwähnen wir: obwohl wir die Weierstraß-Funktion als gleichmäßigen Grenzwert einer Folge differenzierbarer Funktionen definiert haben, ist sie nicht differenzierbar. Es gilt sogar: sie ist in keinem Punkt differenzierbar, was von Weierstraß im Jahre 1872 (unter stärkeren Annahmen an a und b, nämlich dass ab > 1 + 23 π) bewiesen wurde. Bis zum Beginn des 19. Jahrhunderts war die geläufige Meinung, dass stetige Funktionen automatisch fast überall differenzierbar sind. Auch heute gilt: wenn wir uns eine stetige, nicht differenzierbare Funktion vorstellen, dann haben wir eine Funktion wie die Betragsfunktion vor Augen, die nur an isolierten Stellen nicht differenzierbar ist. Die Weierstraß-Funktion zeigt, dass diese Vorstellung falsch ist: eine allgemeine stetige Funktion kann ziemlich fürchterlich aussehen. Weiterhin gilt: selbst wenn wir eine gleichmäßig konvergente Funktionenfolge gegeben haben, deren Grenzfunktion wieder differenzierbar ist, so muss die Folge der Ableitungen nicht gegen die Ableitung der Grenzfunktion konvergieren: Beispiel 4.6.3. Wir betrachten die reelle Funktionenfolge fn (x) = n1 sin(nx). Da |fn (x)| ≤ n1 für alle x ∈ R, konvergiert fn gleichmäßig gegen die Nullfunktion, die natürlich differenzierbar ist. Betrachten wir jedoch nun die Folge der Ableitungen, fn0 (x) = cos(nx), so konvergiert diese Funktionenfolge noch nicht einmal punktweise gegen irgendeine Funktion. Satz 4.6.4. Es sei U ⊂ R oder U ⊂ C offen. Es seien fn : U → C stetig differenzierbare Funktionen (d.h. alle fn sind stetig differenzierbar), so dass (fn ) gleichmäßig gegen eine Funktion f konvergiert, und die Folge von stetigen Funktionen (fn0 ) gleichmäßig gegen eine Funktion g konvergiert. Dann ist f ∈ C 1 (U ) und es gilt f 0 = g. 4.7. DIFFERENZIERBARKEIT VON POTENZREIHEN 93 Beweis. Wir betrachten für fixiertes x0 ∈ U die Funktion ( f (x)−f (x0 ) x 6= x0 x−x0 h(x) = g(x0 ) x = x0 . Wenn wir zeigen können, dass h in x0 stetig ist, dann folgt, dass f in x0 differenzierbar ist, mit f 0 (x0 ) = g(x0 ). Da x0 beliebig ist, wird das also die Behauptung implizieren. Wir fixieren also ε > 0 und müssen ein δ > 0 finden, so dass |h(x)−h(x0 )| < ε für alle x ∈ Bδ (x0 ). Für alle n und x ∈ U \ {x0 } setzen wir hn (x) = fn (x) − fn (x0 ) . x − x0 und berechnen |h(x) − h(x0 )| = |h(x) − hn (x) + hn (x) − fn0 (x) + fn0 (x) − g(x) + g(x) − g(x0 )| ≤ |h(x) − hn (x)| + |hn (x) − fn0 (x)| + |fn0 (x) − g(x)| + |g(x) − g(x0 )| . (4.6.1) Diese Ungleichung gilt, wie gesagt, für alle n und alle x ∈ U \ {x0 }. Nun fixieren wir zuerst ein n0 , so dass ||fn0 − g||∞ < 4ε für alle n ≥ n0 . Danach sei δ > 0 so klein, dass für alle x ∈ Bδ (x0 ) gilt, dass |hn (x) − fn0 (x)| < 4ε (dies geht, da n (x) fn in x differenzierbar ist, und der Ausdruck hn (x) = fn (xx00)−f für x0 → x −x ε 0 daher gegen fn (x) konvergiert) sowie |g(x) − g(x0 )| < 4 (dies geht, da g als gleichmäßiger Grenzwert einer Folge stetiger Funktionen wieder stetig ist). Für jedes solche x ∈ Bδ (x0 ) gibt es dann ein n ≥ n0 , so dass |h(x) − hn (x)| < 4ε . Insgesamt gibt es also für alle x ∈ Bδ (x0 ) ein n, so dass jeder Summand in der rechten Seite von (4.6.1) kleiner ist als 4ε , also folgt |h(x) − h(x0 )| < ε. 4.7 Differenzierbarkeit von Potenzreihen In diesem Abschnitt werden wir den folgenden Satz beweisen, der das Analogon von Beispiel 4.1.7 für Potenzreihen darstellt. P∞ Satz 4.7.1. Es sei f (z) = n=0 an (z − z0 )n eine Potenzreihe um z0 ∈ C mit Konvergenzradius R > 0. Dann ist die Funktion f : BR (z0 ) → C auf ganz BR (z0 ) differenzierbar, und es gilt f 0 (z) = ∞ X nan (z − z0 )n−1 . n=1 Diese Potenzreihe hat wieder den Konvergenzradius R. Beweis. Wir betrachten die Potenzreihe ∞ X nan (z − z0 )n−1 (4.7.1) n=1 von der wir zeigen wollen, dass sie die Ableitung von f darstellt. Zuerst zeigen wir, dass sie denselben Konvergenzradius wie f besitzt. Ihr Konvergenzradius 94 KAPITEL 4. DIFFERENTIALRECHNUNG ist aber derselbe wie der der Potenzreihe P∞ n=1 nan (z − z0 )n , der sich als 1 1 p = √ p lim supn→∞ n |nan | lim supn→∞ ( n n · n |an |) √ berechnet. Da n n aber gegen 1 konvergiert, ist dieser Ausdruck dasselbe wie 1 √ = R. lim supn→∞ n |an | PN Wir betrachten die Folge der Partialsummen fN (z) = n=0 an (z−z0 )n . Jede Funktion fN ist C 1 (sogar C ∞ , da ein Polynom). Weiterhin gilt: fN konvergiert, wie in Abschnitt 3.8 gezeigt, auf jeder Kreisscheibe Br (0), wobei 0 < r < R, 0 gleichmäßig gegen f , und die Folge der Ableitungen fN konvergiert auf Br (0) gleichmäßig gegen die durch (4.7.1) gegebene Funktion. Damit sind alle Voraussetzungen von Satz 4.6.4 erfüllt: es folgt, dass f differenzierbar ist, und dass die Ableitung von f durch (4.7.1) gegeben ist. Es folgt unmittelbar: Korollar 4.7.2. Potenzreihen sind in ihrem Konvergenzkreis unendlich oft differenzierbar. P∞ n Beispiel 4.7.3. 1. Wir betrachten exp : C → C; z 7→ n=0 zn! . Es folgt aus Satz 4.7.1: ∞ ∞ X X zn z n−1 = = exp(z), exp0 (z) = n n! n! n=0 n=1 d.h. exp0 = exp, wie bereits aus den Übungen bekannt. P∞ z 2n+1 2. Wir betrachten sin : C → C; z 7→ n=0 (−1)n (2n+1)! . Es folgt aus Satz 4.7.1: ∞ X z 2n z 2n (−1) (2n + 1) (−1)n sin (z) = = = cos(z), (2n + 1)! n=0 (2n!) n=0 0 ∞ X n d.h. sin0 = cos, wie wir bereits in Beispiel 4.2.2 gezeigt haben. Genauso zeigt man: cos0 = − sin. Beispiel 4.7.4. Es gibt unendlich oft differenzierbare Funktionen, die trotzdem nicht analytisch sind. In den Übungen wurde gezeigt, dass die Funktion ( 0 x≤0 f : R −→ R; x 7−→ 1 e− x unendlich oft differenzierbar ist. Aufgrund des Verschwindungssatzes für Potenzreihen kann sie in keiner Umgebung von 0 als Potenzreihe geschrieben werden. Man kann Satz 4.7.1 auch umgekehrt anwenden: P∞ Korollar 4.7.5. Es sei f (z) = n=0 an (z − z0 )n eine Potenzreihe um z0 ∈ C mit Konvergenzradius R > 0. Dann hat die Potenzreihe F (z) = ∞ ∞ X X an an−1 (z − z0 )n+1 = (z − z0 )n n + 1 n n=0 n=1 ebenfalls Konvergenzradius R, und es gilt F 0 = f auf BR (z0 ). 4.8. TAYLORENTWICKLUNG 95 Beweis. Dass die Konvergenzradien übereinstimmen, zeigt man wie im Beweis von Satz 4.7.1 mit Hilfe des Wurzelkriteriums. Damit definiert F nach Satz 4.7.1 eine differenzierbare Funktion auf BR (z0 ). Ihre Ableitung F 0 ist nach Konstruktion identisch mit f . Beispiel 4.7.6. Wir betrachten den natürlichen Logarithmus ln : (0, ∞) → R. In Beispiel 4.1.11 haben wir gezeigt, dass die Ableitung von ln durch die Funktion 1 x gegeben ist, welches eine analytische Funktion ist. Dies können wir benutzen, um eine Potenzreihendarstellung von ln herzuleiten, z.B. um den Punkt 1. Wir benutzen die geometrische Reihe: für |x − 1| < 1 gilt ∞ ∞ X X 1 1 = = (1 − x)n = (x − 1)n ; x 1 − (1 − x) n=0 n=0 die rechte Seite ist eine Potenzreihe um 1 mit Konvergenzradius 1. Wir wenden Korollar 4.7.5 an: Auch die Reihe ∞ X (−1)n n=0 ∞ X (x − 1)n 1 (−1)n+1 (x − 1)n+1 = n+1 n n=1 hat Konvergenzradius 1, die durch sie definierte Funktion auf B1 (1) ist unendlich oft differenzierbar, und hat als Ableitung die Funktion x1 . Nach Korollar 4.4.3 stimmt diese Potenzreihe auf dem Intervall (0, 2) also bis auf eine Konstante mit dem natürlichen Logarithmus überein. Es gilt aber außerdem: ln(1) = 0, und die Potenzreihe hat als konstanten Term ebenfalls 0. Es folgt, dass wir ln um 1 in eine Potenzreihe entwickelt haben: für alle x ∈ (0, 2) gilt ln x = ∞ X (−1)n+1 n=1 (x − 1)n . n Man beachte, dass die rechte Seite, wie jede Potenzreihe, natürlicherweise auf einem Kreis in C, hier auf B1 (1), definiert ist! 4.8 Taylorentwicklung P∞ Wir betrachten eine Potenzreihe der Form g(z) = n=0 an (z − z0 )n mit Konvergenzradius R > 0. Im letztenP Abschnitt haben wir gezeigt, dass g auf BR (z0 ) ∞ differenzierbar ist, mit g 0 (z) = n=1 nan (z − z0 )n−1 , und dass diese neue Potenzreihe wieder differenzierbar ist. Es folgt induktiv für alle k: g (k) (z) = ∞ X n · (n − 1) · · · · · (n − k + 1) · an (z − z0 )n−k . n=k Insbesondere gilt g (k) (z0 ) = k! · ak . Der n-te Koeffizient einer Potenzreihe ist also eindeutig durch die n-te Ableitung der durch die Potenzreihe definierten Funktion im Punkt z0 bestimmt. Betrachten wir nun eine unendlich oft differenzierbare Funktion f : U → C, fixieren z0 ∈ U und stellen die Frage, ob wir eine Potenzreihe g(z) = 96 KAPITEL 4. DIFFERENTIALRECHNUNG P∞ an (z − z0 )n um z0 finden, die mit f in einer Umgebung von z0 übereinstimmt. Falls es eine solche Potenzreihe gibt, dann folgt, dass f in dieser Umgebung unendlich oft differenzierbar sein muss, und aus unserer obigen Vorüberlegung folgt auch, dass die Koeffizienten an durch die Ableitungen von f bestimmt sind: Falls eine solche Potenzreihe existiert, so ist sie notwendigerweise durch n=0 ∞ X f (n) (z0 ) n z n! n=0 gegeben. Definition 4.8.1. Ist f : U → C eine unendlich oft differenzierbare Funktion und z0 ∈ U , so heißt die Potenzreihe ∞ X f (n) (z0 ) n z n! n=0 die Taylorreihe von f um den Entwicklungspunkt z0 . Wir betonen, dass die Taylorreihe von f um einen Punkt z0 im Allgemeinen nicht, auch nicht in einer kleinen Umgebung von z0 , mit f übereinstimmen muss. Man betrachte Beispiel 4.7.4: die Taylorreihe der dort angegebenen Funktion f um 0 ist die konstante Potenzreihe 0: in den Übungen haben wir gezeigt, dass alle Ableitungen von f im Punkt 0 verschwinden. In diesem Beispiel stimmt die Taylorreihe wenigstens noch auf der negativen reellen Achse mit der Ausgangsfunktion überein, aber auch das muss im Allgemeinen nicht stimmen: betrachten wir die Funktion g, die aus f durch g(x) = f (x) für x ≥ 0 und g(x) = f (−x) für x < 0 hervorgeht, d.h. 1 g(x) = e− |x| , so ist sie (trotz Auftretens des Betrages) unendlich oft differenzierbar, aber ihre Taylorreihe um 0 ist die konstante Nullfunktion. Diese stimmt also in keinem Punkt außer 0 mit g überein. Beispiel 4.8.2. Wir betrachten den natürlichen Logarithmus f := ln : (0, ∞) → R und möchten die Taylorentwicklung von ln im Punkt 1 bestimmen. Wir haben die Ableitung von ln bereits in Beispiel 4.1.11 bestimmt; es gilt f 0 (x) = x1 = x−1 . Es folgt induktiv: f (n) (x) = (−1)n+1 (n − 1)! x1n . Insbesondere: f (n) (1) = (−1)n+1 (n − 1)!. Die Taylorreihe von ln um den Entwicklungspunkt 1 lautet also (man beachte ln(1) = 0) ∞ X (x − 1)n (−1)n+1 , n n=1 was wie erwartet mit der in Beispiel 4.7.6 bestimmten Potenzreihenentwicklung von ln übereinstimmt.