Analysis 1 August 2010 Michael Kaltenbäck Inhaltsverzeichnis 1 Mengen und Abbildungen 1.1 Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Die reellen Zahlen 2.1 Algebraische Struktur der reellen Zahlen 2.2 Ordnungsstruktur der reellen Zahlen . . 2.3 Die natürlichen Zahlen . . . . . . . . . 2.4 Der Ring der ganzen Zahlen . . . . . . 2.5 Der Körper Q . . . . . . . . . . . . . . 2.6 Archimedisch angeordnete Körper . . . 2.7 Das Vollständigkeitsaxiom . . . . . . . 2.8 Die komplexen Zahlen . . . . . . . . . 3 1 1 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 9 11 16 26 34 39 40 46 Der Grenzwert 3.1 Metrische Räume . . . . . . . . . . . . . . . 3.2 Der Grenzwert in metrischen Räumen . . . . 3.3 Folgen reeller und komplexer Zahlen . . . . . 3.4 Existenz von Grenzwerten . . . . . . . . . . 3.5 Konvergenz in weiteren metrischen Räumen . 3.6 Konvergenz gegen unendlich . . . . . . . . . 3.7 Unendliche Reihen . . . . . . . . . . . . . . 3.8 Konvergenzkriterien . . . . . . . . . . . . . . 3.9 Umordnungen von Reihen und Doppelreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 49 54 59 62 65 68 72 77 82 . . . . . . . . . . . . . . . . 4 Die Konstruktion der reellen Zahlen 5 Geometrie metrischer Räume 5.1 ǫ-Kugeln, offene und abgeschlossene Mengen . . . . . . . . . . . . . 5.2 Kompaktheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Folgen und Netze . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 99 104 109 6 Reelle und komplexe Funktionen 6.1 Stetigkeit . . . . . . . . . . 6.2 Der Zwischenwertsatz . . . 6.3 Gleichmäßige Stetigkeit . . . 6.4 Unstetigkeitsstellen . . . . . 6.5 Monotone Funktionen . . . . 6.6 Gleichmäßige Konvergenz . 117 117 122 124 127 129 131 . . . . . . 93 . . . . . . . . . . . . i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . INHALTSVERZEICHNIS ii 6.7 6.8 6.9 6.10 Reell- und komplexwertige Folgen und Reihen Die Exponentialfunktion . . . . . . . . . . . . Fundamentalsatz der Algebra . . . . . . . . . . Weitere wichtige elementare Funktionen . . . . 7 Differentialrechnung 7.1 Begriff der Ableitung . . 7.2 Mittelwertsätze . . . . . 7.3 Der Taylorsche Lehrsatz 7.4 Stammfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 144 152 154 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 159 165 174 182 Literaturverzeichnis 191 Index 192 Kapitel 1 Mengen und Abbildungen 1.1 Mengen Die Objekte der modernen Mathematik sind die Mengen. Obwohl die Logik einen axiomatischen Zugang zur Mengenlehre bietet, wollen wir uns auf den vom Schöpfer der Mengenlehre (Georg CANTOR) geprägten Mengenbegriff stützen: 1.1.1 Definition. Eine Menge ist eine Zusammenfassung von bestimmten, wohlunterschiedenen Objekten unserer Anschauung zu einem Ganzen. Die Objekte heißen Elemente der Menge. Ist x ein solches Element von M, so schreiben wir x ∈ M. Im Falle, dass x nicht zu M gehört, schreiben wir x < M. Möglichkeiten Mengen darzustellen sind die aufzählende Schreibweise: M = {a, b, c, d, e}, oder M = {1, 2, . . . } und die beschreibende Schreibweise: M = {x : x ist ungerade ganze Zahl}. 1.1.2 Definition. Sind A, B Mengen, so sagt man A ist gleich B (A = B), wenn sie die selben Elemente enthalten. Man sagt A ist eine Teilmenge von B (A ⊆ B), falls jedes Element von A auch ein Element von B ist. In diesem Fall bezeichnet man auch B als Obermenge von A (B ⊇ A). Will man zum Ausdruck bringen, dass dabei A mit B nicht übereinstimmt, so schreibt man A ( B. Schreibweisen wie A , B, A ) B, o.ä. sind dann selbsterklärend. Einer bestimmten Menge werden wir oft begegnen, nämlich der leeren Menge ∅, also der Menge, die keine Elemente enthält. Man beachte zum Beispiel, dass die Menge {a, b, c} gleich der Menge {c, a, b, a} ist, und dass z.B. die Menge {1, 3, 5, . . . } mit {x : x ist ungerade natürliche Zahl} übereinstimmt. Hat man zwei oder mehrere Mengen, so kann man diese in verschiedener Weise miteinander verknüpfen. 1 KAPITEL 1. MENGEN UND ABBILDUNGEN 2 1.1.3 Definition. Seien A und B zwei Mengen: Die Menge A ∪ B = {x : x ∈ A oder x ∈ B} heißt die Vereinigungsmenge von A und B. Für A ∪ B sagt man kurz auch A vereinigt B. Die Menge A ∩ B = {x : x ∈ A und x ∈ B} heißt die Schnittmenge von A und B. Man sagt kurz auch A geschnitten B. Die Menge B \ A = {x : x ∈ B und x < A} ist die Differenz von B und A. Man sagt kurz auch B ohne A. Betrachtet man Teilmengen A einer fixen Grundmenge M, so schreiben wir auch Ac für M \ A und nennen es das Komplement von A in M, kurz A Komplement. A × B := {(x, y) : x ∈ A, y ∈ B} das kartesische Produkt der Mengen A und B. Das ist also die Menge, deren Elemente die geordneten Paare sind, deren erste Komponente zu A und deren zweite Komponente zu B gehört1 . Für A×A schreibt man auch A2 . Auch Durchschnitt und Vereinigung von mehr als zwei Mengen kann man analog definieren. Ist Mi , i ∈ I, eine Familie von Mengen, durchindiziert mit der Indexmenge I, so ist \ Mi := {x : x ∈ Mi für alle i ∈ I}, [ i∈I i∈I Mi := {x : es gibt ein i ∈ I mit x ∈ Mi }. Das kartesische Produkt endlich vieler Mengen ist analog wie jenes für zwei Mengen erklärt. Zum Beispiel ist A × B × C := {(x, y, z) : x ∈ A, y ∈ B, z ∈ C}. Für A × A × A schreibt man A3 , u.s.w. 1.1.4 Beispiel. Einfache Beispiele für Durchschnitts- bzw. Vereinigungsbildung wären: {1, 2, 3} ∩ {−1, 0, 1} = {1}, {a, b, 7} ∩ {3, 4, x} = ∅, {2, 3, 4, 5} ∪ {4, 5, 6, 7} = {2, 3, 4, 5, 6, 7}, {a, b, c} ∪ ∅ = {a, b, c}. Ist M2 = {x ∈ Z : es gibt ein y ∈ Z, sodass x = 2y}, so wäre Z \ M2 gerade die Menge der ungeraden ganzen Zahlen. Weiters ist {1, 2, 3, 4} \ {4, 5, 6, 7} = {1, 2, 3}, {a, b, c} \ ∅ = {a, b, c}. Bezeichnet man mit 2N die Menge der geraden natürlichen Zahlen, so ist das kartesische Produkt N × 2N die Menge N × 2N = {(1, 2), (1, 4), . . ., (2, 2), (2, 4), . . ., (3, 2), (3, 4), . . .}. 1 Anm.: Ist x , y, so ist (x, y) , (y, x). 1.1. MENGEN 3 1.1.5 Definition. Ist M eine Menge, so bezeichnet man mit P(M) die Menge aller Teilmengen von M, P(M) = {A : A ⊆ M}. Diese Menge heißt die Potenzmenge von M. Sie ist also die Menge, deren Elemente alle Teilmengen von M sind. 1.1.6 Beispiel. Ist M = {1, 2, 3}, dann ist die Potenzmenge P(M) gleich P(M) = {∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}}. Die Potenzmenge der Menge N ist schon viel zu groß um sie noch in irgendeiner aufzählenden Weise anschreiben zu können. Sie enthält ja neben Mengen des Typs {1, 2, 3}, {4, 6, 7, 8, 1004} usw. auch noch unendliche Mengen wie zum Beispiel 2N oder {n ∈ N : n ≥ 27} und viele mehr. 1.1.7 Bemerkung. Für das Verknüpfen von Mengen gelten diverse Rechenregeln. Es gilt zum Beispiel das Distributivgesetz für drei Mengen A, B, C: A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C), (1.1) A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C). Um z.B. (1.1) nachzuweisen beachte man, dass zwei Mengen übereinstimmen, wenn ein beliebiges Element x genau dann in der einen Menge ist, wenn es auch in der anderen Menge ist: Ein x liegt in A ∩ (B ∪ C) genau dann, wenn x ∈ A und x ∈ B ∪ C. Das ist gleichbedeutend mit: x ∈ A, und x liegt zumindest in einer der Mengen B bzw. C. Diese Aussage ist aber äquivalent zu: Zumindest eine der Aussagen - x ∈ A und x ∈ B - oder - x ∈ A und x ∈ C - trifft zu. Nun ist das dasselbe, wie: x ∈ A ∩ B oder x ∈ A ∩ C. Schließlich gilt das genau dann, wenn x ∈ (A ∩ B) ∪ (A ∩ C). Den an einem kleinen Abriss des axiomatischen Zugangs zur Mengenlehre interessierten Leser möchte ich hier an die Vorlesung Lineare Algebra verweisen. KAPITEL 1. MENGEN UND ABBILDUNGEN 4 1.2 Funktionen 1.2.1 Definition. Seien M und N Mengen. Eine Teilmenge f ⊆ M × N heißt eine Funktion von M nach N, wenn gilt (i) Für alle x ∈ M gibt es ein y ∈ N : (x, y) ∈ f , (ii) Sind (x, y1 ) ∈ f und (x, y2 ) ∈ f , so folgt y1 = y2 . Die Bedingung (i) besagt, dass jedem x (mindestens) ein Funktionswert y zugeordnet wird, man sagt auch f ist überall definiert. Die Bedingung (ii) besagt, dass einem x höchstens ein Funktionswert zugeordnet wird. Man sagt auch f sei wohldefiniert. Insgesamt hat man also: Eine Funktion von M nach N ist eine (wie auch immer geartete) Vorschrift, durch die jedem Element x aus der Menge M in eindeutiger Weise ein Element y aus der Menge N zugeordnet wird. Man schreibt y = f (x) und bezeichnet y als den Funktionswert von f an der Stelle x. Anstelle des Namens Funktion“ ” gebraucht man auch den Namen Abbildung. Klarerweise stimmen zwei Funktionen f und g von M nach N überein, also f = g, genau dann, wenn f (x) = g(x) für alle x ∈ M. Sieht man eine Funktion eher als Abbildungsvorschrift, dann unterscheidet man - obwohl mathematisch das Gleiche - die Funktion als Abbildungsvorschrift und die Funktion als Teilmenge von M × N, und man bezeichnet diese Teilmenge von M × N auch als Graph graph f von f . Da für eine Funktion der einem Wert zugeordnete Funktionswert ja eindeutig bestimmt ist, schreibt man eine Funktion f von M nach N auch oft an als ( M → N f : . x 7→ f (x) 1.2.2 Definition. Ist M eine Menge, so heißt die Abbildung ( M → M idM : x 7→ x die identische Abbildung auf der Menge M. Daher id M : M → M mit id M (x) = x. 1.2.3 Beispiel. Sei M die Menge aller Wörter in einem Wörterbuch. N = {1, 2, . . . } sei die Menge der natürlichen Zahlen. Sei nun f jene Funktion auf M, die jedem Wort die Anzahl seiner Buchstaben zuweist. Also z.B. f (’gehen’) = 5. 1.2.4 Beispiel. Wir haben im Abschnitt über Familien von Mengen Mi , i ∈ I, gesprochen, ohne genau zu sagen, was das bedeutet. Das ist nämlich die Funktion i 7→ Mi von der Indexmenge I in die Potenzmenge P(M), wobei M eine hinreichend große Menge ist, die alle Mengen Mi enthält, z.B. M = ∪i∈I Mi . 1.2.5 Bemerkung. In manchen Zusammenhängen betrachtet man auch Funktionen, die nicht überall definiert sind. Das sind Teilmengen von f ⊆ M × N, die nur die Eigenschaft (ii) aus Definition 1.2.1 haben, d.h. dass es zu jedem Wert x ∈ M höchstens einen 1.2. FUNKTIONEN 5 Funktionswert (d.h. keinen oder genau einen) y ∈ N gibt. Man muss dann zusätzlich den Definitionsbereich dom f (vom englischen Wort domain) der Funktion angeben: dom f = {x ∈ M : es gibt ein y ∈ N, sodass (x, y) ∈ f }. Der Wertebereich ran f (vom englischen Wort range) einer Funktion f ist die Menge ran f = {y ∈ N : es gibt ein x ∈ M, sodass (x, y) ∈ f }. Betrachte zum Beispiel f := {(x, y) ∈ N2 : x = 2y}. (1.2) Offenbar ist dieses f eine nur auf der Menge der geraden Zahlen definierte Funktion. 1.2.6 Definition. Sei f eine Funktion von M nach N und sei A ⊆ M. Die Funktion, die jedem x ∈ A den Funktionswert f (x) zuweist, heißt Einschränkung von f auf A und wird mit f |A bezeichnet. Also f |A = {(x, y) ∈ f : x ∈ A}. Ist umgekehrt g eine Funktion von A nach N und M ⊇ A, so heißt eine Funktion f : M → N Fortsetzung von g, falls g = f |A . 1.2.7 Definition. Für eine Teilmenge A von M bezeichne f (A) = {y ∈ N : es gibt ein x ∈ A, sodass f (x) = y}, das Bild der Menge A unter der Abbildung f . Klarerweise ist ran f = f (M). Ist y ∈ N, und ist x ∈ M, sodass y = f (x), so bezeichnet man x als ein Urbild von y. Das vollständige Urbild einer Teilmenge B von N ist die Menge f −1 (B) := {x ∈ M : f (x) ∈ B}. 1.2.8 Bemerkung. Ist f : M → N eine Funktion, und ist B ⊆ N mit f (M) ⊆ B, so kann man f auch als Funktion von M nach B betrachten. 1.2.9 Beispiel. Betrachte zum Beispiel die Funktion n 7→ 2n von N in N. Natürlich kann man auch n 7→ 2n als Funktion von N in die Menge aller geraden natürlichen Zahlen betrachten. Folgende Begriffsbildung ist auf den ersten Blick nicht allzu kompliziert. Sie spielt aber in der Mathematik eine ganz wichtige Rolle. 1.2.10 Definition. Sei f : M → N eine Funktion. f heißt injektiv, wenn gilt f (x1 ) = f (x2 ) ⇒ x1 = x2 , d.h. zu jedem Wert y ∈ N gibt es höchstens ein Urbild. Äquivalent dazu ist, dass aus x1 , x2 folgt, dass f (x1 ) , f (x2 ). surjektiv, wenn es zu jedem y ∈ N ein x ∈ M gibt, sodass f (x) = y, oder äquivalent ausgedrückt: für alle y ∈ N : f −1 ({y}) , ∅. D.h. also, dass jedes Element von N wirklich als Funktionswert von f auftritt: ran f = N. Eine Funktion, die sowohl injektiv als auch surjektiv ist, bezeichnet man als bijektiv. KAPITEL 1. MENGEN UND ABBILDUNGEN 6 1.2.11 Bemerkung. Man beachte, dass die Eigenschaft surjektiv, und somit auch bijektiv, zu sein, ganz wesentlich vom betrachteten Bildbereich der Funktion f abhängt. Denn ist etwa f : M → N eine beliebige Funktion, und betrachtet man f als Funktion von M nach f (M) und nicht nach N, so ist f : M → f (M) immer surjektiv. Vergleiche auch Bemerkung 1.2.8. 1.2.12 Beispiel. Folgende drei Beispiele zeigen insbesondere, dass keine der beiden Eigenschaften injektiv und surjektiv zu sein, die jeweils andere impliziert. Sei A die Menge aller in Österreich amtlich registrierten Staatsbürger, und sei f jene Funktion, die einer Person aus A ihre Sozialversicherungsnummer zuordnet. Dann ist f : A → N keine surjektive (es gibt ja nur endlich viele Österreicher), aber sehr wohl eine injektive Funktion, da zwei verschiedene Personen auch zwei verschiedene Sozialversicherungsnummern haben. Die Funktion g : A → N, die jeder Person ihre Körpergröße in Zentimeter (gerundet) zuordnet, ist weder injektiv noch surjektiv. Sei h : N → N die Funktion, die einer Zahl (dargestellt im Dezimalsystem) ihre Ziffernsumme zuordnet. Diese Funktion ist nicht injektiv (h(11) = 2 = h(2)), aber sie ist surjektiv, denn ist n ∈ N, so gilt sicherlich h(11 . . .} 1) = n. | {z n Stellen 1.2.13 Lemma. Sei f eine Funktion von M nach N. Ist f bijektiv, so ist f −1 = {(y, x) ∈ N × M : (x, y) ∈ f } eine Funktion von N nach M. Beweis. Ist y ∈ N, dann existiert ein x ∈ M mit y = f (x), da f surjektiv ist. Also ist die Forderung (i) von Definition 1.2.1 für f −1 erfüllt. Um auch (ii) nachzuprüfen, sei (y, x1 ), (y, x2 ) ∈ f −1 . Dann sind (x1 , y), (x2 , y) ∈ f und wegen der Injektivität von f folgt x1 = x2 . ❑ 1.2.14 Bemerkung. Man sieht am obigen Beweis, dass die Inverse f −1 einer injektiven Funktion f eine nicht notwendig überall definierte Funktion ist. Ihr Definitionsbereich ist gerade ran f . Ist dagegen f nicht injektiv, so ist f −1 nicht einmal mehr eine nicht überall definierte Funktion. Durch unmittelbares Nachprüfen der Definition sieht man, dass die Zusammensetzung von Funktionen wieder eine Funktion ist. 1.2.15 Definition. Seien f : M → N und g : N → P Funktionen. Dann bezeichne g ◦ f jene Funktion von M nach P, die durch (g ◦ f )(x) = g( f (x)), x ∈ M, definiert ist. Man bezeichnet g ◦ f oft auch als die zusammengesetzte Funktion oder als die Hintereinanderausführung von f und g. 1.2. FUNKTIONEN 7 1.2.16 Bemerkung. Man kann g ◦ f auch als {(x, z) : ∃y ∈ N, (x, y) ∈ f, (y, z) ∈ g} (1.3) schreiben. Ist f eine Abbildung von M nach N, so gilt immer f = f ◦ id M = idN ◦ f . Das Hintereinanderausführen ist assoziativ: Sind f : M → N, g : N → P und h : P → Q Funktionen so gilt (x ∈ M) ((h ◦ g) ◦ f )(x) = (h ◦ g)( f (x)) = h(g( f (x))) = h((g ◦ f )(x)) = (h ◦ (g ◦ f ))(x). Also gilt (h ◦ g) ◦ f = h ◦ (g ◦ f ). Als Konsequenz schreiben wir auch h ◦ g ◦ f dafür. 1.2.17 Bemerkung. Sind f und g nicht mehr überall definiert, so muss man bei der Komposition darauf achten, dass die Definitionsbereiche so zusammenpassen, dass der Bildbereich von f im Definitionsbereich von g enthalten ist. 1.2.18 Satz. Eine Funktion f : M → N ist genau dann bijektiv, wenn es eine Funktion g : N → M gibt mit g ◦ f = id M , f ◦ g = idN . In diesem Fall gilt g = f −1 . Ist h : N → P ebenfalls bijektiv, so gilt weiters (h ◦ f )−1 = f −1 ◦ h−1 . Beweis. Sei zunächst f bijektiv. Offenbar gilt ( f −1 ◦ f )(x) = x, x ∈ M, und ( f ◦ f −1 )(y) = y, y ∈ N. Also hat die Funktion g = f −1 alle im Satz geforderten Eigenschaften. Sei nun die Existenz einer Funktion g mit den genannten Eigenschaften vorausgesetzt. Ist y ∈ N, so setze x = g(y), dann gilt f (x) = f (g(y)) = idN (y) = y. D.h. f ist surjektiv. Ist f (x1 ) = f (x2 ), so folgt x1 = g( f (x1 )) = g( f (x2 )) = x2 . Also ist f auch injektiv. Schließlich: g = id M ◦g = ( f −1 ◦ f ) ◦ g = f −1 ◦ ( f ◦ g) = f −1 ◦ idN = f −1 . Die Funktion e := f −1 ◦ h−1 erfüllt wegen der Assoziativität der Hintereinanderausführung e ◦ (h ◦ f ) = f −1 ◦ (h−1 ◦ h) ◦ f = f −1 ◦ idN ◦ f = f −1 ◦ f = id M , sowie (h ◦ f ) ◦ e = h ◦ ( f ◦ f −1 ) ◦ h−1 = h ◦ idN ◦h−1 = h ◦ h−1 = idP . Nach dem ersten Teil des Satzes gilt e = (h ◦ f )−1 . ❑ 8 KAPITEL 1. MENGEN UND ABBILDUNGEN Kapitel 2 Die reellen Zahlen Die reellen Zahlen sind eine Menge, die uns anschaulich schon aus der Schule bekannt ist. Wir wollen im Folgenden die charakteristischen Eigenschaften der reellen Zahlen sammeln, von denen wir dann sehen werden, dass diese die reellen Zahlen (bis auf isomorphe Kopien) eindeutig bestimmen. Dass es die reellen Zahlen (also eine Menge mit den charakteristischen Eigenschaften) unter der Annahme der Gültigkeit der Mengenlehre überhaupt gibt, werden wir auch später sehen. 2.1 Algebraische Struktur der reellen Zahlen Zuerst wollen wir uns den Operationen + und ·, also der algebraischen Struktur, zuwenden. Die reellen Zahlen mit diesen Operationen sind ein so genannter Körper: 2.1.1 Definition. Sei K eine nichtleere Menge, und es seien Abbildungen (Verknüpfungen) + : K × K → K (Addition) und · : K × K → K (Multiplikation) gegeben. Das Tripel hK, +, ·i heißt Körper, falls folgende Gesetze gelten. Wir schreiben dabei x + y für +(x, y) und x · y für ·(x, y). (A1) Die Addition ist assoziativ: (x + y) + z = x + (y + z), x, y, z ∈ K. (A2) Es existiert ein neutrales Element 0 ∈ K bezüglich +: x + 0 = x, x ∈ K. (A3) Jedes Element x ∈ K besitzt ein Inverses −x ∈ K bezüglich +: x + (−x) = 0. (A4) Die Addition ist kommutativ: x + y = y + x, x, y ∈ K. 9 KAPITEL 2. DIE REELLEN ZAHLEN 10 (M1) Die Multiplikation ist assoziativ: (x · y) · z = x · (y · z), x, y, z ∈ K. (M2) Es existiert ein neutrales Element 1 ∈ K \ {0} bezüglich ·: x · 1 = x, x ∈ K \ {0}. (M3) Jedes von 0 verschiedene Element x besitzt ein Inverses bezüglich ·: x · x−1 = 1. (M4) Die Multiplikation ist kommutativ: x · y = y · x, x, y ∈ K. (D) Es gilt das Distributivgesetz: x · (y + z) = (x · y) + (x · z), x, y, z ∈ K. 2.1.2 Bemerkung. Da hK, +i und hK \ {0}, ·i Gruppen sind, folgt, dass die jeweiligen neutralen Elemente 0 bzw. 1 eindeutig bestimmt sind: Wäre etwa 0̃ ein weiters neutrales Element bezüglich +, so folgte aus (A2) und (A4), dass 0 = 0̃ + 0 = 0̃. Dasselbe gilt für die Inversen −a und a−1 . Wäre etwa ã ein weiteres additiv Inverses zu a, also a + ã = 0, so folgte ã = ã + (a + (−a)) = (ã + a) +(−a) = 0 + (−a) = −a. | {z } | {z } =0 =0 Somit ist x 7→ −x eine - wie aus untenstehenden Rechenregeln folgt - bijektive Funktion von K auf sich selbst und x 7→ x−1 eine bijektive Funktion von K \ {0} auf sich selbst. Siehe dazu die Lineare Algebra Vorlesung. 2.1.3 Beispiel. Man betrachte die Menge K = {≬, ⋔}. Die Verknüpfungen + und · seien gemäß folgender Verknüpfungstafeln definiert. + ≬ ⋔ ≬ ≬ ⋔ ⋔ ⋔ ≬ · ≬ ⋔ ≬ ≬ ≬ ⋔ ≬ ⋔ Man erkennt unschwer, dass alle Anforderungen an einen Körper, d.h. Axiome (A1) − (A4), (M1) − (M4), (D), erfüllt sind, wobei ≬ des neutrale 0 Element bezüglich + und ⋔ des neutrale Element 1 bezüglich · ist. Es sei noch bemerkt, dass jeder Körper mindestens zwei Elemente hat, und somit der hier vorgestellte Körper kleinst möglich ist. 2.2. ORDNUNGSSTRUKTUR DER REELLEN ZAHLEN 11 Wir werden xy für x · y und, falls y , 0, für xy−1 oft yx schreiben. Um Klammern zu sparen, wollen wir auch übereinkommen, dass Punkt- vor Strichrechnung kommt (xy + xz = (xy) + (xz)). Schließlich werden wir für x + (−y) bzw. (−x) + y auch x − y bzw. −x + y schreiben. Aus obigen Gesetzen für einen Körper leitet man in elementarer Weise folgende Rechenregeln her: 2.1.4 Lemma. Es gelten folgende Rechenregeln: (i) Die Inverse von der Inversen ist die Zahl selbst: −(−x) = x, x ∈ K und (x−1 )−1 = x, x ∈ K \ {0}. (ii) −(x + y) = (−x) + (−y), x, y ∈ K. (iii) x, y , 0 ⇒ x · y , 0 und (xy)−1 = x−1 y−1 , sowie (−x)−1 = −(x−1 ). Insbesondere (−1)(−1) = 1. (iv) x · 0 = 0, x(−y) = −xy, (−x)(−y) = xy, x(y − z) = xy − xz. (v) ac bd = ac bd . Beweis. Exemplarisch wollen wir −(x + y) = (−x) + (−y) nachweisen: Es gilt wegen dem Kommutativgesetz und Assoziativgesetz (x + y) + ((−x) + (−y)) = ((x + y) + (−x)) + (−y) = ((y + x) + (−x)) + (−y) = (y + (x + (−x))) + (−y) = ((y + 0) + (−y)) = y + (−y) = 0. Also ist (−x) + (−y) eine additiv Inverse von x + y. Wegen Bemerkung 2.1.2 ist diese additiv Inverse aber eindeutig. Also (−x) + (−y) = −(x + y). ❑ Schließlich wollen wir noch einige Schreibweisen festlegen: Ist A Teilmenge unseres Körpers K, so sei −A = {−a : a ∈ A}. Also ist −A das Bild von A unter der Abbildung −. Sind A, B ⊆ K, so sei A + B = {a + b : a ∈ A, b ∈ B}. Somit ist A + B das Bild von A × B(⊆ K × K) unter der Abbildung +. Entsprechend seien A−1 , A − B, etc. definiert. 2.2 Ordnungsstruktur der reellen Zahlen Eine weitere wichtige Eigenschaft der reellen Zahlen, wie aus der Schule bekannt, ist die, dass man je zwei Zahlen x und y der Größe nach vergleichen kann. Dabei ist bekannterweise x < y genau dann, wenn y − x eine positive reelle Zahle ist. Um diesen Sachverhalt mathematisch zu fassen, definieren wir 2.2.1 Definition. Sei hK, +, ·i ein Körper und sei P ⊆ K. Dann heißt K (streng genommen hK, +, ·, Pi) ein angeordneter Körper, wenn gilt KAPITEL 2. DIE REELLEN ZAHLEN 12 1 ˙ ∪(−P), ˙ (P1) Es gilt K = P∪{0} wobei P, −P disjunkt sind (ihr Schnitt ist die leere Menge), und beide 0 nicht enthalten. (P2) x, y ∈ P ⇒ x + y ∈ P. (P3) x, y ∈ P ⇒ xy ∈ P Die Menge P heißt die Menge der positiven Zahlen. Seien x, y ∈ K. Wir sagen, dass x kleiner als y ist, in Zeichen x < y, wenn y − x ∈ P. x größer als y ist, in Zeichen x > y, wenn x − y ∈ P. x kleiner oder gleich y ist, in Zeichen x ≤ y, wenn x < y ∨ x = y. x größer oder gleich y ist, in Zeichen x ≥ y, wenn x > y ∨ x = y. 2.2.2 Lemma. In einem angeordneten Körper K gelten für beliebige a, b, x, y, z ∈ K folgende Regeln: (i) x ≤ x (Reflexivität). (ii) (x ≤ y ∧ y ≤ x) ⇒ x = y (Antisymmetrie). (iii) (x ≤ y ∧ y ≤ z) ⇒ x ≤ z (Transitivität). (iv) x ≤ y ∨ y ≤ x (Totalität). (v) (x ≤ y ∧ a ≤ b) ⇒ x + a ≤ y + b. (vi) x ≤ y ⇒ −x ≥ −y. (vii) (z > 0 ∧ x ≤ y) ⇒ xz ≤ yz und (z < 0 ∧ x ≤ y) ⇒ xz ≥ yz. (viii) x , 0 ⇒ x2 > 0. Insbesondere: 1 > 0. (ix) x > 0 ⇒ x−1 > 0 und x < 0 ⇒ x−1 < 0. (x) 0 < x ≤ y ⇒ ( yx ≤ 1 ≤ y x ∧ x−1 ≥ y−1 ). (xi) (0 < x ≤ y ∧ 0 < a ≤ b) ⇒ xa ≤ yb. (xii) x < y ⇒ x < x+y 2 < y, wobei 2 := 1 + 1. Beweis. Wir beweisen exemplarisch (ii), (iii), (viii) und (xii): (ii): (x ≤ y ∧ y ≤ x) ist per Definitionem dasselbe, wie y − x ∈ P ∪ {0} ∧ x − y ∈ P ∪ {0}. Also y − x ∈ (P ∪ {0}) ∩ (−P ∪ {0}) = {0}, und damit x = y. (iii): (x ≤ y ∧ y ≤ z) ⇔ (y − x ∈ P ∪ {0} ∧ z − y ∈ P ∪ {0}). Aus (P2) folgt z − x = (z − y) + (y − x) ∈ P ∪ {0}, also x ≤ z. (viii): Aus x , 0 folgt x ∈ P ∪ −P. Ist x ∈ P, so folgt wegen (P3), dass x2 = xx ∈ P und damit x2 > 0. Ist x ∈ −P, so folgt −x ∈ P und wieder wegen (P3), dass x2 = xx = (−x)(−x) ∈ P. 1 Der Punkt über ∪ soll die Disjunktheit der Mengen anzeigen. 2.2. ORDNUNGSSTRUKTUR DER REELLEN ZAHLEN 13 (xii): Aus x < y und (v) folgt x + x < x + y < y + y. Nun ist wegen dem Distributivgesetz x + x = x(1 + 1) und y + y = y(1 + 1). Da wegen (P2), 1 + 1 ∈ P, folgt aus (vii), dass x < x+y 2 < y. ❑ 2.2.3 Bemerkung. Die Eigenschaften (i)−(iii) besagen genau, dass ≤ eine Halbordnung auf K ist. Eigenschaft (iv) bedeutet dann, dass diese Halbordnung sogar eine Totalordnung ist. Man kann also einen angeordneten Körper als Gerade veranschaulichen, wobei eine Zahl x genau dann links von einer anderen Zahl y liegt, wenn sie kleiner ist: 0 x K y Abbildung 2.1: Zahlengerade 2.2.4 Definition. Sei K eine Menge und ≤ eine Totalordnung darauf. Sind x, y ∈ K, so sei max(x, y) das Maximum von x und y. Also max(x, y) = x, falls x ≥ y, und max(x, y) = y falls y ≥ x. Entsprechend definiert man das Minimum min(x, y) zweier Zahlen. Ist A ⊆ K, und gibt es ein a0 ∈ A, sodass a ≤ a0 (a0 ≤ a) für alle a ∈ A, so nennt man a0 das Maximum (Minimum) von A, und schreibt a0 = max A (a0 = min A). Zum Maximum (Minimum) sagt man auch größtes (kleinstes) Element. Ist A ⊆ K, so heißt A nach oben beschränkt, falls es ein x ∈ K gibt, sodass A ≤ x, sodass also a ≤ x für alle a ∈ A. Jedes x ∈ K mit A ≤ x heißt dabei obere Schranke von A. Entsprechend heißt eine Teilmenge A nach unten beschränkt, wenn es eine untere Schranke in K hat, wenn also x ≤ A für ein x ∈ K. Eine nach oben und nach unten beschränkte Teilmenge heißt beschränkt. Sei A ⊆ K eine nach oben (unten) beschränkte Teilmenge. Hat die Menge {x ∈ K : A ≤ x} ({x ∈ K : x ≤ A}) aller oberen (unteren) Schranken von A ein Minimum (Maximum), so heißt dieses Supremum (Infimum) von A und wird mit sup A (inf A) bezeichnet. Die Tatsache, dass eine Menge A ⊆ K nicht nach oben (nicht unten) beschränkt ist wollen wir mit sup A = +∞ (inf A = −∞) zum Ausdruck bringen. obere Schranken von M M sup M Abbildung 2.2: Supremum der Menge M KAPITEL 2. DIE REELLEN ZAHLEN 14 2.2.5 Bemerkung. Man sieht leicht, dass jedes Maximum (Minimum) einer Teilmenge auch Supremum (Infimum) dieser Teilmenge ist. Die Umkehrung gilt im Allgemeinen nicht. Es kann auch vorkommen, dass eine beschränkte Teilmenge von K weder ein Supremum, noch ein Infimum hat. 2.2.6 Bemerkung. Wenn das Supremum einer Teilmenge A existiert, so gilt gemäß der Definition A ≤ sup A, und sup A ≤ x für alle oberen Schranken x von A. Ist umgekehrt y ∈ K mit A ≤ y und y ≤ x für alle oberen Schranken x von A, so folgt aus A ≤ y, dass y eine obere Schranke von A ist, und aus der zweiten Voraussetzung, dass y das Minimum der oberen Schranken von A ist. Also ist y = sup A. Entsprechendes lässt sich für das Infimum sagen. 2.2.7 Lemma. Ist A ⊆ B ⊆ K, so gilt (i) {x ∈ K : A ≤ x} ⊇ {x ∈ K : B ≤ x} und {x ∈ K : x ≤ A} ⊇ {x ∈ K : x ≤ B}. (ii) Haben A und B ein Maximum (Minimum), so folgt max A ≤ max B (min A ≥ min B). (iii) Haben A und B ein Supremum (Infimum), so folgt sup A ≤ sup B (inf A ≥ inf B). Beweis. (i) t ∈ {x ∈ K : B ≤ x} bedingt b ≤ t für alle b ∈ B. Wegen A ⊆ B gilt auch a ≤ t für alle a ∈ A, und daher t ∈ {x ∈ K : A ≤ x}. Die zweite Mengeninklusion beweist man genauso. (ii) Das Maximum von B erfüllt definitionsgemäß max B ≥ b für alle b ∈ B, und damit insbesondere max B ≥ a für alle a ∈ A. Wegen max A ∈ A folgt insbesondere max B ≥ max A. Analog zeigt man min A ≥ min B. (iii) Definitionsgemäß haben wir sup A = min{x ∈ K : A ≤ x} und sup B = min{x ∈ K : B ≤ x}. Nach (i) ist {x ∈ K : B ≤ x} ⊆ {x ∈ K : A ≤ x} und daher nach (ii) sup A = min{x ∈ K : A ≤ x} ≤ min{x ∈ K : B ≤ x} = sup B. ❑ Ist K ein angeordneter Körper, so gelten für die oben eingeführten Begriffe einfache Rechenregeln: (i) Aus x ≤ A ⇔ −x ≥ −A folgt, dass A ⊆ K genau dann nach oben (unten) beschränkt ist, wenn −A nach unten (oben) beschränkt ist. (ii) min(−A) = − max A, max(−A) = − min A, (iii) inf(−A) = − sup(A), sup(−A) = − inf(A). Diese Gleichheiten gelten in dem Sinn, dass die linke Seite des Gleichheitszeichen genau dann existiert, wenn die rechte existiert. 2.2. ORDNUNGSSTRUKTUR DER REELLEN ZAHLEN 15 2.2.8 Beispiel. Seien a, b ∈ K. Dann definiert man die Intervalle (a, b) := {x ∈ K : a < x < b}, (a, b] := {x ∈ K : a < x ≤ b}, und entsprechend [a, b] := {x ∈ K : a ≤ x ≤ b}, [a, b) := {x ∈ K : a ≤ x < b}. Außerdem setzt man (+∞, −∞ sind hier nur formale Ausdrücke) (−∞, b) := {x ∈ K : x < b}, (−∞, b] := {x ∈ K : x ≤ b}, (a, +∞) := {x ∈ K : a < x}, [a, +∞) := {x ∈ K : a ≤ x}. Ist a < b, so sind die Mengen (a, b), [a, b], (a, +∞) z.B. nach unten beschränkt. Nach oben beschränkt sind dagegen nur die ersten beiden. Die Mengen (a, b), (a, b] haben das Supremum b, aber nur für die Menge (a, b] ist b ein Maximum. Um etwa einzusehen, dass b = sup(a, b) argumentiert man folgendermaßen: Zunächst ist wegen der Definition von Intervallen x ≤ b für alle x ∈ (a, b), also (a, b) ≤ b. Angenommen es gäbe eine obere Schranke y von (a, b) mit y < b. Im Falle y ≤ a wäre y ≤ a < a+b 2 < b (vgl. Lemma 2.2.2, (xii)), womit aber y keine obere Schranke sein kann, da a+b 2 ∈ (a, b). Im Falle a < y wäre a < y < y+b 2 < b, womit wiederum y keine obere Schranke sein ∈ (a, b). kann, da y+b 2 Also ist b tatsächlich die kleinste obere Schranke von (a, b), sup(a, b) = b. 2.2.9 Beispiel. Dem Begriff der rationalen Zahlen vorgreifend seien K die rationalen Zahlen und sei M = {x ∈ K : x2 < 2}. Dann hat diese Menge weder Maximum noch Supremum, obwohl sie nach oben beschränkt ist. Siehe dazu Satz 2.7.5. Wir wollen noch zwei elementare Funktionen auf einem angeordneten Körper betrachten: 2.2.10 Definition. Sei hK, +, ·, Pi ein angeordneter Körper. Die Signumfunktion sgn sei jene Funktion von K nach K, sodass für x ∈ K 1 0 sgn(x) = −1 , , , x∈P x=0 . x ∈ −P Für x , 0 heißt sgn(x) auch das Vorzeichen von x. Die Betragsfunktion |.| : K → K ist definiert durch ( x , x ∈ P ∪ {0} |x| = . −x , x ∈ −P Sind x, y ∈ K, so bezeichnet man |x − y| auch als den Abstand von x und y. 2.2.11 Lemma. Für x, y ∈ K gilt: KAPITEL 2. DIE REELLEN ZAHLEN 16 (i) |x| = sgn(x)x. (ii) |xy| = |x||y|. (iii) |x + y| ≤ |x| + |y| (Dreiecksungleichung). (iv) |x + y| ≥ ||x| − |y|| (Dreiecksungleichung nach unten). (v) max(x, y) = x+y+|x−y| , 2 min(x, y) = x+y−|x−y| . 2 Beweis. (i) und (ii) folgen ganz leicht, wenn wir die Fälle x > 0, x = 0, x < 0 unterscheiden. Die Dreiecksungleichung folgt unmittelbar, wenn eine der Zahlen x oder y Null ist. Sonst unterscheiden wir folgende zwei Fälle: sgn(x) = sgn(y) , 0 ⇒ |x + y| = | sgn(x)(|x| + |y|)| = |x| + |y| sgn(x) = − sgn(y) , 0 ⇒ |x + y| = | sgn(x)(|x| − |y|)| = ||x| − |y|| ≤ |x| + |y| Letztere Ungleichung gilt, da sowohl |x| − |y| ≤ |x| + |y|, als auch −(|x| − |y|) = |y| − |x| ≤ |x| + |y|. Um die Dreiecksungleichung nach unten einzusehen, bemerke |x| = |(x + y) + (−y)| ≤ |x + y| + |y|, (2.1) also |x| − |y| ≤ |x + y|. Analog folgt |y| ≤ |x + y| + |x|, also auch |y| − |x| ≤ |x + y|. Mit einer ähnlichen Fallunterscheidung beweist man die Aussage (v). ❑ 2.3 Die natürlichen Zahlen Von den bisher vorgestellten Objekten (Körper, angeordneter Körper) ist noch nicht bekannt, ob es sie überhaupt gibt. Um solche Objekte zu konstruieren, wenden wir uns zunächst den natürlichen Zahlen zu. Die natürlichen Zahlen sind uns als Objekt des Alltages wohlvertraut, aber ihre Existenz als mathematisches Objekt ist keine Trivialität. Trotzdem wollen wir diese voraussetzen. In der Tat folgt sie aus den Axiomen der Mengenlehre. 2.3.1 Definition. Die natürlichen Zahlen sind eine Menge N, in der ein Element 1 ∈ N ausgezeichnet ist,2 und auf der eine Funktion (Nachfolgerabbildung) ′ : N → N definiert ist, sodass gilt (S1) ′ ist injektiv. (S2) Es gibt kein n ∈ N mit n′ = 1. (S3) Ist M ⊆ N, 1 ∈ M und m′ ∈ M für alle m ∈ M, so ist M = N. 2 Die Bezeichnung 1 hat zumindest zum gegenwärtigen Zeitpunkt nichts mit der gleichlautenden Bezeichnung für das multiplikative neutrale Element in einem Körper zu tun. 2.3. DIE NATÜRLICHEN ZAHLEN 17 Für n′ wollen wir auch n + 1 schreiben. 2.3.2 Bemerkung. Wir wollen anmerken, dass wir weder die Abbildungen +, ·, die N × N nach N abbilden, noch die Möglichkeit zwei natürliche Zahlen der Größe nach zu ordnen, zur Verfügung haben. Obige Festlegung, dass n′ = n + 1 ist nur symbolisch zu verstehen. Ehe wir uns an die Definition von Addition und Multiplikation machen, wollen wir P uns die Möglichkeit schaffen, Ausdrücke, wie nx, xn , nk=1 c(k) für n ∈ N zu definieren, wenn z.B. x und c(k) für k ∈ N Elemente eines Körpers sind. Alle diese Ausdrücke haben gemein, dass sie Funktionen n 7→ φ(n) auf N sind, wobei φ(1) bekannt ist, und wobei φ(n′ ) bekannt ist, wenn φ(n) es ist. Im Falle von ′ n 7→ xn ist etwa x1 = x und xn = xn · x. Um einzusehen, warum solche Funktionen eindeutig definiert sind, zeigen wir folgenden Satz: 2.3.3 Satz (Rekursionssatz). Sei A eine Menge, a ∈ A, g : A → A (Rekursionsfunktion). Dann existiert genau eine Abbildung φ : N → A mit φ(1) = a und φ(n′ ) = g(φ(n)). Beweis. Betrachte alle Teilmengen H ⊆ N × A mit den Eigenschaften (i) (1, a) ∈ H (ii) Ist (n, b) ∈ H, so gilt auch (n′ , g(b)) ∈ H. Solche Teilmengen existieren, da z.B. N × A die Eigenschaften (i) und (ii). Sei D der Durchschnitt aller solchen Teilmengen: \ D := H H erfüllt (i) und (ii) Da (1, a) ∈ H für alle H, die (i) und (ii) erfüllen, ist auch (1, a) ∈ D. Ist (n, b) ∈ D, so gilt (n, b) ∈ H für alle (i) und (ii) erfüllenden H. Nach (ii) folgt (n′ , g(b)) ∈ H für alle solchen H, und somit (n′ , g(b)) ∈ D. Somit hat D auch die Eigenschaften (i) und (ii), und ist damit die kleinste Teilmenge mit diesen Eigenschaften. Wir behaupten, dass D eine Funktion von N nach A ist, also, dass es zu jedem n ∈ N genau ein b ∈ A gibt, sodass (n, b) ∈ D. Dazu sei3 M = {n ∈ N : ∃! b ∈ A, (n, b) ∈ D}. Nun ist 1 ∈ M, da einerseits (1, a) ∈ D. Gäbe es andererseits ein weiteres c ∈ A, c , a mit (1, c) ∈ D, so betrachte D \ {(1, c)}. Klarerweise hat D \ {(1, c)} die Eigenschaft (i). Wegen (S 2) bleibt auch die Eigenschaft (ii) erhalten. Ein Widerspruch dazu, dass D kleinstmöglich ist. Ist nun n ∈ M, so gibt es genau ein b ∈ A mit (n, b) ∈ D. Also ist auch (n′ , g(b)) ∈ D. Wäre noch (n′ , c) ∈ D mit c , g(b), so kann man wieder D \ {(n′ , c)} betrachten. Weil n′ , 1, erfüllt D \ {(n′ , c)} Eigenschaft (i). Aus (k, d) ∈ D \ {(n′ , c)} ⊆ D folgt (k′ , g(d)) ∈ D. Ist k , n, so folgt wegen (S 1) daher auch (k′ , g(d)) , (n′ , c). Ist n = k, so muss wegen n ∈ M die Gleichheit d = b gelten. Es folgt (k′ , g(d)) = (n′ , g(b)) , (n′ , c). In jedem Fall gilt also (k′ , g(d)) ∈ 3 ∃! steht für: Es gibt genau ein KAPITEL 2. DIE REELLEN ZAHLEN 18 D \ {(n′ , c)}, und D \ {(n′ , c)} erfüllt auch (ii). In analoger Weise wie oben erhalten wir einen Widerspruch. Man kann also D auffassen als Abbildung φ : N → A. Die Eigenschaft (i) bedeutet φ(1) = a, (ii) besagt φ(n′ ) = g(φ(n)). Wäre φ̃ eine weitere Funktion mit φ̃(1) = a und mit φ̃(n′ ) = g(φ̃(n)), und betrachtet man φ̃ als Teilmenge D̃ von N × A, so erfüllt D̃ Eigenschaften (i), (ii). Weil wir schon wissen, dass D die kleinste solche Menge ist, folgt D ⊆ D̃. Da aber beide Funktionen sind, muss D = D̃ bzw. φ = φ̃. ❑ 2.3.4 Bemerkung. Satz 2.3.3 rechtfertigt rekursive Definitionen: Zum Beispiel die Funktion n 7→ xn , wobei x in einem Körper K liegt. Dafür nehmen wir A = K, a = x und g : K → K, y 7→ yx. Nach Satz 2.3.3 ist dann xn für alle n ∈ N eindeutig definiert. Genauso kann man n 7→ nx definieren. Q Um n 7→ nk=1 c(k) zu definieren, wenn c : N → K ist, wenden wir Satz 2.3.3 mit A = N × K, a = (1, c(1)) und g : N × K → N × K, (n, x) 7→ (n′ , x · c(n′ )) an, Q und definieren nk=1 c(k) als die zweite Komponente von φ(n). P Genauso kann man n 7→ nk=1 c(k), n 7→ maxnk=1 c(k) und ähnliche Ausdrücke definieren. Für n P k=1 c(k) schreiben wir auch c(1) + · · · + c(n). Entsprechend setzen wir c(1) · · · · · c(n) := n Y k=1 n c(k) und max c(k) = max(c(1), . . . , c(n)). k=1 Als weitere Anwendung des Rekursionssatzes erhalten wir, dass die natürlichen Zahlen im Wesentlichen eindeutig sind. 2.3.5 Korollar (Eindeutigkeitssatz). Seien N und Ñ Mengen mit ausgezeichneten Elementen 1 ∈ N und 1̃ ∈ Ñ und Abbildungen ′ : N → N, ˜ : Ñ → Ñ, sodass für beide die Axiome (S1), (S2) und (S3) gelten. Dann gibt es eine eindeutige bijektive Abbildung g = ϕ(n′ ), n ∈ N. ϕ : N → Ñ mit ϕ(1) = 1̃ und ϕ(n) Beweis. Wendet man den Rekursionssatz an auf A = Ñ, a = 1̃, und g = ˜, so folgt, dass g = ϕ(n′ ), n ∈ N. genau eine Abbildung ϕ : N → Ñ existiert mit ϕ(1) = 1̃ und ϕ(n) Durch Vertauschung der Rollen von N und Ñ erhält man eine Abbildung ψ : Ñ → N mit ψ(1̃) = 1 und ψ(x)′ = ψ( x̃), x ∈ Ñ. Betrachte die Abbildung Φ = ψ ◦ ϕ : N → N. Es gilt Φ(1) = 1 und g = (ψ ◦ ϕ)(n′ ). Φ(n)′ = (ψ(ϕ(n)))′ = ψ(ϕ(n)) Die identische Abbildung idN hat die selben Eigenschaften, also folgt nach der Eindeutigkeitsaussage des Rekursionssatzes Φ = idN . Analog zeigt man ϕ ◦ ψ = idÑ , also ist ϕ bijektiv und es gilt ϕ−1 = ψ. ❑ 2.3. DIE NATÜRLICHEN ZAHLEN 19 Wenn wir uns den Beweis des Rekursionssatzes nochmals anschauen, so haben wir gezeigt, dass D eine Funktion auf N ist, es also zu jedem n ∈ N genau ein b ∈ A gibt mit (n, b) ∈ D, indem wir die Menge M aller in diesem Sinne guten“n ∈ N hernehmen ” und davon zeigen, dass sie die Voraussetzungen von (S 3) erfüllen. Diese Vorgangsweise kann man auf alle Aussagen A(n) ausdehnen, die für alle natürliche Zahlen n gelten sollen. Das führt zum so genannten: Prinzip der vollständigen Induktion: Für jedes n ∈ N sei A(n) eine Aussage über die natürliche Zahl n. Gilt (i) Induktionsanfang: Die Aussage A(1) ist wahr. (ii) Induktionsschritt: Für jedes n ∈ N ist wahr, dass aus der Gültigkeit von A(n) die Gültigkeit von A(n′ ) folgt. Dann ist die Aussage A(n) für jede natürliche Zahl n richtig. Um das einzusehen, betrachte man die Menge M aller n ∈ N, für die A(n) richtig ist. Ist nun A(1) richtig, so ist 1 ∈ M, und aus A(n) ⇒ A(n′ ) sehen wir, dass mit m ∈ M auch m′ ∈ M. Nach Axiom (S 3) ist M = N. Also ist A(n) für jede natürliche Zahl n richtig. Als Anwendung der Beweismethode der vollständigen Induktion bringen wir die später verwendete Bernoullische Ungleichung. 2.3.6 Lemma. Ist hK, +, ·, Pi ein angeordneter Körper, und bezeichnen wir das multiplikative neutrale Element mit 1K , so folgt für x ∈ K, x ≥ −1K , und n ∈ N, dass (1K + x)n ≥ 1K + nx . Beweis. Induktionsanfang: Ist n = 1, so besagt die Bernoullische Ungleichung (1K + x)n = 1K + x ≥ 1K + x, was offenbar stimmt. Induktionsschritt: Angenommen sie sei nun für n ∈ N richtig. Dann folgt wegen 1K + x ≥ 0, dass ′ (1K + x)n = (1K + x)n (1K + x) ≥ (1K + nx)(1K + x) = 1K + (n′ )x + nx2 ≥ 1K + n′ x . ❑ Eine andere unmittelbare Anwendung des Beweisprinzipes der vollständigen InP duktion ist die Verifikation der offensichtlich für Ausdrücke wie nk=1 c(k) geltenden Rechenregeln. Zum Beispiel das Distributivgesetz a n X k=1 c(k) = n X (ac(k)). k=1 P P Induktionsanfang: Ist n = 1, so gilt a 1k=1 c(k) = ac(1) = 1k=1 (ac(k)). Induktionsschritt: Angenommen die Rechenregel gilt für n, so rechnen wir: a n′ X k=1 n n X X ′ c(k) = a( c(k) + c(n )) = a c(k) + ac(n′ ) = k=1 k=1 KAPITEL 2. DIE REELLEN ZAHLEN 20 n X (ac(k)) + ac(n′ ) = k=1 n′ X (ac(k)). k=1 Entsprechend zeigt man auch andere Rechenregeln für solche induktiv definierten Ausdrücke. Wir kommen nun zur Diskussion der algebraischen Operationen Addition und Multiplikation, sowie der Ordnungsrelation auf N. Ihre Existenz und ihre Eigenschaften müssen wir nun mit mathematischer Strenge herleiten, d.h. sie alleine aus den Axiomen (S 1),(S 2),(S 3) mittels logischer Schlüsse zeigen. Hauptinstrument dabei wird wieder der Rekursionssatz Satz 2.3.3 sein. 2.3.7 Definition. Wir definieren für jedes m ∈ N Abbildungen +m : N → N und ·m : N → N rekursiv: +m (1) := m′ und +m (n′ ) = (+m (n))′ , ·m (1) := m und ·m (n′ ) = +m (·m (n)). Weiters definieren wir Relationen < und ≤ auf N durch n < m : ⇐⇒ (∃t ∈ N : +t (n) = m), n ≤ m : ⇐⇒ (n = m) oder (n < m). Sind m, n ∈ N, so schreibt man +m (n) =: m + n, ·m (n) =: m · n, und spricht von der Addition bzw. Multiplikation auf N. 2.3.8 Satz. Für jedes m ∈ N sind die Abbildungen +m und ·m injektiv, wobei +m (n) , m für alle n ∈ N. Die Addition im Bereich N der natürlichen Zahlen erfüllt die Gesetze Für alle a, b, c ∈ N gilt (a + b) + c = a + (b + c). (Assoziativität) Für alle a, b ∈ N gilt a + b = b + a. (Kommutativität) sowie die Kürzungsregel Sind n, m, k ∈ N und gilt k + m = k + n, so folgt m = n. Die Multiplikation ist ebenfalls assoziativ, kommutativ und erfüllt die Kürzungsregel. Zusätzlich gilt noch Für jedes a ∈ N ist a · 1 = 1 · a = a. (Existenz des neutralen Elementes) Die Addition hängt mit der Multiplikation zusammen über das Distributivgesetz Für a, b, c ∈ N gilt stets (b + c) · a = (b · a) + (c · a). Die Relation ≤ ist eine Totalordnung mit 1 als kleinstes Element, und es gilt m < n ⇐⇒ m ≤ n und m , n. Zudem gelten folgende Verträglichkeiten mit den Operationen + und ·: 2.3. DIE NATÜRLICHEN ZAHLEN 21 Sind a, b, c ∈ N und gilt a < b (a ≤ b), so folgt a + c < b + c (a + c ≤ b + c). Sind a, b, c ∈ N und gilt a < b (a ≤ b), so folgt a · c < b · c (a · c ≤ b · c). Es gilt weiters Sind n, m, l ∈ N mit n + l < m + l (n + l ≤ m + l) oder n · l < m · l (n · l ≤ m · l), so folgt n < m (n ≤ m). Sind n, m ∈ N, n < m, so gibt es ein eindeutiges t ∈ N, sodass m = n + t. Wir setzen in diesem Falle m − n := t. (2.2) Sind m, n, t ∈ N, t < n < m, so folgt n − t < m − t. Sind l, m, n ∈ N, n + m < l, so folgt n < l − m und l − (m + n) = (l − m) − n. (2.3) Beweis. Zur Assoziativität von +: Seien k, m ∈ N fest gewählt, wir führen Induktion nach n durch. Induktionsanfang: (k + m) + 1 = +k (m)′ = +k (m′ ) = k + (m + 1). Induktionsschritt: Nach Induktionsvoraussetzung gilt (k + m) + n = k + (m + n). Es folgt (k + m) + (n′ ) = +k+m (n′ ) = +k+m (n)′ = ((k + m) + n)′ = = (k + (m + n))′ = +k (m + n)′ = +k ((m + n)′ ) = k + (m + n′ ), wobei letztere Gleichheit wegen des schon gezeigten Induktionsanfangs folgt. Zur Kommutativität von +: Wir zeigen ∀m, n ∈ N : m + n = n + m mittels Induktion nach m. Induktionsanfang (m = 1): Wir zeigen ∀n ∈ N : 1 + n = n + 1 mittels Induktion nach n. Der Fall n = 1 ist klar, denn 1 + 1 = 1 + 1. Für den Induktionsschritt n → n′ gehen wir aus von der Induktionsvoraussetzung 1 + n = n + 1. Daraus folgt n′ + 1 = n′′ = (n + 1)′ = (1 + n)′ = 1 + n′ . Induktionsschritt (m → m′ ): Wir zeigen (∀n ∈ N : m + n = n + m) =⇒ (∀n ∈ N : m′ + n = n + m′ ). Dazu führen wir Induktion nach n durch. Betrachte also zuerst den Fall n = 1. Nach der bereits bewiesenen Aussage (Induktionsanfang (m = 1)) ∀l ∈ N : 1 + l = l + 1, gilt m′ + 1 = 1 + m′ . Der Induktionsschritt n → n′ hat nun als Induktionsvoraussetzung m′ + n = n + m′ und wir erhalten ∗ m′ + n′ = (m′ + n)′ = (n + m′ )′ = (n + m)′′ = (m + n)′′ = ∗ = (m + n′ )′ = (n′ + m)′ = n′ + m′ . An den mit ∗ gekennzeichneten Stellen ist die Induktionsvoraussetzung des Induktionsschritts (m 7→ m′ ) benützt worden. KAPITEL 2. DIE REELLEN ZAHLEN 22 Zur Injektivität von +m und der Tatsache, dass +m (n) , m, für alle n ∈ N: Für m = 1 ist +m (n) = n′ . Nach (S 1) ist +1 injektiv und nach (S 2) gilt +1 (n) , 1. Sei nun m ∈ N und +m injektiv und erfülle +m (n) , m für alle n ∈ N. Es folgt +m′ (n) = m′ + n = m + (n + 1) = +m (n′ ). Also ist +m′ die Zusammensetzung der injektiven Abbildungen (n 7→ n′ ) und +m und somit selbst injektiv. Aus m + 1 = m′ = +m′ (n) = (m + n) + 1 folgt wegen der Injektivität von +1 , dass m = m + n = +m (n) im Widerspruch zur Induktionsvoraussetzung. Die Kürzungsregeln für + folgt sofort aus der Injektivität von +k . Es gilt a · 1 = 1 · a = a, a ∈ N: Unmittelbar aus der Definition 2.3.7 folgt a · 1 = ·a (1) = a. Die zweite Gleichheit zeigen wir mittels Induktion nach a: Induktionsanfang (a = 1): 1 · a = 1 · 1 = 1 = a. Induktionsschritt (a → a′ ): Wir nehmen also 1 · a = a an und schließen 1 · (a′ ) = ·1 (a′ ) = +1 (·1 (a)) = +1 (1 · a) = 1 + a = a′ . Zur Kommutativität von ·: Wir zeigen ∀m, n ∈ N : m · n = n · m mittels Induktion nach m. Induktionsanfang (m = 1): Nach dem letzten Punkt gilt ∀n ∈ N : 1 · n = n = n · 1. Induktionsschritt (m → m′ ): Wir zeigen (∀n ∈ N : m · n = n · m) =⇒ (∀n ∈ N : m′ · n = n · m′ ). Dazu führen wir Induktion nach n durch. Betrachte also zuerst den Fall n = 1. Wieder nach dem letzten Punkt gilt (m′ ) · 1 = m′ = 1 · m′ . Der Induktionsschritt n → n′ hat nun als Induktionsvoraussetzung m′ · n = n · m′ und wir erhalten m′ · n′ = m′ + (m′ · n) = m′ + (n · m′ ) = (m + 1) + (n + (n · m)) = ∗ (n + 1) + (m + (n · m)) = (n + 1) + (m + (m · n)) = ∗ n′ + (m · n′ ) = n′ + (n′ · m) = n′ · m′ . An den mit ∗ gekennzeichneten Stellen ist die Induktionsvoraussetzung des Induktionsschritts (m 7→ m′ ) benützt worden. Zum Distributivgesetz: Vollständige Induktion nach a: Induktionsanfang (a = 1): Da 1 bezüglich · ein neutrales Element ist, folgt (b + c) · 1 = b + c = (b · 1) + (c · 1). Induktionsschritt: ∗ (b + c) · (a + 1) = (b + c) + ((b + c) · a) = (b + c) + ((b · a) + (c · a)) = (b + (b · a)) + (c + (c · a)) = (b · (a + 1)) + (c · (a + 1)). An der mit ∗ gekennzeichneten Stelle ist die Induktionsvoraussetzung eingegangen. 2.3. DIE NATÜRLICHEN ZAHLEN 23 Zur Assoziativität von ·: Wir zeigen a · (b · c) = (a · b) · c mittels Induktion nach b. Induktionsanfang: a · (1 · c) = a · c = (a · 1) · c. Induktionsschritt: Nach Induktionsvoraussetzung gilt also (a · b) · c = a · (b · c). Mittels Distributivgesetz folgt (a · (b + 1)) · c = ((a · b) + (a · 1)) · c = ((a · b) · c) + ((a · 1) · c) = (a · (b · c)) + (a · (1 · c)) = a · ((b · c) + (1 · c)) = a · ((b + 1) · c). Zur Totalität von ≤ und zur Tatsache 1 ≤ n, n ∈ N: Wir wollen zeigen, dass je zwei n, m ∈ N bezüglich ≤ vergleichbar sind, was wir mittels Induktion nach m beweisen werden. Für m = 1 zeigt man, leicht mittels Induktion nach n, dass immer n = 1, oder ∃t ∈ N, n = 1 + t, also immer 1 ≤ n. Gelte die Vergleichbarkeit von m mit allen n ∈ N. Um sie für m′ zu zeigen, machen wir eine Fallunterscheidung: Ist m = n, so folgt n + 1 = m′ also n ≤ m′ . Aus n < m folgt m = n + t für ein t ∈ N, und daher m′ = n + (t + 1), also n < m′ . Ist n = m + 1, so folgt m′ = n. Ist schließlich m < n, n , m + 1, so gilt n = m + t mit t , 1. Aus der schon bewiesenen Vergleichbarkeit mit 1 folgt, dass 1 < t, und somit t = 1 + s, s ∈ N. Aus der Assoziativität folgt n = m′ + s, also m′ < n. Die Reflexivität von ≤ ist klar. m < n ⇐⇒ ( m ≤ n und m , n ), folgt unmittelbar aus der Definition und der Tatsache, dass aus m < n, dh. n = m + k mit einem k ∈ N, aus m = n der Widerspruch m = m + k = +m (k) folgt. Zur Transitivität von < und damit ≤: Sei k, l, m ∈ N und k ≤ l, l ≤ m. Ist k = l oder l = m, so sieht man sofort, dass k ≤ m. Im Fall k < l, l < m gibt es i, j ∈ N mit k + i = l, l + j = m. Es folgt k + (i + j) = m und daher k < m. Die Antisymmetrie von ≤ folgt, da aus n ≤ m und m ≤ n im Falle m , n wegen dem vorletzten Punkt und wegen der Transitivität von < folgt, dass n < n, was dem vorletzten Punkt widersprucht. Zur Verträglichkeit von < mit + und ·: Sei n < m und k ∈ N. Somit ist n + t = m mit t ∈ N, und es gilt m + k = (n + t) + k = n + (t + k) = n + (k + t) = (n + k) + t, sowie m · k = (n + t) · k = (n · k) + (t · k). Also folgt n + k < m + k und n · k < m · k. KAPITEL 2. DIE REELLEN ZAHLEN 24 Die Injektivität von ·k bzw. - was das selbe ist - die Kürzungsregel für · folgt nun aus den gezeigten Eigenschaften von ≤: Seien k, m, n ∈ N mit m , n. Wegen der Totalität gilt m < n oder n < m, was mit der Verträglichkeit von < mit · bedingt, dass k · m < k · n oder k · n < k · m und somit k · m , k · n. Zum Kürzen in Ungleichungen: Aus n + l < m + l folgt definitionsgemäß m + l = (n + l) + k für ein k ∈ N. Gemäß der Kürzungsregel für + folgt m = n + k und somit n < m. Sei nun n ·l < m·l. Wäre m ≤ n, so folgte aus dem letzten Punkt der Widerspruch m · l ≤ n · l. Wegen der Totalität muss n < m. Zur Wohldefiniertheit von m − n: Sei also n < m. Definitionsgemäß ist m = n + t für ein t ∈ N. Ist nun m = n + s für eine weitere Zahl s ∈ N, so folgt aus der Kürzungsregel für + und n + t = n + s, dass s = t. Also ist die m − n := t eindeutig dadurch definiert, dass n + t = m. Zur Verträglichkeit von < mit −: Ist t < n < m, so folgt n = t + s und m = n + l für s, l ∈ N, und weiters m = t + (l + s). Somit ist m − t = l + s und n − t = s, und daher n − t < m − t. Zu (2.3): Die Ungleichung m + n < l bedeutet l = (m + n) + k für ein eindeutiges k ∈ N. Definitionsgemäß ist daher k = l − (m + n). Andererseits gilt wegen m < m + n < l auch l = m + s, s ∈ N. Wegen der Kürzungsregel für + folgt s = n + k, und somit n < s = l − m. Außerdem ist k = s − n = (l − m) − n. ❑ 2.3.9 Bemerkung. Ist Ñ eine Kopie von N wie in Korollar 2.3.5, und werden die Operationen + und ·, sowie ≤ auf Ñ genauso definiert wie auf N, so sieht man leicht, dass die nach Korollar 2.3.5 existierende Abbildung ϕ : N → Ñ mit den Operationen und ≤ verträglich ist: ϕ(n + m) = ϕ(n) + ϕ(m), ϕ(n · m) = ϕ(n) · ϕ(m), n ≤ m ⇔ ϕ(n) ≤ ϕ(m). Folgende Eigenschaft der natürlichen Zahlen werden wir oft verwenden. 2.3.10 Satz. Ist ∅ , T ⊆ N, so hat T ein Minimum. Beweis. Wir nehmen das Gegenteil an. Sei M = {n ∈ N : ∀m ∈ T : n < m}. Es ist nun 1 ∈ M, da ja sonst 1 das Minimum von T wäre. Ist n ∈ M, und m ∈ T , so gilt n < m. Daraus schließen wir n + 1 ≤ m. Wäre n + 1 = m0 für ein m0 ∈ T , so hätte T das Minimum m0 . Wir nehmen aber an, dass es ein solches nicht gibt. 2.3. DIE NATÜRLICHEN ZAHLEN 25 Also gilt immer n + 1 < m, m ∈ T , bzw. n + 1 ∈ M. Somit folgt M = N. Ist m ∈ T ⊆ N, so folgt m ∈ M und daher der Widerspruch m < m. ❑ Diese Eigenschaft der natürlichen Zahlen können wir hernehmen, um folgende Varianten des Prinzips der vollständigen Induktion zu rechtfertigen. Zum Beispiel ist es oft bequemer die folgende Version zu benützen: 2.3.11 Bemerkung. Sei A(n), n ∈ N, eine Aussage über die natürliche Zahl n. Gilt (i) Die Aussage A(1) ist wahr. (ii) Es gelte für jedes n ∈ N, n > 1: Ist die Aussage A(m) wahr für alle m < n, so ist auch A(n) wahr. Dann ist die Aussage A(n) für alle n ∈ N wahr. Denn wäre die Menge der n ∈ N, für die A(n) falsch ist, nicht leer, so hätte sie ein Minimum n. Wegen (i) ist aber n > 1, wegen (ii) ist A(n) wahr, was offensichtlich ein Widerspruch ist. Oft ist eine Aussage auch erst ab einer gewissen Zahl n0 richtig. 2.3.12 Bemerkung. Gilt (i) Die Aussage A(n0 ) ist wahr. (ii) Ist A(n) wahr für ein n ≥ n0 , dann ist A(n + 1) wahr. oder gilt (i) Die Aussage A(n0 ) ist wahr. (ii) Ist n > n0 und ist A(m) wahr für alle m mit n0 ≤ m < n, dann ist A(n) wahr. Dann ist die Aussage A(n) für alle n ≥ n0 richtig. 2.3.13 Bemerkung. Mit fast dem selben Beweis wie in Lemma 2.3.6 jedoch mit einer Induktion bei 2 startend zeigt man, dass für x ≥ −1K und x , 0 sowie n ≥ 2 sogar (1K + x)n > 1K + nx . Induktionsanfang: Ist n = 2, so gilt wegen x2 > 0, dass (1K + x)2 = 1K + 2x + x2 > 1K + 2x. Induktionsschritt: Angenommen die Ungleichung ist für n ∈ N richtig. Dann folgt wegen 1K + x ≥ 0 und nx2 > 0, dass ′ (1K + x)n = (1K + x)n (1K + x) ≥ (1K + nx)(1K + x) = 1K + (n′ )x + nx2 > 1K + n′ x . Klarerweise haben unendliche Teilmengen von N kein Maximum. Aber wie intuitiv klar ist, hat jede endliche Teilmenge einer total geordneten Menge ein Maximum und ein Minimum. Um das exakt nachzuweisen, benötigen wir die genaue Definition von Endlichkeit. 2.3.14 Definition. Eine nichtleere Menge M heißt endlich, wenn es ein k ∈ N und eine bijektive Funktion f : {n ∈ N : n ≤ k} → M gibt. Die Zahl k ist dann die Mächtigkeit von M 4 . Man sagt auch, dass M genau k Elemente hat. Die leere Menge nennen wir auch endlich, und ihre Mächtigkeit sei Null. 2.3.15 Bemerkung. Man zeigt elementar durch vollständige Induktion nach der Mächtigkeit der endlichen Menge M, dass alle ihre Teilmengen auch endlich sind. 4 Damit die Mächtigkeit wohldefiniert ist, muss man noch zeigen, dass es im Fall k , k keine bijektive 1 2 Funktion von {n ∈ N : n ≤ k1 } auf {n ∈ N : n ≤ k2 } gibt. KAPITEL 2. DIE REELLEN ZAHLEN 26 Mit vollständiger Induktion nach der Mächtigkeit einer endlichen Teilmenge beweist man: 2.3.16 Lemma. Jede endliche nichtleere Teilmenge M einer total geordneten Menge hT, ≤i hat ein Minimum und ein Maximum, das wir mit min(M) bzw. mit max(M) bezeichnen. Insbesondere gilt diese Aussage für endliche Teilmengen von angeordneten Körpern und von N. Beweis. Hat M nur ein Element, d.h. M = {m}, so ist klarerweise m das Maximum von M. Angenommen alle M̃ ⊆ T mit n Elementen haben ein Maximum. Hat nun M ⊆ T genau n + 1 Elemente und ist m1 ∈ M, so hat M \ {m1 } genau n Elemente und laut Induktionsvoraussetzung ein Maximum m2 ∈ M \ {m1 }. Da hT, ≤i eine Totalordnung ist, gilt m1 ≤ m2 oder m1 ≥ m2 . Im ersten Fall ist dann m2 das Maximum von M und im zweiten ist m1 das Maximum von M. ❑ Eine immer wieder verwendete Tatsache ist im folgenden Lemma vermerkt. 2.3.17 Lemma. Sei M ⊆ N nicht endlich. Dann gibt es eine streng monoton wachsende Bijektion φ von N auf M. Für eine solche gilt immer φ(n) ≥ n. Beweis. Sei g : M → M definiert durch g(s) = min{m ∈ M : m > s}, und sei a = min M. Man beachte, dass g(s) für alle s ∈ M definiert ist, da {m ∈ M : m > s} voraussetzungsgemäß niemals leer ist. Nach dem Rekursionssatz gibt es eine eindeutige Abbildung φ : N → M mit φ(1) = a = min M und so, dass φ(n + 1) = g(φ(n)) = min{m ∈ M : m > φ(n)}. Offensichtlich gilt φ(n + 1) > φ(n). Daraus folgt durch vollständige Induktion, dass φ(l) > φ(n), wenn l > n. Also ist φ streng monoton wachsende und somit auch injektiv. Durch vollständige Induktion zeigt man auch leicht, dass φ(n) ≥ n für alle n ∈ N. Wäre ein m1 ∈ M nicht im Bild von φ, so ist klarerweise m1 > min M = φ(1). Angenommen m1 > φ(n). Dann ist m1 ∈ {m ∈ M : m > φ(n)} und wegen m1 , φ(n + 1) = min{m ∈ M : m > φ(n)} muss m1 > φ(n + 1). Es folgt, dass φ(n) < m1 für alle n ∈ N, was aber φ(m1 ) ≥ m1 widerspricht. ❑ 2.4 Der Ring der ganzen Zahlen Im Bereich der natürlichen Zahlen haben wir zuletzt Operationen + und · definiert. Ist m < n, so haben wir auch n − m ∈ N definiert. Wir wollen nun aus den natürlichen Zahlen die ganzen Zahlen Z konstruieren, und die Operationen + und · auf Z so fortsetzen, dass wir einen Ring hZ, +, ·i erhalten. Die Menge Z zu definieren, ist kein Problem: 2.4.1 Definition. Seien N1 und N2 zwei disjunkte Kopien der natürliche Zahlen, und sei 0 ein Element, das in keiner dieser Mengen enthalten ist5 . Wir definieren ˙ ∪N ˙ 2. Z := N1 ∪{0} 5 Man kann z.B. für N j einfach die Menge N × { j} hernehmen, und für 0 das Element (1, 3) 2.4. DER RING DER GANZEN ZAHLEN 27 Ist ϕ : N1 → N2 eine bijektive Abbildung wie in Korollar 2.3.5, so definieren wir eine Abbildung − : Z → Z ϕ(n) , n ∈ N1 0 , n=0 −n = ϕ−1 (n) , n ∈ N 2 Schreiben wir nun N für N1 , so können wir Z als ˙ ∪N ˙ −N∪{0} anschreiben. Man erkennt unschwer, dass − eine Bijektion ist, die mit sich selber zusammengesetzt die Identität ergibt, also eine Involution ist. Nun definieren wir die Operationen auf Z in der Art und Weise, wie wir sie der Anschauung nach erwarten. 2.4.2 Definition. Für n ∈ N setzen wir sgn(n) := 1, sgn(−n) := −1, sgn(0) = 0 sowie |n| := n, | − n| := n und |0| := 0. Weiters sei + : Z × Z → Z definiert durch p + q , p, q ∈ N −(|p| + |q|) , −p, −q ∈ N p − |q| , p, −q ∈ N, p > −q −(|q| − p) , p, −q ∈ N, p < −q −(|p| − q) , −p, q ∈ N, − p > q , p + q := q − |p| , −p, q ∈ N, − p < q 0 , q = −p p , q=0 q , p=0 und · : Z × Z → Z durch |p| · |q| , −(|p| · |q|) , p · q := 0 , q, p , 0, sgn(q) = sgn(p) q, p , 0, sgn(q) = − sgn(p) . q=0∨ p=0 2.4.3 Satz. hZ, +, ·i ist ein kommutativer Integritätsring mit Einselement. Es gilt also: Die Addition ist kommutativ und assoziativ, 0 ist ein bzgl. + neutrales Element und −p ist das zu p ∈ Z bzgl. + inverse Element. Also gelten (A1)-(A4). Die Multiplikation ist kommutativ und assoziativ, und 1 ist ein bzgl. · neutrales Element. Also gelten (M1),(M2),(M4). Es gilt das Distributivgesetz. Aus p , 0 ∧ q , 0 folgt pq , 0 (Integritätseigenschaft). Beweis. Seien p, q ∈ Z. Zunächst folgen p + q = q + p und p · q = q · p unmittelbar aus der Definition und eben der Tatsache, dass diese Operationen auf N kommutativ sind. Ebenfalls unmittelbar aus der Definition sieht man, dass p + 0 = p und p · 1 = p. Also ist 0 ein bezüglich + und 1 ein bezüglich · neutrales Element. Genauso elementar verifiziert man p + (−p) = 0 und p · q , 0, wenn p und q beide , 0. Es bleibt die Assoziativität und das Distributivgesetz nachzuprüfen. Das ist in der Tat mühsam und durch zahlreiche Fallunterscheidungen zu bewerkstelligen. Wir wollen daher nur r + (q + p) = (r + q) + p im exemplarischen Fall r, q ∈ N, − p ∈ N KAPITEL 2. DIE REELLEN ZAHLEN 28 betrachten: Ist |p| > r + q, so folgt (r + q) + p = −(|p| − (r + q)), und nach (2.3) ist dieser Ausdruck gleich −((|p| − q) − r). Wegen |p| − q > r und |p| > q folgt definitionsgemäß −((|p| − q) − r) = r + (−(|p| − q)) = r + (p + q). Im Falle |p| = r + q gilt einerseits (r + q) + p = 0 und andererseits wegen |p| > q und |p| − q = r (siehe (2.2)), dass r + (q + p) = r + (−(|p| − q)) = 0. Sei nun |p| < r + q. Dann folgt (r + q) + p = (r + q) − |p| =: k ∈ N. Also ist k jene Zahl, sodass |p| + k = r + q. Ist q > |p|, so gilt andererseits r + (q + p) = r + (q − |p|), und wegen den bekannten Rechenregeln auf N, |p| + (r + (q − |p|)) = r + q, also k = r + (q + p). Wenn q = |p|, so folgt r+(q+ p) = r, und ebenfalls |p|+r = r+q, d. h. k = r+(q+ p). Ist schließlich q < |p|, so folgt r + (q + p) = r + (−(|p| − q)). Da |p| < r + q folgt r > |p| − q, und somit r + (−(|p| − q)) = r − (|p| − q) =: l ∈ N. Das ist also jene Zahl, sodass (|p| − q) + l = r. Addiert man hier q und verwendet die Assoziativität von + auf N, so folgt |p| + l = r + q, also l = k. ❑ 2.4.4 Bemerkung. In Integritätsringen gilt die Kürzungsregel: m , 0, xm = ym ⇒ y = x, denn xm − ym = (x − y)m = 0 ⇒ x − y = 0. Sind p, q ∈ Z, so werden wir im Folgenden wie schon zuvor für p + (−q) den Ausdruck p − q verwenden. Wir benötigen noch eine Totalordnung auf Z, welche ≤ auf N erweitert. 2.4.5 Definition. Wir definieren für p, q ∈ Z q < p ⇔ p − q ∈ N und q ≤ p ⇔ q < p ∨ q = p. (2.4) Man sieht leicht ein, dass mit ≤ eine Totalordnung auf Z definiert ist, die ≤ auf N erweitert, und die mit den Operationen + und · verträglich ist. 2.4.6 Bemerkung. Wenn man sich an die Definition eines angeordneten Körpers in Definition 2.2.1 erinnert, so haben wir die Existenz einer Teilmenge P ⊆ K verlangt, die (P1) - (P3) erfüllt. Genau diese Situation haben wir hier mit P = N, nur, dass Z kein Körper, sondern ein Ring ist. Die von uns definierte Totalordnung ≤ auf Z erfüllt nun auch alle Eigenschaften, die für die entsprechende Totalordnung auf einem angeordneten Körper gelten (vgl. Lemma 2.2.2). Ausgenommen sind nur die Eigenschaften, die sich auf die multiplikativ Inverse beziehen. 2.4.7 Bemerkung. Die ganzen Zahlen sind eindeutig in dem Sinn, dass wenn Z̃ neben Z eine weitere Menge versehen mit einer Involution −̃ : Z̃ → Z̃, mit Operationen +̃, ˜· und einer Relation ≤˜ ist, sodass Z̃ eine Kopie Ñ der natürlichen Zahlen enthält, Z̃ geschrieben werden kann als die disjunkte Vereinigung von −Ñ, {0} und Ñ, die Operationen +̃ und ˜· wie in Definition 2.4.2 durch die entsprechenden Operationen auf Ñ (siehe Bemerkung 2.3.9) definiert sind, und sodass ≤˜ wie in (2.4) definiert ist, es eine eindeutige Bijektion φ : Z → Z̃ gibt, sodass φ(−p) = −φ(p), φ(1) = 1̃, φ(n + 1) = φ(n)+̃1̃, p ∈ Z, n ∈ N. 2.4. DER RING DER GANZEN ZAHLEN 29 Um das zu zeige, setzt man einfach die Bijektion ϕ aus Korollar 2.3.5 zu einer Bijektion φ von Z auf Z̃ gemäß der Forderung φ(−p) = −φ(p) fort. Die erhaltene Bijektion Z → Z̃ ist mit +, ·, − und ≤ verträglich. Siehe dazu auch Bemerkung 2.3.9. Wir haben im Abschnitt über die natürlichen Zahlen für eine Zahl x aus einem Körper ihre Potenzen xn , n ∈ N definiert (siehe Bemerkung 2.3.4). Das wollen wir auf Z ausdehnen: 2.4.8 Definition. Sei hK, +, ·i ein Körper. Für eine ganze Zahl p und eine Zahl x ∈ K, x , 0 definieren wir p , p ∈N x 1 , p =0 . xp = 1 , −p ∈ N −p x 2.4.9 Bemerkung. Dafür gelten die aus der Schule bekannten Rechenregeln (x ∈ K \ {0}, p, q ∈ Z): 1 x p xq = x p+q , (x p )q = x pq , x−p = p . (2.5) x Den Beweis für diese Rechenregeln führt man durch vollständige Induktion für p, q ∈ N, und dann durch Fallunterscheidung für den allgemeinen Fall p, q ∈ Z. 2.4.10 Lemma. Ist hK, +, ·, Pi ein angeordneter Körper, so gilt für n ∈ N und x, y ≥ 0 x < y ⇔ xn < yn , und für x, y > 0 x < y ⇔ x−n > y−n . Beweis. Zunächst zeigt man leicht durch vollständige Induktion und mit Hilfe von (P3), dass aus 0 < t immer 0 < tn folgt. Ist x < y, so folgt im Falle x = 0 daher xn = 0 < yn . Ist 0 < x < y, so zeigt man n x < yn durch vollständige Induktion: Für n = 1 ist xn < yn offensichltich. Gilt xn < yn , so folgt aus Lemma 2.2.2 und der rekursiven Definition von xn (siehe Bemerkung 2.3.4) xn+1 = xn · x < yn · x < yn · y = yn+1 . Ist umgekehrt xn < yn , so muss x < y, da sonst y ≤ x, und aus dem eben bewiesenem yn ≤ xn folgte. Die letzte Behauptung folgt sofort aus x < y ⇔ x−1 > y−1 für alle x, y > 0. ❑ n Also ist x 7→ x eine streng monoton wachsende Funktion und somit injektive Funktion von P ∪ {0} nach P ∪ {0}. Wir werden später sehen, dass diese Funktionen in vollständig angeordneten Körpern auch surjekiv sind. Für p ∈ Z, p < 0 ist x 7→ x p eine streng monoton fallende Funktion und somit eine injektive Funktion von P nach P. Wir wollen nun nachweisen, dass das Dividieren mit Rest, wie in der Schule kennengelernt, auf gutem mathematischen Fundament steht. 2.4.11 Satz. Sind m ∈ N, n ∈ Z, so gibt es eindeutige Zahlen l ∈ Z und r ∈ {0, . . . , m − 1}6 , sodass n = ml + r. Dabei ist n ≥ 0 genau dann, wenn l ≥ 0. 6 {0, . . . , m − 1} steht für {k ∈ N ∪ {0} : 0 ≤ k < m} KAPITEL 2. DIE REELLEN ZAHLEN 30 Beweis. Sei zunächst n ∈ N ∪ {0} beliebig. Da die Menge aller l ∈ N ∪ {0} mit m · l + m > n nicht leer ist (n ist sicher in dieser Menge), hat sie ein Minimum (Variante von Satz 2.3.10). Ist l = 0, so muss n ∈ {0, . . . , m − 1}, und ist l > 0, so folgt wegen der Minimalität ml = m(l − 1) + m ≤ n < ml + m. Also muss immer n = ml + r für ein l ∈ N ∪ {0} und ein r ∈ {0, . . . , m − 1}. Ist nun auch n = ml̂ + r̂ für lˆ ∈ N∪{0} und r̂ ∈ {0, . . . , m−1}, so folgt ml̂ +m > n und wegen der Minimalitätseigenschaft von l auch lˆ ≥ l. Andererseits gilt ml̂ ≤ n, weshalb nicht l̂ > l sein kann, da sonst n ≥ ml̂ = ml + m(l̂ − l) ≥ ml + m wäre. Somit gibt es eindeutige l ∈ N ∪ {0} und r ∈ {0, . . . , m − 1}, sodass n = ml + r. Für n < 0 ist −n − 1 ≥ 0 und somit gibt es eindeutige s ∈ N ∪ {0}, t ∈ {0, . . . , m − 1}, sodass −n − 1 = sm + t = (s + 1)m + (t − m), und daher sodass −n = (s + 1)m + (t − m + 1), bzw. n = −(s + 1)m + (−t + m − 1). Setzen wir l = −(s+1) und r = −t+m−1, so sehen wir, dass n = ml+r für ein eindeutiges l < 0 und ein eindeutiges r ∈ {0, . . . , m−1}. ❑ 2.4.12 Bemerkung. Die geraden (ungeraden) Zahlen sind genau alle ganzen Zahlen der Form 2k (2k + 1) für ein k ∈ Z. Aus Satz 2.4.11 folgt insbesondere, dass jede gegebene ganze Zahl gerade oder ungerade ist, wobei aus der Eindeutigkeitsaussage ˙ in Satz 2.4.11 folgt, dass sie nicht gleichzeitig gerade und ungerade sein kann. Also gilt Z = 2Z∪(2Z + 1). Entsprechendes gilt, wenn man 2 durch eine andere natürliche Zahl m ersetzt, nur, dass dann ˙ ˙ Z = mZ∪(mZ + 1)∪˙ . . . ∪(mZ + m − 1). 2.4.13 Definition. Eine Zahl q ∈ N teilt eine Zahl p ∈ N, falls es ein m ∈ N gibt, sodass mq = p. Wir schreiben q|p dafür. Außerdem setzen wir p : q := m7 . Eine Zahl p ∈ N \ {1} heißt Primzahl, wenn p nur von 1 und p geteilt wird. Die Menge aller Primzahlen sei P. 2.4.14 Bemerkung. Falls q|p, so folgt aus mq = p und 1 ≤ m, dass q ≤ p, wobei q = p genau dann, wenn m = 1. Um zu sehen, ob eine Zahl p eine Primzahl ist, genügt es somit zu überprüfen, dass q 6 |p für alle q ∈ N, 1 < q < p. Man sieht sofort, dass 2, 3, 5, . . . Primzahlen sind. Ist n ∈ N \ {1} und M = {r ∈ N \ {1} : r|n}, so ist M nicht leer, da zumindest n ∈ M. Gilt M = {n}, so ist n definitionsgemäß eine Primzahl. Anderenfalls sei m das kleinste Element von M und k so, dass km = n. Nun ist m eine Primzahl, da sonst m = pq mit 1 < p, q < m, und weiter p(qk) = n. Es wäre p ∈ M im Widerspruch zur Minimalität von m. Insbesondere wird jede Zahl in N \ {1} von einer Primzahl geteilt. 2.4.15 Lemma. Seien a, b ∈ N und p ∈ P. Gilt p|(ab), so folgt p|a ∨ p|b. Beweis. Sei T ⊆ P die Menge aller Primzahlen, sodass die Aussage falsch ist für gewisse a, b ∈ N. Wir bringen die Annahme T , ∅ auf einen Widerspruch. Sei also T , ∅ und p die kleinste Zahl in T (siehe Satz 2.3.10). Somit gibt es a, b ∈ N mit p 6 |a ∧ p 6 |b, aber p|(ab), bzw. pn = ab für ein n ∈ N. Daher ist S = {n ∈ N : ∃a, b ∈ N : p 6 |a ∧ p 6 |b ∧ pn = ab}, die Menge aller solchen n nicht leer. Somit hat auch diese Menge ein Minimum s. Seien c, d ∈ N, sodass p 6 |c, p 6 |d und ps = cd. Aus den ersten beiden Tatsachen folgt c, d , p, c, d , 1, und daraus zusammen mit der Tatsache, dass p eine Primzahl ist, folgt s > 1. Nun muss c < p sein, da sonst c − p ∈ N und damit p(s − d) = (c − p)d, was s − d ∈ N implizieren und somit der Minimalität von s widersprechen würde. Genauso gilt d < p. Daraus schließen wir wegen ps = cd auf s < p. Gemäß Bemerkung 2.4.14 gibt es eine Primzahl p′ ≤ s < p, sodass p′ |s, d.h. s = p′ s′ für ein s′ ∈ N, s′ < s. Somit folgt p′ (ps′ ) = cd, also p′ |(cd). Wegen der Minimalität von p muss p′ |c oder p′ |d. O.B.d.A. sei c = c′ p′ , c′ ∈ N, womit p′ (ps′ ) = p′ (c′ d) und daraus ps′ = c′ d folgt. Nun widerspricht das aber ebenfalls der Minimalität von s. ❑ 2.4.16 Satz. Ist n ∈ N \ {1}, so gibt es eindeutige Primzahlen p1 , . . . , pm ∈ P und Exponenten e1 , . . . , em ∈ N, sodass e n = p11 · . . . pemm . Diese Zerlegung heißt Primfaktorzerlegung. 7 Da wir in Z kürzen dürfen, ist p : q eindeutig definiert. (2.6) 2.4. DER RING DER GANZEN ZAHLEN 31 Beweis. Wir zeigen zuerst die Existenz einer solche Zerlegung. Für n = 2 ist diese klar. Angenommen für ein n > 2 gibt es zu allen k < n, k ≥ 2 eine solche Zerlegung. Nach Bemerkung 2.4.14 gibt es eine Primzahl p ≤ n mit p|n. Ist n = p, so haben wir unsere Zerlegung. Ist p < n, so folgt n = (n : p)p, wobei nach Voraussetzung n : p (< n) eine solche Zerlegung hat. Somit hat auch n eine solche Zerlegung. Nach einer Variante des Prinzipes der vollständigen Induktion gibt es eine Primfaktorzerlegung für alle n ∈ N \ {1}. Die Eindeutigkeit ist für n = 2 wieder klar, da alle Produkte der Form (2.6) einen Wert > 2 ergeben, außer für m = 1 und e1 = 1, p1 = 2. Angenommen mit einem n > 2 ist die Primfaktorzerlegung eindeutig für alle k < n, k ≥ 2, und angenommen f f e q11 · . . . ql l = n = p11 · . . . pemm , e mit l, m ∈ N und e1 , . . . , em , f1 , . . . , fl ∈ N sowie p1 , . . . , pm , q1 , . . . , ql ∈ P. Insbesondere gilt q1 |p11 · . . . pemm . Nach Lemma 2.4.15 muss q1 |p j und daher q1 = p j für ein j ∈ {1, . . . , m}. Durch Umnummerierung können wir q1 = p1 annehmen. Es folgt f f −1 e −1 q11 · . . . ql l = n : q1 = p11 · . . . pemm . Ist n : q1 = 1, so muss n = p1 = q1 und l = 1 = m, e1 = 1 = f1 . Sonst folgt wegen 1 < n : q1 < n aus unserer Annahme, dass auch l = m und e j = f j sowie p j = q j , j = 1, . . . , l. ❑ Eine alternative Konstruktion von Z Bis zum Ende dieses Abschnittes wird ein anderer Zugang wie oben zu den ganzen Zahlen vorgestellt. Der Vorteil dieser etwas aufwendigeren Methode ist, dass die Beweise der Rechengesetze struktureller sind. Sei ∼⊆ (N × N)2 die Relation (x, n) ∼ (y, m) : ⇐⇒ x + m = y + n . 2.4.17 Lemma. Die Relation ∼ ist eine Äquivalenzrelation. Beweis. Die Reflexivität und Symmetrie ist klar. Um zu zeigen, dass ∼ transitiv ist, seien (x, n) ∼ (y, m) und (y, m) ∼ (z, k) gegeben. Dann gilt x + m = y + n und y + k = z + m. Es folgt (x + k) + m = (x + m) + k = (y + n) + k = (y + k) + n = (z + m) + n = (z + n) + m , und wegen der Kürzungsregel in N daher x + k = z + n, d.h. (x, n) ∼ (z, k). ❑ 2.4.18 Definition. Wir bezeichnen mit Z die Faktormenge (N × N)/∼ und sprechen von dem Ring der ganzen Zahlen. Auf Z definieren wir algebraische Operationen +“ und ·“. Die Vorgangsweise dazu ist zunächst Addition und Multi” ” plikation auf N × N zu definieren, und diese dann auf Z zu übertragen. +: ( ( (N × N)2 ((x, n), (y, m)) ·: (N × N)2 ((x, n), (y, m)) → 7→ → 7→ N×N (x + y, n + m) N×N (xy + nm, xm + ny) Die Motivation für diese Definition erhalten wir aus der formalen Rechnung (x − n) + (y − m) = (x + y) − (n + m) , (x − n) · (y − m) = xy − ny − xm + nm = (xy + nm) − (xm + ny) . 2.4.19 Lemma. Die Operationen + und · auf N × N sind kommutativ, assoziativ und es gilt das Distributivgesetz. Beweis. Seien (x, n), (y, m) ∈ N × N. Dann ist (x, n) + (y, m) = (x + y, n + m) = (y + x, m + n) = (y, m) + (x, n) , (x, n) · (y, m) = (xy + nm, xm + ny) = (yx + mn, yn + mx) = (y, m) · (x, n) . Sei zusätzlich (z, k) ∈ N × N. Dann gilt (x, n) + (y, m) + (z, k) = (x + y, n + m) + (z, k) = (x + y) + z, (n + m) + k = = x + (y + z), n + (m + k) = (x, n) + (y, m) + (z, k) . Die Gültigkeit der Assoziativität der Multiplikation sowie des Distributivgesetzes rechnet man in genau der gleichen Weise (nur deutlich mühsamer) nach. ❑ Um diese Operationen auf Z übertragen zu können benötigen die Verträglichkeit mit der Relation ∼. KAPITEL 2. DIE REELLEN ZAHLEN 32 2.4.20 Lemma. Sind (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂), so folgt, dass auch (x, n) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂), (x, n) · (y, m) ∼ ( x̂, n̂) · (ŷ, m̂) . Beweis. Seien (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂) gegeben. Dann gilt (x + y) + (n̂ + m̂) = (x + n̂) + (y + m̂) = ( x̂ + n) + (ŷ + m) = ( x̂ + ŷ) + (n + m) , und wir sehen, dass (x, n) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂). Um die Aussage für · zu zeigen, betrachten wir zuerst (x, n) ∼ ( x̂, n̂) und ein (y, m). Dann gilt (xy + nm) + ( x̂m + n̂y) = (x + n̂)y + ( x̂ + n)m = = ( x̂ + n)y + (x + n̂)m = ( x̂y + n̂m) + (xm + ny) , und wir erhalten (x, n) · (y, m) ∼ ( x̂, n̂) · (y, m). Wegen der Kommutativität von · folgt auch, dass für (x, n) und (y, m) ∼ (ŷ, m̂) stets (x, n) · (y, m) ∼ (x, n) · (ŷ, m̂) gilt. Insgesamt erhalten wir, dass für (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂) gilt (x, n) · (y, m) ∼ ( x̂, n̂) · (y, m) ∼ ( x̂, n̂) · (ŷ, m̂) . ❑ 2.4.21 Definition. Auf Z seien zwei algebraische Operationen +“ und ·“ definiert durch: Sind a, b ∈ Z, so wähle ” ” (x, n), (y, m) ∈ N × N mit [(x, n)]∼ = a und [(y, m)]∼ = b, und setze a + b := (x, n) + (y, m) ∼ , a · b := (x, n) · (y, m) ∼ . Dass durch diese Vorschrift tatsächlich zwei Funktionen definiert werden (Wohldefiniertheit), verdanken wir gerade der Verträglichkeitsaussage Lemma 2.4.20. Im nächsten Schritt definieren wir eine Relation ≤ auf Z. Dazu sei (x, n) ≤ (y, m) : ⇐⇒ x + m ≤ y + n, (x, n), (y, m) ∈ N × N . Diese Relation ist mit der Relation ∼ verträglich, und sie ist schon fast eine Halbordnung: 2.4.22 Lemma. Die Relation ≤ auf N × N ist reflexiv, transitiv und total ((x, n) ≤ (y, m) ∨ (y, m) ≤ (x, n)). Ist (x, n) ≤ (y, m) und (y, m) ≤ (x, n), so folgt (x, n) ∼ (y, m). Sind (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂), so folgt (x, n) ≤ (y, m) ⇐⇒ ( x̂, n̂) ≤ (ŷ, m̂) . Beweis. Die Reflexivität folgt unmittelbar aus der Definition. Sei (x, n) ≤ (y, m) und (y, m) ≤ (z, k). Dann gilt x + m ≤ y + n und y + k ≤ z + m, und wir erhalten (x + k) + m = (x + m) + k ≤ (y + n) + k = (y + k) + n ≤ (z + m) + n = (z + n) + m . Daraus folgt nun x + k ≤ z + n, d.h. (x, n) ≤ (z, k). Die Totalität folgt aus der Tatsache, dass ≤ eine Totalordnung auf N ist. Sei (x, n) ≤ (y, m) und (y, m) ≤ (x, n), dann gilt also x + m ≤ y + n und y + m ≤ x + n. Wir erhalten x + m = y + n, d.h. (x, n) ∼ (y, m). Die letzte Aussage folgt wieder unmittelbar aus der Definition. ❑ Überträgt man nun die Relation ≤ in naheliegender Weise auf die Faktormenge Z, was nach dem letzten Lemma möglich ist, so erhält man eine Totalordnung. 2.4.23 Definition. Seien a, b ∈ Z, a = [(x, n)]∼ , b = [(y, m)]∼ . Dann schreiben wir a ≤ b, wenn gilt (x, n) ≤ (y, m). 2.4.24 Satz. Die Addition und Multiplikation auf Z sind kommutativ, assoziativ und es gilt das Distributivgesetz. Das Element 0 := [(1, 1)]∼ bzw. 1 := [(2, 1)]∼ ist neutrales Element bezüglich + bzw. ·. Jedes Element besitzt ein additives Inverses. Für · gilt die Kürzungsregel, d.h. ist a, b, c ∈ Z, c , 0, und ist a · c = b · c, so folgt a = b. Die Relation ≤ ist eine Totalordnung. Für alle a, b, c ∈ Z, a ≤ b, gilt auch a + c ≤ b + c und, sofern c ≥ 0 ist, auch a · c ≤ b · c. Umgekehrt, ist c > 0 und a · c ≤ b · c, so folgt a ≤ b. Die natürlichen Zahlen N sind in Z eingebettet durch φ: ( N x → 7→ Diese Einbettung erhält Addition, Multiplikation und Ordnung. Z [(x + 1, 1)]∼ 2.4. DER RING DER GANZEN ZAHLEN 33 Beweis. Die Gültigkeit von Assoziativität, Kommutativität sowie Distributivität folgt wegen Lemma 2.4.19. Sei a = [(x, n)]∼ ∈ Z. Dann gilt a + 0 = [(x, n)]∼ + [(1, 1)]∼ = [(x + 1, n + 1)]∼ = [(x, n)]∼ = a , sowie a · 1 = [(x, n)]∼ · [(2, 1)]∼ = [(2x + n, x + 2n)]∼ = [(x, n)]∼ = a , also ist 0 neutrales Element der Addition und 1 neutrales Element der Multiplikation. Setze â := [(n, x)]∼ , dann gilt a + â = [(x, n)]∼ + [(n, x)]∼ = [(x + n, n + x)]∼ = [(1, 1)]∼ = 0 , also hat a ein additives Inverses, nämlich â. Wegen Lemma 2.4.22 ist ≤ auf Z eine Totalordnung. Seien a, b, c ∈ Z, a = [(x, n)]∼ , b = [(y, m)]∼ , c = [(z, k)]∼ . Dann gilt a + c ≤ b + c ⇐⇒ (x + z, n + k) ≤ (y + z, m + k) ⇐⇒ x + z + m + k ≤ y + z + n + k ⇐⇒ x + m ≤ y + n ⇐⇒ a ≤ b . Sei nun angenommen, dass a < b, d.h. dass x+m < y+n, und dass c ≥ 0, d.h. z ≥ k. Dann gibt es t ∈ N mit y+n = (x+m)+t. Wegen z ≥ k folgt tz ≥ tk und daher auch (y + n)z = (x + m)z + tz ≥ (x + m)z + tk und schließlich (x + m)k + (y + n)z ≥ (x + m)z + tk + (x + m)k = (x + m)z + (y + n)k . Also haben wir (xk + nz) + (yz + mk) ≥ (xz + nk) + (yk + mz), und das heißt gerade a · c ≤ b · c. Sei umgekehrt a · c ≤ b · c, d.h. nach obiger Rechnung (x + m)k + (y + n)z ≥ (x + m)z + (y + n)k, und c > 0, d.h. z > k. Angenommen es wäre a > b, d.h. x + m > y + n. Dann gibt es t ∈ N mit (y + n) + t = x + m. Damit erhalten wir tk + (y + n)(k + z) ≥ tz + (y + n)(z + k) und daraus tk ≥ tz und schließlich k ≥ z, ein Widerspruch. Also gilt a ≤ b. Die Kürzungsregel für · folgt aus der gerade bewiesenen für ≤. Betrachte die Abbildung φ. Angenommen (x + 1, 1) ∼ (y + 1, 1), dann folgt x + 2 = y + 2, also x = y. D.h. φ ist injektiv. Es gilt φ(x) + φ(y) = [((x + 1) + (y + 1), 1 + 1)]∼ = [((x + y) + 1, 1)]∼ = φ(x + y) , φ(x) · φ(y) = ((x + 1)(y + 1) + 1, (x + 1) + (y + 1)) ∼ = = (xy + x + y + 1 + 1, x + y + 1 + 1) ∼ = [(xy + 1, 1)]∼ = φ(xy) , φ(x) ≤ φ(y) ⇐⇒ (x + 1) + 1 ≤ (y + 1) + 1 ⇐⇒ x ≤ y . ❑ Folgendes Resultat liefert insbesondere, dass die hier konstruierten ganzen Zahlen eine Kopie der ganzen Zahlen aus der Vorlesung sind. 2.4.25 Proposition. Versteht man die natürlichen Zahlen via φ eingebettet in Z wie in Satz 2.4.24, so gilt ˙ ∪N, ˙ Z = −N∪{0} wobei diese drei Mengen disjunkt sind. Dabei gilt p ∈ N ⇔ p > 0 und p ∈ −N ⇔ p < 0. Definieren wir sgn(x) = 0, wenn x = 0, sgn(x) = 1, wenn x ∈ N, und sgn(x) = −1, wenn x ∈ −N, und setzen |p| = sgn(p)p, so gilt für p, q ∈ Z und p+q −(|p| + |q|) p − |q| −(|q| − p) −(|p| − q) p+q= q − |p| 0 p q |p| · |q| p·q = −(|p| · |q|) 0 , , , , , , , , , , , , p, q ∈ N −p, −q ∈ N p, −q ∈ N, p > −q p, −q ∈ N, p < −q −p, q ∈ N, − p > q −p, q ∈ N, − p < q q = −p q=0 p=0 , q, p , 0, sgn(q) = sgn(p) q, p , 0, sgn(p) = − sgn(p) q=0∨ p =0 Schließlich gilt p < q ⇔ q − p ∈ N und p ≤ q ⇔ (p = q ∨ p < q). . KAPITEL 2. DIE REELLEN ZAHLEN 34 Beweis. Ist [(x, n)]∼ ∈ Z, [(x, n)]∼ > 0 = [(1, 1)]∼ , so gilt x + 1 > n + 1. Damit ist x − n ∈ N, und wegen (x − n + 1, 1) ∼ (x, n) folgt φ(x − n) = [(x, n)]∼ . Umgekehrt ist für y ∈ N φ(y) = [(y + 1, 1)]∼ > [(1, 1)]∼ = 0. Ist [(x, n)]∼ ∈ Z, [(x, n)]∼ < 0 = [(1, 1)]∼ , so folgt aus den Rechenregeln von Satz 2.4.24 0 > −[(x, n)]∼ = [(n, x)]∼ . Aus dem schon bewiesenem folgt −[(x, n)]∼ = −φ(n − x), wobei n − x ∈ N. Umgekehrt ist für y ∈ N −φ(y) = [(1, y + 1)]∼ < [(1, 1)]∼ = 0. Also kann man N mit p ∈ Z : p > 0 und −N mit p ∈ Z : p < 0 identifizieren. ˙ ∪N, ˙ Z = −N∪{0} folgt nun aus der Tatsache, dass ≤ eine Totalordnung ist. Die restlichen Aussagen folgen aus der Definition von |.|, sgn(.) und der Tatsache, dass p < q ⇔ 0 < q − p, siehe Satz 2.4.24. ❑ 2.5 Der Körper Q Oben haben wir den kommutativen Integritätsring hZ, +, ·i konstruiert. Diesen werden wir nun zu einem angeordneten Körper, dem Körper der rationalen Zahlen erweitern, und damit sehen, dass es zumindest einen angeordneten Körper gibt. Der Grundgedanke der folgenden Konstruktion entspringt der Tatsache, dass in einem Körper qp11 = qp22 genau dann, wenn p1 q2 = p2 q1 . Sei ∼⊆ (Z × N)2 die Relation (x, n) ∼ (y, m) : ⇐⇒ xm = yn . 2.5.1 Lemma. Die Relation ∼ ist eine Äquivalenzrelation. Beweis. Die Reflexivität und Symmetrie sind offensichtlich. Sei nun (x, n) ∼ (y, m) und (y, m) ∼ (z, k) dann gilt also xm = yn und yk = zm. Es folgt (xk)m = (xm)k = (yn)k = (yk)n = (zm)n = (zn)m , und da hZ, +, ·i ein Integritätsring ist, gilt die Kürzungsregel und wir erhalten xk = zn, d.h. (x, n) ∼ (z, k). ❑ 2.5.2 Definition. Wir bezeichnen mit Q die Menge (Z × N)/∼ aller Äquivalenzklassen. Q heißt der Körper der rationalen Zahlen. Auf Q definieren wir algebraische Operationen +“ und ·“. Dazu definieren wir ” ” wieder zunächst Addition und Multiplikation auf Z × N, und übertragen diese dann durch Faktorisieren auf Q. ( (Z × N)2 → Z × N +: ((x, n), (y, m)) 7→ (xm + yn, nm) ( (Z × N)2 → Z × N ·: ((x, n), (y, m)) 7→ (xy, nm) Unsere Motivation für diese Definition ergibt sich aus einer formalen (!) Rechnung. x y xm yn xm + yn x y xy + = + = , · = . n m nm mn nm n m nm 2.5.3 Lemma. Für die Verknüpfungen +, · gilt das Kommutativ-, Assoziativ- und Distributivgesetz. 2.5. DER KÖRPER Q 35 Beweis. Die Gesetze gelten, da man sie leicht auf die Gültigkeit dieser Gesetze auf Z zurückführt. Zum Beispiel gilt das Assoziativgesetz wegen ((x, n) + (y, m)) + (z, k) = (xm + yn, nm) + (z, k) = ((xm + yn)k + z(nm), (nm)k) = (x(mk) + (yk + zm)n, n(mk)) = (x, n) + ((y, m) + (z, k)). ❑ Um Q anordnen zu können, definieren wir noch ( (Z × N) → Z sgn : . (x, n) 7→ sgn(x) Um obige Operationen und die Vorzeichenfunktion auf Q übertragen zu können, benötigen wir das folgende Resultat. 2.5.4 Lemma. Sind (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂), so folgt sgn((x, n)) = sgn(( x̂, n̂)) und (x, n) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂), (x, n) · (y, m) ∼ ( x̂, n̂) · (ŷ, m̂) . Beweis. Seien (x, n) ∼ ( x̂, n̂) und (y, m) gegeben. Zunächst folgt aus xn̂ = x̂n und n, n̂ ∈ N, dass sgn((x, n)) = sgn(x) = sgn( x̂) = sgn(( x̂, n̂)). Weiters gilt (xm + yn)n̂m = xmn̂m + ynn̂m = = (xn̂ − x̂n) mm + x̂nmm + ynn̂m = ( x̂m + yn̂)nm , | {z } =0 also (x, n) + (y, m) ∼ ( x̂, n̂) + (y, m). Wegen der Kommutativität folgt auch, dass für (x, n) und (y, m) ∼ (ŷ, m̂) stets (x, n) + (y, m) ∼ (x, n) + (ŷ, m̂). Setzt man diese beiden Erkenntnisse zusammen, so folgt, dass für (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂) (x, n) + (y, m) ∼ ( x̂, n̂) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂) . Bei der Multiplikation geht man analog vor. Seien (x, n) ∼ ( x̂, n̂) und (y, m) gegeben. Dann gilt xyn̂m = (xn̂ − x̂n) ym + x̂nym = x̂ynm , | {z } =0 also (x, n) · (y, m) ∼ ( x̂, n̂) · (y, m). Die gleiche Argumentation wie bei + liefert das gewünschte Ergebnis. ❑ 2.5.5 Definition. Auf Q seien zwei algebraische Operationen +“ und ·“ definiert ” ” durch: Sind a, b ∈ Q, so wähle (x, n), (y, m) ∈ Z × N mit [(x, n)]∼ = a und [(y, m)]∼ = b, und setze sgn(a) := sgn((x, n)) sowie a + b := (x, n) + (y, m) ∼ , a · b := (x, n) · (y, m) ∼ . Wegen Lemma 2.5.4 hängen sgn(a), a + b und a · b nicht von den gewählten Repräsentanten (x, n) bzw. (y, m) ab. 2.5.6 Satz. Setzt man nun P = {a ∈ Q : sgn(a) = 1}, so ist hQ, +, ·, Pi ist ein angeordneter Körper. KAPITEL 2. DIE REELLEN ZAHLEN 36 Dabei ist [(0, 1)]∼ das neutrale Element bzgl. +, [(1, 1)]∼ das neutrale Element bezüglich ·. Zu [(x, n)]∼ ∈ Q ist [(−x, n)]∼ das additiv Inverse, und zu [(x, n)]∼ ∈ Q \ {0} ist [(sgn(x)n, |x|)]∼ das multiplikativ Inverse. Außerdem gilt [(x, n)]∼ ≤ [(y, m)]∼ ⇔ xm ≤ ny. (2.7) Die ganzen Zahlen Z sind in Q eingebettet durch ( Z → Q φ: x 7→ [(x, 1)]∼ Diese Einbettung erhält Addition, Multiplikation und Ordnung. Schließlich hat Q die Eigenschaft, dass die Teilmenge φ(N) von Q keine obere Schranke hat. Beweis. Die Gültigkeit der Rechenregeln wie Kommutativität, Assoziativität und Distributivität ergibt sich aus den entsprechenden Regeln für + und · auf Z × N. Für a = [(x, n)]∼ ∈ Q gilt a + [(0, 1)]∼ = [(x + 0, n · 1)]∼ = a, a · 1 = [(x · 1, n · 1)]∼ = a . Weiters hat man für b := [(−x, n)]∼ a + b = [(xn − xn, nn)]∼ = [(0, nn)]∼ = [(0, 1)]∼ = 0 . Sei nun a , 0, d.h. (x, n) / (0, 1) oder äquivalent x , 0. Mit c := [(sgn(x)n, |x|)]∼ folgt ac = [(sgn(x)xn, n|x|)]∼ = [(1, 1)]∼. Wegen sgn([(−x, n)]∼) = sgn(−x) = − sgn([(x, n)]∼) und sgn([(x, n)]∼) = 0 ⇔ x = 0 ⇔ [(x, n)]∼ = [(0, 1)]∼ gilt für a ∈ Q a∈P ⇔ sgn(a) = 1 a ∈ {0} ⇔ sgn(a) = 0 a ∈ −P ⇔ sgn(a) = −1 Daraus folgt sofort ˙ ∪˙ − P, Q = P∪{0} wobei das eine Vereinigung paarweiser disjunkter Mengen ist. Aus sgn([(x, n)]∼ + [(y, m)]∼) = sgn(xm + yn) und sgn([(x, n)]∼ · [(y, m)]∼) = sgn(xy) erhalten wir a, b ∈ P ⇒ a + b, a · b ∈ P. Somit ist hQ, +, ·, Pi ein angeordneter Körper, und wir haben damit eine Totalordnung ≤ auf Q. (2.7) folgt aus [(y, m)]∼ − [(x, n)]∼ = [(yn − xm, mn)]∼ ∈ {0} ∪ P ⇔ sgn(yn − xm) ≥ 0 ⇔ xm ≤ yn. Betrachte nun die Abbildung φ : Z → Q. Diese ist injektiv, denn (x, 1) ∼ (y, 1) genau dann wenn x = y. Dass sie die algebraischen Operationen erhält, rechnet man leicht nach. Die Verträglichkeit mit der Ordnung gilt, da wegen (2.7) x ≤ y ⇔ x · 1 ≤ y · 1 ⇔ [(x, 1)]∼ ≤ [(y, 1)]∼ ⇔ φ(x) ≤ φ(y). 2.5. DER KÖRPER Q 37 Angenommen [(x, n)]∼ ist eine obere Schranke von φ(N), also mn ≤ x für alle m ∈ N. Das ist aber offensichtlich falsch, wenn x ≤ 1 und man zum Beispiel m = 2 setzt. Ist x > 1, so erhält man mit m = x2 den Widerspruch x ≤ xn ≤ 1. ❑ x n Wir werden im Folgenden für die rationale Zahl [(x, n)]∼ stets das Symbol schreiben. Dieses Symbol drückt tatsächlich die Division von x durch n aus, denn man hat [(x, 1)]∼ = [(x, n)]∼ · [(n, 1)]∼ Wir sehen insbesondere, dass jede rationale Zahl der Quotient von zwei ganzen Zahlen ist. Nun wollen wir zeigen, dass jeder angeordnete Körper die rationalen Zahlen, und damit insbesondere auch die ganzen Zahlen, enthält. 2.5.7 Proposition. Sei hK, +, ·, Pi ein angeordneter Körper. Dann gibt es eine eindeutige Abbildung φ : Q → K, die nicht identisch gleich 0 ist, und welche mit der Addition und Multiplikation verträglich ist. Diese Abbildung ist dann injektiv und auch mit der Ordnung verträglich. Beweis. Für n ∈ N und x ∈ K haben wir im Abschnitt über die natürlichen Zahlen eine Funktion n 7→ nx von N nach K rekursiv durch 1x = x und (n′ )x = nx+x definiert (siehe Bemerkung 2.3.4). Nun nehmen wir für x ∈ K das multiplikativ neutrale Element 1K von K, und bezeichnen mit φ : N → K die entsprechende Funktion n 7→ n1K , welche offensichtlicherweise φ(1) = 1K und φ(n + 1) = φ(n) + 1K erfüllt. Mit vollständiger Induktion (nach m) zeigt man leicht, dass φ(n+m) = φ(n)+φ(m) und φ(n · m) = φ(n) · φ(m) für alle n, m ∈ N. Wegen 1K ∈ P (siehe Lemma 2.2.2) sieht man ebenfalls mit vollständiger Induktion, dass φ(n) ∈ P für alle n ∈ N. Insbesondere gilt immer φ(n) , 0K . Nun setzen wir φ auf Z dadurch fort, dass wir φ(0) = 0K und φ(−n) = −φ(n), n ∈ N setzen. Man beweist durch Fallunterscheidungen mit der in Definition 2.4.2 angegebenen Form von + und · auf Z auf elementare Art und Weise, dass diese Fortsetzung die Addition und Multiplikation erhält. Wegen (p, q ∈ Z) p < q ⇔ q − p ∈ N ⇔ φ(q − p) = φ(q) − φ(p) ∈ P ⇔ φ(p) < φ(q) ist φ auch mit der Ordnung verträglich. Da ganz Q von den Quotienten φ durch die Vorschrift x n mit x ∈ Z, n ∈ N, ausgeschöpft wird, lässt sich φ x n := φ(x) φ(n) zu einer Abbildung von Q nach K fortsetzen. Man beachte hier, dass aus nx = n̂x̂ φ( x̂) φ(x) = φ(n̂) . Also ist diese folgt, dass xn̂ = x̂n und daher φ(x)φ(n̂) = φ( x̂)φ(n) bzw. φ(n) Abbildung wohldefiniert. KAPITEL 2. DIE REELLEN ZAHLEN 38 Diese Fortsetzung erhält ebenfalls die Addition und Multiplikation, denn für x y n , m ∈ Q gilt xm + yn φ(xm + yn) x y =φ = = φ + n m nm φ(nm) y x φ(x)φ(m) + φ(y)φ(n) φ(x) φ(y) +φ , = + =φ φ(n)φ(m) φ(n) φ(m) n m φ x xy φ(xy) y =φ = = n m nm φ(nm) · x y φ(x)φ(y) φ(x) φ(y) ·φ . = · =φ φ(n)φ(m) φ(n) φ(m) n m Sie erhält auch die Ordnung, denn es gilt x y φ(x) φ(y) < ⇐⇒ xm < yn ⇐⇒ φ(x)φ(m) < φ(y)φ(n) ⇐⇒ < . n m φ(n) φ(m) Es folgt insbesondere, dass φ injektiv ist. Zur Eindeutigkeit von φ: Ist φ̃ eine weitere mit Addition und Multiplikation verträgliche Abbildung, sodass φ̃(x) , 0 für zumindest ein x ∈ Q, so folgt aus φ̃(x)φ̃(1) = φ̃(x1) = φ̃(x), dass φ̃(1) = 1K , und aus φ̃(0) + φ̃(0) = φ̃(0 + 0) = φ̃(0), dass φ̃(0) = 0K . Durch vollständige Induktion folgt nun φ̃(n) = φ(n) für n ∈ N. Aus φ̃(−n)+φ̃(n) = φ̃(0) = 0K = φ(−n) + φ(n) folgt φ̃(p) = φ(p), p ∈ Z. Schließlich folgt aus φ̃( np )φ̃(n) = φ̃(p) = φ(p) = φ( np )φ(n), dass φ̃ = φ. ❑ Das letzte Resultat zeigt uns, dass die rationalen Zahlen in einem gewissen Sinn der kleinste angeordnete Körper ist. Wenn wir im Folgenden von den natürlichen (ganzen, rationalen) Zahlen als Teilmenge eines angeordneten Körpers sprechen, so wollen wir darunter die gemäß Proposition 2.5.7 existierende isomorphe Kopie φ(N) = {n1k : n ∈ N}, φ(Z), bzw. φ(Q) verstehen und nicht mehr z.B. zwischen n und n · 1K unterscheiden. 2.5.8 Bemerkung. Die am Beginn vom Beweis von Proposition 2.5.7 konstruierte Einbettung φ der natürlichen Zahlen in einen angeordneten Körper lässt sich auch auf beliebigen Körpern K durchführen. Dabei kann es passieren, dass φ(n) = 0K für ein n ∈ N. Das kleinste derartige n ist dann eine Primzahl und heißt die Charakteristik des Körpers K. Ist hingegen immer φ(n) , 0K , so sagt man, dass K von Charakteristik Null ist. Insbesondere sind angeordnete Körper von Charakteristik Null. Man sieht leicht ein, dass dann φ injektiv ist, und man denselben Beweis wie den von Proposition 2.5.7 hernehmen kann, um zu zeigen, dass sich Q injektiv in jeden Körper der Charakteristik Null einbetten lässt. 2.5.9 Bemerkung. Die angegebene Art und Weise, aus Z die rationalen Zahlen zu konstruieren, lässt sich auf beliebige kommutative Integritätsringe R ausdehnen. Dazu betrachtet man R × (R \ {0}) und die Äquivalenzrelation ∼ mit (x, a) ∼ (y, b) ⇔ xb = ya darauf. Die in diesem Abschnitt gebrachten Ergebnisse (samt Beweise) gelten sinngemäß auch in dieser allgemeineren Situation, wobei man hier i.A. keine sgn-Funktion hat, und wobei das multiplikativ Inverse zu [(x, n)]∼ genau [(n, x)]∼ ist. (R × (R \ {0}))/∼ ist dann ein Körper (Quotientenkörper von R), aber i.A. kein angeordneter Körper. Wendet man diese Konstruktion auf Z an, so erhält man wieder Q. 2.6. ARCHIMEDISCH ANGEORDNETE KÖRPER 39 2.6 Archimedisch angeordnete Körper 2.6.1 Definition. Sei hK, +, ·, Pi ein angeordneter Körper. Dann heißt K archimedisch angeordnet, wenn N als Teilmenge von K nicht nach oben beschränkt ist. In Satz 2.5.6 haben wir gesehen, dass die rationalen Zahlen archimedisch angeordnet sind. Wir werden auch sehen, dass die reellen Zahlen archimedisch angeordnet sind. 2.6.2 Beispiel. Die Eigenschaft, dass hK, +, ·, Pi ein archimedisch angeordneter Körper ist, ermöglicht es uns etwa das Infimum von Mengen wie ( 1 :n∈N M= n ) zu berechnen. Der Vermutung nach ist inf M = 0. Um das zu beweisen, sei zunächst bemerkt, dass 0 offensichtlich eine untere Schranke von M ist. Wäre ǫ > 0 eine weitere untere Schranke von M, d.h. 0 < ǫ < 1 1 n , n ∈ N, so folgte n < ǫ , was aber der Eigenschaft von K, archimedisch angeordnet zu sein, widerspricht. In archimedisch angeordneten Körpern gilt der folgende für die später zu entwickelnde Konvergenztheorie wichtige 2.6.3 Satz. Sei hK, +, ·, Pi ein archimedisch angeordneter Körper. Sind x, y ∈ K, x < y, dann existiert p ∈ Q mit x < p < y 8 . Beweis. Seien zunächst x, y ∈ K mit 0 ≤ x < y gegeben. Dann ist y − x > 0 und damit 1 1 auch y−x > 0. Da K archimedisch angeordnet ist, gibt es ein n ∈ N mit n > y−x und daher n(y − x) > 1. Nach Satz 2.3.10 hat {k ∈ N : k > nx} ein Minimum, und somit gibt es eine kleinste natürliche Zahl m ∈ N, sodass m > nx. Ist m > 1, so folgt aus der Wahl von m, dass m − 1 ≤ nx. Ist m = 1, so folgt gemäß unserer Voraussetzung m − 1 = 0 ≤ nx. Also gilt immer m − 1 ≤ nx < m. Kombiniert man diese Ungleichung mit n(y − x) > 1, so folgt nx < m ≤ nx + 1 < ny , und damit x < mn < y. Ist schließlich x < 0, so können wir ein k ∈ N wählen mit k ≥ |x| (N ist nicht nach oben beschränkt). Es folgt 0 ≤ x + k < y + k, und nach dem eben bewiesenen x + k < mn < y + k. Nun ist mn − k eine rationale Zahl mit x < mn − k < y. ❑ 2.6.4 Bemerkung. Da man obigen Satz induktiv immer wieder anwenden kann, sieht man, dass zwischen zwei Zahlen sogar unendlich viele rationale Zahlen liegen. Ist Q ( K, so kann man mit einer linearen Transformation sogar zeigen, dass es eine nicht rationale Zahl zwischen 0 und 1 gibt, und weiters unter Verwendung von Satz 2.6.3, dass es zwischen zwei Zahlen von K auch eine nicht rationale Zahl gibt. 8 Diese Aussage nennt man auch die Dichteeigenschaft von Q in K. 40 KAPITEL 2. DIE REELLEN ZAHLEN 2.7 Das Vollständigkeitsaxiom Wie wir später sehen werden, ist die Vollständigkeit die Eigenschaft der reellen Zahlen, die sie unverwechselbar von anderen angeordneten Körpern unterscheidet. 2.7.1 Definition. Sei hK, +, ·, Pi ein angeordneter Körper. Dann heißt K vollständig angeordnet, wenn jede nach oben beschränkte Menge ein Supremum hat. Diese Eigenschaft nennen wir (S ). Wie schon im vorhergehenden Abschnitt erwähnt, gilt 2.7.2 Lemma. Ist hK, +, ·, Pi ein vollständig angeordneter Körper, so ist er archimedisch angeordnet. Beweis. Wäre nämlich N nach oben beschränkt, so existierte η = sup N. Sei n beliebig in N. Mit n gehört aber auch n + 1 zu N. Also gilt n + 1 ≤ η, und somit n ≤ η − 1. Daher ist η − 1 eine obere Schranke von N, aber selber kleiner als die kleinste obere Schranke von N. Das ist ein Widerspruch, und wir kommen zu dem Schluss, dass N nicht nach oben beschränkt sein kann. ❑ Nun gilt folgender wichtige Satz, dessen Beweis wir später (am Ende dieses Abschnittes oder in Kapitel 4) bringen werden. 2.7.3 Satz. Es gibt einen vollständig angeordneten Körper hL, +, ·, L+ i. Ist hK, +, ·, Pi ein weiterer vollständig angeordneter Körper, so gibt es einen Isomorphismus φ : L → K, also eine Bijektion, sodass φ mit den Operationen verträglich ist und sodass φ(L+ ) = P. Wenn wir ab jetzt von den reellen Zahlen sprechen, dann sei immer ein vollständig angeordneter Körper hL, +, ·, L+ i gemeint. Wir schreiben im Folgenden immer hR, +, ·, R+ i dafür. Wegen Satz 2.7.3 ist hR, +, ·, R+ i bis auf Kopien eindeutig. 2.7.4 Bemerkung. Zusammenfassend sei nochmals betont, dass die reellen Zahlen R ein vollständig angeordneter Körper sind, der die Körperaxiome (A1)-(A4), (M1)(M4), (D), die Axiome eines angeordneten Körpers (P1)-(P3) und (S ) erfüllt. Alle bis hierher gezeigten Rechenregeln und Eigenschaften von R lassen sich alle aus diesen Axiomen herleiten, bzw. haben wir hergeleitet. Auch die im Folgenden aufgebaute Analysis setzt nur auf diese Axiome auf. Die Vollständigkeit von R garantiert, dass es n-te Wurzeln von nichtnegativen Zahlen gibt. 2.7.5 Satz. Sei x ∈ R, x ≥ 0, und n ∈ N. Dann existiert genau eine Zahl y ∈ R, y ≥ 0, sodass yn = x. Beweis. Im Fall n = 1 ist die Aussage trivial. Sei also n ≥ 2. Wir zeigen zuerst die Eindeutigkeit. Seien y1 , y2 ≥ 0, und sei z.B. y1 < y2 . Dann folgt auch yn1 < yn2 (mit vollständiger Induktion zu zeigen) und daher können nicht beide der Gleichung yn = x genügen. Zur Existenz: Ist x = 0, so ist klarerweise yn = x für y = 0. Im Fall x > 0 sei E := {t ∈ R : t > 0, tn < x}. 2.7. DAS VOLLSTÄNDIGKEITSAXIOM 41 x Diese Menge ist nicht leer, denn z.B. t0 = 1+x ∈ E, da aus 0 < t0 < 1 und t0 < x folgt, n n dass t0 < t0 < x, und somit t0 < x. Setzt man t1 := 1 + x, dann ist t1 > 1, also auch t1n > t1 . Weiters ist t1 > x. Ist nun t ≥ t1 , so erhalten wir tn ≥ t1n > x, d.h. t < E. Also ist E nach oben beschränkt, da ja t1 eine obere Schranke ist. x ∈ E ist sicher Da R vollständig angeordnet ist, existiert y := sup E. Wegen 0 < 1+x n y > 0. Wir zeigen im Folgenden, dass y = x, und zwar indem wir die beiden anderen Möglichkeiten yn < x und yn > x ausschließen. Dazu machen wir die folgende Bemerkung. Für beliebige Elemente a, b ∈ R gilt (die mit vollständiger Induktion zu beweisende Gleichung) bn − an = (b − a)(bn−1 + bn−2 a + . . . + ban−2 + an−1 ) . (2.8) Also erhalten wir für 0 < a < b die Abschätzung bn − an < (b − a)nbn−1 . Angenommen yn < x, so wähle ein ǫ ∈ Q mit ! x − yn 0 < ǫ < min ,1 . n(y + 1)n−1 Dies ist wegen Satz 2.6.3 möglich, da ja x − yn > 0. Setze in obiger Abschätzung a = y und b = y + ǫ. Dann folgt (y + ǫ)n − yn < ǫn(y + ǫ)n−1 < ǫn(y + 1)n−1 < x − yn . Also ist (y + ǫ)n < x und daher y + ǫ ∈ E. Ein Widerspruch, denn y ist eine obere Schranke von E. Wäre yn > x, so setze man yn − x δ := n−1 . ny Dann ist 0 < δ < ny < y. Für jedes t ≥ y − δ folgt wieder unter Verwendung obiger Abschätzung, diesmal mit b = y, a = (y − δ), yn − tn ≤ yn − (y − δ)n < δnyn−1 = yn − x . Also tn > x, und daher t < E. Wir sehen, dass y − δ eine obere Schranke von E ist, ein Widerspruch, denn y ist die kleinste obere Schranke von E. ❑ Die nach obigem √ Satz eindeutig bestimmte Zahl y ≥ 0, die n-te Wurzel von x, 1 schreibt man auch als n x oder x n . 2.7.6 Bemerkung. Man betrachte die Funktion ( + R ∪ {0} → R+ ∪ {0} . y 7→ yn Gemäß Bemerkung 2.4.9 ist diese Funktion streng monoton wachsend und daher injektiv. √ Zu gegebenem x ist y = n x so, dass yn = x. Also ist y 7→ yn auch surjektiv als Funktion von√R+ ∪ {0} nach R+ ∪ {0}. Sie ist also bijektiv und ihre Umkehrfunktion√ist genau x 7→ n x. Wegen y1 < y2 ⇔ yn1 < yn2 (siehe Bemerkung 2.4.9) ist auch x 7→ n x streng monoton wachsend. KAPITEL 2. DIE REELLEN ZAHLEN 42 2.7.7 Bemerkung. Nun sehen wir auch, dass R nicht nur aus rationalen Zahlen bestehen kann, also Q ( R gilt. Wäre nämlich √ p 2 = ∈ Q, q (2.9) so kann man p, q teilerfremd wählen, d.h. es gibt kein k ∈ N \ {1}, das p und q teil9 . Insbesondere ist nur höchstens eine der Zahlen p oder q gerade. Ausquadrieren und mit q2 Multiplizieren in (2.9) ergibt: 2q2 = p2 . Da eine Zahl genau dann gerade ist, wenn ihr Quadrat es ist, folgt dass p gerade und damit q ungerade ist. Schreibt man p = 2m, so folgt 2q2 = 4m2 , und damit q2 = 2m2 . Wir erhalten daraus den Widerspruch, dass auch q gerade sein müsste. Wenn man nicht verwenden will, dass jede natürliche Zahl eine eindeutige Primfaktorzerlegung hat, so können wir die oben verwendeten Tatsachen aus der elementaren Zahlentheorie folgendermaßen verifizieren. Die Tatsache, dass man einen Bruch qp mit p, q > 0 teilerfremd schreiben kann, sieht man, indem man die Menge aller p̂ ∈ N betrachtet, sodass es ein q̂ ∈ N gibt mit q̂p̂ = qp . Nach Satz 2.3.10 gibt es ein kleinstes p̂ in dieser Menge, das nun keinen gemeinsamen Teiler mit q̂ haben kann, da sonst p̂ nicht die Minimalitätseigenschaft hätte. Um zu sehen, dass eine ganze Zahl p genau dann gerade ist, wenn p2 gerade ist, so an Bemerkung 2.4.12 erinnert, wo wir insbesondere gesehen haben, dass eine Zahl der Form 2k + 1 nicht gerade ist. Ist nun p gerade, d.h. p = 2s, s ∈ Z, so auch p2 = 2s·2s = 2(2s2 ). Sei umgekehrt p ungerade. Wir nehmen p > 0 an, da wir sonst −p betrachten können. Da p nicht gerade ist, folgt p = 2m + 1, und damit ist p2 = 4m2 + 4m + 1 = 2(2m2 + 2m) + 1 auch nicht gerade. 2.7.8 Definition. Ist x > 0 und r ∈ Q, so stellen wir r in der Form r = N dar, und definieren √ p xr = q x . p q mit p ∈ Z, q ∈ Da die Darstellung einer rationalen Zahl als Bruch nicht eindeutig ist, müssen wir nachweisen, dass die Definition von xr nicht von der Wahl von p, q abhängt. Dazu brauchen wir q 2.7.9 Lemma. Ist x > 0 und q ∈ N, so gilt q 1x = √q1x und √q √ ( q x) p = x p . q Beweis. q 1x = √q1x folgt aus ( √q1x )q = ( √q1x)q = q q 1 1 q x die eindeutige Lösung y von y = x ist. 1 x (2.10) und der Tatsache, dass nach Satz 2.7.5 √q trivialerweise richtig, da ja 1 = 1. Sonst folgt (2.10)√aus √q Istp pq = 0,√qso qistp (2.10) q (( x) ) = (( x) ) = x p (siehe (2.5)) und aus der Tatsache, dass nach Satz 2.7.5 x p q p die eindeutige Lösung y von y = x ist. ❑ Ist jetzt r = p q = m n, so folgt wegen pn = qm √ p √ pn √ qm √ q ( q x ) n = q x = q x = ( q x ) m = xm . Zieht man links und rechts die n-te Wurzel, so gilt wegen (2.10) √q 9 Eine p x = √n m x , ganze Zahl k , 0 teilt eine ganze Zahl n, wenn es ein m ∈ Z gibt, sodass km = n. 2.7. DAS VOLLSTÄNDIGKEITSAXIOM 43 und damit ist xr wohldefiniert. Außerdem gelten die (mit einer Beweisführung ähnlich wie der von Lemma 2.7.9 zu zeigenden) Rechenregeln (r, s ∈ Q, x > 0) xr+s = xr x s , (xr ) s = xrs , x−r = 1 . xr Ohne Beweis sei noch das Lemma vom iterierten Supremum erwähnt. 2.7.10 Lemma. Seien M, N zwei nichtleere Mengen und f : M × N → R eine beschränkte Funktion, d.h. ∃C ∈ R+ : ∀(m, n) ∈ M × N ⇒ | f ((m, n))| ≤ C. Dann gilt sup{sup{ f (m, n) : m ∈ M} : n ∈ N} = sup{ f (m, n) : (m, n) ∈ M × N} = sup{sup{ f (m, n) : n ∈ N} : m ∈ M}. Eine entsprechende Aussage gilt fürs Infimum. Die Existenz und Eindeutigkeit der reellen Zahlen Am Ende dieses Abschnitts werden wir beweisen, dass ein vollständig angeordneter Körper tatsächlich existiert, und dass alle solche immer Kopien von einander sind. Eine andere Art und Weise, das zu tun, findet sich in Kapitel 4. Um diese, anspruchsvolle, Konstruktion zu motivieren denken wir uns eine Gerade gezeichnet, gemeinsam mit einer Einheitsstrecke. Auf dieser Geraden denken wir uns die rationalen Zahlen durch fortgesetztes unterteilen der Einheitsstrecke aufgetragen. Obwohl es -anschaulich- beliebig nahe an jedem Punkt eine rationale Zahl gibt, gibt es nach dem vorher Gesagten Punkte, welche nicht rational sind. Unsere Konstruktion beruht nun auf der folgenden Bemerkung, die R.Dedekind10 gemacht hat: Zerfallen alle Punkte der Geraden in zwei Klassen von der Art, dass jeder Punkt der ersten Klasse links von jedem Punkt der zweiten Klasse liegt, so existiert ein und nur ein Punkt, welcher diese Einteilung aller Punkte in zwei Klassen, diese Zerschneidung der Geraden in zwei Stücke, hervorbringt. Man kann also einen Punkt P der Geraden identifizieren mit der Menge aller Punkte die links von ihm liegen. Da man nun aber mit den rationalen Punkten beliebig nahe an den Punkt P herankommt, genügt es, alle rationalen Punkte die links von P liegen zu kennen um P selbst eindeutig zu rekonstruieren. 2.7.11 Satz. Es gibt einen vollständig angeordneten Körper. Dieser ist bis auf Isomorphie eindeutig bestimmt. Beweis. Der Beweis dieses Satzes ist relativ lang und wird in mehreren Schritten geführt von denen wir auch nicht alle im Detail ausführen werden. Schritt 1: Eine Teilmenge α von Q heißt ein Dedekindscher Schnitt, wenn sie die folgenden drei Eigenschaften besitzt: (I) (II) (III) α , ∅, α , Q. Ist p ∈ α, dann ist auch das rationale Intervall (−∞, p] ⊆ α. Ist p ∈ α, so existiert ein ǫ ∈ Q, ǫ > 0, sodass p + ǫ ∈ α (und wegen (II) sogar (−∞, p + ǫ] ⊆ α). Die Menge aller Dedekindschen Schnitte bezeichnen wir mit K. Dieser Begriff modelliert die Anschauung der Menge aller (rationalen) Punkte die links von dem Punkt (der ” Geraden) liegen“. Die Eigenschaft (III) besagt, dass α kein größtes Element hat. Aus der Eigenschaft (II) erhält man unmittelbar die folgenden beiden Aussagen: (i) (ii) Ist p ∈ α und q < α, dann ist p < q. Ist r < α und s > r, so ist s < α. Schritt 2: Wir definieren eine Relation ≤“ auf K durch ” α ≤ β : ⇐⇒ α ⊆ β, α, β ∈ K , Diese Relation ist offenbar eine Halbordnung. Wir zeigen, dass sie sogar eine Totalordnung ist. Seien α, β ∈ K und sei angenommen, dass α β, d.h. α * β. Dann existiert also p ∈ α mit p < β. Es folgt, dass für alle q > p ebenfalls q < β, und dass aus q < p folgt q ∈ α. Ist also q ∈ β, so muss q < p sein und daher zu α gehören. D.h. es gilt β ≤ α. Für α ( β schreiben wir auch α < β. 10 Richard Dedekind. 6.10.1831 Braunschweig - 12.2.1916 Braunschweig KAPITEL 2. DIE REELLEN ZAHLEN 44 Schritt 3: In diesem Schritt zeigen wir, dass K mit der Ordnung ≤ die Supremumseigenschaft besitzt. Sei A ⊆ K eine nichtleere und nach oben beschränkte Teilmenge von K. Setze γ := [ α. α∈A Wir zeigen, dass γ ∈ K. Da A nichtleer ist, existiert α0 ∈ A. Nun ist α0 nichtleer und α0 ⊆ γ, also ist auch γ , ∅. Da A nach oben beschränkt ist, existiert β ∈ K mit α ⊆ β für alle α ∈ A. Daher ist auch γ ⊆ β. Da β , Q, ist auch γ , Q. Also erfüllt γ die Eigenschaft (I). Ist p ∈ γ, so existiert α ∈ A mit p ∈ α. Also folgt (−∞, p] ⊆ α ⊆ γ. Weiters existiert ein rationales ǫ > 0 mit r + ǫ ∈ α ⊆ γ. Wir sehen also, dass γ die Eigenschaften (II) und (III) hat. Es bleibt γ = sup A zu zeigen. Die Tatsache α ≤ γ, ∀α ∈ A ist klar. Ist β ∈ K mit β ≥ α, α ∈ A, d.h. β ⊇ α, α ∈ A, so folgt da γ die Vereinigung aller α ∈ A ist, dass β ⊇ γ. Also ist γ tatsächlich die kleinste obere Schranke von A. Schritt 4: Wir definieren eine Addition auf K. Für α, β ∈ K setze Weiters setze 0∗ := {p ∈ Q : p < 0}. α + β := r + s : r ∈ α, s ∈ β . Als erstes zeigen wir, dass α + β ∈ K. Da α , ∅ und β , ∅, folgt auch α + β , ∅. Wähle r′ < α und s′ < β, dann ist r′ > r, r ∈ α, und s′ > s, s ∈ β. Also erhalten wir r′ + s′ > r + s, r ∈ α, s ∈ β. Damit kann r′ + s′ nicht zu α + β gehören. Wir sehen, dass α + β die Eigenschaft (I) besitzt. Sei nun p ∈ α + β gegeben, und schreibe p = r + s mit gewissen r ∈ α, s ∈ β. Für q < p folgt q − s < r und daher q − s ∈ α. Also q = (q − s) + s ∈ α + β, und wir sehen, dass (II) gilt. Zu p = r + s ∈ α + β wähle ein rationales ǫ > 0 mit r + ǫ ∈ α, dann folgt r + s + ǫ ∈ α + β, also gilt auch (III). Die Addition ist kommutativ: α + β = {r + s : r ∈ α, s ∈ β} = {s + r : r ∈ α, s ∈ β} = β + α . Sie ist assoziativ, denn α + (β + γ) = r + u : r ∈ α, u ∈ (β + γ) = = r + (s + t) : r ∈ α, s ∈ β, t ∈ γ = (r + s) + t : r ∈ α, s ∈ β, t ∈ γ = = v + t : v ∈ (α + β), t ∈ γ = (α + β) + γ . Nun identifizieren wir 0∗ als das neutrale Element bezüglich der Addition: Ist r ∈ α und s ∈ 0∗ , so folgt r + s < r, also r + s ∈ α. D.h. α + 0∗ ≤ α. Sei umgekehrt p ∈ α, und wähle ein rationales ǫ > 0 mit p + ǫ ∈ α. Dann gilt p = p + ǫ + (−ǫ) ∈ α + 0∗ . Es bleibt zu zeigen, dass jedes Element von K ein additives Inverses besitzt. Sei also α ∈ K gegeben. Setze β := p ∈ Q : ∃ ǫ > 0 : p + ǫ < −α . Als erstes zeigen wir, dass β ∈ K. Sei s < α und setze p := −s − 1, dann ist p + 1 = −s < −α, also p ∈ β, d.h. β , ∅. Ist q ∈ α, so ist −q < β (da sonst q − ǫ < α, und somit q < α) und damit β , Q. Es gilt also (I). Sei nun p ∈ β gegeben. Wähle ǫ > 0, sodass −p − ǫ < α. Ist q < p, so gilt −q − ǫ > −p − ǫ und daher −q − ǫ < α, d.h. q ∈ β. Es gilt also (II). Mit t := p + 2ǫ ist t > p und −t − 2ǫ = −p − ǫ < α, d.h. t ∈ β. Also gilt (III). Ist r ∈ α und s ∈ β, so ist −s < α und daher r < −s. Daher ist r + s < 0, bzw, r + s ∈ 0∗ . Wir sehen, dass α + β ≤ 0∗ . Umgekehrt sei v ∈ 0∗ . Setze w := − 2v > 0. Sei q < α, Dann gibt es, da Q archimedisch angeordnet ist, ein n1 ∈ N mit n1 w > q und daher n1 w < α. Sei q ∈ α, dann gibt es auch ein n2 ∈ N mit n2 w > −q, und daher mit −n2 w ∈ α. Es existiert also n ∈ Z mit nw ∈ α aber (n + 1)w < α. Setze p := −(n + 2)w. Dann ist p ∈ β, denn −p − w < α. Wir haben also v = nw + p ∈ α + β . Schritt 5: Die Addition ist mit der Ordnung verträglich. Ist nämlich α ≤ β, d.h. α ⊆ β, und ist γ ∈ K, so folgt α+ γ ⊆ β + γ. Addieren von −γ zeigt, dass in der Tat α ≤ β ⇔ α + γ ≤ β + γ. Daraus folgt unmittelbar α < β ⇔ β − α ∈ P := {γ ∈ K : γ > 0}, und die Tatsache, dass mit α, β ∈ P auch α + β > α + 0∗ > 0∗ und somit α + β ∈ P. Schritt 6: Wir definieren eine Multiplikation auf K. Seien zunächst α, β > 0. Dann setze α · β := p ∈ Q : ∃r ∈ α, s ∈ β, r, s > 0 : p ≤ rs . Man zeigt genauso wie in Schritt 4, dass α· β tatsächlich ein Element von K ist, dass die Multiplikation kommutativ und assoziativ ist, und dass das Distributivgesetz gilt. Weiters definieren wir 1∗ := {p ∈ Q : p < 1} . 2.7. DAS VOLLSTÄNDIGKEITSAXIOM 45 Wieder sieht man analog wie in den vorherigen Beweisschritten, dass 1∗ neutrales Element bezüglich der Multiplikation ist, und dass jedes Element α > 0 ein multiplikatives Inverses 1 β := p ∈ Q : ∃ ǫ > 0 : p + ǫ < { : q ∈ α, q > 0} q besitzt. Um nun die Multiplikation auch für Elemente α < 0 zu definieren, setze (−α) · (−β) (−α) · β α · β := α · (−β) 0∗ , , , , α < 0∗ , β < 0∗ α < 0∗ , β > 0∗ α > 0∗ , β < 0∗ α = 0∗ oder β = 0∗ Der Beweis der Rechengesetze folgt aus den bereits bekannten Regeln für die Multiplikation von positiven Zahlen durch Fallunterscheidungen. Um α, β ∈ P ⇒ α · β ∈ P einzusehen, wähle man a ∈ α \ 0∗ , b ∈ β \ 0∗ . Also a, b ≥ 0. Wegen (III) können wir sogar a, b > 0 annehmen. Es folgt a · b ∈ α · β \ 0∗ und somit α, β ∈ P. Wir haben also bewiesen, dass hK, +, ·, Pi ein vollständig angeordneter Körper ist. Schritt 7: Wie jeder angeordnete Körper enthält K eine Kopie von Q, daher eine mit den Operationen und mit ≤ Verträgliche Injektion φ : Q → K, vgl. Proposition 2.5.7. Da φ(1) = 1∗ , folgt mit vollständiger Induktion φ(n) = {p ∈ Q : p < n}. Außerdem zeigt man, dass für r, s ∈ Q und αr = {p ∈ Q : p < r}, αs = {p ∈ Q : p < s} gilt, dass αr + αs = {p ∈ Q : p < r + s}, − αr = {p ∈ Q : p < −r}, αr · αs = {p ∈ Q : p < rs}, α−1 r = {p ∈ Q : p < 1 }. r Für r > 0 sieht man die letzte Tatsache z.B. folgendermaßen. 1 1 1 : q ∈ Q, 0 < q < r} = p ∈ Q : ∃ ǫ > 0 : p + ǫ ≤ = {p ∈ Q : p < }. α−1 r = p ∈ Q : ∃ǫ > 0 : p + ǫ < { q r r Da φ( nx ) = sgn(x) φ(|x|) φ(n) für x ∈ Z, n ∈ N, folgt somit φ(r) = αr , r ∈ Q. Schritt 8: Wir zeigen, dass jeder vollständig angeordnete Körper L isomorph zu dem oben konstruierten Körper K ist. Beachte, dass L und K als angeordnete Körper den Körper der rationalen Zahlen enthalten. Definiere ω: ( L x → 7 → K {p ∈ Q : p < x} , ψ: ( K α → 7→ L sup α Die Abbildung ω ist wohldefiniert, denn {p ∈ Q : p < x} ist, wie man unmittelbar überprüft, ein Dedekindscher Schnitt. Auch ψ ist wohldefiniert, denn α ist eine nichtleere und beschränkte Teilmenge von Q ⊆ L und besitzt daher in L ein Supremum. Außerdem sind diese beiden Abbildungen streng monoton wachsend, und für p ∈ Q gilt ω(p) = α p und ψ(α p ) = sup α p = p. Aus Lemma 2.7.12 folgt, dass ω und ψ mit den Operationen verträglich sind. Wendet man Lemma 2.7.12 nun auch auf ω ◦ ψ und ψ ◦ ω an, so folgt aus der Eindeutigkeitsaussage, dass ω ◦ ψ = id K und ψ ◦ ω = idL . Also sind ω und ψ zueinander inverse Bijektionen, welche mit Addition, Multiplikation und Ordnung verträglich sind. Daher sind L und K als angeordnete Körper isomorph. ❑ 2.7.12 Lemma. Seien K1 und K2 zwei vollständig angeordnete Körper, und bezeichne Q1 bzw. Q2 die gemäß Proposition 2.5.7 existierende Kopie von Q, welche in K1 bzw. K2 enthalten ist. Seien φ j : Q → K j , j = 1, 2, die entsprechenden Einbettungen. Ist ω : K1 → K2 streng monton wachsend und so, dass ω(φ1 (p)) = φ2 (p) für alle p ∈ Q, dann ist ω mit +, · verträglich. Weiters muss jede weitere streng monton wachsend Abbildung ω̃ : K1 → K2 mit ω̃(φ1 (p)) = φ2 (p), p ∈ Q schon mit ω übereinstimmen. KAPITEL 2. DIE REELLEN ZAHLEN 46 Beweis. Zunächst beweisen wir die letzte Aussage. Angenommen es gäbe ein x ∈ K1 , sodass φ1 (x) , φ2 (x). O.B.d.A. sei ω(x) < ω̃(x). Nach Satz 2.6.3 gibt es ein p ∈ Q mit ω(x) < φ2 (p) < ω̃(x). Nun muss x < φ1 (p), da widrigenfalls φ1 (p) ≤ x und daher ω(φ1 (p)) = φ2 (p) ≤ ω(x). Andererseits muss aber φ1 (p) < x, da sonst x ≤ φ1 (p) und daher ω̃(x) ≤ φ2 (p) = ω̃(φ1 (p)). Beides kann aber nicht gleichzeitig gelten. Somit muss ω = ω̃. Zur Verträglichkeit mit + halte man zunächst ein p ∈ Q fest, und betrachte ωp : ( K1 x → 7→ K2 ω(x + φ1 (p)) − φ2 (p) . Wegen den Eigenschaften von φ1 , φ2 aus Proposition 2.5.7 folgt ω p (φ1 (q)) = ω(φ1 (q + p)) − φ2 (p) = φ2 (q) für alle q ∈ Q. Außerdem ist ω p offensichtlicherweise streng monoton wachsend. Nach obiger Eindeutigkeitsaussage folgt ω = ω p bzw. ω(x + φ1 (p)) = ω(x) + φ2 (p) = ω(x) + ω(φ1 (p)) für alle x ∈ K1 und wegen der Beliebigkeit von p auch für alle p ∈ Q. Nun betrachte man für ein festes y ∈ K1 die Abbildung ωy (x) = ω(x + y) − ω(y). Wegen dem eben gezeigten erfüllt diese ωy (φ1 (q)) = φ2 (q), q ∈ Q, und sie ist ebenfalls streng monoton wachsend. Also folgt ωy = ω, bzw. ω(x + y) = ω(x) + ω(y), x, y ∈ K1 . ω(x·φ1 (p)) Indem man zunächst x 7→ φ (p) für festes p ∈ Q \ {0} und dann x 7→ ω(x·y) ω(y) für festes y ∈ K1 \ {0} betrachtet, folgt 1 wie oben auch die Verträglichkeit mit ·. ❑ 2.8 Die komplexen Zahlen Betrachtet man die quadratische Gleichung x2 + 1 = √ 0, und sucht die Lösungen davon, indem man formal rechnet, so erhält man x1,2 = ± −1, also eigentlich kein Ergebnis. Das stimmt mit der Tatsache überein, dass die Gleichung x2 + 1 = 0 keine reellen Lösungen hat. Aus vielen Gründen wäre es trotzdem wünschenswert mit Wurzeln√aus negativen Zahlen rechnen zu können, denn dann wären selbstverständlich x1,2 = ± −1 Lösungen der Gleichung. Wir formalisieren nun das Konzept der Wurzel aus einer negativen Zahl. 2.8.1 Definition. Die Menge der komplexen Zahlen C wird definiert als die Menge der Paare reeller Zahlen, C := R2 = R × R. Wir schreiben eine komplexe Zahl (a, b) ∈ C an als a + ib. Hierbei ist i ein formales Symbol, die sogenannte imaginäre Einheit. Ist z = a + ib ∈ C, so heißt a der Realteil und b der Imaginärteil von z. Man schreibt auch a = Re z und b = Im z. Für zwei komplexe Zahlen a + ib und c + id definieren wir eine Addition und eine Multiplikation wie folgt: (a + ib) + (c + id) := (a + c) + i(b + d), (2.11) (a + ib) · (c + id) := (ac − bd) + i(bc + ad). (2.12) Wir wollen die triviale aber nützliche Tatsache bemerken, dass zwei komplexe Zahlen genau dann übereinstimmen, wenn ihre Realteile und ihre Imaginärteile übereinstimmen. √ Die imaginäre Einheit modelliert die Zahl“ −1. Tatsächlich gilt nach Definition ” der Multiplikation von komplexen Zahlen i2 = −1. 2.8.2 Satz. Die komplexen Zahlen hC, +, ·i sind ein Körper, wobei 0 + i0 das neutrale Element bezüglich +, 1 + i0 das neutrale Element bezüglich ·, (−a) + i(−b) die additiv Inverse zu a + ib, und −b a +i 2 (2.13) a2 + b2 a + b2 die multiplikativ Inverse zu a + ib , 0 + i0 ist. 2.8. DIE KOMPLEXEN ZAHLEN 47 Beweis. Wir müssen die Körperaxiome aus Definition 2.1.1 nachweisen. Die Kommutativität von + und · (Axiome (A4),(M4)) sieht man unmittelbar aus der Definition in (2.11) und (2.12). Genauso schnell überzeugt man sich von der Gültigkeit der Assoziativität von + ((A1)). Wegen ((a + ib) · (c + id)) · (x + iy) = ((ac − bd) + i(bc + ad)) · (x + iy) = (acx − bdx − bcy − ady) + i(bcx + adx + acy − bdy) = = (a + ib) · ((cx − dy) + i(cy + dx)) = (a + ib) · ((c + id) · (x + iy)) gilt (M1). Ganz leicht sieht man, dass 0 + i0 das additiv neutrale Element von C ist ((A2)), und dass (−a) + i(−b) das zu a + ib additiv inverse Element ist ((A3)). Genauso elementar sieht man, dass 1 + i0 das multiplikativ neutrale Element ist ((M2)), und dass die in (2.13) angegebene komplexe Zahl das zu a + ib multiplikativ inverse Element ist ((M3)). Schließlich gilt (D), da in R das Distributivgesetz gilt und da (x + iy) · ((a + ib) + (c + id)) = (x + iy) · ((a + c) + i(b + d)) = (xa + xc − yb − yd) + i(xb + xd + ya + yc) = ((xa − yb) + i(xb + ya)) + ((xc − yd) + i(xd + yc)) = (x + iy) · (a + ib) + (x + iy) · (c + id). ❑ Die reellen Zahlen sind in C eingebettet vermöge der Abbildung a 7→ a + i · 0. Offenbar ist diese Einbettung ein Körperhomomorphismus (verträglich mit den Verknüpfungen +, ·). Insbesondere sehen wir, dass C ein R-Vektorraum ist, die dafür nötigen Rechengesetze gelten, da sie einfach Spezialfälle der Rechenregeln des Körpers C sind. Eine Basis von C als R-Vektorraum lässt sich leicht angeben, nämlich {1, i}. Denn (nach Definition) lässt sich jede komplexe Zahl in eindeutiger Weise anschreiben als Linearkombination a · 1 + b · i mit den reellen Koeffizienten a, b. Wir sehen also, dass die Dimension von C als R-Vektorraum gleich 2 ist. Statt a + i0 schreibt man üblicherweise a und statt 0 + ib auch ib. Graphisch lassen sich die Zahlen aus C als Punkte in der Ebene veranschaulichen, man spricht auch von der Gausschen Zahlenebene11. Dabei ist √ (2.14) |z| := a2 + b2 (≥ 0) die Länge des Vektors von (0, 0) nach (a, b). Wir nennen |z| auch den Betrag von z. Nicht ganz zufällig wird der Betrag auf den komplexen Zahlen gleich wie die Betragsfunktion auf einem bewerteten Körper bezeichnet. Es gelten nämlich vergleichbare Regeln (z, w ∈ C): (i) | Re z| ≤ |z|, | Im z| ≤ |z| (ii) |zw| = |z||w|. (iii) |z + w| ≤ |z| + |w|. (iv) |z + w| ≥ ||z| − |w||. 11 Carl-Friedrich Gauß. 30.4.1777 Braunschweig - 23.2.1855 Göttingen KAPITEL 2. DIE REELLEN ZAHLEN 48 Im C z = a + ib ib |z| 0 |z| = |z| b Re z = a − ib −ib Abbildung 2.3: Zahlenebene (i) und (ii) lassen sich dabei elementar nachprüfen. Die Dreiecksungleichung folgt durch Ausquadrieren, und die Dreiecksungleichung nach unten beweist man genauso, wie bei den angeordneten Körpern (siehe (2.1)). Eine weiters Begriffsbildung im Zusammenhang mit den komplexen Zahlen ist die der konjugiert komplexen Zahl z zu einer komplexen Zahl z = a + ib: z := a − ib . Offenbar gilt |z| = |z|, |z|2 = zz, und z−1 = |z|z2 wenn z , 0. Der Übergang von z zu seiner konjugierten z̄ entspricht bei der graphischen Veranschaulichung der komplexen Zahlen genau dem Spiegeln an der reellen Achse. Kapitel 3 Der Grenzwert Schon sehr bald hat sich in der Mathematik herausgestellt, dass eine rein algebraische Betrachtungsweise der reellen Zahlen nicht immer das geeignete Instrument zur Modellierung der in den Naturwissenschaften auftretenden Phänomene ist. Probleme wie unendlich oft immer kleiner werdende Größen zusammenzählen“ oder einer gewis” ” sen Zahl immer näher kommen“, lassen sich mit den bisher rein algebraischen Methoden nicht betrachten. Man denke zum Beispiel an die Approximation der Zahl 2π, indem man einem Kreis mit Radius eins regelmäßige n-Ecke einschreibt, von diesen den Umfang berechnet, und dann n immer größer werden lässt. Das führt zu dem Begriff des Grenzwertes einer Folge von Zahlen. Dazu wollen wir das einer Zahl immer näher Kommen“bzw. Konvergieren mathematisch exaktifi” zieren: Eine Folge x1 , x2 , x3 , . . . von reellen Zahlen heißt konvergent gegen eine reelle Zahl x, falls es zu jedem beliebig kleinen Abstand ǫ > 0 einen Folgenindex N gibt, sodass ab diesem Index alle Folgenglieder einen Abstand von x kleiner als ǫ haben; sodass also |xn − x| < ǫ, für alle n ≥ N. Wir wollen nun aber Konvergenzbetrachtungen nicht nur für Folgen von reellen Zahlen betrachten, sondern auch z.B. für Folgen von komplexen Zahlen oder für Folgen von Punkten im Raum. Wie man aus der Definition der Konvergenz erahnen kann, benötigt man dazu lediglich einen Abstandsbegriff auf dem betrachteten Objekt. Wir führen dazu den Begriff des metrischen Raumes ein. 3.1 Metrische Räume Um zu sagen, wann ein Punkt x nahe“ bei einem anderen Punkt y liegt, müssen wir in ” irgendeiner Weise den Abstand von x zu y messen können. Betrachten wir zum Beispiel die Menge X aller Punkte der Ebene. Dann ist es naheliegend, als Abstand zwischen x und y die Länge l x,y der Strecke, die die beiden Punkte verbindet, zu nehmen. Man sieht, dass die folgenden Regeln gelten: Stets ist l x,y ≥ 0, denn Längen sind immer positiv. Dabei gilt =“ genau dann, wenn x = y, denn eine Strecke hat dann und nur dann Länge ” 0, wenn Anfangs- und Endpunkt gleich sind. Es ist stets l x,y = ly,x , denn vertauscht man Anfangs- und Endpunkt so bleibt die Länge der Strecke erhalten. Schwieriger 49 KAPITEL 3. DER GRENZWERT 50 einzusehen, aber anschaulich doch klar, ist die Gültigkeit der Dreiecksungleichung: In jedem Dreieck ist die Länge einer Seite höchstens so groß, wie die Summe der Längen der anderen Seiten. D.h. für je drei Punkte (die Eckpunkte des Dreiecks) gilt l x,z ≤ l x,y + ly,z . Es sind genau diese drei Eigenschaften, die es ausmachen, dass die Länge der ” Verbindungsstrecke“ ein vernünftiger Abstandsbegriff ist. 3.1.1 Definition. Sei X eine Menge, d : X × X → R eine Funktion. Dann heißt d eine Metrik auf X, und hX, di ein metrischer Raum, wenn gilt (M1) Für alle x, y ∈ X ist d(x, y) ≥ 0. Es gilt d(x, y) = 0 genau dann, wenn x = y. (M2) Für alle x, y ∈ X gilt d(x, y) = d(y, x). (M3) Sind x, y, z ∈ X, so gilt die Dreiecksungleichung: d(x, z) ≤ d(x, y) + d(y, z) . 3.1.2 Bemerkung. Man kann allgemeiner auch Metriken d betrachten, die X × X nicht nach R, sondern nach K abbilden, wobei hK, +, ·, Pi ein archimedisch angeordneter Körper ist. Wir werden darauf im Kapitel 4 zurück kommen. 3.1.3 Beispiel. Ist X = R und d(x, y) = |x − y| für x, y ∈ R, so sieht man sofort, dass (M1) und (M2) erfüllt sind. (M3) folgt aus der Dreiecksungleichung für den Betrag (siehe Lemma 2.2.11): |x − z| = |(x − y) + (y − z)| ≤ |x − y| + |y − z|, x, y, z ∈ R. (3.1) Ist X = C R2 und d(z, w) = |z − w| für z, w ∈ C, wobei |.| hier der komplexe Betrag ist, so erfüllt d offensichtlich (M2) p und d(z, w) ≥ 0. Schreibt man z = a+ib und w = c + id, so gilt d(z, w) = (a − c)2 + (b − d) = 0 genau dann, wenn a − c = 0 und b − d = 0, also z = w. Somit ist (M1) erfüllt. (M3) folgt aus der Dreiecksungleichung für den komplexe Betrag ähnlich wie in (3.1). Um eine Metrik auf X := R p zu definieren, setzen wir d2 (x, y) := p X j=1 12 (x j − y j )2 , x = (x1 , . . . , x p ), y = (y1 , . . . , y p ) ∈ X . Man spricht von der euklidischen Metrik auf Rn . Die Gültigkeit von (M1) und (M2) ist aus der Definition offensichtlich. Die Dreiecksungleichung (M3) folgt hingegen aus dem unten folgenden Lemma 3.1.4. Im Falle p = 1, also X = R, gilt d2 (x, y) = |x − y|, und damit ist der Abstand zweier Zahlen bzgl. der euklidischen Metrik nichts anderes als der Betrag der Differenz dieser Zahlen. Die euklidische Metrik auf R2 hat eine analoge Interpretation mit Hilfe des Betrages einer √ komplexen Zahl. Für z = a + ib ∈ C haben wir den Betrag definiert als |z| = a2 + b2 . Daraus sieht man, dass die euklidische Metrik auf R2 gerade d2 (z, w) = |z − w|, z = a + ib, w = c + id ∈ C , 3.1. METRISCHE RÄUME 51 ist, wobei wir hier die komplexen Zahlen in der Gausschen Zahlenebene, also als Elemente von R2 interpretieren. (M3) folgt in den Fällen p = 1, 2 wie schon oben gezeigt, aus der bereits bewiesenen Dreiecksungleichung für die Betragsfunktion 3.1.4 Lemma. Seien p ∈ N, a1 , . . . , a p , b1 , . . . , b p ∈ R. Dann gilt (Schwarzsche Ungleichung1) p 2 p p X X 2 X 2 ai bi ≤ ai · bi , i=1 i=1 i=1 2 und (Minkowskische Ungleichung ) p 1 p 12 p 12 X 2 X X (ai + bi )2 ≤ a2i + b2i . i=1 i=1 i=1 Beweis. Wir verwenden die Bezeichnungen a := (a1 , . . . , a p ), b := (b1 , . . . , b p ) ∈ R p und definieren3 p X (a, b) := ai bi . i=1 p Für Zahlen λ, µ ∈ R und a, b ∈ R setzen wir λa + µb := (λa1 + µb1 , . . . , λa p + µb p ) . Offenbar gilt für a, b, c ∈ R p (λa + µb, c) = p X (λai + µbi )ci = i=1 p X i=1 λai ci + p X µbi ci = λ(a, c) + µ(b, c) . i=1 Man spricht von der Linearität von (., .) in der vorderen Komponente. Wegen (a, b) = (b, a) ist (., .) auch in der hinteren Komponente linear (vgl. den Begriff des Skalarproduktes auf einem Vektorraum in der Linearen Algebra). Um die Schwarzsche Ungleichung zu zeigen, gehen wir von der trivialen Bemerkung aus, dass für jedes p-Tupel x = (x1 , . . . , x p ) ∈ R p gilt (x, x) = p X i=1 x2i ≥ 0. Für alle t ∈ R gilt nun 0 ≤ (a + tb, a + tb) = (a, a) + 2t(a, b) + t2 (b, b). (a,b) in obiger Ungleichung ein, und erhält Ist (b, b) , 0, so setze man t = − (b,b) 0 ≤ (a, a) − 1 Hermann (a, b)2 . (b, b) Amandus Schwarz. 25.1.1843 Hermsdorf (Sobiecin, Polen) - 30.11.1921 Berlin Minkowski. 22.6.1864 Alexoten (bei Kaunas, Litauen) - 12.1.1909 Göttingen 3 Also ist (., .) eine Abbildung von R p × R p nach R. 2 Hermann (3.2) KAPITEL 3. DER GRENZWERT 52 Daraus folgt unmittelbar die Schwarzsche Ungleichung. Im Falle (b, b) = 0 folgt b = (0, . . . , 0), und damit auch (a, b) = 0. Es gilt also auch in diesem Fall die Schwarzsche Ungleichung. Die Minkowskische Ungleichung folgt wegen (ai + bi )2 = ai · (ai + bi ) + bi (ai + bi ) aus p p p p p X X X X X 2 (ai + bi ) = ai (ai + bi ) + bi (ai + bi ) ≤ ai · (ai + bi ) + bi · (ai + bi ) i=1 i=1 i=1 i=1 i=1 p 1 X 2 2 ≤ ai i=1 p 1 21 p X 2 X · (ai + bi )2 + b2i i=1 i=1 p 21 X · (ai + bi )2 = i=1 12 p 12 1 p p X X 2 X 2 2 2 = ai + bi · (ai + bi ) . i=1 i=1 i=1 ❑ Beispiele von Metriken gibt es viele, und sie treten in verschiedensten Zusammenhängen auf. 3.1.5 Beispiel. (i) Sei noch einmal X := R2 und setze d1 (x, y) := |x1 − y1 | + |x2 − y2 |, x = (x1 , x2 ), y = (y1 , y2 ) ∈ R2 . Dann ist d1 eine Metrik: Die Gültigkeit von (M1) und (M2) ist wieder aus der Definition offensichtlich. Um die Dreiecksungleichung einzusehen, seien x, y, z ∈ R gegeben. Dann folgt mit Hilfe der Dreiecksungleichung für |.|, d1 (x, z) = |x1 − z1 | + |x2 − z2 | ≤ |x1 − y1 | + |y1 − z1 | + |x2 − y2 | + |y2 − z2 | = = |x1 − y1 | + |x2 − y2 | + |y1 − z1 | + |y2 − z2 | = d1 (x, y) + d1 (y, z) . Diese Metrik ist offenbar nicht gleich der euklidischen Metrik, denn zum Beispiel √ ist d1 ((0, 0), (2, 1)) = 3 aber d2 ((0, 0), (2, 1)) = 5. Anschaulich interpretiert bezeichnet man d1 manchmal als New York-Metrik“. ” Denn stellt man sich in der Ebene einen Stadtplan mit lauter rechtwinkeligen Straßen vor (wie in New York), dann misst d1 (x, y) gerade die Länge des Fußweges von der Kreuzung x zur Kreuzung y. Ganz analog definiert man eine Metrik am R p : d1 (x, y) = p X j=1 |x j − y j |, x = (x1 , . . . , x p ), y = (y1 , . . . , y p ) ∈ R p . Der Nachweis von (M1)-(M3) geht genauso wie im oben betrachteten Fall p = 2. (ii) Ist wieder X = R p , so definieren wir nun die Metrik d∞ (x, y) := max |x j − y j |, x = (x1 , . . . , x p ), y = (y1 , . . . , y p ) ∈ R p . j=1,...,p 3.1. METRISCHE RÄUME 53 (M1),(M2) sind klar. Die Dreiecksungleichung folgt aus der Tatsache, dass für alle nichtnegativen Zahlen max{a1 + b1 , . . . , a p + b p } ≤ max{a1 , . . . , a p } + max{b1 , . . . , b p } . Auch diese Metrik unterscheidet sich tatsächlich von den schon eingeführten Metriken d1 und d2 , da etwa im Falle p = 2 gilt, dass d∞ ((0, 0), (2, 1)) = 2. (iii) Eine hauptsächlich aus theoretischer Sicht wichtige Metrik ist die diskrete Metrik. Sie findet man auf jeder nichtleeren Menge X, indem man ( 0 , x=y d(x, y) = 1 , x,y setzt. (iv) Betrachte die ganzen Zahlen X := Z und halte eine Primzahl p fest. Setze 1 pn(p) d(p) (x, y) := 0 , x , y, x − y = ± , x=y Q q prim qn(q) Q Dabei ist ± q prim qn(q) die eindeutige Primfaktorzerlegung von x − y. Dann ist d(p) eine Metrik auf Z. Denn (M1) ist nach Definition erfüllt, (M2) ist ebenfalls richtig, denn vertauscht man x und y, so ändert sich bei der Differenz x − y nur das Vorzeichen, nicht jedoch die Primfaktoren und ihre Potenzen. Die Dreiecksungleichung ist wieder schwieriger einzusehen. Wir zeigen, dass in diesem Fall sogar die stärkere Ungleichung d(p) (x, z) ≤ max{d(p) (x, y), d(p) (y, z)}, x, y, z ∈ Z , gilt. Diese Ungleichung impliziert tatsächlich sofort die Dreiecksungleichung, denn für je zwei Zahlen a, b ≥ 0 ist stets max(a, b) ≤ a + b. Schreibe x−z = ± Y q prim sodass also d(p) (x, z) = qn1 (q) , x − y = ± Y q prim qn2 (q) , y − z = ± Y qn3 (q) , q prim 1 1 1 , d(p) (x, y) = n (p) , d(p) (y, z) = n (p) . pn1 (p) p2 p3 Betrachte den Fall, dass d(p) (x, y) ≥ d(p) (y, z), d.h. n2 (p) ≤ n3 (p). Wegen n2 (p) ≤ n3 (p) teilt pn2 (p) sowohl x − y als auch y − z, und daher auch (x − y) + (y − z) = x − z. Es folgt n2 (p) ≤ n1 (p), und somit d(p) (x, y) ≥ d(p) (x, z). Der Fall d(p) (x, y) ≤ d(p) (y, z) wird genauso behandelt. Auf Z haben wir natürlich auch die euklidische Metrik d2 (x, y) = |x − y|, denn Z ist ja eine Teilmenge von R. Diese ist verschieden von der Metrik d(p) , denn zum Beispiel ist d(p) (0, p) = 1 p, wogegen d2 (0, p) = p. 3.1.6 Bemerkung. Auf R stimmen die Metriken d1 , d2 , d∞ alle überein. 3.1.7 Bemerkung. Die oben kennengelernten Metriken d2 , d1 , d∞ auf dem R p sind allesamt von Normen erzeugte Metriken. Eine Norm k.k auf R p ist eine Funktion von R p → R mit folgenden drei Eigenschaften x, y ∈ R p , λ ∈ R: (i) kxk ≥ 0, wobei kxk = 0 ⇔ x = 0. (ii) kλxk = |λ| · kxk. (iii) kx + yk ≤ kxk + kyk. Es gilt nun d(x, y) = kx − ykq 2 , d1 (x, y) = kx − yk1 , d∞ (x, y) = kx − yk∞ , wobei diese Pp Pp 2 drei Normen durch kxk2 := j=1 |x j | , kxk1 := j=1 |x j |, kxk∞ = max{|x1 |, . . . , |x p |} definiert sind. KAPITEL 3. DER GRENZWERT 54 3.2 Der Grenzwert in metrischen Räumen Wir kommen nun zurück zu dem am Anfang des Kapitels motivierten Begriff der Konvergenz einer Folge. 3.2.1 Definition. Eine Folge in einer Menge X ist aus mathematischer Sicht nichts anderes als eine Funktion y : N → X, wobei der Funktionswert y(n) von y an der Stelle n meist als yn geschrieben wird. Für die Folge y als solche schreiben wir meist (yn )n∈N . Folgen werden auch oft als y1 , y2 , y3 , . . . angeschrieben. 3.2.2 Definition. Sei hX, di ein metrischer Raum, (xn )n∈N eine Folge in X, und x ein Element von X. Dann heißt (xn )n∈N konvergent gegen x, wenn gilt 4 ∀ǫ ∈ R, ǫ > 0 ∃N ∈ N : d(xn , x) < ǫ für alle n ≥ N . (3.3) In diesem Fall schreibt man limn→∞ xn = x. xN x1 xN ′ x ǫ′ ǫ Ist (xn )n∈N eine Folge, und gibt es ein Element x ∈ X, sodass limn→∞ xn = x, so sagt man die Folge (xn )n∈N ist konvergent. Ist eine Folge nicht konvergent, so sagt man sie ist divergent. Man verwendet auch andere Schreibweisen für limn→∞ xn = x, wie zum Beispiel n→∞ (xn )n∈N → x, n → ∞, oder x −→ x, oder auch nur xn → x. 3.2.3 Bemerkung. Wegen |d(x, xn ) − 0| = d(x, xn ) folgt, dass eine Folge (xn )n∈N in einem metrischen Raum hX, di genau dann gegen ein x ∈ X konvergiert, wenn die Folge (d(x, xn ))n∈N in R (versehen mit der euklidischen Metrik) gegen 0 konvergiert. Folgen müssen nicht immer mit dem Index 1 anfangen. Ist k eine feste ganze Zahl, so setzen wir Z≥k := {n ∈ Z : n ≥ k}. Eine Abbildung x : Z≥k → X nennen wir ebenfalls Folge, wobei ihre Konvergenz in analoger Weise wie in Definition 3.2.2 definiert ist. 3.2.4 Beispiel. (i) Sei hX, di ein beliebiger metrischer Raum, und sei x ∈ X. Betrachte die konstante Folge x1 = x2 = x3 = . . . = x. Dann gilt limi→∞ xi = x. Um dies einzusehen, sei ein ǫ ∈ R, ǫ > 0, gegeben. Wir müssen eine Zahl N ∈ N finden, sodass d(xi , x) < ǫ für alle i ≥ N. Wähle N := 1, dann gilt d(xi , x) = d(x, x) = 0 < ǫ, i ≥ N . Dieses Beispiel ist natürlich in gewissem Sinne trivial, denn die Folgenglieder xi sind ja schon alle gleich dem Grenzwert x, kommen diesem also natürlich beliebig nahe. 4 Kürzer lässt sich folgendermaßen schreiben: ∀ǫ ∈ R, ǫ > 0 ∃N ∈ N : ∀n ≥ N ⇒ d(xn , x) < ǫ. 3.2. DER GRENZWERT IN METRISCHEN RÄUMEN 55 (ii) Sei X = R und d = d2 die euklidische Metrik d2 (x, y) = |x − y|. Dann gilt lim j→∞ 1j = 0. Um dies einzusehen, sei ein ǫ ∈ R, ǫ > 0, gegeben. Wir müssen eine Zahl N ∈ N finden, sodass | 1j − 0| = 1j < ǫ gilt, wenn nur j ≥ N. Dazu benützen wir die Tatsache, dass N als Teilmenge von R nicht nach oben beschränkt ist: Wähle N ∈ N mit 1ǫ < N. Für alle j ∈ N mit j ≥ N gilt 1j ≤ N1 < ǫ. (iii) Aus dem letzten Beispiel schließen wir lim j→∞ (1+ 1j ) = 1, da |(1+ 1j )−1| = (vgl. Bemerkung 3.2.3). 1 j →0 Die Vorgangsweise aus Beispiel 3.2.4, (ii), kommt öfters vor. Darum wollen wir sie explizit formulieren. 3.2.5 Korollar. Sei hX, di ein metrischer Raum, xi , x ∈ X, i ∈ N. Dann gilt xi → x genau dann, wenn 1 für alle i ≥ N . (3.4) M Die jeweiligen Bedingungen (3.3) und (3.4) sind äquivalent zu den entsprechenden Bedingungen, wenn man in diesen Beziehungen < durch ≤ ersetzt. ∀M ∈ N ∃N ∈ N : d(xi , x) < Beweis. Gilt (3.4) und ist ǫ > 0, so gibt es wegen Lemma 2.7.2 ein M ∈ N, sodass 1 1 M < ǫ. Wegen (3.4) gibt es ein N ∈ N, sodass d(xi , x) < M < ǫ für i ≥ N. Also haben wir (3.3) nachgewiesen. Gilt umgekehrt (3.3), so folgt (3.4) sofort, da ja M1 spezielle ǫ > 0 sind. Dass aus den jeweiligen Bedingungen die Bedingungen mit ≤ statt < folgt ist klar, da aus < ja ≤ folgt. Zur Umkehrung: Man wende die Bedingungen mit ≤ statt < auf 2ǫ an. Man erhält dann ... ≤ 2ǫ < ǫ. ❑ 3.2.6 Beispiel. Jede Zahl x ∈ R ist Limes einer Folge (rn )n∈N bestehend aus rationalen Zahlen. Um das einzusehen, wähle gemäß Satz 2.6.3 für jedes n ∈ N eine Zahl rn ∈ Q so, dass x < rn < x + 1n . Nach unserer Wahl ist (3.4) erfüllt. Also limn→∞ rn = x. Genauso gibt eine Folge irrationaler Zahlen größer x, die gegen x konvergiert. Arbeitet man mit größerer mathematischen Strenge, so muss man obiges Argument folgendermaßen präzisieren. Nach Satz 2.6.3 ist die Menge Mn der r ∈ Q mit x < r < x + 1 n nicht leer. Nun sei ρ einfach eine nach dem Auswahlaxiom existierende Funktion von N nach ∪n∈N Mn , sodass ρ(n) ∈ Mn . Nun setze einfach rn = ρ(n). Mit einer etwas feineren Argumentation kann man (rn )n∈N sogar streng monoton fallend (rn1 > rn2 wenn n1 < n2 ) wählen. Dazu definiert man rn induktiv so, dass x < rn < min(x + 1n , rn−1 ). Genauso kann man eine streng monoton wachsende Folge aus Q konstruieren, die gegen x konvergiert. Lässt man auch hier mehr Strenge walten, so benötigt man zur Existenz der Folge (rn )n∈N den Rekursionssatz: Für jedes y > x und jedes n ∈ N ist die Menge Q ∩ (x, min(y, n1 )) nicht leer. Sei ̺ : N × (x, +∞) → Q eine Auswahlfunktion, sodass ̺(n, y) ∈ Q ∩ (x, min(y, 1n )). Nun sei a := (1, r1 ) ∈ N × ((x, +∞) ∩ Q) =: A und g : A → A definiert durch g(n, y) = (n + 1, ̺(n, y)). Nach dem Rekursionssatz gibt es eine Funktion φ : N → A mit φ(1) = a und φ(n + 1) = g(φ(n)). Ist für n ∈ N nun rn die zweite Komponente von φ(n), so hat (rn )n∈N die geforderten Eigenschaften. KAPITEL 3. DER GRENZWERT 56 Sei F ⊆ R nach oben beschränkt und x := sup F. Nun wähle gemäß der Definition des Supremums ein xn ∈ (x− 1n , x] , ∅ für jedes n ∈ N. Also gibt es eine Folge (xn )n∈N , in F, die gegen sup F konvergiert. Man kann ähnlich wie oben (xn )n∈N sogar monoton wachsend wählen. Entsprechendes gilt für nach unten beschränkte Mengen und deren Infimum. 3.2.7 Beispiel. Es gibt viele Folgen, die nicht konvergieren. Zum Beispiel betrachte die Folge zn := in in C, wobei wir wie immer, wenn wir nichts anderes explizit sagen, C mit der euklidischen Metrik versehen. Dann hat (zn )n∈N das Aussehen i, −1, −i, 1, i, −1, −i, 1, . . . , und ist divergent. Denn angenommen es wäre zn → z für ein gewisses z ∈ C, so wähle man N ∈ N, sodass |zn − z| < 12 , n ≥ N. Ist nun n0 ≥ N durch 4 teilbar, so folgt der Widerspruch 2 = |1 − (−1)| = |zn0 − zn0 +2 | ≤ |zn0 − z| + |z − zn0 +2 | < 1 1 + = 1. 2 2 3.2.8 Definition. Eine Teilfolge einer gegebenen Folge (xn )n∈N ist (xn( j) ) j∈N , wobei n : N → N eine streng monoton wachsende Funktion ist. Also n(1) < n(2) < n(3) < . . . . Klarerweise ist eine solche Funktion n immer injektiv, und es gilt n( j) ≥ j. Folgende elementare Sachverhalte von großer Bedeutung und werden in Beweisen immer wieder Verwendung finden. 3.2.9 Satz. Sei hX, di ein metrischer Raum und sei (xn )n∈N eine Folge von Elementen von X. (i) Die Folge (xn )n∈N hat höchstens einen Grenzwert. (ii) (xn )n∈N konvergiert gegen x ∈ X genau dann, wenn es ein k ∈ N gibt, sodass (xn )n∈Z≥k gegen x ∈ X konvergiert. Es kommt also nicht auf endlich viele Folgenglieder an, ob und wohin eine Folge konvergiert. (iii) Ist limn→∞ xn = x und k ∈ N, so konvergieren auch (xn+k )n∈N und (xn−k )n∈Z≥k+1 gegen x. (iv) Ist limn→∞ xn = x, so konvergiert auch jede Teilfolge (xn( j) ) j∈N gegen x. Beweis. Wir zeigen zunächst (i). Es gelte xn → x und xn → y, und angenommen x , y, also d(x, y) > 0. Wähle N1 ∈ N, sodass d(xn , x) < d(x,y) 3 , n ≥ N1 , und N2 ∈ N, sodass d(xn , y) < d(x,y) , n ≥ N . Dann folgt für N := max{N , N2 } der Widerspruch 2 1 3 d(x, y) ≤ d(x, xN ) + d(xN , y) < d(x, y) d(x, y) 2d(x, y) + = < d(x, y) , 3 3 3 Wir zeigen auch noch (iv). Die restlichen Aussagen sind noch elementarer nachzuweisen. Sei also (xn( j) ) j∈N eine Teilfolge der gegen x konvergenten Folge (xn )n∈N . Ist ǫ > 0, so gibt es ein N ∈ N, sodass d(xn , x) < ǫ, wenn nur n ≥ N. Ist nun i0 ∈ N so groß, dass n(i0 ) ≥ N (z.B. i0 = N), so folgt für i ≥ i0 auch n(i) ≥ N und somit d(xn(i) , x) < ǫ. Also lim j→∞ xn( j) = x. ❑ 3.2. DER GRENZWERT IN METRISCHEN RÄUMEN 57 3.2.10 Beispiel. (i) Ist p ∈ N, so gilt limn→∞ n1p = 0. Das folgt unmittelbar aus Satz 3.2.9 und der ist. Tatsache, dass diese Folge eine Teilfolge von n1 n∈N Genauso gilt limn→∞ √p1n mit 1n < ǫ p , es ein N ∈ N 1 √ < ǫ für n ≥ N. p n = 0. Ist nämlich ǫ > 0, so auch ǫ p > 0. Da 1 n → 0, gibt wenn n ≥ N. Aus der Monotonie der p-ten Wurzel folgt (ii) Sei q ∈ R, 0 ≤ q < 1, und betrachte die Folge (qn )n∈N . Dann gilt limn→∞ qn = 0. Um das einzusehen, können wir q > 0 voraussetzen, da sonst die betreffliche Folge identisch gleich Null ist. Wir verwenden zum Beweis die Bernoullische Ungleichung aus Lemma 2.3.6. Setzt man in der Bernoullischen Ungleichung x = q1 − 1 > 0, so erhält man 1 q !n ! 1 −1 . ≥1+n q Da R archimedisch angeordnet ist, gibt es zu jedem ǫ > 0 eine Zahl N ∈ N mit 1 + N( q1 − 1) > 1ǫ und damit auch ( 1q )N > 1ǫ , also qN < ǫ. Es folgt d(0, qn ) = qn ≤ qN < ǫ für alle n ≥ N. (iii) Sei z ∈ C, |z| < 1. Betrachte die Folge S n := n X zk = 1 + z + z2 + . . . + zn . k=0 1 Dann gilt limn→∞ S n = 1−z . Das ist die sogenannte geometrische Reihe. Zum Beweis: Es gilt (vgl. (2.8)) 1n − zn = (1 − z)(1n−1 + 1n−2 z + . . . + 1zn−2 + zn−1 ) = (1 − z)(1 + z + . . . + zn−1 ) , und wir erhalten S n−1 = 1 zn − . 1−z 1−z (3.5) Sei nun ǫ > 0 gegeben. Wähle N ∈ N mit |z|n < ǫ, n ≥ N (vgl. (ii)), dann folgt S n−1 − ǫ 1 |z|n = < , n≥ N. 1−z |1 − z| |1 − z| Startet man nun anstelle von ǫ mit der ebenfalls positiven Zahl |1 − z| · ǫ, so erhält 1 man am Ende der Ungleichungskette nur ǫ. Also gilt S n−1 → 1−z und wegen Satz 1 3.2.9 auch S n → 1−z . Weil die im letzten Beispiel verwendete Vorgehensweise oftmals Anwendung findet, wollen wir hier auch explizit bemerken, dass xn → x genau dann, wenn ∀ǫ > 0 ∃N ∈ N d(xn , x) < K · ǫ, für alle n ≥ N, wobei K irgendeine feste positive reelle Zahl ist. (3.6) KAPITEL 3. DER GRENZWERT 58 3.2.11 Bemerkung. Sei (xn )n∈N eine Folge in einem metrischen Raum hX, di und x ∈ X. Angenommen diese Folge konvergiert nicht gegen x. Dann zeigt man leicht, dass sie eine Teilfolge (xn(i) )i∈N hat, sodass d(xn(i) , x) ≥ ǫ für ein gewisses ǫ > 0 und alle i ∈ N. Ist nun (xn(i( j)) ) j∈N eine beliebige Teilfolge von (xn(i) )i∈N , so kann diese wegen d(xn(i( j)) , x) ≥ ǫ sicherlich auch nicht gegen x konvergieren. Somit haben wir gezeigt, dass wenn jede Teilfolge von (xn )n∈N wiederum eine Teilfolge hat, die gegen x konvergiert, so muss schon (xn )n∈N gegen x konvergieren. Wegen Satz 3.2.9, (iv), gilt auch die Umkehrung. 3.2.12 Lemma. Sei hX, di ein metrischer Raum und seien (xn )n∈N , (yn )n∈N Folgen von Elementen von X, sodass limn→∞ xn = x und limn→∞ yn = y. Dann folgt lim d(xn , yn ) = d(x, y). n→∞ Beweis. Zunächst wollen wir folgende Ungleichung beweisen: d(a1 , b1 ) − d(a2 , b2 ) ≤ d(a1 , a2 ) + d(b1 , b2 ), a1 , a2 , b1 , b2 ∈ X . (3.7) Aus der Dreiecksungleichung folgt d(a1 , b1 ) − d(a2 , b1 ) ≤ d(a1 , a2 ) sowie d(a2 , b1 ) − d(a1 , b1 ) ≤ d(a1 , a2 ). Also gilt d(a1 , b1 ) − d(a2 , b2 ) ≤ d(a1 , b1 ) − d(a2 , b1 ) + d(a2 , b1 ) − d(a2 , b2 ) ≤ d(a1 , a2 ) + d(b1 , b2 ) . Sei nun ǫ > 0 und N ∈ N so groß, dass d(xn , x), d(yn , y) < 2ǫ , wenn n ≥ N. Aus (3.7) folgt |d(xn , yn ) − d(x, y)| ≤ d(xn , x) + d(yn , y) < ǫ für alle n ≥ N. ❑ Ein weiterer Begriff, der im Zusammenhang mit konvergenten Folgen auftritt, ist der der Beschränktheit. 3.2.13 Definition. Sei hX, di ein metrischer Raum, und sei Y ⊆ X. Dann heißt Y beschränkt, wenn es eine Zahl M > 0 und einen Punkt x0 ∈ X gibt, sodass d(y, x0 ) ≤ M, y ∈ Y . Eine Folge (xn )n∈N heißt beschränkt, wenn die Bildmenge {xn : n ∈ N} beschränkt ist. Allgemeiner heißt eine Funktion f : E → X beschränkt, wenn die Bildmenge f (E) beschränkt ist. Die Menge Y ist also beschränkt, wenn sie ganz in einem gewissen Kreis (Mittelpunkt x0 , Radius M) liegt. 3.2.14 Bemerkung. Y ist beschränkt genau dann, wenn es zu jedem Punkt x ∈ X eine Zahl M x > 0 gibt mit d(y, x) ≤ M x , y ∈ Y. Denn, ist x ∈ X gegeben, so setze M x := M + d(x, x0 ). Dann gilt für jedes y ∈ Y d(y, x) ≤ d(y, x0 ) + d(x0 , x) ≤ M + d(x, x0 ) = M x . 3.3. FOLGEN REELLER UND KOMPLEXER ZAHLEN 59 Mit Hilfe dieser Tatsache sieht man auch, dass Y ⊆ C (Y ⊆ R) versehen mit der euklidischen Metrik genau dann beschränkt ist, wenn für ein gewisses M > 0 gilt, dass ∀x ∈ Y : |x| (= d(x, 0)) ≤ M. Im Falle Y ⊆ R stimmt daher diese Definition von Beschränktheit mit der von Definition 2.2.4 überein. 3.2.15 Proposition. Jede konvergente Folge (xn )n∈N ist beschränkt. Beweis. Wähle N ∈ N mit d(xn , x) < 1 für n ≥ N. Setzt man M := 1 + max{d(x1 , x), . . . , d(xN−1 , x)} , so erhält man d(xn , x) ≤ M für jedes n ∈ N. ❑ 3.2.16 Bemerkung. Die Umkehrung gilt nicht (außer der Raum X besteht aus nur einem Element), da für x, y ∈ X, x , y, die Folge x, y, x, y, x, y, x, . . . zwar beschränkt, aber nicht konvergent ist. 3.2.17 Bemerkung. Insbesondere gibt es zu jeder konvergenten reell- bzw. komplexwertigen Folge (xn )n∈N ein Konstante M > 0, sodass |xn | ≤ M, n ∈ N. 3.2.18 Beispiel. Man betrachte die Folge (S n )n∈N aus Beispiel 3.2.10, (iii), für den Fall |z| = 1 aber z , 1. Aus (3.5) sehen wir, dass Sn = 1 − zn+1 . 1−z n+1 | 2 = |1−z| , und (S n )n∈N ist damit beschränkt. Sie ist aber nicht Also ist |S n | ≤ 1+|z |1−z| konvergent, denn, wie man aus den Ergebnissen im nächsten Abschnitt sieht, wäre dann auch (zn )n∈N konvergent. Das ist aber nicht der Fall. Man setze z.B. z = i oder z = −1. 3.3 Folgen reeller und komplexer Zahlen Wir wollen uns hier zunächst mit dem metrischen Raum hR, di beschäftigen, und folgendes einfaches, aber sehr nützliches Lemma bringen. 3.3.1 Lemma. Seien (xn )n∈N , (yn )n∈N zwei konvergente Folgen reeller Zahlen mit den Grenzwerten x und y. Dann gilt: (i) Ist c ∈ R mit x < c (c < x), so gibt es ein N ∈ N, sodass xn < c (c < xn ) für alle n ≥ N. (ii) Ist x < y, so gibt es ein N ∈ N, sodass xn < yn für alle n ≥ N. (iii) Gilt ab einem gewissen N ∈ N die Ungleichung xn ≤ yn , so folgt x ≤ y. Beweis. (ii) Setzt man ǫ = y−x 2 , so folgt aus der Konvergenz die Existenz eines N ∈ N, sodass und |yn − y| < y−x |xn − x| < y−x 2 2 für n ≥ N. Somit gilt −(yn − y) − (x − xn ) ≤ |yn − y| + |x − xn | < (y − x). Also yn − xn = (y − x) + (yn − y) + (x − xn ) > 0. KAPITEL 3. DER GRENZWERT 60 (i) Folgt aus (ii), wenn wir (yn )n∈N ((xn )n∈N ) als die identische Folge (c)n∈N wählen. (iii) Wäre x > y, so würde aus (ii) folgen, dass xn > yn für alle n ≥ k mit einem hinreichend großen k ∈ N. Das widerspricht der Annahme. ❑ Der nächste Satz dient häufig als Werkzeug zur Berechnung von Grenzwerten. 3.3.2 Satz (Einschluss-Satz). Seien (xn )n∈N , (yn )n∈N und (an )n∈N reelle Folgen mit xn ≤ an ≤ yn für alle bis auf endlich viele n ∈ N. Gilt lim xn = lim yn , n→∞ n→∞ so existiert auch der Grenzwert limn→∞ an und ist gleich dem gemeinsamen Grenzwert von (xn )n∈N und (yn )n∈N . Beweis. Setze a := limn→∞ xn . Zu ǫ > 0 wähle N ∈ N mit |xn − a|, |yn − a| < ǫ und xn ≤ an ≤ yn für n ≥ N. Für solche n folgt −ǫ < xn − a ≤ an − a ≤ yn − a < ǫ, d.h. |an − a| < ǫ. ❑ 3.3.3 Beispiel. Als ganz einfache Beispiel betrachte man die Folge sieht leicht, dass 1 1 0≤ 2 ≤ , für n ≥ 3. n − 3n + 3 n Also folgt mit Satz 3.3.2, dass limn→∞ 1 n2 −3n+3 1 . n2 −3n+3 n∈N Man = 0. Wir haben auf R und C algebraische Operationen und die Betragsfunktion. Im nächsten Satz wollen wir zeigen, dass diese mit dem Grenzwertbegriff verträglich sind. 3.3.4 Satz (Rechenregeln für Folgen). Seien (zn )n∈N und (wn )n∈N konvergente Folgen komplexer Zahlen, limn→∞ zn =: z, limn→∞ wn =: w, und sei λ ∈ C. Dann gilt für k ∈ N (i) limn→∞ |zn | = |z|, limn→∞ z̄n = z̄. (ii) limn→∞ (zn + wn ) = z + w, limn→∞ (−zn ) = −z. (iii) Ist z = 0, also zn → 0, n → ∞, und ist (un )n∈N eine beschränkte Folge in C, dann gilt limn→∞ (zn · un ) = 0. (iv) limn→∞ (λzn ) = λz und limn→∞ (zn · wn ) = z · w. (v) limn→∞ zkn = zk . (vi) Falls z , 0 ist, gilt limn→∞ 1 zn = 1z . √ √ (vii) Ist zn ∈ R und zn ≥ 0, so folgt limn→∞ k zn = k z. Diese Aussagen gelten auch, wenn die Folgen bzw. der Skalar λ aus R sind. 3.3. FOLGEN REELLER UND KOMPLEXER ZAHLEN 61 3.3.5 Bemerkung. Bis auf den letzten Punkt werden wir Satz 3.3.4 für komplexe Folgen beweisen. Fast derselbe Beweis funktioniert für reellwertige Folgen. Man kann aber die Rechenregeln für reellwertige Folgen auch aus denen für komplexwertige Folgen herleiten, da, wie wir gleich zeigen wollen, eine Folge (xn )n∈N in R genau dann konvergiert, wenn (xn +i0)n∈N in C konvergiert. Dabei ist limn→∞ (xn +i0) = (limn→∞ xn ) + i0. Ist (xn )n∈N eine reellwertige Folge, welche gegen ein x ∈ R konvergiert, so konvergiert (xn + i0)n∈N gegen x + i0, da ja |(xn + i0) − (x + i0)| = |xn − x| → 0 (vgl. Bemerkung 3.2.3). Konvergiert umgekehrt für eine reellwertige Folge (xn )n∈N die Folge (xn + i0)n∈N in C gegen x + iy ∈ C, so muss wegen 0 ≤ max(|xn − x|, |0 − y|) ≤ |(xn + i0) − (x + iy)| → 0, n → ∞, gemeinsam mit Satz 3.3.2 folgen, dass xn → x und |y| → 0, d.h. y = 0. Beweis. (Satz 3.3.4) (i) Zu ǫ > 0 wähle N ∈ N, sodass |zn −z| < ǫ für n ≥ N. Mit der Dreiecksungleichung nach unten erhält man |zn | − |z| ≤ |zn − z| < ǫ, |z̄n − z̄| = |zn − z| < ǫ. Man kann limn→∞ |zn | = |z| auch als Spezialfall von Lemma 3.2.12 sehen: |zn | = d(zn , 0) → d(z, 0) = |z|. (ii) Sei ǫ > 0 gegeben. Wähle N so, dass |zn − z| < n ≥ N. Es gilt für solche n ǫ 2 und auch |wn − w| < |(zn + wn ) − (z + w)| = |(zn − z) + (wn − w)| ≤ |zn − z| + |wn − w| < ǫ 2 für alle ǫ ǫ + = ǫ. 2 2 Also ist (zn + wn )n∈N konvergent und der Grenzwert ist gleich z + w. Weiters gilt für n so groß, dass |zn − z| < ǫ: |(−zn ) − (−z)| = | − (zn − z)| = |zn − z| < ǫ, also konvergiert (−zn )n∈N gegen −z. (iii) Ist C > 0 so, dass |un | ≤ C, n ∈ N, und ist ǫ > 0, so gibt es wegen zn → 0 ein N ∈ N, sodass |zn | < Cǫ , n ≥ N. Es folgt |zn ·un | < ǫ für alle n ≥ N, also zn ·un → 0. (iv) Sei N so groß, dass für n ≥ N gilt |zn − z| < ǫ. Dann gilt |λzn − λz| = |λ| · |zn − z| < λ · ǫ. Gemäß (3.6) folgt daher λzn → λz. Um zn wn → zw nachzuweisen, wollen wir zunächst bemerken, dass nach Bemerkung 3.2.17 konvergente Folgen beschränkt sind. Nach (ii) konvergiert (zn − z) gegen Null, und mit (iii) daher auch (zn − z)wn → 0, n → ∞. Der schon bewiesene Teil von (iv) gibt nun zusammen mit (ii) n→∞ zn wn = (zn − z)wn + zwn −→ 0 + zw. KAPITEL 3. DER GRENZWERT 62 (v) Das folgt durch vollständige Induktion nach k aus (iv). (vi) Sei nun z , 0. Wegen (i) und Lemma 3.3.1 folgt aus zn → z für hinreichend großes n, dass |zn | > |z|2 . Es folgt die Abschätzung 1 − 1 = |z − zn | ≤ |z − z | · 2 , n zn z |z| · |zn | |z|2 und damit wird die Differenz 1 zn − 1 z für große n beliebig klein. (vii) Sei zunächst z > 0. Wegen (i) und Lemma 3.3.1 folgt aus zn → z die Existenz von N ∈ N, sodass für n ≥ N sicher zn > 2z > 0 und |zn − z| < ǫ. Gemäß (2.8) gilt für solche n, da klarerweise auch z > 2z , √ √ |zn − z| | k zn − k z| = √ k−1 √ k−2 √ ≤ √ √ √ k | kz + kz zn + . . . + k zn k−2 k z + k zn k−1 | | pk z k−1 pk z k−2 pk z |zn − z| + 2 2 +...+ √k √k Gemäß (3.6) folgt zn → z. 2 pk z k−2 pk z 2 2 ǫ pk z k−1 < pk z k−1 . + 2 | k 2 Ist z = 0, so sei ǫ > 0 vorgegeben. Ist nun N ∈ N so, dass zn = |zn − 0| < ǫ k für n ≥ N, dann folgt aus der Monotonie der Wurzelfunktion (vgl. Bemerkung 2.7.6) √ √ √ | k zn − 0| = k zn < ǫ. Also k zn → 0. ❑ 3.3.6 Beispiel. √ (i) Die Folge xn = n n konvergiert gegen 1: Setze an := xn − 1, dann ist an ≥ 0 und (1 + an )n = n. Nach dem Binomischen Lehrsatz gilt ! n X n(n − 1) 2 n k n−k an . n = (an + 1)n = an 1 ≥ 1 + 2 k k=0 2(n−1) Damit folgt a2n ≤ n(n−1) = 2n → 0. Daraus folgt nach Satz 3.3.4, (vii), dass an → 0 und damit xn → 1 für n → ∞. √ den Fall q > 1. Dann (ii) Ist q > 0 fest, so gilt limn→∞ n q = 1. Betrachte zunächst √ √ √ √n gilt stets q ≥ 1. Für n hinreichend groß gilt n q ≤ n n. Also folgt n q → 1. Der Fall q = 1 ist klar. Im Fall 0 < q < 1 betrachte √n1q . 3.4 Existenz von Grenzwerten Bisher haben wir zwar gesehen, was aus der Konvergenz einer oder mehrerer Folgen folgt. Die Problem, ob eine gegebene Folge konvergiert oder nicht haben wir jedoch nicht betrachtet. Wir wollen als erstes eine Methode angeben um auf Konvergenz einer reellen Zahlenfolge zu schließen. Diese Eigenschaft ist von herausragender Bedeutung. Tatsächlich spiegelt sie genau die definierende Eigenschaft von R vollständig angeordnet zu sein wieder. 3.4. EXISTENZ VON GRENZWERTEN 63 3.4.1 Definition. Eine Folge (an )n∈N in R heißt monoton, wenn entweder a1 ≤ a2 ≤ a3 ≤ . . . (monoton wachsend) oder a1 ≥ a2 ≥ a3 ≥ . . . (monoton fallend) gilt. 3.4.2 Satz. Sei (xn )n∈N eine monoton wachsende und nach oben beschränkte Folge. Dann konvergiert (xn )n∈N gegen sup{xn : n ∈ N}. Entsprechend konvergiert eine monoton fallende und nach unten beschränkte Folge (xn )n∈N gegen inf{xn : n ∈ N}. Beweis. Sei (xn )n∈N monoton wachsend und nach oben beschränkt. Definiere x := sup{xn : n ∈ N}. Wir zeigen, dass limn→∞ xn = x. Sei ǫ > 0. Da x − ǫ < x, kann x − ǫ keine obere Schranke der Menge {xn : n ∈ N} sein. Es gibt also ein N ∈ N mit xN > x − ǫ. Wegen der Monotonie folgt auch xn > x − ǫ für alle n ≥ N. Da stets x ≥ xn gilt, erhält man für n ≥ N 0 ≤ x − xn < ǫ, also |xn − x| < ǫ. Ist die Folge (xn )n∈N monoton fallend und nach unten beschränkt, so setze x := inf{xn : n ∈ N} und schließe in analoger Art und Weise. ❑ 3.4.3 Beispiel. Man betrachte die Folge 1n . Aus Beispiel 2.6.2 wissen wir, dass inf{ 1n : n ∈ n∈N N} = 0. Also folgt aus obigem Satz, dass limn→∞ n1 = 0. Das haben wir aber auch schon in Beispiel 3.2.4, (ii), festgestellt. Die Bedingung in Satz 3.4.2 ist hinreichend n für Konvergenz, aber nicht notwendig. Betrachte zum Beispiel die Folge (−1) . n n∈N Um in allgemeinen metrischen Räumen Folgen auf Konvergenz zu untersuchen, führt man den Begriff der Cauchy-Folge ein. 3.4.4 Definition. Sei hX, di ein metrischer Raum, und sei (xn )n∈N eine Folge von Elementen von X. Diese Folge heißt Cauchy-Folge5, , falls ∀ǫ > 0 ∃N ∈ N : d(xn , xm ) < ǫ für alle n, m ≥ N. Ähnlich wie in Proposition 3.2.15 gilt. 3.4.5 Proposition. Sei (xn )n∈N eine Cauchy-Folge. Dann ist {xn : n ∈ N} beschränkt. Beweis. Wähle N ∈ N mit d(xn , xm ) < 1 für n, m ≥ N. Setzt man M := 1 + max{d(x1 , xN ), . . . , d(xN−1 , xN )} , so erhält man, dass d(xn , xN ) ≤ M für jedes n ∈ N. ❑ Aus dem nächsten Resultat erkennt man einen Zusammenhang zum Begriff der Konvergenz. 5 Augustin Louis Cauchy. 21.8.1789 Paris - 22.5.1857 Sceaux (bei Paris) 64 KAPITEL 3. DER GRENZWERT 3.4.6 Proposition. Ist die Folge (xn )n∈N konvergent, so ist sie eine Cauchy-Folge. Beweis. Sei ǫ > 0 gegeben. Aus der Definition der Konvergenz folgt die Existenz einer Zahl N ∈ N mit der Eigenschaft, dass d(xn , x) < 2ǫ , n ≥ N. Hier bezeichnet x den Grenzwert der Folge (xn )n∈N , der zwar nach Voraussetzung existiert, über den sonst aber nichts bekannt zu sein braucht. Dann gilt nach der Dreiecksungleichung für n, m ≥ N ǫ ǫ d(xn , xm ) ≤ d(xn , x) + d(x, xm ) < + = ǫ. 2 2 ❑ Also ist jede konvergente Folge eine Cauchy-Folge. Würde nun umgekehrt jede Cauchy-Folge konvergieren, so könnten wir die Konvergenz einer Folge nachweisen, ohne ihren Grenzwert explizit in der Hand zu haben. Leider ist dies bei vielen metrischen Räumen nicht der Fall. 3.4.7 Definition. Ein metrischer Raum hX, di heißt vollständig, wenn jede CauchyFolge von Elementen aus X in X einen Grenzwert besitzt. 3.4.8 Beispiel. Die rationalen Zahlen sind nicht vollständig. Dazu betrachte man z.B. eine √ Folge (rn )n∈N bestehend aus rationalen Zahlen wie in Beispiel 3.2.6, die gegen 2 ∈ R \ Q konvergiert. Diese ist eine Cauchy-Folge in R und daher auch in Q. Sie konvergiert aber nicht √ in Q. Denn würde sie das tun, so würde sie in R einerseits gegen 2 und andererseits gegen einen Grenzwert in Q konvergieren. Das widerspricht der Eindeutigkeit des Grenzwertes in R. 3.4.9 Lemma. Sei (xn )n∈N eine Cauchy-Folge in einem metrischen Raum hX, di, die eine konvergente Teilfolge hat. Dann ist (xn )n∈N konvergent. Proof. Sei (xn(k) )k∈N die konvergente Teilfolge mit limk→∞ xn(k) = x. Ist ǫ > 0 gegeben, so wähle N1 so groß, dass d(xn , xm ) < ǫ für n, m ≥ N1 . Wähle N2 so groß, dass d(xn(k) , x) < ǫ für k ≥ N2 . Setze N := max{N1 , N2 }. Wählt man nun k ≥ N, so folgt n(k) ≥ k ≥ N, und man erhält für n ≥ N: d(xn , x) ≤ d(xn , xn(k) ) + d(xn(k) , x) < ǫ + ǫ = 2ǫ. Das wichtigste Beispiel für einen vollständige metrischen Raum sind die reellen Zahlen: 3.4.10 Satz (Cauchysches Konvergenzkriterium). Sei (xn )n∈N eine Cauchy-Folge reeller Zahlen. Dann existiert eine reelle Zahl x, sodass (xn )n∈N gegen x konvergiert. Beweis. Jede Folge (an )n∈N hat eine monotone Teilfolge (an(k) )k∈N . Wir sagen die Folge (an )n∈N besitzt beim Index k eine Spitze, falls ak ≥ an für alle n ≥ k. Wenn es unendlich viele Spitzen gibt, bilden sie eine monoton fallende Teilfolge6 . Gibt es keine oder nur endlich viele Spitzen, so kann man einen Index k finden, sodass ab diesem Index keine Spitzen mehr auftreten. Setze n(1) = k + 1. Da n(1) keine 6 Genau genommen muss man eine monoton wachsende Abbildung n : N → N, die als Bild genau die Menge aller Spitzen hat, konstruieren. Das lässt sich mit Hilfe des Rekursionssatzes bewerkstelligen. 3.5. KONVERGENZ IN WEITEREN METRISCHEN RÄUMEN 65 Spitze ist, existiert n(2) > n(1) mit an(2) > an(1) . Wieder kann n(2) keine Spitze sein, und daher muss n(3) existieren mit an(3) > an(2) . Verfährt man induktiv so weiter, erhält man eine monoton wachsende Teilfolge7 . Sei nun (xn )n∈N eine Cauchy-Folge. Dann ist (xn )n∈N beschränkt. Nach dem eben gezeigten kann man eine monotone Teilfolge wählen, welche natürlich ebenfalls beschränkt ist. Nach Satz 3.4.2 ist diese Teilfolge konvergent, und nach Lemma 3.4.9 daher auch die Folge (xn )n∈N selbst konvergent. ❑ 3.4.11 Beispiel. Der metrische Raum X = [0, 1] versehen mit der euklidischen Metrik ist auch vollständig, denn ist (xn )n∈N eine Cauchy-Folge in X, so ist sie das auch in R. Wegen Satz 3.4.10 gilt limn→∞ xn = x für ein x ∈ R. Da immer 0 ≤ xn ≤ 1 folgt aus Lemma 3.3.1, (iii), dass auch x ∈ X. Also hat jede Cauchy-Folge in X einen Grenzwert in X. Ist dagegen etwa X = (0, 1] versehen mit der euklidischen Metrik, so ist n1 n∈N eine Cauchy-Folge in X. Sie hat aber in X keinen Grenzwert, denn sonst würde 1 n n∈N auch in R gegen diesen Grenzwert x ∈ X ⊆ R und andererseits gegen 0 streben. Wegen 0 < X muss x , 0 im Widerspruch zu Satz 3.2.9, (i). 3.5 Konvergenz in weiteren metrischen Räumen Wir betrachten zunächst als Menge R p (p ∈ N) und versehen diesen mit den drei schon vorgestellten Metriken d1 , d2 , d∞ . Wie bereits bemerkt, unterscheiden sich diese Metriken voneinander. Der Unterschied ist aber nicht allzu groß. In der Tat werden wir sehen, dass wenn eine Folge bezüglich einer der Metriken konvergiert, dann auch bezüglicher der anderen konvergiert. Der Grund dafür liegt in der Ungleichungskette max {|xk |} ≤ k=1,...,p p X k=1 |xk |2 12 ≤ p X k=1 |xk | ≤ p · max {|xk |} . k=1,...,p (3.8) Das zweite ≤“ sieht man durch quadrieren. Das erste und dritte ist klar. ” Es sei aber hier auch darauf hingewiesen, dass es auf ein und der selben Menge Metriken d, d̃ geben kann, sodass eine gewissen Folge (xn )n∈N in dieser Menge bezüglich d konvergiert, aber bezüglich d̃ divergiert. 3.5.1 Proposition. Sei (xn )n∈N eine Folge von Punkten xn = (xn,1 , . . . , xn,p ) ∈ R p , und y = (y1 , . . . , y p ) ∈ R p . Dann impliziert limn→∞ xn = y bezüglich einer der Metriken d1 , d2 , d∞ auch limn→∞ xn = y bezüglich der anderen zwei Metriken aus d1 , d2 , d∞ . Die Konvergenz von (xn )n∈N gegen y bezüglich einer und daher aller dieser Metriken ist wiederum äquivalent zur komponentenweisen Konvergenz 8 lim xn,k = yk für alle k = 1, . . . , p . n→∞ 7 Dass man so verfahren kann, wird durch den Rekursionssatz gewährleistet. Konvergenz versteht sich in R bezüglich der euklidischen Metrik. 8 Diese (3.9) KAPITEL 3. DER GRENZWERT 66 Beweis. Aus Ungleichung (3.8) schließen wir d∞ (xn , x) ≤ d2 (xn , x) ≤ d1 (xn , x) ≤ p · d∞ (xn , x). Ist nun limn→∞ xn = y bezüglich d∞ , so gibt es zu ǫ > 0 ein N ∈ N, sodass d∞ (xn , x) < ǫ, n ≥ N. Nach der letzten Ungleichung bedingt das d1 (xn , x) < p · ǫ, n ≥ N, woraus limn→∞ xn = y bezüglich d1 folgt (siehe (3.6)). Fast genauso schließt man daraus auf die Konvergenz bezüglich d2 , und daraus wiederum auf die bezüglich d∞ . Sei nun limn→∞ xn = y bezüglich bezüglich einer dieser Metriken und daher insbesondere bezüglich d∞ . Ist ǫ > 0 gegeben, so gibt es ein N ∈ N, sodass max {|xn,k − yk |} = d∞ (xn , y) < ǫ, n ≥ N . k=1,...,p Insbesondere gilt für jedes k = 1, . . . , p, dass |xn,k − yk | < ǫ, n ≥ N, und somit limn→∞ xn,k = yk . Sei umgekehrt (3.9) vorausgesetzt und ǫ > 0 gegeben. Wähle N1 , . . . , N p , sodass für k = 1, . . . , p folgt |xn,k − yk | < ǫ, n ≥ Nk . Setzt man N := max{N1 , . . . , N p }, so folgt d∞ (xn , y) = max {|xn,k − yk |} < ǫ . k=1,...,p Also gilt xn → y bezüglich d∞ . ❑ 3.5.2 Beispiel. Man betrachte die Folge (xn )n∈N im R3 gegeben durch n X 1 1 n xn = · (−1) , 2 − 3n, . n 2k k=0 P Wegen | n1 · (−1)n | = 1n → 0 und 1n · nk=0 21k ≤ n2 → 0 konvergieren die erste und die dritte Komponente gegen 0. Die zweite konvergiert wegen n1 (2 − 3n) = 2n − 3 gegen −3. Also konvergiert unsere Folge bezüglich d1 , d2 , d∞ gegen (0, −3, 0). Die nächste Aussage setzt inhaltlich die Bemerkung 3.3.5 fort. 3.5.3 Korollar. Sei (zn )i∈N eine Folge komplexer Zahlen und z ∈ C. Dann gilt limn→∞ zn = z genau dann, wenn lim Re(zn ) = Re z und lim Im(zn ) = Im z . n→∞ n→∞ Beweis. Das ist gerade die Aussage von Proposition 3.5.1 für den R2 und die euklidische Metrik. ❑ 3.5.4 Korollar. Der Raum R p versehen mit einer der Metriken d1 , d2 , d∞ ist vollständig. Insbesondere sind die komplexen Zahlen vollständig. Beweis. Zunächst sei bemerkt, dass wenn eine Folge (xn )n∈N von Punkten des R p eine Cauchy-Folge bezüglich einer der Metriken d1 , d2 , d∞ ist, so ist sie das bezüglich aller dieser Metriken. Das folgt aus (3.8) ganz ähnlich der entsprechenden Aussage über die Konvergenz wie am Anfang des Beweises von Proposition 3.5.1. 3.5. KONVERGENZ IN WEITEREN METRISCHEN RÄUMEN 67 Sei nun (xn )n∈N eine Cauchy-Folge von Punkten des R p (bzgl. d1 , d2 , d∞), xn = (xn,1 , . . . , xn,p ). Dann gibt es zu jedem vorgegebenen ǫ > 0 eine Zahl N ∈ N mit d∞ (xn , xm ) < ǫ für n, m ≥ N. Es folgt für jedes k ∈ {1, . . . , p} |xn,k − xm,k | ≤ d∞ (xn , xm ) < ǫ, n, m ≥ N , d.h. jede der Folgen (xn,k )n∈N , k = 1, . . . , p, ist eine Cauchy-Folge reeller Zahlen. Daher existieren y1 , . . . , y p ∈ R mit lim xi,k = yk , k = 1, . . . , p . i→∞ Wegen Proposition 3.5.1 folgt limn→∞ xn = y mit y = (y1 , . . . , y p ). ❑ 3.5.5 Bemerkung. Die in Satz 3.3.4 hergeleiteten Rechenregeln gelten zum Teil auch in R p , wenn R p mit der euklidischen Metrik und mit den Verknüpfungen +“ und ” skalares Multiplizieren“ wie aus der Linearen Algebra bekannt versehen wird. Sind ” also (xn )n∈N , (yn )n∈N Folgen in R p , die gegen x bzw. y konvergieren, und ist (λn )n∈N eine gegen ein λ ∈ R konvergente Folge in R, so gilt (i) limn→∞ (xn + yn ) = x + y. (ii) limn→∞ λn xn = λx. (iii) limn→∞ (xn , yn ) = (x, y) (∈ R) (vgl. (3.2)). Das folgt aus Proposition 3.5.1, da man die jeweiligen Konvergenzen auf die Komponenten von R p zurückführen kann. Eine andere Möglichkeit, diese Behauptungen zu p beweisen, besteht darin, den euklidischen qPAbstand d2 (x, y) zweier Punkte x, y ∈ R als p 2 kx − yk2 zu schreiben, wobei kxk2 = k=1 |xk | , und im Beweis von Satz 3.3.4 den Betrag durch k.k ersetzt. Siehe Bemerkung 3.1.7. Dass es auf ein und derselben Menge zwei Metriken geben kann, sodass die Konvergenz einer Folge bezüglich der einen Metrik nicht die Konvergenz bezüglich der anderen bedingt, zeigt folgendes Beispiel. 3.5.6 Beispiel. Man betrachte R einerseits versehen mit der Euklidischen Metrik d2 , also die von |.| induzierte Metrik, und andererseits mit der diskreten Metrik d aus Beispiel 3.1.5, (iii). Außerdem betrachte man die Folge n1 n∈N , welche bekannterweise gegen 0 konvergiert. Bezüglich d tut sie das nicht, da ja immer d(0, 1n ) = 1, n ∈ N. Man zeigt unschwer, dass eine Folge (xn )n∈N bezüglich d genau dann gegen x konvergiert, wenn xn = x ab einem Index n0 . 3.5.7 Beispiel. Sei p eine feste Primzahl. Die Folge (pn )n∈N ist bezüglich der Metrik d(p) auf Z gegen 0 konvergent, bezüglich der euklidischen Metrik d2 auf Z jedoch divergent. Um das einzusehen, sei ǫ > 0 gegeben. Wählt man N ∈ N mit p1N < ǫ, so gilt für alle n ≥ N 1 1 d(p) (pn , 0) = n ≤ N < ǫ . p p Angenommen es existiere x ∈ Z, sodass pn → x bezüglich d2 . Wähle N ∈ N, sodass d2 (pn , x) < 1, n ≥ N. Dann folgt mit der Bernoullischen Ungleichung 1 + n(p − 1) ≤ pn = d2 (pn , 0) ≤ d2 (pn , x) + d2 (x, 0) < 1 + |x|, n ≥ N , und weiter, dass n(p − 1) ≤ |x|, n ≥ N, was der Tatsache widerspricht, dass R archimedisch angeordnet ist. Tatsächlich sind in hZ, d2 i nur die ab einem Index konstanten Folgen konvergent. Denn ist xi → x, und wählt man N ∈ N mit |xi − x| < 21 , i ≥ N, so folgt xi = x, i ≥ N, da zwei verschiedene ganze Zahlen sicher einen Abstand von mindestens 1 haben. KAPITEL 3. DER GRENZWERT 68 3.6 Konvergenz gegen unendlich Betrachte die Folge reeller Zahlen xn = n, n ∈ N. Ist diese konvergent? Nein, denn sie ist ja nicht einmal beschränkt. Trotzdem zeigt sie ein doch recht determiniertes Verhalten. Sie strebt gegen unendlich“. Wir wollen jetzt genau definieren, was es heißt, ” dass eine Folge (xn )n∈N in R gegen +∞ strebt (xn → +∞): ∀M > 0 ∃N ∈ N : xn > M für n ≥ N . (3.10) Diese Bedingung besagt, dass jede vorgegebene Schranke ab einem Index überschritten wird. Entsprechend sagen wir, dass eine Folge (xn ) in R gegen −∞ strebt (xn → −∞), wenn ∀M < 0 ∃N ∈ N : xn < M für n ≥ N . (3.11) Folgen, die im obigen Sinne gegen +∞ oder −∞ streben, heißen auch bestimmt divergent. 3.6.1 Bemerkung. Ist (xn )n∈N in R und x ∈ R oder x = ±∞, so kann man x = limn→∞ xn einheitlich folgendermaßen schreiben: (∀ξ ∈ R, ξ < x ∃N ∈ N : ∀n ≥ N ⇒ xn > ξ) ∧ (∀η ∈ R, η > x ∃N ∈ N : ∀n ≥ N ⇒ xn < η). Für diese Konvergenzbegriffe gelten ähnliche Regeln, wie bei der Konvergenz gegen Zahlen. 3.6.2 Satz. Seien (xn )n∈N und (yn )n∈N Folgen, sodass limn→∞ xn = +∞. Es gelten folgende Aussagen (i) Ist yn ≥ C für ein gewisses C ∈ R und für alle n ∈ N, n ≥ K mit einem gewissen K ∈ N, d.h. die Menge {yn : n ∈ N, n ≥ K} ist nach unten beschränkt, dann gilt auch lim (xn + yn ) = +∞. n→∞ (ii) limn→∞ (−xn ) = −∞. (iii) Ist yn ≥ C für ein gewisses C > 0 und für alle n ∈ N, n ≥ K mit einem gewissen K ∈ N, so gilt limn→∞ xn yn = +∞. (iv) Ist xn ≤ yn , für alle n ∈ N, n ≥ K für einen gewissen Index K ∈ N, so folgt limn→∞ yn = +∞. (v) Seien alle bis auf endlich viele, d.h. alle ab einem Index K ∈ N, yn positiv (negativ). Dann gilt limn→∞ yn = +∞ (−∞) genau dann, wenn limn→∞ y1n = 0. (vi) Sei (yn )n∈N monoton wachsend (fallend). Ist (yn )n∈N beschränkt, so ist diese Folge konvergent gegen eine reelle Zahl. Ist (yn )n∈N unbeschränkt, so konvergiert sie gegen +∞ (−∞). Analoge Aussagen gelten im Fall limn→∞ xn = −∞. Beweis. 3.6. KONVERGENZ GEGEN UNENDLICH 69 (i) Sei M > 0 gegeben. Wählt man N so groß, dass xn ≥ M − C, n ≥ N, und sodass N ≥ K, so folgt für n ≥ N auch xn + yn ≥ (M − C) + C = M, also ist (xn + yn ) → +∞. (ii) Folgt unmittelbar aus xn > M ⇔ −xn < −M. (iii) Wähle N so, dass xn ≥ auch M C für n ≥ N und sodass N ≥ K. Dann folgt für n ≥ N xn yn ≥ M · C = M, C d.h. xn yn → +∞. (iv) Ist xn ≥ M, so erst recht yn ≥ M. (v) Nun nehmen wir zuerst an, dass x1n → 0. Ist M vorgegeben, so wähle N ≥ K so groß, dass für n ≥ N gilt x1n < M1 . Es folgt xn ≥ M. Gilt xn → +∞, und ist ǫ > 0, so wähle N so groß, dass für n ≥ N gilt xn > 1ǫ . Daraus ersieht man | x1n | = x1n < ǫ. (vi) Ist (yn )n∈N beschränkt, so folgt die Aussage aus Satz 3.4.2. Im Fall der Unbeschränktheit gibt es eben wegen dieser zu jedem M > 0 ein N ∈ N, sodass yN > M. Wegen der Monotonie folgt dann auch yn > M, n ≥ N ❑ 3.6.3 Beispiel. Sei q ∈ R und betrachte die Folge qn , n ∈ N. Dann gilt +∞ 1 lim qn = n→∞ 0 ∄ , , , , q>1 q=1 −1 < q < 1 q ≤ −1 Dabei haben wir den Fall 0 ≤ q < 1 schon in Beispiel 3.2.10 behandelt. Der Fall q = 1 ist klar. Für q > 1 folgt aus 0 < 1q < 1 durch Anwendung von Satz 3.6.2, dass qn → +∞. Ist −1 < q < 0, so beachte |qn | = |q|n → 0. Ist q ≤ −1, so hat man qn ≥ 1 für n gerade und qn ≤ −1 für n ungerade. Insbesondere ist der Abstand zweier aufeinanderfolgender Folgenglieder ≥ 2, und wir sehen, dass qn keine Cauchy-Folge und erst recht keine konvergente Folge sein kann. Konvergenz gegen +∞ oder −∞ kann aber auch nicht stattfinden, denn dann müssten ja die Folgenglieder insbesondere ab einem Index alle das gleiche Vorzeichen haben. 3.6.4 Beispiel. Seien p, q ∈ R[x], p, q , 0, zwei Polynome. Betrachte die Folge xn := p(n) , n ∈ N, q(n) , 0 . q(n) KAPITEL 3. DER GRENZWERT 70 R −∞ +∞ Abbildung 3.1: Veranschaulichung von R Beachte hier, dass q(n) für höchstens endlich viele Werte von n verschwinden kann, also ist ab einem gewissen Index sicher stets q(n) , 0. Schreibe p und q als p(x) = am xm + . . . + a0 , q(x) = bk xk + . . . + b0 , mit am , bk , 0 an. Dann gilt 0 , m<k am , m=k bk lim xn = n→∞ +∞ , m > k, abmk > 0 −∞ , m > k, am < 0 bk Um dieses einzusehen, betrachte zuerst den Fall, dass m ≤ k, und schreibe xn = am nm + am−1 nm−1 + . . . + a0 am nm−k + am−1 nm−1−k + . . . + a0 n−k = . bk nk + bk−1 nk−1 + . . . + b0 bk + bk−1 n−1 + . . . + b0 n−k Dann konvergiert der Nenner dieses Bruches gegen bk , 0. Ist m < k, so konvergiert der Zähler gegen 0, insgesamt also xn → 0. Ist m = k, so strebt der Zähler gegen am und wieder folgt unsere Behauptung. Ist m > k, so schreiben wir xn als nm−k am + am−1 n−1 + . . . + a0 n−m . bk + bk−1 n−1 + . . . + b0 n−k Also gilt xn = nm−k yn , wobei yn → abmk . Nach Lemma 3.3.1 hat yn für hinreichend große Indizes dasselbe Vorzeichen, wie abmk . Da x1n → 0 folgt aus Satz 3.6.2 das behauptete Konvergenzverhalten für xn . Am Ende diese Kapitels wollen wir eine Möglichkeit vorstellen, wie man die eingeführte Konvergenz gegen ±∞ als herkömmliche Konvergenz in einem metrischen Raum auffassen kann. Als erstes müssen wir ±∞ als Elemente unseres Raumes anerkennen, denn eine Folge von Elementen eines Raumes X kann gegen ein Element von X konvergieren aber nicht gegen irgendetwas. Betrachte also die Menge R = R ∪ {+∞, −∞}, wobei +∞ und −∞ zwei verschiedene formale Elemente sind, die nicht in R liegen. Nun versehen wir die Menge R in naheliegender Weise mit einer Relation: x ≤ y : ⇐⇒ (x ≤ y, x, y ∈ R) oder x = −∞ oder y = +∞ . Diese Relation ist offensichtlicherweise eine Totalordnung, die die Supremumseigenschaft hat. Somit lässt sich R folgendermaßen veranschaulichen. x 3.6.5 Lemma. Die Funktion φ : R → (−1, 1), wobei φ(x) = 1+|x| , bildet R bijektiv auf das offene Intervall (−1, 1) ab. Ihre y −1 −1 Inverse φ : (−1, 1) → R ist gegeben durch φ (y) = 1−|y| . Schließlich sind φ und ihre Inverse φ−1 streng monoton wachsend. Beweis. Als erstes wollen wir festhalten, dass für x ∈ R stets |φ(x)| < 1, d.h. φ(x) ∈ (−1, 1) gilt, und dass φ(x) das gleiche Vorzeichen wie x hat. y Ist ψ : (−1, 1) → R definiert durch ψ(y) = 1−|y| , so folgt φ ◦ ψ(y) = 1 und ψ ◦ φ(x) = 1 y 1−|y| |y| + 1−|y| = y = y, (1 − |y|) + |y| x 1+|x| |x| − 1+|x| = x = x. (1 + |x|) − |x| 3.6. KONVERGENZ GEGEN UNENDLICH 71 Somit ist nach Satz 1.2.18 die Abbildung φ bijektiv und ψ ist die Inverse von φ. Zur behaupteten Monotonieeigenschaft: Sind x1 , x2 ∈ R mit x1 = 0 ∨ x2 = 0 ∨ sgn(x1 ) = sgn(x2 ), so gilt dann wegen x1 |x2 | = |x1 |x2 x1 < x2 ⇔ x1 (1 + |x2 |) = x1 + x1 |x2 | < x2 + x2 |x1 | = x2 (1 + |x1 |) ⇔ φ(x1 ) < φ(x2 ). Da x und φ(x) dasselbe Vorzeichen haben, folgt für den verbleibenden Fall, dass x1 , x2 , 0, sgn(x1 ) = − sgn(x2 ), wobei o.B.d.A. x1 < x2 , dass sowohl x1 < 0 < x2 als auch φ(x1 ) < 0 < φ(x2 ). ❑ Nun setzten wir φ fort zu einer Abbildung R → [−1, 1], indem wir x 1+|x| φ(x) := 1 −1 definieren. , x∈R , x = +∞ , x = −∞ +∞ φ R [−1, 1] φ−1 −∞ Abbildung 3.2: Die Abbildung φ Offensichtlicher ist diese Fortsetzung, die wir ebenfalls φ nennen wollen, auch bijektiv und streng monoton wachsend, wobei y , −1 < y < 1 1−|y| −1 φ (y) := . +∞ , y=1 −∞ , y = −1 Wir definieren nun eine Metrik auf R, indem wir die euklidische Metrik mittels φ nach R übertragen. 3.6.6 Definition. Definiere eine Abbildung d : R × R → R als d(x, y) := φ(x) − φ(y) . 3.6.7 Lemma. Die Abbildung d ist eine Metrik. Dabei konvergiert eine Folge (xn )n∈N in R gegen ein x ∈ R bezüglich d genau dann, wenn die Folge (φ(xn ))n∈N in [−1, 1] gegen φ(x) ∈ [−1, 1] bezüglich der euklidischen Metrik d2 konvergiert. Beweis. Da die Abbildung (a, b) 7→ |a − b| eine Metrik ist und φ injektiv, folgen die verlangten Eigenschaften (M1)-(M3) von d: Setze a := φ(x), b := φ(y), dann gilt (M1): d(x, y) = |a − b| ≥ 0, und d(x, y) = 0 genau dann, wenn a = b. Da φ injektiv ist, ist dieses äquivalent dazu das x = y. (M2): d(x, y) := |a − b| = |b − a| = d(y, x) (M3): Sei zusätzlich z ∈ R und setze c := φ(z). Dann ist d(x, z) = |a − c| ≤ |a − b| + |b − c| = d(x, y) + d(y, z) . Die Aussage über die Konvergenz folgt leicht aus Bemerkung 3.2.3, da xn → x (bzgl. d) ⇔ d(xn , x) = d2 (φ(xn ) → 0 ⇔ φ(xn ) → φ(x) (bzgl. d2 ). KAPITEL 3. DER GRENZWERT 72 ❑ Wir wissen jetzt also, was es bedeutet, dass eine Folge reeller Zahlen in hR, di gegen +∞ bzw. −∞ konvergiert. Haben wir unser Modell nun richtig in dem Sinne gebaut, dass dieser Begriff von Konvergenz gegen ±∞ tatsächlich mit dem eingangs eingeführten Begriff von Konvergenz gegen ±∞ übereinstimmt? 3.6.8 Proposition. Sei (xn )n∈N eine Folge reeller Zahlen. Dann gilt limn→∞ xn = +∞ im Sinne einer Konvergenz im metrischen Raum hR, di genau dann, wenn (3.10) gilt. Analog gilt limn→∞ xn = −∞ in hR, di genau dann, wenn (3.11) gilt. Bleibt die Folge weg von ±∞, so bleibt unser alter Konvergenzbegriff reeller Zahlen erhalten: Sei x ∈ R, dann gilt limn→∞ xn = x in hR, di genau dann, wenn limn→∞ xn = x in R bezüglich der euklidischen Metrik d2 . Beweis. Sei nun vorausgesetzt, dass xn → +∞ in hR, di, und sei M > 0 gegeben. Setze ǫ := 1 − φ(M) > 0, und wähle N ∈ N mit d(xn , +∞) < ǫ, n ≥ N. Dann ist 1 − φ(xn ) = |φ(xn ) − 1| = d(xn , +∞) < ǫ = 1 − φ(M) , und daher φ(M) < φ(xn ), also xn > M. Gelte umgekehrt (3.10), und sei 0 < ǫ < 1 gegeben. Setze M := φ−1 (1 − ǫ) > 0, und wähle N ∈ N so, dass xn > M für n ≥ N. Dann folgt d(xn , +∞) = |φ(xn ) − 1| = 1 − φ(xn ) < 1 − φ(M) = ǫ, n ≥ N . Wir sehen, dass xn → +∞ in hR, di äquivalent zu (3.10) ist. Die Behauptung für xn → −∞ sieht man genauso. Sei nun x ∈ R, und xn → x in R bezüglich d2 . Dann folgt, wegen unserer Rechenregeln für Folgen, Satz 3.3.4, dass auch φ(xn ) → φ(x). Wegen Lemma 3.6.7 erhalten wir xn → x in hR, di. Gelte nun xn → x in hR, di, d.h. φ(xn ) → φ(x) in R (Lemma 3.6.7). Die Abbildung φ−1 ist von der gleichen Gestalt wie φ, und wir schließen wieder wegen unserer Rechenregeln für Folgen, dass xn = φ−1 (φ(xn )) → φ−1 (φ(x)) = x in R bezüglich d2 . ❑ Wir haben nun unser Zahlensystem etwas erweitert, um den Begriff des Strebens gegen unendlich“ als Konvergenz in ” metrischen Räumen interpretieren zu können. Wir haben dabei jedoch auch sehr viel verloren, nämlich unsere algebraischen Operationen + und ·. Gemäß Satz 3.6.2 macht es zwar Sinn x + (+∞) = +∞, −(+∞) = −∞, y(+∞) = +∞, 1 = 0, usw. ±∞ für x, y ∈ R, y > 0 zu setzen, damit die Operationen mit den Grenzwertregeln verträglich bleiben. Aber wie sollte man z.B. +∞ + (−∞) oder 0 · (+∞) definieren? Als einfachstes Beispiel betrachte man[!ht] xn = 2n, yn = n. Es gilt xn , yn → +∞. Es gilt aber xn − yn = n → +∞, was auf (+∞) − (+∞) = +∞“ deuten würde, wogegen yn − xn = −n → −∞, also (+∞) − (+∞) = −∞“. ” ” 3.7 Unendliche Reihen Wir sind schon einmal einer Folge (S n )n∈N begegnet, die von der speziellen Gestalt P S n = nk=0 ak mit gewissen Zahlen ak war, nämlich der geometrischen Reihe S n = 1 1 + z + . . .+ zn mit |z| < 1. Wir haben gezeigt, dass diese Folge gegen den Grenzwert 1−z Pn k konvergiert. Das heißt also, dass für große Werte von n die Summe k=0 z den Wert 1 1−z beliebig gut approximiert. Es ist also naheliegend zu schreiben X 1 = zk . 1 − z k=0 ∞ 3.7.1 Definition. Sei (ak )k∈N eine Folge reeller oder komplexer Zahlen. Allgemeiner kann (ak )k∈N auch eine Folge von Elementen eines metrischen Raumes sein, auf dem man eine Verknüpfung + hat; zum Beispiel Vektoren des R p ). Bezeichne mit S n , n ∈ N die n-te Partialsumme S n := a1 + a2 + . . . + an . Die Folge (S n )n∈N heißt dann die unendliche Reihe mit den Summanden ak . 3.7. UNENDLICHE REIHEN 73 Hat die Folge (S n )n∈N einen Grenzwert, so sagen wir die Reihe sei konvergent. In diesem Fall nennen wir ihren Grenzwert lim S n die Summe der (unendlichen) Reihe n→∞ und benützen die Schreibweise ∞ X ak := lim S n . n→∞ k=1 Falls der Grenzwert lim S n nicht existiert heißt die Reihe divergent. n→∞ Um die Notation zu vereinfachen, benützt man die Schreibweise ∞ P Reihe (S n )n∈N selbst, und sagt dann Ausdrücke, wie etwa ∞ P ∞ P ak auch für die k=1 ak sei konvergent oder divergent. k=1 ak haben eine analoge Interpretation durch Grenzwerte k=6 von Partialsummen. 3.7.2 Bemerkung. (i) Gilt lim S n = +∞ bzw. = −∞ so heißt die Reihe konvergent gegen +∞ bzw. −∞ n→∞ (man sagt auch bestimmt divergent gegen +∞ bzw. −∞) und schreibt ∞ X ak = +∞ bzw. k=1 ∞ X k=1 ak = −∞. (ii) Eine unendliche Reihe ist per definitionem die Folge ihrer Partialsummen, d.h. die Theorie der Reihen ist ein Spezialfall jener der Folgen. Umgekehrt kann man auch jede Folge als Folge der Partialsummen einer Reihe auffassen: Ist (cn )n∈N irgendeine Folge, so setze a1 := c1 , a2 := c2 − c1 , a3 := c3 − c2 , . . . , ak := ck − ck−1 , . . . . Dann gilt cn = n P ak . k=1 Auf Grund der Definition einer unendlichen Reihe als Limes ihrer Partialsummen können wir Aussagen über Folgen sofort auf Reihen übertragen. 3.7.3 Korollar. Sind ∞ P ak , und bk konvergent, so ist auch ∞ ∞ ∞ X X X (ak + bk ) = ak + bk . k=1 P∞ ∞ P (ak + bk ) konvergent. k=1 k=1 k=1 Es gilt ∞ P k=1 k=1 und λ eine feste (reelle oder komplexe) Zahl, so sind auch k=1 ak konvergent P∞ ā und (λa ) konvergent. Es gilt k k=1 k k=1 Ist P∞ ∞ X āk = k=1 ∞ X k=1 ak , ∞ ∞ X X (λak ) = λ · ak . k=1 Beweis. Für die entsprechenden Partialsummen S n = n P k=1 n P k=1 (ak + bk ) gilt S n + T n = Un . k=1 ak , T n = n P k=1 bk und Un = KAPITEL 3. DER GRENZWERT 74 Weiters gilt für Vn = n P (λak ) und Wn = n P āk sicher Vn = λS n und Wn = S̄ n . Also k=1 k=1 folgen auch diese Rechenregeln aus den entsprechenden Regeln für Folgen. ❑ Beim letzten Beweis haben wir die Rechengesetze wie Kommutativität, Distributivität u.ä. für endliche Summen benützt. Das Verhalten dieser Rechenregeln bei unendlichen Reihen ist wesentlich komplizierter, vgl. u.a. Beispiel 3.9.1. 3.7.4 Fakta. 1. Man beachte, dass man endlich viele Reihenglieder beliebig abändern kann, ohne das Konvergenzverhalten zu stören. Das gilt deshalb, weil sich dabei die neue Folge der Partialsummen ab einem gewissen Index von der alten nur um eine additive Konstante unterscheidet. Natürlich verändert sich dabei die Summe der Reihe. P 2. Hat man eine konvergente Reihe ∞j=1 a j gegeben, so dürfen beliebig Klammern ” gesetzt werden“, ohne das Konvergenzverhalten der Reihe zu verändern, was exakt formuliert bedeutet, dass für jede streng monoton wachsende Folge (k(n))n∈N natürlicher Zahlen gilt, dass ∞ X aj = j=1 ∞ X An , n=1 wobei A1 = a1 + · · · + ak(1) und An = ak(n−1)+1 + · · · + ak(n) für n ≥ 2. Dieser Sachverhalt folgt aus der einfachen Beobachtung, dass die Folge der ParP tialsummen unserer neuen Reihe ∞ A genau die Teilfolge (S k(n) )n∈N der Folge P∞n=1 n (S k )k∈N der Partialsummen von j=1 a j ist (vgl. Satz 3.2.9, (iv)). P Die Umkehrung gilt hier nicht. Es kann nämlich vorkommen, dass ∞ n=1 An konP∞ vergiert, aber k=1 ak nicht. Man betrachte nur die Reihe 1 − 1 + 1 − 1 + . . . und klammere immer zwei aufeinanderfolgende Summanden ein. 3. Sind ∞ P k=1 ak und ∞ P bk zwei konvergente Reihen mit reellen Summanden, sodass k=1 ak ≤ bk für alle k ∈ N, so gilt für die Partialsummen klarerweise auch n P k=1 n P k=1 ak ≤ bk für alle n ∈ N. Aus Lemma 3.3.1 erhalten wir dann für die Grenzwerte dieser zwei Folgen von Partialsummen ∞ X k=1 ak ≤ ∞ X bk . k=1 Ist nun zusätzlich sogar al < bl für zumindest ein l ∈ N, so folgt al + δ ≤ bl für n n P P ein hinreichend kleines δ > 0. Somit gilt für n ≥ l, dass δ + ak ≤ bk . Für k=1 n → ∞ folgt wieder aus Lemma 3.3.1, dass ∞ X k=1 ak < δ + ∞ X k=1 ak ≤ ∞ X k=1 bk . k=1 3.7. UNENDLICHE REIHEN 75 3.7.5 Beispiel. ∞ P Betrachte die Reihe k=1 S n := 1 k(k+1) . n X k=1 Die Reihe ∞ P k=1 1 k(k+1) Wegen 1 k(k+1) = 1 k − 1 k+1 gilt (Teleskopreihe) ! n X 1 1 1 1 =1− = − . k(k + 1) k=1 k k + 1 n+1 konvergiert also gegen lim S n = 1. n→∞ Lässt man die ersten drei Terme weg, d.h. ersetzt sie durch 0, so gilt für die entsprechenden Partialsummen S n′ stets (n ≥ 3) ! 1 1 1 1 1 3 ′ Sn = Sn − − − = 1− − → . 1·2 2·3 3·4 n+1 4 4 D.h. die Reihe ∞ P k=4 1 k(k+1) ist ebenfalls konvergent. Ihre Summe ist Fasst man immer zwei Summanden der Reihe die Reihe ∞ P k=1 ∞ P k=1 2 (2k−1)(2k+1) , 1 k(k+1) 1 4 . zusammen, so erhält man welche nach Fakta 3.7.4, 2, ebenfalls die Summe 1 hat. 3.7.6 Bemerkung. Aus dem entsprechenden Resultat für Folgen erhält man, dass eiP ne Reihe ∞ bestehend aus komplexen Zahlen genau dann konvergiert, wenn die n=1 z Pn P∞ reellen Reihen ∞ n=1 Re zn und n=1 Im zn beide konvergieren. In diesem Fall gilt ∞ X zn = ( n=1 ∞ X Re zn ) + i( n=1 ∞ X Im zn ). n=1 Da jede konvergente Folge auch Cauchy-Folge ist, erhält man unmittelbar eine einfache notwendige Bedingung für die Konvergenz einer Reihe. 3.7.7 Proposition. Ist ∞ P ak konvergent, so folgt limk→∞ ak = 0. k=1 Beweis. Betrachte die Reihe ∞ P k=1 bk , wobei b1 = 0 und bk+1 = ak für k ∈ N. Sind (S n )n∈N und (T n )n∈N die Folgen der Partialsummen von ∞ P k=1 S n − Tn = n X k=1 ak − n X ak bzw. ∞ P bk , so folgt k=1 ak−1 = an . k=2 Wegen T n+1 = S n folgt aus Satz 3.2.9, dass (T n )n∈N gegen den gleichen Grenzwert, wie (S n )n∈N konvergiert. Somit erhalten wir S n − T n = an → 0. ❑ Wie wir aus Beispiel 3.7.9 sehen werden, ist diese notwendige Bedingung bei weitem nicht hinreichend. ∞ P ak eine Reihe mit reellen nichtnegativen Summanden, d.h. ak ∈ 3.7.8 Satz. Sei R, ak ≥ 0. k=1 KAPITEL 3. DER GRENZWERT 76 (i) Die Reihe ist genau dann konvergent, wenn die Folge (S n )n∈N der Partialsummen n ∞ P P beschränkt ist9 . In diesem Fall ist auch ak ≤ ak für alle n ∈ N. Anderenfalls k=1 k=1 ist sie bestimmt gegen +∞ divergent. (ii) Ist ∞ P k=1 bk eine divergente Reihe nichtnegativer reeller Zahlen mit ak ≥ bk , k ∈ N, so ist auch ∞ P ak divergent (Minorantenkriterium). k=1 (iii) Ist ∞ P k=1 bk eine konvergente Reihe nichtnegativer reeller Zahlen mit ak ≤ bk , k ∈ N, so ist auch ∞ P ak konvergent (Majorantenkriterium), und k=1 ∞ P k=1 ak ≤ ∞ P bk . k=1 Beweis. Wegen der Voraussetzung ak ≥ 0 ist (S n )n∈N monoton wachsend. Somit folgt (i) aus Satz 3.6.2, (vi). Die behauptete Ungleichung gilt, da im Falle der Konvergenz der monoton wachsenden Folge (S n )n∈N der Grenzwert gemäß Satz 3.4.2 nichts anderes als sup{S n : n ∈ N} ist. ∞ P bk , so ist auch Ist nun bk ≥ 0 und (T n )n∈N der Folge Partialsummen der Reihe k=1 diese monoton wachsend. Ist diese divergent, und ak ≥ bk , so gilt sicherlich S n ≥ T n . Also kann die Folge (S n )n∈N nicht beschränkt sein. ∞ P Ist dagegen bk konvergent, und ak ≤ bk , so ist S n ≤ T n , und mit (T n )n∈N ist auch k=1 die Folge (S n )n∈N ist nach oben beschränkt. Die behauptete Ungleichung folgt aus Fakta 3.7.4, 3. ❑ 3.7.9 Beispiel. Betrachte die harmonische Reihe ∞ X 1 k=1 k . Diese Reihe ist nicht konvergent (sie ist bestimmt divergent gegen +∞). Betrachtet man nämlich die Folge der Partialsummen, S n = 1 + 21 + · · · + n1 , so ist diese monoton wachsend. Für die Existenz des Limes ist es also notwendig und hinreichend, dass diese Folge beschränkt ist (vgl. Satz 3.7.8, (i)). Nun gilt jedoch S 2l = 1 + 1+ 1 1 1 1 1 1 1 1 1 + + + + + + + +...+ l ≥ 2 3 4 5 6 7 8 9 2 1 1 1 1 1 1 1 1 1 1 + + + + + + + +...+ l = 1+l · , 2 | 4 {z4} | 8 8 {z8 8} 16 2 2 = 21 = 12 d.h. S 2l kann für l → ∞ nicht beschränkt bleiben. 3.7.10 Beispiel. Durch Vergleich mit der harmonischen Reihe ist nach dem Minoran∞ P 1 10 tenkriterium die Reihe kα für α < 1 divergent . k=1 9 Da (S n ) monoton wachsend ist, ist sie genau dann beschränkt, wenn irgendeine Teilfolge davon beschränkt ist. 10 Bemerke, dass wir kα erst für rationales α definiert haben. 3.8. KONVERGENZKRITERIEN 77 3.7.11 Korollar (Cauchysches Konvergenzkriterium). Die Reihe ∞ P ak ist genau dann k=1 konvergent, wenn gilt n X ak < ǫ, n > m ≥ N. ∀ǫ > 0 ∃N ∈ N : k=m+1 Beweis. Für die Partialsummen S n = n P k=1 ak gilt S n − S m = (3.12) Pn k=m+1 ak . Also ist (3.12) nichts anderes als das Cauchysches Konvergenzkriterium für die Folge der Partialsummen. ❑ Wir werden später weitere Konvergenzkriterien kennenlernen. Diesen Abschnitt beenden wir mit einer weiteren Begriffsbildung, die sich aus folgender Überlegung motivieren lässt. Will man mit Hilfe des Cauchyschen Konvergenzkriteriums eine Reihe auf Kon n P vergenz überprüfen, so muss man den Ausdruck a abschätzen. Verwendet man k=m+1 k die Dreiecksungleichung, so erhält man n n n X X X ak ≤ (3.13) |ak | . | ak |= k=m+1 k=m+1 k=m+1 Kennt man also eine hinreichend gute Abschätzung für den entsprechenden Ausdruck P der Reihe ∞ k=1 |ak |, so ist man fertig. 3.7.12 Definition. Sei (ak )k∈N eine Folge reeller oder komplexer Zahlen. Die Reihe P∞ P∞ k=1 ak heißt absolut konvergent, wenn die Reihe der Beträge k=1 |ak | konvergiert. Aus (3.13) und dem Cauchyschen Konvergenzkriterium erhalten wir sofort 3.7.13 Lemma. Jede absolut konvergente Reihe ist auch konvergent. 3.7.14 Bemerkung. Die Umkehrung gilt jedoch im Allgemeinen nicht. Zum Beispiel P k+1 1 ist die alternierende harmonische Reihe ∞ k=1 (−1) k konvergent, wie man aus dem Leibnizschen Konvergenzkriterium weiter unten erkennt. P 1 Die Reihe der Beträge ∞ k=1 k ist die harmonische Reihe, also divergent. 3.7.15 Definition. Reihen, die konvergent, aber nicht absolut konvergent sind, heißen auch bedingt konvergent. 3.8 Konvergenzkriterien Wir wollen das Majorantenkriterium ausnützen, um durch Vergleich mit der geometrischen Reihe zwei oft einsetzbare hinreichende Bedingungen für die absolute Konvergenz einer Reihe herzuleiten. 3.8.1 Satz. Sei ∞ P k=1 ak eine Reihe mit reellen oder komplexen Summanden. Dann gilt: KAPITEL 3. DER GRENZWERT 78 (i) Wurzelkriterium: Gibt es eine feste Zahl q, 0 < q < 1, sodass ab einem Index k0 die Ungleichung pk |ak | ≤ q, k ≥ k0 , ∞ P so ist die Reihe ak absolut konvergent. Gibt es eine Teilfolge (ak(l) )l∈N mit k=1 pk |ak(l) | ≥ 1, so ist sie divergent. (ii) Quotientenkriterium: Gibt es eine Zahl q, 0 < q < 1, sodass ab einem Index k0 alle ak , 0 sind, und sodass |ak+1 | ≤ q, k ≥ k0 , |ak | so ist die Reihe ∞ P ak absolut konvergent. Gibt es einen Index k0 , sodass ak , 0 k=1 und |ak+1 | |ak | ≥ 1 für k ≥ k0 , so ist sie divergent. Beweis. (i) Aus ∞ √k P |ak | ≤ q < 1 folgt |ak | ≤ qk . Da die Reihe qk konvergiert, zeigt das Majorantenkriterium, dass ∞ P k=k0 k=k0 |ak |, und damit auch ∞ P k=1 |ak | konvergiert. √ Ist dagegen k |ak | ≥ 1 für unendlich viele Indizes k, so kann (|ak |)k∈N und damit (ak )k∈N keine Nullfolge sein. Daher ist die Reihe divergent. (ii) Es existiere q < 1, sodass für hinreichend große k ∈ N, d.h. für alle k ≥ k0 mit einem geeigneten k0 , |ak+1 | ≤ q|ak | gilt. Dann folgt durch ein induktives Argument |al | ≤ ql |ak0 | , l ≥ k0 , q k0 q √ |a | und wir erhalten l |al | ≤ q · l qkk00 . Da der zweite Faktor mit l → ∞ gegen 1 strebt, können wir das Wurzelkriterium anwenden. | Aus |a|ak+1 ≥ 1 für k ≥ k0 folgt |ak+1 | ≥ |ak |. Also kann (|ak |)k∈N keine Nullfolge k| sein, da sie ab dem Index k0 monoton wächst. ❑ Diese Bedingungen werden oft in der folgenden Form angewandt. 3.8.2 Korollar. Sei (ak )k∈N eine Folge reeller oder komplexer Zahlen. Ist pk |ak+1 | < 1 bzw. lim |ak | < 1 , k→∞ k→∞ |ak | lim so ist die Reihe Reihe divergent. P∞ k=1 ak absolut konvergent. Ist dieser Limes dagegen > 1, so ist die Beweis. Existiert der eine oder andere Limes η und ist η < 1, so folgt η < 1+η 2 < 1. √k 1+η 1+η |ak+1 | Aus Lemma 3.3.1 sieht man, dass |ak | < 2 =: q bzw. |ak | < 2 =: q ab einem 3.8. KONVERGENZKRITERIEN 79 gewissen k0 . Im Falle η > 1 schließt man analog. ❑ Es sei darauf hingewiesen, dass es vorkommen kann, dass für eine Reihe Korollar 3.8.2 nicht anwendbar ist, weil der entsprechende Limes nicht existiert, Satz 3.8.1 jedoch schon anwendbar ist. 3.8.3 Beispiel. P zn (i) Betrachte die Reihe ∞ n=0 n! , wobei n! := 1 · 2 · 3 · . . . · n die Zahl n-faktorielle bezeichnet und z ∈ C. Diese Reihe ist konvergent, denn es gilt n+1 z 1· 2· ...·n |z| = (n+1)! |z| = → 0. zn 1 · 2 · . . . · n · (n + 1) n+1 n! (ii) Betrachte die Reihe P∞ 1 n=1 (3+(−1)n )n . s n Die Folge der n-ten Wurzeln 1 1 = (3 + (−1)n )n (3 + (−1)n ) hat zwar keinen Grenzwert, aber ihre Glieder sind alle ≤ 21 . Somit kann man zwar nicht Korollar 3.8.2 anwenden, aber das Wurzelkriterium aus Satz 3.8.1. Der Grenzwert der Reihe lässt sich mit Hilfe der hergeleiteten Regeln für Reihen berechnen: ! X ∞ ∞ ∞ ∞ X X X 1 1 1 1 1 = = + + = n )n 2k−1 2k 2k−1 2k (3 + (−1) 2 4 2 4 k=1 k=1 k=1 n=1 ∞ ∞ X 1 1 X 1 2 + = 2 k k 4 16 1− k=1 k=1 1 4 − 1 + 1 − 1 . 1 1 − 16 (iii) Bezeichne mit τ(n) die Anzahl der Teiler der natürlichen Zahl n. Wir betrachten P n die Reihe ∞ n=1 τ(n)x wobei x > 0 ist. Wegen τ(n) ≤ n gilt pn pn √ τ(n)xn = x · τ(n) ≤ x · n n → x . Ist also x < 1, so ist die Reihe konvergent. Für x ≥ 1 ist sie sicher divergent, denn dann bilden die Summanden keine Nullfolge. Wir haben im Beweis von Satz 3.8.1 gesehen, dass das Quotientenkriterium schwächer als das Wurzelkriterium ist. Das eben betrachtete Beispiel ist gerade eines wo uns das Wurzelkriterium zum Ziel führt, das Quotientenkriterium aber versagen würde. Denn ist n > 2 eine Primzahl, dann gilt τ(n) = 2. Weiters ist n sicher ungerade, und damit kann n + 1 keine Primzahl sein, also gilt τ(n + 1) ≥ 3. Wir erhalten damit τ(n + 1)xn+1 3 ≥ · x. τ(n)xn 2 Für x ≥ 32 ist daher der Quotient ≥ 1. Da es unendlich viele Primzahlen gibt, können wir also das Quotientenkriterium nicht anwenden. Die nun präsentierten Kriterien basieren auf folgendem auch später verwendeten Lemma. KAPITEL 3. DER GRENZWERT 80 3.8.4 Lemma. Seien a1 , . . . , am und b1 , . . . , bm komplexe oder reelle Zahlen, so gilt m X n=1 an bn = am βm − wobei die βn die Partialsummen n P m−1 X (an+1 − an )βn , n=1 b j = βn bezeichnen. j=1 Beweis. m−1 X n=1 m X n=2 (an+1 − an )βn = an βn−1 − m−1 X n=1 m−1 X n=1 an+1 βn − an βn = am βm−1 − am βm − am bm − m−1 X n=2 m−1 X n=2 m−1 X an βn = n=1 an (βn − βn−1 ) − a1 β1 = an bn − a1 b1 = am βm − m X an bn . n=1 ❑ 3.8.5 Satz (Dirichletsches11 Kriterium). Sei (an )n∈N eine monotone Nullfolge reeller Zahlen und sei (bn )n∈N eine Folge reeller oder komplexer Zahlen. Gilt für eine Zahl M>0 N X bn ≤ M, N ∈ N, n=1 so ist die Reihe ∞ P an bn konvergent. n=1 Beweis. Sei N so groß, dass |an | < ǫ für n ≥ N. Dann folgt für k, m ≥ N, k < m aus Lemma 3.8.4 und der Dreiecksungleichung m m m−1 n X X X X an bn ≤ am bi + bi . |an+1 − an | n=k+1 n=k+1 i=k+1 i=k+1 P P P Da | ni=k+1 bi | ≤ | ki=1 bi | + | ni=1 bi | ≤ 2M, schätzen wir diesen Ausdruck weiter nach oben durch m−1 X 2M|am | + 2M |an+1 − an | n=k+1 ab. Voraussetzungsgemäß haben die Ausdrücke der Form (an+1 − an ) niemals verschiedenes Vorzeichen. Also gilt m−1 m−1 X X 2M |am | + |an+1 − an | = 2M |am | + (an+1 − an ) ≤ n=k+1 n=k+1 2M (|am | + |am | + |ak+1 |) ≤ 2M · 3ǫ. ∞ P Nach dem Cauchyschen Kriterium ist die Reihe an bn konvergent. n=1 11 Johann Peter Gustav Lejeune Dirichlet. 13.2.1805 Düren (bei Aachen) - 5.5.1859 Göttingen ❑ 3.8. KONVERGENZKRITERIEN 81 3.8.6 Korollar (Leibniz12Kriterium). Sei ∞ P (−1)n an eine alternierende Reihe, d.h. n=1 an ≥ 0, n ∈ N. Ist (ak )k∈N monoton fallend und gilt lim an = 0, so konvergiert n→∞ ∞ P (−1)nan . n=1 Beweis. Setze im Dirichletschen Kriterium bn = (−1)n . ❑ ∞ P 3.8.7 Beispiel. Für α > 1 ist die Reihe k=1 1 kα konvergent13. m+1 Da m+1 m → 1, kann man m ∈ N so wählen, dass m ≤ α. Nach dem Majorantenkriterium genügt es, die Behauptung für den Exponenten m+1 m zu zeigen. ∞ P Betrachte die nach dem Leibnizschen Kriterium konvergente Reihe (−1)k+1 11 . km k=1 Fassen wir immer je zwei Summanden zusammen, so konvergiert nach Fakta 3.7.4, 2, auch die Reihe ! ∞ X 1 1 − . 1 1 m (2k) m k=1 (2k − 1) Nun ist 1 (2k − 1) 1 m − (2k) 1 1 1 = 1 m (2k) m − (2k − 1) m 1 m (2k − 1) (2k) (2k) − (2k − 1) 1 m = 1 1 1 (2k − 1) m (2k) m · ≥ 1 1 m−2 m−1 (2k − 1) m + . . . + (2k) m (2k − 1) m + (2k − 1) m 1 1 1 = · m+1 ≥ 2 m−1 m+1 (2k) m m(2k) m m2 m k m ∞ P 1 Nach dem Majorantenkriterium folgt somit, dass auch die Reihe m+1 konvergiert. · (2k) m−1 m + (2k) m−2 m k=1 k 3.8.8 Korollar (Abelsches14 Kriterium). Sei die Reihe Folge. Dann ist die Reihe ∞ P ∞ P m bn konvergent, und sei (an )n∈N eine monotone und beschränkte n=1 an bn konvergent. n=1 Beweis. Die Folge (an )n∈N ist konvergent, an → a. Es gilt N X an bn = n=1 N X n=1 (an − a)bn + a N X bn . n=1 Für N → ∞ existiert für jeden der beiden Summanden auf der P rechten Seite der Grenzwert, denn die Reihe konvergiert nach dem Dirichletschen Kriterium und die Reihe ∞ n=1 bn nach Voraussetzung. P∞ n=1 (an − a)bn ❑ 3.8.9 Satz (Kriterium von Raabe15 ). Sei (an )n∈N eine Folge reeller oder komplexer Zahlen. Gibt es eine Zahl β > 1, sodass ab einem Index k0 alle ak , 0 sind, und |ak+1 | β ≤ 1 − , k ≥ k0 , |ak | k so ist die Reihe ∞ P ak absolut konvergent. k=1 Ist ab einem gewissen Index k0 jedoch konvergent. 12 Gottfried |ak+1 | |ak | ≥ 1 − 1k , so ist sie nicht absolut konvergent, also höchstens bedingt Wilhelm Leibniz. 1.7.1646 Leipzig - 14.11.1716 Hannover dass wir kα erst für rationales α definiert haben. 14 Niels Henrik Abel. 5.8.1802 Finnö (Norwegen) - 6.4.1829 Froland (Norwegen) 15 Josef Ludwig Raabe. 1801 - 1859 13 Bemerke, KAPITEL 3. DER GRENZWERT 82 Beweis. Für k ≥ k0 gilt wegen unserer Voraussetzung k|ak+1 | ≤ k|ak | − β|ak | und daher (β − 1)|ak | ≤ (k − 1)|ak | − k|ak+1 |. (3.14) Wegen β > 1 ist (k−1)|ak | > k|ak+1 | > 0. Somit ist die Folge ((k−1)|ak |)k∈Z≥2 monoton und beschränkt, und daher konvergent. Daraus ergibt sich die Konvergenz der Folge (in k) k X n=2 ((n − 1)|an | − n|an+1 |) = |a2 | − k|ak+1 | von Partialsummen. Wegen (3.14) konvergiert die Reihe |ak+1 | |ak | 1 k P∞ n=1 |an |. ≥ 1 − für k ≥ k0 (> 1), so folgt k|ak+1 | ≥ (k − 1)|ak | ≥ (k0 − 1)|ak0 | := α > 0. Also ist |ak+1 | ≥ Gilt nun P nach dem Minorantenkriterium kann ∞ n=1 |an | nicht konvergieren. Wir wollen noch anmerken, dass man die Konvergenz von ( n1α )n∈N α k, und ❑ für α ∈ N, n ≥ 2, mit dem Kriterium von Raabe und der Bernouillsche Ungleichung zeigen kann. 3.9 Umordnungen von Reihen und Doppelreihen Wir haben in Fakta 3.7.4 gesehen, dass die Konvergenz einer Reihe nicht verloren geht, und der Grenzwert unverändert bleibt, wenn man beliebig Klammern setzt. Es ist aber wesentlich, dass man die Summationsreihenfolge beibehält. Denn wie man am P folgenden Beispiel sieht, kann man für manche Reihen ∞ n=1 xn eine Bijektion σ : N → P∞ P∞ N finden, sodass n=1 xσ(n) , n=1 xn . Diese neue Reihe heißt Umordnung der Reihe P∞ n=1 xn . PN Das ist ein wesentlicher Unterschied zu endlichen Summen. Denn ist k=1 ak eine endliche Summe, so können wir die Summanden beliebig umordnen ohne, dass sich die Summe verändert. Anders ausgedrückt: Ist σ eine Permutation von {1, . . . , N}, d.h. PN PN eine Bijektion von {1, . . . , N} auf sich, dann gilt k=1 ak = k=1 aσ(k) . 3.9.1 Beispiel. Betrachte die alternierende harmonische Reihe S =1− 1 1 1 1 1 + − + − + .... 2 3 4 5 6 Ordnen wir die Summanden in einer anderen Reihenfolge an 16 , z.B. als 1 1 1 1 1 1 1 1 1 1 1 − + − − +... = 1− − + − − + − 2 4 3 6 8 5 10 12 7 14 16 |{z} | {z } | {z } | {z } = 12 = = 16 1 = 10 1 = 14 1 1 1 1 1 1 1 1 1 1 1 1 1 1 − + − + − + − +... = 1− + − + − +... , 2 4 6 8 10 12 14 16 2 2 3 4 5 6 so erhalten wir genau S2 . Die Summe einer Reihe kann also von der Reihenfolge der Summanden abhängen. Tatsächlich kann man eine konvergente aber nicht absolut konvergente Reihe stets so umordnen, dass jede beliebige Summe einschließlich ±∞, oder gar eine divergente Reihe, herauskommt, vgl. Satz 3.9.4. Eine der herausragenden Eigenschaften von absolut konvergenten Reihen ist die, dass bei Ihnen ein solches Verhalten nicht auftreten kann. Also hängt die Summe nicht von der Ordnung der natürlichen Zahlen ab. Um das einzusehen, führen wir im folgenden Lemma eine neue Art von Grenzwertbegriff ein. 16 Die entsprechende Bijektion σ : N → N ist für k ∈ N durch σ(3k−2) = 2k−1, σ(3k−1) = 4k−2, σ(3k) = 4k bestimmt. 3.9. UMORDNUNGEN VON REIHEN UND DOPPELREIHEN 83 P 3.9.2 Lemma. Sei ∞ k=1 ak eine Reihe reeller oder komplexer Zahlen. Dann sind folgende Aussagen äquivalent: (i) Die Reihe ist absolut konvergent. P (ii) Es gibt ein C > 0, sodass j∈M |a j | ≤ C für alle endlichen Teilmengen M von N. P (iii) Es gibt ein C > 0, sodass | j∈M a j | ≤ C für alle endlichen Teilmengen M von N. (iv) Es gibt ein s ∈ R, sodass X ∀ǫ > 0 ∃M0 ⊆ N, M0 endlich : a j − s < ǫ, (3.15) j∈M für alle endlichen M, M0 ⊆ M ⊆ N. Sind diese Bedingungen erfüllt, so ist die Zahl s aus (iv) genau die Summe der Reihe P∞ k=1 ak . Beweis. Ehe wir die Äquivalenzen zeigen, sei darauf hingewiesen, dass die Zahl s in (iv) eindeutig ist. Würde nämlich (iv) für s und ein s′ , s gelten, dann folgt mit |s−s′ | ǫ := 3 und M = M0 ∪ M0′ der Widerspruch (vgl. Satz 3.2.9) X X |s − s′ | ≤ a j − s + a j − s′ < 2ǫ < |s − s′ |. j∈M j∈M P P (i) ⇔ (ii): Für endliche Teilmengen M ⊆ N gilt klarerweise j∈M |a j | ≤ max(M) |a j |. j=1 Somit ist (ii) äquivalent zur Beschränktheit der Folge der Partialsummen der P Reihe ∞j=1 |a j |. Die Äquivalenz zu (i) folgt nun aus Satz 3.7.8, (i). (i) ⇒ (iv): Sei ǫ > 0 gegeben. Wegen der absoluten Konvergenz gibt es ein N ∈ N, sodass für n > m ≥ N n X | ak |< ǫ. k=m+1 Setze M0 = {1, . . . , N}. Ist M eine endliche Teilmenge von N, die M0 enthält, so sind alle j ∈ M \ M0 größer als N. Also gilt für beliebiges m > N max(M) m m m X X X X X X a j − |a j | + a j ≤ |a j | < 2ǫ. a j = a j − j=N+1 j∈M j=N+1 j=N+1 j=1 j∈M j>N P Strebt nun m gegen ∞, so folgt (siehe Lemma 3.3.1) | j∈M a j − s| ≤ 2ǫ. Da ǫ > 0 beliebig war folgt (3.15). (iv) ⇒ (iii): Sei ǫ > 0 fest und M0 wie in (3.15). Für ein beliebiges endliches M ⊆ N folgt aus (3.15) wegen (M0 \ M) ∪ M = M0 ∪ M ⊇ M0 X X X X a j = a j + aj − s + s − a j ≤ j∈M j∈M j∈M0 \M j∈M0 \M X X X a j − s + |s| + |a j |. |a j | ≤ ǫ + |s| + j∈M0 ∪M j∈M0 j∈M0 \M KAPITEL 3. DER GRENZWERT 84 P P (iii) ⇒ (ii): Da |a j | ≤ | Re a j | + | Im a j |, genügt es, j∈M | Re a j |, j∈M | Im a j | ≤ 2C nachzuweisen. Dazu setzt man M1 = {n ∈ M : Re an ≥ 0} und M2 = {n ∈ M : Re an < 0}. Es folgt X X X X X Re an = Re Re an − | Re an | = an − Re an ≤ n∈M n∈M2 n∈M1 n∈M1 n∈M2 X X an ≤ 2C. an + n∈M1 n∈M2 P Entsprechend schließt man für n∈M | Im an |. ❑ P 3.9.3 Satz. Die Reihe ∞ k=1 bk mit reellenPoder komplexen Summanden sei absolut konvergent. Dann ist auch jede Umordnung ∞ k=1 bσ(k) absolut konvergent und hat die gleiche Summe s. P Beweis. Wir wenden Lemma 3.9.2, (iv), auf s := ∞ k=1 bk an. Also gilt (3.15) mit a j = b j . Diese Bedingung ist aber invariant unter jeder Bijektion σ : N → N. In der Tat, ist ǫ > 0 und M0 so, dass (3.15) gilt, und ist σ−1 (M0 ) ⊆ M, so folgt wegen M0 ⊆ σ(M) X X X bσ( j) − s = bσ( j) − s = bk − s < ǫ. j∈M σ( j)∈σ(M) k∈σ(M) Also gilt (3.15) auch mit a j = bσ( j) . Nach Lemma 3.9.2 konvergiert auch die umgeordP nete Reihe ∞ n=1 bσ(n) gegen s. ❑ Der Grenzwertbegriff, dem wir in (3.15) begegnet sind, und die Konvergenz von Folgen sind Spezialfälle eines allgemeineren Konzeptes, das wir am Ende von Kapitel 5 diskutieren werden. Nun wollen wir Satz 3.9.3 umkehren. 3.9.4 Satz. Sei die Reihe ∞ P ak reeller Zahlen konvergent mit der Summe S , aber nicht k=1 absolut konvergent. Dann gibt es zu jeder vorgegebenen Zahl S ′ ∈ R ∪ {±∞} eine ∞ ∞ P P Umordnung (bk )k∈N , bk = aσ(k) , mit bk = S ′ . Weiters gibt es Umordnungen bk die k=1 k=1 divergieren (aber nicht bestimmt divergieren). Beweis. Bezeichne mit a+k := max(ak , 0), a−k := min(ak , 0), d.h. die Folgen der positiven bzw. negativen Terme ak . Wir überlegen zuerst, dass ∞ X k=1 a+k = +∞, ∞ X k=1 a−k = −∞ (3.16) gelten muss. Zunächst sind die Partialsummen dieser Reihen monotone Folgen, haben also einen Grenzwert in R ∪ {±∞}. Angenommen einer der beiden wäre endlich, z.B. 3.9. UMORDNUNGEN VON REIHEN UND DOPPELREIHEN ∞ P k=1 85 a+k = S + < ∞. Dann folgt N X a−k = k=1 und somit N X k=1 N X k=1 | ak |= ak − N X k=1 N X k=1 a+k N→∞ a+k −→ S − := S − S + > −∞. − N X k=1 N→∞ a−k −→ S + − S − < ∞, ∞ P ak nicht absolut konvergiert. P ′ Sei nun S ∈ R gegeben. Wir konstruieren eine Umordnung ∞ k=1 bk , die gegen S + + + + konvergiert. Zuerst addiert man Summanden a1 , a2 , a3 , . . . , an1 , bis man das erste Mal > S ′ ist, dann Summanden a−1 , a−2 , . . . , a−l1 bis die Gesamtsumme das erste mal wieder < S ′ ist. Dann a+n1 +1 , a+n1 +2 , . . . , a+n2 bis man das erste Mal wieder > S ′ ist. So verfährt man weiter. Wegen (3.16) ist das stets möglich. ∞ P ak . Ist S n′ eine Partialsumme, Man erhält in dieser Weise eine Umordnung von im Widerspruch zur Voraussetzung, dass k=1 ′ k=1 so ist S n′ − S ′ beschränkt nach oben durch das letzte aufgetretene a+k und nach unten durch das letzte aufgetretene a−k . Wegen lim ak = 0 gilt auch k→∞ lim (S n′ − S ′ ) = 0. n→∞ In analoger Weise verfährt man, wenn man eine Umordnung konstruieren möchte, die bestimmt divergiert gegen +∞ oder −∞, oder nicht einmal bestimmt divergiert. ❑ 3.9.5 Bemerkung. Obiger Beweis verwendet bei der Definition der Umordnung implizit den Rekursionssatz. Die Tatsache, dass die dadurch definierte Funktion bijektiv auf N ist und dass sie das gewünschte leistet, bedarf eigentlich eines strengeren Beweises. Für den interessierten Leser bringen wir anschließend einen wasserdichten Beweis. Wir zeigen wie oben, dass (3.16) zutrifft. Nun sei M1 := {n ∈ N : an ≥ 0}, M2 := {n ∈ N : an < 0}. ˙ 2 . Wäre M1 endlich, so hätten wir a+n = 0 für n > max(M1 ), was aber (3.16) Offensichtlicherweise gilt N = M1 ∪M widerspricht. Also ist M1 und mit einer ganz ähnlichen Argumentation auch M2 unendlich. Nun sei Fn die Menge aller Funktionen f : {1, . . . , n} → N, die folgende beiden Bedingungen erfüllen: (i) 1 ≤ i < j ≤ n, f (i), f ( j) ∈ M1 ⇒ f (i) < f ( j) und 1 ≤ i < j ≤ n, f (i), f ( j) ∈ M2 ⇒ f (i) < f ( j). (ii) f (i) ∈ M1 ⇒ {1, . . . , f (i)} ∩ M1 ⊆ f ({1, . . . , i}) und f (i) ∈ M2 ⇒ {1, . . . , f (i)} ∩ M2 ⊆ f ({1, . . . , i}). Fn ist nicht leer, da - wie man sich leicht überzeugt - die Funktion f (1) = min(M1 ), f (2) = min(M1 \ { f (1)}), . . . , f (n) = min(M1 \ { f (1), .S. . , f (n − 1)}) in dieser Menge liegt. n∈N Fn (⊆ N × N) und definiere g : F → F folgendermaßen: Sei f ∈ F , also f ∈ Fn für ein n ∈ N. Falls Pn Setze F = ′ j=1 a f ( j) < S , so sei g( f ) : {1, . . . , n + 1} → N die Fortsetzung von f , sodass g( f )(n + 1) = min(M1 \ f ({1, . . . , n})). Diese Fortsetzung liegt tatsächlich in Fn+1 ⊆ F . Um das zu sehen, sei 1 ≤ i < j ≤ n + 1, sodass beide Zahlen g( f )(i), g( f )( j) gleichzeitig entweder in M1 oder in M2 liegen. Ist j ≤ n, dann folgt f (i) = g( f )(i), f ( j) = g( f )( j) ∈ M1 (M2 ) und daher g( f )(i) = f (i) < f ( j) = g( f )( j). Falls j = n+1, dann ist g( f )(n+1) = min(M1 \ f ({1, . . . , n})) ∈ M1 . Wegen i ∈ {1, . . . , n} muss auch g( f )(i) = f (i) ∈ M1 . Falls g( f )(n + 1) ≤ f (i), so wäre nach (ii), g( f )(n + 1) = f (k) für ein k ≤ i ≤ n, und damit g( f )(n + 1) = f (k) < M1 \ f ({1, . . . , n}), was aber nicht sein kann. Also gilt g( f )(n + 1) > f (i) und g( f ) erfüllt (i). KAPITEL 3. DER GRENZWERT 86 Um (ii) zu zeigen, sei g( f )(i) ∈ M1 (M2 ) für ein i ∈ {1, . . . , n + 1}. Falls i ≤ n, so folgt {1, . . . , g( f )(i)} ∩ M1 = {1, . . . , f (i)} ∩ M1 ⊆ f ({1, . . . , i}) = g( f )({1, . . . , i}). Dasselbe gilt für M2 . Sei nun i = n + 1. Dann ist g( f )(n + 1) ∈ M1 . Ist k ∈ M1 mit k < g( f )(n + 1), so muss k in f ({1, . . . , n}) sein, da wir sonst P den Widerspruch g( f )(n + 1) = min(M1 \ f ({1, . . . , n})) ≤ k bekämen. Ist dagegen nj=1 a f ( j) ≥ S ′ , so sei g( f ) : {1, . . . , n + 1} → N die Fortsetzung von f , sodass g( f )(n + 1) = min(M2 \ f ({1, . . . , n})). Man zeigt genauso wie oben, dass auch in diesem Fall g( f ) ∈ Fn+1 ⊆ F . Ist nun noch a ∈ F1 definiert durch a(1) = 1, so gibt es nach dem Rekursionssatz (Satz 2.3.3) eine Abbildung φ : N → F , sodass φ(1) = a und φ(n + 1) = g(φ(n)). Wir setzen [ φ(n). σ= n∈N Durch vollständige Induktion zeigt man leicht, dass φ(n) ∈ Fn und dass φ(m) eine Fortsetzung von φ(n) für alle m, n ∈ N, m > n ist. Man sieht daher sofort, dass σ : N → N eine Funktion ist, wobei σ|{1,...,n} = φ(n). Weiters ist σ injektiv, da für i < j ∈ N, unter der zusätzlichen Voraussetzung σ(i), σ( j) ∈ M1 (M2 ) nach (i) die Relation σ(i) = φ(N)(i) < φ(N)( j) = σ( j) mit irgendeinem N ≥ i, j folgt. Ist σ(i) ∈ M1 ∧ σ( j) ∈ M2 bzw. σ(i) ∈ M2 ∧ σ( j) ∈ M1 , so muss auch σ(i) , σ( j), da M1 ∩ M2 = ∅. σ ist sogar surjektiv. Dazu sei k ∈ N. Wir nehmen an, dass k ∈ M1 . Wäre k < σ(N), so folgt aus σ( j) ∈ M1 wegen σ( j) = φ( j)( j) und (ii), dass σ( j) < k. Also gilt {k, k + 1, . . . } ∩ σ(N) ⊆ M2 . Da σ injectiv ist, muss dieser Schnitt unendlich viele Zahlen enthalten. Wegen (ii) ist mit m ∈ σ(N), m > k, auch {k, k + 1, . . . , m} ⊆ σ(N), und somit {k, k + 1, . . . } = {k, k + 1, . . . } ∩ σ(N) ⊆ M2 . Somit hätten wir den Widerspruch, dass M1 endlich ist. Entsprechend führt auch k ∈ M2 und k < σ(N) auf einen Widerspruch. P ′ Nun gilt es noch zu zeigen, dass ∞ j=1 aσ( j) = S . Dazu sei ǫ > 0, und wähle k1 ∈ M1 (k2P∈ M2 ) so, dass |ak | < ǫ für alle k ≥ k1 (k ≥ k2 ). Das ist möglich, da die Folge der Summanden der konvergenten Reihe ∞ j=1 a j ja eine Nullfolge bildet. Sei N die kleinste Zahl in N, sodass σ(N) > k1 , σ(N) > k2 und sodass σ(N) ∈ M1 ∧ σ(N + 1) ∈ M2 oder σ(N) ∈ M2 ∧ σ(N + 1) ∈ M1 . Für ein k ≥ N+1 sei m ∈ {N, . . . , k−1} die größte Zahl mit σ(m) ∈ M1 ∧σ(m+1) ∈ M2 oder σ(m) ∈ M2 ∧σ(m+1) ∈ M1 . Im ersten Fall muss dann σ(m + 1), . . . , σ(k) ∈ M2 und im zweiten σ(m + 1), . . . , σ(k) ∈ M1 . Wegen g(σ|{1,...,l} ) = σ|{1,...,l+1} muss im ersten Fall m−1 m k−1 m−1 X X X X aσ( j) + aσ(m) . aσ( j) = aσ( j) ≤ aσ( j) < S ′ ≤ m−1 X j=1 j=1 j=1 und im zweiten aσ( j) + aσ(m) = m X j=1 j=1 In jedem Fall gilt aσ( j) ≤ k−1 X j=1 j=1 aσ( j) < S ′ ≤ m−1 X aσ( j) . j=1 k X aσ( j) − S ′ ≤ |aσ (k)| + |aσ(m) | < 2ǫ. j=1 3.9.6 Bemerkung. Für komplexwertige Reihen gilt Satz 3.9.4 nicht. Als nächstes wollen wir uns mit dem Distributivgesetz befassen. Für zwei endliche Summen gilt ja n m n,m X X X ai · b j = ai b j . i=1 Möchte man das Produkt ∞ P i=1 ! ai · j=1 ∞ P b j von zwei Reihen ausrechnen, so muss man j=1 also alle Einzelprodukte aufsummieren: a1 b1 + a2 b1 + a3 b1 + .. . + + + i=1, j=1 ! a1 b2 + a2 b2 + a3 b2 + .. . + + + a1 b3 + a2 b3 + a3 b3 + .. . + ... + ... + ... (3.17) 3.9. UMORDNUNGEN VON REIHEN UND DOPPELREIHEN 87 Wie wir gesehen haben, ist es nicht unwesentlich, in welcher Reihenfolge man das tut. Die Problematik (3.17) aufzusummieren führt zu so genannten Doppelreihe. Es gilt also gegebene Zahlen ai j , i, j ∈ N, a11 a21 a31 .. . a12 a22 a32 .. . a13 a23 a33 .. . ... ... ... .. . in einer vernünftigen Art und Weise aufzusummieren. Eine Möglichkeit, das zu tun, P wären zuerst die Zeilen aufzusummieren, si = ∞j=1 ai j , und dann die Spalten: ∞ ∞ X X ai j ; S1 = i=1 eine andere, zuerst die Spalten, v j = P∞ i=1 S2 = j=1 ai j , und dann die Zeilen ai j . ∞ ∞ X X j=1 Mann könnte auch längs der Diagonalen i=1 ∞ X X S3 = ai j , (3.18) k=2 i+ j=k oder überhaupt auf irgend eine andere Weise aufsummieren. Dass dabei aber viel schiefgehen kann, zeigt das folgende Beispiel. 3.9.7 Beispiel. Betrachte man 1 + 0 + 0 + 0 + .. . − + + + 1 + 1 + 0 + 0 + .. . + − + + 0 + 1 + 1 + 0 + .. . + + − + 0 + 0 + 1 + 1 + .. . + ... = 0 + ... = 0 + ... = 0 − ... = 0 .. . = 1\0 = = = = 1 + 0 + 0 + 0 + ... = P∞ P∞ P P∞ d.h. ∞ j=1 i=1 ai j = 1. Summiert man längs der Diagonalen, so i=1 j=1 ai j = 0, erhält man 1 − 1 + 1 − 1 + 1 − 1 ± ..., diese Summe ist also nicht einmal konvergent. P 3.9.8 Definition. Eine Reihe ∞ k=1 bk heißt eine lineare Anordnung der Doppelreihe P∞ 17 i, j=1 ai j , falls bk = aτ(k) mit einer Bijektion τ : N → N × N . 17 Bekanntlich sind N und N × N gleich mächtig, was bedeutet, dass es solche linearen Anordnungen tatsächlich gibt. KAPITEL 3. DER GRENZWERT 88 3.9.9 Bemerkung. Von den drei oben genannten Summationsmethoden entspricht nur die Summation längs der Diagonalen eine lineare Anordnung. Die dazugehörige Bijektion kann man folgendermaßen veranschaulichen: i= 1 2 3 4 .. . j= 1 •τ(1) •τ(3) •τ(6) •τ(10) .. . 2 •τ(2) •τ(5) •τ(9) · .. . 3 •τ(4) •τ(8) · · .. . 4 •τ(7) · · · .. . ··· ··· ··· ··· ··· Die Summe aus (3.18) ist dann nichts anderes als k(k+1) ∞ 2 X X a , τ(l) k(k−1) k=1 l= P∞ und stimmt wegen Fakta 3.7.4, 2, mit 2 l=1 +1 aτ(l) überein. Um τ wasserdicht zu definieren, sei ψ : N × N → N × N mit ψ(i, j) = (i + j, i). Man sieht sofort, dass ψ injektiv ist. Außerdem ist i + 1 ≤ i + j. Also liegt ψ(i, j) in D := {(d, p) ∈ N × N : p + 1 ≤ d}. Ist andererseits (d, p) in dieser Menge, so ist ψ(p, d − p) = (d, p). Also ist ψ : N × N → D bijektiv. + p. Sei (d1 , p1 ) , (d2 , p2 ), wobei oBdA. d1 ≤ d2 . Ist d1 < d2 , Nun sei φ : D → N definiert durch φ(d, p) = (d−1)(d−2) 2 so gilt wegen p1 ≤ d1 − 1 (d1 − 1)(d1 − 2) (d1 − 1)(d1 − 2) d1 (d1 − 1) (d2 − 1)(d2 − 2) (d2 − 1)(d2 − 2) + p1 ≤ + d1 − 1 = ≤ < + p2 , 2 2 2 2 2 und somit φ(d1 , p1 ) , φ(d2 , p2 ). Ist d1 = d2 , so muss p1 , p2 und somit auch φ(d1 , p1 ) , φ(d2 , p2 ). Also ist φ injektiv. Sei . Setzen wir p = n − (d−1)(d−2) , so muss 1 ≤ p ≤ d − 1, da umgekehrt n ∈ N und d ∈ N, d ≥ 2 maximal, sodass n > (d−1)(d−2) 2 2 im Falle p > d − 1 (d − 1)(d − 2) d(d − 1) (d − 1)(d − 2) >d−1+ = n= p+ 2 2 2 folgen würde. Das widerspricht aber der Maximalität von d. Also ist φ : D → N bijektiv. Nun sei τ die Inverse von φ ◦ ψ : N × N → N. Also ist τ : N → N × N bijektiv, wobei τ−1 (i, j) = (i + j − 1)(i + j − 2) + i. 2 3.9.10 Satz. P (i) Sei die Doppelreihe ∞ i,P j=1 ai j reeller oder komplexer Zahlen gegeben. Ist eine lineare Anordnung von ∞ i, j=1 ai j absolut konvergent, so auch alle anderen, und alle haben die selbe Summe S . (ii) Die absolute Konvergenz ist genau dann der Fall, wenn für ein C > 0 und allen n∈N n X n X | ai j |≤ C (3.19) i=1 j=1 (iii) Die absolute Konvergenz ist genau dann der Fall, wenn sowohl P P j ∈ N also auch ∞j=1 ∞ |a | i=1 i j konvergiert. Dabei gilt ∞ ∞ X X ai j S = j=1 i=1 P∞ i=1 |ai j | für alle 3.9. UMORDNUNGEN VON REIHEN UND DOPPELREIHEN (iv) Die absolute Konvergenz ist genau dann der Fall, wenn sowohl P P∞ i ∈ N also auch ∞ i=1 j=1 |ai j | konvergiert. Dabei gilt ∞ ∞ X X ai j S = i=1 89 P∞ j=1 |ai j | für alle j=1 Beweis. (i) Da für zwei lineare Anordnungen τ1 , τ2 die Funktion τ−1 2 ◦ τ1 eine Bijektion auf N ist, sind zwei lineare Anordnungen Umordnungen voneinander, und die erste Behauptung folgt aus Satz 3.9.3. (ii) Da jede endliche M ⊆ N × N für hinreichend großes n ∈ N in einem Quadrat {1, . . . , n} × {1, . . . , n} enthalten ist, ist die Bedingung (3.19) äquivalent zu: X | ai j |≤ C (3.20) (i, j)∈M für alle endlichen Teilmengen M ⊆ N × N. Ist nun τ : N → N × N eine lineare Anordnung, so ist letztere Bedingung äquivalent zur Bedingung aus Lemma 3.9.2, (ii), wobei an = aτ(n) . Aus Lemma 3.9.2 P folgt, dass (3.19) äquivalent zur absoluten Konvergenz von ∞ n=1 an ist. P Pn P∞ P∞ (iii) Ist C := j=1 i=1 |ai j | < +∞ und n ∈ N, so folgt wegen i=1 |ai j | ≤ ∞ i=1 |ai j | sicherlich (siehe Lemma 3.3.1) n ∞ n n X X X X |ai j | ≤ C. |ai j | ≤ j=1 i=1 j=1 i=1 Somit gilt (3.19). Nehmen wir umgekehrt (3.19) an, so haben wir schon gesehen, dass dann (3.20) gilt. Setzen wir speziell M = {1, . . . , k} × { j}, so folgt k X i=1 Also sind alle Reihen P∞ i=1 | ai j |≤ C, k ∈ N. ai j absolut konvergent. Aus der absoluten Konvergenz folgt wegen Lemma 3.9.2 die Bedingung (3.15). Überträgt man nun diese mit einer lineare Anordnung τ : N → N × N auf unsere Doppelreihe, so ist (3.15) äquivalent zu X ∀ǫ > 0 ∃M0 ⊆ N × N, M0 endlich : a(i, j) − S < ǫ, (i, j)∈M für alle endlichen M, M0 ⊆ M ⊆ N × N. Wie oben schon bemerkt, findet man zu einem endlichen M0 ⊆ N × N ein n0 ∈ N, sodass M0 ⊆ {1, . . . , n0 } × {1, . . . , n0 }. Ist m ≥ n ≥ n0 , so ist sicher auch M0 ⊆ {1, . . . , m} × {1, . . . , n} =: Qm , und es gilt daher n X m X X a(i, j) − S = a(i, j) − S < ǫ. j=1 i=1 (i, j)∈Qm KAPITEL 3. DER GRENZWERT 90 Lässt man nun bei festgehaltenem n die Zahl m gegen unendlich streben, so folgt mit Lemma 3.3.1 n X ∞ X ai j − S ≤ ǫ. j=1 i=1 Somit haben wir aber gezeigt, dass ∞ n X X lim ai j = S . n→∞ j=1 i=1 Wendet man diese Argumentation auf |a(i, j) | anstatt a(i, j) an, so folgt auch die P∞ P∞ Konvergenz von j=1 i=1 |ai j | . (iv) Man argumentiert wie im letzten Punkt. ❑ 3.9.11 Bemerkung. Aus (iii) und (iv) von Satz 3.9.10 folgt insbesondere: lim lim u→∞ v→∞ u X v X ai j = lim lim v→∞ u→∞ i=1 j=1 u X v X ai j . i=1 j=1 P P∞ 3.9.12 Korollar. Seien die beiden Reihen ∞ i=1 ai und j=1 b j absolut konvergent, und sei ∞ ∞ X X S = ai · b j . i=1 j=1 P Dann ist jede lineare Anordnung der Doppelreihe ∞ i, j=1 ai b j absolut konvergent und alle haben die Summe S . Weiters gilt m−1 ∞ ∞ ∞ X ∞ X ∞ X X X X ai bm−i = ai b j = S = ai b j , m=2 i=1 i=1 j=1 j=1 i=1 wobei alle auftretenden Reihen absolut konvergieren. P P∞ Beweis. Sei ∞ j=1 |b j | = D, dann folgt i=1 |ai | = C, n X m X i=1 j=1 |ai b j | = n X i=1 m X |ai | · |b j | ≤ C · D , j=1 also sind nach Satz 3.9.10 alle linearen Anordnungen sowie die iterierten Reihen absolut konvergent und haben die gleiche Summe S ′ . Diese kann man auch berechnen als S ′ = lim lim n→∞ m→∞ lim n→∞ n X m X ai b j = lim lim n→∞ m→∞ i=1 j=1 m n i X h X bj = ai · i=1 j=1 ∞ ∞ ∞ n X i X X h X bj = S . ai · bj = ai · i=1 j=1 i=1 j=1 3.9. UMORDNUNGEN VON REIHEN UND DOPPELREIHEN 91 Ist schließlich τ : N → N × N die spezielle Bijektion aus Bemerkung 3.9.9, so folgt wegen Fakta 3.7.4, 2, mit αi j = ai b j S′ = ∞ X l=1 da für l = k(k−1) 2 ατ(l) k(k+1) ∞ 2 X X = k=1 l= k(k−1) +1 2 m−1 X ∞ X ai bm−i , ατ(l) = m=2 i=1 + 1, . . . , k(k+1) und τ(l) = (i, j) gerade i + j = k + 1. 2 ❑ 3.9.13 Beispiel. Definiere eine Funktion exp : C → C durch exp(z) := ∞ X zn , z ∈ C. n! n=0 Zunächst müssen wir diese Definition rechtfertigen, also zeigen, dass diese Reihe konvergiert. Für jedes feste z ∈ C gilt n+1 z (n+1)! z = 0. lim zn = lim n→∞ (n + 1) n→∞ n! P zn Nach dem Quotientenkriterium ist die Reihe ∞ n=0 n! für jedes feste z ∈ C absolut konvergent. Wir wollen für zwei Zahlen z, w ∈ C das Produkt exp(z) exp(w) ausrechnen. Dazu verwenden wir Summation längs der Diagonalen. Wir erhalten aus Korollar 3.9.12 (unter Beachtung einer Indexverschiebung) exp(z) · exp(w) = ∞ X k X k=0 j=0 zk− j w j . (k − j)! j! Nach dem Binomischen Lehrsatz gilt k X j=0 zk− j w j 1 = (z + w)k , (k − j)! j! k! und wir erhalten ∞ X 1 (z + w)k = exp(z + w) . exp(z) exp(w) = k! k=0 Die Funktion exp heißt auch die Eulersche18 Exponentialfunktion. Sie ist eine der wichtigsten Funktionen, die es in der Mathematik gibt. Wir werden sie zum Beispiel auch dafür benützen um Funktionen wie sin z oder cos z zu definieren, vgl. den Abschnitt über elementare Funktionen. 3.9.14 Bemerkung. In analoger Weise kann man dreifach, vierfach, usw. Summen betrachten. Mit der entsprechend angepassten Definition von linearer Anordnung gelten dabei ganz ähnliche Aussagen wie für Doppelsummen. 18 Leonhard Euler. 15.4.1707 Basel - 18.9.1783 St.Petersburg 92 KAPITEL 3. DER GRENZWERT Kapitel 4 Die Konstruktion der reellen Zahlen Wir wollen in diesem Kapitel die am Anfang verschobene Konstruktion der reellen Zahlen nachholen und zeigen, dass diese eindeutig dadurch charakterisiert sind, dass R ein vollständig angeordneter Körper ist. Wir wollen uns als erstes mit einer Bemerkung beschäftigen, die uns zeigt, dass die reellen Zahlen im Sinne der Theorie metrischer Räume ganz natürlich aus den rationalen Zahlen entstehen. Dafür noch eine Definition: 4.1.1 Definition. (i) Seien hY, dY i und hX, dX i metrische Räume. Eine Abbildung φ : Y → X heißt isometrisch, wenn dX (φ(a), φ(b)) = dY (a, b), a, b ∈ Y . (ii) Seien hY, dY i und hX, dX i metrische Räume. Dann sagen wir hY, dY i ist isometrisch in hX, dX i enthalten, wenn Y ⊆ X und dY (a, b) = dX (a, b), a, b ∈ Y . (iii) Sei hX, di ein metrischer Raum und sei Y ⊆ X. Dann heißt Y dicht in hX, di, wenn es zu jedem Punkt x ∈ X eine Folge (yn )n∈N von Punkten aus Y gibt, mit limn→∞ yn = x bezüglich der Metrik d. 4.1.2 Bemerkung. Hat man die reellen Zahlen als vollständig angeordneten Körper zur Verfügung (was ja noch nicht der Fall ist), so wissen wir von Beispiel 3.2.6, dass Q eine dichte Teilmenge von R (bezüglich der euklidischen Metrik) ist. Wir sehen, dass die reellen Zahlen versehen mit der euklidischen Metrik ein vollständiger metrischer Raum sind, der hQ, di (d(x, y) = |x − y|) isometrisch und dicht enthält. Es ist also jede reelle Zahl der Grenzwert einer Cauchy-Folge rationaler Zahlen. Umgekehrt ist, wegen dem Cauchyschen Konvergenzkriterium, jede Cauchy-Folge rationaler Zahlen konvergent gegen eine gewisse reelle Zahl. Da Metriken Werte in R haben, benötigt man die reellen Zahlen, um von CauchyFolgen sprechen zu können. Wenn wir aber den Begriff des metrischen Raumes hX, di 93 94 KAPITEL 4. DIE KONSTRUKTION DER REELLEN ZAHLEN leicht dadurch verändern, dass wir annehmen, dass d nur Werte in Q hat, so kann man dem Begriff der Cauchy-Folge auch Sinn geben, wenn man nur Q zur Verfügung hat. Ein solcher metrischer Raum ist klarerweise hQ, di, wobei d(x, y) = |x − y|, siehe dazu Bemerkung 3.1.2. Eine Folge (xn )n∈N in einem solchen Raum X heißt dann konvergent gegen x ∈ X, wenn ∀ǫ ∈ Q, ǫ > 0 ∃N ∈ N : d(xn , x) < ǫ für alle n ≥ N , und sie heißt Cauchy-Folge, wenn ∀ǫ ∈ Q, ǫ > 0 ∃N ∈ N : d(xn , xm ) < ǫ für alle m, n ≥ N . Wir werden nun einen vollständig angeordneten Körper konstruieren, der aus rationalen Cauchy-Folgen besteht, wobei wir klarerweise Cauchy-Folgen, die sich nur um eine Nullfolge unterscheiden, als gleich anzusehen haben. (i) Sei X die Menge aller rationalen Cauchy-Folgen, und sei ∼⊆ X × X die Relation (rn )n∈N ∼ (sn )n∈N : ⇐⇒ lim (rn − sn ) = 0. n→∞ Diese Relation ist eine Äquivalenzrelation: Dabei ist Reflexivität und Symmetrie klar, um die Transitivität nachzuweisen, seien (rn )n∈N ∼ (sn )n∈N und (sn )n∈N ∼ (tn )n∈N gegeben. Es ist limn→∞ (rn − sn ) = limn→∞ (sn − tn ) = 0, und somit gilt für die Summe dieser Folgen limn→∞ (rn − tn ) = 0. Also ist (rn )n∈N ∼ (tn )n∈N . Es sei bemerkt, dass wir die Rechenregeln für Folgen in Q-wertigen metrischen Räumen nicht hergeleitet haben, obwohl wir sie hier und im Folgenden des öfteren verwenden. Das zu tun ist aber nur eine Abschreibübung für die Ergebnisse aus Proposition 3.2.15, Lemma 3.3.1 und Satz 3.3.4 indem wir immer dann, wenn von R als Bildmenge der Metrik die Rede ist, diese durch Q ersetzen. (ii) Unser Ziel soll sein, X/∼ zu einem vollständig angeordneten Körper zu machen. Dazu brauchen wir Operationen, die wir zunächst auf X definieren: (rn )n∈N + (sn )n∈N := (rn + sn )n∈N , −(rn )n∈N := (−rn )n∈N , (rn )n∈N · (sn )n∈N := (rn · sn )n∈N . Mit (rn )n∈N , (sn )n∈N sind auch (rn )n∈N + (sn )n∈N , −(rn )n∈N und (rn )n∈N · (sn )n∈N Cauchy-Folgen. Um das z.B. für die Multiplikation zu zeigen, sei C ∈ Q, C > 0, sodass |rn |, |sn | ≤ C, n ∈ N (siehe Proposition 3.4.5), und rechne |rn sn − rm sm | ≤ |rn sn − rn sm | + |rn sm − rm sm | ≤ C|sn − sm | + C|rn − rm |. Dieser Ausdruck ist kleiner als ǫ, wenn man N so groß wählt, dass ǫ |sn − sm |, |rn − rm | < 2C für m, n ≥ N. (iii) Da die Verknüpfungen + und · gliedweise definiert sind, folgt aus den Rechenregeln auf Q, dass für + und · das Kommutativgesetz, das Assoziativgesetz und das Distributivgesetz gelten. Klarerweise gilt auch (rn )n∈N + (0)n∈N = (rn )n∈N , − (rn )n∈N + (rn )n∈N = (0)n∈N , (rn )n∈N · (1)n∈N = (rn )n∈N . Wir können aber X nicht zu einem Körper machen, denn ist (rn )n∈N , (0)n∈N , so können wir noch lange nicht ein multiplikativ Inverses dazu finden. 95 (iv) Die Äquivalenzrelation ∼ lässt sich nun mit Hilfe obiger Verknüpfungen charakterisieren: (rn )n∈N ∼ (sn )n∈N ⇔ (rn )n∈N + (−(sn )n∈N ) ist Nullfolge, und (rn )n∈N ist Nullfolge ⇔ (rn )n∈N ∼ (0)n∈N . Daraus sieht man leicht, dass obige Verknüpfungen mit den Operationen verträglich sind: Sind (rn )n∈N ∼ (rn′ )n∈N und (sn )n∈N ∼ (s′n )n∈N , so folgt (rn )n∈N + (sn )n∈N ∼ (rn′ )n∈N + (s′n )n∈N , −(rn )n∈N ∼ −(rn′ )n∈N sowie (rn )n∈N · (sn )n∈N ∼ (rn′ )n∈N · (s′n )n∈N . Letztere Relation folgt etwa aus (rn )n∈N · (sn )n∈N + (−(rn′ )n∈N · (s′n )n∈N ) = rn (sn − s′n ) + s′n (rn − rn′ ) da mit (sn − sind. s′n )n∈N und (rn − rn′ )n∈N n∈N auch rn (sn − ∼ (0)n∈N , s′n ) + s′n (rn − rn′ ) n∈N Nullfolgen (v) Setzt man1 P = {(rn )n∈N ∈ X : ∃δ ∈ Q, δ > 0, rn > δ für fast alle n ∈ N}, so gilt folgende Aussage: Ist (rn )n∈N ∈ X so gehört diese Folge zu genau einer der folgenden Teilmengen: P, [(0)n∈N ]∼ , − P. Ist (rn )n∈N ∼ (rn′ )n∈N , so gehört (rn′ )n∈N zur selben Teilmenge. Beweis. Da nicht gleichzeitig rn > δ und −rn > δ für fast alle n ∈ N sein kann, folgt P∩−P = ∅. Ist (rn )n∈N ∼ (0)n∈N , so ist sie eine Nullfolge. Also unterschreitet |rn | jedes vorgegebene δ > 0, wenn n hinreichend groß ist, und (rn )n∈N kann damit weder in P noch in −P liegen. Seien (rn )n∈N , (rn′ )n∈N ∈ X äquivalent, aber beide nicht äquivalent zu (0)n∈N . Also sind beide keine Nullfolgen. Für (rn )n∈N bedeutet das: ∃δ > 0 : |rn | ≥ δ für alle n in einer unendlichen Teilmenge M von N. Sei N ∈ N, sodass |rn − rm |, |rn′ − rn | ≤ 4δ , m, n ≥ N. Ist nun m ∈ M, m, n ≥ N, so folgt δ |rn′ | ≥ |rm | − |rn′ − rn | − |rn − rm | ≥ . 2 Wegen |rn′ − rm | ≤ 2δ und |rm | ≥ δ haben rn′ und rm dasselbe Vorzeichen. Also gilt für fast alle n ∈ N, dass |rn′ | ≥ 2δ und dass sgn(rn′ ) = sgn(rm ) für unendlich viele m ∈ M. Da (rn )n∈N ∼ (rn )n∈N , erhält man mit dieser Argumentation genauso für fast alle n, m ∈ N, dass |rn | ≥ 2δ und sgn(rn ) = sgn(rm ). Also liegen (rn )n∈N und (rn′ )n∈N gemeinsam in P bzw. −P je nach dem Vorzeichen von rm . ❑ 1 Fast alle bedeutet hier ’alle bis auf endlich viele’. 96 KAPITEL 4. DIE KONSTRUKTION DER REELLEN ZAHLEN (vi) Man sieht auch ganz leicht, dass aus (rn )n∈N , (sn )n∈N ∈ P folgt, dass (rn )n∈N + (sn )n∈N , (rn )n∈N · (sn )n∈N ∈ P. (vii) Nun betrachten wir X/ ∼ und definieren: [(rn )n∈N ]∼ + [(sn )n∈N ]∼ := [(rn )n∈N + (sn )n∈N ]∼ , [(rn )n∈N ]∼ · [(sn )n∈N ]∼ := [(rn )n∈N · (sn )n∈N ]∼ , −[(rn )n∈N ]∼ = [−(rn )n∈N ]∼ , P/ ∼ = {[(rn )n∈N ]∼ : (rn )n∈N ∈ P}. Aus (iv) wissen wir, dass die Verknüpfungen damit wohldefiniert sind und aus (v), dass P/ ∼, [(0)n∈N]∼ , −P/ ∼ paarweise disjunkte Mengen sind, deren Vereinigung X/ ∼ ist. Nun übertragen sich das Kommutativgesetz, das Assoziativgesetz und das Distributivgesetz für + und ·. Die Restklasse [(0)n∈N ]∼ ist das additiv neutrale Element, und [(1)n∈N ]∼ ist das multiplikativ neutrale Element. Weiters ist −[(rn )n∈N ]∼ das additiv Inverse von [(rn )n∈N ]∼ . Was X/ ∼ noch fehlt ein Körper zu sein, ist die Existenz einer multiplikativ Inversen. Dazu sei [(rn )n∈N ]∼ , [(0)n∈N ]∼ . Nach (v) wissen wir, dass |rn | > δ für ein rationales δ > 0 und alle n ∈ N, n ≥ N. Also gilt für m, n ≥ N 1 − 1 ≤ |rn − rm | , rn rm δ und wir sehen, dass (qn )n∈N mit qn = r1n für n ≥ N, und qn = 0 für n < N, eine Cauchy-Folge ist, und dass [(rn )n∈N ]∼ · [(qn )n∈N ]∼ = [(1)n∈N ]∼ . Schließlich ist hX/ ∼, +, ·, P/ ∼i wegen (vi) sogar ein angeordneter Körper. Wir bemerken noch, dass wegen (v) für die Ordnung ≤ auf X/ ∼ gilt, dass [(rn )n∈N ]∼ < [(sn )n∈N ]∼ ⇔ rn ≤ sn + δ, n ≥ N für ein δ > 0 und ein N ∈ N. Insbesondere gilt rn ≤ sn , n ≥ N ⇒ [(rn )n∈N ]∼ ≤ [(sn )n∈N ]∼ . (viii) Da für zwei verschiedene rationale Zahlen r, s die konstante Folge (r − s)n∈N niemals eine Nullfolge ist und damit [(r)n∈N ]∼ und [(s)n∈N ]∼ zwei verschiedene Elemente in X/∼ sind, ist klar, dass man vermöge der Abbildung r 7→ [(r, r, . . . )]∼ die rationalen Zahlen als Teilmenge von X/∼ wiederfinden kann. Diese Identifizierung ist verknüpfungstreu, und auch die Ordnung ≤ bleibt erhalten. (ix) hX/ ∼, +, ·, P/ ∼i ist ein archimedisch angeordneter Körper: Wenn [(rn )n∈N ]∼ ∈ X/ ∼, dann ist (rn )n∈N eine Cauchy-Folge und daher beschränkt. Da Q archimedisch angeordnet ist, gibt es ein N ∈ N, sodass rn ≤ N, n ∈ N. Das bedingt aber [(rn )n∈N ]∼ ≤ [(N)]∼ . (x) Nun wollen wir zeigen, dass unser Körper vollständig angeordnet ist. Dazu sei A ⊆ X/ ∼ eine nach oben beschränkte, nicht leere Menge. Also gilt A < [(N)]∼ für ein N ∈ N. 97 Für j ∈ N sei 2− j Z die Menge aller rationalen Zahlen der Form qp mit p ∈ Z und q = 2 j . Man sieht leicht, dass 2− j Z ⊆ 2− j−1 Z und dass der Abstand von zwei verschiedenen Zahlen aus 2− j Z immer ein Vielfaches von 2− j ist. Nun sei D j := {r ∈ 2− j Z : ∀a ∈ A : [(r)n∈N ]∼ > a}. Wegen N ∈ D j sind diese Mengen nicht leer, und es gilt D j ⊆ D j+1 . Daraus folgt für x j := min D j , dass x j+1 ≤ x j . Es sei bemerkt, dass D j eine Minimum hat, da die Zähler p von r ∈ D j die Ungleichung p ≥ 2 j M erfüllen müssen, wobei M ∈ Z mit [(M)]∼ ≤ a0 für irgendein festes a0 ∈ A. Für die x j gilt nun x j − x j+1 ≤ 2− j−1 . Wäre diese Differenz nämlich größer, so wäre sie zumindest 22− j−1 , da die Abstände zwischen Elementen von D j+1 ja Vielfache von 2− j−1 sind. Das würde aber [(x j − 2− j )n∈N ]∼ ≥ [(x j+1 )n∈N ]∼ > A implizieren, was der Wahl von x j als kleinstes Element in 2− j Z mit [(x j )n∈N ]∼ > A widerspricht. Die Folge (xn )n∈N ist eine Cauchyfolge, denn ist ǫ > 0 und n0 ∈ N so, dass 2−n0 < ǫ, und sind n > l ≥ n0 , so folgt |xl − xn | = xl − xn = n X (xk−1 − xk ) ≤ k=l+1 n X 2−k < k=l+1 ∞ X 2−k = 2−l , (4.1) k=l+1 wobei dieser Ausdruck ist aber kleiner oder gleich 2−n0 und daher kleiner ǫ ist. Nun gilt [(xn )n∈N ]∼ = sup A. Um das zu einzusehen, wollen wir zunächst zeigen, dass [(xn )n∈N ]∼ eine obere Schranke von A ist. Angenommen wir hätten a > [(xn )n∈N ]∼ für ein a = [(an )n∈N ] ∈ A. Dann gäbe es ein δ > 0 und ein n1 ∈ N, sodass an ≥ xn + δ, n ≥ n1 . Nun wähle man ein natürliches l ≥ n1 so groß, dass 2−l ≤ δ. Für n > l folgt mit (4.1) xl = xn + (xl − xn ) < xn + 2−l ≤ an , und somit [(xl )n∈N ]∼ ≤ a, was aber xl ∈ Dl widerspricht. Ist b = [(bn )n∈N ] eine obere Schranke von A, d.h. A ≤ b, und wäre b < [(xn )n∈N ]∼ , so wäre bn ≤ xn − δ, für alle n größer gleich einem n2 ∈ N. Ist l ≥ n2 mit 2−l ≤ δ, so folgt aus der Monotonie der xn für n > l bn ≤ xn − 2−l ≤ xl+1 − 2−l , und daher bn + 2−l−1 ≤ xl+1 − 2−l−1 , n > l. Damit haben wir A ≤ b < [(xl+1 − 2−l−1 )n∈N ]∼ bzw. xl+1 − 2−l−1 ∈ Dl+1 . Das widerspricht aber der Minimalität von xl+1 . Also können wir uns nun sicher sein, dass es vollständig angeordnete Körper gibt. Es bleibt zu zeigen, dass diese bis auf Kopien eindeutig sind. 4.1.3 Satz. Ist hK, +, ·, Pi ein vollständig angeordneter Körper und hX/ ∼, +, ·, P/ ∼i der soeben konstruierte Körper, dann gibt es eine Bijektion φ̃ : X/ ∼ → K, die verknüpfungstreu und ordnungstreu ist. KAPITEL 4. DIE KONSTRUKTION DER REELLEN ZAHLEN 98 Beweis. Nach Proposition 2.5.7 gibt es eine verknüpfungs- und ordnungstreue injektive Abbildung φ : Q → K. Insbesondere sind die Bilder von Nullfolgen bzw. CauchyFolgen wieder Nullfolgen bzw. Cauchy-Folgen. Ist [(rn )n∈N ]∼ ∈ X/ ∼, so definieren wir φ̃([(rn )n∈N ]∼ ) := lim φ(rn ). n→∞ Man beachte, dass der Grenzwert existiert, da K ja ein vollständig angeordneter Körper ist (vgl. Satz 3.4.10), und dass der Grenzwert nicht von der Wahl des Repräsentanten (rn )n∈N der Restklasse [(rn )n∈N ]∼ abhängt: Ist nämlich (rn )n∈N ∼ (sn )n∈N , so folgt lim φ(rn ) = lim φ(sn ) + lim φ(rn − sn ) = lim φ(sn ). n→∞ n→∞ n→∞ n→∞ φ̃ ist injektiv, da [(rn )n∈N ]∼ = [(sn )n∈N ]∼ ⇔ lim (rn − sn ) = 0 ⇔ lim φ(rn ) = lim φ(sn ). n→∞ n→∞ n→∞ Die Surjektivität folgt aus der Tatsache, dass jede Zahl aus K durch eine Folge rationaler Zahlen approximiert werden kann (siehe Beispiel 3.2.6). Die Verträglichkeit mit + folgt aus (siehe Satz 3.3.4) φ̃([(rn )n∈N ]∼ + [(sn )n∈N ]∼ ) = lim φ(rn + sn ) = n→∞ lim φ(rn ) + lim φ(sn ) = φ̃([(rn )n∈N ]∼ ) + φ̃([(sn )n∈N ]∼ ), n→∞ n→∞ und die für · zeigt man genauso. Um die Verträglichkeit mit der Ordnung zu zeigen sei bemerkt, dass (siehe Lemma 3.3.1) φ̃([(rn )n∈N ]∼ ) ∈ P ⇔ limn→∞ φ(rn ) > 0 ⇔ ∃δ > 0, φ(rn ) > δ für alle n ≥ N. Das heißt aber genau [(rn )n∈N ]∼ ∈ P/ ∼. ❑ Somit haben wir die Existenz und die Eindeutigkeit eines vollständig angeordneten Körpers und damit auch Satz 2.7.3 bewiesen. 4.1.4 Bemerkung. Die in diesem Abschnitt angegebene Vorgangsweise aus Q die reellen Zahlen zu konstruieren lässt sich auch anwenden um zu zeigen, dass es zu jedem metrischen Raum hX, di einen vollständigen metrischen Raum hX̂, d̂i gibt, sodass hX, di isometrisch und dicht in hX̂, d̂i enthalten ist. In der Tat nimmt man auch hier die Menge X aller Cauchy-Folgen in hX, di, betrachtet genauso die Äquivalenzrelation ∼, die zwei Folgen identifiziert, falls deren Differenz eine Nullfolge ist, und beweist, dass X/ ∼ versehen mit einer geeigneten Metrik der gesuchte metrische Raum ist. Kapitel 5 Geometrie metrischer Räume 5.1 ǫ-Kugeln, offene und abgeschlossene Mengen Als erstes wollen wir uns dem anschaulich leicht verständlichen Begriff der Kugel in metrischen Räumen zuwenden. 5.1.1 Definition. Sei hX, di ein metrischer Raum und x ∈ X. Dann heißt die Menge Uǫ (x) := {y ∈ X : d(y, x) < ǫ} die offene ǫ-Kugel um den Punkt x, und die Menge Kǫ (x) := {y ∈ X : d(y, x) ≤ ǫ} die abgeschlossene ǫ-Kugel um den Punkt x. 5.1.2 Beispiel. (i) Man betrachte R versehen mit der euklidischen Metrik. Für x ∈ R ist dann Uǫ (x) = (x − ǫ, x + ǫ) und Kǫ (x) = [x − ǫ, x + ǫ]. (ii) Sei X eine Menge, und sei diese mit der diskreten Metrik aus Beispiel 3.1.5 versehen. Ist ǫ ≤ 1, so gilt dann in diesem Raum Uǫ (x) = {x}. Falls ǫ > 1, so gilt Uǫ (x) = X. (iii) Betrachte R2 , und versehe diese Menge einerseits mit der Metrik, d1 , der euklidischen Metrik d2 und mit d∞ (siehe Beispiel 3.1.5). Die ǫ-Kugeln Uǫ1 (0) bzgl. d1 sowie Uǫ (0) bzgl. d2 bzw. Uǫ∞ (0) bzgl. d∞ lassen sich folgendermaßen darstellen. Uǫ1 (0) Uǫ∞ (0) Uǫ (0) ǫ ǫ ǫ ǫ ǫ ǫ Abbildung 5.1: ǫ-Umgebungen von 0 5.1.3 Bemerkung. Die Konvergenz einer Folge (xn )n∈N in metrischen Räumen lässt sich durch obige Mengen folgendermaßen formulieren: x = lim xn ⇔ ∀ǫ > 0 ∃N ∈ N : {xn : n ≥ N} ⊆ Uǫ (x). n→∞ 99 KAPITEL 5. GEOMETRIE METRISCHER RÄUME 100 Da Uǫ (x) ⊆ Kǫ (x) ⊆ U2ǫ (x), können wir hier genauso Kǫ (x) anstatt Uǫ (x) schreiben. Diese Sichtweise des Grenzwertbegriffes gewinnt zum Beispiel dann an Bedeutung, wenn man den Konvergenzbegriff bezüglich verschiedener Metriken vergleichen will. Wir betrachten zum Beispiel die Metriken d und d∞ aus Beispiel 5.1.2, (iii). Wegen (3.8) gilt Uǫ (x) ⊆ Uǫ∞ (x) ⊆ U2ǫ (x). Nimmt man nun obiges Konvergenzkriterium her, so folgt unmittelbar aus dieser Relation, dass eine Folge genau dann bzgl. d konvergiert, wenn sie es bzgl. d∞ tut. Siehe Proposition 3.5.1. 5.1.4 Definition. Sei hX, di ein metrischer Raum. Eine Teilmenge O von X heißt offen, wenn es zu jedem Punkt x ∈ O eine ǫ-Kugel gibt mit Uǫ (x) ⊆ O. ǫ x ǫ ′′ x′′ ǫ ′ x′ O Abbildung 5.2: Offene Mengen 5.1.5 Beispiel. In (R, d) sind z.B. die Mengen (a, b) und R \ {0} offen. Denn ist etwa x ∈ (a, b), b−x so folgt für ǫ = min( x−a 2 , 2 ), dass U ǫ (x) = (x − ǫ, x + ǫ) ⊆ (a, b). Man sieht sofort, dass in jedem metrischen Raum hX, di die Mengen ∅ und X immer offen sind. Ist hX, di ein metrischer Raum, so ist jede Kugel Uǫ (x) für beliebige x ∈ X, ǫ > 0 offen. In der Tat gilt für y ∈ Uǫ (x) definitionsgemäß d(x, y) < ǫ. Wählt man δ = ǫ − d(x, y), so folgt für z ∈ Uδ (y) aus d(y, z) < δ, dass d(x, z) ≤ d(x, y) + d(y, z) < d(x, y) + ǫ − d(x, y) = ǫ, und somit z ∈ Uǫ (x). 5.1.6 Proposition. Sei hX, di ein metrischer Raum. Dann gilt Ist n ∈ N und sind O1 , . . . , On offene Teilmengen von X, so ist auch Tn i=1 Oi offen. Ist I eine beliebige Indexmenge, und sind Oi offene Teilmengen von X, so auch S i∈I Oi . 5.1. ǫ -KUGELN, OFFENE UND ABGESCHLOSSENE MENGEN 101 Beweis. Seien O1 , . . . , On offen und x ∈ O1 ∩ . . . ∩ On . Definitionsgemäß gibt es ǫ1 , . . . , ǫn > 0 mit Uǫi (x) ⊆ Oi , i = 1, . . . , n. Es folgt Umin{ǫ1 ,...,ǫn } (x) = Uǫ1 (x) ∩ . . . ∩ Uǫn (x) ⊆ O1 ∩ . . . ∩ On . Damit ist O1 ∩ . . . ∩ On offen. S Seien Oi , i ∈ I, offen, und x ∈ i∈I Oi . Dann existiert ein i ∈ I mit x ∈ Oi , und S daher ein ǫ > 0 mit Uǫ (x) ⊆ Oi . Insgesamt folgt Uǫ (x) ⊆ i∈I Oi . ❑ 5.1.7 Definition. Sei hX, di ein metrischer Raum, E ⊆ X und x ∈ X. Man nennt x einen Häufungspunkt von E, wenn jede ǫ-Kugel um x einen Punkt aus E \ {x} enthält, bzw. wenn ∀ǫ > 0 ∃y ∈ E, x , y : d(x, y) < ǫ. Wenn x ∈ E kein Häufungspunkt ist, so nennen wir ihn isolierten Punkt von E. Das ist also ein Punkt aus E, sodass ∃ǫ > 0, Uǫ (x) ∩ E = {x}. Wir sagen eine Menge A ⊆ X ist abgeschlossen, wenn jeder Häufungspunkt von A schon in A enthalten ist. 5.1.8 Bemerkung. In jeder ǫ-Kugel Uǫ (x) um einen Häufungspunkt x von E liegen sogar unendlich viele Punkte von E \{x}. Denn angenommen es wären nur endlich viele x1 , . . . , xn , so erhielten wir mit δ := min{ǫ, d(x, x1 ), . . . , d(x, xn )} > 0 den Widerspruch Uδ (x) ∩ E \ {x} = ∅. 5.1.9 Bemerkung. Sei E ⊆ X. Für ein x ∈ X tritt genau einer der folgenden Fälle ein: (i) x ist isolierter Punkt von E. (ii) x ∈ E und x ist Häufungspunkt von E. (iii) x < E und x ist Häufungspunkt von E. (iv) x < E und x ist nicht Häufungspunkt von E. 5.1.10 Definition. Die Menge aller x, die (i), (ii) oder (iii) erfüllen, wollen wir mit c(E) (Abschluss der Menge E) bezeichnen. 5.1.11 Bemerkung. Klarerweise ist E ⊆ c(E), und x ∈ c(E) ⇔ ∀ǫ > 0 ∃y ∈ E : d(x, y) < ǫ ⇔ ∀ǫ > 0 : E ∩ Uǫ (x) , ∅. Außerdem ist E abgeschlossen genau dann, wenn c(E) = E. Schließlich kann man einfach zeigen, dass c(c(E)) = c(E), also dass c(E) immer abgeschlossen ist. 5.1.12 Beispiel. Sei E = [0, 1) ∪ {2} als Teilmenge von R. Dann ist 1 ein Häufungspunkt von E, da jede ǫ-Kugel (1 − ǫ, 1 + ǫ) um 1 sicherlich Punkte aus E enthält. Da 1 nicht zu E gehört, ist E nicht abgeschlossen. Man weist auch leicht nach, dass [0, 1] genau die Menge aller Häufungspunkte von E ist, und dass 2 ein isolierter Punkt ist. Also ist c(E) = [0, 1] ∪ {2} KAPITEL 5. GEOMETRIE METRISCHER RÄUME 102 Ist hX, di ein beliebiger metrischer Raum, und E ⊆ X eine endliche Teilmenge, so hat E keine Häufungspunkte, besteht daher nur aus isolierten Punkten und ist daher immer abgeschlossen. Ist hX, di ein beliebiger metrischer Raum, so sind auch ∅ und X abgeschlossen, genauso wie jede abgeschlossene Kugel Kǫ (x). Ist nämlich y Häufungspunkt von Kǫ (x), so gibt es zu jedem n ∈ N ein yn ∈ Kǫ (x) mit d(yn , y) < n1 . Also d(x, y) ≤ d(x, yn ) + d(yn , y) < ǫ + 1n , und, da die rechte Seite gegen ǫ konvergiert, folgt d(x, y) ≤ ǫ (siehe Lemma 3.3.1). Somit ist y ∈ Kǫ (x). Die im vorigen Beispiel gewählte Vorgangsweise lässt sich zu folgendem Ergebnis ausbauen. 5.1.13 Lemma. Ein Punkt x ist ein Häufungspunkt einer Menge E genau dann, wenn es eine Folge (xn )n∈N von Punkten xn ∈ E \ {x} gibt mit xn → x. Ein Punkt x liegt genau dann in c(E), wenn es eine Folge (xn )n∈N von Punkten xn ∈ E gibt mit xn → x. Beweis. Ist x Häufungspunkt von E, so gibt es zu jedem n ∈ N ein xn ∈ E \ {x} mit d(x, xn ) < 1n , also xn → x. Ist x isolierter Punkt von E, so konvergiert die identische Folge x = xn , n ∈ N gegen x. Diese Folge ist klarerweise aus E. Sei nun umgekehrt x = limn→∞ xn für eine Folge aus E. Ist für ein n ∈ N, xn = x, so folgt trivialerweise x = xn ∈ E ⊆ c(E). Im Fall xn , x für alle n ∈ N ist die Folge (xn )n∈N sicher in E \ {x} enthalten, und zu jedem ǫ > 0 gibt es ein N ∈ N, sodass ∅ , {xn : n ≥ N} ⊆ Uǫ (x). Jedes Element der Menge auf der linken Seite ist in Uǫ (x) ∩ E \ {x} enthalten. x ist somit Häufungspunkt von E. ❑ 5.1.14 Beispiel. Ist F ⊆ R abgeschlossen und nach oben beschränkt, so sei x := sup F. Nach Beispiel 3.2.6 gibt es in F eine Folge, die gegen sup F konvergiert. Die Abgeschlossenheit von F impliziert sup F ∈ F, d.h. sup F = max F. Entsprechendes gilt für nach unten beschränkte Mengen und deren Infimum. 5.1.15 Bemerkung. In Definition 4.1.1 haben wir definiert, was es heißt, dass eine Teilmenge E ⊆ X dicht in X ist. Wegen Lemma 5.1.13 ist das äquivalent zu c(E) = X. 5.1.16 Proposition. Sei hX, di ein metrischer Raum und sei A ⊆ X. Dann sind äquivalent: (i) Ac (= X \ A) ist offen. (ii) A ist abgeschlossen. (iii) Ist (xn )n∈N eine Folge von Punkten aus A und ist (xn )n∈N konvergent, so liegt auch ihr Grenzwert in A. Beweis. (i) ⇒ (ii): Sei Ac offen, und sei x ein Häufungspunkt von A. Wäre x < A, so folgt aus Ac offen, dass Uǫ (x) ⊆ Ac für ein ǫ > 0, und daher Uǫ (x) ∩ A = ∅. Ein Widerspruch, denn jede Umgebung von x muss mit A nichtleeren Schnitt haben. Also muss x ∈ A. 5.1. ǫ -KUGELN, OFFENE UND ABGESCHLOSSENE MENGEN 103 (ii) ⇒ (i): Sei x ∈ Ac . Da A abgeschlossen ist, ist x kein Häufungspunkt von A. Also gibt es ein ǫ > 0 mit Uǫ (x)∩A = Uǫ (x)∩A\{x} = ∅. Das ist aber gleichbedeutend mit Uǫ (x) ⊆ Ac . Also ist Ac offen. (ii) ⇔ (iii): Folgt unmittelbar aus der Tatsache, dass A abgeschlossen ist genau dann, wenn c(A) = A, und aus Lemma 5.1.13. ❑ Diese einfache Charakterisierung von abgeschlossenen Mengen gibt uns unmittelbar das folgende Korollar von Proposition 5.1.6. 5.1.17 Korollar. Sei hX, di ein metrischer Raum. Dann gilt S Sind n ∈ N und A1 , . . . , An abgeschlossen, so auch ni=1 Ai . Ist I eine beliebige Indexmenge, und sind alle Mengen Ai , i ∈ I, abgeschlossen, T so folgt, dass auch i∈I Ai abgeschlossen ist. Beweis. Es gilt n [ i=1 Ai c = n [ \ \ (Ai )c . (Aci ), Ai c = i=1 i∈I i∈I ❑ 5.1.18 Beispiel. Korollar 5.1.17gestattet uns z.B. die Teilmenge T = {z ∈ C : |z| = 1} (Einheitskreislinie) als abgeschlossene Teilmenge von C zu identifizieren. In der Tat ist T = K1 (0) ∩ (U1 (0))c , und damit Durchschnitt von abgeschlossenen Mengen. Man betrachte M = {z ∈ C : Re z ≥ 0} als Teilmenge von C. Ist (zn )n∈N eine Folge aus M, die gegen z ∈ C konvergiert, so muss nach Proposition 3.5.1 die Folge (Re zn )n∈N in R gegen Re z konvergieren. Wegen Lemma 3.3.1 folgt aus Re zn ≥ 0, n ∈ N, dass auch Re z ≥ 0 und damit z ∈ M. Nach Proposition 5.1.16 ist M abgeschlossen. Die Teilmenge {z ∈ C : 0 ≤ Re z ≤ 1} von C lässt sich als Durchschnitt von {z ∈ C : Re z ≥ 0} und {z ∈ C : Re z ≤ 1} schreiben. Nach dem vorhergehenden Beispiel ist die erste Menge abgeschlossen. Entsprechendes gilt für die zweite Menge. Also ist {z ∈ C : 0 ≤ Re z ≤ 1} der Durchschnitt von abgeschlossenen Mengen und damit selber abgeschlossen. Das Quadrat {z ∈ C : Re z ∈ [0, 1], Im z ∈ [0, 1]} ist der Durchschnitt der abgeschlossenen Mengen {z ∈ C : 0 ≤ Re z ≤ 1} und {z ∈ C : 0 ≤ Im z ≤ 1}, und daher auch abgeschlossen. Da die Menge {z ∈ C : Re z ≥ 0} abgeschlossen ist, folgt, dass ihr Komplement M := {z ∈ C : Re z > 0} in C offen ist. Das kann man auch direkt nachweisen: Ist z ∈ M beliebig, so wähle ǫ = Re z > 0. Ist w ∈ Uǫ (z), so folgt wegen Re z − Re w ≤ | Re z − Re w| ≤ |z − w| und damit Re w > Re z − ǫ = 0, dass auch w ∈ M, und daher Uǫ (z) ⊆ M. KAPITEL 5. GEOMETRIE METRISCHER RÄUME 104 Das offene Quadrat M = {z ∈ C : Re z ∈ (0, 1), Im z ∈ (0, 1)} lässt sich als Durchschnitt von endlich vielen offenen Mengen schreiben: M = {z ∈ C : Re z > 0}∩{z ∈ C : Re z < 1}∩{z ∈ C : Im z > 0}∩{z ∈ C : Im z < 1}. Sie ist daher selber offen. 5.2 Kompaktheit Wir wollen nun auch Häufungspunkte für Folgen einführen. 5.2.1 Definition. Sei hX, di ein metrischer Raum. Dann heißt ein x ∈ X Häufungspunkt einer Folge (xn )n∈N , falls es eine gegen x konvergente Teilfolge von (xn )n∈N gibt. 5.2.2 Lemma. Sei (xn )n∈N eine Folge in einem metrischen Raum hX, di. (i) Konvergiert (xn )n∈N gegen x, so ist x der einzige Häufungspunkt (siehe Satz 3.2.9). (ii) Ist (xn( j) ) j∈N eine Teilfolge von (xn )n∈N , so ist die Menge aller Häufungspunkte von (xn( j) ) j∈N eine Teilmenge von der Menge aller Häufungspunkte von (xn )n∈N . (iii) x ist Häufungspunkt der Folge (xn )n∈N genau dann, wenn für jedes N ∈ N der Punkt x in c({xn : n ≥ N}) liegt. Beweis. (i) Das folgt unmittelbar aus Satz 3.2.9, da Teilfolgen konvergenter Folgen auch gegen den Grenzwert der Folge streben. (ii) Da jede Teilfolge von (xn( j) ) j∈N erst recht eine Teilfolge von (xn )n∈N ist, muss jeder Häufungspunkt von (xn( j) ) j∈N auch einer von (xn )n∈N sein. (iii) Sei zunächst x Häufungspunkt der Folge (xn )n∈N . Also x = lim j→∞ xn( j) . Wir halten N fest und wählen J ∈ N, sodass n(J) ≥ N. Dann ist (xn( j+J) ) j∈N eine Folge in {xn : n ≥ N}, die gegen x konvergiert. Nach Lemma 5.1.13 ist x ∈ c({xn : n ≥ N}). Ist umgekehrt x ∈ c({xn : n ≥ N}) für alle N ∈ N, so sei n(1) ∈ N so, dass d(x, xn(1) ) < 1. Angenommen wir haben n(1) < · · · < n(k) gewählt, so sei n(k + 1 1) ∈ N, n(k + 1) > n(k) so, dass d(x, xn(k+1) ) < k+1 . So ein n(k + 1) existiert, da x ∈ c({xn : n ≥ n(k) + 1}). Wir haben somit eine Teilfolge konstruiert, die gegen x konvergiert. x ist somit Häufungspunkt der Folge (xn )n∈N . ❑ Folgender Satz ist ein sehr oft verwendetes Mittel in der Analysis. 5.2.3 Satz (Bolzano1-Weierstraß2 ). Sei (xn )n∈N eine beschränkte Folge in R p (versehen mit der euklidischen Metrik). Dann hat (xn )n∈N einen Häufungspunkt. 1 Bernard 2 Karl Bolzano. 5.10.1781 Prag - 18.12.1848 Prag Theodor Wilhelm Weierstraß. 31.10.1815 Ostenfelde (Westfalen) - 19.12.1897 Berlin 5.2. KOMPAKTHEIT 105 Wir wollen uns diesem Satz zuerst im Falle p = 1 zuwenden. Betrachte also eine reelle Folge (xn )n∈N , die beschränkt ist, d.h. |xn | ≤ C, n ∈ N. Für N ∈ N sei yN := sup{xn : n ≥ N}. Da R vollständig angeordnet ist, existieren diese Zahlen yN , und wegen {xn : n ≥ N + 1} ⊆ {xn : n ≥ N} ist die Folge (yN )N∈N monoton fallend. Außerdem gilt immer −C ≤ yN ≤ C. Also können wir Satz 3.4.2 anwenden und sehen, dass limN→∞ yN existiert und mit inf{yN : N ∈ N} übereinstimmt. 5.2.4 Definition. Wir nennen diesen Grenzwert Limes Superior der Folge (xn )n∈N und schreiben dafür lim sup xn := inf sup xn = lim sup xn . n→∞ N∈N n≥N N∈N n≥N Entsprechend existiert der Limes Inferior lim inf xn := sup inf xn = lim inf xn . n→∞ N∈N n≥N N∈N n≥N Ist (xn )n∈N nicht beschränkt, so kann man lim supn→∞ xn und lim inf n→∞ xn genauso definieren, wobei diese dann Werte in R ∪ {−∞, +∞} annehmen. 5.2.5 Proposition. Sei (xn )n∈N eine beschränkte Folge reeller Zahlen. Dann ist lim supn→∞ xn ( lim inf n→∞ xn ) der größte (kleinste) Häufungspunkt von (xn )n∈N . Insbesondere hat jede beschränkte Folge reeller Zahlen mindestens einen Häufungspunkt. Beweis. Wir zeigen die Behauptung für den Limes Superior. Den Fall des Limes Inferior behandelt man analog. Um nachzuweisen, dass x = lim supn→∞ xn ein Häufungspunkt ist, bemühen wir Lemma 5.2.2 und zeigen x ∈ c({xn : n ≥ k}) für jedes k ∈ N. Ist ǫ > 0, so gibt es wegen der Konvergenz yN → x ein N0 ∈ N, sodass yN ∈ (x − ǫ, x + ǫ), N ≥ N0 . Wähle N ≥ max(N0 , k) beliebig. Da yN = sup{xn : n ≥ N} die kleinste obere Schranke ist, gibt es xn , n ≥ N, sodass x − ǫ < xn ≤ yN < x + ǫ. Also haben wir xn ∈ (x − ǫ, x + ǫ) ∩ {xn : n ≥ k} , ∅, und nach Bemerkung 5.1.9 ist x ∈ c({xn : n ≥ k}). Ist schließlich y ein beliebiger Häufungspunkt von (xn )n∈N , so gibt es eine Teilfolge (xn( j) ) j∈N , die gegen y konvergiert. Es folgt yn( j) = sup{xk : k ≥ n( j)} ≥ xn( j) für alle j ∈ N. Also y = lim j→∞ xn( j) ≤ lim j→∞ yn( j) = x. ❑ 5.2.6 Fakta. 1. Aus lim supn→∞ xn = limN∈N supn≥N xn zusammen mit Satz 2.6.3 und Lemma 3.3.1 zeigt man, dass lim supn→∞ xn < ξ genau dann, wenn es ein q < ξ gibt, sodass xn ≤ q für alle bis auf endlich viele n ∈ N. Entsprechendes gilt für lim inf n→∞ xn . 2. Ähnlich zeigt man, dass lim supn→∞ xn > ξ genau dann, wenn es ein q > ξ gibt, sodass xn ≥ q für unendlich viele n ∈ N. Entsprechendes gilt für lim inf n→∞ xn . KAPITEL 5. GEOMETRIE METRISCHER RÄUME 106 3. In der Tat ist lim supn→∞ xn jene eindeutige Zahl x, für die gilt: Für jedes ǫ > 0 gibt es nur für endlich viele n ∈ N, die der Ungleichung xn ≥ x+ǫ genügen, wogegen für unendlich viele n ∈ N die Ungleichung xn ≥ x − ǫ gilt. Auch hier gilt entsprechendes für lim inf n→∞ xn . 4. Satz 3.8.1 lässt sich nun mit Hilfe von Limes Superior und Limes Inferior folgendermaßen formulieren, wobei die Divergenzkriterien schwächer als die in Satz 3.8.1 sind: √ | Falls lim supk→∞ k |ak | < 1 bzw. lim supk→∞ |a|ak+1 < 1, so konvergiert die Reihe k| ∞ P ak absolut. k=1 √ Gilt lim supk→∞ k |ak | > 1 bzw. lim inf k→∞ |ak+1 | |ak | > 1, so divergieren diese Reihen. 5. Weiters folgt aus den Rechenregeln für Suprema und Infima, dass lim supn→∞ (−xn ) = − lim inf n→∞ xn . 5.2.7 Beispiel. Man betrachte die Folge xn = (−1)n(1 + 1n ), n ∈ N in R. Die Teilfolge 1 1 konvergiert für k → ∞ gegen 1, und die Teilfolge x2k−1 = −1 − 2k−1 x2k = 1 + 2k konvergiert für k → ∞ gegen −1. Also sind −1 und 1 Häufungspunkte unserer Folge. Angenommen x ∈ R wäre ein weiterer Häufungspunkt. Dann gäbe es eine Teilfolge (xn( j) ) j∈N , die gegen x konvergierte. Nun sei J1 = { j ∈ N : n( j) ist ungerade} und J2 = { j ∈ N : n( j) ist gerade}. ˙ 2 , und somit ist zumindest eine dieser Mengen unendlich. Klarerweise ist N = J1 ∪J Ist J1 unendlich, so gibt es eine streng monoton wachsende Bijektion j : N → J1 (vgl. Lemma 2.3.17). Also ist (xn( j(k)) )k∈N eine Teilfolge von (xn( j) ) j∈N und somit ebenfalls gegen x konvergent. Andererseits konvergiert aber xn( j(k)) = −1 − 1 n( j(k)) wegen n( j(k)) ≥ k gegen −1. Also muss x = −1. Ist J2 unendlich, so folgt analog x = 1. Jedenfalls haben wir gezeigt, dass −1, 1 die einzigen Häufungspunkte sind. Aus Proposition 5.2.5 folgt schließlich lim inf xn = −1, lim sup xn = 1. n→∞ n→∞ 5.2.8 Korollar. Sei (xn )n∈N eine beschränkte Folge reeller Zahlen. Dann sind folgende drei Punkte äquivalent. (i) (xn )n∈N ist konvergent. (ii) (xn )n∈N hat nur einen Häufungspunkt. (iii) lim inf n→∞ xn = lim supn→∞ xn . Gilt (i)-(iii), so stimmt Grenzwert, einziger Häufungspunkt, sowie Limes Inferior und Limes Superior überein. Beweis. 5.2. KOMPAKTHEIT 107 (ii) ⇔ (iii): Folgt unmittelbar aus Proposition 5.2.5. (i) ⇒ (ii): Falls x = limn→∞ xn , so ist x nach Lemma 5.2.2 der einzige Häufungspunkt unserer Folge. (iii) ⇒ (i): Die Voraussetzung x = lim inf n→∞ xn = lim supn→∞ xn bedeutet, dass x = limN→∞ yN = limN→∞ zN , wobei yN = sup{xn : n ≥ N} und zN = inf{xn : n ≥ N}. Also gibt es zu gegebenen ǫ > 0 einen Index N ∈ N, sodass y j , z j ∈ (x − ǫ, x + ǫ) für alle j ≥ N. Wegen zN ≤ xn ≤ yN , n ≥ N folgt mit j = N x − ǫ < zN ≤ xn ≤ yN < x + ǫ, für alle n ≥ N. Also limn→∞ xn = x. ❑ Wir kommen nun zum Beweis des Satzes von Bolzano-Weierstrass. Beweis. (von Satz 5.2.3) Für Folgen in R folgt der Satz aus Proposition 5.2.5. Sei (xn )n∈N eine beschränkte Folge in R p , wobei xn = (xn,1 , . . . , xn,p ). Wegen (3.8) gilt für k = 1, . . . , p |xn,k | ≤ d2 (xn , 0), und daher ist jede der Folgen (xn,k )n∈N beschränkt. Da wir den Satz im Fall p = 1 schon gezeigt haben, gibt es eine konvergente Teilfolge (xn( j1 ),1 ) j1 ∈N von (xn,1 )n∈N . Nun betrachte (xn( j1 ),2 ) j1 ∈N . Dies ist wieder eine beschränkte Folge und hat daher ihrerseits eine konvergente Teilfolge (xn( j1 ( j2 )),2 ) j2 ∈N . Man beachte, dass (xn( j1 ( j2 )),1 ) j2 ∈N als Teilfolge der konvergenten Folge (xn( j1 ),1 ) j1 ∈N auch konvergiert. Setzen wir diese Konstruktion fort, so erhalten wir eine Teilfolge (xn( j1 (...( j p )... )) ) j p ∈N von (xn )n∈N , sodass (xn( j1 (...( j p )... )),k ) j p ∈N für jedes k = 1, . . . , p konvergiert. Nach Proposition 3.5.1 konvergiert daher auch (xn( j1 (...( j p )... )) ) j p ∈N . ❑ Der Satz von Bolzano-Weierstrass legt folgende Begriffsbildung nahe. 5.2.9 Definition. Sei hX, di ein metrischer Raum, und sei K ⊆ X mit der Eigenschaft, dass jede Folge (xn )n∈N aus K einen Häufungspunkt in K hat. Dann heißt K kompakt. 5.2.10 Beispiel. Man betrachte R. Die Teilmenge N von R ist nicht kompakt, da die Folge (n)n∈N keine konvergente Teilfolge besitzt. Das Intervall (0, 1] ist auch nicht kompakt, da die Folge ( n1 )n∈N gegen 0 konvergiert und somit in (0, 1] keinen Häufungspunkt besitzt. Ist K ⊆ R p eine abgeschlossene und beschränkte Menge, so hat nach Satz 5.2.3 jede Folge einen Häufungspunkt, der nach Proposition 5.1.16 zu K gehört. Insbesondere sind alle abgeschlossenen Intervalle [a, b] in R und allgemeier alle abgeschlossenen Kugeln Kr (x) in R p kompakt. Wir sammeln einige elementare Eigenschaften von kompakten Teilmengen. KAPITEL 5. GEOMETRIE METRISCHER RÄUME 108 5.2.11 Proposition. Sei hX, di ein metrischer Raum. Dann gilt: (i) Ist K ⊆ X kompakt, dann ist K abgeschlossen. (ii) Ist K ⊆ X kompakt, und F ⊆ X abgeschlossen, sodass F ⊆ K, dann ist auch F kompakt. (iii) Kompakte Teilmengen sind beschränkt. Beweis. (i) Wir verwenden Proposition 5.1.16. Sei x = limn→∞ xn für eine Folge aus K. Nun gibt es definitionsgemäß eine gegen ein y ∈ K konvergente Teilfolge von (xn )n∈N . Andererseits konvergieren Teilfolgen von gegen x konvergenten Folgen ebenfalls gegen x. Nun sind aber Grenzwerte eindeutig. Also gilt x = y ∈ K. (ii) Sei F ⊆ K abgeschlossen. Ist (xn )n∈N eine Folge aus F, so ist sie trivialerweise auch eine Folge aus K. Also gilt x = lim j→∞ xn( j) für eine Teilfolge (xn( j) ) j∈N und ein x ∈ K. Nun ist aber F abgeschlossen, und somit folgt aus Proposition 5.1.16, dass x ∈ F. Also enthält jede Folge in F eine gegen einen Punkt in F konvergente Teilfolge. (iii) Sei y ∈ X. Wäre K nicht beschränkt, so wäre auch {d(y, x) : x ∈ K} ⊆ R nicht beschränkt. Also könnten wir zu jedem n ∈ N ein xn ∈ K finden, sodass d(y, xn ) ≥ n. Aus der Kompaktheit folgt die Existenz einer konvergenten Teilfolge xn( j) → x, j → ∞. Aus Lemma 3.2.12 folgt d(y, xn( j) ) → d(y, x). Das widerspricht aber d(y, xn( j) ) ≥ n( j), j ∈ N. ❑ 5.2.12 Korollar. Sei (xn )n∈N eine Folge in einer kompakten Teilmenge eines metrischen Raumes hX, di. Dann konvergiert (xn )n∈N genau dann, wenn (xn )n∈N nur einen Häufungspunkt hat. Beweis. Falls x = limn→∞ xn , so ist x nach Lemma 5.2.2 der einzige Häufungspunkt unserer Folge. Ist x der einzige Häufungspunkt unserer Folge, und wäre (xn )n∈N nicht gegen x konvergent, so gäbe es ein ǫ > 0, sodass ∀N ∈ N ∃n ≥ N, d(xn , x) ≥ ǫ. Daraus definieren wir induktiv eine Teilfolge (xn(k) )k∈N . Sei n(1) ∈ N so, dass d(xn(1) , x) ≥ ǫ. Ist n(k) ∈ N definiert, so sei n(k + 1) die kleinste Zahl in N, sodass n(k + 1) ≥ n(k) + 1 und d(xn(k+1) , x) ≥ ǫ. Nun hat diese Folge wegen der Kompaktheit mindestens einen Häufungspunkt y ∈ K. Da (xn(k) )k∈N eine Teilfolge von (xn )n∈N ist, muss y auch Häufungspunkt von (xn )n∈N und damit gleich x sein. Da y Häufungspunkt ist, gibt es eine Teilfolge (xn(k( j)) ) j∈N von (xn(k) )k∈N , die gegen y konvergiert. Wegen d(x, y) = limn→∞ d(x, xn(k( j)) ) ≥ ǫ folgt aber y , x. Also muss xn → x, n → ∞. ❑ Aus Proposition 5.2.11 und Beispiel 5.2.10 erhalten wir folgendes 5.2.13 Korollar. Eine Teilmenge K von R p ist genau dann kompakt, wenn sie abgeschlossen und beschränkt ist. 5.2.14 Bemerkung. Diese Charakterisierung von Kompaktheit gilt nicht in allen metrischen Räumen. 5.3. FOLGEN UND NETZE 109 5.3 Folgen und Netze Bei der Motivation des Grenzwertbegriffes für Folgen haben wir gesagt eine Folge (xi )i∈N solle konvergent gegen x heißen, wenn für alle hinreichend großen Indizes das Folgenglied xi beliebig nahe an x herankommt. Für den weiteren Aufbau der Analysis verwenden wir ähnliche Grenzwertbegriffe z.B. für Funktionen f : (a, b) → R. Dabei soll f (t) konvergent für t → b gegen x heißen, wenn f (t) beliebig nahe an x herankommt, sobald t nur hinreichend nahe an b zu liegen kommt. Um nicht jedesmal eine neue Konvergenztheorie aufbauen zu müssen, wollen wir einen abstrakten Grenzwertbegriff einführen, von dem alle von uns benötigten Grenzwertbegriffe Spezialfälle sind. Was bei den Folgen die natürlichen Zahlen waren, ist bei unserem allgemeinen Konzept nun die gerichtete Menge 5.3.1 Definition. Sei I eine nicht leere Menge, und sei eine Relation auf I. Dann heißt (I, ) eine gerichtete Menge, wenn folgender drei Bedingungen genügt. Reflexivität: ∀i ∈ I : i i Transitivität: ∀i, j, k ∈ I : i j ∧ j k ⇒ i k Richtungseigenschaft: ∀i, j ∈ I ∃k ∈ I : i k ∧ j k. (5.1) 5.3.2 Beispiel. (i) Neben (N, ≤) ist jede Totalordnung eine gerichtete Menge. Also etwa ((0, +∞), ≤), ((a, b), ≥), ((a, b), ≤), wobei a, b ∈ R, a < b. Die Eigenschaft (5.1) wird bei einer Totalordnung zum Beispiel vom Maximum zweier Elemente erfüllt. (ii) Sei a, b, c ∈ R, a < b < c. Setze I := [a, b) ∪ (b, c] und definiere eine Relation auf I durch x y : ⇐⇒ |y − b| ≤ |x − b| . Dann ist reflexiv, transitiv, und je zwei Punkte sind vergleichbar. Also ist hI, i eine gerichtete Menge. Man beachte, dass nicht antisymmetrisch und somit keine Halbordnung ist. (iii) Die gerichtete Menge aus dem letzten Beispiel ist ein Spezialfall des folgenden Konzeptes. Sei hX, dX i ein metrischer Raum, D ⊆ X und z ein Häufungspunkt von D. Auf D \ {z} definieren wir : x y : ⇐⇒ dX (y, z) ≤ dX (x, z) Mit dieser Relation wird D\{z} zu einer gerichteten Menge, wobei - salopp gesagt - ein Punkt bezüglich der Relation weiter oben als ein anderer ist, wenn er näher an z liegt. KAPITEL 5. GEOMETRIE METRISCHER RÄUME 110 (iv) Wir nennen eine endliche Teilmenge Z eines Intervalls [a, b] eine Zerlegung dieses Intervalls, wenn a, b ∈ Z. Die Menge aller solchen Zerlegungen wird mit Z bezeichnet. Versieht man Z mit der Relation ⊆, so erhalten wir eine gerichtete Menge. n(R) (v) Wir nennen das Paar R = ((ξ j )n(R) j=0 ; (η j ) j=1 ) eine Riemann-Zerlegung eines Intervalls [a, b], falls a = ξ0 < ξ1 < · · · < ξn(R) = b; η j ∈ [ξ j−1 , ξ j ], j = 1, . . . , n(R), und nennen |R| := max{(ξ j − ξ j−1 ) : j = 1, . . . , n(R)} die Feinheit der Zerlegung. Weiters sei R1 R2 :⇔ |R2 | ≤ |R1 |. Ist R die Menge aller solcher Zerlegungen, dann ist (R, ) eine gerichtete Menge. In diesem Beispiel ist sicher nicht antisymmetrisch. Dieser gerichteten Menge und der aus dem letzten Beispiel werden wir bei der Einführung das Integrals wieder begegnen. (vi) Sei I = N × N und (n1 , m1 ) (n2 , m2 ) :⇔ n1 ≤ n2 ∧ m1 ≤ m2 . Dann ist (I, ) eine gerichtete Menge. Diese gerichtete Menge dient für Konvergenzbetrachtungen bei Doppelfolgen. (vii) Sind allgemeiner I und J gerichtete Mengen versehen mit Relationen I bzw. J , dann ist (I × J, ) ebenfalls eine gerichtete Menge, wenn wir (i1 , j1 ) (i2 , j2 ) :⇔ i1 I i2 ∧ j1 J j2 definieren. 5.3.3 Definition. In Analogie zu den Folgen nennen wir eine Abbildung x : I → X ein Netz bzw. eine Moore-Smith-Folge in der Menge X über der gerichteten Menge (I, ), und schreiben diese als (xi )i∈I . Entsprechend Definition 3.2.2 sagen wir, dass ein Netz (xi )i∈I in einen metrischen Raum hX, di gegen einen Punkt x ∈ X konvergiert, falls ∀ǫ > 0 ∃i0 ∈ I : d(xi , x) < ǫ, i i0 . (5.2) In diesem Falle schreiben wir x = lim xi . i∈I 5.3.4 Beispiel. (i) Wie bei den Folgen sieht man, dass konstante Netze xi = x, i ∈ I, immer gegen x konvergieren. (ii) Als konkreteres Beispiel betrachte man die gerichtete Menge ([−1, 0) ∪ (0, 1], ), wobei x y ⇔ |y| ≤ |x|, und f (t) = t2 . Dann konvergiert das Netz ( f (t))t∈[−1,0)∪(0,1] gegen Null: p Zu gegebenen ǫ > 0 sei t0 := 2ǫ . Ist t t0 , so folgt |0 − f (t)| = |t2 | ≤ |t02 | = pǫ 2 2 < ǫ. (iii) Sei M eine Menge und E die Menge aller endlichen Teilmengen von M. Setzt man A B :⇔ A ⊆ B, so ist (E, ) eine gerichtete Menge: Die Reflexivität und Transitivität sind klar, da die Mengeninklusion diese Eigenschaften hat. Sind A, B ∈ E, so folgt A ∪ B ∈ E und A, B ⊆ A ∪ B. Also ist (5.1) erfüllt. Im Falle M = N sind wir dieser gerichteten Menge schon begegnet. Ist nämlich P∞ P A∈E ein n=1 an eine absolut konvergente Reihe mit der Summe s, so ist ( n∈A an )P Netz, und in Lemma 3.9.2, (iv), haben wir nichts anderes als s = lim n∈A an A∈E hergeleitet. 5.3. FOLGEN UND NETZE 111 Nun gelten viele der für Folgen hergeleiteten Ergebnisse auch für Netze. Die Beweise sind im Wesentlichen die selben, wie für Folgen. Der Grenzwert ist eindeutig: Ist (xi )i∈I ein Netz, und sei angenommen, dass xi → x und xi → y mit x , y. > 0. Dann gibt es wegen xi → x einen Index i1 , sodass für alle Setze ǫ := d(x,y) 3 i ∈ I mit i1 i gilt d(xi , x) < ǫ. Wegen xi → y gibt es auch i2 ∈ I, sodass für alle i ∈ I mit i2 i gilt d(xi , y) < ǫ. Ist nun i ∈ I so, dass wir beide Abschätzungen zur Verfügung haben, also so, dass i1 i und i2 i, dann erhalten wir den Widerspruch d(x, y) . d(x, y) ≤ d(x, xi ) + d(xi , y) < 2 3 Die Tatsache, dass es bei Folgen auf endlich viele Glieder nicht ankommt hat auch eine Verallgemeinerung für Netze. Ist nämlich k ∈ I, so ist auch (Ik , ) mit Ik = {i ∈ I : k i} eine gerichtete Menge und lim xi = lim xi , i∈I i∈Ik (5.3) wobei der rechte Grenzwert genau dann existiert, wenn der linke existiert. Im Allgemeinen sind konvergente Netze nicht beschränkt. Aber da ein gegen ein x konvergentes Netz {xi : i i0 } ⊆ Uǫ (x) für ein i0 ∈ I erfüllt, ist zumindest das Netz (xi )i∈Ii0 beschränkt. Eine separate Betrachtung verdient das Analogon von Teilfolgen. 5.3.5 Definition. Sind (I, I ) und (J, J ) zwei gerichtete Mengen, ist X eine Menge und (xi )i∈I ein Netz in X, so heißt (xi( j) ) j∈J eine Teilnetz von (xi )i∈I , wenn i : J → I derart ist, dass ∀i ∈ I ∃k ∈ J : ∀ j J k ⇒ i( j) I i. Ist (J, J ) = (N, ≤), so heißt (xi( j) ) j∈J = (xi(n) )n∈N eine Teilfolge 3 . 5.3.6 Bemerkung. Ist x = limi∈I xi , und ǫ > 0, so gibt es ein i0 ∈ I, sodass d(x, xi ) < ǫ wenn i I i0 . Ist nun j0 ∈ J, sodass i( j) I i0 für alle j J j0 , so folgt d(x, xi( j) ) < ǫ wenn j J j0 . Also gilt x = lim xi ⇒ x = lim xi( j) . (5.4) i∈I j∈J Wie wir im nächsten Kapitel sehen werden, ist es oft wünschenswert die Konvergenz von Netzen auf die von Folgen zurück zu führen. Das geht nicht immer, aber in vielen Fällen. 5.3.7 Definition. Wir sagen, dass eine gerichtete Menge (I, ) Teilfolgen gestattet, wenn es eine abzählbare Teilmenge J von I gibt, sodass ∀i ∈ I∃ j ∈ J : i j. Wie wir im folgenden Lemma 5.3.8 sehen werden, bedeutet diese Eigenschaft, dass man hinreichend viele Teilfolgen konstruieren kann, damit man von der Konvergenz von Teilfolgen auf die Konvergenz eines gegebenen Netzes schließen kann. 5.3.8 Lemma. Sei (Y, dY ) ein metrischer Raum und (I, ) eine gerichtete Menge, die Teilfolgen gestattet. Ist (yi )i∈I ein Netz in Y, so gilt y = limi∈I yi genau dann, wenn limn→∞ yi(n) = y für jede Teilfolge von (yi )i∈I . 3 Im Gegensatz zu Teilfolgen von Folgen verlangen wir hier nicht, dass i : N → I monoton ist. KAPITEL 5. GEOMETRIE METRISCHER RÄUME 112 Beweis. Ist y = limi∈I yi , und ist (yi(n) )n∈N eine Teilfolge, so folgt limn→∞ yi(n) = y wegen (5.4). Konvergiert (yi )i∈I nicht gegen y, so gibt es ein ǫ > 0, sodass ∀i ∈ I ∃k ∈ I, k i : d(yk , y) ≥ ǫ. (5.5) Daraus konstruieren wir eine Teilfolge, die nicht gegen y konvergiert. Dazu sei j : N → J bijektiv, wobei J wie in Definition 5.3.7 ist. Sei i1 ∈ I, i1 j(1) mit d(yi1 , y) ≥ ǫ (siehe (5.5)). Sind i1 · · · im ∈ I definiert, so sei i ∈ I, i im , i j(m + 1). Gemäß (5.5) gibt es ein im+1 i, sodass d(yim+1 , y) ≥ ǫ. Wegen im j(m), m ∈ N, gibt es zu jedem i ∈ I ein m0 ∈ N, sodass j(m0 ) i, und daher im im0 j(m0 ) für alle m ≥ m0 . Also ist (yin )n∈N eine Teilfolge, sodass d(yin , y) ≥ ǫ, und die daher nicht gegen y konvergiert. ❑ Nun zählen wir Sätze, Rechenregeln, etc. auf, die wir für Folgen hergeleitet haben, und die sich auf Netze mit praktischen den selben Beweisen übertragen lassen: Sind (xi )i∈I und (yi )i∈I konvergente Netze, oder nur eine Konstante, in R, und gilt xi ≤ yi für alle i, die k für ein k ∈ I sind, so folgt lim xi ≤ lim yi . i∈I (5.6) i∈I Ist umgekehrt limi∈I xi < limi∈I yi , so gilt xi < yi für alle i k mit einem gewissen k ∈ I. Man betrachte zwei konvergente Netze (zi )i∈I , (wi )i∈I über derselben gerichteten Menge (I, ) in R oder in C. Dann folgt lim(zi + wi ) = (lim zi ) + (lim wi ), lim −zi = − lim zi .. i∈I i∈I i∈I i∈I i∈I (5.7) Dasselbe gilt für die Multiplikation. Um das zu zeigen muss man eine Spur anders vorgehen, als im Beweis von Satz 3.3.4, da Netze i.A. nicht beschränkt sind: Sei ǫ > 0 oBdA. so, dass ǫ ≤ 1. Seien i1 , i2 so groß, dass i i1 ⇒ |zi − z| < ǫ und i i2 ⇒ |wi − w| < ǫ. Insbesondere gilt für solche i auch |wi | ≤ |w| + ǫ ≤ |w| + 1. Gemäß Definition 5.3.1 gibt es ein i0 i1 , i2 . Für i i0 folgt |zi wi − zw| = |(zi − z)wi + z(wi − w)| ≤ |zi − z| · |wi | + |z| · |wi − w| < ǫ|wi | + |z|ǫ ≤ (|w| + 1 + |z|)ǫ. In Analogie zu (3.6) folgt daraus zi wi → zw, i ∈ I. Ist (zi )i∈I ein Netz in R oder C, sodass zi , 0, i ∈ I, und limi∈I zi = z , 0. Dann folgt limi∈I z1i = 1z . Ist (xi )i∈I ein monoton wachsendes Netz in R: i j ⇒ xi ≤ x j und ist {xi : i ∈ I} beschränkt, so folgt lim xi = sup{xi : i ∈ I}. (5.8) i∈I Entsprechendes gilt für monoton fallende Netze. 5.3. FOLGEN UND NETZE 113 Seien (xi )i∈I , (yi )i∈I und (ai )i∈I Netze in R über derselben gerichteten Menge, sodass xi ≤ ai ≤ yi für alle i i0 mit einem gewissen i0 ∈ I. Gilt lim xi = lim yi , i∈I i∈I so existiert auch der Grenzwert limi∈I ai und stimmt mit dem gemeinsamen Grenzwert von (xi )i∈I und (yi )i∈I überein. Man betrachte zwei Netze (xi )i∈I , (yi )i∈I über derselben gerichteten Menge (I, ) in einem metrischen Raum hX, di, die gegen x bzw. y konvergieren. Dann gilt lim d(xi , yi ) = d(x, y). i∈I (5.9) Sei (xi )i∈I ein Netz von Punkten xi = (xi,1 , . . . , xi,p ) ∈ R p , und y = (y1 , . . . , y p ) ∈ R p . Dann gilt limi∈I xi = y bezüglich einer der Metriken d1 , d2 oder d∞ genau dann, wenn lim xi,k = yk für alle k = 1, . . . , p . (5.10) i∈I Sei hX, dX i ein metrischer Raum, D ⊆ X, z ein Häufungspunkt von D und auf D \ {z} definiert als x y : ⇐⇒ dX (x, z) ≥ dX (y, z) wie in Beispiel 5.3.2, (iii). 5.3.9 Lemma. Die gerichtete Menge (D \ {z}, ) gestattet Teilfolgen. Ist hY, dY i ein weiterer metrischer Raum und f : D → Y eine Abbildung, so gilt limt∈D\{z} f (t) = y genau dann, wenn ∀ǫ > 0 ∃δ > 0 : dY ( f (t), y) < ǫ, ∀t ∈ D \ {z}, dX (t, z) < δ. (5.11) Außerdem gilt limt∈D\{z} f (t) = y genau dann, wenn limn→∞ f (tn ) = y für alle gegen z konvergente Folgen (tn )n∈N aus D \ {z}. Beweis. Laut Definition der Konvergenz eines Netzes gilt limt∈D\{z} f (t) = y genau dann, wenn ∀ǫ > 0 ∃t0 ∈ D \ {z} : dY ( f (t), y) < ǫ, ∀t ∈ D \ {z}, dX (t, z) ≤ dX (t0 , z). (5.12) Um daraus (5.11) abzuleiten, setzen wir bei gegebenen ǫ > 0, δ = dX (t0 , z), wobei t0 wie in (5.12) ist. Nun folgt für t ∈ D \ {z}, dX (t, z) < δ = dX (t0 , z) wegen (5.12), dass dY ( f (t), y) < ǫ. Für die Umkehrung sei ǫ > 0 und δ > 0 wie in (5.11). Da z ein Häufungspunkt von D ist, gibt es ein t0 ∈ D \ {z} ∩ Uδ (z). Ist nun t ∈ D \ {z}, dX (t, z) ≤ dX (t0 , z) < δ, so folgt dY ( f (t), y) < ǫ. Ist (tn )n∈N irgendeine Folge aus D \ {z} mit tn → z für n → ∞ - nach Lemma 5.1.13 gibt es eine solche - so ist J = {tn : n ∈ N} eine abzählbare Teilmenge von D \ {z} mit der Eigenschaft, dass bei gegebenen t ∈ D \ {z} sicherlich tn t, d.h. dX (tn , z) ≤ dX (t, z) (> 0), wenn n nur hinreichend groß ist. Also gestattet (D \ {z}, ) Teilfolgen (vgl. Definition 5.3.7). Die letzte Aussage folgt aus Lemma 5.3.8 wenn wir zeigen können, dass ( f (tn ))n∈N genau dann eine Teilfolge von ( f (t))t∈D\{z} ist, wenn tn → z. Zunächst sei ( f (tn ))n∈N eine Teilfolge im Sinne von Definition 5.3.5. Zu gegebenen δ > 0 gibt es ein t0 ∈ D \ {z} mit dX (t, z) < δ, weil z Häufungspunkt von D ist. Gemäß Definition 5.3.5 gibt es ein n0 ∈ N, sodass tn t, wenn nur n ≥ n0 . Also folgt dX (tn , z) ≤ dX (t, z) = δ, n ≥ n0 , und weil δ > 0 beliebig war, tn → z, n → ∞. KAPITEL 5. GEOMETRIE METRISCHER RÄUME 114 Ist umgekehrt tn → z, n → ∞, und ist t ∈ D \ {z}, so gibt wegen tn → z ein n0 ∈ N, sodass dX (tn , z) ≤ dX (t, z) (> 0) für alle n ≥ n0 . Das bedeutet aber tn t für n ≥ n0 . Somit ist ( f (tn ))n∈N eine Teilfolge im Sinne von Definition 5.3.5. ❑ 5.3.10 Definition. Konvergiert obiges Netz, so schreiben wir für den Grenzwert auch lim f (t) := lim f (t), t→z (5.13) t∈D\{z} und nennen ihn Grenzwert der Funktion f für t → z. 5.3.11 Beispiel. Als Beispiel wollen wir lim t→0 1− √ 1 − t2 t2 √ 2 berechnen, wobei das als der Limes limt∈(−1,1)\{0} 1− t21−t mit der gerichteten Menge ((−1, 1) \ {0}, ) wie im vorigen √ verstehen ist. √ Beispiel zu Aus 1 − (1 − t2 ) = (1 − 1 − t2 )(1 + 1 − t2 ) folgt wegen der für Netze gültigen Rechenregeln √ 1 − 1 − t2 1 − (1 − t2 ) = lim = lim √ 2 t→0 t→0 t2 (1 + t 1 − t2 ) = lim t→0 1 1 = . √ √ 2 1+ 1−t 1 + limt→0 1 − t2 p Nun ist aber wegen der für Folgen gültigen Rechenregeln limn→∞ √ 1 − tn2 = 1 für jede gegen 0 konvergente Folge (tn )n∈N . Aus Lemma 5.3.9 folgt limt→0 1 − t2 = 1, und der zu berechnende Grenzwert ist 12 . 5.3.12 Bemerkung. Ist t0 ∈ D \ {z}, so wissen wir aus (5.3), dass ( f (t))t∈D\{z} genau dann konvergiert, wenn das Netz ( f (t))t∈D\{z}, tt0 = ( f (t))t∈D∩Kδ (z)\{z} mit δ = dX (z, t0 ) konvergiert. Das bedeutet, dass der Grenzwert (5.13) eigentlich nur von f auf einer beliebig kleinen δ-Kugel um z abhängt. √ 2 5.3.13 Beispiel. Auf Beispiel 5.3.11 angewandt bedeutet das, dass auch 1− t21−t gegen 1 2 für t → 0 konvergiert, wenn man nicht t ∈ (−1, 1) \ {0} sondern zum Beispiel t ∈ (− 81 , 81 ) \ {0} laufen lässt. 5.3.14 Fakta. 1. Die Schreibweise limt→0 f (t) = x aus Definition 5.3.10 besagt, dass der Funktionswert f (t) beliebig nahe an x herankommt, wenn das Argument t nur hinreichend nahe an 0 ist. Oft ist man in der Situation, dass diese Annäherung nur von einer Seite stattfindet. √ Man betrachte etwa die Funktion t 7→ t für t → 0. Für negative Werte von t macht dieser Ausdruck gar keinen Sinn (zumindest wenn wir reelle Wurzeln suchen). Hat man also a, b ∈ R, a < b, und eine Funktion f (t), t ∈ [a, b), so setzt man D := [a, b) und definiert s t :⇔ |s − b| ≥ |t − b|. Wegen der Gestalt unserer Menge D gilt x y ⇐⇒ x ≤ y. Dann ist limt∈D f (t) = x äquivalent zu ∀ǫ > 0 ∃δ > 0 : dY ( f (t), x) < ǫ, ∀t ∈ [a, b), b − t < δ . 5.3. FOLGEN UND NETZE 115 Man schreibt dafür auch limt→b− f (t) = x und spricht von dem linksseitigen Grenzwert. Die gerichtete Menge ([a, b), ) gestattet ebenfalls Teilfolgen, wobei ( f (tn ))n∈N genau dann eine Teilfolge von ( f (t))t∈[a,b) ist, wenn (tn )n∈N eine gegen b konvergente Folge aus [a, b) ist. Also gilt limt→b− f (t) = x genau dann, wenn limn→∞ f (tn ) = x für alle gegen b konvergente Folgen (tn )n∈N aus [a, b). 2. Analog definiert man den rechtsseitigen Grenzwert limt→a+ f (t) = x, wenn f eine Funktion auf D := (a, b] ist. Dann ist limt∈D f (t) = x äquivalent zu ∀ǫ > 0 ∃δ > 0 : dY ( f (t), x) < ǫ, ∀t ∈ (a, b], t − a < δ . Diese Konvergenz lässt sich auch dadurch charakterisieren, dass limn→∞ f (tn ) = x für alle gegen a konvergente Folgen (tn )n∈N aus (a, b]. 3. Sind a, b, c ∈ R, a < b < c, und ist f : [a, b) ∪ (b, c] → Y eine Funktion. Nun gilt y = lim f (t) ⇔ y = lim f (t) und y = lim f (t). (5.14) t→b t→b− t→b+ Um das einzusehen sei zunächst y = limt→b f (t). Also konvergiert das Netz ( f (t))t∈[a,b)∪(b,c] gegen y. Da alle drei Mengen [a, b) ∪ (b, c], [a, b) und (b, c] so gerichtet sind, dass t1 t2 ⇔ d2 (t1 , b) ≥ d2 (t2 , b), sind ( f (t))t∈[a,b) und ( f (t))t∈(b,c] Teilnetze von ( f (t))t∈[a,b)∪(b,c] , und konvergieren daher ebenfalls gegen y (vgl. Bemerkung 5.3.6). Sei nun umgekehrt limt→b− f (t) = y = limt→b+ f (t) und ǫ > 0. Es gibt somit ein s1 ∈ [a, b) und ein t1 ∈ (b, c], sodass s ∈ [a, b), d2 (s, b) ≤ d2 (s1 , b) ⇒ dY ( f (s), y) < ǫ und t ∈ (b, c], d2 (t, b) ≤ d2 (t1 , b) ⇒ dY ( f (t), y) < ǫ. Setze τ1 = s1 , wenn d2 (s1 , b) ≤ d2 (t1 , b), und τ1 = t1 , wenn d2 (t1 , b) < d2 (s1 , b). Ist τ ∈ [a, b) ∪(b, c] mit d2 (τ, b) ≤ d2 (τ1 , b) = min(d2 (s1 , b), d2(t1 , b)), so folgt im Falle τ ∈ [a, b) wegen d2 (τ, b) ≤ d2 (s1 , b), dass dY ( f (τ), y) < ǫ. Genauso folgt im Falle τ ∈ (b, c] wegen d2 (τ, b) ≤ d2 (t1 , b), dass dY ( f (τ), y) < ǫ. Also konvergiert ( f (t))t∈[a,b)∪(b,c] gegen y 4. Ist f z.B. eine auf (a, +∞) definierte Funktion, und versieht man (a, +∞) mit der Relation ≤, so erhält man ebenfalls eine gerichtete Menge. Für den möglichen Grenzwert x := limt∈(a,+∞) f (t) schreibt man auch limt→+∞ f (t). Die hier zugrunde liegende gerichtete Menge gestattet auch Teilfolgen, wobei ( f (tn ))n∈N genau dann eine solche ist, wenn tn → +∞ für n → ∞. Entsprechend gibt es Grenzwerte für t → −∞. 5.3.15 Beispiel. Sei f : (1, +∞) → R, z.B. f (t) = t−3 . Um limt→+∞ f (t) auszurechnen ist es oft zielführend, das Netz ( f (t))t∈(1,+∞) als Teilnetz (g( 1t ))t∈(1,+∞) des Netzes (g(s)) s∈(0,1) zu betrachten, wobei g(s) = f ( 1s ). Die Menge (0, 1) ist dabei so gerichtet, dass s1 s2 :⇔ s1 ≥ s2 . Dass (g( 1t ))t∈(1,+∞) ein Teilnetze von (g(s)) s∈(0,1) ist, gilt, da zu vorgegebenen s ∈ (0, 1) es ein t0 ∈ (1, +∞) gibt - z.B. t0 = 1s - sodass t ≥ t0 ⇒ 1t ≤ s (vgl. Definition 5.3.5). Man sieht damit, dass etwa lim t−3 = lim s3 = 0. t→+∞ s→0+ Statt der Funktion t 7→ 1t kann man Entsprechendes mit anderen bijektiven und monotonen Funktionen von einem Intervall auf ein anderes machen. KAPITEL 5. GEOMETRIE METRISCHER RÄUME 116 5.3.16 Beispiel. Man betrachte die Menge I = C\{0} gerichtet durch z w ⇔ |z| ≤ |w|. Für limz∈I f (z) = a schreibt man dann auch lim|z|→∞ f (z) = a. Zum Beispiel sieht man leicht ein, dass lim|z|→∞ 1z = 0 und mit den Rechenregeln (a0 , . . . , an ∈ C) lim an + an−1 z−1 + . . . + a0 z−n = an . |z|→∞ 5.3.17 Bemerkung. Genauso wie für Folgen kann man definieren, was es heißt, dass ein reellwertiges Netz (xi )i∈I gegen ±∞ konvergiert: ∀M > 0 ∃i0 ∈ I : ±xi > M für alle i i0 . Es gelten sinngemäß die Aussagen in Satz 3.6.2 auch für Netze. 5.3.18 Beispiel. Ist I wie in Beispiel 5.3.16, so gilt für a0 , . . . , an ∈ C, an , 0, lim |an zn + an−1 zn−1 + . . . + a0 | = lim |zn | · |an + an−1 z−1 + . . . + a0 z−n | = +∞. |z|→∞ |z|→∞ Kapitel 6 Reelle und komplexe Funktionen 6.1 Stetigkeit Sei f eine Funktion und sei x ein Punkt ihres Definitionsbereiches. Sagen wir dass diese Funktion stetig an der Stelle x ist, so verstehen wir darunter anschaulich, dass der Funktionswert f (t) sich beliebig wenig von f (x) unterscheidet, wenn nur t hinreichend nahe bei x ist. Wir sehen, dass man diesem Begriff Sinn geben kann, wenn man verlangt, dass Definitionsbereich und Wertebereich der betrachteten Funktion metrische Räume sind. 6.1.1 Definition. Seien hX, dX i und hY, dY i metrische Räume und D ⊆ X, und sei f : D → Y eine Funktion. Weiters sei x ∈ D. Dann heißt f stetig an der Stelle x, wenn gilt ∀ǫ > 0 ∃δ > 0 : dY ( f (t), f (x)) < ǫ wenn t ∈ D mit dX (t, x) < δ , oder äquivalent ∀ǫ > 0 ∃δ > 0 : f (Uδ (x) ∩ D) ⊆ Uǫ ( f (x)) , Ist f an jeder Stelle x ihres Definitionsbereiches D stetig, so heißt f stetig auf D. f (x) + ǫ f (x) f (x) − ǫ x−δ x x+δ Abbildung 6.1: ǫ-δ Kriterium für f : I (⊆ R) → R 117 KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 118 6.1.2 Beispiel. Sei f : X → Y eine konstante Funktion, d.h. f (x) := y0 , x ∈ X. Dann ist f stetig, denn ist x ∈ X und ǫ > 0, so wähle etwa δ = 1. Für alle t ∈ X mit dX (t, x) < δ gilt sicher dY ( f (t), f (x)) = dY (y0 , y0 ) = 0 < ǫ . Die identische Abbildung, f (x) := idX (x) = x, x ∈ X, ist stetig. Um das einzusehen seien x ∈ X und ǫ > 0 gegeben. Mit δ = ǫ folgt für alle t ∈ X, dX (t, x) < δ, dass dX ( f (t), f (x)) = dX (t, x) < δ = ǫ . Allgemeiner gilt, dass jede isometrische1 Abbildung f : X → Y stetig ist, da zu x ∈ X und ǫ > 0 mit δ = ǫ wieder für alle t ∈ X, dX (t, x) < δ dY ( f (t), f (x)) = dX (t, x) < δ = ǫ . Die Abbildung z 7→ z̄ als Funktion auf C ist isometrisch und daher stetig. Sei f : C → R die Funktion z 7→ |z|. Dann ist f stetig. Denn bei gegebenen z ∈ C und ǫ > 0 wähle δ := ǫ. Für alle w ∈ C mit |w − z| < δ gilt wegen der Dreiecksungleichung nach unten | f (w) − f (z)| = |w| − |z| ≤ |w − z| < δ = ǫ . p Sei π j : R p → R, j = 1, . . . , p die Funktion (xi )i=1 7→ x j . Diese ist überall stetig, p p p denn bei gegebenen (xi )i=1 ∈ R und ǫ > 0 wähle δ = ǫ. Für alle (ti )i=1 ∈ R p mit p p d2 ((xi )i=1 , (ti )i=1 ) < δ gilt p p |x j − t j | ≤ d2 ((xi )i=1 , (ti )i=1 ) < ǫ. Sei f : R → R die Funktion f (x) := [x]. Dabei bezeichnet [x] die größte ganze Zahl, die ≤ x ist, und sie wird als Gaußklammer bezeichnet. Diese Funktion ist stetig an jeder Stelle x ∈ R \ Z, und nicht stetig an jeder Stelle x ∈ Z: Ist x ∈ R \ Z, und ist ǫ > 0 gegeben, so wähle δ > 0, sodass das Intervall (x − δ, x + δ) keine ganze Zahl enthält. Dann ist f auf (x − δ, x + δ) konstant, und somit gilt | f (t) − f (x)| = 0 < ǫ, falls |t − x| < δ . Ist dagegen x ∈ Z, so enthält das Intervall (x − δ, x + δ) für jedes δ > 0 sowohl Zahlen t, die größer als x sind, als auch Zahlen t, die kleiner als x sind. Nun ist aber für t− < x und t+ > x sicher f (t− ) < f (t+ ) und daher, da ja beide Werte ganze Zahlen sind, | f (t− ) − f (t+ )| ≥ 1. Wir können also für kein ǫ mit 0 < ǫ ≤ 1 ein δ finden, das der geforderten Bedingung genügt. 6.1.3 Fakta. Seien hX, dX i und hY, dY i metrische Räume, x ∈ D ⊆ X, und sei f : D → Y eine Funktion. 1. Unmittelbar aus der Definition der Stetigkeit folgt, dass die Stetigkeit bei x eine lokale Eigenschaft ist, d.h. f ist bei x stetig genau dann, wenn es ein ρ > 0 gibt, sodass f |Uρ (x)∩D stetig bei x ist. 1 Isometrisch bedeutet dY ( f (x), f (y)) = dX (x, y). 6.1. STETIGKEIT 119 2. Ist x ein isolierter Punkt von D, dann ist f immer stetig bei x. Ist nämlich δ > 0 so, dass Uδ (x)∩D = {x}, so folgt f (Uδ (x)∩D) = { f (x)} ⊆ Uǫ ( f (x)) für beliebiges ǫ > 0. 3. Ist f : D → Y stetig auf D, so sicherlich auch f |C auf jeder Teilmenge C ⊆ D. Also sind Einschränkungen stetiger Abbildungen wieder stetig. Nun wollen wir die Stetigkeit an einer Stelle mit Hilfe verschiedener Grenzwertbegriffe charakterisieren. 6.1.4 Proposition. Seien hX, dX i und hY, dY i metrische Räume, D ⊆ X, und sei f : D → Y eine Funktion. Ist x ∈ D ein fester Punkt, dann sind äquivalent: (i) f ist stetig an der Stelle x. (ii) Ist x kein isolierter Punkt, so gilt limt→x f (t) = f (x), wobei wir diesen Limes verstehen als Limes des Netzes ( f (t))t∈D\{x} , wo D \ {x} mit der Relation t u : ⇐⇒ dX (u, x) ≤ dX (t, x) zu einer gerichteten Menge wird, vgl. Definition 5.3.10. (iii) Für jede Folge (tn )n∈N aus D \ {x} mit limn→∞ tn = x gilt limn→∞ f (tn ) = f (x). (iv) Für jede Folge (tn )n∈N aus D mit limn→∞ tn = x gilt limn→∞ f (tn ) = f (x). (v) Für jedes Netz (ti )i∈I aus D mit limi∈I ti = x gilt limi∈I f (ti ) = f (x). Beweis. (i) ⇐⇒ (ii): Im Falle, dass x ein isolierter Punkt von D ist, wissen wir schon, dass f bei x stetig ist. Sei also x nicht isolierter Punkt von D. Die Stetigkeit von f an der Stelle x bedeutet nach Definition ∀ǫ > 0 ∃δ > 0 : dY ( f (t), f (x)) < ǫ wenn t ∈ D mit dX (t, x) < δ . Die Beziehung limt→x f (t) = f (x) bedeutet gemäß Definition 5.3.10, ∀ǫ > 0 ∃δ > 0 : dY ( f (t), f (x)) < ǫ wenn t ∈ D \ {x} mit dX (t, x) < δ . (6.1) Also sind diese beiden Aussagen äquivalent. (ii) ⇐⇒ (iii): Das haben wir schon in Lemma 5.3.9 gesehen. (v) ⇒ (iv) ⇒ (iii): (iv) ist Spezialfall von (v) und genauso (iii) von (iv). (i) ⇒ (v): Sei ǫ > 0, dann gibt es ein δ > 0 mit f (Uδ (x)) ⊆ Uǫ ( f (x)). Sei nun i0 ∈ I mit xi ∈ Uδ (x), i i0 . Für diese i folgt f (xi ) ∈ Uǫ ( f (x)), und daraus die behauptete Grenzwertbeziehung. ❑ Ein immer wieder verwendete Eigenschaft der Stetigkeit folgt unmittelbar aus Proposition 6.1.4, (iii): KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 120 6.1.5 Korollar. Sind f, g : D → Y beide stetig und gilt f (x) = g(x) für alle x in einer Teilmenge E ⊆ D, so gilt auch f (x) = g(x) für alle x ∈ c(E) ∩ D. Insbesondere stimmen zwei stetige f und g auf D überein, wenn sie das nur auf einer dichten Teilmenge E von D tun. Beweis. Zu x ∈ D ∩ c(E) gibt es eine Folge (xn )n∈N in E ⊆ D, sodass xn → x. Wegen f (xn ) = g(xn ) und aus der Stetigkeit beider Funktionen folgt f (x) = lim f (xn ) = lim g(xn ) = g(x). n→∞ n→∞ ❑ Viele stetige Funktionen lassen sich mit Hilfe des nächsten Lemmas als solche identifizieren. 6.1.6 Lemma. Seien hX, dX i und hY, dY i metrische Räume, D ⊆ X, E ⊆ Y und f : D → Y und g : E → Z mit f (D) ⊆ E. Ist f bei x ∈ D und g bei f (x) stetig ist, so ist g ◦ f : D → Z bei x stetig. Beweis. Zu ǫ > 0 gibt es wegen der Stetigkeit von g ein δ′ > 0, sodass g(Uδ′ ( f (x)) ∩ E) ⊆ Uǫ (g( f (x))), und wegen der Stetigkeit von f ein δ > 0, sodass f (Uδ (x) ∩ D) ⊆ Uδ′ ( f (x)). Setzt man das zusammen und beachtet, dass auch f (Uδ (x) ∩ D) ⊆ f (D) ⊆ E, so erhält man (g ◦ f )(Uδ (x) ∩ D) ⊆ g(Uδ′ ( f (x)) ∩ E) ⊆ Uǫ (g( f (x))). ❑ 6.1.7 Beispiel. Aus unseren Rechenregeln für Folgen (Satz 3.3.4) folgern wir mit Hilfe der Folgencharakterisierung der Stetigkeit (Proposition 6.1.4, (iv)), dass die algebraischen Operationen ( ( R2 → R R → R +: −: (x, y) 7→ x + y x 7→ −x ·: ( R2 → R (x, y) 7→ x · y .−1 : ( R \ {0} → R \ {0} x 7→ 1x stetig sind. Genauso sind die algebraischen Operationen auf C stetig. Hier sind R, R2 , C, C2 (≃ R4 ) alle der euklidischen Metrik d2 versehen2. 6.1.8 Korollar. Sei hX, di ein metrischer Raum, D ⊆ X, und seien f, g : D → R stetige Funktionen. Dann ist auch die Abbildung x 7→ ( f (x), g(x)) von D nach R2 stetig. Ebenso sind die Abbildungen x 7→ − f (x), x 7→ f (x) + g(x), x 7→ f (x)g(x) von D nach R stetig. 2 Diese Feststellung gilt auch, wenn man d1 oder d∞ hernimmt (vgl. Proposition 3.5.1). 6.1. STETIGKEIT 121 Ist f (x) , 0, x ∈ D, so ist auch x 7→ 1 f (x) von D nach R stetig. Die selben Aussagen sind wahr, wenn wir R durch C ersetzen. Beweis. Ist x = limn→∞ xn mit x, xn ∈ D, n ∈ N, so folgt f (xn ) → f (x) und g(xn ) → g(x). Nach Proposition 3.5.1 folgt ( f (xn ), g(xn )) → ( f (x), g(x)) in R2 . Also ist x 7→ ( f (x), g(x)) stetig auf D. Die anderen Funktionen sind Zusammensetzungen von stetigen Funktionen. Zum Beispiel ist x 7→ f (x)g(x) die Zusammensetzung von x 7→ ( f (x), g(x)) und (u, v) 7→ uv (siehe Beispiel 6.1.7). ❑ Eine wiederholte Anwendung von Korollar 6.1.8 ergibt: p(x) mit gewissen Polynomen 6.1.9 Beispiel. Sei f eine rationale Funktion, d.h. f (x) = q(x) p und q mit reellen bzw. komplexen Koeffizienten. Dann ist f : {x ∈ R bzw. C : q(x) , 0} → R bzw. C stetig. Anmerkung: Wem diese Tatsache trivial vorkommt, der versuche zu Fuß“, d.h. ” durch explizite Angabe einer Zahl δ zu vorgegebenen ǫ und x, zu überprüfen, dass die Funktion x3 + x + 1 f (x) = x2 + 1 auf ihrem Definitionsbereich R stetig ist. Die folgende mengentheoretisch orientierte Charakterisierung der Stetigkeit einer Funktion spielt eine wichtige Rolle. 6.1.10 Proposition. Seien hX, dX i und hY, dY i metrische Räume, und sei f : X → Y eine Funktion. Dann sind äquivalent: (i) f ist stetig. (ii) Für jede in hY, dY i offene Menge B ist das vollständige Urbild f −1 (B) := {x ∈ X : f (x) ∈ B} offen in hX, dX i. (iii) Für jede in hY, dY i abgeschlossene Menge F ist das vollständige Urbild f −1 (F) := {x ∈ X : f (x) ∈ F} abgeschlossen in hX, dX i. Beweis. (i) ⇒ (ii): Sei B ⊆ Y offen, und sei x ∈ f −1 (B). Da B offen ist und f (x) ∈ B, folgt Uǫ ( f (x)) ⊆ B für ein ǫ > 0. Wegen der Stetigkeit existiert δ > 0 mit f (Uδ (x)) ⊆ Uǫ ( f (x)) ⊆ B, d.h. mit Uδ (x) ⊆ f −1 (B). Also enthält f −1 (B) mit jedem Punkt eine ganze δ-Kugel, d.h. f −1 (B) ist offen. (ii) ⇒ (i): Sei ǫ > 0 und x ∈ X gegeben. Die Menge Uǫ ( f (x)) ist offen, also ist auch f −1 (Uǫ ( f (x))) offen. Wegen x ∈ f −1 (Uǫ ( f (x))) existiert ein δ > 0, sodass Uδ (x) ⊆ f −1 (Uǫ ( f (x))). Das heißt aber gerade f (Uδ (x)) ⊆ Uǫ ( f (x)). (ii) ⇔ (iii): Das folgt sofort aus Proposition 5.1.16 und der Tatsache, dass f −1 (M c ) = f −1 (M)c . 122 KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN ❑ 6.1.11 Proposition. Seien hX, dX i und hY, dY i metrische Räume, und sei f : D → Y eine stetige Funktion. Ist K ⊆ D kompakt, so ist auch f (K) ⊆ Y kompakt. Beweis. Sei (yn )n∈N eine Teilfolge in f (K), und sei xn ∈ K, sodass f (xn ) = yn . Wegen der Kompaktheit von K gibt es eine gegen ein x ∈ K konvergente Teilfolge (xn(k) )k∈N von (xn )n∈N . Aus der Stetigkeit folgt f (x) = lim f (xn(k) ) = lim yn(k) . k→∞ k→∞ Also hat (yn )n∈N eine konvergente Teilfolge mit Grenzwert aus f (K). Also ist f (K) kompakt. ❑ 6.1.12 Korollar. Sei f : D → R stetig, und sei K ⊆ D kompakt. Dann ist f auf K beschränkt und nimmt ein Maximum und ein Minimum an, d.h. es gibt Punkte x+ , x− ∈ K mit f (x+ ) = max f (x), f (x− ) = min f (x) . x∈K x∈K Insbesondere nimmt jede auf einem reellen Intervall [a, b] definierte und stetige reellwertige Funktion ein Maximum und ein Minimum an. Beweis. Nach Proposition 6.1.11 ist f (K) ⊆ R kompakt, und wegen Proposition 5.2.11 damit beschränkt und abgeschlossen. Wegen Beispiel 5.1.14 ist sup f (K) = max f (K) = f (x+ ) für irgendein x+ ∈ K. Genauso zeigt man die Aussage für das Minimum. ❑ 6.1.13 Proposition. Seien hX, dX i und hY, dY i metrische Räume und D ⊆ X kompakt. Ist f : D → Y stetig und injektiv, so ist es auch f −1 : ran( f ) → D. Beweis. Wäre f −1 bei einem y nicht stetig, so gäbe es eine Folge (yn )n∈N in ran f mit yn → y, aber xn = f −1 (yn ) 6→ f −1 (y). Es gibt dann eine Teilfolge (xn(m) )m∈N und ein ǫ > 0, sodass (vgl. Bemerkung 3.2.11) dX ( f −1 (y), xn(m) ) ≥ ǫ, m ∈ N. Wegen der Kompaktheit hat aber (xn(m) )m∈N seinerseits eine Teilfolge (xn(m(l)) )l∈N mit xn(m(l)) → x, l → ∞ für ein x in D. Nun ist aber wegen dX ( f −1 (y), xn(m(l)) ) ≥ ǫ auch dX ( f −1 (y), x) ≥ ǫ und somit x , f −1 (y). Die Injektivität impliziert f (x) , y. Im Widerspruch dazu gilt f (x) = lim f (xn(m(l)) ) = lim yn(m(l)) = y. l→∞ l→∞ ❑ 6.2 Der Zwischenwertsatz Sei I ⊆ R ein Intervall. Die Anschauung von Stetigkeit legt nahe, dass mit I auch f (I) ein Intervall ist. 6.2. DER ZWISCHENWERTSATZ 123 6.2.1 Bemerkung. Man überlegt sich leicht, dass I ⊆ R genau dann ein Intervall ist, d.h. genau dann eine der Formen (a, b ∈ R, a < b,) ∅, (a, b), [a, b], (a, b], [a, b), (a, +∞), (−∞, a), [a, +∞), (−∞, a], R, hat, wenn für I gilt ∀x, y ∈ I, x < y ⇒ [x, y] ⊆ I. Um zu rechtfertigen, dass f (I) wieder ein Intervall ist, werden wir eine weitere charakteristische Eigenschaft von Intervallen herleiten. 6.2.2 Definition. Dazu nennen wir eine Teilmenge E eines metrischen Raumes zusammenhängend, wenn man E nicht als Vereinigung zweier nichtleerer getrennter Mengen schreiben kann. Dabei heißen A und B getrennt, wenn c(A) ∩ B = A ∩ c(B) = ∅. 6.2.3 Proposition. Sei I ⊆ R. Dann ist I genau dann ein Intervall, wenn I zusammenhängend ist. Beweis. Ist I = ∅, so ist I (vgl. Bemerkung 6.2.1) ein Intervall, und I ist auch zusammenhängend, wie man sofort überprüft. Also sei I , ∅. Angenommen es existieren x, y ∈ I, x < y, sodass [x, y] * I. Wähle z ∈ [x, y] \ I und setze A := (−∞, z] ∩ I, B := [z, +∞) ∩ I. Dann sind A und B disjunkt, und jeder Häufungspunkt t von A ist in (−∞, z], da diese Menge ja abgeschlossen ist. Wegen z < I folgt t < B und damit c(A) ∩ B = ∅. Genauso sieht man A ∩ c(B) = ∅. Also ist I nicht zusammenhängend. Sei umgekehrt I nicht zusammenhängend. Dann können wir I als A ∪ B mit nichtleeren A, B schreiben, wobei c(A) ∩ B = A ∩ c(B) = ∅. Wähle x ∈ A und y ∈ B, und sei o.B.d.A. angenommen, dass x < y. Man betrachte t = sup(A ∩ [x, y]). Insbesondere ist x ≤ t ≤ y. Weiters folgt aus t ∈ c(A ∩ [x, y]) ⊆ c(A) (siehe Beispiel 3.2.6), dass t < B, und somit x ≤ t < y. Wir wollen nun [x, y] * I zeigen, was im Fall t < A, sofort aus t ∈ [x, y] \ (A ∪ B) = [x, y] \ I folgt. Im Fall t ∈ A, folgt aus t < c(B) die Existenz einer ǫ-Kugel (t − ǫ, t + ǫ), sodass (t − ǫ, t + ǫ) ∩ B = ∅, wobei wir ǫ > 0 noch dazu so klein wählen, dass t + ǫ < y. Somit ist t + 2ǫ < B, und wegen x < t + 2ǫ < y und t = sup(A ∩ [x, y]) kann t + auch nicht in A liegen. Also t + 2ǫ ∈ [x, y] \ (A ∪ B) = [x, y] \ I und daher [x, y] * I. ǫ 2 ❑ 6.2.4 Proposition. Seien hX, dX i und hY, dY i metrische Räume, D ⊆ X, und sei f : D → Y eine stetige Funktion. Ist E ⊆ D zusammenhängend, so auch f (E). Beweis. Angenommen f (E) wäre nicht zusammenhängend. Dann gilt f (E) = A∪B mit A, B , ∅ und c(A)∩B = A∩c(B) = ∅. Für die nichtleeren Mengen E∩ f −1 (A), E∩ f −1 (B) folgt E = E ∩ f −1 (A) ∪ E ∩ f −1 (B) , E ∩ f −1 (A) ∩ E ∩ f −1 (B) = ∅. Jedes x ∈ c E ∩ f −1 (A) ∩ E ∩ f −1 (B) ist insbesondere Häufungspunkt von E ∩ f −1 (A). Somit gibt es eine gegen x konvergente Folge (xn )n∈N in E ∩ f −1 (A) \ {x}. Es folgt KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 124 limn→∞ f (xn ) = f (x), und somit f (x) ∈ c f (E ∩ f −1 (A)) ⊆ c(A). Andererseits ist −1 f (x) ∈ f E ∩ f (B) ⊆ B im Widerspruch zu c(A) ∩ B = ∅. Also kann nur c E ∩ f −1 (A) ∩ E ∩ f −1 (B) = ∅. Entsprechend gilt −1 −1 c E ∩ f (B) ∩ E ∩ f (A) = ∅, und E wäre somit nicht zusammenhängend, was unserer Annahme widerspricht. ❑ 6.2.5 Beispiel. Wir werden später sehen, dass die Einheitskreislinie T = {z ∈ C : |z| = 1} als das Bild von [0, 2π) unter der stetigen Abbildung x 7→ exp(ix) geschrieben werden kann. Nach Proposition 6.2.4 identifizieren wir damit T als zusammenhängend. 6.2.6 Korollar (Zwischenwertsatz). Sei I ⊆ D ein Intervall und f : I → R stetig. Dann ist auch f (I) ein Intervall. Ist insbesondere c ∈ R mit (−∞ ≤) inf f (I) < c < sup f (I) (≤ +∞), so existiert ein Punkt x ∈ I mit f (x) = c. Insbesondere gilt: Ist f stetig auf [a, b] und c eine Zahl zwischen f (a) und f (b), dh. f (a) < c < f (b) oder f (b) < c < f (a), so existiert ein Punkt x ∈ (a, b) mit f (x) = c. Beweis. Mit I ist nach Proposition 6.2.4 auch f (I) ⊆ R zusammenhängend, und somit nach Proposition 6.2.3 ein Intervall. Wählt man α, β ∈ f (I) mit inf x∈I f (x) < α < c < β < sup x∈I f (x), dann enthält f (I) das ganze Intervall [α, β] (siehe Bemerkung 6.2.1). Also gibt es ein x ∈ I mit f (x) = c. ❑ sup f (I) f (I) f (x) = c inf f (I) x I Abbildung 6.2: Veranschaulichung des Zwischenwertsatzes 6.3 Gleichmäßige Stetigkeit Die Definition der Stetigkeit einer Funktion f : D → Y lautet, in logischen Formeln angeschrieben, ∀x ∈ D ∀ǫ > 0 ∃δ > 0 : ∀t ∈ D : dX (t, x) < δ ⇒ dY ( f (t), f (x)) < ǫ . (6.2) 6.3. GLEICHMÄSSIGE STETIGKEIT 125 Die Zahl δ, die es zu jedem ǫ geben muss, hängt im Allgemeinen nicht nur von ǫ, sondern auch von der Stelle x ab. 6.3.1 Beispiel. Betrachte die Funktion f (x) = x−1 : R+ → R+ . Ist x ∈ R und ǫ > 0 gegeben, so berechnet man: 1 δ 1 − = . x x + δ (x + δ)x 2 ǫx Damit dieser Ausdruck ≤ ǫ ist, darf δ höchstens 1−ǫ x sein. Man sieht, dass diese größt mögliche Wahl von δ immer kleiner wird, je kleiner x wird, und tatsächlich für x → 0 ebenfalls gegen 0 strebt. Man kann in diesem Beispiel also tatsächlich zu gegebenem ǫ kein δ finden das von x unabhängig ist. Sollte eine Funktion nun so beschaffen sein, dass dieses Phänomen nicht auftritt, sollte also zu gegebenem ǫ stets ein δ existieren, welches für alle x funktioniert, so nennt man die Funktion gleichmäßig stetig. 6.3.2 Definition. Seien hX, dX i und hY, dY i metrische Räume, und sei f : D → Y eine Funktion. Dann heißt f gleichmäßig stetig, wenn gilt ∀ǫ > 0 ∃δ > 0 ∀x, t ∈ D : dX (t, x) < δ ⇒ dY ( f (t), f (x)) < ǫ . Vergleicht man diese Definition mit der Formel (6.2), so sieht man, dass man hier den Allquantor ∀x ∈ X und den Existenzquantor ∃δ > 0 vertauscht hat. Dies wird also nicht den gleichen, sondern einen stärkeren Begriff liefern. Ist f gleichmäßig stetig, so ist f auch stetig. Wie wir am obigen Beispiel sehen, gilt die Umkehrung nicht. Interessant in diesem Zusammenhang ist nun der folgende Satz. 6.3.3 Satz. Seien hX, dX i und hY, dY i metrische Räume, und D ⊆ X kompakt. Dann ist jede stetige Funktion f : D → Y sogar gleichmäßig stetig. Beweis. Nehme man das Gegenteil an. Dann gibt es ein ǫ > 0, sodass es für alle n ∈ N Punkte xn , yn ∈ D gibt, sodass dX (xn , yn ) < 1n und dY ( f (xn ), f (yn )) ≥ ǫ. Die Folgen (xn )n∈N (yn )n∈N haben wegen der Kompaktheit von D Häufungspunkte x bzw. y. Somit gilt x = lim xn(k) , y = lim yn(k) k→∞ k→∞ für Teilfolgen (xn(k) )k∈N und (yn(k) )k∈N . Aus dX (xn(k) , yn(k) ) < 3.2.12, dass dX (x, y) = lim dX (xn(k) , yn(k) ) = 0, 1 n(k) folgt mit Lemma k→∞ also x = y und somit f (x) = f (y). Andererseits folgt aus der Stetigkeit zusammen mit Lemma 3.3.1 der offensichtliche Widerspruch dY ( f (x), f (y)) = dY ( lim f (xn(k) ), lim f (yn(k) )) = lim dY ( f (xn(k) ), f (yn(k) )) ≥ ǫ. k→∞ k→∞ k→∞ ❑ 6.3.4 Beispiel. Sei E ⊆ R nicht kompakt. Dann gilt: (i) Es gibt eine auf E stetige Funktion die nicht beschränkt ist. (ii) Es gibt eine auf E stetige und beschränkte Funktion, die kein Maximum hat. KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 126 (iii) Ist E beschränkt, so gibt es eine auf E stetige, aber nicht gleichmäßig stetige Funktion. Wir betrachten zuerst den Fall, dass E einen Häufungspunkt x0 hat, der nicht zu E gehört (dieser Fall tritt sicher immer dann ein, wenn E beschränkt ist, denn dann würde 1 aus abgeschlossen kompakt folgen). Die Funktion x 7→ x−x ist stetig auf E, aber nicht 0 1 beschränkt. Sie ist auch nicht gleichmäßig stetig. Die Funktion f (x) = 1+(x−x 2 ist 0) stetig auf E und beschränkt (0 < f (x) < 1). Offenbar gilt lim x→x0 f (x0 ) = 1, also supx∈E f (x) = 1. Betrachte nun den Fall, dass E nicht beschränkt ist. (i) folgt mit f (x) = x, (ii) mit x2 f (x) = 1+x 2. In (iii) kann man die Forderung, dass E beschränkt ist, nicht ganz weglassen. Zum Beispiel betrachte E = Z. Dann ist jede Funktion auf E gleichmäßig stetig, denn man kann stets irgendein δ < 1 wählen, z.B. also δ = 21 ). 6.3.5 Satz. Seien hX, dX i und hY, dY i metrische Räume, wobei hY, dY i sogar vollständig ist. Weiters sei D ⊆ X und f : D → Y gleichmäßig stetig. Dann existiert eine eindeutige gleichmäßig stetige Fortsetzung F : c(D) → Y. Beweis. Sei (xn )n∈N eine Cauchy-Folge von Punkten aus D. Zu ǫ > 0 wähle δ > 0 so, dass dY f (y), f (z) < ǫ für dX (y, z) < δ . (6.3) Weiters wähle N ∈ N so, dass dX (xn , xm ) < δ für alle n, m ≥ N. Dann folgt dY f (xn ), f (xm ) < ǫ, n, m ≥ N, d.h. ( f (xn ))n∈N ist eine Cauchy-Folge in Y. Somit existiert der Limes limn→∞ f (xn ). Sei x ∈ X, und seien (xn )n∈N und (yn )n∈N zwei Folgen von Punkten in D mit xn → x sowie yn → x. Ist ǫ > 0 gegeben und δ > 0 wie in (6.3), so wähle N ∈ N mit dX (xn , x) < δ δ , dX (yn , x) < , n ≥ N. 2 2 Insbesondere gilt dX (xn , yn ) ≤ dX (xn , x) + dX (yn , x) < δ für alle n ≥ N. Es folgt dY ( f (xn ), f (yn )) < ǫ, n ≥ N, und daher dY lim f (xn ), lim f (yn ) ≤ ǫ. n→∞ n→∞ Da ǫ > 0 beliebig war, folgt limn→∞ f (xn ) = limn→∞ f (yn ). Zu jedem Sx ∈ c(D) gibt es definitionsgemäß eine Folge (xn )n∈N mit xn → x. Definiere F(x) := lim f (xn ). n→∞ Wegen der obigen Punkte ist F eine wohldefinierte Funktion von X nach Y. Ist x ∈ D, so betrachte die konstante Folge xn := x. Dann gilt sicher xn → x und f (xn ) → f (x), also F(x) = f (x). Somit ist F eine Fortsetzung von f . Es bleibt zu zeigen, dass F gleichmäßig stetig ist. Sei dazu ǫ > 0 gegeben. Wähle δ > 0 so, dass dY ( f (x), f (y)) < für x, y ∈ D mit dX (x, y) < δ. ǫ 3 Seien nun x, y ∈ c(D) mit dX (x, y) < 3δ . Wähle xn , yn ∈ D mit xn → x, yn → y und N ∈ N mit dX (xn , x) < δ δ ǫ ǫ , dX (yn , y) < , dY (F(x), f (xn )) < , dY (F(y), f (yn )) < , n ≥ N . 3 3 3 3 Dann gilt dX (xn , yn ) < δ und daher dY ( f (xn ), f (yn )) < 3ǫ . Somit erhalten wir dY (F(x), F(y)) < ǫ. Die Eindeutigkeit folgt sofort aus Korollar 6.1.5. ❑ 6.4. UNSTETIGKEITSSTELLEN 127 6.4 Unstetigkeitsstellen Sei,hY, dY i ein metrischer Raum, und sei f : (a, b) → Y mit a, b ∈ R, a < b. Weiters sei x ∈ (a, b). f ist gemäß Proposition 6.1.4 genau dann bei x stetig, wenn f (x) = limt→x f (t). In (5.14) haben wir gesehen, dass f (x) = limt→x f (t) genau dann, wenn die Grenzwerte f (x−) := limt→x− f (t) und f (x+) := limt→x+ f (t) existieren und beide mit f (x) übereinstimmen. 6.4.1 Bemerkung. Gilt zumindest f (x) = f (x−) ( f (x) = f (x+)), so spricht man von Linksstetigkeit bzw. linksseitiger Stetigkeit (Rechtsstetigkeit bzw. rechtsseitiger Stetigkeit) der Funktion f bei x. Klarerweise ist f bei x stetig, wenn f bei x sowohl links- als auch rechtsstetig ist. Ist f nicht stetig, so unterscheidet man folgende Fälle. 6.4.2 Definition. Sei f unstetig bei x. Man sagt, f habe eine Unstetigkeit 1. Art bei x, falls f (x−) := limt→x− f (t) und f (x+) := limt→x+ f (t) existieren, aber nicht beide gleich f (x) sind. Für Unstetigkeiten 1. Art gibt es zwei Möglichkeiten. Entweder f (x−) , f (x+), in welchem Fall man von einer Sprungstelle spricht, oder f (x−) = f (x+) , f (x). Dann spricht man von einer hebbaren Unstetigkeit. Liegt keine Unstetigkeit 1. Art vor, so spricht man von einer Unstetigkeit 2. Art. Den Begriff hebbar“hat man deswegen gewählt, weil man dann f an der Stelle x ” so abändern kann, dass die neue Funktion bei x stetig ist. 6.4.3 Beispiel. Betrachte die Funktion 1 , x rational f (x) = 0 , x irrational Diese Funktion hat an jeder Stelle x eine Unstetigkeit 2.Art. Sei x , x rational g(x) = 0 , x irrational g ist stetig bei 0, hat aber an jeder Stelle x , 0 eine Unstetigkeit 2.Art. Es gibt nämlich eine Folge (rn )n∈N aus Q ∩ (x, +∞) und eine Folge (xn )n∈N aus R \ Q ∩ (x, +∞), die beide gegen x konvergieren (vgl. Beispiel 3.2.6). Nun ist aber f (xn ) = 0 → 0 und f (rn ) = rn → x für n → ∞. Nach (5.14) kann somit limt→x+ f (t) nicht existieren. Ähnlich zeigt man, dass auch limt→x− f (t) nicht extistiert. Sei KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 128 h x+2 h(x) = −x − 2 x + 2 2 , x ∈ (−3, −2) , x ∈ [−2, 0) , x ∈ [0, 1) 1 −3 −2 0 −1 1 −1 −2 Dann ist h stetig auf (−3, 1) \ {0} und hat bei 0 eine Sprungstelle. Wir setzen den Begriff der Sinusfunktion (aus der Schule) voraus. Sei f sin 1x f (x) = 0 , x>0 , x≤0 0 1 π Dann ist f stetig auf R \ {0} und hat eine Unstetigkeit 2.Art bei 0. Es können also im Allgemeinen alle möglichen Varianten von Unstetigkeiten auftreten. Thematisch dazu passend wollen wir uns der Fortsetzbarkeit von stetigen Funktionen auf um einen Punkt größere Mengen zuwenden. 6.4.4 Bemerkung. Seien hX, dX i und hY, dY i metrische Räume und D ⊆ X, und sei f : D → Y eine stetige Funktion. Sei weiters x ∈ X \ D. Wir fragen uns, ob wir eine Fortsetzung f˜ : D ∪ {x} → Y von f finden können, die die Eigenschaft stetig zu sein beibehält. Wenn x kein Häufungspunkt von D ist, so sieht man leicht, dass x ein isolierter Punkt von D ∪ {x} ist, und daher jede Fortsetzung f˜ stetig ist. Sei also x ein Häufungspunkt von D. Gibt es eine stetige Fortsetzung f˜, so muss nach Proposition 6.1.4 f˜(x) = limt→x f (t). Existiert umgekehrt limt→x f (t), so setze man limt→x f (t) , s = x ˜f (s) = . f (s) , s∈D Klarerweise ist f˜ eine Fortsetzung von f . Wegen Proposition 6.1.4, (ii), ist f˜ bei x stetig. Andererseits ist wegen Fakta 6.1.3 mit f auch f˜ bei allen t ∈ D stetig. Also ist f˜ eine auf D ∪ {x} stetige Fortsetzung. 6.5. MONOTONE FUNKTIONEN 129 6.4.5 Beispiel. Seien a, b, c ∈ R, c ≤ 0, D = (−∞, 0)∪(0, +∞) und f : D → R definiert b durch f (x) = a für x < 0 und f (x) = x−c für x > 0. Dann gilt lim x→0− f (t) = a und −b , b , 0, c < 0 c lim f (t) = sgn(b) · ∞ , b , 0, c = 0 . x→0+ 0 , b=0 Aus Bemerkung 6.4.4 wissen wir, dass sich f genau dann zu einer Funktion f˜ : R → R fortsetzen lässt, wenn limt→0 f (t) existiert. Nach (5.14) existiert dieser Grenzwert genau dann, wenn a = b = 0 oder b , 0, c , 0, a = − bc . Dabei muss f˜(0) = 0 bzw. f˜(0) = a = − bc . 6.5 Monotone Funktionen 6.5.1 Definition. Man sagt, dass für ein Intervall I ⊆ R, eine Funktion f : I → R monoton wachsend ist, falls x < y ⇒ f (x) ≤ f (y) . Gilt sogar x < y ⇒ f (x) < f (y), so sagt man f sei streng monoton wachsend. Analog sagt man, f sei monoton fallend, falls x < y ⇒ f (x) ≥ f (y). Sollte x < y sogar f (x) > f (y) implizieren, so spricht von einer streng monoton fallenden Funktion. Klarerweise ist eine streng monotone Funktion stets injektiv. Nun kommen wir zur Diskussion der Unstetigkeitsstellen monotoner Funktionen. 6.5.2 Proposition. Sei f monoton wachsend auf einem reellen Intervall I, wobei a, b ∈ R ∪ {−∞, +∞}, a < b die Intervallränder bezeichnet. Dann existieren für jeden Punkt x ∈ (a, b) sowohl f (x−) := lim s→x− f (s) als auch f (x+) := limt→x+ f (t), wobei3 sup f (s) = f (x−) ≤ f (x) ≤ f (x+) = inf f (t). (6.4) x<t<b a<s<x Ist x = a ∈ I (x = b ∈ I), so gilt die rechte (linke) Seite von (6.4). Weiters gilt für x < y immer f (x+) < f (y−). Analoge Aussagen gelten für monoton fallende Funktionen. Beweis. Wir beschränken uns auf x ∈ (a, b). Der Fall der Intervallränder betrachtet man in analoger Weise. Der Beweis folgt unmittelbar aus (5.8), da die Grenzwerte in (6.4) ja Grenzwerte monotoner und beschränkter Netze sind. Die Ungleichung in (6.4) folgt leicht aus der Tatsache, dass jeder Punkt aus { f (s) : s ∈ (a, x)} kleiner oder gleich f (x) und f (x) kleiner oder gleich jedem Punkt aus { f (t) : t ∈ (x, b)} ist. Der zweite Teil der Behauptung folgt aus lim f (t) = inf f (t) = inf f (t), lim f (s) = sup f (s) = sup f (s). t→x+ x<t<b x<t<y t→y− a<s<y x<s<y ❑ 3 Insbesondere können in (a, b) nur Unstetigkeitsstellen 1.Art auftreten. KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 130 f f (x3 +) f (x3 +) f (x3 −) = f (x2 −) f (x2 ) = f (x2 +) x1 x2 x3 f (x1 +) f (x1 ) = f (x1 −) Abbildung 6.3: Veranschaulichung monotoner Funktionen 6.5.3 Korollar. Sei I ⊆ R ein Intervall, f : I → R eine monoton wachsende Funktion und J = f (I). Das Bild ist genau dann ein Intervall, wenn f stetig ist. Ist f streng monoton wachsend, so ist f −1 : J → I auch streng monoton wachsend. Dabei enthält I genau dann seinen linken (rechten) Intervallrand, wenn J das tut. Ist f streng monoton wachsend und stetig, so ist auch f −1 : J → I streng monoton wachsend und stetig. Eine entsprechende Aussage gilt für streng monoton fallende Funktionen. Beweis. Ist f stetig, so ist wegen Korollar 6.2.6 auch f (I) ein Intervall. Angenommen f ist nicht stetig an einem x ∈ I, das zunächst nicht ein Intervallrand von I sei. Wegen (6.4) muss lim s→x− f (s) < limt→x+ f (t). Es folgt f (τ) ≤ lim f (s) = f (x−), τ < x und f (τ) ≥ lim f (t) = f (x+), τ > x . s→x− Also kann f keine Werte im Inter vall f (x−), f (x+) bis auf unter Umständen einen - nämlich f (x) annehmen. t→x+ f (x+) f (x) f (x−) 6.6. GLEICHMÄSSIGE KONVERGENZ 131 Ist x der linke Intervallrand von I, so muss nach (6.4) f (x) < limt→x+ f (t). Somit folgt ( f (x), limt→x+ f (t)) ∩ J = ∅. Entsprechend argumentiert man im Fall des rechten Randes. Jedenfalls ist J kein Intervall. Wegen der Strengen Monotonie ist f injektiv. Man sieht sofort, dass auch f −1 : J → I auch streng monoton wachsend ist. Enthält I seinen linken Rand4 a, so folgt aus der Monotonie, dass f (a) ≤ f (t), t ∈ I, und somit dass J auch seinen linken Rand enthält. Enthält J = f (I) seinen linken Rand f (c) für ein c ∈ I, und wäre t ∈ I, t < c, so folgt aus der strengen Monotonie der Widerspruch f (t) < f (c). Also ist c ∈ I der linke Rand von I. Ist f stetig, so ist J ein Intervall und die streng monoton wachsende Funktion f −1 : J → I hat als Bild genau das Intervall I. Nach dem ersten Punkt muss daher auch f −1 stetig sein. ❑ Wir werden später dieses Korollar verwenden, um z.B. zu zeigen, dass der Logarithmus eine stetige Funktion ist. Thematisch zu obigem Ergebnis passt das nächste Lemma, das aus dem Zwischenwertsatz folgt. 6.5.4 Lemma. Seien I, J ⊆ R zwei Intervalle und f : I → J stetig und bijektiv. Dann ist f streng monoton wachsend oder fallend. Beweis. Wäre f weder streng monoton wachsend noch streng monoton fallend, so gibt es x1 < x2 aus I mit f (x1 ) ≥ f (x2 ) und x3 < x4 aus I mit f (x3 ) ≤ f (x4 ). Weil f injektiv ist, muss sogar f (x1 ) > f (x2 ) und f (x3 ) < f (x4 ). Daraus folgt, dass {x1 , x2 , x3 , x4 } zumindest drei Elemente hat. Durch Fallunterscheidungen je nachdem, wie diese Punkte angeordnet sind, findet man immer a < b < c aus {x1 , x2 , x3 , x4 }, sodass entweder f (a) < f (b), f (b) > f (c) oder f (a) > f (b), f (b) < f (c). Man beachte, dass dabei wegen der Injektivität alle drei Werte f (a), f (b), f (c) untereinander verschieden sein müssen. Im ersten Fall ist entweder f (a) ∈ ( f (c), f (b)) oder f (c) ∈ ( f (a), f (b)). Aus Korollar 6.2.6 folgt daher f (a) = f (t) für ein t ∈ (b, c) bzw. f (c) = f (t) für ein t ∈ (a, b), was jedenfalls der Injektivität widerspricht. Im zweiten Fall argumentiert man entsprechend. ❑ 6.6 Gleichmäßige Konvergenz P n Wir haben schon gesehen, dass z.B. die geometrische Reihe ∞ n=0 z für jedes z ∈ C, |z| < 1, konvergiert. Betrachtet man diese Reihe nicht nur für ein festes vorgegebenes z, sondern für alle z, so hat man eine Reihe, deren Summanden Funktionen (von z) sind, 1 ). und deren Summe ebenfalls eine Funktion von z ist (nämlich 1−z 4I ist daher von der Form [a, b], [a, b), [a, +∞) mit b ∈ R, b > a. KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 132 Betrachten wir also eine Folge ( fn )n∈N von Funktionen, die definiert ist, zum Beispiel, auf einer Menge E ⊆ R und die, zum Beispiel, reelle Werte annimmt. Wir würden gerne erklären, was es bedeutet, dass diese Folge gegen eine Funktion f konvergiert. Um einen vernünftigen“ Grenzwertbegriff zu bekommen, müssen wir jetzt eine ” Metrik definieren, und zwar eine Metrik auf einer Menge von Funktionen f : E → R. Aber man kann in diesem konkreten Fall auch naiver an die Sache herangehen. Ist ( fn )n∈N , fn : E → R, eine Folge von Funktionen, dann ist für jedes feste x ∈ E sicher ( fn (x))n∈N eine Folge von Zahlen, und für diese wissen wir, was es bedeutet zu konvergieren. Man kann also definieren: 6.6.1 Definition. Sei E eine Menge und hY, dY i ein metrischer Raum. Eine Folge ( fn )n∈N , fn : E → Y, heißt punktweise konvergent gegen die Funktion f : E → Y, wenn für jedes feste x ∈ E gilt limn→∞ fn (x) = f (x). Entsprechend definiert man die punktweise Konvergenz von Netzen von Funktionen. Es entsteht die Frage, ob sich Eigenschaften wie etwa die fundamentale Eigenschaft der Stetigkeit der Funktionen fn auf die Grenzfunktion f übertragen. Die folgenden Beispiele illustrieren, dass in dieser Angelegenheit etwas schiefgehen kann. 6.6.2 Beispiel. Betrachte die Funktionen gn : [0, 1] → R, definiert durch gn (x) := xn , n ∈ N. Bekannterweise gilt 0 , x ∈ [0, 1) . lim gn (x) = 1 , x = 1 n→∞ Jede der Funktionen gn ist eine stetige Funktionen auf [0, 1], nicht jedoch die Grenzfunktion. Betrachte die Funktionen fn : R → R, definiert durch fn (x) := für jedes x , 0 ∞ X x2 n=0 x2 . (1+x2 )n Dann ist (1 + x2 )n eine konvergente geometrische Reihe. Ihre Summe ist 1 + x2 , x , 0. Für x = 0 sind alle Summanden = 0, also auch ihre Summe. Man erhält ∞ X 1 + x2 x , 0 fn (x) = 0 x=0 n=0 Alle Funktionen fn , und damit auch alle Partialsummen obiger Reihe sind stetige Funktionen von x ∈ R, nicht jedoch die Grenzfunktion. Die punktweise Konvergenz von Funktionen ist also nicht stark genug um etwa die Eigenschaft der Stetigkeit zu erhalten. 6.6.3 Definition. Sei E eine Menge und hY, dY i ein metrischer Raum. Wir bezeichnen mit B(E, Y) die Menge aller beschränkten Funktionen f : E → Y, d.h. B(E, Y) := f : E → Y : ∃R > 0, y0 ∈ Y : ∀x ∈ E ⇒ dY ( f (x), y0 ) ≤ R . 6.6. GLEICHMÄSSIGE KONVERGENZ 133 Man definiert nun die Abbildung ( B(E, Y) × B(E, Y) → R d∞ : ( f, g) 7→ supx∈E dY ( f (x), g(x)) und spricht von der Supremumsmetrik. f g Für reellwertige Funktionen f, g : E → R = Y ist dY (x, y) = |x − y| und daher d∞ ( f, g) = sup x∈E | f (x) − g(x)|. d∞ ( f, g) | f − g| E 6.6.4 Lemma. Die Supremumsmetrik d∞ ist eine Metrik auf der Menge B(E, Y). Beweis. Es gilt d∞ ( f, f ) = supx∈E dY ( f (x), f (x)) = sup x∈E 0 = 0. Ist umgekehrt d∞ ( f, g) = sup x∈E dY ( f (x), g(x)) = 0, so folgt dY ( f (x), g(x)) = 0 für jedes x ∈ E, und daher f (x) = g(x), x ∈ E. Also f = g. Aus dY ( f (x), g(x)) = dY (g(x), f (x)) folgt d∞ ( f, g) = d∞ (g, f ). Ist h eine weitere Funktion, so gilt für festes x ∈ E dY ( f (x), g(x)) ≤ dY ( f (x), h(x)) + dY (h(x), g(x)) , und daher auch dY ( f (x), g(x)) ≤ sup dY ( f (x), h(x)) + sup dY (h(x), g(x)) = d∞ ( f, h) + d∞ (h, g) . x∈E x∈E Da diese Beziehung für jedes x ∈ E gilt, folgt auch d∞ ( f, g) = supx∈E dY ( f (x), g(x)) ≤ d∞ ( f, h) + d∞ (h, g). ❑ 6.6.5 Definition. Eine Folge ( fn )n∈N von Funktionen aus B(E, Y) heißt gleichmäßig gegen f , wenn limn→∞ fn = f bezüglich d∞ , d.h. wenn ∀ǫ > 0 ∃N ∈ N : d∞ ( fn , f ) ≤ ǫ, n ≥ N, (6.5) oder äquivalent dazu ∀ǫ > 0 ∃N ∈ N : d∞ ( fn , f ) < ǫ, n ≥ N. Entsprechend definiert man die gleichmäßige Konvergenz von Netzen von Funktionen. 134 KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN f fn , n ≥ N f +ǫ f −ǫ E Abbildung 6.4: Veranschaulichung der gleichmäßigen Konvergenz 6.6.6 Bemerkung. Ist f ∈ B(E, Y) und g irgendeine Funktion von E → Y mit der Eigenschaft, dass supt∈E dY ( f (t), g(t)) < ∞, so folgt aus der Dreiecksungleichung, dass auch g eine beschränkte Funktion ist. Ist daher ( fn )n∈N eine Folge aus B(E, Y), und gilt supt∈E dY ( fn (t), g(t)) → 0, so folgt g ∈ B(E, Y) und fn → g gleichmäßig. Der Unterschied zwischen punktweiser und gleichmäßiger Konvergenz liegt darin begründet, dass man ein N finden muss, das für alle x ∈ E funktioniert. In der Tat gilt d∞ ( fn , f ) ≤ ǫ ⇔ ∀x ∈ E ⇒ dY ( fn (x), f (x)) ≤ ǫ, und somit ist (6.5) äquivalent zu ∀ǫ > 0 ∃N ∈ N ∀x ∈ E : dY ( fn (x), f (x)) ≤ ǫ, n ≥ N , wogegen punktweise Konvergenz bedeutet ∀x ∈ E ∀ǫ > 0 ∃N ∈ N : dY ( fn (x), f (x)) ≤ ǫ, n ≥ N . Insbesondere sehen wir, dass jede gleichmäßig konvergente Folge auch punktweise konvergiert und zwar zur gleichen Grenzfunktion. 6.6.7 Beispiel. Betrachte nochmals die reellwertigen Funktionen gn (x) := xn , n ∈ N nun defniert für x ∈ [0, 1), vgl. Beispiel 6.6.2. Wir wissen schon, dass gn punktweise gegen die Nullfunktion auf [0, 1) konvergiert. Dabei gilt wegen xn < 1 für x ∈ [0, 1), n ∈ N, und wegen lim x→1− xn = 1, dass d∞ (gn , 0) = sup dR (gn (x), 0) = sup |xn | = 1. x∈[0,1) x∈[0,1) Also d∞ (gn , 0) 6→ 0 für n → ∞, d.h. (gn )n∈N konvergiert nicht gleichmäßig gegen die Nullfunktion. 6.6.8 Beispiel. Sei η ∈ (0, 1) fest, und betrachtet die Funktionenfolge gn (x) = xn , n ∈ N, auf dem Intervall [0, η]. Klarerweise konvergiert auch diese eingeschränkte Funktionenfolge punktweise gegen die Nullfunktion auf [0, η]. Nun folgt aber wegen d∞ (gn , 0) = sup dR (gn (x), 0) = sup |xn | = ηn , x∈[0,η] x∈[0,η] 6.6. GLEICHMÄSSIGE KONVERGENZ 135 gn (x) 1 n=1 n=3 n=7 n = 13 1 2 0 1 2 η 1 x Abbildung 6.5: Graph der Funktionen gn für ausgewählte n ∈ N dass d∞ (gn , 0) → 0 für n → ∞. Also konvergiert gn sogar gleichmäßig gegen die Nullfunktion. 1 2 6.6.9 Beispiel. Man untersuche die Funktionenfolge fn (x) := nxe− 2 nx , x ∈ [0, ∞), n ∈ N, auf gleichmäßige Konvergenz. Dabei greifen wir der Definition der Funktion x 7→ e x für x ∈ R weiter hinten vor. Wir verwenden auch die Tatsache, dass ye−y → 0 für y → +∞. Weiters verwenden wir die Differentialrechnung zur Bestimmung von Extrema. Da dieses Beispiel nur zum besseren Verständnis des Begriffes der gleichmäßigen Konvergenz dient und später nicht verwendet wird, sind diese Vorgriffe gerechtfertigt. Zunächst sei bemerkt, dass für alle n ∈ N die Funktion fn (x) stetig ist und fn (x) ≥ 0 für x ∈ [0, ∞). Eine getrennte Untersuchung der Fälle x , 0 und x = 0 liefert punktweise Konvergenz fn (x) → f (x) ≡ 0 für n → ∞. Um ( fn )n∈N auf gleichmäßige Konvergenz gegen die Funktion f (x) ≡ 0 zu untersuchen betrachtet man die Supremumsmetrik d∞ ( fn , 0) = sup dR ( fn (x), 0) = sup | fn (x)|. x∈[0,∞) x∈[0,∞) Da für jedes n ∈ N die Funktion fn (x) nicht negativ ist, fn (0) = 0 und lim x→∞ fn (x) = 0 gilt, folgt, dass fn (x) sogar ein Maximum in [0, ∞) annimmt. Um das Maximum zu berechnen, ist Satz 7.2.2 hilfreich. Für jedes n ∈ N ist fn (x) beliebig oft differenzierbar, und setzt man die erste Ableitung gleich Null, so erhält man 1 1 1 ±1 2 2 2 fn′ (x) = ne− 2 nx − n2 x2 e− 2 nx = e− 2 nx (n − n2 x2 ) = 0 ⇔ x = √ . n Also ist x = √1n die einzige Nullstelle der ersten Ableitung, die in [0, ∞) enthalten ist. Wegen lim x→∞ fn (x) = 0 folgt daher, dass das Maximum der Funktion fn (x) an der Stelle x = √1n liegt. Somit ergibt sich für die Supremumsmetrik 1 1 n d∞ ( fn , 0) = sup | fn (x)| = max | fn (x)| = fn √ = √ e− 2 . x∈[0,∞) n n x∈[0,∞) Daraus folgt d∞ ( fn , 0) 6→ 0 für n → ∞, d.h. ( fn )n∈N konvergiert nicht gleichmäßig gegen die Nullfunktion. KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 136 fn (x) 7 n=1 n=5 6 n = 20 5 n = 120 4 3 2 1 0 1 1 2 3 2 2 5 2 3 x 7 2 Abbildung 6.6: Graph der Funktionen fn für ausgewählte n ∈ N 1 2 6.6.10 Beispiel. Sei η > 0 und betrachtet man die Funktionenfolge fn (x) := nxe− 2 nx , n ∈ N, auf dem Intervall [η, ∞). Aus dem vorigen Beispiel wissen wir bereits, dass die Funktion fn (x) für x > √1n monoton fallend ist. Wegen 1 ∀δ > 0 ∃n0 ∈ N : δ > √ ∀n ≥ n0 n gibt es ein n0 ∈ N, sodass √1n < [η, ∞) für alle n ≥ n0 . Daher ergibt sich für n ≥ n0 in diesem Fall für die Supremumsmetrik 1 2 d∞ ( fn , 0) = sup | fn (x)| = max | fn (x)| = fn (η) = nηe− 2 nη . x∈[η,∞) x∈[η,∞) Also folgt d∞ ( fn , 0) → 0 für n → ∞, d.h. ( fn )n∈N konvergiert gleichmäßig gegen die Nullfunktion. Gleichmäßige Konvergenz sichert nun (wie wir auch später immer wieder feststellen werden), dass sich Grenzübergänge brav“ verhalten. ” 6.6.11 Lemma. Sei hX, dX i ein metrischer Raum und hY, dY i ein vollständig metrischer Raum, E ⊆ X, und seien f, fn ∈ B(E, Y), n ∈ N. Weiters sei (xk )k∈N eine Folge in E. Ist die Folge ( fn )n∈N auf E gleichmäßig konvergent gegen f , und existiert für jedes n ∈ N der Grenzwert lim fn (xk ) = An , k→∞ dann konvergiert die Folge (An )n∈N und zwar gegen limk→∞ f (xk ). Also gilt lim lim fn (xk ) = lim lim fn (xk ). k→∞ n→∞ n→∞ k→∞ Beweis. Sei ǫ > 0 gegeben. Da ( fn )n∈N → f bezüglich d∞ , ist ( fn )n∈N in B(E, Y) eine Cauchy-Folge. Es existiert also ein N ∈ N, sodass für n, m ≥ N und alle t ∈ E gilt dY ( fn (t), fm (t)) ≤ ǫ. 6.6. GLEICHMÄSSIGE KONVERGENZ 137 Hält man n und m fest und lässt man t die Folge (xk )k∈N durchlaufen, so folgt mit Lemma 3.2.12 und Lemma 3.3.1 die Beziehung dY (An , Am ) ≤ ǫ. Damit ist (An )n∈N eine Cauchy-Folge in Y und daher konvergent, limn→∞ An =: A. Nun gilt dY ( f (xk ), A) ≤ dY ( f (xk ), fn (xk )) + dY ( fn (xk ), An ) + dY (An , A). Wähle n so groß, dass für alle t ∈ E und insbesondere für alle t = xk dY ( f (t), fn (t)) < ǫ und dY (An , A) < ǫ. Für dieses n existiert ein k0 ∈ N, sodass aus k ≥ k0 die Ungleichung dY ( fn (xk ), An ) < ǫ folgt. Insgesamt erhalten wir dY ( f (xk ), A) < 3ǫ, k ≥ k0 . ❑ 6.6.12 Bemerkung. Wir werden später eine Verallgemeinerung dieses Lemmas für Netze zeigen. Der Beweis davon wird im Wesentlich derselbe sein. 6.6.13 Korollar. Sei hX, dX i ein metrischer Raum und hY, dY i ein vollständig metrischer Raum, E ⊆ X, und seien f, fn ∈ B(E, Y), n ∈ N, sodass ( fn )n∈N auf E gleichmäßig gegen f konvergiert. Sind die Funktionen fn alle stetig bei einem x ∈ E, so ist es auch f . Sind alle fn auf ganz E stetig, so ist es auch f . k→∞ Beweis. Sei x ∈ E und sei (xk )k∈N eine Folge mit xk −→ x. Aus Lemma 6.6.11 folgt lim f (xk ) = lim lim fn (xk ) = lim lim fn (xk ) = lim fn (x) = f (x). k→∞ k→∞ n→∞ n→∞ k→∞ n→∞ Nach Proposition 6.1.4 ist f bei x stetig. ❑ 6.6.14 Bemerkung. Nach Lemma 5.1.13 erhält man, dass die Menge C(E, Y) aller beschränkten und stetigen Funktionen von E → Y, eine abgeschlossene Teilmenge von B(E, Y) versehen mit der Metrik d∞ ist. Dabei ist E Teilmenge eines metrischen Raumes. 6.6.15 Satz (Cauchy-Kriterium). Ist E eine Menge und hY, dY i ein vollständig metrischer Raum, so ist hB(E, Y), d∞i ebenfalls ein vollständig metrischer Raum. Somit konvergiert eine Folge ( fn )n∈N von Funktionen aus B(E, Y) genau dann gleichmäßig, wenn es zu jedem ǫ > 0 ein N ∈ N gibt, sodass für alle n, m ≥ N und beliebiges x ∈ E gilt dY ( fn (x), fm (x)) ≤ ǫ. (6.6) Beweis. Klarerweise ist eine konvergente Folge ( fn )n∈N von Funktionen aus B(E, Y) eine Cauchy-Folge. Diese Tatsache gilt ja in allen metrischen Räumen. Sei nun umgekehrt die Cauchy-Bedingung erfüllt. Man beachte, dass (6.6) für alle x ∈ E zu d∞ ( fn , fm ) ≤ ǫ äquivalent ist. Es folgt, dass insbesondere für jedes einzelne x die Folge ( fn (x))n∈N eine CauchyFolge in Y und daher konvergent ist. Also existiert der Grenzwert limn→∞ fn (x) punktweise auf E. Wir setzen f (x) := lim fn (x). n→∞ 138 KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN Wir müssen nun noch zeigen, dass f beschränkt ist und dass die Konvergenz sogar gleichmäßig stattfindet. Sei ǫ > 0 gegeben und wähle N ∈ N so, dass dY ( fn (x), fm (x)) ≤ ǫ für alle n, m ≥ N und alle x ∈ E. Hält man x fest und lässt m → ∞ streben, so folgt für n ≥ N dY ( fn (x), f (x)) ≤ ǫ. Da x beliebig, war folgt d∞ ( fn , f ) ≤ ǫ, n ≥ N, d.h. fn → f gleichmäßig und mit Bemerkung 6.6.6 ist f beschränkt. ❑ 6.7 Reell- und komplexwertige Folgen und Reihen 6.7.1 Definition. Ist Y = R oder Y = C, dann setzt man für f : E → Y k f k∞ := sup | f (x)|, x∈E und spricht von der Supremumsnorm. d∞ ( f, g) lässt sich dann als k f − gk∞ schreiben. Klarerweise ist k f k∞ = d∞ ( f, 0), wobei 0 hier die konstante Nullfunktion ist. Unmittelbar überprüft man, dass ( f, g ∈ B(E, Y)) k f k∞ ≥ 0 und k f k∞ = 0 ⇔ f = 0, kλ · f k∞ = |λ| · k f k∞ für λ ∈ R bzw. λ ∈ C, k f + gk∞ ≤ k f k∞ + kgk∞ , k f · gk∞ ≤ k f k∞ · kgk∞ . 6.7.2 Korollar. Sind ( fn )n∈N , (gn )n∈N Folgen von Funktionen aus B(E, R) bzw. B(E, C), die gleichmäßig gegen f bzw. g konvergieren, so gilt lim fn + gn = f + g, lim fn · gn = f · g, n→∞ n→∞ und zwar gleichmäßig. Insbesondere gilt limn→∞ λ · fn = λ · f für alle λ ∈ R bzw. λ ∈ C. Beweis. Wir beweisen exemplarisch nur die zweite Aussage. Es gilt d∞ ( fn gn , f g) = k fn gn − f gk∞ ≤ kgn k∞ · k fn − f k∞ + k f k∞ · kgn − gk∞ . Als konvergente Folge ist (gn )n∈N beschränkt, d.h. kgn k∞ = d∞ (gn , 0) ≤ C, n ∈ N. Somit konvergiert d∞ ( fn gn , f g) gegen Null. ❑ P 6.7.3 Definition. Für n ∈ N sei fn : E → R (C). Man sagt, die Reihe ∞ n=1 fn konverP∞ giert punktweise, wenn für jedes x ∈ E die Reihe n=1 fn (x) in R (C) konvergiert. P∞ Ist fn ∈ B(E, PR) (∈ B(E, C)), n ∈ N, so heißt n=1 fn gleichmäßig konvergent, N wenn die Folge n=1 fn (.) von Partialsummen gleichmäßig konvergiert. N∈N P∞ Die Reihe n=1 fn konvergiert absolut als Funktionenreihe, wenn die Reihe P∞ n=1 k fn k∞ konvergiert. 6.7. REELL- UND KOMPLEXWERTIGE FOLGEN UND REIHEN 139 P Klarerweis impliziert die absolute Konvergenz von ∞ n=1 fn als Funktionenreihe die P∞ absolute Konvergenz von n=1 fn (x) für jedes x ∈ E. Wir haben aber auch folgendes Ergebnis. 6.7.4 Korollar (Weierstraß Kriterium). Sei ( fn )n∈N eine Folge von beschränkten reellP bzw. komplexwertigen Funktionen auf einer Menge E. Ist ∞ n=1 fn absolut konvergent als Funktionenreihe, so ist diese Funktionenreihe auch gleichmäßig konvergent. P∞ und somit auch gleichmäßig konvergent, n=1 fn ist sicher dann absolut konvergent,P wenn es Mn ∈ R, Mn ≥ 0, n ∈ N gibt, für die ∞ n=1 Mn konvergiert, und sodass k fn k∞ ≤ Mn , n ∈ N. Beweis. Nach dem Majorantenkriterium (vgl. Satz 3.7.8) folgt aus der Konvergenz von P∞ P∞ n=1 Mn die von n=1 k fn k∞ . P N Ist nun letztere Reihe konvergent, so ist die Folge n=1 k fn k∞ von PartialsumN∈N men eine Cauchy-Folge in R. Es gibt somit zu ǫ > 0 ein N ∈ N, sodass für k, m ≥ N P gilt m n=k+1 k fn k∞ ≤ ǫ. Für solche m, k folgt auch m m X X fn ≤ k fn k∞ ≤ ǫ, . n=k+1 n=k+1 P ∞ N fn eine Cauchy-Folge in B(E, R) (∈ B(E, C)), und nach Satz 6.6.15 Also ist n=1 N∈N P konvergent. Somit ist ∞ n=1 fn gleichmäßig konvergent. ❑ P∞ 6.7.5 P Bemerkung. Man sagt eine Funktionenreihe n=1 fn konvergiert absolut und gleichmäßig, wenn die Funktionenreihe ∞ Man sieht unschwer ähnlich wie im Beweis von Korollar n=1 | fn (.)| gleichmäßig konvergiert. P 6.7.4, dass daraus die P∞ gleichmäßige Konvergenz von n=1 fn folgt. Außerdem folgt aus der absoluten Konvergenz von ∞ n=1 fn ihre absolut und gleichmäßige Konvergenz. Somit liegt dieser Konvergenzbegriff zwischen der gleichmäßigen Konvergenz und der absoluten Konvergenz. Die meisten Konvergenzkriterien für Reihen kann man so anpassen, dass sie auch für Reihen von Funktionen anwendbar sind. Wir wollen das hier aber nicht weiter ausführen. Ein bedeutendes Beispiel für Reihen von Funktionen sind die sogenannten Potenzreihen. 6.7.6 Definition. Sind an ∈ C oder auch nur an ∈ R für n ∈ N ∪ {0}, und ist z ∈ C, so nennt man die komplexwertige Reihe ∞ X an zn n=0 eine Potenzreihen5. Als Konvergenzradius wollen wir die Zahl R ∈ [0, +∞] mit ∞ X n |z| : z ∈ C, R = sup a z ist konvergent n n=0 bezeichnen6. 5 Dabei ist es zunächst unerheblich, ob sie jetzt konvergiert oder nicht. für z = 0 die Reihe immer absolut konvergiert, ist diese Menge nicht leer. 6 Da (6.7) KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 140 6.7.7 Beispiel. sind solchen Reihen schon begegnet, z.B. sind die geometrische Reihe P∞ n P∞ zn n=0 z und die Exponentialreihe n=0 n! Potenzreihen. Erstere konvergiert genau für |z| < 1 und hat somit Konvergenzradius 1. Die Exponentialreihe konvergiert für alle z ∈ C und hat somit Konvergenzradius +∞. P n 6.7.8 Satz. Sei ∞ n=0 an z eine Potenzreihe und R ihr Konvergenzradius. P n (i) Für jedes z ∈ C mit |z| > R ist ∞ n=0 an z divergent. P n (ii) Für jedes z ∈ C mit |z| < R ist ∞ n=0 an z sogar absolut konvergent. Insbesondere ist ∞ X n |z| : z ∈ C, . (6.8) R = sup a z ist absolut konvergent n n=0 P∞ (iii) Für jedes r ∈ [0, R) ist n=0 an zn auf dem abgeschlossenen Kreis Kr (0) = {z ∈ C : |z| ≤ r} absolut und gleichmäßig konvergent. Die Funktion z 7→ ∞ X n=0 an zn , z ∈ Kr (0), ist dabei eine stetige und beschränkte Funktion auf Kr (0). Im C r Re −R R Abbildung 6.7: Konvergenzradius (iv) Auf UR (0) = {z ∈ C : |z| < R} ist z 7→ P∞ n=0 an zn eine stetige Funktion7. (v) Der Konvergenzradius lässt sich auch durch die Koeffizienten an bestimmen. Es gilt 1 1 1 ≤R= . ≤ √n | | lim supn→∞ | aan+1 lim inf | aan+1 lim sup |a | n→∞ n n→∞ n n Beweis. 7 Im Allgemeinen ist sie aber nicht mehr beschränkt 6.7. REELL- UND KOMPLEXWERTIGE FOLGEN UND REIHEN 141 (i) Folgt sofort aus (6.7). (ii) Folgt aus dem nächsten Punkt. P n (iii) Nach (6.7) gibt es ein komplexes z0 mit r < |z0 | ≤ R, sodass ∞ n=0 an z0 konvergiert. n Somit ist die Summandenfolge eine Nullfolge; insbesondere |an z0 | ≤ C, n ∈ N für ein C > 0. Für |z| ≤ r < |z0 | rechnet man n n r z |an zn | = |an zn0 | · ≤ C · . z0 z0 n P ∞ r r Wegen z0 < 1 konvergiert n=0 C z0 . PN Die Partialsummen n=0 an zn , N ∈ N, sind Polynome und damit stetig. Da Kr (0) kompakt ist (vgl. Beispiel 5.2.10), sind diese Partialsummen auf Kr (0) beschränkt. Aus dem Weierstraßschen Kriterium (Korollar 6.7.4) folgt die absolute und somit gleichmäßige Konvergenz unserer Potenzreihe auf Kr (0) gegen eine beschränkte Funktion. Nach Korollar 6.6.13 ist die Grenzfunktion sogar stetig. P (iv) Betrachtet man z 7→ nn=0 an zn auf UR (0), so ist auch dies eine stetige Funktion. In der Tat ist die Stetigkeit eine lokale Eigenschaft (siehe Fakta 6.1.3), und man kann zu jedem komplexen z mit |z| < R ein δ > 0 und ein r ∈ [0, R) finden, sodass Uδ (z) ⊆ Kr (0). (v) Wäre 1 a lim supn→∞ n+1 an > R so wähle z ∈ C mit 1 > |z| > R. lim supn→∞ aan+1 n Wegen (i) divergiert die Potenzreihe. Andererseits folgt an+1 zn+1 an+1 < 1. lim sup = |z| · lim sup an n n→∞ an z n→∞ Nach dem Quotientenkriterium (vgl. Fakta 5.2.6 und Satz 3.8.1) ist unsere Potenzreihe aber konvergent. Also muss 1 ≤ R. lim supn→∞ aan+1 n Analog zeigt man mit dem Wurzelkriterium, dass Wäre 1 a lim inf n→∞ n+1 an 1 √ lim supn→∞ n |an | ≤ R. < R, so wähle wieder z ∈ C mit 1 < |z| < R. lim inf n→∞ aan+1 n Wegen (ii) konvergiert die Potenzreihe. Andererseits sieht man ähnlich wie oben, an+1 zn+1 dass lim inf n→∞ an zn > 1, und mit dem Quotientenkriterium (vgl. Fakta 5.2.6 und Satz 3.8.1) folgt die Divergenz der Potenzreihe. Also muss auch 1 ≥ R. lim inf n→∞ aan+1 n Analog zeigt man mit dem Wurzelkriterium, dass 1 √ lim supn→∞ n |an | ≥ R. 142 KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN ❑ 6.7.9 Beispiel. Das Konvergenzverhalten einer Potenzreihe ist durch den obigen Satz relativ gut abgeklärt. Einzig über die Punkte mit |z| = R, wo R der Konvergenzradius ist, hat man keine Aussage. Es können hier tatsächlich auch alle Fälle eintreten. P ∞ zn P n P∞ zn Betrachte die Potenzreihen ∞ . Alle haben Konvergenzn=0 z , n=0 n und n2 P Pn=0 ∞ zn n radius 1. Jedoch ist ∞ z für |z| = 1 divergent, n=0 n=0 n2 absolut konvergent, und P∞ zn n=0 n (nicht absolut) konvergent außer bei z = 1, wo sie divergiert. 6.7.10 Korollar. Sei f (z) := R > 0. P∞ n=0 an zn eine Potenzreihe und ihr Konvergenzradius sei Verschwinden nicht alle an , so gibt es ein δ ∈ (0, R), sodass f (z) , 0 für z ∈ Uδ (0) \ {0}. P n Sei ∞ n=0 bn z eine weitere Potenzreihen mit Konvergenzradien R̃ > 0. Gibt es eine Menge E ⊆ Umin(R,R̃) (0), die Null als Häufungspunkt hat, und sodass P∞ P∞ n n n=0 an z = n=0 bn z für alle z ∈ E, so folgt an = bn , n ∈ N ∪ {0} und damit R = R̃. Beweis. Sei n0 ∈ N ∪ {0} der erste Index, sodass an0 , 0. Wegen den Rechenregeln P P∞ n n für Reihen konvergiert ∞ n=0 an z genau dann, wenn g(z) = n=0 an+n0 z es tut, wobei im Fall der Konvergenz zn0 g(z) = f (z). Letztere ist also auch eine Potenzreihe mit Konvergenzradius R. Wegen g(0) = an0 , 0 und wegen der Stetigkeit von g auf UR (0) gibt es ein δ ∈ (0, R), sodass |g(z) − g(0)| < |an0 | und somit g(z) , 0 für z ∈ Uδ (0). Also ist auch f (z) , 0 für z ∈ Uδ (0) \ {0}. Um die zweite Aussage zu zeigen betrachte man die Potenzreihe P n h(z) = ∞ n=0 (an − bn )z , die zumindest für |z| < min(R, R̃) konvergiert, und damit einen Konvergenzradius ≥ min(R, R̃) hat. Nach Voraussetzung und den Rechenregeln für Reihen folgt h(z) = 0, z ∈ E. Da 0 ein Häufungspunkt von E ist, widerspricht das aber der ersten Aussage, außer an − bn = 0, n ∈ N. ❑ 6.7.11 Bemerkung. Ist |z| < R, so folgt aus Korollar 3.7.3 ∞ X an (z̄)n = n=0 ∞ X ān zn . (6.9) n=0 P n Wir sehen insbesondere, dass wenn alle an reell sind und z = x ∈ R, auch ∞ n=0 an x ∈ R. P n Ist umgekehrt ∞ n=0 an x ∈ R für alle x ∈ R, |x| < R, so folgt aus (6.9), dass die Potenzreihen (beide mit Konvergenzradius R) ∞ X n=0 an zn , ∞ X ān zn n=0 für z ∈ R ∩ UR (0) übereinstimmen. Aus Korollar 6.7.10 folgt an = ān , also an ∈ R. 6.7. REELL- UND KOMPLEXWERTIGE FOLGEN UND REIHEN 143 6.7.12 Bemerkung. Üblicherweise werden auch Reihen der Form ∞ X n=0 an (z − z0 )n (6.10) für ein festes z0 als Potenzreihen bezeichnet. Die hergeleiteten Aussagen für Potenzreihen stimmen sinngemäß offensichtlich auch für solche Reihen. Dabei ist z.B. der Bereich der Konvergenz UR (z0 ) mit entsprechend definierten Konvergenzradius. Funktionen f : D → C mit offenem D ⊆ C heißen analytisch in einem Punkt z0 ∈ D, falls es eine offene Kugel Ur (z0 ) ⊆ D mit r > 0 und eine Potenzreihe der Form (6.10) gibt, sodass r kleiner oder gleich dem Konvergenzradius der Reihe ist und sodass f (z) für alle z ∈ Ur (z0 ) mit dem Grenzwert der Reihe (6.10) übereinstimmt, f also lokal um z0 als Grenzwert einer Potenzreihe dargestellt werden kann. Ist f um jedes z0 ∈ D analytisch, so heißt f analytisch. 6.7.13 Satz. Sei P(z) = Ist die Zahlenreihe s := P∞ j=0 P∞ a j z j eine Potenzreihe, R ihr Konvergenzradius mit 0 < R < ∞. Weiters sei z0 ∈ C mit |z0 | = R. j j=0 a j z0 konvergent, so gilt lim P(tz0 ) = s. (6.11) t→1− Beweis. Sei |z| < R und sn := n X j a j z0 , s := lim sn . n→∞ j=0 Laut Voraussetzung existiert der Grenzwert s. Aus Lemma 3.8.4 folgt n X a jz j = j=0 ! ! ! ! n n−1 X X z j z j+1 z n z j (a j z0j ) sj ( = sn − − )= z0 z0 z0 z0 j=0 j=0 z z0 Wegen z z0 n !n sn + 1 − ! n−1 !j z z X sj . z0 j=0 z0 sn → 0 konvergiert die Reihe auf der rechten Seite, und wir erhalten P(z) = ∞ X j=0 Andererseits ist folgt aus P∞ j=0 ζj = 1 1−ζ a jz j = 1 − ! ∞ !j z z X sj , |z| < R. z0 j=0 z0 , |ζ| < 1 s= 1− ! ∞ ! z j z X s . z0 j=0 z0 Für |z| < R und N ∈ N folgt ! ! N ∞ z X z j z j z X |P(z) − s| ≤ 1 − |s − s j | |s − s j | + 1 − z0 j=0 z0 z0 j=N+1 z0 Ist nun ǫ > 0 und N fest und so groß, dass |s − s j | < ǫ, j > N, so ist das kleiner oder gleich !j X 1 − z N z0 z 1 − z . |s − s j | +ǫ z0 j=0 z0 1 − z (6.12) z0 Ist z = tz0 , t ∈ (0, 1), so sieht man, dass es ein t0 ∈ (0, 1) gibt, sodass für t > t0 dieser Ausdruck kleiner oder gleich 2ǫ ist. Da ǫ > 0 beliebig war, gilt (6.11). ❑ KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 144 Im C α Re α Abbildung 6.8: Winkelraum Nα 6.7.14 Bemerkung. Mit einer etwas feiner Argumentationsweise läßt sich (6.11) folgendermaßen verallgemeinern. Nähert sich z nichttangentiell dem Punkt z0 an, so konvergiert P(z) gegen s. Das bedeutet: Ist Nα , 0 < α < π der Winkelraum Nα = {reiβ ∈ C : r > 0, β ∈ [−α, α]}, so gilt lim τ∈Nα , τ→0 P((1 − τ)z0 ) = s. (6.13) Um das einzusehen, bemerke man zunächst, dass für τ = reiβ ∈ Nα mit r = |τ| ≤ cos α (für die Funktion cos siehe den nächsten Abschnitt) |τ|(1 + |1 − τ|) 2 2 2 |τ| = ≤ ≤ . ≤ 1 − |1 − τ| 2 cos β − r 2 cos α − r cos α 1 − |(1 − τ)|2 Nun folgt man dem Beweis von Satz 6.7.13 bis (6.12). Dann folgt mit z = (1 − τ)z0 , |τ| ≤ cos α, τ ∈ Nα !j N z X z 2 |s − s j | |P(z) − s| ≤ 1 − . +ǫ z0 j=0 z0 cos α Für |τ| → 0 konvergiert der erste Summand gegen Null. Also gibt es ein t0 ∈ (0, cos α), sodass |P(z) − s| ≤ ǫ cos3 α , wenn nur |τ| ≤ t0 , τ ∈ Nα . Da ǫ beliebig war, folgt (6.13). 6.8 Die Exponentialfunktion Wir wollen jetzt einige der sogenannten elementaren Funktionen betrachten. Grundlage für alle diese ist die Exponentialfunktion exp(z) = ∞ X zn , z ∈ C. n! n=0 (6.14) Wir haben schon gesehen, dass diese Reihe für alle z ∈ C konvergiert. Sie ist also eine Potenzreihe mit Konvergenzradius +∞. Insbesondere ist exp : C → C stetig. Weitere wichtige elementare Funktionen sind sin und cos. 6.8.1 Definition. Für z ∈ C seien cos z = exp(iz) − exp(−iz) exp(iz) + exp(−iz) , sin z = , 2 2i die sogenannten trigonometrischen Funktionen Cosinus und Sinus. Als Zusammensetzung von stetigen Funktionen sind cos : C → C und sin : C → C auf C stetig (siehe Lemma 6.1.6 und Korollar 6.1.8). 6.8. DIE EXPONENTIALFUNKTION 145 6.8.2 Lemma. Für alle z ∈ C gilt cos z = ∞ ∞ X X z2k z2k+1 (−1)k , sin z = . (−1)k (2k)! (2k + 1)! k=0 k=0 Also sind cos und sin Grenzfunktionen obiger Potenzreihe mit Konvergenzradius +∞. Beweis. Für gerade n = 2k gilt in + (−i)n = 2i2k = 2(−1)k , und für ungerade n = 2k + 1 gilt in + (−i)n = 0. Aus den Rechenregeln für Reihen folgt somit z2k exp(iz) + exp(−iz) X in + (−i)n zn X = = . (−1)k 2 2 n! k=0 (2k)! n=0 ∞ ∞ Analog leitet man die Potenzreihenentwicklung für sin her. ❑ 6.8.3 Satz. Sei z, w ∈ C und x, y ∈ R. Dann gilt (i) exp(z) , 0, exp(z + w) = exp(z) exp(w) und exp(−z) = (exp z)n = exp(zn), n ∈ Z. 1 exp(z) . Schließlich ist (ii) exp(iz) = cos z + i sin z. Allgemeiner gilt die Formel von de Moivre: (cos z + i sin z)n = cos(nz) + i sin(nz), n ∈ Z. (iii) exp(z̄) = exp(z), cos(z̄) = cos(z), sin(z̄) = sin(z). Insbesondere sind exp |R , cos |R , sin |R Funktionen, die R nach R abbilden. (iv) cos y = Re exp(iy), sin y = Im exp(iy) und exp(x + iy) = exp(x)(cos y + i sin y), wobei exp(x) ∈ R. Im i exp(x) sin y ( x) exp i exp(iy) = cos y + i sin y i sin y 0 −1 exp(x + iy) = exp(x)(cos y + i sin y) cos y 1 exp(x) cos y Re −i Abbildung 6.9: Darstellung der Lage von exp(x + iy) (v) Die Funktion exp eingeschränkt auf die reelle Achse ist eine streng monoton wachsende bijektive Funktion von R auf R+ mit exp(0) = 1. Insbesondere gilt lim exp(x) = +∞, lim exp(x) = 0. x→+∞ x→−∞ (6.15) KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 146 (vi) | exp(z)| = exp(Re z). Insbesondere gilt | exp(z)| = 1 ⇔ Re z = 0 und (cos y)2 + (sin y)2 = 1. (vii) cos(−z) = cos z und sin(−z) = − sin z. (viii) Es gelten die Summensätze für Sinus und Cosinus cos(z + w) = cos z cos w − sin z sin w, sin(z + w) = sin z cos w + cos z sin w . Beweis. (i) exp(z + w) = exp(z) exp(w) haben wir in Beispiel 3.9.13 gesehen. Die beiden nächsten Aussagen folgen aus exp(−z) · exp(z) = exp(0) = 1. Schließlich folgt (exp z)n = exp(zn), n ∈ N, durch vollständige Induktion, und für n ∈ Z wegen 1 . exp(−zn) = exp(zn) (ii) exp(iz) = cos z + i sin z folgt leicht durch Nachrechnen, und daraus (cos z + i sin z)n = (exp iz)n = exp(inz) = cos(nz) + i sin(nz). (iii) Da die Koeffizienten in den Potenzreihenentwicklungen reell sind, folgt die Aussage sofort aus Bemerkung 6.7.11. (iv) Folgt aus (i) und (ii), da nach dem letzten Punkt exp(x), cos y, sin y ∈ R. (v) Für x > 0 folgt aus der Tatsache, dass alle Koeffizienten in der Potenzreihe (6.14) von exp strikt positiv sind, immer exp(x) > 1 + x > 1. Klarerweise ist exp(0) = 1. 1 Für x < 0 folgt aus (i), dass exp(x) = exp(−x) > 1 − x > 1 und somit exp(x) ∈ 1 (0, 1), exp(x) < 1−x . Aus diesen Abschätzungen schließen wir sofort auf (6.15). Aus x < y ergibt sich wegen exp(y) = exp(x + (y − x)) = exp(x) · exp(y − x) > exp(x) die Tatsache, dass exp(x) streng monoton wachsende ist. Nun ist exp(x) : R → R+ stetig. Somit muss wegen Korollar 6.5.3 exp(R) ein offenes Intervall sein, das wegen (6.15) aber nur (0, +∞) = R+ sein kann. (vi) Aus | exp(z)|2 = exp(z)exp(z) = exp(z) exp(z) = exp(z + z) = exp(2 Re z) = exp(Re z)2 und aus der Tatsache, dass | exp(z)| und exp(Re z) positive reelle Zahlen sind, folgt | exp(z)| = exp(Re z). Weiters gilt (cos y)2 + (sin y)2 = | cos y + i sin y|2 = | exp(iy)|2 = exp(0) = 1. (vii) Folgt aus der jeweiligen Potenzreihenentwicklung, da nur gerade bzw. nur ungerade Potenzen vorkommen. (viii) Man setze die Definition von sin und cos ein und rechne die Gleichheit nach. ❑ + Wie wir unter anderem gerade gesehen haben, ist exp : R → R eine Bijektion. 6.8. DIE EXPONENTIALFUNKTION 147 y 4 3 y = exp(x) 2 1 −3 −2 −1 1 0 2 x 3 −1 Abbildung 6.10: Funktionsgraphen der reellen Exponentialfunktion y y = ln(x) 3 2 1 −1 0 1 2 3 4 5 6 x −1 −2 −3 Abbildung 6.11: Logarithmus naturalis 6.8.4 Definition. Mit ln : R+ → R wollen wir die Inverse von exp : R → R+ bezeichnen und sprechen vom natürlichen Logarithmus bzw. vom Logarithmus naturalis. Aus Satz 6.8.3, Korollar 6.5.3 und durch elementares Nachrechnen folgt sofort 6.8.5 Korollar. Die Funktion ln : R+ → R ist eine stetige und streng monoton wachsende Bijektion. Es gilt lim ln x = −∞, lim ln x = +∞ , x→0+ x→+∞ sowie ln(xy) = ln x + ln y, x, y > 0, ln(xn ) = n ln x, x > 0, n ∈ Z . Beachte, dass wir den Logarithmus nur für reelle Werte definiert haben. Dies ist kein Zufall, will man den Logarithmus auch für komplexe Werte definieren, trifft man auf Schwierigkeiten ganz essentieller Natur (vgl. Vorlesung zur Komplexen Analysis). KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 148 Wir können nun mit Hilfe der Exponentialfunktion die bisher nur für rationale b definierte Ausdrücke ab auch für beliebige b ∈ R definieren. 6.8.6 Korollar. Für a ∈ R+ und b ∈ Q gilt ab = exp(b ln a). Setzen wir ab durch exp(b ln a) auf ganz (a, b) ∈ R+ × R fort, so gilt (a, a1, a2 ∈ R+ , b, b1 , b2 ∈ R) ab1 +b2 = ab1 · ab2 , (a1 a2 )b = ab1 · ab2 . Beweis. Ist b = qp ∈ Q mit p ∈ Z, q ∈ N, so ist exp(b ln a) nach Satz 6.8.3 eine positive reelle Zahl mit der Eigenschaft, dass (exp(b ln a))q = exp(bq ln a) = exp(p ln a) = exp(ln a p ) = a p . . √q Also ist exp(b ln a) = a p . Die Funktionalgleichungen folgen aus denen von exp und ln. ❑ 6.8.7 Bemerkung. Als Zusammensetzung der stetigen Funktionen exp, ln und ·, ist (a, b) 7→ ab auf (a, b) ∈ R+ × R stetig (vgl. Beispiel 6.1.7). Die Funktion exp kann nun selbst mit dieser Notation als allgemeine Potenz angeschrieben werden. Sei dazu e := exp(1), die Eulersche Zahl. Dann gilt nach der Definition der allgemeinen Potenz e x = exp(x ln e) = exp x ln exp(1) = exp(x) . | {z } =1 6.8.8 Bemerkung. Wir haben schon festgestellt, und auch demonstriert, dass die Eulersche Exponentialfunktion eine ganz zentrale Rolle spielt. Daher wird auch die reelle Zahl e ein interessantes Objekt sein. Dazu wollen wir hier bemerken, dass man die P 1 Eulersche Zahl e, neben ihrer Definition als e := exp(1) = ∞ n=0 n! auch in vielfacher Weise anders charakterisieren kann. Zum Beispiel kann man zeigen, dass e = lim 1 + n→∞ z 1 n bzw. ez = lim 1 + n , n→∞ n n gilt. Diese Formel gibt auch Anlass zu alternativen Definitionen der Funktion exp(x), nämlich als e x . Dafür muss man allerdings die allgemeine Potenz zuerst (ohne Verwendung von exp) definieren. Dies kann man so machen, dass man von der Funktion √q a p : R+ ×Q → R+ ausgeht, und diese mittels stetiger Fortsetzung“ zu einer Funktion ” R+ × R → R+ macht. Wie aus der Schule bekannt, ist einer der wichtigsten Naturkonstanten die Zahl π. Mit Hilfe der Funktion cos kann man nun die Existenz dieser Zahl mit all ihren wichtigen Eigenschaften herleiten. 6.8.9 Lemma. Für t ∈ [0, 2] und n ∈ N gilt tn n! ≥ tn+2 (n+2)! . Die Funktion cos : R → R hat eine kleinste positive Nullstelle x0 , die im Intervall (0, 2) liegt. 6.8. DIE EXPONENTIALFUNKTION 149 Für x0 gilt sin x0 = 1. Beweis. Durch Umformen ist die zu beweisende Ungleichung äquivalent zu (n + 2)(n + 1) ≥ t2 , und somit richtig. Wir betrachten die Potenzreihenentwicklung von cos in Lemma 6.8.2 und stellen sofort cos 0 = 1 fest. Da man in Reihen Klammern setzen darf, folgt aus dem letzten Punkt ! ∞ 22 24 24l+4 1 22 24 X 24l+2 ≤1− + − − + =− . cos 2 = 1 − 2 4! l=1 (4l + 2)! (4l + 4)! 2 4! 3 Nach dem Zwischenwertsatz Korollar 6.2.6 hat t 7→ cos t im Intervall (0, 2) sicher eine Nullstelle x. Nun ist nach Proposition 6.1.10 die Menge {t ∈ R : cos t , 0} = cos−1 (R \ {0}) als Urbild einer offenen Menge unter einer stetigen Funktion selber offen. Somit ist ihr Komplement N = {t ∈ R : cos t = 0} und daher auch N ∩ [0, +∞) abgeschlossen. In Beispiel 5.1.14 haben wir gesehen, dass N ∩ [0, +∞) ein Minimum hat, welches wegen cos 0 = 1 sicher nicht 0 ist. Also gibt es eine kleinste positive Nullstelle x0 von t 7→ cos t. Aus Satz 6.8.3 folgt wissen wir (cos x0 )2 + (sin x0 )2 = 1, und daher (sin x0 )2 = 1. Nun ist aber wegen dem ersten Punkt sin x0 = und somit sin x0 = 1. ∞ X x4l+3 x4l+1 0 ≥ 0, 0 − (4l + 1)! (4l + 3)! l=0 ❑ 6.8.10 Definition. Die Zahl π sei jene positive reelle Zahl, sodass tive Nullstelle von cos : R → R ist. π 2 y die kleinste posi- y = sin(x) y = cos(x) 1 −2π − 3π 2 −π − π2 0 −1 π 2 π 3π 2 2π Abbildung 6.12: Funktionsgraphen des reellen Sinus und Cosinus x KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 150 6.8.11 Satz. (i) exp(±i π2 ) = ±i, exp(±iπ) = −1, exp(±2iπ) = 1. (ii) cos(± π2 ) = 0, cos(±π) = −1, cos(±2π) = 1, sin(± π2 ) = ±1, sin(±π) = 0, sin(±2π) = 0. (iii) exp(z + 2kπi) = exp(z), sin(z + 2kπ) = sin(z), cos(z + 2kπ) = cos(z), z ∈ C, k ∈ Z. . (iv) exp(z) = 1 ⇐⇒ ∃k ∈ Z : z = 2kπi (⇔ z ∈ 2πiZ). (v) cos z = 0 ⇔ ∃k ∈ Z : z = π 2 + πk, und sin z = 0 ⇔ ∃k ∈ Z : z = πk. (vi) Es gilt exp(C) = C \ {0}, wobei exp(z) = exp(ζ) ⇔ z − ζ ∈ 2πiZ. Beweis. (i) Wegen Satz 6.8.3 und Lemma 6.8.9 gilt exp(i π2 ) = cos π2 + i sin π2 = i. Der Rest folgt aus Satz 6.8.3, (i). (ii) Folgt aus (i), indem man Real- und Imaginärteil betrachtet. (iii) exp(z + 2kπi) = exp(z) · exp(2πi)k = exp(z). Daraus folgen durch Einsetzen von Definition 6.8.1 die restlichen Aussagen. (iv) Sei exp(z) = 1 gegeben. Aus Satz 6.8.3 wissen wir, dass damit Re z = 0. Klarerweise ist y = η + 2lπi für ein l ∈ Z und η ∈ [0, 2π). Aus (iii) folgt exp(iη) = exp(iy) = 1. Angenommen η , 0. Schreibe η η η exp(i ) = cos + i sin =: u + iv mit u, v ∈ R . 4 4 4 Dabei ist wegen 0 < η4 < π2 , und der Definition von π2 , sicherlich u , 0. Im Fall v = 0 wäre exp(i η4 ) = u = ±1 und somit exp(i π2 ) i π η exp(i( − )) = = ±i.. η = 2 4 ±1 exp( 4 ) Also ist x1 = π2 − 4η eine Nullstelle von cos t mit x1 ∈ (0, π2 ) im Widerspruch zur Definition von π2 . Also muss v , 0. Klarerweise gilt auch 1 = exp(iη) = (u + iv)4 = u4 − 6u2 v2 + v4 + i 4uv(u2 − v2 ) . Die rechte Zahl ist genau dann reell, wenn u2 − v2 = 0. Wegen u2 + v2 = 1 ist das äquivalent zu u2 = v2 = 12 . Dann ist aber u4 − 6u2 v2 + v4 = −1 , 1. (v) Es ist cos z = 0 genau dann, wenn exp(iz) = − exp(−iz) = exp(iπ − iz), also wenn exp(2iz − iπ) = 1. Dieses tritt genau dann ein, wenn 2iz−iπ 2πi ∈ Z, d.h. wenn z ∈ π2 + πZ. Analog bestimmt man die Nullstellen des Sinus. (vi) Sei w ∈ C, w , 0, gegeben. Da exp(x) eine Bijektion von R auf R+ ist, gibt es ein w x ∈ R mit exp(x) = |w|. Schreibe exp x = u + iv mit u, v ∈ R. Klarerweise ist u2 + v2 = 1. Insbesondere gilt u ∈ [−1, 1]. Wegen cos 0 = 1 und cos π = −1 gibt es nach dem Zwischenwertsatz (Korollar 6.2.6) gibt es eine t ∈ [0, π] mit u = cos t. 6.8. DIE EXPONENTIALFUNKTION 151 Aus u2 + v2 = 1 = (cos t)2 + (sin t)2 folgt v2 = (sin t)2 . Ist v = sin t, so setze y = t. Sonst muss v = − sin t, und dann setze man y = −t. In jedem Falle ist cos y = u und sin y = v und somit w = exp(x)(cos y + i sin y) = exp(x + iy). Ist exp(z) = exp(ζ), so folgt 1 = exp(z − ζ), also z − ζ ∈ 2πiZ. ❑ Jede komplexe Zahl w , 0 lässt sich gemäß Satz 6.8.11 als exp(z) schreiben. Wählt man z so, dass 0 ≤ Im z < 2π, so ist nach Satz 6.8.11, (v), z eindeutig bestimmt. Also ist exp : R × [0, 2π) → C \ {0} bijektiv. Im w Im z exp(1 + 12 πi) = ie −1 +2πi 2πi 1 +2πi −1 +23 πi 3 2 πi 1 +23 πi exp(z) = w exp( 21 πi) = i √1 (1 2 exp(1 + πi) = −e e = exp(1) 0 −1 +πi πi 1 +πi −1 +21 πi 1 2 πi 1 +21 πi + i) = exp( 41 πi) exp(πi) = −1 1 = exp(0) = exp(2πi) Re w exp( 32 πi) = −i 1 4 πi −1 0 1 exp(1 + 32 πi) = −ie Re z Abbildung 6.13: Exponentialfunktion als Abbildung von C auf C \ {0} 6.8.12 Definition. Setzt man r = exp(Re z) und t = Im z, so erhält man w = r(cos t + i sin t). Also ist (r, t) 7→ w eine Bijektion von T : R+ × [0, 2π) → C \ {0}. (r, t) heißen dabei die Polarkoordinaten von w. 6.8.13 Bemerkung. Wegen Satz 6.8.11, (iii), kann dabei auch das Intervall [0, 2π) durch irgendein halboffenes Intervall der Länge 2π, z.B. (−π, π], ersetzen. Offensichtlich ist T : R+ × [0, 2π) → C \ {0} als Zusammensetzung von stetigen Funktionen selbst stetig. Die Umkehrung ist nicht stetig: Es gilt limn→∞ exp(−i n1 ) = 1, aber 1 1 lim T −1 (exp(−i )) = lim (1, 2π − ) = (1, 2π) , (1, 0) = T −1 (1). n→∞ n n n→∞ Nimmt man statt [0, 2π) z.B. das Intervall [a, a + 2π), so treten entsprechende Probleme beim Winkel a auf. KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 152 Nimmt man den kritischen Winkel aus, so sind die Polarkoordinaten in beide Richtungen stetig. 6.8.14 Proposition. Die Abbildung T : R+ × (a, a + 2π) → C \ {r exp(ia) : r ∈ [0, +∞)} ist bijektiv, und T und T −1 sind stetig. Beweis. Es bleibt die Stetigkeit von T −1 : D := C \ {r exp(ia) : r ∈ [0, +∞)} → R+ × (a, a + 2π) zu zeigen. Dazu sei limn→∞ zn = z ∈ D für eine Folge aus D. Somit können wir zn = rn exp(iαn ), n ∈ N, z = r exp(iα), mit rn , r ∈ (0, +∞) und αn , α ∈ (a, a + 2π) schreiben. Wegen rn = |zn |, r = |z| folgt rn → r. Ist (αn(k) )k∈N eine Teilfolge, so hat diese wegen der Kompaktheit von [a, a + 2π] eine gegen ein β ∈ [a, a + 2π] konvergente Teilfolge (αn(k(l)) )l∈N . Somit wäre wegen der Stetigkeit von T exp(iβ) = lim exp(iαn(k(l)) ) = lim l→∞ l→∞ zn(k(l)) z = = exp(iα), rn(k(l)) r und nach Satz 6.8.11 β − α ∈ 2πZ. Also folgt α = β und nach Bemerkung 3.2.11 gilt αn → α. ❑ 6.8.15 Bemerkung. Wir sehen nun auch, dass es für n ∈ N immer n viele n-te Wurzeln einer jeder Zahl w ∈ C \ {0} gibt: Ist w = r(cos t + i sin t), (r, t) ∈ R+ × [0, 2π), so sind ( j = 0, . . . , n − 1) ! √n t + 2 jπ t + 2 jπ + i sin η j = r · cos n n komplexe Zahlen, die wegen der Formel von de Moivre alle ηnj = w erfüllen. 6.9 Fundamentalsatz der Algebra Als Anwendung der bisher entwickelten Stetigkeitstheorie wollen wir den Fundamentalsatz der Algebra beweisen. Zunächst benötigen wir ein Lemma. 6.9.1 Lemma. Ist f (z) = an zn + . . . + a0 , an , 0 ein komplexes Polynom, so hat | f (z)| ein Minimum, d.h. es gibt eine Zahl c ∈ C mit | f (c)| ≤ | f (z)| für alle z ∈ C. Beweis. Wir haben in Beispiel 5.3.18 gesehen, dass lim|z|→∞ |an zn + . . . + a0 | = +∞. Insbesondere gibt es eine Zahl R > 0, sodass | f (z)| ≥ |a0 | = | f (0)|, z ∈ C mit |z| > R. Die Kreisscheibe K := {z ∈ C : |z| ≤ R} ist kompakt, und | f (z)| ist, als Zusammensetzung der stetigen Funktionen f und |.|, stetig auf K. Daher wird ein Minimum angenommen, minz∈K | f (z)| = | f (c)| (≤ | f (0)|). Unsere Wahl von R sichert, dass | f (c)| = minz∈C | f (z)|. ❑ 6.9.2 Satz (Fundamentalsatz der Algebra). Sei p(z) = a0 + · · · + an zn ein komplexes Polynom vom Grad n. Dann existieren n (nicht notwendig verschiedene) Zahlen z1 , . . . , zn ∈ C, sodass n Y (z − zk ). (6.16) p(z) = an k=1 Beweis. 6.9. FUNDAMENTALSATZ DER ALGEBRA 153 Sei h(z) ein Polynom der Form h(z) = 1 + bzk + zk g(z) mit k ∈ N, b ∈ C \ {0} und einem Polynom g, wobei g(0) = 0. Wir zeigen die Existenz eines u ∈ C mit |h(u)| < 1. Dazu wählen wir eine k-te Wurzel von − b1 (vgl. Bemerkung 6.8.15), d.h. eine Zahl d ∈ C mit bd k = −1. Für t ∈ (0, 1] gilt |h(td)| ≤ |1 − tk | + |tk dk g(td)| = 1 − tk + tk |dk g(td)|. Da |dk g(td)| = 0 für t = 0, folgt aus der Stetigkeit dieses Ausdruckes bei 0, dass |dk g(td)| ≤ 12 für t ∈ (0, δ) mit einem δ > 0. Für jedes solche t gilt |h(td)| ≤ 1 − 12 tk < 1. Nun zeigen wir, dass jedes nichtkonstante Polynom f (z) eine Nullstelle in C hat. Nach Lemma 6.9.1 gibt es ein c ∈ C, sodass | f (c)| = minz∈C | f (z)| (siehe Lemma 6.9.1). Wäre f (c) , 0, so betrachte h(z) := f (z + c) = 1 + bk zk + bk+1 zk+1 + . . . + bn zn , bk , 0. f (c) Nach dem ersten Beweisschritt existiert ein u ∈ C mit |h(u)| < 1 und daher | f (u + c)| = |h(u)| · | f (c)| < | f (c)| im Widerspruch zu | f (c)| = minz∈C | f (z)|. Wir zeigen nun (6.16) durch Induktion nach dem Grad von p(z). Ist der Grad eins, also p(z) = a1 z + a0 mit a1 , 0, so ist p(z) = a1 (z − (− aa10 )). Stimme nun (6.16) für alle Polynome vom Grad kleiner als n, sei p(z) vom Grad n. Nach dem vorigen Beweisschritt hat p eine Nullstelle z1 . Mittels Polynomdivision und Einsetzen von z = z1 erhält man p(z) = s(z)(z − z1 ). Das Polynom s hat den gleichen Führungskoeffizienten wie p, und lässt sich nach Induktionsvoraussetzung in der angegebenen Weise faktorisieren. ❑ 6.9.3 Bemerkung. Funktionen f : R → C der Bauart f (t) = N X cn exp(itn), n=−N für ein N ∈ N und cn ∈ C, n = 0, . . . , N nennt man trigonometrische Polynome. Man sieht sofort, dass f (t) = exp(iNt) · p(exp(it)), wobei p : C \ {0} → C p(z) = 2N X cn−N zn . n=0 Also ist f stetig und 2π-periodisch. Weiters stimmen zwei trigonometrische Polynome überein, wenn das ihre Koeffizienten tun. Ist nämlich M N X X dn exp(itn), cn exp(itn) = n=−N n=−M PN wobei o.B.d.A. N ≥ M, so folgt n=−N (cn − dn ) exp(itn) = 0, wobei wir b j = 0, M < j ≤ N setzten. Es folgt P n q(exp(it)) = 0, t ∈ R, mit q(z) = 2N n=0 (cn−N − dn−N )z . Also hat das Polynom q(z) unendlich viele Nullstellen und ist damit das Nullpolynom, d.h. cn = dn , n = −N, . . . , N. KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 154 Schließlich lässt sich jedes trigonometrische Polynom wegen N X cn exp(itn) = n=−N N X cn (cos nt + i sin nt) = c0 + n=−N N X (cn + c−n ) cos nt + N X bn sin nt, n=1 in der Form a0 + N X an cos nt + N X n=1 (cn − ic−n ) sin nt, (6.17) n=1 n=1 schreiben. Umgekehrt lässt sich jede Funktion der Bauart (6.17) schreiben als a0 + N X an n=1 N −1 N X X exp(int) + exp(−int) X exp(int) − exp(−int) a−n + ib−n an − ibn bn + = exp(itn) + a0 + exp(itn). 2 2i 2 2 n=−N n=1 n=1 Somit ist (6.17) eine zweite Art trigonometrische Polynome darzustellen, wobei die Koeffizienten in (6.17) ebenfalls eindeutig sind. 6.10 Weitere wichtige elementare Funktionen Die Funktion π sin x tan : R \ { + πn : n ∈ Z} → R, tan(x) = , 2 cos x wird als Tangens und cot : R \ {πn : n ∈ Z} → R, cot(x) = cos x , sin x als Cotangens bezeichnet. y y = tan(x) y = cot(x) − 3π 2 −2π −π 3π 2 π 2 − π2 0 π 2π x Abbildung 6.14: Tangens und Cotangens Betrachtet man tan eingeschränkt auf (− π2 , π2 ), so zeigt man elementar, dass tan dieses Intervall bijektiv auf R abbildet. Entsprechend bildet cot das Intervall (0, π) bijektiv auf R ab. Die jeweiligen Umkehrfunktionen heißen arctan (Arcustangens) bzw. arccot (Arcuscotangens). Man kann auch sin auf das Intervall [− π2 , π2 ] einschränken, und erhält eine Bijektion von [− 2π , π2 ] auf [−1, 1]. Die Umkehrfunktion davon heißt arcsin (Arcussinus). Entsprechend bildet cos das Intervall [0, π] bijektiv auf [−1, 1] ab. Die Umkehrfunktion davon heißt arccos (Arcuscosinus). 6.10. WEITERE WICHTIGE ELEMENTARE FUNKTIONEN 155 y y = arctan(x) y = arccot(x) π π 2 −π −2π π 0 2π x − π2 Abbildung 6.15: Arcustangens und Arcuscotangens y y = arcsin(x) y = arccos(x) π π 2 −2 −1 0 1 2 x − π2 Abbildung 6.16: Arcussinus und Arcuscosinus Ähnlich wie sin und cos sind Sinus Hyperbolicus sinh und Cosinus Hyperbolicus cosh defininiert: cosh z := exp(z) + exp(−z) exp(z) − exp(−z) , sinh z := , z ∈ C. 2 2 Die Werte von cosh z und sinh z liegen im allgemeinen in C. Für reelle z = x liegen cosh x und sinh x offensichtlich in R. Da sinh : R → R bijektiv ist, hat er eine Inverse die mit areasinh (Areasinus Hyperbolicus) bezeichnet wird. Die Funktion cosh eingeschränkt auf [0, +∞) bildet dieses Intervall bijektiv auf [1, +∞) ab. Die entsprechende Umkehrfunktion von [1, +∞) auf [0, +∞) heißt areacosh (Areacosinus Hyperbolicus). KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 156 y 4 3 y = sinh(x) y = cosh(x) 2 1 −3 −2 −1 −1 0 1 2 x 3 −2 −3 −4 Abbildung 6.17: Sinus Hyperbolicus und Cosinus Hyperbolicus y y = areasinh(x) y = areacosh(x) 3 2 1 −6 −5 −4 −3 −2 −1 −1 0 1 2 3 4 5 6 x −2 −3 Abbildung 6.18: Areasinus Hyperbolicus und Areacosinus Hyperbolicus sinh x Schließlich ist tanh : R → R definiert durch tanh x = cosh x , und coth : R \ {0} → R x durch coth x = cosh . sinh x Dabei bildet tanh die reellen Zahlen bijektiv auf (−1, 1) und coth die Menge R \ {0} bijektiv auf R \ [−1, 1]. Die entsprechenden Umkehrfunktion heißen areatanh (Areatangens Hyperbolicus) und areacoth (Areacotangens Hyperbolicus). 6.10. WEITERE WICHTIGE ELEMENTARE FUNKTIONEN 157 y y = tanh(x) y = coth(x) 1 −2 −1 1 0 x 2 −1 Abbildung 6.19: Tangens Hyperbolicus und Cotangens Hyperbolicus y y = areatanh(x) y = areacoth(x) 2 1 −6 −4 −2 0 2 4 6 x −1 −2 Abbildung 6.20: Areatangens Hyperbolicus und Areacotangens Hyperbolicus 158 KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN Kapitel 7 Differentialrechnung Bewegt sich etwa ein Punkt, und bezeichnet s(t) den zum Zeitpunkt t zurückgelegten Weg, so erhält man die Geschwindigkeit zum Zeitpunkt t, indem man s(t + h) − s(t) h betrachtet, und h immer kleiner macht. Um derlei Betrachtungen, die in den Naturwissenschaften eine wichtige Rolle spielen, einen mathematisch exakten Hintergrund zu geben, wollen wir den Begriff der Ableitung einführen. 7.1 Begriff der Ableitung 7.1.1 Definition. Sei f : (a, b) → R (C) und sei x ∈ (a, b). Dann heißt f differenzierbar im Punkt x, falls der Grenzwert lim t→x f (t) − f (x) ∈ R (C) t−x existiert. Dieser heißt dann die Ableitung von f an der Stelle x, und man schreibt dafür f ′ (x) oder ddtf (x). Ist f zumindest auf [a, b) definiert1 , und existiert lim t→a+ f (t) − f (a) ∈ R (C), t−a so spricht man von rechtsseitiger Differenzierbarkeit im Punkt a und schreibt f ′ (a)+ dafür. Entsprechend definiert man die linksseitige Differenzierbarkeit im Punkt b und die linksseitige Ableitung f ′ (b)− . Anschaulich ist die Ableitung f ′ (x) gerade die Steigung der Tangente (in der folgenden Grafik als durchgehende Gerade gezeichnet) am Punkt (x, f (x)). Diese Steigung der Tangente erhält man als Grenzwert der Steigungen der Verbindungsgeraden von (x, f (x)) und (t, f (t)) (als strichlierte Gerade gezeichnet) für t → x. 7.1.2 Fakta. 1 Klarerweise könnte f sogar auf einer noch größeren Menge definiert sein. 159 KAPITEL 7. DIFFERENTIALRECHNUNG 160 f Steigung = f (t)− f (x) t−x Steigung = f ′ (x) t′′ x t′ t Abbildung 7.1: Ableitung als Grenzwert der Differenzenquotienten 1. Wie in Fakta 5.3.14 bemerkt, existiert ein Grenzwert limt→x h(t) genau dann, wenn die beiden einseitigen Grenzwerte limt→x− h(t) und limt→x+ h(t) existieren und übereinstimmen. Also ist f bei x ∈ (a, b) genau dann differenzierbar, wenn f bei x links- und rechtsseitig differenzierbar ist und f ′ (x)− und f ′ (x)+ übereinstimmen. In diesem Fall ist f ′ (x)− = f ′ (x) = f ′ (x)+ . 2. Da nach Lemma 5.3.8 genau dann y = limt→x h(t), wenn für jede gegen x konvergente Folge (tn )n∈N mit tn , x, n ∈ N, folgt, dass h(tn ) → y, ist f bei x genau dann differenzierbar mit Ableitung f ′ (x), wenn für jede solche Folge f ′ (x) = lim n→∞ f (tn ) − f (x) . tn − x Entsprechend lassen sich die einseitigen Ableitungen charakterisieren. 3. Entweder aus der letzten Behauptung oder aus (5.3) folgt, dass die Ableitung f ′ (x) im Falle ihrer Existenz nur vom Aussehen von f lokal bei x, also von f |(x−δ,x+δ) für jedes δ > 0, abhängt. 4. Wegen (5.10) ist eine Funktion f : (a, b) → C genau dann differenzierbar bei x ∈ (a, b), wenn Re f, Im f : (a, b) → R es sind, wobei f ′ (x) = (Re f )′ (x) + i(Im f )′ (x). (7.1) Analog kann man die Differenzierbarkeit von R p -wertigen Funktionen f auf (a, b) definieren. Dabei wird es sich herausstellen, dass dass solche Funktionen genau dann differenzierbar sind, wenn alle Komponentenfunktionen π j ◦ f : (a, b) → R differenzierbar sind. Siehe die Analysis 2 Vorlesung. 7.1. BEGRIFF DER ABLEITUNG 161 7.1.3 Bemerkung. Ist f definiert auf einer offenen Teilmenge der komplexen Zahlen f (w) und bildet wieder in C hinein ab, so kann man analog f ′ (w) := limz→w f (z)− bez−w trachten. Existiert dieser Grenzwert, so heißt f in w komplex differenzierbar. Wir wollen das hier aber nicht weiter verfolgen, denn dies führt zur Theorie der komplexen Analysis, die in einer eigenen Vorlesung behandelt wird. 7.1.4 Beispiel. (i) Für jedes λ ∈ R (C) ist die konstante Funktion f (t) = λ, t ∈ (−∞, +∞), an jeder Stelle x differenzierbar, und ihre Ableitung im Punkt x ist gleich 0. (ii) Die reellwertige Funktion t 7→ f (t) = tn , n ∈ N für t ∈ (−∞, +∞) ist auch an jedem Punkt x differenzierbar mit der Ableitung lim t→x (t − x)(tn−1 + tn−2 x + . . . + txn−2 + tn−1 ) t n − xn = lim = nxn−1 . t→x t−x t−x (iii) Die stetige Funktion t sin 1t , f (t) = 0, t,0 t=0 (7.2) ist im Punkt x = 0 nicht differenzierbar. Denn es gilt t sin 1t − 0 f (t) − f (0) 1 = = sin . t−0 t−0 t P n (iv) Sei f (z) = ∞ n=0 an z eine Potenzreihe mit Konvergenzradius R > 0. Für f |(−R,R) : (−R, R) → C gilt ∞ X f (t) − f (0) = lim an tn−1 . lim t→0 t→0 t n=1 P n Diese Potenzreihe rechts konvergiert genau dann, wenn ∞ n=0 an t es tut und hat somit auch Konvergenzradius R. Sie ist daher stetig in t. Also ist obiger Limes gleich a1 . Später werden wir f ′ (x) für alle x ∈ (−R, R) berechnen. (v) Für ein festes w ∈ C gilt lim t→x exp(w(t − x)) − 1 exp(wt) − exp(wx) = exp(wx) lim = t→x t−x t−x exp(wτ) − 1 = w exp(wx), τ wobei die letzte Gleichheit aus (iv) folgt, da der Koeffizient a1 in der Potenzreihe P wn n exp(wτ) = ∞ n=0 n! τ eben w ist. exp(wx) lim τ→0 Setzt man w = 1, so folgt exp′ (x) = exp(x). (vi) Als weitere Anwendung der Rechnung im letzten Beispiel berechnen wir Im exp(it) − Im exp(ix) sin(it) − sin(ix) = lim = t→x t−x t−x ! exp(it) − exp(ix) = Im(i exp(ix)) = Re(exp(ix)) = cos(x). Im lim t→x t−x sin′ (x) = lim t→x Dabei haben wir die Stetigkeit von z 7→ Im z verwendet. Genauso erhält man cos′ (x) = − sin(x). KAPITEL 7. DIFFERENTIALRECHNUNG 162 (vii) Für t ∈ R betrachte die Funktion f t2 t2 sin 1t , f (t) = 0 , t,0 t=0 f (t) −t2 Die Funktion f ist an der Stelle x = 0 differenzierbar mit Ableitung 0, denn es gilt f (t) − f (0) 1 = t sin → 0 für t → 0. t−0 t An einer Stelle x , 0 ist f differenzierbar und es gilt wie wir später sehen werden f ′ (x) = 2x sin 1 1 − cos . x x 7.1.5 Lemma. Ist f im Punkt x differenzierbar, so ist sie dort stetig. Beweis. Aus limt→x f (t)− f (x) t−x = α folgt # " f (t) − f (x) (t − x) = α · 0 = 0. lim f (t) − f (x) = lim t→x t→x t−x ❑ 7.1.6 Bemerkung. Wie man am Beispiel der Funktion f aus (7.2) sieht, gilt die Umkehrung von Lemma 7.1.5 nicht. 7.1.7 Satz. Seien f, g : (a, b) → R (C) beide differenzierbar im Punkt x ∈ (a, b), und α, β ∈ R (C). Dann sind auch α f + βg, f g und (falls g(x) , 0) gf an der Stelle x differenzierbar, und es gilt (α f + βg)′ (x) = α f ′ (x) + βg′ (x), ( f g)′ (x) = f ′ (x)g(x) + f (x)g′ (x) (Produktregel), ′ ′ f (x)g′ (x) (Quotientenregel). gf (x) = f (x)g(x)− g(x)2 Entsprechende Regeln gelten auch für einseitige Ableitungen. Beweis. lim t→x (α f + βg)(t) − (α f + βg)(x) f (t) − f (x) g(t) − g(x) = α lim + β lim . t→x t→x t−x t−x t−x Da f nach Lemma 7.1.5 bei x stetig ist, folgt aus den Rechenregeln für Grenzwerte (vgl. Abschnitt 5.3) ! ! f (t) − f (x) g(t) − g(x) f (t)g(t) − f (x)g(x) + lim = lim f (t) g(x) = lim t→x t→x t→x t−x t−x t−x 7.1. BEGRIFF DER ABLEITUNG 163 f (t) − f (x) g(t) − g(x) + g(x) lim = f (x)g′ (x) + f ′ (x)g(x). t→x t→x t→x t−x t−x Die letzte Quotientenregel folgt ebenfalls aus der Stetigkeit und den Rechenregeln für Grenzwerte indem man in f (x) f (t) " # f (t) − f (x) 1 g(t) − g(x) g(t) − g(x) g(x) . = − f (x) t−x g(t)g(x) t−x t−x lim f (t) · lim t → x streben lässt. ❑ 7.1.8 Beispiel. Wir haben schon gesehen, dass f (t) = tn für alle n ∈ N differenzierbar ist mit f ′ (x) = nxn−1 . Um das auch für n ∈ −N zu zeigen verwende man die Quotientenregel: !′ 1 (x|n| )′ n ′ (x ) = |n| = − 2|n| = nx|n|−1−2|n| = nxn−1 . x x Weiters ist eine rationale Funktion in jedem Punkt, wo der Nenner nicht verschwindet, differenzierbar. 7.1.9 Satz (Kettenregel). Sei f : (a, b) → R reellwertig und g : (c, d) → R (C), sodass f (a, b) ⊆ (c, d), und x ∈ (a, b). Ist f bei x und g bei f (x) differenzierbar, so ist g ◦ f bei x differenzierbar, wobei (g ◦ f )′ (x) = g′ ( f (x)) · f ′ (x). Beweis. Es zu zeigen, dass (g ◦ f )(tn ) − (g ◦ f )(x) → g′ ( f (x)) · f ′ (x) tn − x (7.3) für jede gegen x konvergente Folge (tn )n∈N aus (a, b) \ {x}. Wir unterscheiden dabei für die Menge M = {n ∈ N : f (tn ) = f (x)} zwei Fälle. Ist M endlich, so folgt für n ≥ max(M) (g ◦ f )(tn ) − (g ◦ f )(x) g( f (tn )) − g( f (x)) f (tn ) − f (x) = · → g′ ( f (x)) · f ′ (x). tn − x f (tn ) − f (x) tn − x Ist dagegen M unendlich, so gilt für diese unendlich vielen n ∈ M, f (tntn)−−xf (x) = 0 und g( f (tn )) = g( f (x)). Somit gilt f ′ (x) = 0 und ( g( f (tn ))−g( f (x)) f (tn )− f (x) (g ◦ f )(tn ) − (g ◦ f )(x) · tn −x , n < M f (tn )− f (x) . = tn − x 0, n∈M Wegen der Stetigkeit von f bei x gilt f (tn ) → f (x). Damit ist obiger Differenzenquotient beliebig nahe bei 0, wenn nur n hinreichend groß ist. Es folgt (7.3). ❑ 7.1.10 Bemerkung. Es gelten diverse einseitige Varianten von Satz 7.1.9, deren Beweise fast gleich verlaufen: Ist f : (a, b) → (c, d], g : (c, d] → R (C), x ∈ (a, b), f (x) = d sowie f bei x differenzierbar und g bei f (x) = d linksseitig differenzierbar, so folgt (g ◦ f )′ (x) = g′ ( f (x))− · f ′ (x). KAPITEL 7. DIFFERENTIALRECHNUNG 164 Ist f : [a, b) → (c, d), g : (c, d) → R (C), sowie f bei a rechtsseitig differenzierbar und g bei f (a) differenzierbar, so folgt (g ◦ f )′ (a)+ = g′ ( f (a)) · f ′ (a)+ . usw. . 7.1.11 Beispiel. Sei f (x) = x2 sin 1x , x , 0 wie in Beispiel 7.1.4, (vii). Durch Anwendung der Produkt und der Kettenregel ergibt sich (x , 0) !′ ! !′ 1 1 1 1 1 1 1 f ′ (x) = (x2 )′ sin + x2 sin = 2x · sin + x2 · cos = 2x · sin − cos . · x x x x x x x 7.1.12 Satz. Sei f : (a, b) → (c, d) bijektiv und streng monoton, und bezeichne mit g : (c, d) → (a, b) ihre Umkehrfunktion. Ist f an einer Stelle x differenzierbar und gilt f ′ (x) , 0, so ist g an der Stelle f (x) differenzierbar, und es gilt g′ ( f (x)) = 1 . f ′ (x) Beweis. Wegen Korollar 6.5.3 sind f und g beide stetig. Ist daher (tn )N eine gegen f (x) konvergente Folge aus (c, d) \ { f (x)}, so ist g(tn ) N eine gegen x = g( f (x)) konvergente Folge aus (a, b) \ {x}. Mit τn := g(tn ) folgt lim n→∞ g(tn ) − x 1 1 g(tn ) − g( f (x)) = lim = ′ . = f (τ )− f (x) n n→∞ tn − f (x) f (x) f g(tn ) − f (x) limn→∞ τn −x ❑ Auch bei obigem Satz gelten entsprechende Aussagen für einseitige Ableitungen, wenn f und damit auch g an einem/beiden der Ränder definiert ist. 7.1.13 Beispiel. Betrachte die Funktion exp(t) : R → R+ . Diese ist stetig und bijektiv. Ihre Umkehrfunktion ist ln(u) : R+ → R. Es folgt (y = exp(x)) ln′ (y) = ln′ ( f (x)) = 1 1 1 1 = = = . exp′ (x) exp(x) exp(ln(y)) y 7.1.14 Definition. Sei f eine reell- oder komplexwertige Funktion definiert auf einem Intervall I ⊆ R. Ist f an allen x ∈ I differenzierbar, wobei im Falle, dass x der linke bzw. rechte Intervallrand von I ist und dieser in I liegt, die rechts- bzw. linksseitige Differenzierbarkeit gemeint ist, so nennt man die Funktion ( I → R (C) ′ f : x 7→ f ′ (x) Ableitung von f auf I. Ist x der linke bzw. rechte Intervallrand von I und liegt dieser in I, so ist unter f ′ (x) die rechts- bzw. linksseitige Ableitung an der Stelle x zu verstehen. Einer Funktion f wird also eine weitere Funktion zugeordnet, die die aus f abgeleitete Funktion f ′ genannt wird. Ihr Wert an einer Stelle x ist gerade der Limes des Differenzenquotienten von f bei x. Diese Sichtweise erklärt auch die Schreibweise f ′ (x) aus Definition 7.1.1. Die Schreibweise ddtf (x) erklärt sich aus der Interpretation der Ableitung als Grenzfall des Zuwachses von f dividiert durch den Zuwachs von t. Es ist also sinnvoll von Eigenschaften der Funktion f ′ , wie zum Beispiel Stetigkeit oder auch wieder Differenzierbarkeit zu sprechen. Wie wir in Beispiel 7.1.4, (vii), gesehen haben, muss die Ableitung f ′ nicht notwendigerweise stetig sein. 7.2. MITTELWERTSÄTZE 165 7.1.15 Definition. Sei f eine reell- oder komplexwertige Funktion definiert auf einem Intervall I ⊆ R, sodass die Ableitung f ′ von f auf ganz I existiert. Ist die Ableitung f ′ an einer Stelle x differenzierbar, so bezeichnet man ( f ′ )′ (x) mit f ′′ (x) und spricht von der zweiten Ableitung von f an der Stelle x. Im Falle, dass x Intervallrand ist, so sei wieder die entsprechende einseitige Ableitung gemeint. Allgemeiner definiert man höhere Ableitungen rekursiv durch f (n) (x) := ( f (n−1) )′ (x), n ∈ N, wann immer f (n−1) auf I definiert ist und bei x differenzierbar ist. Man sagt dann, dass f bei x n-mal differenzierbar ist. Existiert f (n) an allen Stellen x ∈ I und ist f (n) stetig auf (a, b), so spricht man von einer n-mal stetig differenzierbaren Funktion. Die Menge aller n-mal stetig differenzierbaren Funktionen auf I wird mit Cn (I) bezeichnet. Mit f ∈ C∞ (I) wollen wir zum Ausdruck bringen, dass f auf I beliebig oft differenzierbar ist. Aus der Produktregel erhält man mittels vollständiger Induktion die oft nützliche Formel ! n X n (k) (n−k) (n) ( f g) = f g . k k=0 7.1.16 Beispiel. Sei f (x) = x3 − 2x. Dann gilt f ′ (x) = 3x2 − 2, f ′′ (x) = 6x, f ′′′ (x) = 6, f ′′′′ (x) = 0, f (5) (x) = 0, . . . Man sieht genauso, dass jedes Polynom p beliebig oft differenzierbar ist und wenn n der Grad von p ist, p(n+1) (x) = p(n+2) (x) = . . . = 0 gilt. Sei f die Funktion x2 f (x) = −x2 , x≥0 , x≤0 Die Ableitung von f ist f ′ (x) = |x|. Die zweite Ableitung existiert also an der Stelle x = 0 nicht. 7.2 Mittelwertsätze 7.2.1 Definition. Sei hX, dX i ein metrischer Raum, E ⊆ X und sei f : E → R. Man sagt f hat ein lokales Maximum in einem Punkt x ∈ E, falls ∃ δ > 0 : f (x) ≥ f (t) für t ∈ E ∩ Uδ (x). Analog definiert man ein lokales Minimum. Will man sich nicht festlegen, ob x ein Minimum oder Maximum ist, so spricht man zusammenfassend von einem lokalen Extremum. Man beachte den Unterschied zum Begriff des Maximums. Das ist eine Stelle x ∈ E, sodass für jedes t ∈ E gilt f (x) ≥ f (t), also nicht nur lokal bei x sondern global. Man spricht dann von einem absoluten Maximum. Analog für absolute Minima bzw. zusammenfassend absolute Extrema. Natürlich ist ein absolutes Extremum stets auch ein lokales. KAPITEL 7. DIFFERENTIALRECHNUNG 166 7.2.2 Satz. Sei f : [a, b] → R. Hat f an einer Stelle x ∈ (a, b) ein lokales Extremum und ist f bei x differenzierbar, so muss f ′ (x) = 0. Beweis. Wir nehmen an, dass x ein lokales Maximum ist. Den Fall eines lokalen Minimums behandelt man analog. Wähle δ > 0 wie in Definition 7.2.1. Es gilt also f (x) ≥ f (t) für alle |t − x| < δ. Im Falle t > x gilt somit f (t) − f (x) ≤ 0, t−x und daher f ′ (x) = limt→x+ f (t)− f (x) t−x ≤ 0. Ist jedoch t < x, so impliziert f (x) ≥ f (t) f (t) − f (x) ≥ 0. t−x Also muss auch f ′ (x) = limt→x− f (t)− f (x) t−x ≥ 0. ❑ Geometrisch bedeutet Satz 7.2.2, dass an einem lokalen Extremum die Tangente an die Kurve y = f (x), falls eine solche existiert, waagrecht liegen muss. 7.2.3 Korollar (Satz von Rolle). Sei f : [a, b] → R stetig und auf (a, b) differenzierbar. Gilt f (a) = f (b) = 0, so gibt es ein ζ ∈ (a, b), sodass f ′ (ζ) = 0. Beweis. Aus Korollar 6.1.12 wissen wir, dass f auf [a, b] ein Maximum und ein Minimum besitzt. Also gibt es x− , x+ ∈ [a, b], sodass f (x− ) ≤ f (t) ≤ f (x+ ), für alle t ∈ [a, b]. Sind beide x− und x+ Randpunkte, d.h. x− , x+ ∈ {a, b}, so muss f (t) = 0 für alle t ∈ [a, b] und daher f ′ (t) = 0 für alle t ∈ (a, b) sein. Ist x− in (a, b) enthalten, so muss nach Satz 7.2.2 f ′ (x− ) = 0. Im Falle x+ ∈ (a, b) schließt man genauso. ❑ a ζ b Abbildung 7.2: Satz von Rolle 7.2. MITTELWERTSÄTZE 167 7.2.4 Korollar. Sei f : [a, b] → R stetig und n-mal differenzierbar auf (a, b). Weiters habe f mindestens n + 1 Nullstellen in [a, b]. Dann existiert ξ ∈ (a, b) mit f (n) (ξ) = 0. Beweis. Der Fall n = 1 folgt sofort aus Korollar 7.2.3. Angenommen der Satz gelte für n − 1. Wir zeigen ihn für n. Nach Korollar 7.2.3 liegt zwischen je zwei Nullstellen von f mindestens eine Nullstelle von f ′ . Also hat f ′ mindestens n Nullstellen. Nach Induktionsvoraussetzung existiert ein ξ mit f (n) (ξ) = ( f ′ )(n−1) (ξ) = 0. ❑ 7.2.5 Satz (Mittelwertsatz). Sei f : [a, b] → R stetig und auf (a, b) differenzierbar. Dann existiert ein Punkt ζ ∈ (a, b) mit f (b) − f (a) = f ′ (ζ). b−a Beweis. Betrachte die Funktion F : [a, b] → R F(t) := f (t) − f (a) − f (b) − f (a) (t − a). b−a Dann ist F auf [a, b] stetig (vgl. Korollar 6.1.8) und auf (a, b) differenzierbar (vgl. Beispiel 7.1.4, (i), (ii) und Satz 7.1.7), wobei F(a) = F(b) = 0 und für x ∈ (a, b) F ′ (x) = f ′ (x) − f (b) − f (a) . b−a Wenden wir Korollar 7.2.3 an, so folgt sofort die Behauptung. ❑ f (b) f (a) a ζ b Abbildung 7.3: Mittelwertsatz 7.2.6 Bemerkung. Satz 7.2.5, welcher auch 1. Mittelwertsatz der Differentialrechnung genannt wird, besagt, dass man (falls durchwegs Tangenten existieren) stets eine Tangente findet, welche parallel zur Sekante durch die Punkte (a, f (a)) und (b, f (b)) liegt. Die Stelle ζ aus Satz 7.2.5, an der die Steigung der Kurve gleich der mittleren Steigung im Intervall [a, b] ist, ist nicht eindeutig bestimmt. KAPITEL 7. DIFFERENTIALRECHNUNG 168 Obwohl man es auf den ersten Blick nicht sieht, so hat der Mittelwertsatz doch weitreichende Folgerungen. 7.2.7 Korollar. Sei I ⊆ R ein Intervall und f : I → R stetig. Sind a, b die Intervallränder von I, so sei f auf (a, b) differenzierbar. Dann gilt: Ist f ′ (x) ≥ 0 (> 0), für alle x ∈ (a, b), so ist f (streng) monoton wachsend. Ist f ′ (x) ≤ 0 (< 0), für alle x ∈ (a, b), so ist f (streng) monoton fallend. Ist f ′ (x) = 0, für alle x ∈ (a, b), so ist f konstant. Bezüglich der Umkehrung gilt nur, dass, wenn f monoton wachsend (fallend) ist, für ihre Ableitung immer f ′ (x) ≥ 0 (≤ 0) gilt. Beweis. Seien x1 , x2 ∈ I, x1 < x2 . Dann existiert eine Stelle x ∈ (x1 , x2 ) mit f (x2 ) − f (x1 ) = (x2 − x1 ) f ′ (x). Daraus folgt unmittelbar das behauptete Monotonieverhalten. Ist umgekehrt f monoton wachsend (fallend), so gilt für den Differenzenquotient für alle x, t ∈ (a, b) f (t) − f (x) ≥ 0 (≤ 0). t−x Für t → x folgt f ′ (x) ≥ 0 (≤ 0). ❑ 7.2.8 Beispiel. Dass aus der strengen Monotonie einer Funktion f nicht notwendigerweise f ′ (x) > 0 bzw. f ′ (x) < 0 für alle x folgt, sieht man anhand eines einfachen Beispiels. Die Funktion f (x) = x3 ist auf R streng monoton wachsend. Ihre Ableitung f ′ (x) = 3x2 ist nur ≥ 0, aber nicht > 0 für alle x ∈ R. 7.2.9 Bemerkung. Der Schluss f ′ (x) ≡ 0 ⇒ f ≡ c für ein festes c gilt auch für komplexwertige Funktionen. Das sieht man leicht, indem man f in Real- und Imaginärteil aufspaltet (vgl. (7.1)). 7.2.10 Korollar. Sei I ⊆ R ein Intervall mit den Randpunkten a, b, a < b. Weiters sei f : I → R (C) stetig und auf (a, b) differenzierbar. Ist a ∈ I und existiert limt→a+ f ′ (t), so ist f bei a rechtsseitig differenzierbar, sodass limt→a+ f ′ (t) = f ′ (a)+ . Entsprechendes gilt für t → b−, wenn b ∈ I. Somit gilt f ∈ C1 (I) genau dann, wenn f ∈ C1 (a, b) und aus a ∈ I die Existenz des Grenzwertes limt→a+ f ′ (t) und aus b ∈ I die von limt→b− f ′ (t) folgt. Beweis. Ist f reellwertig, so gibt es zu jedem t ∈ (a, b) ein x ∈ (a, t), sodass f (a) somit gegen f ′ (a)+ . f ′ (x). Für t → a+ konvergiert f (t)− t−a Ist f komplexwertig, so betrachte man Real- und Imaginärteil. f (t)− f (a) t−a = ❑ ′ Obwohl die Ableitung f einer auf einem Intervall (a, b) differenzierbaren Funktion nicht notwendig stetig sein muss, so gilt trotzdem stets die Zwischenwerteigenschaft. 7.2.11 Korollar. Sei I ⊆ R ein Intervall mit den Randpunkten a, b, a < b und f : I → R differenzierbar. Sind x1 , x2 ∈ I und c ∈ R mit f ′ (x1 ) < c < f ′ (x2 ), dann existiert eine Stelle x , x1 , x2 zwischen x1 und x2 mit f ′ (x) = c. 7.2. MITTELWERTSÄTZE 169 Ist f ′ (x) , 0 für alle x ∈ I, so gilt entweder immer f ′ (x) > 0, x ∈ I, oder immer f ′ (x) < 0, x ∈ I. Sie sind daher entweder streng monoton wachsend oder streng monoton fallend. Beweis. Wir nehmen zunächst x1 < x2 an. Betrachte die Funktion g : I → R, g(t) = f (t) − ct. Für ihre Ableitung gilt g′ (x1 ) = f ′ (x1 ) − c < 0, g′ (x2 ) = f ′ (x2 ) − c > 0. Sei x ∈ [x1 , x2 ] eine Stelle, an der g ihr Minimum annimmt. Wegen 0 = g′ (x) = f ′ (x) − c, genügt es x , x1 , x2 zu zeigen. Wegen g′ (x1 ) < 0 existiert ein δ > 0 mit g(t) − g(x1 ) < 0, x1 < t < x1 + δ. t − x1 Also muss g(t) < g(x1 ) für solche Werte von t. Der Punkt x1 scheidet als Kandidat für das Minimum also aus. Wegen g′ (x2 ) > 0 folgt die Existenz eines δ > 0, sodass g(t) − g(x2 ) > 0, x2 − δ < t < x2 . t − x2 Also ist g(t) < g(x2 ) für solche t, und der Punkt x2 kommt daher auch nicht in Frage. Den Fall x1 > x2 führt man durch die Betrachtung von − f auf obigen Fall zurück. Die letzte Aussage folgt sofort aus der eben bewiesenen Zwischenwerteigenschaft. ❑ 7.2.12 Korollar. Sei f differenzierbar auf (a, b). Dann hat f ′ keine Sprungstelle in (a, b). Beweis. An einer Sprungstelle existieren f ′ (x+) := limt→x+ f ′ (t) und f ′ (x−) := limt→x− f ′ (t), es sind jedoch nicht beide gleich f ′ (x). Angenommen es ist f ′ (x+) < f ′ (x), also f ′ (x+) + ǫ ≤ f ′ (x) für ein ǫ > 0. Also gilt f ′ (t) + ǫ ≤ f ′ (x), für alle t ∈ (x, t0 ], 2 für ein t0 > x. Also nimmt f ′ (t) für x < t < t0 keine Werte in ( f ′ (x) − 2ǫ , f ′ (x)) obiger Zwischenwerteigenschaft. ⊆ ( f ′ (t0 ), f ′ (x)) an. Das widerspricht ❑ Wir benötigen im Folgenden eine Verallgemeinerung von Satz 7.2.5. 7.2.13 Satz (Verallgemeinerter Mittelwertsatz). Seien f, g : [a, b] → R stetig und differenzierbar auf (a, b). Weiters gelte g′ (t) , 0 für alle t ∈ (a, b). Dann existiert eine Stelle ζ ∈ (a, b) mit f (b) − f (a) f ′ (ζ) = ′ . (7.4) g(b) − g(a) g (ζ) Beweis. Zunächst existiert nach Satz 7.2.5 ein x ∈ (a, b) mit g(b) − g(a) = g′ (x)(b − a), woraus wir g(b) − g(a) , 0 schließen. Somit ist die Funktion F : [a, b] → R, F(t) = f (t) − f (a) − f (b) − f (a) (g(t) − g(a)), g(b) − g(a) wohldefiniert, stetig und auf (a, b) differenzierbar, wobei F ′ (t) = f ′ (t) − f (b) − f (a) ′ g (t). g(b) − g(a) Weiters gilt F(a) = F(b) = 0. Somit gibt es nach Korollar 7.2.3 ein ζ ∈ (a, b) mit F ′ (ζ) = 0, und daher (7.4). ❑ KAPITEL 7. DIFFERENTIALRECHNUNG 170 Beachte, dass man für g(t) = t gerade den Mittelwertsatz erhält. Satz 7.2.13 heißt auch 2. Mittelwertsatz der Differentialrechnung. Wir werden ihn verwenden, um eine sehr nützliche Methode herzuleiten, Limiten zu berechnen. 7.2.14 Korollar (Regel von de L’Hospital2 ). Seien f, g : (a, b) → R differenzierbar auf (a, b), wobei a, b, ∈ R ∪ {±∞}, −∞ ≤ a < b ≤ +∞. Für x ∈ (a, b) hinreichend nahe bei a gelte g′ (x) , 0, und lim f (x) = lim g(x) = 0, (7.5) lim g(x) = +∞. (7.6) x→a+ x→a+ oder x→a+ Dann gilt lim x→a+ f ′ (x) f (x) = A ⇒ lim = A, x→a+ g(x) g′ (x) (7.7) mit A ∈ R ∪ {±∞}. Die analoge Aussage ist richtig, wenn man überall x → a+ durch x → b− oder in (7.6) +∞ durch −∞ ersetzt. Beweis. Da die Grenzwerte in (7.7) nur von den Funktionswerten lokal bei x abhängen (vgl. (5.3)), können wir b nötigenfalls kleiner machen, sodass g′ (x) , 0 auf ganz (a, b). Damit kann g auf (a, b) höchstens eine Nullstelle haben, da sonst nach Korollar 7.2.3 g′ (ζ) = 0 für ein ζ ∈ (a, b). Machen wir b nötigenfalls nochmals kleiner, so können wir auch g(x) , 0 auf ganz (a, b) annehmen. Gilt (7.6), so muss wegen dem Zwischenwertsatz, Korollar 6.2.6, insbesondere g(x) > 0 für alle x ∈ (a, b) gelten. Außerdem hat nach Korollar 7.2.11 g′ (x) immer das selbe Vorzeichen. Wegen (7.6) gibt es aber sicher a < s < t < b mit g(s) > g(t). Mit dem Mittelwertsatz Satz 7.2.5 folgt daraus g′ (x) < 0 für ein und daher für alle x ∈ (a, b). Also ist g unter der Voraussetzung (7.6) auf ganz (a, b) streng monoton fallend. ′ (t) Sei α ∈ R, α > A, und wähle r ∈ R mit A < r < α. Wegen limt→a+ gf ′ (t) = A existiert ein c ∈ (a, b) mit f ′ (t) < r für t ∈ (a, c). g′ (t) Sind dann x, y ∈ (a, c), x < y beliebig, so folgt aus Satz 7.2.5 f ′ (t) f (x) − f (y) = ′ < r, g(x) − g(y) g (t) (7.8) für ein t ∈ (x, y) ⊆ (a, c). Ist die Bedingung (7.5) erfüllt, so lässt man in obiger Beziehung x gegen a streben und erhält f (y) ≤ r < α für y ∈ (a, c). g(y) Ist nun Bedingung (7.6) ist erfüllt, so halte man y in (7.8) fest. Da g auf (a, b) streng monoton fällt und g(x) > 0, folgt ! f (x) f (y) f ′ (t) g(x) − g(y) f (y) g(y) + = + <r 1− , x ∈ (a, c). g(x) g′ (t) g(x) g(x) g(x) g(x) 2 Guillaume Francois L’Hospital, Marquis de Saint-Mesme, geb.1661 Paris, gest.3.2.1704 Paris 7.2. MITTELWERTSÄTZE 171 Lässt man hier x → a+ streben, so konvergiert die rechte Seite gegen r (> α). Also folgt die Existenz eines d ∈ (a, c), sodass f (x) < α, a < x < d. g(x) Wir haben also unter jeder der Voraussetzungen (7.6) und (7.7) nachgewiesen, dass für ein gewisses ρ ∈ (a, b) f (t) < α, wenn nur t ∈ (a, ρ). g(t) Wendet man das auf − f und −A statt f und A an, so sieht man, dass es auch zu jedem β ∈ R, β < A ein ρ ∈ (a, b) gibt, sodass f (t) > β, wenn nur t ∈ (a, ρ). g(t) Somit folgt lim x→a+ f (x) g(x) = A (vgl. Bemerkung 3.6.1). ❑ 7.2.15 Bemerkung. Indem man eine Funktion f : [a, b] → C in Real- und Imaginärteil zerlegt, folgt sofort die Gültigkeit der Regel von de L’Hospital auch wenn f komplexwertig ist (vgl. (7.1)). Die Funktion g muss aber reellwertig sein. 7.2.16 Bemerkung. Oft findet man mit dem folgenden Spezialfall der Regel von de L’Hospital: Seien f, g differenzierbar auf einem Intervall (c, d), sei x ∈ (c, d), f (x) = g(x) = 0 und g′ (x) , 0. Dann gilt lim t→x f (t) f ′ (x) = ′ . g(t) g (x) In manchen wichtigen Beispielen benötigt man jedoch die allgemeine Version der Regel von de L’Hospital, wie etwa für den ersten Grenzwert in Beispiel 7.2.17. 7.2.17 Beispiel. (i) 1 x x→0+ − 12 x lim x ln x = lim x→0+ (ii) = 0. sin x cos x (sin x)′ = lim = lim = 1. ′ x→0+ x x→0+ 1 x→0+ x lim Genauso sieht man lim x→0− sin x x = 1. (iii) Man betrachte den Grenzwert 1 1 − 2 lim 2 x→0 (sin x) x ! Dieser Ausdruck ist von der Form ∞ − ∞. Wir rechnen ! 1 x2 − (sin x)2 1 = − . (sin x)2 x2 (x sin x)2 (7.9) KAPITEL 7. DIFFERENTIALRECHNUNG 172 Für x → 0 ist dieser Ausdruck von der Form 00 . Also stimmt der Grenzwert in (7.9) nach der Regel von de L’Hospital mit lim x→0 2x − 2 sin x cos x 2x − sin(2x) = lim 2x(sin x)2 + 2x2 sin x cos x x→0 2x(sin x)2 + x2 sin(2x) überein. Wenden wir die Regel von de L’Hospital nochmals an, so erhalten wir lim x→0 2 − 2 cos(2x) 1 − cos(2x) = lim . 2(sin x)2 + 4x sin(2x) + 2x2 cos(2x) x→0 (sin x)2 + 2x sin(2x) + x2 cos(2x) Dieser Ausdruck ist wieder von der Form 00 . Wir müssten die Regel von de L’Hospital noch zweimal anwenden, um zu einem Ergebnis zu kommen. Etwas einfach ist es, diesen Grenzwert als x2 1 − cos(2x) · lim = 2 2 x→0 (sin x) + 2x sin(2x) + x2 cos(2x) x→0 x lim lim x→0 1 − cos(2x) 1 · lim x→0 sin x 2 sin(2x) x2 + 4 2x + cos(2x) x zu schreiben. Zweimal de L’Hospital liefert lim x→0 limx→0 sinx x = 1 gilt lim x→0 sin x x Also ist (7.9) genau 13 . 2 1 = + 4 sin(2x) 2x + cos(2x) 1−cos(2x) x2 = 2, und wegen 1 1 = . 1+4+1 6 (iv) Eine andere Möglichkeit den Grenzwert (7.9) zu berechnen, besteht darin, die Potenzreihenentwicklung von sin x um 0 zu verwenden: ! ! sin x 1 − ( sinx x )2 1 1 sin x 1 − x · = − = 1 + = x (sin x)2 x2 (sin x)2 (sin x)2 P∞ (−1)n x2n ! ! P∞ (−1)n−1 x2n sin x 1 − n=0 (2n+1)! sin x n=1 (2n+1)! · P · P 1+ = 1+ . 2 n 2n+1 x x ∞ (−1) x ∞ (−1)n x2n+1 2 n=0 n=0 (2n+1)! (2n+1)! Oben und unten durch x2 dividieren ergibt ! P∞ (−1)n x2n sin x n=0 (2n+3)! · P 1+ . x ∞ (−1)n x2n 2 n=0 (2n+1)! Man beachte, dass alle hier auftretenden Potenzreihen Konvergenzradius +∞ haben. Somit stehen in Zähler und Nenner stetige Funktionen in x (vgl. Satz 6.7.8). Für x → 0 konvergiert die Potenzreihen gegen den nullten Summanden. Also 1 erhalten wir für den Grenzwert (7.9) abermals 2 3!1 = 13 . 7.2. MITTELWERTSÄTZE 173 (v) Sei w ∈ C mit einem Realteil, der kleiner als Null ist. Wir wollen zeigen, dass der Grenzwert limt→+∞ t exp(wt) in C die komplexe Zahl 0 ist. Entweder wir betrachten dazu Real- und Imaginärteil des Grenzwertes gesondert, oder - was einfacher ist - wir betrachten den Betrag von t exp(wt) für t > 0 (vgl. Satz 6.8.3): |t exp(wt)| = t exp(t Re w) = t . exp t(− Re w) Wegen − Re w > 0 ist der Grenzwert davon für t → +∞ von der Form +∞ +∞ . Somit stimmt nach Korollar 7.2.14 dieser Grenzwert überein mit (siehe (6.15)) exp(t Re w) 1 t′ = 0. = lim = lim t→+∞ t→+∞ − Re w · exp t(− Re w) t→+∞ exp t(− Re w) ′ − Re w lim Das Folgende bringen wir hier der Vollständigkeit halber, da es sich aus dem Mittelwertsatz ableitet. Wir werden diese Problematik später (nach der Integrationstheorie) ausführlicher behandeln. Sei ( fn )n∈N eine Folge von reellwertigen Funktionen, welche gegen eine Funktion f konvergiert. Überträgt sich diese Eigenschaft auf die abgeleiteten Funktionen? 7.2.18 Beispiel. Sei fn (x) = sin√ nx n für x ∈ R. Dann gilt lim fn (x) = 0, n→∞ und das sogar gleichmäßig auf ganz R. Man berechnet fn′ (x) = √ n cos nx, also gilt z.B. limn→∞ fn′ (0) = +∞. 7.2.19 Satz. Sei ( fn )n∈N eine Folge von reellwertigen Funktionen, definiert und stetig auf [a, b] und differenzierbar auf (a, b). Es existiere ein Punkt x0 ∈ [a, b], sodass ( fn (x0 ))n∈N konvergiert. Ist dann die Folge ( fn′ )n∈N gleichmäßig konvergent auf (a, b), so ist auch die Folge ( fn )n∈N gleichmäßig konvergent auf [a, b], und es gilt d d lim fn (x) = lim fn (x), x ∈ (a, b). n→∞ dx dx n→∞ Beweis. Sei ǫ > 0 gegeben. Wähle N ∈ N, sodass für n, m ≥ N stets | fn (x0 ) − fm (x0 )| < ǫ, und | fn′ (t) − fm′ (t)| < ǫ, t ∈ (a, b). Nach dem Mittelwertsatz gilt (x ∈ [a, b]) fn (x) − fm (x) = fn (x) − fm (x) − fn (x0 ) + fm (x0 ) + fn (x0 ) − fm (x0 ) = = (x − x0 ) fn′ (t) − fm′ (t) + [ fn (x0 ) − fm (x0 )], mit einer geeigneten Zwischenstelle t. Es folgt | fn (x) − fm (x)| < (b − a)ǫ + ǫ. Also konvergiert ( fn )n∈N gleichmäßig auf [a, b] gegen f = limn→∞ fn . Sei nun x ∈ (a, b) festgehalten. Setze φn (t) := f (t) − f (x) fn (t) − fn (x) , φ(t) := , t−x t−x dann gilt für n fest aber beliebig lim φn (t) = fn′ (x). t→x Weiters ist fn (t) − fm (t) − fn (x) + fm (x) = fn′ (s) − fm′ (s) t−x mit einer geeigneten Stelle s zwischen t und x. Da ( fn′ ) gleichmäßig konvergiert, existiert auch der Limes limn→∞ φn (t) gleichmäßig für t ∈ [a, b] \ {x}. Man erhält daher φn (t) − φm (t) = lim lim φn (t) = lim lim φn (t). t→x n→∞ Die linke Seite ist gleich f ′ (x), die rechte ist limn→∞ fn′ (x). n→∞ t→x ❑ KAPITEL 7. DIFFERENTIALRECHNUNG 174 P n 7.2.20 Beispiel. Sei f (x) = ∞ n=0 an (x − x0 ) eine um −x0 verschobene Potenzreihe mit positivem Konvergenzradius R. Dann gilt für jedes x mit |x − x0 | < R f ′ (x) = ∞ ∞ X d X nan (x − x0 )n−1 . an (x − x0 )n = dx n=0 n=1 Denn die rechte Reihe hat den Konvergenzradius 1 1 = = R. √ √ √ lim supn→∞ n |nan+1 | limn→∞ n n · lim supn→∞ n |an+1 | Allgemein gilt für N ∈ N f (N) (x) = ∞ X nan (x − x0 )n−N . n=N 7.3 Der Taylorsche Lehrsatz Sei P∞ n=0 an zn eine Potenzreihe mit Konvergenzradius R > 0, und betrachte die Funktion f : (−R, R) → C, f (t) = ∞ X an tn . n=0 Wir haben schon gesehen, dass diese Funktion bei t = 0 differenzierbar mit f ′ (0) = a1 ist. Im Beweis von Lemma 7.3.2 benötigen folgendes Lemma. 7.3.1 Lemma. Sind (xn )n∈N , (yn )n∈N , (ξn )n∈N drei Folgen in R mit yn ≥ 0, xn > 0, ξn > 0, n ∈ N, sodass xn → x > 0 und ξn → 1, so folgt lim sup xn yξnn = x lim sup yn . n→∞ n→∞ Beweis. Um das einzusehen, zeigen wir, dass t ∈ R genau dann Häufungspunkt von (xn yξnn )n∈N ist, wenn xt Häufungspunkt von (yn )n∈N ist. Dann ist insbesondere der größte Häufungspunkt t von (xn yξnn )n∈N von der Form xτ für den größten Häufungspunkt τ von (yn )n∈N , also genau die gewünschte Gleichheit. Ist τ Häufungspunkt von (yn )n∈N , also yn(k) → τ, k → ∞ für eine Teilfolge (yn(k) )k∈N , so folgt im Falle τ > 0 aus der ξ n(k) Stetigkeit von (a, b) 7→ ab für (a, b) ∈ R+ × R (vgl. Bemerkung 6.8.7), dass yn(k) → τ1 = τ, k → ∞, und mit Satz 3.3.4 ξn(k) xn(k) yn(k) weiter dass → xτ. Im Fall τ = 0 gilt für k ∈ N hinreichend groß sicherlich ξn(k) ≤ 2 und xn(k) ≤ x + 1. Für solche k folgt dann ξ ξ n(k) n(k) 0 ≤ xn(k) yn(k) ≤ (x + 1)y2n(k) , und wegen dem Einschluss-Satz, Satz 3.3.2, konvergiert (xn(k) yn(k) )k∈N gegen 0 = xτ. Ist umgekehrt t ein Häufungspunkt von (xn yξnn )n∈N , so wenden wir das gerade gezeigte auf die Folgen ( x1n )n∈N , (yξnn )n∈N und (1)n∈N an, und erhalten, dass xt Häufungspunkt von (yξnn )n∈N ist. Nun wenden wir das oben gezeigte auf die Folgen (1)n∈N , (yξnn )n∈N und ( ξ1n )n∈N an, und sehen, dass xt Häufungspunkt von (yn )n∈N ist. ❑ P P∞ n n 7.3.2 Lemma. Die Potenzreihe ∞ n=0 (n + 1)an+1 z hat den selben Konvergenzradius R, wie n=0 an z . Die Funktion f ist auf (−R, R) differenzierbar und hat die Ableitung f ′ (x) = ∞ X (n + 1)an+1 xn . n=0 Sie ist sogar beliebig oft differenzierbar mit (l ∈ N) ∞ X f (l) (x) = n=0 (n + l) · · · (n + 1)an+l xn , (7.10) wobei auch diese Potenzreihe Konvergenzradius R hat. Insbesondere gilt f (l) (0) = l!al . Beweis. Der Konvergenzradius von und wegen √ n |an+1 | = √ n+1 |an+1 | P∞ n+1 n lim supn→∞ n=0 (n+1)an+1 z n ist nach Satz 6.7.8 √ n 1√ . Wegen n lim supn→∞ n |(n+1)an+1 | + 1 → 1, n → ∞, folgt mit Lemma 7.3.1 1 √ n |(n + 1)an+1 | = limn→∞ √ n 1 n + 1 · lim supn→∞ √ n+1 |an+1 | = R. (7.11) 7.3. DER TAYLORSCHE LEHRSATZ 175 Sei nun x ∈ (−R, R) und r ∈ (0, R) so, dass |x| < r. Ist (tk )k∈N eine gegen x konvergente Folge aus [−r, r] \ {x}, so gilt lim k→∞ Nun ist für |x|, |t| ≤ r N X t n − xn f (tk ) − f (x) an k = lim lim . k→∞ N→∞ tk − x tk − x n=1 (7.12) n n−1 n X a t − x ≤ |a | · |t| j · |x|n−1− j ≤ n|an ||r|n−1 . n n t−x j=0 Da innerhalb ihres Konvergenzradius sogar absolut konvergieren, konvergiert wegen (7.11) die Reihe P∞ Potenzreihen n−1 . Nach dem Weierstraß Kriterium, Korollar 6.7.4, konvergiert die Funktionenfolge n=1 n|an ||r| N X tn − xn an t−x n=1 N∈N in der Variable t gleichmäßig auf [−r, r] \ {0}. Nach Lemma 6.6.11 stimmt (7.12) überein mit lim lim N→∞ k→∞ N X n=1 an ∞ N X X tkn − xn nan xn−1 . nan xn−1 = = lim N→∞ tk − x n=1 n=1 Die Verallgemeinerung in (7.10) folgt nun leicht durch vollständige Induktion. ❑ P∞ 1 7.3.3 Beispiel. Für x ∈ (−1, 1) ist die Funktion x 7→ ln(1 − x) beliebig oft differenzierbar. Da ln(1 − x)′ = − 1−x =− P P∞ xn nach Lemma 7.3.2 mit der Ableitung von x 7→ − ∞ n=1 n , x ∈ (−1, 1) übereinstimmt, und da ln(1 − x) und − n=1 x = 0 beide den Wert Null annehmen, folgt aus Korollar 7.2.7, dass ln(1 − x) = − n n=1 x xn n für ∞ X xn für alle x ∈ (−1, 1). n n=1 Da diese Reihe auch für x = −1 (bedingt) konvergiert, folgt aus Satz 6.7.13, dass − P∞ n=1 (−1)n n = ln(2). Wir sehen insbesondere, dass Grenzfunktionen von Potenzreihen beliebig oft ableitbar sind. Ist etwa jede unendlich oft differenzierbare Funktion Grenzfunktion einer Potenzreihe, und wie könnte man diese angeben? Das ist eine der Fragestellungen, die auf den Taylorschen Lehrsatz führen. Eine andere Motivation des Taylorschen Lehrsatz ergibt sich aus folgenden Interpolationsüberlegungen. Die Gerade, die eine Kurve in einem Punkt am besten approximiert ist die Tangente (falls sie existiert). Approximiert man die Kurve mit einem Polynom höheren Grades, so kann man hoffen, dass die Approximation genauer wird. Wir haben die Tangente gefunden (eigentlich definiert) als die Grenzlage von Sekanten durch die Punkte (x, f (x)) und (x + △x, f (x + △x)). Da eine Gerade durch zwei Punkte eindeutig bestimmt ist, sind diese Sekanten wohldefinierte Objekte. Ein Polynom vom Grade ≤ n ist eindeutig festgelegt durch die Vorgabe der Werte y0 , . . . , yn an n + 1 verschiedenen Stellen x0 , . . . , xn : n Y X x − xj . yk · p(x) = x − xj j∈{0,...,n}\{k} k k=0 Die Eindeutigkeit folgt aus der Tatsache, dass ein Polynom vom Grad ≤ n höchstens n Nullstellen hat. Betrachten wir nun n + 1 Punkte der Kurve f mit den x-Koordinaten x, x + △x, . . . , x + n△x, und legen ein Polynom p durch diese Punkte. Für große Schrittweiten △x wird das erhaltene Polynom nicht viel mit der Kurve zu tun haben, lässt man jedoch △x → 0 streben, so hofft man auf eine gute Approximation. 7.3.4 Satz (Newtonsche Interpolationsformel). Seien x, △x und Werte y0 , . . . , yn gegeben. Das Polynom, welches durch die Punkte (x, y0 ), (x + △x, y1 ), . . . , (x + n△x, yn ) geht, ist gleich p(x) = y0 + ... + (x − x0 ) △y0 (x − x0 )(x − x1 ) △2 y0 + + ··· 1! △x 2! △x2 (x − x0 )(x − x1 ) . . . (x − xn−1 ) △n y0 , n! △xn wobei wir x j = x + j△x gesetzt haben und △ j y0 die j-te Differenz bezeichnet. Diese ist rekursiv definiert als △yi = yi+1 − yi , △2 yi = △yi+1 − △yi , . . . . KAPITEL 7. DIFFERENTIALRECHNUNG 176 Beweis. Offenbar gilt p(x0 ) = y0 . Man erhält p(x1 ) = y0 + (x1 − x0 ) p(x j ) = y0 + (x j − x0 ) ... + △y0 △x = y0 + △x △y0 △x = y0 + (y1 − y0 ) = y1 . Allgemein gilt (x j − x0 )(x j − x1 ) △2 y0 △y0 + + ... △x 2 △x2 (x j − x0 ) · · · (x j − x j−1 ) △ j y0 = j! △x j △y0 j△x( j − 1)△x △2 y0 j!△x j △ j y0 + = + ··· + △x 2 j! △x j △x2 ! ! ! ! j j j j = y0 + △y0 + △2 y0 + · · · + △ j y0 . 0 1 2 j = y0 + j△x Wir zeigen nun mittels Induktion die folgende Behauptung: Für je j + 1 Werte y0 , . . . , y j gilt die Formel yj = ! j X j l △ y0 . l l=0 Der Induktionsanfang j = 0 ist offensichtlich richtig. Sei die Formel also bereits gezeigt für je j Werte. Dann folgt ! j−1 ! j X X j l j l △ y0 + △ j y0 = △ y0 = y0 + l l l=1 l=0 = y0 + = y0 + ! !# j−1 " X j−1 j−1 + △l y0 + (△ j−1 y1 − △ j−1 y0 ) = l−1 l l=1 ! ! j−1 j−1 X X j − 1 l−1 j−1 l (△ y1 − △l−1 y0 ) + △ y0 + (△ j−1 y1 − △ j−1 y0 ) = l−1 l l=1 l=1 j−2 X j − 1! = △l y1 + △ j−1 y1 − l l=0 | {z } =y j j−2 ! j−1 X X j − 1! j − 1 l − △l y0 + △ j−1 y0 + y0 + △ y0 = y j l l l=0 l=1 Ist f an der Stelle x differenzierbar, so gilt lim△x→0 △y0 △x = lim△x→0 f (x+△x)− f (x) △x ❑ = f ′ (x). Allgemein gilt: 7.3.5 Lemma. Sei f : [a, b] → R stetig und n-mal stetig differenzierbar auf (a, b). Ist x ∈ (a, b), so gilt (y j = f (x + j△x)) lim △x→0 (x−x ) △y (x−x )···(x−x △n y0 = f (n) (x). △xn ) △n y 0 n−1 0 Beweis. Sei p(x) = y0 + 1! 0 △x0 + . . . + n! △xn . Die Funktion h(x) := f (x) − p(x) hat die n + 1 Nullstellen x0 , · · · , xn (∈ (a, b) für △x hinreichend klein). Mit Korollar 7.2.4 folgt die Existenz von ξ ∈ (x0 , xn ) mit h(n) (ξ) = 0. Nun gilt 0 = h(n) (ξ) = f (n) (ξ) − p(n) (ξ) = f (n) (ξ) − Für △x → 0 folgt wegen der Stetigkeit von f (n) auch △n y0 △xn △n y0 . △xn → f (n) (x). ❑ Man erhält also als Grenzfall des in einem Punkt x0 approximierenden Polynoms gerade p(x) = f (x0 ) + (x − x0 ) f ′ (x0 ) + (x − x0 ) (n) (x − x0 )2 ′′ f (x0 ) + · · · + f (x0 ). 2 n! Wählt man den Grad von p immer größer, so wird (hoffentlich) p(x) die Kurve f (x) immer besser annähern. Wir wollen im folgenden eine gegebene Funktion f auf einem reellen Intervall I durch Polynome approximieren. Für hinreichend oft differenzierbare f werden wir das durch das sogenannte Taylorpolynom zu bewerkstelligen suchen. 7.3. DER TAYLORSCHE LEHRSATZ 177 7.3.6 Definition. Sei n ∈ N, I ⊆ R ein Intervall und f : I → R (C) liege in Cn (I)3 Ist y ∈ I fest, so nennt man das Polynom (in der Variablen x) T n (x) = n X (x − y)k (k) f (y), k! k=0 das n-te Taylorsche Polynom an der Anschlussstelle y. Die Fehlerfunktion Rn (x) := f (x) − T n (x) nennt man das n-te Restglied. Dass T n (x) eine gute Wahl ist, um ein reellwertiges f zu approximieren, folgt aus dem nun folgenden Satz, welcher eine Art Verfeinerung des Mittelwertsatzes ist. 7.3.7 Satz (Taylorscher Lehrsatz). Sei I ⊆ R ein Intervall, und sei n ∈ N ∪ {0}. Weiters sei f : I → R mit f ∈ Cn (I) und so, dass f (n) am Inneren von I - also auf I ohne seine Randpunkte - differenzierbar ist, bzw. äquivalent dazu, dass f auf dem Inneren von I sicher n + 1-mal differenzierbar ist. Zu x, y ∈ I, x , y, gibt es immer ein ξ ∈ (min(x, y), max(x, y)), sodass sich das n-te Restglied Rn (x) = f (x) − T n (x) schreiben lässt als (Lagrange Form des Restgliedes) Rn (x) = (x − y)n+1 (n+1) f (ξ). (n + 1)! Beweis. Seien F, G : [min(x, y), max(x, y)] → R definiert durch F(t) = f (x) − n X (x − t)k k=0 k! · f (k) (t), G(t) = (x − t)n+1 . Voraussetzungsgemäß sind beide stetig auf [min(x, y), max(x, y)] und differenzierbar auf (min(x, y), max(x, y)), wobei G′ (t) = −(n + 1)(x − t)n , 0 für t ∈ (min(x, y), max(x, y)) und F ′ (t) = − n n X X (x − t)n (n+1) k(x − t)k−1 (k) (x − t)k (k+1) f (t) + f (t) = − f (t). k! k! n! k=1 k=0 Nach dem verallgemeinerten Mittelwertsatz, Satz 7.2.13, gibt es ein ξ (min(x, y), max(x, y)), sodass ∈ n (n+1) (ξ) − (x−ξ) Rn (x) f (n+1) (ξ) F(y) − F(x) F ′ (ξ) n! f = = = . = (n + 1)! (x − y)n+1 G(y) − G(x) G′ (ξ) −(n + 1)(x − ξ)n ❑ p 7.3.8 Bemerkung. Wählt man im obigen Beweis G(t) = (x−t) für ein festes aber beliebiges p ∈ N, so erhält man mit derselben Argumentation ein ξ ∈ (min(x, y), max(x, y)), sodass f (n+1) (ξ) Rn (x) = (x − y) p (x − ξ)n−p+1 . n!p Stellt man ξ durch ξ = θx + (1 − θ)y für ein θ ∈ (0, 1) dar, so erhält man die Schlömilchsche Form f (n+1) (ξ) Rn (x) = (x − y)n+1 (1 − θ)n−p+1 . n!p des Restgliedes. Für p = n + 1 erhält man die Lagrange Form und für p = 1 die sogenannte Cauchysche Form des Restgliedes. 3 Siehe Definition 7.1.14 und Definition 7.1.15. KAPITEL 7. DIFFERENTIALRECHNUNG 178 7.3.9 Fakta. Sei f : I → R (C) wie in Definition 7.3.6. 1. Man sieht unmittelbar durch Nachrechnen, dass T n (x) ein Polynom höchstens n-ten Grades ist, sodass T n (y) = f (y), T n′ (y) = f ′ (y), . . . , T n(n) (y) = f (n) (y). (7.13) Die höheren Ableitungen von T n verschwinden identisch, da es ein Polynom höchstens n-ten Grades ist. 2. Ist p(x) ein weiteres Polynom höchstens n-ten Grades mit (7.13) (T n ersetzt durch p), so verschwinden die Ableitungen 0-ten bis n-ten Grades von q(x) = p(x) − T n (x) an der Stelle y. Wenden wir Satz 7.3.7 auf die reellen Funktionen Re q(x) und Im q(x) oder auch nur q(x), falls diese reell ist, an, so folgt wegen q(n+1) ≡ 0, dass q(x) = 0. Also definiert die Eigenschaft (7.13) das Polynom T n (x) eindeutig. 3. Ist f selber ein Polynom vom Grad m, so muss insbesondere f (x) = T n (x) für n ≥ m. 4. Für reellwertige Funktionen f gibt Satz 7.3.7 im Falle der Differenzierbarkeit von f (n) am Inneren von I eine Möglichkeit, das Restglied Rn (x) durch (x−y)n+1 (n+1) (ξ) auszudrücken. Das Problem dabei ist, dass man von ξ nur weiß, (n+1)! f dass es zwischen x und y liegt. Nichtsdestotrotz kann man manchmal f (n+1) so gut abschätzen, dass man sicher sagen kann, dass Rn (x) klein wird; vgl. auch Bemerkung 7.3.8. 5. Ist f beliebig oft differenzierbar, so kann man für jedes n ∈ N ∪ {0} das Taylorpolynom T n (x) an der Anschlussstelle y betrachten. Man erhält schließlich die Taylorreihe von f an der Anschlussstelle y: T (x) := ∞ X f (n) (y) (x − y)n . n! n=0 Das ist eine Potenzreihe mit Konvergenzradius R ∈ [0, +∞]. Hier können alle Fälle auftreten. 6. Ist R > 0, so konvergiert die Potenzreihe insbesondere auf (y − R, y + R). Nun kann T (x) auf (y − R, y + R) ∩ I mit der Ausgangsfunktion f (x) übereinstimmen; sie muss es aber nicht. Klarerweise ist T (x) = f (x), x ∈ (y − R, y + R) ∩ I genau dann, wenn Rn (x) → 0 auf x ∈ (y − R, y + R) ∩ I. P n 7. Sei ∞ n=0 an z eine Potenzreihe mit Konvergenzradius R > 0, und betrachte die Funktion ∞ X f : (y − R, y + R) → C, f (t) = an (t − y)n . n=0 Wir werden in Proposition 8.7.5 sehen (bzw. haben in Lemma 7.3.2 gesehen), dass f (l) (y) = l! · al , l ∈ N ∪ {0}. Die Taylorreihe von f an der Anschlussstelle y P n ist somit genau ∞ n=0 an (t − y) , und konvergiert daher auf (y − r, y + R). Das Restglied Rn (x) konvergiert klarerweise gegen 0. 7.3. DER TAYLORSCHE LEHRSATZ 179 7.3.10 Beispiel. Sei n ∈ N ∪ {0}, I ⊆ R ein Intervall, und f : I → R so, dass f ∈ Cn (I) und dass f auf dem Inneren des Intervalls I sogar (n + 1)-mal differenzierbar ist. Gilt nun f (n+1) (ξ) = 0 für alle ξ im Inneren von I, so folgt Rn (x) = 0 und daher f (x) = T n (x) für alle x ∈ I. Kurz zusammengefasst bedeutet das, dass genau die Polynome vom Grad ≤ n alle möglichen Lösungen der Differentialgleichung f (n+1) (ξ) = 0, sind. Indem man f in Real- und Imaginärteil zerlegt, folgt diese Tatsache auch für komplexwertige f . 7.3.11 Beispiel. Sei f (t) = et . Dann gilt f (n) (t) = et , also f (n) (0) = 1. Wir erhalten ex = wobei Rn (x) = xn+1 ξ (n+1)! e x n X xk + Rn (x), k! k=0 mit ξ ∈ (0, x). Da e die Grenzfunktion einer Potenzreihe ist, - so wurde sie ja eingeführt muss Rn (x) → 0, vgl. Fakta 7.3.9, 7. Man kann dieses Grenzverhalten aber auch unschwer durch eine elementare Abschätzung von Rn (x) erhalten. Betrachte die Funktion f (t) = ∞ X cos(2k t) . k! k=1 Differenziert man diese Reihe gliedweise, so erhält man ∞ ∞ X −2k sin(2k t) X −22k cos(2k t) , ,... k! k! k=1 k=1 P (2k )l Da ∞ für jedes l ∈ N konvergiert, sind sämtliche dieser Reihen k=1 k! gleichmäßig konvergent auf R. Wie wir später in Korollar 8.7.4 sehen werden (oder man verwende Satz 7.2.19), ist die Funktion f daher in jedem Punkt beliebig oft differenzierbar, und ihre Ableitungen werden durch obige Reihen dargestellt. Es gilt daher f ′ (0) = f ′′′ (0) = . . . = f (2k+1) (0) = . . . = 0, und f (2n) (0) = (−1)n ∞ X 22nk n = (−1)n (e4 − 1). k! k=1 Die Taylorreihe von f bei 0 ist also gleich n ∞ X (−1)n (e4 − 1) 2n x . (2n)! n=0 Wendet man das Quotientenkriterium an, so erhält man (an = n (−1)n (e4 −1) (2n)! an+1 (e4n 2 + 1)(e4n + 1) 2 = x −→ ∞, x , 0. an (2n + 2)(2n + 1) Diese Reihe ist für kein x (außer im Trivialfall x = 0) konvergent. x2n ) . KAPITEL 7. DIFFERENTIALRECHNUNG 180 Sei 1 1 e− x , f (x) = 0, f x>0 x≤0 1 2 0 1 2 3 4 Klarerweise ist f auf (−∞, 0] beliebig oft ableitbar mit f (n) (x) = 0, x ≤ 0. Auf (0, +∞) gilt f ′ (x) = (n ∈ N ∪ {0}) 1 − 1x e , x2 f (n) und durch vollständige Induktion sieht man, dass (x) = pn ! 1 −1 e x , x > 0. x für Polynome pn (x) vom Grad 2n. Nun gilt mit Hilfe der Regel von de L’Hospital Korollar 7.2.14 lim f (n) (x) = lim x→0+ y→+∞ p′ (y) p(2n) (y) pn (y) = lim n y = · · · = lim n y = 0, y y→+∞ e y→+∞ e e da p(2n) n (y) eine Konstante ist. Wir sehen insbesondere, dass f auf [0, +∞) stetig ist, und dass wegen limt→0+ f ′ (t) = 0 nach Korollar 7.2.10 f ′ (0)+ = 0. Wegen f ′ (0)− = 0 ist f auch bei 0 differenzierbar mit f ′ (0), und somit f ∈ C1 (R). Wiederholte Anwendung dieses Argumentes auf f ′ , f ′′ usw. zeigt, dass f auf R beliebig oft differenzierbar ist, wobei f (n) (0) = 0, n ≥ 0. Insbesondere ist das Taylorpolynom T n (x) stets identisch Null. Also ist f ein Beispiel für eine C∞ -Funktion, deren Taylorreihe bei der Anschlussstelle 0 auf ganz R konvergiert, aber nicht mit f übereinstimmt. Wir haben gesehen, dass für eine differenzierbare Funktion f , welche an einer Stelle x ein lokales Extremum besitzt, f ′ (x) = 0 gelten muss, dass jedoch die Umkehrung im Allgemeinen nicht gilt (Beispiel: f (t) = t3 an der Stelle x = 0). Aus dem Taylorschen Satz erhält man unmittelbar eine hinreichende Bedingung für ein lokales Extremum. 7.3.12 Korollar. Für n ∈ N sei f : (c, d) → R eine zumindest n-mal stetig differenzierbare Funktion, x ∈ (c, d), und gelte f ′ (x) = f ′′ (x) = . . . = f (n−1) (x) = 0, f (n) (x) , 0. Ist n gerade, so liegt ein lokales Extremum vor, und zwar ein lokales Minimum falls f (n) (x) > 0 und ein lokales Maximum falls f (n) (x) < 0. Ist n ungerade, so liegt kein lokales Extremum vor. 7.3. DER TAYLORSCHE LEHRSATZ 181 Beweis. Nach der Taylorschen Formel gilt für t ∈ (c, d) mit einer geeigneten Zwischenstelle ξ zwischen t und x f (t) = f (x) + (t − x)n (n) f (ξ). n! Ist z.B. f (n) (x) > 0, so gilt für ξ in einer hinreichend kleinen Umgebung (x − δ, x + δ) von x ebenfalls f (n) (ξ) > 0. Da ξ zwischen t und x liegt, folgt aus t ∈ (x − δ, x + δ), dass für gerades n (t − x)n (n) f (ξ) > 0. n! Somit folgt f (t) > f (x), und x ist ein lokales Minimum. Ist n ungerade, so hat (t − x)n für t < x ein anderes Vorzeichen als für t > x. Also ist x kein lokales Extremum. Die anderen Fälle beweist man genauso. ❑ 7.3.13 Beispiel. Mit den bisher gesammelten Ergebnissen lassen sich sogenannte Kurvendiskussionen von Funktionen durchführen. f 4 Man betrachte z.B. die Funktion f (x) = x x auf (0, +∞). 3 2 1 0 1 e 1 2 Zunächst ist diese Funktion stetig und beliebig oft differenzierbar. Klarerweise ist sie immer positiv, hat also keine Nullstellen. Um die lokalen Extrema zu finden, betrachte f ′ (x) = x x (1 + ln x), f ′′ (x) = x x−1 + x x (1 + ln x). Die einzige Nullstelle von f ′ (x) ist 1e . Da f ′′ ( 1e ) > 0 folgt aus Korollar 7.3.12, dass diese Stelle ein lokales Minimum ist. Für 0 < x < 1e ist f ′ (x) < 0 also dort monoton fallend, und für 1e < x ist f ′ (x) > 0, also dort monoton wachsend, vgl. Korollar 7.2.7. Insbesondere ist 1e ein absolutes Minimum von f auf (0, +∞). Schließlich erhält man mit de l’Hospital lim x→0+ f (x) = 1 und wegen x x ≥ e x , x ≥ e die Beziehung lim x→+∞ f (x) = +∞. 7.3.14 Beispiel. Wir wollen zeigen, dass die Gleichung (1 − ln x)2 = x(3 − 2 ln x) KAPITEL 7. DIFFERENTIALRECHNUNG 182 in (0, +∞) genau zwei Lösungen hat. Dazu betrachten wir die Funktion f : (0, +∞) → R, f (x) = (1 − ln x)2 − x(3 − 2 ln x). Für diese gilt es zu zeigen, dass f genau zwei Nullstellen hat. Setzt man x = 1, so folgt f (1) = −2 < 0. Andererseits folgt wegen limx→0+ x(3 − 2 ln x) = 0 lim f (x) = +∞. x→0+ Wegen f (x) ≥ x(2 ln x − 3) ≥ x für x ≥ exp(2) folgt auch lim f (x) = +∞. x→+∞ Insbesondere gibt es ξ, η ∈ R mit 0 < ξ < 1 < η < +∞, sodass f (ξ) > 0, f (η) > 0. Nach dem Zwischenwertsatz muss es einen Punkt α ∈ (ξ, 1) und einen Punkt β ∈ (1, η) geben, sodass f (α) = 0 = f (β). Also hat f mindestens zwei Nullstellen. Um zu zeigen, dass es nicht mehr sein können, berechnen wir 1 1 ln x − 1 2 4 − 2 ln x + 2x f ′ (x) = 2(ln x − 1) + 2 ln x − 1, f ′′ (x) = 2 2 − 2 + = . x x x x2 x2 Für x ∈ (0, 1] ist ln x ≤ 0 und somit f ′′ (x) > 0. Für x ∈ (1, +∞) gilt wegen x > ln x auch f ′′ (x) > 0. Also hat f ′′ keine Nullstelle. Nach dem Satz von Rolle kann f ′ höchstens eine und weiter f höchstens zwei Nullstellen haben (vgl. Korollar 7.2.4). Der Vollständigkeit halber wollen wir f noch weiter diskutieren. Wegen f ′′ (x) > 0 muss f ′ streng monoton wachsen. Außerdem gilt wegen f ′ (x) ≤ − 1x für x ∈ (0, 1) lim f ′ (x) = −∞, x→0+ und wegen f ′ (x) ≥ 2 ln x − 1 für x > e lim f ′ (x) = +∞. x→+∞ Aus dem Zwischenwertsatz folgt, dass f ′ mindestens eine Nullstelle hat. Insgesamt hat f ′ genau eine Nullstelle x0 . Wegen f ′′ (x0 ) > 0 muss x0 ein lokales Minimum sein. Wegen der Monotonie von f ′ gilt f ′ (s) < f ′ (x0 ) = 0 < f ′ (t) für 0 < s < x0 < t < +∞. Also ist f auf (0, x0 ) monoton fallend und auf (x0 , +∞) monoton wachsend. Deswegen muss x0 sogar ein globales Minimum sein. 7.4 Stammfunktion Bei der Integration von Funktionen wird es wichtig sein, zu einer gegebenen Funktion f : [a, b] → R (C) - falls möglich - eine Funktion F : [a, b] → R (C) zu finden, sodass F′ = f . 7.4.1 Definition. Sei I ⊆ R ein Intervall und f : I → R (C). Wir nennen eine Funktion F : I → R (C) eine Stammfunktion von f , wenn F ′ (x) = f (x) für alle x ∈ I. Hat ein f mindestens eine Stammfunktion, so heißt die Gesamtheit aller StammR funktionen von f das unbestimmte Integral von f und wird durch f bezeichnet. 7.4. STAMMFUNKTION 183 7.4.2 Bemerkung. Mit F ist offensichtlicherweise auch F + c für jedes c ∈ R (C) eine Stammfunktion von f . Sind umgekehrt F1 , F2 zwei Stammfunktionen der selben Funktion f , so gilt (F1 − F2 )′ ≡ 0 auf I. Nach Korollar 7.2.7 bzw. Bemerkung 7.2.9 ist F1 − F2 eine Konstante. Somit gibt es bis auf additive Konstanten eine eindeutige Stammfunktion F, und Z f = {F + c : c ∈ R (C)}. Zum Aufsuchen von Stammfunktionen gegebener Funktionen ist folgendes Resultat sehr hilfreich. 7.4.3 Lemma. Seien I, J ⊆ R Intervalle und f, g : I → R (C), sowie α, β ∈ R (C). Weiters sei h : J → I differenzierbar. (i) Haben f und g Stammfunktionen, so auch α f + βg, wobei Z Z Z (α f + βg) = α f +β g . (ii) Sind f und g differenzierbar auf I, sodass f ′ g eine Stammfunktion hat, dann hat auch f g′ eine solche, und Z Z f ′g = f g − f g′ , Regel von der Partiellen Integration. (7.14) (iii) Mit f hat auch ( f ◦ h) · h′ : J → R (C) eine Stammfunktion, wobei Z Z ! (( f ◦ h) · h′ ) = f ◦ h, Substitutionsregel) Diese drei Beziehungen sind so zu verstehen, dass wenn funktion steht, die Gleichheit bis auf eine Konstante gilt. R · · · für jeweils eine Stamm- Beweis. (i) Sind F und G Stammfunktionen von f und g, so folgt (αF + βG)′ = αF ′ + βG′ = α f + βg. Also ist αF + βG eine Stammfunktion von α f + βg. (ii) Ist H Stammfunktionen von f ′ g, so folgt aus der Produktregel ( f g − H)′ = ( f ′ g + f g′ ) − f ′ g = f g′ . Somit ist f g − H Stammfunktionen von f g′ , und es gilt (7.14). (iii) Ist F Stammfunktionen von f , so folgt aus der Kettenregel in Satz 7.1.9 bzw. Bemerkung 7.1.10, dass (F ◦ h)′ = ( f ◦ h) · h′ . Also ist F ◦ h Stammfunktion von ( f ◦ h) · h′ . ❑ KAPITEL 7. DIFFERENTIALRECHNUNG 184 7.4.4 Bemerkung. Zur Substitutionsregel gibt es folgende Merkregel: Seien I, J ⊆ R wieder Intervalle, f : I → R (C), und h : J → I differenzierbar. Schreiben wir x = h(t) mit t ∈ J und formal dx = h′ (t) dt, so erhält man aus Z ! Z f (x) =: f (x)dx durch Ersetzen von x durch h(t) und dx durch h′ (t) dt Z Z ′ f (h(t)) · h (t) dt := (( f ◦ h) · h′ ). Wie gesagt ist das eine Merkregel, die sich beim Bestimmen konkreter Stammfunktionen aber als durchaus praktikabel und übersichtlich herausgestellt hat, siehe etwa Beispiel 7.4.8. 7.4.5 Beispiel. Man kann die Substitutionsregel verwenden, um einfache Differentialgleichungen der Form y′ (t) · f (y(t)) = g(t), t ∈ I, (7.15) zu lösen. Hier sind I, J ⊆ R Intervalle und f : F → R sowie g : I → R stetige Funktionen. Angenommen man hat eine Funktion y : I → J ⊆ R, welche (7.15) erfüllt. Hat f eine Stammfunktion F, so ist nach der Substitutionsregel die Funktion F ◦ y eine Stammfunktion von t 7→ y′ (t) · f (y(t)) und daher auch von g. Kennt man andererseits eine Stammfunktion G von g explizit, so folgt F ◦ y = G + c für eine Konstante c ∈ R. Also hat man eine implizite Beschreibung von y(t). In manchen Fällen lässt sich diese Gleichung nach y auflösen, wodurch man y(t) explizite beschreiben kann. Diese hier beschriebene Methode nennt man auch Trennung der Variablen . 7.4.6 Beispiel. Man betrachte die Differentialgleichung y′ (t) = y(t), t ∈ R. Eine reellwertige Lösung y dieser Differentialgleichung ist y ≡ 0. Angenommen y ist eine weitere reellwertige Lösung mit y(t0 ) < 0 für ein t0 ∈ R. Wegen der Stetigkeit gilt y(t) < 0 für alle t ∈ (t0 − ǫ, t0 + ǫ) =: I. Ist f : I → (−∞, 0) die Funktion f (η) = η1 , so gilt für t ∈ I, y′ (t) · 1 = y′ (t) · f (y(t)) = 1. y(t) Eine Stammfunktion von f ist F(η) = ln(−η), also ist t 7→ ln(−y(t)) eine Stammfunkti1 auf I. Von 1 ist t 7→ t eine Stammfunktion. Es folgt ln(−y(t)) = t+c, t ∈ on von y′ (t)· y(t) I, und weiter y(t) = −ec · et . Also muss y(t) = d · et , t ∈ I für ein reelles d ∈ (−∞, 0). Man beachte, dass wir von der Gültigkeit von y′ (t) = y(t) auf y(t) = d · et , t ∈ I geschlossen haben, wir uns also zunächst nicht sicher sein können, dass diese Funktion tatsächlich y′ (t) = y(t) löst. Durch Einsetzen zeigt man aber sofort, dass tatsächlich y(t) = d · et , t ∈ R, eine Lösung ist. 7.4. STAMMFUNKTION 185 Wir werden nun einige Funktionstypen auflisten und angeben, wie man die unbestimmten Integrale von diesen bestimmt. (i) Ist Rf (x) = xn , n ∈ N ∪ {0} auf R, so ist F(x) = 1 n+1 x + c. ist xn = n+1 1 n+1 n+1 x eine Stammfunktion. Also (ii) Ist f (x) = x−n , n ∈ N, n > 1 auf (−∞, 0) oder (0, +∞), so ist F(x) = eine Stammfunktion. 1 −n+1 −n+1 x (iii) Ist f (x) = x−1 , auf (−∞, 0) oder (0, +∞), so ist F(x) = ln |x|, x , 0 eine Stammfunktion. (iv) Um die Stammfunktion von ln x, x > 0 zu ermitteln, wenden wir die Partielle Integration an: Z Z Z 1 ln(x) = (x′ ) ln(x) = x ln(x) − x = x(ln(x) − 1) + c. x R sinh x = cosh x + c, cosh x = sinh x + c. R R (vi) sin x = − cos x + c, cos x = sin x + c. (v) R e x = e x + c, R (vii) Sei n ∈ N, n ≥ 2. Mit partieller Integration sieht man Z Z Z n n−1 n−1 cos t = (cos t) · (cos t) = (cos t)(sin t) + (n − 1) (cosn−2 t)(sin t)2 = (cosn−1 t)(sin t) + (n − 1) Z (cosn−2 t) − (n − 1) Z (cosn t). Also erhält man die Rekursionsgleichung Z Z n−1 1 (cosn−2 t). cosn t = (cosn−1 t)(sin t) + n n (viii) Mit Hilfe von (i) und der Substitutionsregel folgt (k ∈ N, k > 1) Z Z a a a = a ln |x − b| + c, = + c, (x − b) (x − b)k (−k + 1)(x − b)k−1 wobei man diese Funktionen auf einem Intervall betrachtet, das b nicht enthält. R 1 sin (ix) 1+x2 = arctan x + c. (Umkehrfunktion von tan = cos : (− 2π , π2 ) → R). R x 2 ′ (x) Um 1+x 2 zu ermitteln, wende man die Substitutionsregel auf h(x) = x , h (x) = 1 2x und f (y) = 1+y an: Z x 1 = 2 2 1+x Z 2x 1 = 2 2 1+x Z R = (xi) Ganz ähnlich sieht man x (1+x2 )k 1 1+y ! = y=x2 1 1 2(1−k) (1+x2 )k−1 1 1 (ln |1 + y|)y=x2 = ln |1 + x2 |. 2 2 für k ∈ N, k > 1. KAPITEL 7. DIFFERENTIALRECHNUNG 186 (xii) R 1 , (1+x2 )k k ∈ N, k > 1 lässt sich rekursiv berechnen, indem man t = arctan x ∈ (− π2 , π2 ) substituiert Z Z Z Z 1 1 1 1 = · = = cos2k−2 t = (1 + x2 )k (1 + x2 )k−1 (1 + x2 ) (tan2 t + 1)k−1 Z 1 2k − 3 2k−2 (cos t) · (tan t) + (cos2k−4 t) = 2k − 2 2k − 2 Z 1 1 x 2k − 3 · + . 2k − 2 (1 + x2 )k−1 2k − 2 (1 + x2 )k−1 (xiii) Ist nun allgemein f (x) = (D := q − 2 p 4 x+d , (x2 +px+q)k > 0), so schreibe f (x) = Um R und hat x2 + px + q keine reellen Nullstellen (x + 2p ) + (d − 2p ) ((x + 2p )2 + q − f (x) zu berechnen, substituiere Z 1 f (x) = k D Z √ Dy − Dy + p 2 √ p2 k 4 ) . = x(y): D(d − 2p ) (1 + y2 )k . Dieses Integral lässt sich mit Hilfe der oben behandelten Funktionen lösen. (xiv) Zu guter letzt noch Stammfunktion von C-wertigen Funktionen (w ∈ C): Z Z 1 eix = −ieix + c, ewx = ewx + c, w Z Z 1 wx x wx 1 x e = e − 2 ewx + c. xewx = ewx − w w w w P(x) , wobei Um die Stammfunktion einer beliebigen rationalen Funktion R(x) = Q(x) P(x) und Q(x) zwei reelle Polynome sind, zu ermitteln, werden wir diese in eine Summe von Funktionen entwickeln, deren Stammfunktionen wir eben kennengelernt haben. Als erstes folgt aus dem Euklidischen Algorithmus, dass P(x) = S (x)Q(x) + T (x), wobei S (x) und T (x) reelle Polynome sind, und wobei der Grad von T (x) kleiner als der von Q(x) ist. R R T (x) T (x) Das Integral von R(x) = S (x) + Q(x) ist daher S (x) + Q(x) . Das erste Integral T (x) weiter zerlegen. errechnet man leicht mit Hilfe von (i). Für das zweite müssen wir Q(x) Dazu betrachten wir zuerst die auftretenden Polynome als komplexe Polynome. Das hat den Vorteil, dass sich jedes komplexe Polynom bis auf eine Konstante als Produkt von Faktoren (z − z j ) schreiben lässt. 7.4.7 Satz. Seien T (z), Q(z) zwei komplexe Polynome, sodass der Grad n von Q(z) größer als der von T (z) ist. Schreiben wir Q(z) = an zn + · · · + a0 (an ∈ C \ {0}) als Q(z) = an (z − z1 )ν1 · · · · · (z − zm )νm , 7.4. STAMMFUNKTION 187 wobei zi , z j wenn i , j und wobei ν1 + · · · + νm = n, so gibt es eindeutige Zahlen a jk ∈ C, sodass (z < {z1 , . . . , zm }) ν j m T (z) X X a jk = . Q(z) (z − z j )k j=1 k=1 Beweis. Unser Problem ist äquivalent zur Existenz und Eindeutigkeit von Zahlen a jk , sodass (z ∈ C) νj m X m X Y 1 T (z) = a jk (z − z j )ν j −k (z − zl )νl . (7.16) an j=1 k=1 l=1,l, j Betrachte den Vektorraum Cn [z] aller komplexen Polynome vom Grad kleiner n. Dieser hat Dimension n. Kann man nun zeigen, dass die n Stück Polynome (z − z j )ν j −k m Y (z − zl )νl , j = 1, . . . , m, k = 1, . . . , ν j , l=1,l, j linear unabhängig in Cn [z] sind, so bilden sie sogar eine Basis, und unser Satz folgt sofort aus der Linearen Algebra. Wäre m Y X λ jk (z − z j )ν j −k (z − zl )νl = 0, j=1,...,m,k=1,...,ν j l=1,l, j und setzt man z = z1 , . . . , zm , so erhält man λ1ν1 = · · · = λmνm = 0. Nun kann man Qm j=1; ν j >1 (z − z j ) durchdividieren und erhält X j=1,...,m;k=1,...,ν j −1 λ jk (z − z j )ν j −1−k m Y (z − zl )νl −1 = 0. l=1,l, j Wiederholt man obige Argumentation, so folgt λ j(ν j −1) = 0 für alle j ∈ {1, . . . , m}, ν j > 1, usw. bis man schließlich λ jk = 0 für alle j = 1, . . . , m, k = 1, . . . , ν j erhält. ❑ Aus (7.16) sehen wir auch, wie man die Zahlen a jk gewinnen kann. In der Tat, kann man alle auftretenden Polynome ausmultiplizieren, und vergleicht dann die Koeffizienten, die bei jedem zk links und rechts vom Gleichheitszeichen stehen. Diese müssen übereinstimmen, und so erhält man n Gleichungen für n Unbekannte. Etwas weniger Arbeit hat man, wenn man den eben gebrachten Beweisgedanken einfließen lässt. Man kann nämlich in (7.16) nacheinander z = z1 , . . . , zm setzen und erhält so a jν j ganz leicht. Wir kehren zu unseren reellen Polynomen T (x) und Q(x) zurück. Wenn wir auf diese Satz 7.4.7 anwenden, hat das den Nachteil, dass man eine Partialbruchzerlegung mit möglicherweise nicht nur reellen Komponenten erhält. Um das wieder zu reparieren, schließt man zuerst aus Q(z̄) = Q(z) (Q(z) hat ja reelle Koeffizienten), dass mit z j auch z̄ j eine Nullstelle von Q(z) ist, und dass diese die gleiche Vielfachheit ν j haben. Somit sind die Nullstellen von Q(z) von der Form x1 , . . . , x p , z1 , . . . zq , z̄1 , . . . z̄q , wobei x j ∈ R und z j ∈ C+ := {z ∈ C : Im z > 0}. Die Partialbruchzerlegung aus Satz 7.4.7 lässt sich nun schreiben als ! µj q X p νj X c jk b jk T (z) X X a jk + + . = Q(z) (z − x j )k j=1 k=1 (z − z j )k (z − z̄ j )k j=1 k=1 KAPITEL 7. DIFFERENTIALRECHNUNG 188 T (z) T (z̄) = Q(z) , folgt aus der Eindeutigkeit der komplexen PartialbruchzerleDa aber auch Q(z̄) gung a jk ∈ R und c jk = b̄ jk , und man erhält ! ! b jk c jk b j (z − z̄ j )k + b̄ j (z − z j )k = , + (z − z j )k (z − z̄ j )k (z2 − 2z Re(z j ) + |z j |2 )k wobei das Polynom im Zähler ebenfalls reell ist. Summiert man nun über k auf, und bringt die Summe auf gemeinsamen Nenner, so erhält man eine Funktion der Form (z2 T j (x) , + B j z + C j )µ j wobei T j (x) ein reelles Polynom mit Grad kleiner 2µ j ist, und B j = −2 Re(z j ), C j = |z j |2 . Durch wiederholte Anwendung des Euklidischen Algorithmus kann man dieses Polynom als µj X (d jk z + e jk )(z2 + B jz + C j )µ j −k k=1 anschreiben. Somit folgt die Zerlegung ν µ j j XX d jk z + e jk T (z) X X a jk = + , k 2 + B z + C )k Q(z) (z − x ) (z j j j j=1 k=1 j=1 k=1 p q (7.17) welche nur reellen Zahlen beinhaltet. Dabei haben die z2 + B j z + C j klarerweise keine reellen Nullstellen. Zur Praktischen Berechnung der Koeffizienten a jk in (7.17) multipliziert man Q(z) links und rechts, und führt einen Koeffizientenvergleich durch. Durch Einsatzen von z = x j lassen sich die a jν j auch schneller berechnen. R T (x) Um Q(x) zu berechnen, genügt es nun die einzelnen Summanden in der Partialbruchzerlegung zu integrieren, und diese dann zu summieren. R 7.4.8 Beispiel. Wir wollen das Integral tan x dx auf einem Intervall I berechnen, wobei keine Nullstelle von cos x enthalten darf: Z Z Z sin x 1 i − tan x dx = dx =h dt = cos x t t=cos x dt=− sin xdx = − ln |t| + C = − ln | cos x| + C . Diese Methode beruht darauf, dass unser Integrand von der Gestalt f (t(x)) t′ (x) ist, und noch dazu mit einer sehr einfachen Funktion f . Daher können wir die Substitutionsregel unmittelbar anwenden und die entstehende Funktion leicht integrieren. R 7.4.9 Beispiel. Wir wollen das Integral x2 sin x dx auf einem beliebigen Intervall berechnen. Wir verwenden partielle Integration: Z Z Z 2 2 2 x sin x dx = x (− cos x) − 2x(− cos x) dx = −x cos x + 2 x cos x dx = 2 = −x cos x + 2 x sin x − Z sin x dx = −x2 cos x + 2x sin x + 2 cos x + C 7.4. STAMMFUNKTION 189 Mit dieser Methode kann man zum Beispiel alle Integrale von der Form Z Z Z x P(x)e dx, P(x) sin x dx, P(x) cos x dx , mit einem Polynom P berechnen. 7.4.10 Beispiel (Integration von R(e x )). Hat man eine Funktion f der Gestalt f (x) = R(e x ), wobei R eine rationale Funktion ist, so kann man deren Integral stets mit Hilfe der Substitution t = e x auf das Integral einer rationalen Funktion bringen. Denn es gilt, mit t = e x , Z Z 1 x R(t) dt R(e ) dx =h t=ex i t x dt=e dx dx= 1t dt R 2x −1 7.4.11 Beispiel. Wir wollen das Integral eex +2 dx auf R berechnen. Zunächst gilt Z Z 2x Z 2 x 2 (e ) − 1 e −1 t −1 1 i dx = dx =h · dt x x x t=e e +2 e +2 t+2 t 1 dx= t dt Man beachte, dass nach der Substitution t(x) = t in (0, +∞) liegt; also immer positiv ist. Nun haben wir ein Integral einer rationalen Funktion auf (0, +∞) zu berechnen. Dazu schreiben wir t2 − 1 t2 − 1 1 t2 + 2t − 2t − 1 2t + 1 · = 2 = =1− t+2 t t(t + 2) t + 2t t2 + 2t und versuchen nun den zweiten Summanden in Partialbrüche zu zerlegen: 2t + 1 A B (A + B)t + 2A = + = t(t + 2) t t+2 t(t + 2) Koeffizientenvergleich führt auf A = 1 2 und B = 32 . Also haben wir t2 − 1 1 1 3 · =1− − t+2 t 2t 2(t + 2) und daher Z 1 3 t2 − 1 1 · dt = t − ln t − ln(t + 2) = t+2 t 2 2 x 3 = e x − − ln(e x + 2) 2 2 7.4.12 Beispiel (Integration von R(sin x, cos x)). Hat man eine Funktion f der Gestalt f (x) = R(sin x, cos x), wobei R eine rationale Funktion ist, so kann man deren Integral stets mit Hilfe der Substitution t = tan 2x auf das Integral einer rationalen Funktion bringen. Denn es gilt, mit t = tan 2x , x sin x = 2 sin 2 tan 2 x x cos = 2 2 1 + tan2 x 2 = 2t 1 + t2 x 1 − t2 x x 1 − tan2 2 = − sin2 = 2 2 1 + tan2 2x 1 + t2 dt 1 x 2 = (1 + tan2 ) also dx = dt dx 2 2 1 + t2 cos x = cos2 190 KAPITEL 7. DIFFERENTIALRECHNUNG Literaturverzeichnis [EL] K.Endl,W.Luh: Analysis I-III, Aula Verlag, Wiesbaden 1986. [F] G.M.Fichtenholz: Differential- und Integralrechnung I-III, Deutscher Verlag der Wissenschaften, Berlin 1964. [H] H.Heuser: Lehrbuch der Analysis 1,2, Teubner Verlag, Stuttgart 1989. [L] S.Lang: A first course in calculus, Springer Verlag, Heidelberg 1986. [R] W.Rudin: Principles of Mathematical Analysis, McGraw-Hill, New York 1953, third edition 1976. [W] W.Walter: Analysis 1, Springer Verlag, Heidelberg, New York Tokoyo. 191 Index ǫ-Kugel, 99 C∞ (I), 165 Cn (I), 165 überall definiert, 4 Abbildung, 4 identische, 4 Abel Kriterium, 81 Ableitung einer Funktion, 164 höhere, 165 im Punkt x, 159 linksseitige, 159 rechtsseitige, 159 Abschluss, 101 absolut konvergent, 77 Addition, 9, 20 alternierende harmonische Reihe, 77 analytisch, 143 analytisch in einem Punkt, 143 Anschlussstelle, 177 Antisymmetrie, 12 Arcuscosinus, 154 Funktionsgraph, 155 Arcuscotangens, 154 Funktionsgraph, 155 Arcussinus, 154 Funktionsgraph, 155 Arcustangens, 154 Funktionsgraph, 155 Areacosinus Hyperbolicus, 155 Funktionsgraph, 156 Areacotangens Hyperbolicus, 156 Funktionsgraph, 157 Areasinus Hyperbolicus, 155 Funktionsgraph, 156 Areatangens Hyperbolicus, 156 Funktionsgraph, 157 Assoziativität, 7, 20 Auswahlaxiom, 55 Bernoullische Ungleichung, 19 beschränkt, 13 nach oben, 13 nach unten, 13 beschränkte Folge, 58 Menge, 58 Betrag komplexer Zahlen, 47 bijektiv, 5 Cauchy-Folge, 63 Cauchy-Kriterium, 137 Cauchysches Konvergenzkriterium Folgen, 64 Reihen, 77 Cauchysches Restglied, 177 Charakteristik, 38 Cosinus, 144 Funktionsgraph, 149 Cosinus Hyperbolicus, 155 Funktionsgraph, 156 Cotangens, 154 Funktionsgraph, 154 Cotangens Hyperbolicus Funktionsgraph, 157 Dedekindscher Schnitt, 43 Definitionsbereich, 5 dicht, 93 Dichteeigenschaft, 39 Differentialgleichung, 179, 184 Differentialgleichungen Trennung der Variablen, 184 Differenz, 2 differenzierbar n-mal, 165 im Punkt x, 159 rechtsseitig, 159 stetig, 165 Dirichlet Kriterium, 80 192 INDEX diskrete Metrik, 53 Distributivgesetz, 3 Distributivität, 20 divergent, 54, 73 bestimmt, 68 Dividieren mit Rest, 29 Doppelreihe, 87 Dreiecksungleichung, 16, 50 Dreiecksungleichung nach unten, 16 Einheitskreislinie, 103, 124 Einschränkung, 5 Elemente, 1 endlich, 25 Euklidischer Algorithmus, 186, 188 Eulersche Exponentialfunktion, 91 Eulersche Zahl, 148 Existenz des neutralen Elementes, 20 Exponentialfunktion, 91, 144 Funktionsgraph, 147 Extremum absolutes, 165 lokales, 165 faktorielle, 79 Folge, 54 Cauchy-Folge, 63 monoton fallende, 63 monoton wachsende, 63 monotone, 63 Rechenregeln für, 60 streng monoton fallend, 55 Formel von de Moivre, 145 Fortsetzung, 5 Funktion, 4 beschränkte, 58, 132 bijektive, 5 Einschränkung, 5 Fortsetzung, 5 injektive, 5 monoton fallende, 129 monoton wachsende, 129 stetige, 117 streng monoton fallende, 29, 129 streng monoton wachsende, 29, 129 surjektive, 5 unstetige, 127 zusammengesetzte, 6 Funktionen trigonometrische, 144 193 Funktionswert, 4 Gaußklammer, 118 Gaussche Zahlenebene, 47 gerichtete Menge, 109 Graph, 4 Grenzwert einer Funktion, 114 einseitige, 115 linksseitiger, 115 rechtsseitiger, 115 Häufungspunkt einer Folge, 104 einer Menge, 101 harmonische Reihe, 76 hebbare Unstetigkeit, 127 Hintereinanderausführung, 6 imaginäre Einheit, 46 Imaginärteil, 46 Induktions -anfang, 19 -prinzip, 19 -schritt, 19 Varianten d., 25 Infimum, 13 injektiv, 5 Integral unbestimmtes, 182 Intervall, 123 Involution, 27 isolierter Punkt, 101 Isometrie, 93 isometrisch, 93 isometrisch enthalten, 93 Körper angeordneter, 11 archimedisch angeordneter, 39 vollständig angeordneter, 40 Kürzungsregel, 20 kartesisches Produkt, 2 Kommutativität, 20 kompakt, 107 Komplement, 2 komplex differenzierbar, 161 konjugiert komplexen, 48 konvergent, 54, 73 absolut, 77 INDEX 194 bedingt, 77 gegen ±∞, 68 gegen x, 54 gleichmäßig, 133 punktweise, 132 Konvergenz gleichmäßige einer Funktionenfolge, 133 absolute einer Funktionenreihe, 138 absolute und gleichmäßige einer Funktionenreihe, 139 einer Folge, 54 eines Netzes, 110 gleichmäßige einer Funktionenreihe, 138 komponentenweise, 65 punktweise einer Funktionenfolge, 132 punktweise einer Funktionenreihe, 138 Konvergenzradius, 139 Kurvendiskussionen, 181 Lagranges Restglied, 177 leere Menge, 1 Leibniz Kriterium, 81 Lemma vom iterierten Supremum, 43 Limes Inferior, 105 Limes Superior, 105 linksstetig, 127 Logarithmus natürlicher, 147 naturalis, 147 Logarithmus naturalis Funktionsgraph, 147 lokale Eigenschaft, 118 Mächtigkeit, 25 Majorantenkriterium, 76 Maximum, 13 absolutes, 165 lokales, 165 Menge, 1 abgeschlossene, 101 Bild, 5 Differenz-, 2 Distributivgesetz-, 3 leere, 1 Ober-, 1 offene, 100 Potenz-, 3 Schnitt-, 2 Teil-, 1 Vereinigungs-, 2 zusammenhängende, 123 Mengen getrennte, 123 Mengengleichheit, 1 Metrik, 50 euklidische, 50 Supremums-, 133 metrischer Raum vollständiger, 64 Minimum, 13 absolutes, 165 lokales, 165 Minkowskische Ungleichung, 51 Minorantenkriterium, 76 Mittel arithmetisches, 12 Mittelwertsatz, 167 monoton fallend, 63, 129 monoton wachsend, 63, 129 Moore-Smith-Folge, 110 Multiplikation, 9, 20 Nachfolgerabbildung, 16 natürliche Zahlen, 16 Netz, 110 Norm, 53 obere Schranke, 13 Obermenge, 1 Partialbruchzerlegung komplexe, 186 reelle, 188 Partialsumme, 72 Permutation, 82 Pi, 149 Polarkoordinaten, 151 Polynom trigonometrisches, 153 Potenzmenge, 3 Potenzreihe, 143 Potenzreihen, 139 Primfaktorzerlegung, 30 Primzahl, 30 Produktregel, 162 Quotientenkörper, 38 INDEX Quotientenkriterium, 78 Quotientenregel, 162 Raabe Kriterium, 81 Raum metrischer, 50 Realteil, 46 rechtsstetig, 127 Reflexivität, 12 Regel von de L’Hospital, 170 Regel von der Partiellen Integration, 183 Reihe, 72 alternierende harmonische, 77 bestimmt divergente, 73 divergente, 73 geometrische, 57 harmonische, 76 konvergent gegen ±∞, 73 konvergente, 73 lineare Anordnung, 87 Potenzreihen, 139 Rechenregeln für, 73 Summe der, 73 Teleskop-, 75 Umordnung, 82 Riemann-Zerlegung, 110 195 Sprungstelle, 127 Stammfunktion, 182 stetig, 117 an der Stelle x, 117 gleichmäßig, 125 linksseitig, 127 rechtsseitig, 127 streng monoton fallend, 129 streng monoton wachsend, 129 Substitutionsregel, 183 Summensätze, 146 Supremum, 13 Supremumsnorm, 138 surjektiv, 5 Tangens, 154 Funktionsgraph, 154 Tangens Hyperbolicus Funktionsgraph, 157 Taylorreihe, 178 Taylorsche Polynom, 177 Teilfolge, 56 Teilfolgen gestattet, 111 Teilmenge, 1 Teilnetz, 111 Totalität, 12 Satz Transitivität, 12 1. Mittelwertsatz der Differenzial- Trennung der Variablen, 184 rechnung, 167 2. Mittelwertsatz der Differenzial- Unstetigkeit rechnung, 169 1. Art, 127 Cauchysches Konvergenzkriterium, 2. Art, 127 64, 77 hebbare, 127 Eindeutigkeits-, 18 Sprungstelle, 127 Einschluss-, 60 untere Schranke, 13 Fundamentalsatz der Algebra, 152 Urbild, 5 Leibniz Kriterium, 81 vollständiges, 5 Rekursions-, 17 Taylorscher Lehrsatz, 177 Vereinigungsmenge, 2 von Bolzano-Weierstraß, 104 Verknüpfung, 9 von Rolle, 166 vollständige Induktion, 19 Zwischenwertsatz, 124 Weierstraß Kriterium, 139 Schlömilchsches Restglied, 177 Wertebereich, 5 Schnittmenge, 2 wohldefiniert, 4 Schwarzsche Ungleichung, 51 Wurzel Sinus, 144 einer komplexen Zahl, 152 Funktionsgraph, 149 einer reellen Zahl ≥ 0, 41 Sinus Hyperbolicus, 155 Wurzelkriterium, 78 Funktionsgraph, 156 196 Zahl komplexe, 46 rationale, 34 Zahlen natürliche, 16 positive, 12 Zerlegung, 110 INDEX