Analysis 1 WS 2012-2013 Michael Kaltenbäck Inhaltsverzeichnis Vorwort iii 1 Mengen und Abbildungen 1.1 Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Die reellen Zahlen 2.1 Algebraische Struktur der reellen Zahlen 2.2 Ordnungsstruktur der reellen Zahlen . . 2.3 Die natürlichen Zahlen . . . . . . . . . 2.4 Der Ring der ganzen Zahlen . . . . . . 2.5 Der Körper Q . . . . . . . . . . . . . . 2.6 Archimedisch angeordnete Körper . . . 2.7 Das Vollständigkeitsaxiom . . . . . . . 2.8 Die komplexen Zahlen . . . . . . . . . 1 1 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 9 11 16 26 34 39 40 46 Der Grenzwert 3.1 Metrische Räume . . . . . . . . . . . . . . 3.2 Der Grenzwert in metrischen Räumen . . . 3.3 Folgen reeller und komplexer Zahlen . . . . 3.4 Monotone Folgen . . . . . . . . . . . . . . 3.5 Cauchy-Folgen . . . . . . . . . . . . . . . 3.6 Konvergenz in weiteren metrischen Räumen 3.7 Konvergenz gegen unendlich . . . . . . . . 3.8 Unendliche Reihen . . . . . . . . . . . . . 3.9 Konvergenzkriterien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 51 56 61 65 69 70 73 78 83 4 Die Konstruktion der reellen Zahlen 4.1 Existenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Eindeutigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 89 93 5 Geometrie metrischer Räume 5.1 ǫ-Kugeln, offene und abgeschlossene Mengen . . . 5.2 Kompaktheit . . . . . . . . . . . . . . . . . . . . . 5.3 Gerichtete Mengen und Netze . . . . . . . . . . . 5.4 Unbedingte Konvergenz und Umordnen von Reihen 5.5 Grenzwerte von Funktionen . . . . . . . . . . . . 3 i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 97 104 108 114 123 INHALTSVERZEICHNIS ii 6 Reelle und komplexe Funktionen 6.1 Stetigkeit . . . . . . . . . . . . . . . . . . . . 6.2 Der Zwischenwertsatz . . . . . . . . . . . . . 6.3 Gleichmäßige Stetigkeit . . . . . . . . . . . . . 6.4 Unstetigkeitsstellen . . . . . . . . . . . . . . . 6.5 Monotone Funktionen . . . . . . . . . . . . . . 6.6 Gleichmäßige Konvergenz . . . . . . . . . . . 6.7 Reell- und komplexwertige Folgen und Reihen 6.8 Die Exponentialfunktion . . . . . . . . . . . . 6.9 Fundamentalsatz der Algebra . . . . . . . . . . 6.10 Weitere wichtige elementare Funktionen . . . . 6.11 Abelscher Grenzwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 129 136 138 140 143 146 152 158 166 168 172 7 Differentialrechnung 7.1 Begriff der Ableitung . . 7.2 Mittelwertsätze . . . . . 7.3 Der Taylorsche Lehrsatz 7.4 Stammfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 175 182 191 197 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Literaturverzeichnis 205 Index 206 Vorwort Mit diesem Skriptum, liebe Studenten, möchte ich zu einem reibungslosen Start in ihr Mathematikstudium beitragen. Den in dieser Vorlesung auftretenden Begriffen, Konzepten und Ergebnissen werden Sie im ganzen Studium immer wieder begegnen. So Dinge wie Stetigkeit, Differenzierbarkeit und Konvergenz werden als selbstverständlich vorausgesetzt werden. Bei der Gestaltung dieses Skriptums habe ich versucht darauf zu achten, dass selbiges nicht nur als Lernunterlage, sondern auch zum Nachschlagen in späteren Semestern verwendet werden kann. Insbesondere findet sich ein ausführlicher Index am Ende des Skriptums. Obwohl die erste Analysis Vorlesung inhaltlich nicht viel Spielraum für den Vortragenden lässt, habe ich doch versucht, auf die Dinge besonderes Augenmerk zu legen, die mir in meiner Arbeit als Mathematiker und im Hinblick auf zukünftige Vorlesungen wichtig scheinen. Ich möchte aber auch betonen, dass das meine ganz persönliche Sicht der Materie ist. Es kann für Sie daher nur von Nutzen sein, wenn sie auch in andere Analysis Skripten bzw. Bücher schauen und daraus lernen, um einen größeren Blickwinkel zu bekommen. Das ersten Kapitel ist als Einführung in die mathematischen Grundlagen bewusst kurz gehalten, da diese in der parallel gehaltenen Vorlesung Lineare Algebra 1 ohnehin ausführlicher behandelt werden, und somit allzu viele Doppelgleisigkeiten vermieden werden. Schließlich möchte ich den vielen Kolleginnen und Kollegen aus mittlerweile vier Analysis Zyklen danken, die mich auf Fehler in den vorherigen Versionen dieses Skriptums aufmerksam gemacht haben, und somit ein viel weniger holpriges Werk ermöglicht haben. Bezüglich der noch versteckten Fehler möchte ich die Leser bitten, mir entdeckte Druckfehler mit Seiten und Zeilenangabe per Email zu schicken: [email protected] Michael Kaltenbäck Wien, im September 2012 iii iv VORWORT Kapitel 1 Mengen und Abbildungen 1.1 Mengen Die Objekte der modernen Mathematik sind die Mengen. Obwohl die Logik einen axiomatischen Zugang zur Mengenlehre bietet, wollen wir uns in dieser Vorlesung auf den naiven Mengenbegriff stützen. Interessierte Studenten seien auf die Vorlesungen über axiomatische Mengenlehre verwiesen. 1.1.1 Definition. Eine Menge ist eine Zusammenfassung von bestimmten, wohl unterschiedenen Objekten unserer Anschauung zu einem Ganzen. Die Objekte heißen Elemente der Menge. Ist x ein solches Element von M, so schreiben wir x ∈ M. Im Falle, dass x nicht zu M gehört, schreiben wir x < M. Möglichkeiten Mengen darzustellen sind die aufzählende Schreibweise: M = {a, b, c, d, e}, oder M = {1, 2, . . . } und die beschreibende Schreibweise: M = {x : x ist ungerade ganze Zahl}. 1.1.2 Definition. Sind A, B Mengen, so sagt man A ist gleich B (A = B), wenn sie die selben Elemente enthalten. Man sagt A ist eine Teilmenge von B (A ⊆ B), falls jedes Element von A auch ein Element von B ist. In diesem Fall bezeichnet man auch B als Obermenge von A (B ⊇ A). Will man zum Ausdruck bringen, dass dabei A mit B nicht übereinstimmt, so schreibt man A ( B. Schreibweisen wie A , B, A ) B, o.ä. sind dann selbsterklärend. Einer bestimmten Menge werden wir oft begegnen, nämlich der leeren Menge ∅, also der Menge, die keine Elemente enthält. Man beachte zum Beispiel, dass die Menge {a, b, c} gleich der Menge {c, a, b, a} ist, und dass z.B. die Menge {1, 3, 5, . . . } mit {x : x ist ungerade natürliche Zahl} übereinstimmt. 1 KAPITEL 1. MENGEN UND ABBILDUNGEN 2 Hat man zwei oder mehrere Mengen, so kann man diese in verschiedener Weise miteinander verknüpfen. 1.1.3 Definition. Seien A und B zwei Mengen: Die Menge A ∪ B = {x : x ∈ A oder x ∈ B} heißt die Vereinigungsmenge von A und B. Für A ∪ B sagt man kurz auch A vereinigt B. Die Menge A ∩ B = {x : x ∈ A und x ∈ B} heißt die Schnittmenge von A und B. Man sagt kurz auch A geschnitten B. Die Menge B \ A = {x : x ∈ B und x < A} ist die Differenz von B und A. Man sagt kurz auch B ohne A. Betrachtet man Teilmengen A einer fixen Grundmenge M, so schreiben wir auch Ac für M \ A und nennen es das Komplement von A in M, kurz A Komplement. A × B := {(x, y) : x ∈ A, y ∈ B} das kartesische Produkt der Mengen A und B. Das ist also die Menge, deren Elemente die geordneten Paare sind, deren erste Komponente zu A und deren zweite Komponente zu B gehört1 . Für A×A schreibt man auch A2 . Auch Durchschnitt und Vereinigung von mehr als zwei Mengen kann man analog definieren. Ist Mi , i ∈ I, eine Familie von Mengen, durch indiziert mit der Indexmenge I, so ist \ Mi := {x : x ∈ Mi für alle i ∈ I}, i∈I [ i∈I Mi := {x : es gibt ein i ∈ I mit x ∈ Mi }. Das kartesische Produkt endlich vieler Mengen ist analog wie jenes für zwei Mengen erklärt. Zum Beispiel ist A × B × C := {(x, y, z) : x ∈ A, y ∈ B, z ∈ C}. Für A × A × A schreibt man A3 , u.s.w. 1.1.4 Beispiel. Einfache Beispiele für Durchschnitts- bzw. Vereinigungsbildung wären: {1, 2, 3} ∩ {−1, 0, 1} = {1}, {a, b, 7} ∩ {3, 4, x} = ∅, {2, 3, 4, 5} ∪ {4, 5, 6, 7} = {2, 3, 4, 5, 6, 7}, {a, b, c} ∪ ∅ = {a, b, c}. Ist M2 = {x ∈ Z : es gibt ein y ∈ Z, sodass x = 2y}, so wäre Z \ M2 gerade die Menge der ungeraden ganzen Zahlen. Weiters ist {1, 2, 3, 4} \ {4, 5, 6, 7} = {1, 2, 3}, {a, b, c} \ ∅ = {a, b, c}. 1 Anm.: Ist x , y, so ist (x, y) , (y, x). 1.1. MENGEN 3 Bezeichnet man mit 2N die Menge der geraden natürlichen Zahlen, so ist das kartesische Produkt N × 2N die Menge N × 2N = {(1, 2), (1, 4), . . ., (2, 2), (2, 4), . . ., (3, 2), (3, 4), . . .}. 1.1.5 Definition. Ist M eine Menge, so bezeichnet man mit P(M) die Menge aller Teilmengen von M, P(M) = {A : A ⊆ M}. Diese Menge heißt die Potenzmenge von M. Sie ist also die Menge, deren Elemente alle Teilmengen von M sind. 1.1.6 Beispiel. Ist M = {1, 2, 3}, dann ist die Potenzmenge P(M) gleich P(M) = {∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}}. Die Potenzmenge der Menge N ist schon viel zu groß um sie noch in irgendeiner aufzählenden Weise anschreiben zu können. Sie enthält ja neben Mengen des Typs {1, 2, 3}, {4, 6, 7, 8, 1004} usw. auch noch unendliche Mengen wie zum Beispiel 2N oder {n ∈ N : n ≥ 27} und viele mehr. 1.1.7 Bemerkung. Für das Verknüpfen von Mengen gelten diverse Rechenregeln. Es gilt zum Beispiel das Distributivgesetz für drei Mengen A, B, C: A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C), (1.1) A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C). Um z.B. (1.1) nachzuweisen beachte man, dass zwei Mengen übereinstimmen, wenn ein beliebiges Element x genau dann in der einen Menge ist, wenn es auch in der anderen Menge ist: Ein x liegt in A ∩ (B ∪ C) genau dann, wenn x ∈ A und x ∈ B ∪ C. Das ist gleichbedeutend mit: x ∈ A, und x liegt zumindest in einer der Mengen B bzw. C. Diese Aussage ist aber äquivalent zu: Zumindest eine der Aussagen - x ∈ A und x ∈ B - oder - x ∈ A und x ∈ C - trifft zu. Nun ist das dasselbe, wie: x ∈ A ∩ B oder x ∈ A ∩ C. Schließlich gilt das genau dann, wenn x ∈ (A ∩ B) ∪ (A ∩ C). Den an einem kleinen Abriss des axiomatischen Zugangs zur Mengenlehre interessierten Leser möchte ich hier an die Vorlesung Lineare Algebra verweisen. KAPITEL 1. MENGEN UND ABBILDUNGEN 4 1.2 Funktionen 1.2.1 Definition. Seien M und N Mengen. Eine Teilmenge f ⊆ M × N wird als Funktion (oder auch als Abbildung) von M nach N bezeichnet, wenn (i) für alle x ∈ M gibt es ein y ∈ N : (x, y) ∈ f ; (ii) sind (x, y1 ) ∈ f und (x, y2 ) ∈ f , so folgt y1 = y2 . Die Menge M wird als Definitionsmenge und die Menge N als Zielmenge bzw. Wertevorrat bezeichnet. Die Bedingung (i) besagt, dass jedem x (mindestens) ein Funktionswert y zugeordnet wird, man sagt auch f ist überall definiert. Die Bedingung (ii) besagt, dass einem x höchstens ein Funktionswert zugeordnet wird. Man sagt auch f ist wohldefiniert. Eine Funktion von M nach N lässt sich also als eine Vorschrift auffassen, durch die jedem Element x aus der Menge M in eindeutiger Weise ein Element y aus der Menge N zugeordnet wird. Man schreibt y = f (x) und bezeichnet y als den Funktionswert von f an der Stelle x. Offenbar stimmen zwei Funktionen f und g von M nach N überein, also f = g, genau dann, wenn f (x) = g(x) für alle x ∈ M. Sieht man eine Funktion eher als Abbildungsvorschrift, dann unterscheidet man – obwohl mathematisch das Gleiche – die Funktion als Abbildungsvorschrift und die Funktion als Teilmenge von M × N, und man bezeichnet diese Teilmenge von M × N auch als Graph graph f von f . 1.2.2 Beispiel. Sei M die Menge aller Wörter in einem Wörterbuch. N = {1, 2, . . . } sei die Menge der natürlichen Zahlen. Sei nun f jene Funktion auf M, die jedem Wort die Anzahl seiner Buchstaben zuweist, d.h. f (’gehen’) = 5. 1.2.3 Beispiel. Wir haben im Abschnitt über Familien von Mengen Mi , i ∈ I, gesprochen, ohne genau zu sagen, was das bedeutet. Das ist nämlich die Funktion i 7→ Mi von der Indexmenge I in die Potenzmenge P(M), wobei M eine hinreichend große Menge ist, die alle Mengen Mi enthält, z.B. M = ∪i∈I Mi . Als Abbildungsvorschrift gibt man eine Funktion f von M nach N auch oft an als ( M → N f : . x 7→ f (x) Eine der wichtigen Funktionen soll nun derart angegeben werden. 1.2.4 Definition. Ist M eine Menge, so heißt die Abbildung ( M → M idM : x 7→ x die identische Abbildung auf der Menge M. Daher id M : M → M mit id M (x) = x. 1.2. FUNKTIONEN 5 1.2.5 Definition. Sei f eine Funktion von M nach N und sei A ⊆ M. Die Funktion, die jedem x ∈ A den Funktionswert f (x) zuweist, heißt Einschränkung von f auf A und wird mit f |A bezeichnet. Also f |A = {(x, y) ∈ f : x ∈ A}. Ist umgekehrt g eine Funktion von A nach N und M ⊇ A, so heißt eine Funktion f : M → N Fortsetzung von g, falls g = f |A . 1.2.6 Definition. Sei f eine Funktion von M nach N. Für eine Teilmenge A von M bezeichne f (A) = {y ∈ N : es gibt ein x ∈ A, sodass f (x) = y}, das Bild der Menge A unter der Abbildung f . Für f (M) schreibt man auch ran f (vom englischen Wort range). Diese Menge wird als Wertebereich bzw. Bildmenge von f bezeichnet. Das vollständige Urbild einer Teilmenge B von N ist die Menge f −1 (B) = {x ∈ M : f (x) ∈ B}. Für y ∈ N wird jedes x ∈ f −1 ({y}) als ein Urbild von y bezeichnet. 1.2.7 Bemerkung. Ist f : M → N eine Funktion, so muss die Zielmenge N im Allgemeinen nicht mit der Bildmenge f (M) übereinstimmen. Ist insbesondere B ⊆ N mit f (M) ⊆ B, so kann man f auch als Funktion von M nach B betrachten. 1.2.8 Beispiel. Betrachte zum Beispiel die Funktion n 7→ 2n von N in N. Natürlich kann man auch n 7→ 2n als Funktion von N in die Menge aller geraden natürlichen Zahlen betrachten. 1.2.9 Bemerkung. In manchen Zusammenhängen betrachtet man auch Funktionen, die nicht überall definiert sind. Das sind Teilmengen von f ⊆ M × N, die nur die Eigenschaft (ii) aus Definition 1.2.1 haben, d.h. dass es zu jedem Wert x ∈ M höchstens einen – also keinen oder genau einen – Funktionswert y ∈ N gibt. Eine interessante Menge ist dann offenbar der Definitionsbereich dom f (vom englischen Wort domain) der Funktion f : dom f = {x ∈ M : es gibt ein y ∈ N, sodass (x, y) ∈ f }. Betrachte zum Beispiel f := {(x, y) ∈ N2 : x = 2y}. (1.2) Offenbar ist dieses f eine nur auf der Menge der geraden Zahlen definierte Funktion. Folgende Begriffsbildung ist auf den ersten Blick nicht allzu kompliziert. Sie spielt aber in der Mathematik eine immens wichtige Rolle. 1.2.10 Definition. Sei f : M → N eine Funktion. f heißt KAPITEL 1. MENGEN UND ABBILDUNGEN 6 injektiv, wenn gilt f (x1 ) = f (x2 ) ⇒ x1 = x2 , d.h. zu jedem Wert y ∈ N gibt es höchstens ein Urbild. Äquivalent dazu ist, dass aus x1 , x2 folgt, dass f (x1 ) , f (x2 ). surjektiv, wenn es zu jedem y ∈ N ein x ∈ M gibt, sodass f (x) = y, oder äquivalent ran f = N. bijektiv, wenn sie sowohl injektiv als auch surjektiv ist. 1.2.11 Bemerkung. Man beachte, dass die Eigenschaft surjektiv, und somit auch bijektiv, zu sein, ganz wesentlich von der betrachteten Zielmenge der Funktion f abhängt. Denn ist etwa f : M → N eine beliebige Funktion, und betrachtet man f als Funktion von M nach f (M) und nicht nach N, so ist f : M → f (M) immer surjektiv. Vergleiche auch Bemerkung 1.2.7. 1.2.12 Beispiel. Folgende drei Beispiele zeigen insbesondere, dass keine der beiden Eigenschaften injektiv und surjektiv zu sein, die jeweils andere impliziert. Sei A die Menge aller in Österreich amtlich registrierten Staatsbürger, und sei f jene Funktion, die einer Person aus A ihre Sozialversicherungsnummer zuordnet. Dann ist f : A → N keine surjektive (es gibt ja nur endlich viele Österreicher), aber sehr wohl eine injektive Funktion, da zwei verschiedene Personen auch zwei verschiedene Sozialversicherungsnummern haben. Die Funktion g : A → N, die jeder Person ihre Körpergröße in Zentimeter (gerundet) zuordnet, ist weder injektiv noch surjektiv. Sei h : N → N die Funktion, die einer Zahl (dargestellt im Dezimalsystem) ihre Ziffernsumme zuordnet. Diese Funktion ist nicht injektiv (h(11) = 2 = h(2)), aber sie ist surjektiv, denn ist n ∈ N, so gilt sicherlich h(11 . . .} 1) = n. | {z n Stellen 1.2.13 Lemma. Sei f eine Funktion von M nach N. Ist f bijektiv, so ist f −1 = {(y, x) ∈ N × M : (x, y) ∈ f } eine bijektive Funktion von N nach M. Beweis. Ist y ∈ N, dann existiert ein x ∈ M mit y = f (x), da f surjektiv ist. Also ist die Forderung (i) von Definition 1.2.1 für f −1 erfüllt. Um auch (ii) nachzuprüfen, sei (y, x1 ), (y, x2 ) ∈ f −1 . Dann sind (x1 , y), (x2 , y) ∈ f und wegen der Injektivität von f folgt x1 = x2 . ❑ 1.2.14 Bemerkung. Man sieht am obigen Beweis, dass die Inverse f −1 einer injektiven Funktion f eine nicht notwendig überall definierte Funktion ist, vgl. Bemerkung 1.2.9. Ihr Definitionsbereich ist gerade ran f . Ist dagegen f nicht injektiv, so ist f −1 nicht einmal mehr eine nicht überall definierte Funktion. 1.2. FUNKTIONEN 7 Durch unmittelbares Nachprüfen der Definition sieht man, dass die Zusammensetzung von Funktionen wieder eine Funktion ist. 1.2.15 Definition. Seien f : M → N und g : N → P Funktionen. Dann bezeichne g ◦ f jene Funktion von M nach P, die durch (g ◦ f )(x) = g( f (x)), x ∈ M, definiert ist. Man bezeichnet g ◦ f oft auch als die zusammengesetzte Funktion oder als die Hintereinanderausführung von f und g. Ist f eine Abbildung von M nach N, so gilt immer f = f ◦ idM = idN ◦ f . Die Hintereinanderausführung ist assoziativ: Sind f : M → N, g : N → P und h : P → Q Funktionen so gilt (x ∈ M) ((h ◦ g) ◦ f )(x) = (h ◦ g)( f (x)) = h(g( f (x))) = h((g ◦ f )(x)) = (h ◦ (g ◦ f ))(x). Also gilt (h ◦ g) ◦ f = h ◦ (g ◦ f ). Als Konsequenz schreiben wir auch h ◦ g ◦ f dafür. 1.2.16 Bemerkung. Man kann g ◦ f auch als {(x, z) : ∃y ∈ N, (x, y) ∈ f, (y, z) ∈ g} (1.3) schreiben. Für Mengen M, N, P und beliebige Teilmengen f ⊆ M × N, g ⊆ N × P – also f und g sind nicht notwendigerweise Funktionen; man spricht von Relationen zwischen M und N bzw. zwischen N und P – kann man vermöge (1.3) auch g ◦ f definieren. Man spricht vom Relationenprodukt von f und g. 1.2.17 Bemerkung. Sind f und g nicht mehr überall definiert, so muss man bei der Komposition darauf achten, dass die Definitionsbereiche so zusammenpassen, dass der Bildbereich von f im Definitionsbereich von g enthalten ist. 1.2.18 Satz. Sei f : M → N eine Funktion. Ist f : M → N bijektiv, so gilt f −1 ◦ f = id M , f ◦ f −1 = idN . Ist umgekehrt g : N → M eine Funktion mit g ◦ f = id M , f ◦ g = idN , so ist f bijektiv und es gilt g = f −1 . Für bijektives f ist f −1 auch bijektiv, wobei ( f −1 )−1 = f . Sind f : M → N und h : N → P bijektiv, so gilt (h ◦ f )−1 = f −1 ◦ h−1 . Beweis. Sei zunächst f bijektiv. Offenbar gilt ( f −1 ◦ f )(x) = x, x ∈ M , und ( f ◦ f −1 )(y) = y, y ∈ N , (1.4) 8 KAPITEL 1. MENGEN UND ABBILDUNGEN wodurch f −1 ◦ f = idM , f ◦ f −1 = idN . Sei nun die Existenz einer Funktion g vorausgesetzt, die (1.4) erfüllt. Zu y ∈ N ist x = g(y) ein Element aus M, welches f (x) = f (g(y)) = idN (y) = y erfüllt. Also ist f surjektiv. Aus f (x1 ) = f (x2 ) folgt x1 = g( f (x1 )) = g( f (x2 )) = x2 , womit sich f als injektiv herausstellt. Also ist f bijektiv und hat damit eine Inverse, für die g = id M ◦g = ( f −1 ◦ f ) ◦ g = f −1 ◦ ( f ◦ g) = f −1 ◦ idN = f −1 gilt. Für bijektives f gilt f −1 ◦ f = id M , f ◦ f −1 = idN . Somit kann man das eben gezeigte auf f −1 : N → M anwenden, um die Bijektivität von f −1 zu folgern. Dabei gilt ( f −1 )−1 = f . Seien nun f : M → N und h : N → P bijektiv. Die Funktion e := f −1 ◦ h−1 erfüllt wegen der Assoziativität der Hintereinanderausführung e ◦ (h ◦ f ) = f −1 ◦ (h−1 ◦ h) ◦ f = f −1 ◦ idN ◦ f = f −1 ◦ f = idM , sowie (h ◦ f ) ◦ e = h ◦ ( f ◦ f −1 ) ◦ h−1 = h ◦ idN ◦h−1 = h ◦ h−1 = idP . Nach dem ersten Teil des Satzes gilt e = (h ◦ f )−1 . ❑ Kapitel 2 Die reellen Zahlen Die reellen Zahlen sind uns anschaulich schon aus der Schule bekannt. Wir wollen im Folgenden die charakteristischen Eigenschaften der reellen Zahlen sammeln, von denen wir dann sehen werden, dass diese die reellen Zahlen (bis auf isomorphe Kopien) eindeutig bestimmen. Dass es die reellen Zahlen (also eine Menge mit den charakteristischen Eigenschaften) unter der Annahme der Gültigkeit der Mengenlehre überhaupt gibt, werden wir später sehen. 2.1 Algebraische Struktur der reellen Zahlen Zuerst wollen wir uns den Operationen + und ·, also der algebraischen Struktur, zuwenden. Die reellen Zahlen mit diesen Operationen sind ein so genannter Körper: 2.1.1 Definition. Sei K eine nichtleere Menge, und es seien Abbildungen (sogenannte Verknüpfungen) + : K × K → K (Addition) und · : K × K → K (Multiplikation) gegeben. Das Tripel hK, +, ·i heißt Körper, falls es zwei ausgezeichnete Elemente 0, 1 ∈ K gibt, sodass folgende Gesetze (Axiome) gelten. Wir schreiben dabei x + y für +(x, y) und x · y für ·(x, y). (a1) Die Addition ist assoziativ: (x + y) + z = x + (y + z), für alle x, y, z ∈ K. (a2) 0 ist ein neutrales Element bezüglich +: x + 0 = x, für alle x ∈ K. (a3) Jedes Element x ∈ K besitzt ein Inverses −x ∈ K bezüglich +: x + (−x) = 0, für alle x ∈ K. (a4) Die Addition ist kommutativ: x + y = y + x, für alle x, y ∈ K. 9 KAPITEL 2. DIE REELLEN ZAHLEN 10 (m1) Die Multiplikation ist assoziativ: (x · y) · z = x · (y · z), für alle x, y, z ∈ K. (m2) 1 ist ein neutrales Element von K \ {0} bezüglich ·: x · 1 = x, für alle x ∈ K \ {0}. (m3) Jedes von 0 verschiedene Element x besitzt ein Inverses bezüglich ·: x · x−1 = 1, für alle x ∈ K \ {0}. (m4) Die Multiplikation ist kommutativ: x · y = y · x, für alle x, y ∈ K. (d) Es gilt das Distributivgesetz: x · (y + z) = (x · y) + (x · z), für alle x, y, z ∈ K. 2.1.2 Bemerkung. Da hK, +i und hK \ {0}, ·i Gruppen sind, folgt, dass die jeweiligen neutralen Elemente 0 bzw. 1 eindeutig bestimmt sind1 . Wäre nämlich etwa 0̃ ein weiters neutrales Element bezüglich +, so folgte aus (a2) und (a4), dass 0 = 0̃ + 0 = 0̃. Dasselbe gilt für die Inversen −a und a−1 . Wäre etwa ã ein weiteres additiv Inverses zu a, also a + ã = 0, so folgte ã = ã + (a + (−a)) = (ã + a) +(−a) = 0 + (−a) = −a. | {z } | {z } =0 =0 Somit ist x 7→ −x eine – wie aus unten stehenden Rechenregeln folgt – bijektive Funktion von K auf sich selbst und x 7→ x−1 eine bijektive Funktion von K \ {0} auf sich selbst. Siehe dazu die Lineare Algebra Vorlesung. 2.1.3 Beispiel. Man betrachte die Menge K = {≬, ⋔}. Die Verknüpfungen + und · seien gemäß folgender Verknüpfungstafeln definiert. + ≬ ⋔ ≬ ≬ ⋔ ⋔ ⋔ ≬ · ≬ ⋔ ≬ ≬ ≬ ⋔ ≬ ⋔ Man erkennt unschwer, dass alle Anforderungen an einen Körper, d.h. Axiome (a1) − (a4), (m1) − (m4), (d), erfüllt sind, wobei ≬ des neutrale 0 Element bezüglich + und ⋔ des neutrale Element 1 bezüglich · ist. Es sei noch bemerkt, dass jeder Körper mindestens zwei Elemente hat, und somit der hier vorgestellte Körper kleinst möglich ist. 1 Die ausgezeichneten Elemente 0 und 1 sind zunächst von den gleich bezeichneten, bekannten ganzen Zahlen zu unterscheiden. Sie haben lediglich ähnliche Eigenschaften. Um zu betonen, dass es sich um das additiv bzw. multiplikativ neutrale Element von K handelt, schreibt man auch 0K bzw. 1K . 2.2. ORDNUNGSSTRUKTUR DER REELLEN ZAHLEN 11 Wir werden xy für x · y und, falls y , 0, für xy−1 oft yx schreiben. Um Klammern zu sparen, wollen wir auch übereinkommen, dass Punkt- vor Strichrechnung kommt, also zB. xy + xz = (xy) + (xz). Schließlich werden wir für x + (−y) bzw. (−x) + y auch x − y bzw. −x + y schreiben. 2.1.4 Lemma. Für einen Körper hK, +, ·i gelten folgende Rechenregeln: (i) Die Inverse von der Inversen ist die Zahl selbst: −(−x) = x, x ∈ K und (x−1 )−1 = x, x ∈ K \ {0}. (ii) −(x + y) = (−x) + (−y), x, y ∈ K. (iii) x · 0 = 0, x, y , 0 ⇒ x · y , 0 und (xy)−1 = x−1 y−1 , sowie (−x)−1 = −(x−1 ). Insbesondere (−1)(−1) = 1. (iv) x(−y) = −xy, (−x)(−y) = xy, x(y − z) = xy − xz. (v) ac bd = ac bd . Beweis. Exemplarisch wollen wir x · 0 = 0 und −(x + y) = (−x) + (−y) nachweisen. Wegen (a2) gilt 0 + 0 = 0 und mit (d) damit auch x · 0 = x · (0 + 0) = x · 0 + x · 0. Addieren wir das nach (a3) existierende additiv Inverse von x · 0, so folgt mit Hilfe von (a1), dass 0 = x · 0 + (−x · 0) = (x · 0 + x · 0) + (−x · 0) = x · 0 + (x · 0 + (−x · 0)) = x · 0 + 0 = x · 0 Wegen dem Kommutativgesetz und Assoziativgesetz gilt (x + y) + ((−x) + (−y)) = ((x + y) + (−x)) + (−y) = ((y + x) + (−x)) + (−y) = (y + (x + (−x))) + (−y) = ((y + 0) + (−y)) = y + (−y) = 0. Also ist (−x) + (−y) eine additiv Inverse von x + y. Wegen Bemerkung 2.1.2 ist diese additiv Inverse aber eindeutig. Also (−x) + (−y) = −(x + y). ❑ Schließlich wollen wir noch einige Schreibweisen festlegen: Ist A Teilmenge unseres Körpers K, so sei −A = {−a : a ∈ A}. Also ist −A das Bild von A unter der Abbildung − : K → K. Sind A, B ⊆ K, so sei A + B = {a + b : a ∈ A, b ∈ B}. Somit ist A + B das Bild von A × B (⊆ K × K) unter der Abbildung + : K × K → K. Entsprechend seien A−1 , A − B, etc. definiert. 2.2 Ordnungsstruktur der reellen Zahlen Eine weitere wichtige Eigenschaft der reellen Zahlen ist die, dass man je zwei Zahlen x und y der Größe nach vergleichen kann. Dabei ist bekannterweise x < y genau dann, wenn y − x eine positive reelle Zahle ist. Um diesen Sachverhalt mathematisch zu fassen, definieren wir KAPITEL 2. DIE REELLEN ZAHLEN 12 2.2.1 Definition. Sei hK, +, ·i ein Körper und sei P ⊆ K. Dann heißt K (streng genommen hK, +, ·, Pi) ein angeordneter Körper, wenn gilt, dass 2 ˙ ∪(−P), ˙ (p1) K = P∪{0} wobei P, −P disjunkt3 , und beide 0 nicht enthalten; (p2) x, y ∈ P ⇒ x + y ∈ P; (p3) x, y ∈ P ⇒ xy ∈ P. Die Menge P heißt die Menge der positiven Zahlen. Für x, y ∈ K sagen wir, dass x kleiner als y ist, in Zeichen x < y, wenn y − x ∈ P; x größer als y ist, in Zeichen x > y, wenn x − y ∈ P; x kleiner oder gleich y ist, in Zeichen x ≤ y, wenn x < y oder x = y; x größer oder gleich y ist, in Zeichen x ≥ y, wenn x > y oder x = y. 2.2.2 Lemma. In einem angeordneten Körper K gelten für beliebige a, b, x, y, z ∈ K folgende Regeln: (i) x ≤ x (Reflexivität). (ii) (x ≤ y ∧ y ≤ x) ⇒ x = y (Antisymmetrie). (iii) (x ≤ y ∧ y ≤ z) ⇒ x ≤ z (Transitivität). (iv) x ≤ y ∨ y ≤ x (Totalität). (v) (x ≤ y ∧ a ≤ b) ⇒ x + a ≤ y + b. (vi) x ≤ y ⇒ −x ≥ −y. (vii) (z > 0 ∧ x ≤ y) ⇒ xz ≤ yz und (z < 0 ∧ x ≤ y) ⇒ xz ≥ yz. (viii) x , 0 ⇒ x2 > 0. Insbesondere: 1 > 0. (ix) x > 0 ⇒ x−1 > 0 und x < 0 ⇒ x−1 < 0. (x) 0 < x ≤ y ⇒ ( yx ≤ 1 ≤ y x ∧ x−1 ≥ y−1 ). (xi) (0 < x ≤ y ∧ 0 < a ≤ b) ⇒ xa ≤ yb. (xii) x < y ⇒ x < x+y 2 < y, wobei 2 := 1 + 1. Beweis. Wir beweisen exemplarisch (ii), (iii), (viii) und (xii): (ii): (x ≤ y ∧ y ≤ x) ist per Definitionem dasselbe, wie y − x ∈ P ∪ {0} ∧ x − y ∈ P ∪ {0}. Also y − x ∈ (P ∪ {0}) ∩ (−P ∪ {0}) = {0}, und damit x = y. 2 Der Punkt über ∪ soll die Disjunktheit der Mengen anzeigen. ihr Schnitt ist leer. 3 Also 2.2. ORDNUNGSSTRUKTUR DER REELLEN ZAHLEN 13 (iii): (x ≤ y ∧ y ≤ z) ⇔ (y − x ∈ P ∪ {0} ∧ z − y ∈ P ∪ {0}). Aus (p2) folgt z − x = (z − y) + (y − x) ∈ P ∪ {0}, also x ≤ z. (viii): Aus x , 0 folgt x ∈ P ∪ −P. Ist x ∈ P, so folgt wegen (p3), dass x2 = xx ∈ P und damit x2 > 0. Ist x ∈ −P, so folgt −x ∈ P und wieder wegen (p3), dass x2 = xx = (−x)(−x) ∈ P. (xii): Aus x < y und (v) folgt x + x < x + y < y + y. Nun ist wegen dem Distributivgesetz x + x = x(1 + 1) und y + y = y(1 + 1). Da wegen (p2), 1 + 1 ∈ P, folgt aus (vii), dass x < x+y 2 < y. ❑ 2.2.3 Bemerkung. Die Eigenschaften (i)−(iii) besagen genau, dass ≤ eine Halbordnung auf K ist. Eigenschaft (iv) bedeutet dann, dass diese Halbordnung sogar eine Totalordnung ist. Man kann also einen angeordneten Körper als Gerade veranschaulichen, wobei eine Zahl x genau dann links von einer anderen Zahl y liegt, wenn sie kleiner ist: 0 x y K Abbildung 2.1: Zahlengerade 2.2.4 Definition. Sei K eine Menge und ≤ eine Totalordnung darauf. Sind x, y ∈ K, so sei max(x, y) das Maximum von x und y. Also max(x, y) = x, falls x ≥ y, und max(x, y) = y falls y ≥ x. Entsprechend definiert man das Minimum min(x, y) zweier Zahlen. Ist A ⊆ K, und gibt es ein a0 ∈ A, sodass a ≤ a0 (a0 ≤ a) für alle a ∈ A, so nennt man a0 das Maximum (Minimum) von A, und schreibt a0 = max A (a0 = min A). Zum Maximum (Minimum) sagt man auch größtes (kleinstes) Element. Ist A ⊆ K, so heißt A nach oben beschränkt, falls es ein x ∈ K gibt, sodass A ≤ x, sodass also a ≤ x für alle a ∈ A. Jedes x ∈ K mit A ≤ x heißt dabei obere Schranke von A. Entsprechend heißt eine Teilmenge A nach unten beschränkt, wenn es eine untere Schranke in K hat, wenn also x ≤ A für ein x ∈ K. Eine nach oben und nach unten beschränkte Teilmenge heißt beschränkt. Sei A ⊆ K eine nach oben (unten) beschränkte Teilmenge. Hat nun die Menge {x ∈ K : A ≤ x} ({x ∈ K : x ≤ A}) aller oberen (unteren) Schranken von A ein Minimum (Maximum), so heißt dieses Supremum (Infimum) von A und wird mit sup A (inf A) bezeichnet. Die Tatsache, dass eine Menge A ⊆ K nicht nach oben (nicht unten) beschränkt ist wollen wir mit der formalen Gleichheit sup A = +∞ (inf A = −∞) zum Ausdruck bringen. 2.2.5 Bemerkung. Man sieht leicht, dass jedes Maximum (Minimum) einer Teilmenge auch Supremum (Infimum) dieser Teilmenge ist. Die Umkehrung gilt im Allgemeinen nicht. KAPITEL 2. DIE REELLEN ZAHLEN 14 obere Schranken von M M sup M Abbildung 2.2: Supremum der Menge M Es kann auch vorkommen, dass eine beschränkte Teilmenge von K weder ein Supremum, noch ein Infimum hat. 2.2.6 Bemerkung. Wenn das Supremum einer Teilmenge A existiert, so gilt gemäß der Definition A ≤ sup A, und sup A ≤ x für alle oberen Schranken x von A. Ist umgekehrt y ∈ K mit A ≤ y und y ≤ x für alle oberen Schranken x von A, so folgt aus A ≤ y, dass y eine obere Schranke von A ist, und aus der zweiten Voraussetzung, dass y das Minimum der oberen Schranken von A ist. Also ist y = sup A. Entsprechendes lässt sich für das Infimum sagen. 2.2.7 Lemma. Ist A ⊆ B ⊆ K, so gilt (i) {x ∈ K : A ≤ x} ⊇ {x ∈ K : B ≤ x} und {x ∈ K : x ≤ A} ⊇ {x ∈ K : x ≤ B}. (ii) Haben A und B ein Maximum (Minimum), so folgt max A ≤ max B (min A ≥ min B). (iii) Haben A und B ein Supremum (Infimum), so folgt sup A ≤ sup B (inf A ≥ inf B). Beweis. (i) t ∈ {x ∈ K : B ≤ x} bedingt b ≤ t für alle b ∈ B. Wegen A ⊆ B gilt auch a ≤ t für alle a ∈ A, und daher t ∈ {x ∈ K : A ≤ x}. Die zweite Mengeninklusion beweist man genauso. (ii) Das Maximum von B erfüllt definitionsgemäß max B ≥ b für alle b ∈ B, und damit insbesondere max B ≥ a für alle a ∈ A. Wegen max A ∈ A folgt insbesondere max B ≥ max A. Analog zeigt man min A ≥ min B. (iii) Definitionsgemäß haben wir sup A = min{x ∈ K : A ≤ x} und sup B = min{x ∈ K : B ≤ x}. Nach (i) ist {x ∈ K : B ≤ x} ⊆ {x ∈ K : A ≤ x} und daher nach (ii) sup A = min{x ∈ K : A ≤ x} ≤ min{x ∈ K : B ≤ x} = sup B. ❑ Ist K ein angeordneter Körper, so gelten für die oben eingeführten Begriffe einfach nachzuprüfende Rechenregeln: (i) Aus x ≤ A ⇔ −x ≥ −A folgt, dass A ⊆ K genau dann nach oben (unten) beschränkt ist, wenn −A nach unten (oben) beschränkt ist. (ii) min(−A) = − max A, max(−A) = − min A, (iii) inf(−A) = − sup(A), sup(−A) = − inf(A). 2.2. ORDNUNGSSTRUKTUR DER REELLEN ZAHLEN 15 Diese Gleichheiten gelten in dem Sinn, dass die linke Seite des Gleichheitszeichen genau dann existiert, wenn die rechte existiert. 2.2.8 Beispiel. Seien a, b ∈ K. Dann definiert man die Intervalle (a, b) := {x ∈ K : a < x < b}, (a, b] := {x ∈ K : a < x ≤ b}, und entsprechend [a, b] := {x ∈ K : a ≤ x ≤ b}, [a, b) := {x ∈ K : a ≤ x < b}. Außerdem setzt man (+∞, −∞ sind hier nur formale Ausdrücke) (−∞, b) := {x ∈ K : x < b}, (−∞, b] := {x ∈ K : x ≤ b}, (a, +∞) := {x ∈ K : a < x}, [a, +∞) := {x ∈ K : a ≤ x}. Ist a < b, so sind die Mengen (a, b), [a, b], (a, +∞) z.B. nach unten beschränkt. Nach oben beschränkt sind dagegen nur die ersten beiden. Die Mengen (a, b), (a, b] haben das Supremum b, aber nur für die Menge (a, b] ist b ein Maximum. Um etwa einzusehen, dass b = sup(a, b) argumentiert man folgendermaßen: Zunächst ist wegen der Definition von Intervallen x ≤ b für alle x ∈ (a, b), also (a, b) ≤ b. Angenommen es gäbe eine obere Schranke y von (a, b) mit y < b. Im Falle y ≤ a wäre y ≤ a < a+b 2 < b (vgl. Lemma 2.2.2, (xii)), womit aber y keine obere Schranke a+b sein kann, da 2 ∈ (a, b). Im Falle a < y wäre a < y < y+b 2 < b, womit wiederum y keine obere Schranke sein y+b kann, da 2 ∈ (a, b). Also ist b tatsächlich die kleinste obere Schranke von (a, b), sup(a, b) = b. 2.2.9 Beispiel. Dem Begriff der rationalen Zahlen vorgreifend seien K die rationalen Zahlen und sei M = {x ∈ K : x2 < 2}. Dann hat diese Menge weder Maximum noch Supremum, obwohl sie nach oben beschränkt ist. Siehe dazu Satz 2.7.5. Wir wollen noch zwei elementare Funktionen auf einem angeordneten Körper betrachten. 2.2.10 Definition. Sei hK, +, ·, Pi ein angeordneter Körper. Die Signumfunktion sgn sei jene Funktion von K nach K, sodass für x ∈ K 1 , falls x ∈ P 0 , falls x = 0 . sgn(x) = −1 , falls x ∈ −P Für x , 0 heißt sgn(x) auch das Vorzeichen von x. Die Betragsfunktion |.| : K → K ist definiert durch ( x , falls x ∈ P ∪ {0} |x| = . −x , falls x ∈ −P Sind x, y ∈ K, so bezeichnet man |x − y| auch als den Abstand von x und y. KAPITEL 2. DIE REELLEN ZAHLEN 16 2.2.11 Lemma. Für x, y ∈ K gilt: (i) |x| = sgn(x)x. (ii) |xy| = |x||y|. (iii) |x + y| ≤ |x| + |y| (Dreiecksungleichung). (iv) |x + y| ≥ ||x| − |y|| (Dreiecksungleichung nach unten). (v) max(x, y) = x+y+|x−y| , 2 min(x, y) = x+y−|x−y| . 2 Beweis. (i) und (ii) folgen ganz leicht, wenn wir die Fälle x > 0, x = 0, x < 0 unterscheiden. Die Dreiecksungleichung folgt unmittelbar, wenn eine der Zahlen x oder y Null ist. Sonst unterscheiden wir folgende zwei Fälle: sgn(x) = sgn(y) , 0 ⇒ |x + y| = | sgn(x)(|x| + |y|)| = |x| + |y| sgn(x) = − sgn(y) , 0 ⇒ |x + y| = | sgn(x)(|x| − |y|)| = ||x| − |y|| ≤ |x| + |y| Letztere Ungleichung gilt, da sowohl |x| − |y| ≤ |x| + |y|, als auch −(|x| − |y|) = |y| − |x| ≤ |x| + |y|. Um die Dreiecksungleichung nach unten einzusehen, bemerke |x| = |(x + y) + (−y)| ≤ |x + y| + |y|, (2.1) also |x| − |y| ≤ |x + y|. Analog folgt |y| ≤ |x + y| + |x|, also auch |y| − |x| ≤ |x + y|. Mit einer ähnlichen Fallunterscheidung beweist man die Aussage (v). ❑ 2.3 Die natürlichen Zahlen Ob es die oben diskutierten angeordneten Körper überhaupt gibt, davon haben wir uns bisher nicht überzeugen können. Um solche Objekte zu konstruieren, wenden wir uns zunächst den natürlichen Zahlen zu. Die natürlichen Zahlen sind uns als Objekt des Alltages wohlvertraut, aber ihre Existenz als mathematisches Objekt ist keine Trivialität. Trotzdem wollen wir diese voraussetzen. In der Tat folgt sie aus den Axiomen der Mengenlehre. 2.3.1 Definition. Die natürlichen Zahlen sind eine Menge N, in der ein Element 1 ∈ N ausgezeichnet ist,4 und auf der eine Funktion (Nachfolgerabbildung) ′ : N → N definiert ist, sodass gilt (S1) ′ ist injektiv. (S2) Es gibt kein n ∈ N mit n′ = 1. 4 Die Bezeichnung 1 hat zumindest zum gegenwärtigen Zeitpunkt nichts mit der gleichlautenden Bezeichnung für das multiplikative neutrale Element in einem Körper zu tun. 2.3. DIE NATÜRLICHEN ZAHLEN 17 (S3) Ist M ⊆ N, 1 ∈ M und m′ ∈ M für alle m ∈ M, so ist M = N. Für n′ wollen wir auch n + 1 schreiben. 2.3.2 Bemerkung. Wir wollen anmerken, dass wir zunächst weder die Abbildungen +, ·, die N × N nach N abbilden, noch die Möglichkeit zwei natürliche Zahlen der Größe nach zu ordnen, zur Verfügung haben. Obige Festlegung, dass n′ = n + 1 ist nur symbolisch zu verstehen. Ehe wir uns an die Definition von Addition und Multiplikation machen, wollen wir P uns die Möglichkeit schaffen, Ausdrücke, wie nx, xn , nk=1 c(k) für n ∈ N zu definieren, wenn z.B. x und c(k) für k ∈ N Elemente eines Körpers sind. Alle diese Ausdrücke haben gemein, dass sie Funktionen n 7→ φ(n) auf N sind, wobei φ(1) bekannt ist, und wobei φ(n′ ) bekannt ist, wenn φ(n) es ist. Im Falle von ′ n 7→ xn ist etwa x1 = x und xn = xn · x. Um einzusehen, warum solche Funktionen eindeutig definiert sind, zeigen wir den 2.3.3 Satz (Rekursionssatz). Sei A eine Menge, a ∈ A, g : A → A (Rekursionsfunktion). Dann existiert genau eine Abbildung φ : N → A mit φ(1) = a und φ(n′ ) = g(φ(n)). Beweis. Betrachte alle Teilmengen H ⊆ N × A mit den Eigenschaften (a) (1, a) ∈ H (b) Ist (n, b) ∈ H, so gilt auch (n′ , g(b)) ∈ H. Solche Teilmengen existieren, da z.B. N × A die Eigenschaften (a) und (b). Sei D der Durchschnitt aller solchen Teilmengen: \ D := H H erfüllt (a) und (b) Da (1, a) ∈ H für alle H, die (a) und (b) erfüllen, ist auch (1, a) ∈ D. Ist (n, b) ∈ D, so gilt (n, b) ∈ H für alle (a) und (b) erfüllenden H. Nach (b) folgt (n′ , g(b)) ∈ H für alle solchen H, und somit (n′ , g(b)) ∈ D. Also hat D auch die Eigenschaften (a) und (b), und ist damit die kleinste Teilmenge mit diesen Eigenschaften. Wir behaupten, dass D eine Funktion von N nach A ist, also, dass es zu jedem n ∈ N genau ein b ∈ A gibt, sodass (n, b) ∈ D, vgl. Definition 1.2.1. Dazu reicht es zu zeigen, dass5 M = {n ∈ N : ∃! b ∈ A, (n, b) ∈ D} mit N übereinstimmt. Wir prüfen das mit Hilfe von (S 3) nach. Zunächst ist 1 ∈ M, da einerseits (1, a) ∈ D. Gäbe es andererseits ein weiteres c ∈ A, c , a mit (1, c) ∈ D, so betrachte D \ {(1, c)}. Klarerweise hat D \ {(1, c)} die Eigenschaft (a). Wegen (S 2) bleibt auch die Eigenschaft (b) erhalten. Ein Widerspruch dazu, dass D kleinstmöglich ist. Nun zeigen wir, dass mit n auch n′ in M liegt. Für n ∈ M gibt es aber genau ein b ∈ A mit (n, b) ∈ D. Also ist auch (n′ , g(b)) ∈ D. Wäre noch (n′ , c) ∈ D mit c , g(b), so kann man wieder D \ {(n′ , c)} betrachten. Weil n′ , 1, erfüllt D \ {(n′ , c)} Eigenschaft (a). Aus (k, d) ∈ D \ {(n′ , c)} ⊆ D folgt (k′ , g(d)) ∈ D. Ist k , n, so folgt wegen (S 1) daher auch (k′ , g(d)) , (n′ , c). Ist n = k, so muss wegen n ∈ M die Gleichheit d = b 5 ∃! steht für: Es gibt genau ein KAPITEL 2. DIE REELLEN ZAHLEN 18 gelten. Es folgt (k′ , g(d)) = (n′ , g(b)) , (n′ , c). In jedem Fall gilt also (k′ , g(d)) ∈ D \ {(n′ , c)}, und D \ {(n′ , c)} erfüllt auch (b). Das ist wieder ein Widerspruch dazu, dass D kleinstmöglich ist. Aus (S 3) folgt M = N. Nach Definition 1.2.1 kann man also D auffassen als Abbildung φ : N → A. Die Eigenschaft (a) bedeutet φ(1) = a, und (b) besagt φ(n′ ) = g(φ(n)). Wäre φ̃ eine weitere Funktion mit φ̃(1) = a und mit φ̃(n′ ) = g(φ̃(n)), und betrachtet man φ̃ als Teilmenge D̃ von N × A, so erfüllt D̃ Eigenschaften (a), (b). Weil wir schon wissen, dass D die kleinste solche Menge ist, folgt D ⊆ D̃. Da aber beide Funktionen sind, muss D = D̃ bzw. φ = φ̃. ❑ 2.3.4 Bemerkung. Satz 2.3.3 rechtfertigt rekursive Definitionen: Zum Beispiel die Funktion n 7→ xn , wobei x in einem Körper K liegt. Dafür nehmen wir A = K, a = x und g : K → K, y 7→ yx. Nach Satz 2.3.3 ist dann xn für alle n ∈ N eindeutig definiert. Genauso kann man n 7→ nx definieren. Q Um n 7→ nk=1 c(k) zu definieren, wenn c : N → K ist, wenden wir Satz 2.3.3 mit A = N × K, a = (1, c(1)) und g : N × K → N × K, (n, x) 7→ (n′ , x · c(n′ )) an, Q und definieren nk=1 c(k) als die zweite Komponente von φ(n). P Genauso kann man n 7→ nk=1 c(k), n 7→ maxk=1,...,n c(k) und ähnliche Ausdrücke definieren. n P Für c(k) schreiben wir auch c(1) + · · · + c(n). Entsprechend setzen wir k=1 c(1) · · · · · c(n) := n Y k=1 c(k) und max(c(1), . . . , c(n)) = max c(k) . k=1,...,n Als weitere Anwendung des Rekursionssatzes erhalten wir, dass die natürlichen Zahlen im Wesentlichen eindeutig sind. 2.3.5 Korollar. Seien N und Ñ Mengen mit ausgezeichneten Elementen 1 ∈ N und 1̃ ∈ Ñ und Abbildungen ′ : N → N, ˜ : Ñ → Ñ, sodass für beide die Axiome (S1), (S2) und (S3) gelten. Dann gibt es eine eindeutige bijektive Abbildung ϕ : N → Ñ mit g = ϕ(n′ ), n ∈ N. ϕ(1) = 1̃ und ϕ(n) Beweis. Wendet man den Rekursionssatz an auf A = Ñ, a = 1̃, und g = ˜, so folgt, dass g = ϕ(n′ ), n ∈ N. genau eine Abbildung ϕ : N → Ñ existiert mit ϕ(1) = 1̃ und ϕ(n) Durch Vertauschung der Rollen von N und Ñ erhält man eine Abbildung ψ : Ñ → N mit ψ(1̃) = 1 und ψ(x)′ = ψ( x̃), x ∈ Ñ. Betrachte die Abbildung Φ = ψ ◦ ϕ : N → N. Es gilt Φ(1) = 1 und g = (ψ ◦ ϕ)(n′ ). Φ(n)′ = (ψ(ϕ(n)))′ = ψ(ϕ(n)) Die identische Abbildung idN hat die selben Eigenschaften, also folgt nach der Eindeutigkeitsaussage des Rekursionssatzes Φ = idN . Analog zeigt man ϕ ◦ ψ = idÑ , also ist ϕ bijektiv und es gilt ϕ−1 = ψ. ❑ 2.3. DIE NATÜRLICHEN ZAHLEN 19 Wenn wir uns den Beweis des Rekursionssatzes nochmals anschauen, so haben wir gezeigt, dass D eine Funktion auf N ist, es also zu jedem n ∈ N genau ein b ∈ A gibt mit (n, b) ∈ D, indem wir die Menge M aller in diesem Sinne guten“ n ∈ N hernehmen ” und davon zeigen, dass sie die Voraussetzungen von (S 3) erfüllen. Diese Vorgangsweise kann man auf alle Aussagen A(n) ausdehnen, die für alle natürliche Zahlen n gelten sollen. Das führt zum so genannten: Prinzip der vollständigen Induktion: Für jedes n ∈ N sei A(n) eine Aussage über die natürliche Zahl n. Gilt (i) Induktionsanfang: Die Aussage A(1) ist wahr. (ii) Induktionsschritt: Für jedes n ∈ N ist wahr, dass aus der Gültigkeit von A(n) die Gültigkeit von A(n′ ) folgt. Dann ist die Aussage A(n) für jede natürliche Zahl n richtig. Um das einzusehen, betrachte man die Menge M aller n ∈ N, für die A(n) richtig ist. Ist nun A(1) richtig, so ist 1 ∈ M, und aus A(n) ⇒ A(n′ ) sehen wir, dass mit m ∈ M auch m′ ∈ M. Nach Axiom (S 3) ist M = N. Also ist A(n) für jede natürliche Zahl n richtig. Als Anwendung der Beweismethode der vollständigen Induktion bringen wir die später verwendete Bernoullische Ungleichung. 2.3.6 Lemma. Ist hK, +, ·, Pi ein angeordneter Körper, und bezeichnen wir das multiplikative neutrale Element mit 1K , so folgt für x ∈ K, x ≥ −1K , und n ∈ N, dass (1K + x)n ≥ 1K + nx . Beweis. Induktionsanfang: Ist n = 1, so besagt die Bernoullische Ungleichung (1K + x)n = 1K + x ≥ 1K + x, was offenbar stimmt. Induktionsschritt: Angenommen die Bernoullische Ungleichung sei nun für n ∈ N richtig. Dann folgt wegen 1K + x ≥ 0, dass ′ (1K + x)n = (1K + x)n (1K + x) ≥ (1K + nx)(1K + x) = 1K + (n′ )x + nx2 ≥ 1K + n′ x . ❑ Eine andere unmittelbare Anwendung des Beweisprinzipes der vollständigen InP duktion ist die Verifikation der offensichtlich für Ausdrücke wie nk=1 c(k) geltenden Rechenregeln. Zum Beispiel das Distributivgesetz a n X k=1 c(k) = n X (ac(k)). k=1 P P Induktionsanfang: Ist n = 1, so gilt a 1k=1 c(k) = ac(1) = 1k=1 (ac(k)). Induktionsschritt: Angenommen die Rechenregel gilt für n, so rechnen wir: a n′ X k=1 n n X X ′ c(k) = a( c(k) + c(n )) = a c(k) + ac(n′ ) = k=1 k=1 KAPITEL 2. DIE REELLEN ZAHLEN 20 n X (ac(k)) + ac(n′ ) = k=1 n′ X (ac(k)). k=1 Entsprechend zeigt man auch andere Rechenregeln für solche induktiv definierten Ausdrücke. Wir kommen nun zur Diskussion der algebraischen Operationen Addition und Multiplikation, sowie der Ordnungsrelation auf N. Ihre Existenz und ihre Eigenschaften müssen wir nun mit mathematischer Strenge herleiten, d.h. sie alleine aus den Axiomen (S 1),(S 2),(S 3) mittels logischer Schlüsse zeigen. Hauptinstrument dabei wird wieder der Rekursionssatz Satz 2.3.3 sein. 2.3.7 Definition. Wir definieren für jedes m ∈ N Abbildungen +m : N → N und ·m : N → N rekursiv: +m (1) := m′ und +m (n′ ) = (+m (n))′ , ·m (1) := m und ·m (n′ ) = +m (·m (n)). Weiters definieren wir Relationen < und ≤ auf N durch n < m : ⇐⇒ (∃t ∈ N : +t (n) = m), n ≤ m : ⇐⇒ (n = m) oder (n < m). Sind m, n ∈ N, so schreibt man +m (n) =: m + n, ·m (n) =: m · n, und spricht von der Addition bzw. Multiplikation auf N. 2.3.8 Satz. Für jedes m ∈ N sind die Abbildungen +m und ·m injektiv, wobei +m (n) , m für alle n ∈ N. Die Addition im Bereich N der natürlichen Zahlen erfüllt die Gesetze Für alle a, b, c ∈ N gilt (a + b) + c = a + (b + c). (Assoziativität) Für alle a, b ∈ N gilt a + b = b + a. (Kommutativität) sowie die Kürzungsregel Sind n, m, k ∈ N und gilt k + m = k + n, so folgt m = n. Die Multiplikation ist ebenfalls assoziativ, kommutativ und erfüllt die Kürzungsregel. Zusätzlich gilt noch Für jedes a ∈ N ist a · 1 = 1 · a = a. (Existenz des neutralen Elementes) Die Addition hängt mit der Multiplikation zusammen über das Distributivgesetz Für a, b, c ∈ N gilt stets (b + c) · a = (b · a) + (c · a). Die Relation ≤ ist eine Totalordnung mit 1 als kleinstes Element, und aus m < n folgt m , n. Zudem gelten folgende Verträglichkeiten mit den Operationen Plus und Mal: 2.3. DIE NATÜRLICHEN ZAHLEN 21 Sind a, b, c ∈ N und gilt a < b (a ≤ b), so folgt a + c < b + c (a + c ≤ b + c). Sind a, b, c ∈ N und gilt a < b (a ≤ b), so folgt a · c < b · c (a · c ≤ b · c). Es gilt weiters Sind n, m, l ∈ N mit n + l < m + l (n + l ≤ m + l) oder n · l < m · l (n · l ≤ m · l), so folgt n < m (n ≤ m). Sind n, m ∈ N, n < m, so gibt es ein eindeutiges t ∈ N, sodass m = n + t. Wir setzen in diesem Falle m − n := t. (2.2) Sind m, n, t ∈ N, t < n < m, so folgt n − t < m − t. Sind l, m, n ∈ N, n + m < l, so folgt n < l − m und l − (m + n) = (l − m) − n. (2.3) Beweis. Zur Assoziativität von +: Seien k, m ∈ N fest gewählt, wir führen Induktion nach n durch. Induktionsanfang: (k + m) + 1 = +k (m)′ = +k (m′ ) = k + (m + 1). Induktionsschritt: Nach Induktionsvoraussetzung gilt (k + m) + n = k + (m + n). Es folgt (k + m) + (n′ ) = +k+m (n′ ) = +k+m (n)′ = ((k + m) + n)′ = = (k + (m + n))′ = +k (m + n)′ = +k ((m + n)′ ) = k + (m + n′ ), wobei letztere Gleichheit wegen des schon gezeigten Induktionsanfangs folgt. Zur Kommutativität von +: Wir zeigen ∀m, n ∈ N : m + n = n + m mittels Induktion nach m. Induktionsanfang (m = 1): Wir zeigen ∀n ∈ N : 1 + n = n + 1 (2.4) mittels Induktion nach n. Der Fall n = 1 ist klar, denn 1 + 1 = 1 + 1. Für den Induktionsschritt n → n′ gehen wir aus von der Induktionsvoraussetzung 1 + n = n + 1. Daraus folgt n′ + 1 = n′′ = (n + 1)′ = (1 + n)′ = 1 + n′ . Induktionsschritt (m → m′ ): Wir zeigen (∀n ∈ N : m + n = n + m) =⇒ (∀n ∈ N : m′ + n = n + m′ ). Dazu führen wir Induktion nach n durch. Betrachte also zuerst den Fall n = 1. Nach der bereits bewiesenen Aussage (2.4) mit vertauschten Rollen von m und n gilt m′ + 1 = 1 + m′ . Der Induktionsschritt n → n′ hat nun als Induktionsvoraussetzung m′ + n = n + m′ und wir erhalten ∗ m′ + n′ = (m′ + n)′ = (n + m′ )′ = (n + m)′′ = (m + n)′′ = ∗ = (m + n′ )′ = (n′ + m)′ = n′ + m′ . An den mit ∗ gekennzeichneten Stellen ist die Induktionsvoraussetzung des Induktionsschritts (m → m′ ) benützt worden. KAPITEL 2. DIE REELLEN ZAHLEN 22 Zur Injektivität von +m und der Tatsache, dass +m (n) , m, für alle n ∈ N: Für m = 1 ist +m (n) = n′ . Nach (S 1) ist +1 injektiv und nach (S 2) gilt +1 (n) , 1. Sei nun m ∈ N und +m injektiv und erfülle +m (n) , m für alle n ∈ N. Es folgt +m′ (n) = m′ + n = m + (n + 1) = +m (n′ ). Also ist +m′ die Zusammensetzung der injektiven Abbildungen (n → n′ ) und +m und somit selbst injektiv. Aus m + 1 = m′ = +m′ (n) = (m + n) + 1 folgt wegen der Injektivität von +1 , dass m = m + n = +m (n) im Widerspruch zur Induktionsvoraussetzung. Die Kürzungsregeln für + folgt sofort aus der Injektivität von +k . m < n bedeutet n = m + k mit einem k ∈ N. Aus m = n würde der Widerspruch m = m + k = +m (k) folgen. Es gilt a · 1 = 1 · a = a, a ∈ N: Unmittelbar aus der Definition 2.3.7 folgt a · 1 = ·a (1) = a. Die zweite Gleichheit zeigen wir mittels Induktion nach a: Induktionsanfang (a = 1): 1 · a = 1 · 1 = 1 = a. Induktionsschritt (a → a′ ): Wir nehmen also 1 · a = a an und schließen 1 · (a′ ) = ·1 (a′ ) = +1 (·1 (a)) = +1 (1 · a) = 1 + a = a′ . Zur Kommutativität von ·: Wir zeigen ∀m, n ∈ N : m · n = n · m mittels Induktion nach m. Induktionsanfang (m = 1): Nach dem letzten Punkt gilt ∀n ∈ N : 1 ·n = n = n ·1. Induktionsschritt (m → m′ ): Wir zeigen (∀n ∈ N : m · n = n · m) =⇒ (∀n ∈ N : m′ · n = n · m′ ). Dazu führen wir Induktion nach n durch. Betrachte also zuerst den Fall n = 1. Wieder nach dem letzten Punkt gilt (m′ ) · 1 = m′ = 1 · m′ . Der Induktionsschritt n → n′ hat nun als Induktionsvoraussetzung m′ · n = n · m′ und wir erhalten m′ · n′ = m′ + (m′ · n) = m′ + (n · m′ ) = (m + 1) + (n + (n · m)) = ∗ (n + 1) + (m + (n · m)) = (n + 1) + (m + (m · n)) = ∗ n′ + (m · n′ ) = n′ + (n′ · m) = n′ · m′ . An den mit ∗ gekennzeichneten Stellen ist die Induktionsvoraussetzung des Induktionsschritts (m → m′ ) benützt worden. Zum Distributivgesetz: Vollständige Induktion nach a: Induktionsanfang (a = 1): Da 1 bezüglich · ein neutrales Element ist, folgt (b + c) · 1 = b + c = (b · 1) + (c · 1). Induktionsschritt: ∗ (b + c) · (a + 1) = (b + c) + ((b + c) · a) = (b + c) + ((b · a) + (c · a)) = (b + (b · a)) + (c + (c · a)) = (b · (a + 1)) + (c · (a + 1)). An der mit ∗ gekennzeichneten Stelle ist die Induktionsvoraussetzung eingegangen. 2.3. DIE NATÜRLICHEN ZAHLEN 23 Zur Assoziativität von ·: Wir zeigen a · (b · c) = (a · b) · c mittels Induktion nach b. Induktionsanfang: a · (1 · c) = a · c = (a · 1) · c. Induktionsschritt: Nach Induktionsvoraussetzung gilt also (a · b) · c = a · (b · c). Mittels Distributivgesetz folgt (a · (b + 1)) · c = ((a · b) + (a · 1)) · c = ((a · b) · c) + ((a · 1) · c) = (a · (b · c)) + (a · (1 · c)) = a · ((b · c) + (1 · c)) = a · ((b + 1) · c). Zur Totalität von ≤ und zur Tatsache 1 ≤ n, n ∈ N: Wir wollen zeigen, dass je zwei n, m ∈ N bezüglich ≤ vergleichbar sind, was wir mittels Induktion nach m beweisen werden. Für m = 1 zeigt man, leicht mittels Induktion nach n, dass immer n = 1, oder ∃t ∈ N, n = 1 + t, also immer 1 ≤ n. Gelte die Vergleichbarkeit von m mit allen n ∈ N. Um sie für m′ zu zeigen, machen wir eine Fallunterscheidung: Ist m = n, so folgt n + 1 = m′ also n ≤ m′ . Aus n < m folgt m = n + t für ein t ∈ N, und daher m′ = n + (t + 1), also n < m′ . Ist n = m + 1, so folgt m′ = n. Ist schließlich m < n, n , m + 1, so gilt n = m + t mit t , 1. Aus der schon bewiesenen Vergleichbarkeit mit 1 folgt, dass 1 < t, und somit t = 1 + s, s ∈ N. Aus der Assoziativität folgt n = m′ + s, also m′ < n. Die Reflexivität von ≤ ist klar. Zur Transitivität von < und damit von ≤: Sei k, l, m ∈ N und k ≤ l, l ≤ m. Ist k = l oder l = m, so sieht man sofort, dass k ≤ m. Im Fall k < l, l < m gibt es i, j ∈ N mit k + i = l, l + j = m. Es folgt k + (i + j) = m und daher k < m. Die Antisymmetrie von ≤ folgt, da aus n ≤ m und m ≤ n im Falle m , n wegen dem vorletzten Punkt und wegen der Transitivität von < folgt, dass n < n, was dem vorletzten Punkt widerspricht. Zur Verträglichkeit von < mit + und ·: Sei n < m und k ∈ N. Somit ist n + t = m mit t ∈ N, und es gilt m + k = (n + t) + k = n + (t + k) = n + (k + t) = (n + k) + t, sowie m · k = (n + t) · k = (n · k) + (t · k). Also folgt n + k < m + k und n · k < m · k. Die Injektivität von ·k bzw. – was das selbe ist – die Kürzungsregel für · folgt nun aus den gezeigten Eigenschaften von ≤: Seien k, m, n ∈ N mit m , n. Wegen der Totalität gilt m < n oder n < m, was mit der Verträglichkeit von < mit · bedingt, dass k · m < k · n oder k · n < k · m und somit k · m , k · n. KAPITEL 2. DIE REELLEN ZAHLEN 24 Zum Kürzen in Ungleichungen: Aus n + l < m + l folgt definitionsgemäß m + l = (n + l) + k für ein k ∈ N. Gemäß der Kürzungsregel für + folgt m = n + k und somit n < m. Sei nun n ·l < m·l. Wäre m ≤ n, so folgte aus dem letzten Punkt der Widerspruch m · l ≤ n · l. Wegen der Totalität muss n < m. Zur Wohldefiniertheit von m − n: Sei also n < m. Definitionsgemäß ist m = n + t für ein t ∈ N. Ist nun m = n + s für eine weitere Zahl s ∈ N, so folgt aus der Kürzungsregel für + und n + t = n + s, dass s = t. Also ist die m − n := t eindeutig dadurch definiert, dass n + t = m. Zur Verträglichkeit von < mit −: Ist t < n < m, so folgt n = t + s und m = n + l für s, l ∈ N, und weiters m = t + (l + s). Somit ist m − t = l + s und n − t = s, und daher n − t < m − t. Zu (2.3): Die Ungleichung m + n < l bedeutet l = (m + n) + k für ein eindeutiges k ∈ N. Definitionsgemäß ist daher k = l − (m + n). Andererseits gilt wegen m < m + n < l auch l = m + s, s ∈ N. Wegen der Kürzungsregel für + folgt s = n + k, und somit n < s = l − m. Außerdem ist k = s − n = (l − m) − n. ❑ 2.3.9 Bemerkung. Ist Ñ eine Kopie von N wie in Korollar 2.3.5, und werden die Operationen + und ·, sowie ≤ auf Ñ genauso definiert wie auf N, so sieht man leicht, dass die nach Korollar 2.3.5 existierende Abbildung ϕ : N → Ñ mit den Operationen und ≤ verträglich ist: ϕ(n + m) = ϕ(n) + ϕ(m), ϕ(n · m) = ϕ(n) · ϕ(m), n ≤ m ⇔ ϕ(n) ≤ ϕ(m). Folgende Eigenschaft der natürlichen Zahlen werden wir oft verwenden. 2.3.10 Satz. Ist ∅ , T ⊆ N, so hat T ein Minimum. Beweis. Wir nehmen das Gegenteil an. Sei M = {n ∈ N : ∀m ∈ T ⇒ n < m}. Es ist nun 1 ∈ M, da sonst 1 das Minimum von T wäre. Ist n ∈ M, und m ∈ T , so gilt n < m. Daraus schließen wir n + 1 ≤ m. Wäre n + 1 = m0 für ein m0 ∈ T , so hätte T das Minimum m0 . Wir nehmen aber an, dass es ein solches nicht gibt. Also gilt immer n + 1 < m, m ∈ T , bzw. n + 1 ∈ M. Nach (S 3) folgt M = N. Ist m ∈ T ⊆ N, so folgt m ∈ M und daher der Widerspruch m < m. ❑ Diese Eigenschaft der natürlichen Zahlen können wir hernehmen, um folgende Varianten des Prinzips der vollständigen Induktion zu rechtfertigen. Zum Beispiel ist 2.3. DIE NATÜRLICHEN ZAHLEN 25 es oft zielführender die folgende Version zu benützen: Sei A(n), n ∈ N, eine Aussage über die natürliche Zahl n. Gilt (i) Die Aussage A(1) ist wahr. (ii) Es gelte für jedes n ∈ N, n > 1: Ist die Aussage A(m) wahr für alle m < n, so ist auch A(n) wahr. Dann ist die Aussage A(n) für alle n ∈ N wahr. Denn wäre die Menge der n ∈ N, für die A(n) falsch ist, nicht leer, so hätte sie ein Minimum n. Wegen (i) ist aber n > 1, wegen (ii) ist A(n) wahr, was offensichtlich ein Widerspruch ist. Ist eine Aussage erst ab einer gewissen Zahl n0 richtig, so kann man folgende Varianten des Prinzips der vollständigen Induktion anzuwenden versuchen: Gilt (i) Die Aussage A(n0 ) ist wahr. (ii) Ist A(n) wahr für ein n ≥ n0 , dann ist A(n + 1) wahr. oder gilt (i) Die Aussage A(n0 ) ist wahr. (ii) Ist n > n0 und ist A(m) wahr für alle m mit n0 ≤ m < n, dann ist A(n) wahr. Dann ist die Aussage A(n) für alle n ≥ n0 richtig. 2.3.11 Beispiel. Mit fast dem selben Beweis wie in Lemma 2.3.6 jedoch mit einer Induktion bei 2 startend zeigt man, dass für x ≥ −1K und x , 0 sowie n ≥ 2 sogar (1K + x)n > 1K + nx . Induktionsanfang: Ist n = 2, so gilt wegen x2 > 0, dass (1K +x)2 = 1K +2x+x2 > 1K +2x. Induktionsschritt: Angenommen die Ungleichung ist für n ∈ N richtig. Dann folgt wegen 1K + x ≥ 0 und nx2 > 0, dass ′ (1K + x)n = (1K + x)n (1K + x) ≥ (1K + nx)(1K + x) = 1K + (n′ )x + nx2 > 1K + n′ x . Klarerweise haben unendliche Teilmengen von N kein Maximum. Aber wie intuitiv klar ist, hat jede endliche Teilmenge einer total geordneten Menge ein Maximum und ein Minimum. Um das exakt nachzuweisen, benötigen wir die genaue Definition von Endlichkeit. 2.3.12 Definition. Eine nichtleere Menge M heißt endlich, wenn es ein k ∈ N und eine bijektive Funktion f : {n ∈ N : n ≤ k} → M gibt. Die Zahl k ist dann die Mächtigkeit von M 6 . Man sagt auch, dass M genau k Elemente hat. Die leere Menge nennen wir auch endlich, und ihre Mächtigkeit sei Null. 6 Damit die Mächtigkeit wohldefiniert ist, muss man noch zeigen, dass es im Fall k1 , k2 keine bijektive Funktion von {n ∈ N : n ≤ k1 } auf {n ∈ N : n ≤ k2 } gibt, was sich durch vollständige Induktion bewerkstelligen lässt. KAPITEL 2. DIE REELLEN ZAHLEN 26 2.3.13 Bemerkung. Man zeigt elementar durch vollständige Induktion nach der Mächtigkeit der endlichen Menge M, dass alle ihre Teilmengen auch endlich sind. 2.3.14 Lemma. Jede endliche nichtleere Teilmenge M einer total geordneten Menge hT, ≤i hat ein Minimum und ein Maximum, das wir mit min(M) bzw. mit max(M) bezeichnen. Insbesondere gilt diese Aussage für endliche Teilmengen von angeordneten Körpern und von N. Beweis. Hat M nur ein Element, d.h. M = {m}, so ist klarerweise m das Maximum von M. Angenommen alle M̃ ⊆ T mit n Elementen haben ein Maximum. Hat nun M ⊆ T genau n + 1 Elemente und ist m1 ∈ M, so hat M \ {m1 } genau n Elemente und laut Induktionsvoraussetzung ein Maximum m2 ∈ M \ {m1 }. Da hT, ≤i eine Totalordnung ist, gilt m1 ≤ m2 oder m1 ≥ m2 . Im ersten Fall ist dann m2 das Maximum von M und im zweiten ist m1 das Maximum von M. ❑ Eine immer wieder verwendete Tatsache ist im folgenden Lemma vermerkt. 2.3.15 Lemma. Sei M ⊆ N nicht endlich. Dann gibt es eine streng monoton wachsende Bijektion φ von N auf M. Für eine solche gilt immer φ(n) ≥ n. Beweis. Sei g : M → M definiert durch g(s) = min{m ∈ M : m > s}, und sei a = min M. Man beachte, dass g(s) für alle s ∈ M definiert ist, da {m ∈ M : m > s} voraussetzungsgemäß niemals leer ist. Nach dem Rekursionssatz gibt es eine eindeutige Abbildung φ : N → M mit φ(1) = a = min M und so, dass φ(n + 1) = g(φ(n)) = min{m ∈ M : m > φ(n)}. Offensichtlich gilt φ(n + 1) > φ(n). Daraus folgt durch vollständige Induktion, dass φ(l) > φ(n), wenn l > n. Also ist φ streng monoton wachsende und somit auch injektiv. Durch vollständige Induktion zeigt man auch leicht, dass φ(n) ≥ n für alle n ∈ N. Wäre ein m1 ∈ M nicht im Bild von φ, so ist klarerweise m1 > min M = φ(1). Angenommen m1 > φ(n). Dann ist m1 ∈ {m ∈ M : m > φ(n)} und wegen m1 , φ(n + 1) = min{m ∈ M : m > φ(n)} muss m1 > φ(n + 1). Es folgt φ(n) < m1 für alle n ∈ N, was aber φ(m1 ) ≥ m1 widerspricht. ❑ 2.4 Der Ring der ganzen Zahlen Im Bereich der natürlichen Zahlen haben wir zuletzt Operationen + und · definiert. Ist m < n, so haben wir auch n − m ∈ N definiert. Wir wollen nun aus den natürlichen Zahlen die ganzen Zahlen Z konstruieren, und die Operationen + und · auf Z so fortsetzen, dass wir einen Ring hZ, +, ·i erhalten. Die Menge Z zu definieren, ist kein Problem. 2.4.1 Definition. Seien N1 und N2 zwei disjunkte Kopien der natürliche Zahlen, und sei 0 ein Element, das in keiner dieser Mengen enthalten ist7 . Wir definieren ˙ ∪N ˙ 2. Z := N1 ∪{0} 7 Man kann z.B. für N j einfach die Menge N × { j} hernehmen, und für 0 das Element (1, 3) 2.4. DER RING DER GANZEN ZAHLEN 27 Ist ϕ : N1 → N2 eine bijektive Abbildung wie in Korollar 2.3.5, so definieren wir eine Abbildung − : Z → Z ϕ(n) , falls 0 , falls −n = ϕ−1 (n) , falls n ∈ N1 n=0 n ∈ N2 Schreiben wir nun N für N1 , so gilt ˙ ∪N. ˙ Z = −N∪{0} Man erkennt unschwer, dass − eine Bijektion ist, die mit sich selber zusammengesetzt die Identität ergibt, also eine Involution ist. Nun definieren wir die Operationen auf Z in der Art und Weise, wie wir sie der Anschauung nach erwarten. 2.4.2 Definition. Für n ∈ N setzen wir sgn(n) := 1, sgn(−n) := −1, sgn(0) = 0 sowie |n| := n, | − n| := n und |0| := 0. Weiters sei + : Z × Z → Z definiert durch p + q , p, q ∈ N −(|p| + |q|) , −p, −q ∈ N p − |q| , p, −q ∈ N, p > −q −(|q| − p) , p, −q ∈ N, p < −q −(|p| − q) , −p, q ∈ N, − p > q , p + q := q − |p| , −p, q ∈ N, − p < q 0 , q = −p p , q=0 q , p=0 und · : Z × Z → Z durch |p| · |q| , −(|p| · |q|) , p · q := 0 , q, p , 0, sgn(q) = sgn(p) q, p , 0, sgn(q) = − sgn(p) . q=0∨ p=0 Sind p, q ∈ Z, so schreibt man wie schon zuvor für p + (−q) meist p − q. 2.4.3 Satz. hZ, +, ·i ist ein kommutativer Integritätsring mit Einselement. Es gilt also: Die Addition ist kommutativ und assoziativ, 0 ist ein bzgl. + neutrales Element und −p ist das zu p ∈ Z bzgl. + inverse Element. Also gelten (a1)-(a4) von Definition 2.1.1. Die Multiplikation ist kommutativ und assoziativ, und 1 ist ein bzgl. · neutrales Element. Also gelten (m1),(m2),(m4) von Definition 2.1.1. Es gilt das Distributivgesetz. Aus p , 0 ∧ q , 0 folgt pq , 0 (Integritätseigenschaft). Beweis. Seien p, q ∈ Z. Zunächst folgen p + q = q + p und p · q = q · p unmittelbar aus der Definition und eben der Tatsache, dass diese Operationen auf N kommutativ sind. KAPITEL 2. DIE REELLEN ZAHLEN 28 Ebenfalls unmittelbar aus der Definition sieht man, dass p + 0 = p und p · 1 = p. Also ist 0 ein bezüglich + und 1 ein bezüglich · neutrales Element. Genauso elementar verifiziert man p + (−p) = 0 und p · q , 0, wenn p und q beide , 0. Es bleibt die Assoziativität und das Distributivgesetz nachzuprüfen. Das ist in der Tat mühsam und durch zahlreiche Fallunterscheidungen zu bewerkstelligen. Wir wollen daher nur r + (q + p) = (r + q) + p im exemplarischen Fall r, q ∈ N, − p ∈ N betrachten: Ist |p| > r + q, so folgt (r + q) + p = −(|p| − (r + q)), und nach (2.3) ist dieser Ausdruck gleich −((|p| − q) − r). Wegen |p| − q > r und |p| > q folgt definitionsgemäß −((|p| − q) − r) = r + (−(|p| − q)) = r + (p + q). Im Falle |p| = r + q gilt einerseits (r + q) + p = 0 und andererseits wegen |p| > q und |p| − q = r (siehe (2.2)), dass r + (q + p) = r + (−(|p| − q)) = 0. Sei nun |p| < r + q. Dann folgt (r + q) + p = (r + q) − |p| =: k ∈ N. Also ist k jene Zahl, sodass |p| + k = r + q. Ist q > |p|, so gilt andererseits r + (q + p) = r + (q − |p|), und wegen den bekannten Rechenregeln auf N, |p| + (r + (q − |p|)) = r + q, also k = r + (q + p). Wenn q = |p|, so folgt r+(q+ p) = r, und ebenfalls |p|+r = r+q, d. h. k = r+(q+ p). Ist schließlich q < |p|, so folgt r + (q + p) = r + (−(|p| − q)). Da |p| < r + q folgt r > |p| − q, und somit r + (−(|p| − q)) = r − (|p| − q) =: l ∈ N. Das ist also jene Zahl, sodass (|p| − q) + l = r. Addiert man hier q und verwendet die Assoziativität von + auf N, so folgt |p| + l = r + q, also l = k. ❑ 2.4.4 Bemerkung. In Integritätsringen gilt die Kürzungsregel: m , 0, xm = ym ⇒ y = x, denn aus xm − ym = (x − y)m = 0 folgt ja x − y = 0. Wir benötigen noch eine Totalordnung auf Z, welche ≤ auf N erweitert. 2.4.5 Definition. Wir definieren für p, q ∈ Z q < p ⇔ p − q ∈ N und q ≤ p ⇔ q < p ∨ q = p. (2.5) Man sieht leicht ein, dass mit ≤ eine Totalordnung auf Z definiert ist, die ≤ auf N erweitert, und die mit den Operationen + und · verträglich ist. 2.4.6 Bemerkung. Wenn man sich an die Definition eines angeordneten Körpers in Definition 2.2.1 erinnert, so haben wir die Existenz einer Teilmenge P ⊆ K verlangt, die (p1) - (p3) erfüllt. Genau diese Situation haben wir hier mit P = N, nur, dass Z kein Körper, sondern ein Ring ist. Die von uns definierte Totalordnung ≤ auf Z erfüllt nun auch alle Eigenschaften, die für die entsprechende Totalordnung auf einem angeordneten Körper gelten (vgl. Lemma 2.2.2). Ausgenommen sind nur die Eigenschaften, die sich auf die multiplikativ Inverse beziehen. Die ganzen Zahlen sind eindeutig in dem Sinn, dass wenn Z̃ neben Z eine weitere Menge versehen mit einer Involution −̃ : Z̃ → Z̃, mit Operationen +̃, ˜· und einer 2.4. DER RING DER GANZEN ZAHLEN 29 Relation ≤˜ ist, sodass Z̃ eine Kopie Ñ der natürlichen Zahlen enthält, Z̃ geschrieben werden kann als die disjunkte Vereinigung von −Ñ, {0} und Ñ, die Operationen +̃ und ˜· wie in Definition 2.4.2 durch die entsprechenden Operationen auf Ñ (siehe Bemerkung 2.3.9) definiert sind, und sodass ≤˜ wie in (2.5) definiert ist, es eine eindeutige Bijektion φ : Z → Z̃ gibt, sodass φ(−p) = −φ(p), φ(1) = 1̃, φ(n + 1) = φ(n)+̃1̃, p ∈ Z, n ∈ N. Um das zu zeige, setzt man einfach die Bijektion ϕ aus Korollar 2.3.5 zu einer Bijektion φ von Z auf Z̃ gemäß der Forderung φ(−p) = −φ(p) fort. Die erhaltene Bijektion Z → Z̃ ist mit +, ·, − und ≤ verträglich. Siehe dazu auch Bemerkung 2.3.9. Wir haben im Abschnitt über die natürlichen Zahlen für eine Zahl x aus einem Körper ihre Potenzen xn , n ∈ N definiert (siehe Bemerkung 2.3.4). Das wollen wir auf Z ausdehnen. 2.4.7 Definition. Sei hK, +, ·i ein Körper. Für eine ganze Zahl p und eine Zahl x ∈ K, x , 0 definieren wir p x , falls p ∈N 1 , falls p =0 . xp = 1 , falls −p ∈ N −p x Für x ∈ K \ {0}, p, q ∈ Z gelten die aus der Schule bekannten Rechenregeln: x p xq = x p+q , (x p )q = x pq , x−p = 1 . xp (2.6) Den Beweis für diese Rechenregeln führt man mittels vollständige Induktion für p, q ∈ N, und dann durch Fallunterscheidung für den allgemeinen Fall p, q ∈ Z. 2.4.8 Lemma. Ist hK, +, ·, Pi ein angeordneter Körper, so gilt für n ∈ N und x, y ≥ 0 x < y ⇔ xn < yn , und für x, y > 0 x < y ⇔ x−n > y−n . Beweis. Zunächst zeigt man leicht durch vollständige Induktion und mit Hilfe von (p3), dass aus 0 < t immer 0 < tn folgt. Ist x < y, so folgt im Falle x = 0 daher xn = 0 < yn . Ist 0 < x < y, so zeigt man n x < yn durch vollständige Induktion: Für n = 1 ist xn < yn offensichtlich. Gilt xn < yn , so folgt aus Lemma 2.2.2 und der rekursiven Definition von xn (siehe Bemerkung 2.3.4) xn+1 = xn · x < yn · x < yn · y = yn+1 . Ist umgekehrt xn < yn , so muss x < y, da sonst y ≤ x, und aus dem eben bewiesenem yn ≤ xn folgte. Die letzte Behauptung folgt sofort aus x < y ⇔ x−1 > y−1 für alle x, y > 0. ❑ KAPITEL 2. DIE REELLEN ZAHLEN 30 Also ist x 7→ xn eine streng monoton wachsende Funktion und somit injektive Funktion von P ∪ {0} nach P ∪ {0}. Wir werden später sehen, dass diese Funktionen in vollständig angeordneten Körpern auch surjektiv sind. Für p ∈ Z, p < 0 ist x 7→ x p eine streng monoton fallende Funktion und somit eine injektive Funktion von P nach P. Eine alternative Konstruktion von Z Wir wollen in diesem Abschnitt einen alternativen Zugang zu den ganzen Zahlen vorstellen. Der Vorteil dieser vordergründig aufwendigeren Methode ist, dass die Beweise der Rechengesetze struktureller und kürzer sind. 2.4.9 Definition. Sei ∼⊆ (N × N)2 die Relation (x, n) ∼ (y, m) : ⇐⇒ x + m = y + n . 2.4.10 Lemma. Die Relation ∼ ist eine Äquivalenzrelation. Beweis. Die Reflexivität und Symmetrie ist klar. Um zu zeigen, dass ∼ transitiv ist, seien (x, n) ∼ (y, m) und (y, m) ∼ (z, k) gegeben. Dann gilt x + m = y + n und y + k = z + m. Es folgt (x + k) + m = (x + m) + k = (y + n) + k = (y + k) + n = (z + m) + n = (z + n) + m , und wegen der Kürzungsregel in N daher x + k = z + n; also (x, n) ∼ (z, k). ❑ 2.4.11 Definition. Wir bezeichnen mit Z die Faktormenge (N × N)/∼ . Auf Z definieren wir algebraische Operationen + und · . Die Vorgangsweise dazu ist, zunächst Addition und Multiplikation auf N × N zu definieren, und diese dann auf Z zu übertragen. +: ( ( (N × N)2 ((x, n), (y, m)) ·: (N × N)2 ((x, n), (y, m)) N×N (x + y, n + m) → 7→ → 7 → N×N (xy + nm, xm + ny) 2.4.12 Lemma. Die Operationen + und · auf N × N sind kommutativ, assoziativ und es gilt das Distributivgesetz. Beweis. Seien (x, n), (y, m) ∈ N × N. Dann ist (x, n) + (y, m) = (x + y, n + m) = (y + x, m + n) = (y, m) + (x, n) , (x, n) · (y, m) = (xy + nm, xm + ny) = (yx + mn, yn + mx) = (y, m) · (x, n) . Sei zusätzlich (z, k) ∈ N × N. Dann gilt (x, n) + (y, m) + (z, k) = (x + y, n + m) + (z, k) = (x + y) + z, (n + m) + k = = x + (y + z), n + (m + k) = (x, n) + (y, m) + (z, k) . Die Gültigkeit der Assoziativität der Multiplikation sowie des Distributivgesetzes rechnet man ähnlich, aber deutlich mühsamer, nach. ❑ Um diese Operationen auf Z übertragen zu können benötigen die Verträglichkeit mit der Relation ∼. 2.4.13 Lemma. Sind (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂), so folgt, dass auch (x, n) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂), (x, n) · (y, m) ∼ ( x̂, n̂) · (ŷ, m̂) . Beweis. Seien (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂) gegeben. Dann gilt (x + y) + (n̂ + m̂) = (x + n̂) + (y + m̂) = ( x̂ + n) + (ŷ + m) = ( x̂ + ŷ) + (n + m) , und wir sehen, dass (x, n) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂). 2.4. DER RING DER GANZEN ZAHLEN 31 Um die Aussage für · zu zeigen, betrachten wir zuerst (x, n) ∼ ( x̂, n̂) und ein (y, m). Dann gilt (xy + nm) + ( x̂m + n̂y) = (x + n̂)y + ( x̂ + n)m = = ( x̂ + n)y + (x + n̂)m = ( x̂y + n̂m) + (xm + ny) , und wir erhalten (x, n) · (y, m) ∼ ( x̂, n̂) · (y, m). Wegen der Kommutativität von · folgt auch, dass für (x, n) und (y, m) ∼ (ŷ, m̂) stets (x, n) · (y, m) ∼ (x, n) · (ŷ, m̂) gilt. Die Aussage für · folgt nun aus der Transitivität von ∼ angewandt auf (x, n) · (y, m) ∼ ( x̂, n̂) · (y, m) ∼ ( x̂, n̂) · (ŷ, m̂) . ❑ 2.4.14 Definition. Auf Z seien zwei algebraische Operationen + und · definiert, indem wir für a, b ∈ Z Paare (x, n), (y, m) ∈ N × N so wähle, dass [(x, n)]∼ = a und [(y, m)]∼ = b, und dann setzen. a + b := (x, n) + (y, m) ∼ , a · b := (x, n) · (y, m) ∼ Dass durch diese Vorschrift tatsächlich zwei Funktionen wohldefiniert sind, verdanken wir gerade der Verträglichkeitsaussage in Lemma 2.4.13. Im nächsten Schritt definieren wir die Relation ≤ auf Z. Dazu sei (x, n) ≤ (y, m) : ⇐⇒ x + m ≤ y + n, (x, n), (y, m) ∈ N × N . 2.4.15 Lemma. Die Relation ≤ auf N × N ist reflexiv, transitiv und total, dh. (x, n) ≤ (y, m) ∨ (y, m) ≤ (x, n) für alle (x, n), (y, m) ∈ N × N. Zudem gilt (x, n) ≤ (y, m) und (y, m) ≤ (x, n) ⇐⇒ (x, n) ∼ (y, m). (2.7) Außerdem folgt aus (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂), dass (x, n) ≤ (y, m) ⇐⇒ ( x̂, n̂) ≤ (ŷ, m̂) . Beweis. Die Reflexivität folgt unmittelbar aus der Definition. Sei (x, n) ≤ (y, m) und (y, m) ≤ (z, k). Dann gilt x + m ≤ y + n und y + k ≤ z + m, und wir erhalten (x + k) + m = (x + m) + k ≤ (y + n) + k = (y + k) + n ≤ (z + m) + n = (z + n) + m . Daraus folgt nun x + k ≤ z + n, d.h. (x, n) ≤ (z, k). Die Totalität folgt aus der Tatsache, dass ≤ eine Totalordnung auf N ist. Da (x, n) ≤ (y, m) und (y, m) ≤ (x, n) mit x + m = y + n gleichbedeutend ist, folgt (2.7). Die letzte Aussage folgt unmittelbar aus (2.7) und der Transitivität von ≤ auf N × N. ❑ Wegen der letzte Aussage von Lemma 2.4.15, ist folgende Definition unabhängig von den Repräsentanten der Restklassen a bzw. b. Wir erhalten damit eine Totalordnung auf Z. 2.4.16 Definition. Seien a, b ∈ Z, a = [(x, n)]∼ , b = [(y, m)]∼ . Dann schreiben wir a ≤ b, falls (x, n) ≤ (y, m). 2.4.17 Satz. Die Addition und Multiplikation auf Z sind kommutativ, assoziativ und es gilt das Distributivgesetz. Das Element 0 := [(1, 1)]∼ bzw. 1 := [(2, 1)]∼ ist neutrales Element bezüglich + bzw. ·. Jedes Element besitzt ein additiv Inverses Element. Für · gilt die Kürzungsregel, d.h. ist a, b, c ∈ Z, c , 0, und gilt a · c = b · c, so folgt a = b. Die Relation ≤ ist eine Totalordnung. Für alle a, b, c ∈ Z, a ≤ b, gilt auch a + c ≤ b + c und, falls c ≥ 0, auch a · c ≤ b · c. Umgekehrt, ist c > 0 und a · c ≤ b · c, so folgt a ≤ b. Die natürlichen Zahlen N sind in Z injektiv eingebettet vermöge der Abbildung φ: ( N x → 7 → Z [(x + 1, 1)]∼ Diese Einbettung erhält Addition, Multiplikation und Ordnung. Beweis. Die Gültigkeit von Assoziativität, Kommutativität sowie Distributivität folgt wegen Lemma 2.4.12. Sei a = [(x, n)]∼ ∈ Z. Dann gilt a + 0 = [(x, n)]∼ + [(1, 1)]∼ = [(x + 1, n + 1)]∼ = [(x, n)]∼ = a , sowie a · 1 = [(x, n)]∼ · [(2, 1)]∼ = [(2x + n, x + 2n)]∼ = [(x, n)]∼ = a , KAPITEL 2. DIE REELLEN ZAHLEN 32 also ist 0 neutrales Element der Addition und 1 neutrales Element der Multiplikation. Setze â := [(n, x)]∼ , dann gilt a + â = [(x, n)]∼ + [(n, x)]∼ = [(x + n, n + x)]∼ = [(1, 1)]∼ = 0 , also hat a ein additives Inverses, nämlich â. Wegen Lemma 2.4.15 ist ≤ auf Z eine Totalordnung. Seien a, b, c ∈ Z, a = [(x, n)]∼ , b = [(y, m)]∼ , c = [(z, k)]∼ . Dann gilt a + c ≤ b + c ⇐⇒ (x + z, n + k) ≤ (y + z, m + k) ⇐⇒ x + z + m + k ≤ y + z + n + k ⇐⇒ x + m ≤ y + n ⇐⇒ a ≤ b . Sei nun angenommen, dass a < b, d.h. dass x+m < y+n, und dass c ≥ 0, d.h. z ≥ k. Dann gibt es t ∈ N mit y+n = (x+m)+t. Wegen z ≥ k folgt tz ≥ tk und daher auch (y + n)z = (x + m)z + tz ≥ (x + m)z + tk und schließlich (x + m)k + (y + n)z ≥ (x + m)z + tk + (x + m)k = (x + m)z + (y + n)k . Also haben wir (xk + nz) + (yz + mk) ≥ (xz + nk) + (yk + mz), und das heißt gerade a · c ≤ b · c. Sei umgekehrt a · c ≤ b · c, d.h. nach obiger Rechnung (x + m)k + (y + n)z ≥ (x + m)z + (y + n)k, und c > 0, d.h. z > k. Angenommen es wäre a > b, d.h. x + m > y + n. Dann gibt es t ∈ N mit (y + n) + t = x + m. Damit erhalten wir tk + (y + n)(k + z) ≥ tz + (y + n)(z + k) und daraus tk ≥ tz und schließlich den Widerspruch k ≥ z. Also muss a ≤ b gelten. Die Kürzungsregel für · folgt aus der gerade bewiesenen Kürzungsregel für ≤. Die Injektivität der Abbildung φ gilt, da (x + 1, 1) ∼ (y + 1, 1) gerade x + 2 = y + 2 bedeutet, und damit x = y folgt. Außerdem gilt φ(x) + φ(y) = [((x + 1) + (y + 1), 1 + 1)]∼ = [((x + y) + 1, 1)]∼ = φ(x + y) , φ(x) · φ(y) = ((x + 1)(y + 1) + 1, (x + 1) + (y + 1)) ∼ = (xy + x + y + 1 + 1, x + y + 1 + 1) ∼ = [(xy + 1, 1)]∼ = φ(xy) , φ(x) ≤ φ(y) ⇐⇒ (x + 1) + 1 ≤ (y + 1) + 1 ⇐⇒ x ≤ y . ❑ Folgendes Resultat liefert insbesondere, dass die hier konstruierten ganzen Zahlen eine Kopie der eingangs konstruierten ganzen Zahlen sind. 2.4.18 Proposition. Versteht man die natürlichen Zahlen via φ eingebettet in Z wie in Satz 2.4.17, so gilt ˙ ∪N, ˙ Z = −N∪{0} wobei diese drei Mengen disjunkt sind. Dabei gilt p ∈ N ⇔ p > 0 und p ∈ −N ⇔ p < 0. Definieren wir sgn(x) = 0, wenn x = 0, sgn(x) = 1, wenn x ∈ N, und sgn(x) = −1, wenn x ∈ −N, und setzen |p| = sgn(p)p, so gilt für p, q ∈ Z und p+q −(|p| + |q|) p − |q| −(|q| − p) −(|p| − q) p+q= q − |p| 0 p q |p| · |q| −(|p| · |q|) p·q= 0 , , , , , , , , , , , , p, q ∈ N −p, −q ∈ N p, −q ∈ N, p > −q p, −q ∈ N, p < −q −p, q ∈ N, − p > q −p, q ∈ N, − p < q q = −p q=0 p=0 , q, p , 0, sgn(q) = sgn(p) q, p , 0, sgn(p) = − sgn(p) q= 0∨p =0 . Schließlich gilt p < q ⇔ q − p ∈ N und p ≤ q ⇔ (p = q ∨ p < q). Beweis. Ist [(x, n)]∼ ∈ Z, [(x, n)]∼ > 0 = [(1, 1)]∼ , so gilt x + 1 > n + 1. Damit ist x − n ∈ N, und wegen (x − n + 1, 1) ∼ (x, n) folgt φ(x − n) = [(x, n)]∼ . Umgekehrt ist für y ∈ N φ(y) = [(y + 1, 1)]∼ > [(1, 1)]∼ = 0. Ist [(x, n)]∼ ∈ Z, [(x, n)]∼ < 0 = [(1, 1)]∼ , so folgt aus den Rechenregeln von Satz 2.4.17 0 > −[(x, n)]∼ = [(n, x)]∼ . Aus dem schon Bewiesenen folgt −[(x, n)]∼ = −φ(n − x), wobei n − x ∈ N. Umgekehrt ist für y ∈ N −φ(y) = [(1, y + 1)]∼ < [(1, 1)]∼ = 0. Also kann man N mit {p ∈ Z : p > 0} und −N mit {p ∈ Z : p < 0} identifizieren. ˙ ∪N, ˙ Z = −N∪{0} folgt nun aus der Tatsache, dass ≤ eine Totalordnung ist. Die restlichen Aussagen folgen aus der Definition von |.|, sgn(.) und der Tatsache, dass p < q ⇔ 0 < q − p, siehe Satz 2.4.17. ❑ 2.4. DER RING DER GANZEN ZAHLEN 33 Dividieren mit Rest Ausgerüstet mit unserem Grundwissen über die natürlichen und die ganzen Zahlen können wir nun in diesem Kapitel das aus der Schule bekannte Dividieren mit Rest mathematisch rechtfertigen. 2.4.19 Satz. Sind m ∈ N, n ∈ Z, so gibt es eindeutige Zahlen l ∈ Z und r ∈ {0, . . . , m − 1}8 , sodass n = ml + r. Dabei ist n ≥ 0 genau dann, wenn l ≥ 0. Beweis. Sei zunächst n ∈ N ∪ {0} beliebig. Da die Menge aller l ∈ N ∪ {0} mit m · l + m > n nicht leer ist (n ist sicher in dieser Menge), hat sie ein Minimum (Variante von Satz 2.3.10). Ist l = 0, so muss n ∈ {0, . . . , m − 1}, und ist l > 0, so folgt wegen der Minimalität ml = m(l − 1) + m ≤ n < ml + m. Also muss immer n = ml + r für ein l ∈ N ∪ {0} und ein r ∈ {0, . . . , m − 1}. Ist nun auch n = ml̂+ r̂ für lˆ ∈ N∪{0} und r̂ ∈ {0, . . . , m−1}, so folgt ml̂+m > n und wegen der Minimalitätseigenschaft von l auch lˆ ≥ l. Andererseits gilt ml̂ ≤ n, weshalb nicht l̂ > l sein kann, da sonst n ≥ ml̂ = ml + m(l̂ − l) ≥ ml + m wäre. Somit gibt es eindeutige l ∈ N ∪ {0} und r ∈ {0, . . . , m − 1}, sodass n = ml + r. Für n < 0 ist −n−1 ≥ 0. Somit gibt es eindeutige s ∈ N∪{0}, t ∈ {0, . . . , m−1}, sodass −n−1 = sm+t = (s+1)m+(t−m), und daher sodass −n = (s + 1)m + (t − m + 1), bzw. n = −(s + 1)m + (−t + m − 1). Setzen wir l = −(s + 1) und r = −t + m − 1, so sehen wir, dass n = ml + r für ein eindeutiges l < 0 und ein eindeutiges r ∈ {0, . . . , m − 1}. ❑ 2.4.20 Bemerkung. Die geraden (ungeraden) Zahlen sind genau alle ganzen Zahlen der Form 2k (2k + 1) für ein k ∈ Z. Aus Satz 2.4.19 folgt insbesondere, dass jede gegebene ganze Zahl gerade oder ungerade ist, wobei aus der Eindeutigkeitsaussage ˙ in Satz 2.4.19 folgt, dass sie nicht gleichzeitig gerade und ungerade sein kann. Also gilt Z = 2Z∪(2Z + 1). Entsprechendes gilt, wenn man 2 durch eine andere natürliche Zahl m ersetzt, wobei dann ˙ ˙ Z = mZ∪(mZ + 1)∪˙ . . . ∪(mZ + m − 1). 2.4.21 Definition. Eine Zahl q ∈ N teilt eine Zahl p ∈ N, falls es ein m ∈ N gibt, sodass mq = p. Wir schreiben q|p dafür. Teilt q die Zahl p nicht, so schreiben wir q ∤ p. Außerdem setzen wir p : q := m9 . Eine Zahl p ∈ N \ {1} heißt Primzahl, wenn p nur von 1 und p geteilt wird. Die Menge aller Primzahlen sei P. 2.4.22 Fakta. Falls q|p, so folgt aus mq = p und 1 ≤ m, dass q ≤ p, wobei q = p genau dann, wenn m = 1. Um zu sehen, ob eine Zahl p eine Primzahl ist, genügt es somit zu überprüfen, dass q ∤ p für alle q ∈ N, 1 < q < p. Man sieht sofort, dass 2, 3, 5, . . . Primzahlen sind. Ist n ∈ N \ {1} und M = {r ∈ N \ {1} : r|n}, so ist M nicht leer, da zumindest n ∈ M. Gilt M = {n}, so ist n definitionsgemäß eine Primzahl. Anderenfalls sei m das kleinste Element von M und k so, dass km = n. Nun ist m eine Primzahl, da sonst m = pq mit 1 < p, q < m, und weiter p(qk) = n. Es wäre p ∈ M im Widerspruch zur Minimalität von m. Insbesondere wird jede Zahl in N \ {1} von einer Primzahl geteilt. 2.4.23 Lemma. Seien a, b ∈ N und p ∈ P. Gilt p|(ab), so folgt p|a ∨ p|b. Beweis. Sei T ⊆ P die Menge aller Primzahlen, sodass die Aussage für gewisse a, b ∈ N falsch ist. Wir bringen die Annahme T , ∅ auf einen Widerspruch. Sei also T , ∅ und p die kleinste Zahl in T (siehe Satz 2.3.10). Somit gibt es a, b ∈ N mit p ∤ a ∧ p ∤ b, aber p|(ab), bzw. pn = ab für ein n ∈ N. Daher ist S = {n ∈ N : ∃a, b ∈ N : p ∤ a ∧ p ∤ b ∧ pn = ab}, die Menge aller solchen n nicht leer. Somit hat auch diese Menge ein Minimum s. Seien c, d ∈ N, sodass p ∤ c, p ∤ d und ps = cd. Aus den ersten beiden Tatsachen folgt c, d , p, c, d , 1, und daraus zusammen mit der Tatsache, dass p eine Primzahl ist, folgt s > 1. Nun muss c < p sein, da sonst c − p ∈ N und damit p(s − d) = (c − p)d, was s − d ∈ N implizieren und somit der Minimalität von s widersprechen würde. Genauso gilt d < p. Daraus schließen wir wegen ps = cd auf s < p. Gemäß Fakta 2.4.22 gibt es eine Primzahl p′ ≤ s < p, sodass p′ |s, d.h. s = p′ s′ für ein s′ ∈ N, s′ < s. Somit folgt p′ (ps′ ) = cd, also p′ |(cd). Wegen der Minimalität von p muss p′ |c oder p′ |d. O.B.d.A. sei c = c′ p′ , c′ ∈ N, womit p′ (ps′ ) = p′ (c′ d) und daraus ps′ = c′ d folgt. Nun widerspricht das aber ebenfalls der Minimalität von s. ❑ 2.4.24 Satz. Ist n ∈ N \ {1}, so gibt es eindeutige Primzahlen p1 , . . . , pm ∈ P und Exponenten e1 , . . . , em ∈ N, sodass e n = p11 · . . . pemm . Diese Zerlegung heißt Primfaktorzerlegung. 8 {0, . . . , m 9 Da − 1} steht für {k ∈ N ∪ {0} : 0 ≤ k < m} wir in Z kürzen dürfen, ist p : q eindeutig definiert. (2.8) KAPITEL 2. DIE REELLEN ZAHLEN 34 Beweis. Wir zeigen zuerst die Existenz einer solche Zerlegung. Für n = 2 ist diese klar. Angenommen für ein n > 2 gibt es zu allen k < n, k ≥ 2 eine solche Zerlegung. Nach Fakta 2.4.22 gibt es eine Primzahl p ≤ n mit p|n. Ist n = p, so haben wir unsere Zerlegung. Ist p < n, so folgt n = (n : p)p, wobei nach Voraussetzung n : p (< n) eine solche Zerlegung hat. Somit hat auch n eine solche Zerlegung. Nach einer Variante des Prinzips der vollständigen Induktion gibt es eine Primfaktorzerlegung für alle n ∈ N \ {1}. Die Eindeutigkeit ist für n = 2 wieder klar, da alle Produkte der Form (2.8) einen Wert > 2 ergeben, außer für m = 1 und e1 = 1, p1 = 2. Angenommen mit einem n > 2 ist die Primfaktorzerlegung eindeutig für alle k < n, k ≥ 2, und angenommen f f e q11 · . . . ql l = n = p11 · . . . pemm , e mit l, m ∈ N und e1 , . . . , em , f1 , . . . , fl ∈ N sowie p1 , . . . , pm , q1 , . . . , ql ∈ P. Insbesondere gilt q1 |p11 · . . . pemm . Nach Lemma 2.4.23 muss q1 |p j und daher q1 = p j für ein j ∈ {1, . . . , m}. Durch Umnummerierung können wir q1 = p1 annehmen. Es folgt f e −1 f −1 q11 · . . . ql l = n : q1 = p11 · . . . pemm . Ist n : q1 = 1, so muss n = p1 = q1 und l = 1 = m, e1 = 1 = f1 . Sonst folgt wegen 1 < n : q1 < n aus unserer Annahme, dass auch l = m und e j = f j sowie p j = q j , j = 1, . . . , l. ❑ 2.5 Der Körper Q Oben haben wir den kommutativen Integritätsring hZ, +, ·i konstruiert. Diesen werden wir nun zu einem angeordneten Körper, dem Körper der rationalen Zahlen erweitern, und damit sehen, dass es zumindest einen angeordneten Körper gibt. Der Grundgedanke der folgenden Konstruktion entspringt der Tatsache, dass in einem Körper qp11 = qp22 genau dann, wenn p1 q2 = p2 q1 . 2.5.1 Definition. Sei ∼⊆ (Z × N)2 die Relation (x, n) ∼ (y, m) : ⇐⇒ xm = yn . 2.5.2 Lemma. Die Relation ∼ ist eine Äquivalenzrelation. Beweis. Die Reflexivität und Symmetrie sind offensichtlich. Sei nun (x, n) ∼ (y, m) und (y, m) ∼ (z, k) dann gilt also xm = yn und yk = zm. Es folgt (xk)m = (xm)k = (yn)k = (yk)n = (zm)n = (zn)m , und da hZ, +, ·i ein Integritätsring ist, gilt die Kürzungsregel, und wir erhalten xk = zn, d.h. (x, n) ∼ (z, k). ❑ 2.5.3 Definition. Wir bezeichnen mit Q die Menge (Z × N)/∼ aller Äquivalenzklassen. Q heißt der Körper der rationalen Zahlen. Um auf Q die algebraischen Operationen + und · zu definieren, definieren wir zunächst Addition und Multiplikation auf Z × N, und übertragen diese dann durch Faktorisieren auf Q. ( (Z × N)2 → Z × N +: ((x, n), (y, m)) 7→ (xm + yn, nm) ( (Z × N)2 → Z × N ·: ((x, n), (y, m)) 7→ (xy, nm) 2.5. DER KÖRPER Q 35 Die Motivation für unsere Definition ergibt sich aus den Regeln der Bruchrechnung. x y xm yn xm + yn x y xy + = + = , · = . n m nm mn nm n m nm 2.5.4 Lemma. Für die Verknüpfungen +, · gilt das Kommutativ-, Assoziativ- und Distributivgesetz. Beweis. Die Gesetze gelten, da man sie leicht auf die Gültigkeit dieser Gesetze auf Z zurückführt. Zum Beispiel gilt das Assoziativgesetz wegen ((x, n) + (y, m)) + (z, k) = (xm + yn, nm) + (z, k) = ((xm + yn)k + z(nm), (nm)k) = (x(mk) + (yk + zm)n, n(mk)) = (x, n) + ((y, m) + (z, k)). ❑ Um Q anordnen zu können, definieren wir noch ( (Z × N) → Z sgn : . (x, n) 7→ sgn(x) 2.5.5 Lemma. Sind (x, n) ∼ ( x̂, n̂) und (y, m) ∼ (ŷ, m̂), so folgt sgn((x, n)) = sgn(( x̂, n̂)) und (x, n) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂), (x, n) · (y, m) ∼ ( x̂, n̂) · (ŷ, m̂) . Beweis. Seien (x, n) ∼ ( x̂, n̂) und (y, m) gegeben. Zunächst folgt aus xn̂ = x̂n und n, n̂ ∈ N, dass sgn((x, n)) = sgn(x) = sgn( x̂) = sgn(( x̂, n̂)). Weiters gilt (xm + yn)n̂m = xmn̂m + ynn̂m = = (xn̂ − x̂n) mm + x̂nmm + ynn̂m = ( x̂m + yn̂)nm , | {z } =0 also (x, n) + (y, m) ∼ ( x̂, n̂) + (y, m). Wegen der Kommutativität folgt daraus mit vertauschter Notation, dass für ( x̂, n̂) und (y, m) ∼ (ŷ, m̂) stets auch ( x̂, n̂) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂). Wegen der Transitivität folgt (x, n) + (y, m) ∼ ( x̂, n̂) + (ŷ, m̂) . Bei der Multiplikation geht man analog vor. Seien (x, n) ∼ ( x̂, n̂) und (y, m) gegeben. Dann gilt xyn̂m = (xn̂ − x̂n) ym + x̂nym = x̂ynm , | {z } =0 also (x, n)·(y, m) ∼ ( x̂, n̂)·(y, m). Wegen der Kommutativität folgt daraus mit vertauschter Notation, dass für ( x̂, n̂) und (y, m) ∼ (ŷ, m̂) stets auch ( x̂, n̂) · (y, m) ∼ ( x̂, n̂) · (ŷ, m̂). Wegen der Transitivität folgt schließlich (x, n) · (y, m) ∼ ( x̂, n̂) · (ŷ, m̂) . ❑ KAPITEL 2. DIE REELLEN ZAHLEN 36 2.5.6 Definition. Auf Q seien zwei algebraische Operationen + und · dadurch definiert, dass wir für a, b ∈ Q Paare (x, n), (y, m) ∈ Z×N mit [(x, n)]∼ = a und [(y, m)]∼ = b wählen, und sgn(a) := sgn((x, n)) sowie a + b := (x, n) + (y, m) ∼ , a · b := (x, n) · (y, m) ∼ setzen. Wegen Lemma 2.5.5 hängen sgn(a), a + b und a · b nicht von den gewählten Repräsentanten (x, n) bzw. (y, m) ab. 2.5.7 Satz. Setzt man nun P = {a ∈ Q : sgn(a) = 1}, so ist hQ, +, ·, Pi ist ein angeordneter Körper. Dabei ist [(0, 1)]∼ das neutrale Element bzgl. +, [(1, 1)]∼ das neutrale Element bezüglich ·. Zu [(x, n)]∼ ∈ Q ist [(−x, n)]∼ das additiv Inverse, und zu [(x, n)]∼ ∈ Q \ {0} ist [(sgn(x)n, |x|)]∼ das multiplikativ Inverse. Außerdem gilt [(x, n)]∼ ≤ [(y, m)]∼ ⇔ xm ≤ ny. (2.9) Die ganzen Zahlen Z sind in Q eingebettet durch ( Z → Q φ: x 7→ [(x, 1)]∼ Diese Einbettung erhält Addition, Multiplikation und Ordnung. Schließlich hat Q die Eigenschaft, dass die Teilmenge φ(N) von Q keine obere Schranke hat. Beweis. Die Gültigkeit der Rechenregeln wie Kommutativität, Assoziativität und Distributivität ergibt sich aus den entsprechenden Regeln für + und · auf Z × N. Für a = [(x, n)]∼ ∈ Q gilt a + [(0, 1)]∼ = [(x + 0, n · 1)]∼ = a, a · [(1, 1)]∼ = [(x · 1, n · 1)]∼ = a . Weiters hat man für b := [(−x, n)]∼ a + b = [(xn − xn, nn)]∼ = [(0, nn)]∼ = [(0, 1)]∼ = 0 . Sei nun a , 0, d.h. (x, n) / (0, 1) oder äquivalent x , 0. Mit c := [(sgn(x)n, |x|)]∼ folgt ac = [(sgn(x)xn, n|x|)]∼ = [(1, 1)]∼. Wegen sgn([(−x, n)]∼) = sgn(−x) = − sgn([(x, n)]∼) und sgn([(x, n)]∼) = 0 ⇔ x = 0 ⇔ [(x, n)]∼ = [(0, 1)]∼ gilt für a ∈ Q a∈P ⇔ sgn(a) = 1 a ∈ {0} ⇔ sgn(a) = 0 a ∈ −P ⇔ sgn(a) = −1 Daraus folgt sofort ˙ ∪˙ − P, Q = P∪{0} 2.5. DER KÖRPER Q 37 wobei das eine Vereinigung paarweiser disjunkter Mengen ist. Aus sgn([(x, n)]∼ + [(y, m)]∼) = sgn(xm + yn) und sgn([(x, n)]∼ · [(y, m)]∼) = sgn(xy) erhalten wir, dass a, b ∈ P die Tatsache a + b, a · b ∈ P nach sich zieht. Somit ist hQ, +, ·, Pi ein angeordneter Körper, und wir haben damit eine Totalordnung ≤ auf Q. (2.9) folgt aus [(y, m)]∼ − [(x, n)]∼ = [(yn − xm, mn)]∼ ∈ {0} ∪ P ⇔ sgn(yn − xm) ≥ 0 ⇔ xm ≤ yn. Betrachte nun die Abbildung φ : Z → Q. Diese ist injektiv, denn (x, 1) ∼ (y, 1) gilt genau dann, wenn x = y. Dass φ die algebraischen Operationen erhält, rechnet man leicht nach. Die Verträglichkeit mit der Ordnung gilt, da wegen (2.9) x ≤ y ⇔ x · 1 ≤ y · 1 ⇔ [(x, 1)]∼ ≤ [(y, 1)]∼ ⇔ φ(x) ≤ φ(y). Angenommen [(x, n)]∼ ist eine obere Schranke von φ(N), also mn ≤ x für alle m ∈ N. Das ist aber offensichtlich falsch, wenn x ≤ 1 und man zum Beispiel m = 2 setzt. Ist x > 1, so erhält man mit m = x2 den Widerspruch x ≤ xn ≤ 1. ❑ x n Wir werden im Folgenden für die rationale Zahl [(x, n)]∼ stets das Symbol schreiben. Dieses Symbol drückt tatsächlich die Division von x durch n aus, denn man hat [(x, 1)]∼ = [(x, n)]∼ · [(n, 1)]∼ Wir sehen insbesondere, dass jede rationale Zahl der Quotient von zwei ganzen Zahlen ist. Nun wollen wir zeigen, dass jeder angeordnete Körper die rationalen Zahlen, und damit insbesondere auch die ganzen Zahlen, enthält. 2.5.8 Proposition. Sei hK, +, ·, Pi ein angeordneter Körper. Dann gibt es eine eindeutige Abbildung φ : Q → K, die nicht identisch gleich 0K ist, und welche mit der Addition und Multiplikation verträglich ist. Diese Abbildung ist dann injektiv und auch mit − sowie mit den Ordnungen < und ≤ verträglich. Beweis. Für n ∈ N und x ∈ K haben wir im Abschnitt über die natürlichen Zahlen eine Funktion n 7→ nx von N nach K rekursiv durch 1x = x und (n′ )x = nx + x definiert; siehe Bemerkung 2.3.4. Nun nehmen wir für x ∈ K das multiplikativ neutrale Element 1K von K, und bezeichnen mit φ : N → K die entsprechende Funktion n 7→ n1K , welche offensichtlicherweise φ(1) = 1K und φ(n + 1) = φ(n) + 1K erfüllt. Mit vollständiger Induktion nach m zeigt man leicht, dass φ(n + m) = φ(n) + φ(m) und φ(n · m) = φ(n) · φ(m) für alle n, m ∈ N. Wegen 1K ∈ P (siehe Lemma 2.2.2) sieht man ebenfalls mit vollständiger Induktion, dass φ(n) ∈ P für alle n ∈ N. Insbesondere gilt immer φ(n) , 0K . Nun setzen wir φ auf Z dadurch fort, dass wir φ(0) = 0K und φ(−n) = −φ(n), n ∈ N setzen. Man beweist durch Fallunterscheidungen mit der in Definition 2.4.2 angegebenen Form von + und · auf Z auf elementare Art und Weise, dass diese Fortsetzung die Addition und Multiplikation erhält. Wegen (p, q ∈ Z) p < q ⇔ q − p ∈ N ⇔ φ(q − p) = φ(q) − φ(p) ∈ P ⇔ φ(p) < φ(q) ist φ auch mit der Ordnung verträglich. KAPITEL 2. DIE REELLEN ZAHLEN 38 Da ganz Q von den Quotienten φ durch die Vorschrift x n mit x ∈ Z, n ∈ N, ausgeschöpft wird, lässt sich φ x n := φ(x) φ(n) zu einer Abbildung von Q nach K fortsetzen. Man beachte hier, dass aus nx = n̂x̂ φ(x) φ( x̂) folgt, dass xn̂ = x̂n und daher φ(x)φ(n̂) = φ( x̂)φ(n) bzw. φ(n) = φ(n̂) . Also ist diese Abbildung wohldefiniert. Diese Fortsetzung erhält ebenfalls die Addition und Multiplikation, denn für x y n , m ∈ Q gilt φ x + φ x · n xm + yn φ(xm + yn) y =φ = = m nm φ(nm) y x φ(x)φ(m) + φ(y)φ(n) φ(x) φ(y) +φ , = + =φ φ(n)φ(m) φ(n) φ(m) n m xy φ(xy) y =φ = = n m nm φ(nm) x y φ(x) φ(y) φ(x)φ(y) ·φ . = · =φ φ(n)φ(m) φ(n) φ(m) n m Sie erhält auch die Ordnung, denn es gilt x y φ(x) φ(y) < ⇐⇒ xm < yn ⇐⇒ φ(x)φ(m) < φ(y)φ(n) ⇐⇒ < . n m φ(n) φ(m) Es folgt insbesondere, dass φ injektiv ist. Um die Eindeutigkeit von φ nachzuweisen, sei φ̃ eine weitere mit Addition und Multiplikation verträgliche Abbildung, sodass φ̃(x) , 0 für zumindest ein x ∈ Q. Aus φ̃(x)φ̃(1) = φ̃(x1) = φ̃(x) folgt φ̃(1) = 1K , und aus φ̃(0) + φ̃(0) = φ̃(0 + 0) = φ̃(0) folgt φ̃(0) = 0K . Durch vollständige Induktion zeigt man, dass φ̃(n) = φ(n) für n ∈ N. Aus φ̃(−n)+ φ̃(n) = φ̃(0) = 0K = φ(−n) + φ(n) folgt φ̃(p) = φ(p), p ∈ Z. Schließlich folgt aus φ̃( np )φ̃(n) = φ̃(p) = φ(p) = φ( np )φ(n), dass φ̃ = φ. ❑ Das letzte Resultat zeigt uns, dass die rationalen Zahlen in einem gewissen Sinn der kleinste angeordnete Körper ist. Wenn wir im Folgenden von den natürlichen (ganzen, rationalen) Zahlen als Teilmenge eines angeordneten Körpers sprechen, so wollen wir darunter die gemäß Proposition 2.5.8 existierende isomorphe Kopie φ(N) = {n1k : n ∈ N}, φ(Z), bzw. φ(Q) verstehen und nicht mehr z.B. zwischen n und n · 1K unterscheiden. 2.5.9 Bemerkung. Die am Beginn vom Beweis von Proposition 2.5.8 konstruierte Einbettung φ der natürlichen Zahlen in einen angeordneten Körper lässt sich auch auf beliebigen Körpern K durchführen. Dabei kann es passieren, dass φ(n) = 0K für ein n ∈ N. Das kleinste derartige n ist dann eine Primzahl und heißt die Charakteristik des Körpers K. Ist hingegen immer φ(n) , 0K , so sagt man, dass K von Charakteristik Null ist. Insbesondere sind angeordnete Körper von Charakteristik Null. Man sieht leicht ein, dass dann φ injektiv ist, und man denselben Beweis wie den von Proposition 2.5.8 hernehmen kann, um zu zeigen, dass sich Q injektiv in jeden Körper der Charakteristik Null einbetten lässt. 2.6. ARCHIMEDISCH ANGEORDNETE KÖRPER 39 2.5.10 Bemerkung. Die angegebene Art und Weise, aus Z die rationalen Zahlen zu konstruieren, lässt sich auf beliebige kommutative Integritätsringe R ausdehnen. Dazu betrachtet man R × (R \ {0}) und die Äquivalenzrelation ∼ mit (x, a) ∼ (y, b) ⇔ xb = ya darauf. Die in diesem Abschnitt gebrachten Ergebnisse (samt Beweise) gelten sinngemäß auch in dieser allgemeineren Situation, wobei man hier i.A. keine sgn-Funktion hat, und wobei das multiplikativ Inverse zu [(x, n)]∼ genau [(n, x)]∼ ist. (R × (R \ {0}))/∼ ist dann ein Körper (Quotientenkörper von R), aber i.A. kein angeordneter Körper. Wendet man diese Konstruktion auf Z an, so erhält man wieder Q. 2.6 Archimedisch angeordnete Körper 2.6.1 Definition. Sei hK, +, ·, Pi ein angeordneter Körper. Dann heißt K archimedisch angeordnet, wenn N als Teilmenge von K nicht nach oben beschränkt ist. In Satz 2.5.7 haben wir gesehen, dass die rationalen Zahlen archimedisch angeordnet sind. Wir werden auch sehen, dass die reellen Zahlen archimedisch angeordnet sind. 2.6.2 Beispiel. Die Eigenschaft, dass hK, +, ·, Pi ein archimedisch angeordneter Körper ist, ermöglicht es uns etwa das Infimum von Mengen wie ) ( 1 :n∈N M= n zu berechnen. Der Vermutung nach ist inf M = 0. Um das zu beweisen, sei zunächst bemerkt, dass 0 offensichtlich eine untere Schranke von M ist. Wäre ǫ > 0 eine weitere untere Schranke von M, d.h. 0 < ǫ < 1 1 n , n ∈ N, so folgte n < ǫ , was aber der Eigenschaft von K, archimedisch angeordnet zu sein, widerspricht. In archimedisch angeordneten Körpern gilt der folgende für die später zu entwickelnde Konvergenztheorie wichtige 2.6.3 Satz. Sei hK, +, ·, Pi ein archimedisch angeordneter Körper. Sind x, y ∈ K, x < y, dann existiert p ∈ Q mit x < p < y 10 . Beweis. Seien zunächst x, y ∈ K mit 0 ≤ x < y gegeben. Dann ist y − x > 0 und damit 1 1 > 0. Da K archimedisch angeordnet ist, gibt es ein n ∈ N mit n > y−x und auch y−x daher n(y − x) > 1. Nach Satz 2.3.10 hat {k ∈ N : k > nx} ein Minimum, und somit gibt es eine kleinste natürliche Zahl m ∈ N, sodass m > nx. Ist m > 1, so folgt aus der Wahl von m, dass m − 1 ≤ nx. Ist m = 1, so folgt gemäß unserer Voraussetzung m − 1 = 0 ≤ nx. Also gilt immer m − 1 ≤ nx < m. Kombiniert man diese Ungleichung mit n(y − x) > 1, so folgt nx < m ≤ nx + 1 < ny , und damit x < mn < y. Ist schließlich x < 0, so können wir ein k ∈ N wählen mit k ≥ |x|, da N ja nicht nach oben beschränkt ist. Es folgt 0 ≤ x + k < y + k, und nach dem eben bewiesenen x + k < mn < y + k. Nun ist mn − k eine rationale Zahl mit x < mn − k < y. ❑ 10 Diese Aussage nennt man auch die Dichteeigenschaft von Q in K. 40 KAPITEL 2. DIE REELLEN ZAHLEN 2.6.4 Bemerkung. Da man obigen Satz induktiv immer wieder anwenden kann, sieht man, dass zwischen zwei Zahlen sogar unendlich viele rationale Zahlen liegen. Ist Q ( K, so kann man mit einer linearen Transformation sogar zeigen, dass es eine nicht rationale Zahl zwischen 0 und 1 gibt, und weiters unter Verwendung von Satz 2.6.3, dass es zwischen zwei Zahlen von K auch eine nicht rationale Zahl gibt. 2.7 Das Vollständigkeitsaxiom Wie wir später sehen werden, ist die Vollständigkeit die Eigenschaft der reellen Zahlen, die sie unverwechselbar von anderen angeordneten Körpern unterscheidet. 2.7.1 Definition. Sei hK, +, ·, Pi ein angeordneter Körper. Dann heißt K vollständig angeordnet, wenn jede nach oben beschränkte Menge ein Supremum hat. Diese Eigenschaft nennen wir (s). Wie schon im vorhergehenden Abschnitt erwähnt, gilt 2.7.2 Lemma. Ist hK, +, ·, Pi ein vollständig angeordneter Körper, so ist er archimedisch angeordnet. Beweis. Wäre nämlich N nach oben beschränkt, so existierte wegen (s) η = sup N. Sei n beliebig in N. Mit n gehört aber auch n + 1 zu N. Also gilt n + 1 ≤ η, und somit n ≤ η − 1. Daher ist η − 1 eine obere Schranke von N, was den Widerspruch η − 1 ≥ sup N = η nach sich zieht. ❑ Nun gilt folgender wichtige Satz, dessen Beweis wir später (am Ende dieses Abschnittes bzw. im Kapitel 4) bringen werden. 2.7.3 Satz. Es gibt einen vollständig angeordneten Körper hL, +, ·, L+ i. Ist hK, +, ·, Pi ein weiterer vollständig angeordneter Körper, so gibt es einen eindeutigen Isomorphismus φ : L → K, also eine Bijektion, sodass φ mit den Operationen verträglich ist und sodass φ(L+ ) = P. Wenn wir ab jetzt von den reellen Zahlen sprechen, dann sei immer ein vollständig angeordneter Körper hL, +, ·, L+ i gemeint. Wir schreiben im Folgenden immer hR, +, ·, R+ i dafür. Wegen Satz 2.7.3 ist hR, +, ·, R+ i bis auf Kopien eindeutig. Es sei aber bemerkt, dass diese Eindeutigkeit für die restlichen Aussagen dieses Kapitels und auch für Kapitel 3 unerheblich sind – diese also in jedem vollständig angeordneten Körper gelten. 2.7.4 Bemerkung. Zusammenfassend sei nochmals betont, dass die reellen Zahlen R einen vollständig angeordneter Körper bilden, der die Körperaxiome (a1)-(a4), (m1)(m4), (d), die Axiome eines angeordneten Körpers (p1)-(p3) und das Vollständigkeitsaxiom (s) erfüllt. Alle bisher gezeigten Rechenregeln und Eigenschaften von R lassen sich alle aus diesen Axiomen herleiten, bzw. haben wir hergeleitet. Auch die im Folgenden aufgebaute Analysis setzt nur auf diese Axiome auf. 2.7. DAS VOLLSTÄNDIGKEITSAXIOM 41 Die Vollständigkeit von R garantiert zum Beispiel, dass es n-te Wurzeln von nichtnegativen Zahlen gibt. 2.7.5 Satz. Sei x ∈ R, x ≥ 0, und n ∈ N. Dann existiert genau eine Zahl y ∈ R, y ≥ 0, sodass yn = x. Beweis. Im Fall n = 1 ist die Aussage trivial. Sei also n ≥ 2. Die Eindeutigkeit von y folgt unmittelbar aus Lemma 2.4.8, da aus 0 ≤ y1 < y2 immer yn1 < yn2 folgt. Somit können nicht beide der Gleichung yn = x genügen. Zur Existenz: Ist x = 0, so ist klarerweise yn = x für y = 0. Im Fall x > 0 sei E := {t ∈ R : t > 0, tn < x}. x Diese Menge ist nicht leer, denn für s = 1+x gilt 0 < s < min(x, 1) und daher sn < s < x; also s ∈ E. Für τ := 1 + x gilt τ > 1 und daher τn > τ > x. Aus t ≥ τ folgt dann tn ≥ τn > x und damit t < E. Also muss τ eine obere Schranke von E sein. x Da R vollständig angeordnet ist, existiert y := sup E. Wegen 0 < 1+x ∈ E ist sicher n y > 0. Wir zeigen im Folgenden, dass y = x, und zwar indem wir die beiden anderen Möglichkeiten yn < x und yn > x ausschließen. Dazu benötigen wir, dass die für beliebige Elemente a, b ∈ R geltende und mit vollständiger Induktion nach n zu beweisende Gleichung bn − an = (b − a)(bn−1 + bn−2 a + . . . + ban−2 + an−1 ) . (2.10) Für 0 < a < b erhalten wir daraus die Abschätzung bn − an < (b − a)nbn−1 . (2.11) Angenommen yn < x, so gibt es gemäß Satz 2.6.3 ein ǫ ∈ Q mit ! x − yn ,1 . 0 < ǫ < min n(y + 1)n−1 Setzen wir in (2.11) a = y und b = y + ǫ, so folgt (y + ǫ)n − yn < ǫn(y + ǫ)n−1 < ǫn(y + 1)n−1 < x − yn . Also gilt (y + ǫ)n < x und daher y + ǫ ∈ E im Widerspruch zu y = sup E. Wäre yn > x, so setze man yn − x δ := n−1 . ny Dann gilt 0 < δ < ny < y. Wir zeigen, dass y − δ eine obere Schranke von E ist. Wäre dem nicht so, dann gilt t > y − δ für ein t ∈ E. Aus (2.11) folgt aber mit b = y, a = (y − δ) yn − tn < yn − (y − δ)n < δnyn−1 = yn − x . Also tn > x, und daher der Widerspruch t < E. Die Tatsache, dass y−δ eine obere Schranke von E ist, widerspricht aber y = sup E. ❑ KAPITEL 2. DIE REELLEN ZAHLEN 42 2.7.6 Definition. Die nach obigem √Satz eindeutig bestimmte Zahl y ≥ 0, die n-te 1 Wurzel von x, schreibt man auch als n x oder x n . 2.7.7 Bemerkung. Man betrachte die Funktion ( + R ∪ {0} → R+ ∪ {0} . y 7→ yn Gemäß Lemma 2.4.8 ist diese √ Funktion streng monoton wachsend und daher injektiv. Zu gegebenem x ist y = n x jene Zahl, sodass yn = x. Also ist y 7→ yn auch surjektiv + + als Funktion von und ihre Umkehrfunktion √ √n R ∪ {0} nach R ∪ {0}. Sie ist also bijektiv ist genau x 7→ x. Wegen Lemma 2.4.8 ist auch x 7→ n x streng monoton wachsend. 2.7.8 Bemerkung. Nun sehen wir auch, dass R nicht nur aus rationalen Zahlen bestehen kann, also Q ( R gilt. Wäre nämlich √ p 2 = ∈ Q, q (2.12) so kann man p, q teilerfremd wählen, d.h. es gibt kein k ∈ N \ {1}, welches p und q teilt11 . Insbesondere ist nur höchstens eine der Zahlen p oder q gerade. Ausquadrieren und mit q2 Multiplizieren in (2.12) ergibt 2q2 = p2 . Da eine Zahl genau dann gerade ist, wenn ihr Quadrat es ist, folgt, dass p gerade und damit q ungerade ist; siehe Satz 2.4.24. Schreibt man p = 2m, so folgt 2q2 = 4m2 , und damit q2 = 2m2 . Wir erhalten daraus den Widerspruch, dass auch q gerade sein müsste. 2.7.9 Definition. Ist x > 0 und ist r ∈ Q dargestellt in der Form r = so definieren wir √ p xr := q x . p q mit p ∈ Z, q ∈ N, Da die Darstellung einer rationalen Zahl als Bruch nicht eindeutig ist, müssen wir nachweisen, dass die Definition von xr nicht von der Wahl von p, q abhängt. Dazu brauchen wir q √ √ √ 2.7.10 Lemma. Sind x > 0, z > 0 und p ∈ Z, q ∈ N, so gilt q 1x = √q1x , q xz = q x q z sowie √q √ ( q x) p = x p . (2.13) q Beweis. q 1x = √q1x folgt aus ( √q1x )q = ( √q1x)q = 1x und der Tatsache, dass nach Satz 2.7.5 q q 1 1 q x die eindeutige Lösung y von y = x ist. √q q √q q √ √ √q √q q √q xz übereinstimmen. Wegen ( x z) = ( x) ( z) = xz muss q x q z mit √q 1 = 1. Sonst folgt (2.13)√wegen Ist p = √ 0, so ist (2.13) trivialerweise richtig, da ja √ q (2.6) aus (( q x) p )q = (( q x)q ) p = x p und aus der Tatsache, dass nach Satz 2.7.5 x p die eindeutige Lösung y von yq = x p ist. ❑ Ist jetzt r = p q = m n, so folgt wegen pn = qm √ pn √ qm √ q √ p ( q x ) n = q x = q x = ( q x ) m = xm . 11 Eine ganze Zahl k , 0 teilt eine ganze Zahl n, wenn es ein m ∈ Z gibt, sodass km = n. 2.7. DAS VOLLSTÄNDIGKEITSAXIOM 43 Zieht man links und rechts die n-te Wurzel, so gilt wegen (2.13) √q p √n m x = x , und damit ist xr wohldefiniert. Außerdem gelten die (mit einer Beweisführung ähnlich wie der von Lemma 2.7.10 zu zeigenden) Rechenregeln (r, s ∈ Q, x > 0) xr+s = xr x s , (xr ) s = xrs , x−r = 1 . xr 2.7.11 Lemma (Lemma vom iterierten Supremum). Seien M, N zwei nichtleere Mengen und f : M × N → R eine nach oben beschränkte Funktion, dh. { f (m, n) : (m, n) ∈ M × N} ist nach oben beschränkt. Dann gilt sup{sup{ f (m, n) : m ∈ M} : n ∈ N} = sup{ f (m, n) : (m, n) ∈ M × N} = sup{sup{ f (m, n) : n ∈ N} : m ∈ M}. Sind umgekehrt alle Mengen { f (m, n) : m ∈ M}, n ∈ N, nach oben beschränkt genauso wie {sup{ f (m, n) : m ∈ M} : n ∈ N}, bzw. gilt entsprechendes mit M und N vertauscht, so ist auch { f (m, n) : (m, n) ∈ M × N} nach oben beschränkt, womit obige Gleichung wieder gilt. 12 Eine entsprechende Aussage gilt fürs Infimum. Beweis. Wir setzen s = sup{ f (m, n) : (m, n) ∈ M × N} und für festes q ∈ N auch sq = sup{ f (m, q) : m ∈ M}. Aus { f (m, q) : m ∈ M} ⊆ { f (m, n) : (m, n) ∈ M × N} folgt dann sq ≤ s für jedes q ∈ N; also auch sup{sq : q ∈ N} ≤ s. Umgekehrt folgt für festes (m, n) ∈ M × N, dass f (m, n) ∈ { f (m, q) : m ∈ M}, wenn nur q = n. Für dieses q ist f (m, n) ≤ sq ; also gilt auch f (m, n) ≤ sup{sq : q ∈ N}. Da (m, n) ∈ M × N beliebig war, folgt schließlich s ≤ sup{sq : q ∈ N}. ❑ Die Existenz und Eindeutigkeit der reellen Zahlen Am Ende dieses Abschnitts werden wir beweisen, dass vollständig angeordnete Körper tatsächlich existieren, und dass alle solche immer Kopien von einander sind. Eine andere Art und Weise, das zu tun, findet sich in Kapitel 4. Um diese anspruchsvolle Konstruktion zu motivieren, denken wir uns eine Gerade gemeinsam mit einer Einheitsstrecke gezeichnet. Auf dieser Geraden denken wir uns die rationalen Zahlen durch fortgesetztes unterteilen der Einheitsstrecke aufgetragen. Obwohl es anschaulich beliebig nahe an jedem Punkt eine rationale Zahl gibt, gibt es gemäß Bemerkung 2.7.8 Punkte, welche nicht rational sind. Unsere Konstruktion beruht auf der folgenden Bemerkung, die R.Dedekind13 gemacht hat: Zerfallen alle Punkte der Geraden in zwei Klassen von der Art, dass jeder Punkt der ersten Klasse links von jedem Punkt der zweiten Klasse liegt, so existiert ein und nur ein Punkt, welcher diese Einteilung aller Punkte in zwei Klassen, diese Zerschneidung der Geraden in zwei Stücke, hervorbringt. Man kann also einen Punkt P der Geraden identifizieren mit der Menge aller Punkte, die links von ihm liegen. Da man nun aber mit den rationalen Punkten beliebig nahe an den Punkt P herankommt, genügt es, alle rationalen Punkte die links von P liegen zu kennen, um P selbst eindeutig zu rekonstruieren. 2.7.12 Satz. Es gibt einen vollständig angeordneten Körper. Dieser ist bis auf Isomorphie eindeutig bestimmt. Beweis. Der Beweis dieses Satzes ist relativ lang und wird in mehreren Schritten geführt von denen wir auch nicht alle im Detail ausführen werden. 12 Also gilt obige Gleichung auch für nicht notwendigerweise nach oben beschränkte Funktionen, wenn man auch den Wert +∞ zulässt. 13 Richard Dedekind. 6.10.1831 Braunschweig - 12.2.1916 Braunschweig KAPITEL 2. DIE REELLEN ZAHLEN 44 Schritt 1: Eine Teilmenge α von Q heißt ein Dedekindscher Schnitt, wenn sie die folgenden drei Eigenschaften besitzt: (I) (II) (III) α , ∅, α , Q. Aus p ∈ α folgt (−∞, p] ⊆ α. Ist p ∈ α, so existiert ein ǫ ∈ Q, ǫ > 0, sodass p + ǫ ∈ α. Die Menge aller Dedekindschen Schnitte bezeichnen wir mit K. Dieser Begriff modelliert die Anschauung der Menge aller rationalen Punkte, die links von dem Punkt der Geraden ” liegen“. Die Eigenschaft (III) besagt, dass α kein größtes Element hat. Aus der Eigenschaft (II) erhält man unmittelbar die folgenden beiden Aussagen. (i) Ist p ∈ α und q < α, dann ist p < q. (ii) Ist r < α und s > r, so ist s < α. Schritt 2: Wir definieren eine Relation ≤ auf K durch α ≤ β : ⇐⇒ α ⊆ β, α, β ∈ K , Diese Relation ist offenbar eine Halbordnung. Wir zeigen, dass sie sogar eine Totalordnung ist. Seien α, β ∈ K und sei angenommen, dass α β, d.h. α * β. Dann existiert also p ∈ α mit p < β. Also folgt folgt aus q > p, dass q < β, und aus q < p, dass q ∈ α. Ist also q ∈ β, so muss q < p sein und daher zu α gehören. Somit gilt β ≤ α. Für α ( β schreiben wir auch α < β. Schritt 3: In diesem Schritt zeigen wir, dass K mit der Ordnung ≤ die Supremumseigenschaft besitzt. Sei A ⊆ K eine nichtleere und nach oben beschränkte Teilmenge von K, und setze γ := [ α. α∈A Wir zeigen, dass γ ∈ K. Da A nichtleer ist, existiert ein α0 ∈ A. Nun ist α0 nichtleer und α0 ⊆ γ, also gilt auch γ , ∅. Da A nach oben beschränkt ist, existiert β ∈ K mit α ⊆ β für alle α ∈ A, was γ ⊆ β nach sich zieht. Wegen β , Q ist auch γ , Q. Also erfüllt γ die Eigenschaft (I). Ist p ∈ γ, so existiert α ∈ A mit p ∈ α. Also folgt (−∞, p] ⊆ α ⊆ γ. Weiters existiert ein rationales ǫ > 0 mit r + ǫ ∈ α ⊆ γ. Wir sehen also, dass γ die Eigenschaften (II) und (III) hat. Es bleibt γ = sup A zu zeigen. Offenbar gilt α ≤ γ für alle α ∈ A. Ist β ∈ K mit β ≥ α bzw. β ⊇ α für alle α ∈ A, so folgt β ⊇ γ. Also ist γ tatsächlich die kleinste obere Schranke von A. Schritt 4: Wir definieren eine Addition auf K. Für α, β ∈ K setze Weiters setze 0∗ := {p ∈ Q : p < 0}. α + β := r + s : r ∈ α, s ∈ β . Als erstes zeigen wir, dass α + β ∈ K. Da α , ∅ und β , ∅, folgt auch α + β , ∅. Wähle r′ < α und s′ < β, dann ist r′ > r, r ∈ α, und s′ > s, s ∈ β. Also erhalten wir r′ + s′ > r + s, r ∈ α, s ∈ β. Damit kann r′ + s′ nicht zu α + β gehören. Wir sehen, dass α + β die Eigenschaft (I) besitzt. Sei nun p ∈ α + β gegeben, und schreibe p = r + s mit gewissen r ∈ α, s ∈ β. Für q < p folgt q − s < r und daher q − s ∈ α. Also q = (q − s) + s ∈ α + β, und wir sehen, dass (II) gilt. Zu p = r + s ∈ α + β wähle ein rationales ǫ > 0 mit r + ǫ ∈ α, dann folgt r + s + ǫ ∈ α + β, also gilt auch (III). Die Addition ist kommutativ, denn α + β = {r + s : r ∈ α, s ∈ β} = {s + r : r ∈ α, s ∈ β} = β + α . Sie ist assoziativ, denn α + (β + γ) = r + u : r ∈ α, u ∈ (β + γ) = = r + (s + t) : r ∈ α, s ∈ β, t ∈ γ = (r + s) + t : r ∈ α, s ∈ β, t ∈ γ = = v + t : v ∈ (α + β), t ∈ γ = (α + β) + γ . Nun identifizieren wir 0∗ als das neutrale Element bezüglich der Addition: Ist r ∈ α und s ∈ 0∗ , so folgt r + s < r, also r + s ∈ α. D.h. α + 0∗ ≤ α. Sei umgekehrt p ∈ α, und wähle ein rationales ǫ > 0 mit p + ǫ ∈ α. Dann gilt p = p + ǫ + (−ǫ) ∈ α + 0∗ . Es bleibt zu zeigen, dass jedes Element von K ein additives Inverses besitzt. Sei also α ∈ K gegeben. Setze β := p ∈ Q : ∃ ǫ > 0 : p + ǫ < −α . Als erstes zeigen wir, dass β ∈ K. Sei s < α und setze p := −s − 1, dann ist p + 1 = −s < −α, also p ∈ β, d.h. β , ∅. Aus q ∈ α folgt −q < β, da sonst q − ǫ < α, und somit q < α; also β , Q. Damit gilt (I). Sei nun p ∈ β gegeben. 2.7. DAS VOLLSTÄNDIGKEITSAXIOM 45 Wähle ǫ > 0, sodass −p − ǫ < α. Ist q < p, so gilt −q − ǫ > −p − ǫ und daher −q − ǫ < α, d.h. q ∈ β. Es gilt also (II). Mit t := p + 2ǫ ist t > p und −t − 2ǫ = −p − ǫ < α, d.h. t ∈ β. Also gilt (III). Ist r ∈ α und s ∈ β, so ist −s < α und daher r < −s. Daher ist r + s < 0, bzw, r + s ∈ 0∗ . Wir sehen, dass α + β ≤ 0∗ . Umgekehrt sei v ∈ 0∗ . Setze w := − 2v > 0. Sei q < α. Da Q archimedisch angeordnet ist, gibt es ein n1 ∈ N mit n1 w > q und daher mit n1 w < α. Zu q ∈ α gibt es auch ein n2 ∈ N mit n2 w > −q und daher mit −n2 w ∈ α. Es existiert also ein n ∈ Z mit nw ∈ α und (n + 1)w < α. Setze p := −(n + 2)w. Dann ist p ∈ β, denn −p − w < α. Wir haben also v = nw + p ∈ α + β . Schritt 5: Die Addition ist mit der Ordnung verträglich. Ist nämlich α ≤ β, d.h. α ⊆ β, und ist γ ∈ K, so folgt α+ γ ⊆ β + γ. Addieren von −γ zeigt, dass in der Tat α ≤ β ⇔ α + γ ≤ β + γ. Daraus folgt unmittelbar α < β ⇔ β − α ∈ P := {γ ∈ K : γ > 0}, und die Tatsache, dass mit α, β ∈ P auch α + β > α + 0∗ > 0∗ und somit α + β ∈ P. Schritt 6: Wir definieren eine Multiplikation auf K. Seien zunächst α, β > 0. Dann setze α · β := p ∈ Q : ∃r ∈ α, s ∈ β, r, s > 0 : p ≤ rs . Man zeigt genauso wie in Schritt 4, dass α· β tatsächlich ein Element von K ist, dass die Multiplikation kommutativ und assoziativ ist, und dass das Distributivgesetz gilt. Weiters definieren wir 1∗ := {p ∈ Q : p < 1} . Wieder sieht man analog wie in den vorherigen Beweisschritten, dass 1∗ neutrales Element bezüglich der Multiplikation ist, und dass jedes Element α > 0 ein multiplikatives Inverses 1 β := p ∈ Q : ∃ ǫ > 0 : p + ǫ < { : q ∈ α, q > 0} q besitzt. Um nun die Multiplikation auch für Elemente α < 0 zu definieren, setze (−α) · (−β) (−α) · β α · β := α · (−β) ∗ 0 , , , , α < 0∗ , β < 0∗ α < 0∗ , β > 0∗ α > 0∗ , β < 0∗ α = 0∗ oder β = 0∗ falls falls falls falls Der Beweis der Rechengesetze folgt aus den bereits bekannten Regeln für die Multiplikation von positiven Zahlen durch Fallunterscheidungen. Um α, β ∈ P ⇒ α · β ∈ P einzusehen, wähle man a ∈ α \ 0∗ , b ∈ β \ 0∗ . Also a, b ≥ 0. Wegen (III) können wir sogar a, b > 0 annehmen. Es folgt a · b ∈ α · β \ 0∗ und somit α, β ∈ P. Wir haben also bewiesen, dass hK, +, ·, Pi ein vollständig angeordneter Körper ist. Schritt 7: Wie jeder angeordnete Körper enthält K eine Kopie von Q, daher eine mit den Operationen und mit ≤ Verträgliche Injektion φ : Q → K, vgl. Proposition 2.5.8. Aus φ(1) = 1∗ folgt mit vollständiger Induktion φ(n) = {p ∈ Q : p < n}. Außerdem zeigt man, dass für r, s ∈ Q und αr = {p ∈ Q : p < r}, αs = {p ∈ Q : p < s} αr + αs = {p ∈ Q : p < r + s}, − αr = {p ∈ Q : p < −r}, αr · αs = {p ∈ Q : p < rs}, α−1 r = {p ∈ Q : p < 1 }. r Für r > 0 sieht man z.B. letztere Tatsache folgendermaßen. 1 1 1 : q ∈ Q, 0 < q < r} = p ∈ Q : ∃ ǫ > 0 : p + ǫ ≤ = {p ∈ Q : p < }. α−1 r = p ∈ Q : ∃ǫ > 0 : p + ǫ < { q r r Aus φ( nx ) = sgn(x) φ(|x|) φ(n) für x ∈ Z, n ∈ N, folgt somit φ(r) = αr , r ∈ Q. Schritt 8: Wir zeigen, dass jeder vollständig angeordnete Körper L isomorph zu dem oben konstruierten Körper K ist. Beachte, dass L und K als angeordnete Körper den Körper der rationalen Zahlen enthalten. Definiere ω: ( L x → 7 → K {p ∈ Q : p < x} , ψ: ( K α → 7→ L sup α KAPITEL 2. DIE REELLEN ZAHLEN 46 Die Abbildung ω ist wohldefiniert, denn {p ∈ Q : p < x} ist, wie man unmittelbar überprüft, ein Dedekindscher Schnitt. Auch ψ ist wohldefiniert, denn α ist eine nichtleere und beschränkte Teilmenge von Q ⊆ L und besitzt daher in L ein Supremum. Außerdem sind diese beiden Abbildungen streng monoton wachsend, und für p ∈ Q gilt ω(p) = α p und ψ(α p ) = sup α p = p. Aus dem noch zu zeigenden Lemma 2.7.13 folgt, dass ω und ψ mit den Operationen verträglich sind. Wendet man Lemma 2.7.13 nun auch auf ω ◦ ψ und ψ ◦ ω an, so folgt aus der Eindeutigkeitsaussage, dass ω ◦ ψ = idK und ψ ◦ ω = id L . Also sind ω und ψ zueinander inverse Bijektionen, welche mit Addition, Multiplikation und Ordnung verträglich sind. Daher sind L und K als angeordnete Körper isomorph. Mit derselben Argumentation zeigt man auch, dass der von uns angegebene Isomorphismus eindeutig ist. ❑ 2.7.13 Lemma. Seien K1 und K2 zwei vollständig angeordnete Körper, und bezeichne Q1 bzw. Q2 die gemäß Proposition 2.5.8 existierende Kopie von Q, welche in K1 bzw. K2 enthalten ist. Seien φ j : Q → K j , j = 1, 2, die entsprechenden Einbettungen. Ist ω : K1 → K2 streng monoton wachsend und so, dass ω(φ1 (p)) = φ2 (p) für alle p ∈ Q, dann ist ω mit + und · verträglich. Weiters muss jede weitere streng monoton wachsend Abbildung ω̃ : K1 → K2 mit ω̃(φ1 (p)) = φ2 (p), p ∈ Q schon mit ω übereinstimmen. Beweis. Zunächst beweisen wir die letzte Aussage. Angenommen es gäbe ein x ∈ K1 , sodass ω(x) , ω̃(x). O.B.d.A. sei ω(x) < ω̃(x). Nach Satz 2.6.3 gibt es ein p ∈ Q mit ω(x) < φ2 (p) < ω̃(x). Nun muss x < φ1 (p), da widrigenfalls φ1 (p) ≤ x und daher ω(φ1 (p)) = φ2 (p) ≤ ω(x). Andererseits muss aber φ1 (p) < x, da sonst x ≤ φ1 (p) und daher ω̃(x) ≤ φ2 (p) = ω̃(φ1 (p)). Beides kann aber nicht gleichzeitig gelten. Somit muss ω = ω̃. Zur Verträglichkeit mit + halte man zunächst ein p ∈ Q fest, und betrachte ωp : ( K1 x → 7→ K2 ω(x + φ1 (p)) − φ2 (p) . Wegen den Eigenschaften von φ1 , φ2 aus Proposition 2.5.8 folgt ω p (φ1 (q)) = ω(φ1 (q + p)) − φ2 (p) = φ2 (q) für alle q ∈ Q. Außerdem ist ω p offensichtlicherweise streng monoton wachsend. Nach obiger Eindeutigkeitsaussage folgt ω = ω p bzw. ω(x + φ1 (p)) = ω(x) + φ2 (p) = ω(x) + ω(φ1 (p)) für alle x ∈ K1 und wegen der Beliebigkeit von p auch für alle p ∈ Q. Nun betrachte man für ein festes y ∈ K1 die Abbildung ωy (x) = ω(x + y) − ω(y). Wegen dem eben gezeigten erfüllt diese ωy (φ1 (q)) = φ2 (q), q ∈ Q, und sie ist ebenfalls streng monoton wachsend. Also folgt ωy = ω, bzw. ω(x + y) = ω(x) + ω(y), x, y ∈ K1 . ω(x·φ1 (p)) Indem man zunächst x 7→ φ (p) für festes p ∈ Q \ {0} und dann x 7→ ω(x·y) ω(y) für festes y ∈ K1 \ {0} betrachtet, folgt 1 wie oben auch die Verträglichkeit mit · . ❑ 2.8 Die komplexen Zahlen Betrachtet man die quadratische Gleichung x2 + 1 = √ 0, und sucht die Lösungen davon, indem man formal rechnet, so erhält man x1,2 = ± −1, also eigentlich kein Ergebnis. Das stimmt mit der Tatsache überein, dass die Gleichung x2 + 1 = 0 keine reellen Lösungen hat. Aus vielen Gründen wäre es trotzdem wünschenswert mit Wurzeln aus negativen Zahlen rechnen zu können. Insbesondere hätte x2 + 1 = 0 zwei Lösungen. Wir formalisieren nun das Konzept der Wurzel aus einer negativen Zahl. 2.8.1 Definition. Die Menge der komplexen Zahlen C wird definiert als die Menge der Paare reeller Zahlen, C := R2 = R × R. Wir schreiben eine komplexe Zahl (a, b) ∈ C an als a + ib. Hierbei ist i ein formales Symbol, die sogenannte imaginäre Einheit. Ist z = a + ib ∈ C, so heißt a der Realteil und b der Imaginärteil von z. Man schreibt auch a = Re z und b = Im z. Für zwei komplexe Zahlen a + ib und c + id definieren wir eine Addition und eine Multiplikation, indem wir (a + ib) + (c + id) := (a + c) + i(b + d), (2.14) 2.8. DIE KOMPLEXEN ZAHLEN (a + ib) · (c + id) := (ac − bd) + i(bc + ad). 47 (2.15) setzen. Ist (a, b) ∈ C mit b = 0, so schreibt man auch a anstatt a + i0, und ist a = 0, so schreibt man ib anstatt 0 + ib. Falls a = 0 und b = 1, so schreibt man kurz i. Anstatt 0 + i0 schreibt man auch 0. Wir wollen die triviale aber nützliche Tatsache bemerken, dass zwei komplexe Zahlen genau dann übereinstimmen, wenn ihre Realteile und ihre Imaginärteile übereinstimmen. √ Die imaginäre Einheit modelliert den Ausdruck −1. Tatsächlich gilt gemäß (2.15), dass i2 = −1 sowie (−i)2 = −1. 2.8.2 Satz. Die komplexen Zahlen hC, +, ·i sind ein Körper, wobei 0 + i0 das neutrale Element bezüglich +, 1 + i0 das neutrale Element bezüglich ·, (−a) + i(−b) die additiv Inverse zu a + ib, und a −b +i 2 (2.16) 2 2 a +b a + b2 die multiplikativ Inverse zu a + ib , 0 + i0 ist. Beweis. Wir müssen die Körperaxiome aus Definition 2.1.1 nachweisen. Die Kommutativität von + und ·, daher Axiome (a4),(m4), folgt unmittelbar aus der Definition in (2.14) und (2.15). Genauso schnell überzeugt man sich von der Gültigkeit der Assoziativität von +, dh. (a1). Wegen ((a + ib) · (c + id)) · (x + iy) = ((ac − bd) + i(bc + ad)) · (x + iy) = (acx − bdx − bcy − ady) + i(bcx + adx + acy − bdy) = = (a + ib) · ((cx − dy) + i(cy + dx)) = (a + ib) · ((c + id) · (x + iy)) gilt (m1). Ganz leicht sieht man, dass 0 + i0 das additiv neutrale Element von C ist – (a2) –, und dass (−a) + i(−b) das zu a + ib additiv inverse Element ist, dh. (a3). Genauso elementar sieht man, dass 1 + i0 das multiplikativ neutrale Element ist – (m2) –, und dass die in (2.16) angegebene komplexe Zahl das zu a + ib multiplikativ inverse Element ist, dh. (m3). Schließlich gilt (d), da in R das Distributivgesetz gilt und da (x + iy) · ((a + ib) + (c + id)) = (x + iy) · ((a + c) + i(b + d)) = (xa + xc − yb − yd) + i(xb + xd + ya + yc) = ((xa − yb) + i(xb + ya)) + ((xc − yd) + i(xd + yc)) = (x + iy) · (a + ib) + (x + iy) · (c + id). ❑ Die reellen Zahlen sind in C eingebettet vermöge der Abbildung a 7→ a + i · 0. Offenbar ist diese Einbettung ein Körperhomomorphismus, dh. verträglich mit den Verknüpfungen +, ·. Insbesondere sehen wir, dass C ein R-Vektorraum ist. Die dafür nötigen Rechengesetze gelten, da sie einfach Spezialfälle der Rechenregeln des Körpers C sind. Eine Basis von C als R-Vektorraum lässt sich leicht angeben, nämlich {1, i}. Denn es lässt sich ja jede komplexe Zahl in eindeutiger Weise als Linearkombination a·1+b·i mit den reellen Koeffizienten a, b anschreiben. Wir sehen also, dass die Dimension von C als R-Vektorraum zwei ist. KAPITEL 2. DIE REELLEN ZAHLEN 48 Im C z = a + ib ib |z| 0 |z| = |z| a Re z = a − ib −ib Abbildung 2.3: Zahlenebene Graphisch lassen sich die Zahlen aus C als Punkte in der Ebene veranschaulichen, man spricht auch von der Gaußschen Zahlenebene14. Dabei ist √ |z| := a2 + b2 (≥ 0) (2.17) die Länge des Vektors von (0, 0) nach (a, b). Wir nennen |z| auch den Betrag von z. Der Betrag auf den komplexen Zahlen wird gleich wie die Betragsfunktion auf einem bewerteten Körper bezeichnet. Es gelten nämlich vergleichbare Regeln (z, w ∈ C): (i) | Re z| ≤ |z|, | Im z| ≤ |z| (ii) |zw| = |z||w|. (iii) |z + w| ≤ |z| + |w|. (iv) |z + w| ≥ ||z| − |w||. (i) und (ii) lassen sich dabei elementar nachprüfen. Die Dreiecksungleichung folgt durch Ausquadrieren, und die Dreiecksungleichung nach unten beweist man genauso, wie bei den angeordneten Körpern (siehe (2.1)). Eine weiters Begriffsbildung im Zusammenhang mit den komplexen Zahlen ist die der konjugiert komplexen Zahl z zu einer komplexen Zahl z = a + ib: z := a − ib . 14 Carl-Friedrich Gauß. 30.4.1777 Braunschweig - 23.2.1855 Göttingen 2.8. DIE KOMPLEXEN ZAHLEN 49 Offenbar gilt |z| = |z|, |z|2 = zz, und z−1 = |z|z2 wenn z , 0. Der Übergang von z zu seiner konjugierten z̄ entspricht bei der graphischen Veranschaulichung der komplexen Zahlen genau dem Spiegeln an der reellen Achse. 50 KAPITEL 2. DIE REELLEN ZAHLEN Kapitel 3 Der Grenzwert In der Mathematik hat sich schon bald herausgestellt, dass eine rein algebraische Betrachtungsweise der reellen Zahlen nicht immer das geeignete Instrument zur Modellierung der in den Naturwissenschaften auftretenden Phänomene ist. Probleme wie un” endlich oft immer kleiner werdende Größen zusammenzählen“ oder einer gewissen ” Zahl immer näher kommen“, lassen sich mit den bisher rein algebraischen Methoden nicht betrachten. Man denke zum Beispiel an die Approximation der Zahl 2π, indem man einem Kreis mit Radius eins regelmäßige n-Ecke einschreibt, von diesen den Umfang berechnet, und dann n immer größer werden lässt. Das führt zu dem Begriff des Grenzwertes einer Folge von Zahlen. Dazu wollen wir das einer Zahl immer näher Kommen“ bzw. Konvergieren mathematisch exaktifi” zieren: Eine Folge x1 , x2 , x3 , . . . von reellen Zahlen heißt konvergent gegen eine reelle Zahl x, falls es zu jedem beliebig kleinen Abstand ǫ > 0 einen Folgenindex N gibt, sodass ab diesem Index alle Folgenglieder einen Abstand von x kleiner als ǫ haben; sodass also |xn − x| < ǫ, für alle n ≥ N. Wir wollen nun aber Konvergenzbetrachtungen nicht nur für Folgen von reellen Zahlen betrachten, sondern auch z.B. für Folgen von komplexen Zahlen oder für Folgen von Punkten im Raum. Wie man aus der Definition der Konvergenz erahnen kann, benötigt man dazu lediglich einen Abstandsbegriff auf dem betrachteten Objekt. Wir führen dazu den Begriff des metrischen Raumes ein. 3.1 Metrische Räume Um zu sagen, wann ein Punkt x nahe“ bei einem anderen Punkt y liegt, müssen wir in ” irgendeiner Weise den Abstand von x zu y messen können. Betrachten wir zum Beispiel die Menge X aller Punkte der Ebene. Dann ist es naheliegend, als Abstand zwischen x und y die Länge l x,y der Strecke, die die beiden Punkte verbindet, zu nehmen. Man erkennt dabei, dass folgende Regeln gelten: Stets ist l x,y ≥ 0, denn Längen sind immer positiv. Dabei gilt =“ genau dann, wenn x = y, denn eine Strecke hat dann und ” nur dann Länge 0, wenn Anfangs- und Endpunkt gleich sind. Es ist stets l x,y = ly,x , denn vertauscht man Anfangs- und Endpunkt so bleibt die Länge der Strecke erhalten. 51 KAPITEL 3. DER GRENZWERT 52 Schwieriger einzusehen, aber anschaulich doch klar, ist die Gültigkeit der Dreiecksungleichung: In jedem Dreieck ist die Länge einer Seite höchstens so groß, wie die Summe der Längen der anderen Seiten; also für je drei Punkte – die Eckpunkte des Dreiecks – gilt l x,z ≤ l x,y + ly,z . Es sind genau diese drei Eigenschaften, die es ausmachen, dass die Länge der ” Verbindungsstrecke“ ein vernünftiger Abstandsbegriff ist. 3.1.1 Definition. Sei X eine Menge, d : X × X → R1 eine Funktion. Dann heißt d eine Metrik auf X, und hX, di ein metrischer Raum, wenn gilt (M1) Für alle x, y ∈ X ist d(x, y) ≥ 0. Dabei gilt d(x, y) = 0 genau dann, wenn x = y. (M2) Für alle x, y ∈ X gilt d(x, y) = d(y, x). (M3) Sind x, y, z ∈ X, so gilt die Dreiecksungleichung: d(x, z) ≤ d(x, y) + d(y, z) . 3.1.2 Bemerkung. Man kann allgemeiner auch Metriken d betrachten, die X × X nicht nach R, sondern nach K abbilden, wobei hK, +, ·, Pi ein archimedisch angeordneter Körper ist. Wir werden darauf im Kapitel 4 zurück kommen. 3.1.3 Beispiel. Ist X = R und d(x, y) = |x − y| für x, y ∈ R, so sieht man sofort, dass (M1) und (M2) erfüllt sind. (M3) folgt aus der Dreiecksungleichung für den Betrag (siehe Lemma 2.2.11): |x − z| = |(x − y) + (y − z)| ≤ |x − y| + |y − z|, x, y, z ∈ R. (3.1) Ist X = C R2 und d(z, w) = |z − w| für z, w ∈ C, wobei |.| hier der komplexe Betrag ist, so erfüllt d offensichtlich p (M2) und d(z, w) ≥ 0. Schreibt man z = a+ib und w = c + id, so gilt d(z, w) = (a − c)2 + (b − d)2 = 0 genau dann, wenn a − c = 0 und b − d = 0, also z = w. Somit ist (M1) erfüllt. (M3) folgt aus der Dreiecksungleichung für den komplexe Betrag ähnlich wie in (3.1). Um eine Metrik auf X := R p zu definieren, setzen wir d2 (x, y) := p X j=1 21 (x j − y j )2 , x = (x1 , . . . , x p ), y = (y1 , . . . , y p ) ∈ X . Man spricht von der euklidischen Metrik auf Rn . Die Gültigkeit von (M1) und (M2) ist aus der Definition offensichtlich. Die Dreiecksungleichung (M3) folgt hingegen aus dem unten folgenden Lemma 3.1.4. Im Falle p = 1, also X = R, gilt d2 (x, y) = |x − y|. Damit ist der Abstand zweier Zahlen bzgl. der euklidischen Metrik nichts anderes als der Betrag der Differenz dieser Zahlen. Die euklidische Metrik auf R2 hat eine analoge Interpretation mit Hilfe des Betrages√einer komplexen Zahl. Für z = a+ib ∈ C haben wir den Betrag definiert als |z| = a2 + b2 . Daraus erkennt man, dass die euklidische Metrik auf R2 gerade d2 (z, w) = |z − w|, z, w ∈ C , 1 Wie unmittelbar nach Satz 2.7.3 bemerkt, ist R ein vollständig angeordneter Körper. 3.1. METRISCHE RÄUME 53 ist, wobei wir hier die komplexen Zahlen in der Gaußschen Zahlenebene, also als Elemente von R2 interpretieren. (M3) folgt in den Fällen p = 1, 2 wie schon oben gezeigt, aus der bereits bewiesenen Dreiecksungleichung für die Betragsfunktion 3.1.4 Lemma. Seien p ∈ N, a1 , . . . , a p , b1 , . . . , b p ∈ R. Dann gilt (CauchySchwarzsche Ungleichung2) p 2 X ai bi ≤ i=1 und (Minkowskische Ungleichung3) p X 2 ai · i=1 p X 2 bi , i=1 p 1 p 12 p 12 X 2 X X (ai + bi )2 ≤ a2i + b2i . i=1 i=1 i=1 Beweis. Wir verwenden die Bezeichnungen a := (a1 , . . . , a p ), b := (b1 , . . . , b p ) ∈ R p und definieren4 p X (a, b) := ai bi . i=1 p Für Zahlen λ, µ ∈ R und a, b ∈ R setzen wir λa + µb := (λa1 + µb1 , . . . , λa p + µb p ) . Offenbar gilt für a, b, c ∈ R p (λa + µb, c) = p X (λai + µbi )ci = i=1 p X i=1 λai ci + p X µbi ci = λ(a, c) + µ(b, c) . i=1 Man spricht von der Linearität von (., .) in der vorderen Komponente. Wegen (a, b) = (b, a) ist (., .) auch in der hinteren Komponente linear (vgl. den Begriff des Skalarproduktes auf einem Vektorraum in der Linearen Algebra). Um die Cauchy-Schwarzsche Ungleichung zu zeigen, gehen wir von der trivialen Bemerkung aus, dass für jedes p-Tupel x = (x1 , . . . , x p ) ∈ R p (x, x) = p X i=1 x2i ≥ 0. Für alle t ∈ R gilt nun 0 ≤ (a + tb, a + tb) = (a, a) + 2t(a, b) + t2 (b, b). 2 Hermann Amandus Schwarz. 25.1.1843 Hermsdorf (Sobiecin, Polen) - 30.11.1921 Berlin Minkowski. 22.6.1864 Alexoten (bei Kaunas, Litauen) - 12.1.1909 Göttingen 4 Also ist (., .) eine Abbildung von R p × R p nach R. 3 Hermann (3.2) KAPITEL 3. DER GRENZWERT 54 Ist (b, b) , 0, so setze man t = − (a,b) (b,b) in obige Ungleichung ein, und erhält 0 ≤ (a, a) − (a, b)2 . (b, b) Daraus folgt unmittelbar die Cauchy-Schwarzsche Ungleichung. Im Falle (b, b) = 0 folgt b = (0, . . . , 0), und damit (a, b) = 0. Es gilt also auch in diesem Fall die Cauchy-Schwarzsche Ungleichung. Die Minkowskische Ungleichung folgt wegen (ai + bi )2 = ai · (ai + bi ) + bi (ai + bi ) aus p p p p p X X X X X (ai + bi )2 = ai (ai + bi ) + bi (ai + bi ) ≤ ai · (ai + bi ) + bi · (ai + bi ) i=1 i=1 i=1 i=1 i=1 p 1 X 2 2 ≤ ai i=1 p 1 21 p X X 2 2 2 · (ai + bi ) + bi i=1 i=1 p 21 X 2 · (ai + bi ) = i=1 1 p 12 p 12 p X X 2 2 X 2 2 = ai + bi · (ai + bi ) . i=1 i=1 i=1 ❑ Beispiele von Metriken gibt es viele, und sie treten in verschiedensten Zusammenhängen auf. 3.1.5 Beispiel. (i) Sei noch einmal X := R2 und setze d1 (x, y) := |x1 − y1 | + |x2 − y2 |, x = (x1 , x2 ), y = (y1 , y2 ) ∈ R2 . Dann ist d1 eine Metrik. Die Gültigkeit von (M1) und (M2) ist wieder aus der Definition offensichtlich. Um die Dreiecksungleichung einzusehen, seien x, y, z ∈ R gegeben. Dann folgt mit Hilfe der Dreiecksungleichung für |.| d1 (x, z) = |x1 − z1 | + |x2 − z2 | ≤ |x1 − y1 | + |y1 − z1 | + |x2 − y2 | + |y2 − z2 | = = |x1 − y1 | + |x2 − y2 | + |y1 − z1 | + |y2 − z2 | = d1 (x, y) + d1 (y, z) . Diese Metrik ist offenbar √ ungleich der euklidischen Metrik, denn es gilt etwa d1 ((0, 0), (2, 1)) = 3 , 5 = d2 ((0, 0), (2, 1)). Anschaulich interpretiert bezeichnet man d1 manchmal als New York-Metrik. Denn stellt man sich in der Ebene einen Stadtplan mit lauter rechtwinkeligen Straßen – wie etwa in New York – vor, dann misst d1 (x, y) gerade die Länge des Fußweges von der Kreuzung x zur Kreuzung y. Ganz analog definiert man eine Metrik am R p d1 (x, y) = p X j=1 |x j − y j |, x = (x1 , . . . , x p ), y = (y1 , . . . , y p ) ∈ R p . Der Nachweis von (M1)-(M3) geht genauso wie im oben betrachteten Fall p = 2. 3.1. METRISCHE RÄUME 55 (ii) Ist wieder X = R p , so definieren wir nun die Metrik d∞ (x, y) := max |x j − y j |, x = (x1 , . . . , x p ), y = (y1 , . . . , y p ) ∈ R p . j=1,...,p (M1),(M2) sind klar. Die Dreiecksungleichung folgt aus der Tatsache, dass für alle nichtnegativen Zahlen max{a1 + b1 , . . . , a p + b p } ≤ max{a1 , . . . , a p } + max{b1 , . . . , b p } . Auch diese Metrik unterscheidet sich tatsächlich von den schon eingeführten Metriken d1 und d2 , da etwa im Falle p = 2 gilt, dass d∞ ((0, 0), (2, 1)) = 2. (iii) Ist X = C p , so definiert man für z = (z1 , . . . , z p ), w = (w1 , . . . , w p ) ∈ C p v u tX p d2 (z, w) = |z j − w j |2 . j=1 Identifiziert man z mit dem Vektor x ∈ R2p , indem man x1 = Re z1 , x2 = Im z1 , . . . , x2p−1 = Re z p , x2p = Im z p setzt, und identifiziert man w entsprechend mit dem Vektor y ∈ R2p , so gilt v u tX p (Re(z j − w j )2 + Im(z j − w j )2 ) = d2 (x, y) . d2 (z, w) = j=1 p Insbesondere ist auch C versehen mit d2 ein metrischer Raum. (iv) Eine hauptsächlich aus theoretischer Sicht wichtige Metrik ist die diskrete Metrik. Sie findet man auf jeder nichtleeren Menge X, indem man ( 0 , falls x = y d(x, y) = 1 , falls x , y setzt. (v) Betrachte die ganzen Zahlen X := Z und halte eine Primzahl p fest. Setze d(p) (x, y) := 1 pn(p) 0 , falls , falls x , y, x − y = ± x=y Q q prim qn(q) Q Dabei ist ± q prim qn(q) die eindeutige Primfaktorzerlegung von x − y. Dann ist d(p) eine Metrik auf Z. Denn (M1) ist nach Definition erfüllt, (M2) ist ebenfalls richtig, denn vertauscht man x und y, so ändert sich bei der Differenz x − y nur das Vorzeichen, nicht jedoch die Primfaktoren und ihre Potenzen. Die Dreiecksungleichung ist wieder schwieriger einzusehen. Wir zeigen, dass in diesem Fall sogar die stärkere Ungleichung d(p) (x, z) ≤ max{d(p) (x, y), d(p) (y, z)}, x, y, z ∈ Z , gilt. Diese Ungleichung impliziert tatsächlich sofort die Dreiecksungleichung, denn für je zwei Zahlen a, b ≥ 0 ist stets max(a, b) ≤ a + b. Schreibe x−z = ± Y q prim sodass also d(p) (x, z) = qn1 (q) , x − y = ± Y q prim qn2 (q) , y − z = ± Y qn3 (q) , q prim 1 1 1 , d(p) (x, y) = n (p) , d(p) (y, z) = n (p) . pn1 (p) p2 p3 Betrachte den Fall, dass d(p) (x, y) ≥ d(p) (y, z), d.h. n2 (p) ≤ n3 (p). Wegen n2 (p) ≤ n3 (p) teilt pn2 (p) sowohl x − y als auch y − z, und daher auch (x − y) + (y − z) = x − z. Es folgt n2 (p) ≤ n1 (p), und somit d(p) (x, y) ≥ d(p) (x, z). Der Fall d(p) (x, y) ≤ d(p) (y, z) wird genauso behandelt. Auf Z haben wir natürlich auch die euklidische Metrik d2 (x, y) = |x − y|, denn Z ist ja eine Teilmenge von R. Diese ist verschieden von der Metrik d(p) , denn zum Beispiel ist d(p) (0, p) = 1 p, wogegen d2 (0, p) = p. KAPITEL 3. DER GRENZWERT 56 3.1.6 Bemerkung. Auf R stimmen die Metriken d1 , d2 , d∞ alle überein. 3.1.7 Bemerkung. Die oben kennengelernten Metriken d2 , d1 , d∞ auf dem R p sind allesamt von Normen erzeugte Metriken. Eine Norm k.k auf R p ist eine Funktion von R p → R mit folgenden drei Eigenschaften x, y ∈ R p , λ ∈ R: (i) kxk ≥ 0, wobei kxk = 0 ⇔ x = 0. (ii) kλxk = |λ| · kxk. (iii) kx + yk ≤ kxk + kyk. Es gilt nun d(x, y) = kx − ykq 2 , d1 (x, y) = kx − yk1 , d∞ (x, y) = kx − yk∞ , wobei diese Pp Pp 2 drei Normen durch kxk2 := j=1 |x j | , kxk1 := j=1 |x j |, kxk∞ = max{|x1 |, . . . , |x p |} definiert sind. 3.2 Der Grenzwert in metrischen Räumen Wir kommen nun zurück zu dem am Anfang des Kapitels motivierten Begriff der Konvergenz einer Folge. 3.2.1 Definition. Eine Folge in einer Menge X ist aus mathematischer Sicht nichts anderes als eine Funktion y : N → X, wobei der Funktionswert y(n) von y an der Stelle n meist als yn geschrieben wird. Für die Folge y als solche schreiben wir meist (yn )n∈N . Folgen werden auch oft als y1 , y2 , y3 , . . . angeschrieben. 3.2.2 Definition. Sei hX, di ein metrischer Raum, (xn )n∈N eine Folge in X, und x ein Element von X. Dann heißt (xn )n∈N konvergent gegen x, wenn gilt 5 ∀ǫ ∈ R, ǫ > 0 ∃N ∈ N : d(xn , x) < ǫ für alle n ≥ N . (3.3) In diesem Fall schreibt man limn→∞ xn = x. xN x1 xN ′ x ǫ′ ǫ 5 Kürzer Ist (xn )n∈N eine Folge, und gibt es ein Element x ∈ X, sodass limn→∞ xn = x, so sagt man die Folge (xn )n∈N ist konvergent. Ist eine Folge nicht konvergent, so sagt man sie ist divergent. Man verwendet auch andere Schreibweisen für limn→∞ xn = x, wie zum Beispiel n→∞ (xn )n∈N → x, n → ∞, oder x −→ x, oder auch nur xn → x. lässt sich folgendermaßen schreiben: ∀ǫ ∈ R, ǫ > 0 ∃N ∈ N : ∀n ≥ N ⇒ d(xn , x) < ǫ. 3.2. DER GRENZWERT IN METRISCHEN RÄUMEN 57 3.2.3 Bemerkung. Wegen |d(x, xn ) − 0| = d(x, xn ) konvergiert eine Folge (xn )n∈N in einem metrischen Raum hX, di genau dann gegen ein x ∈ X, wenn die Folge (d(x, xn ))n∈N in R (versehen mit der euklidischen Metrik) gegen 0 konvergiert. Folgen müssen nicht immer mit dem Index 1 anfangen. Ist k eine feste ganze Zahl, so setzen wir Z≥k := {n ∈ Z : n ≥ k}. Eine Abbildung x : Z≥k → X nennen wir ebenfalls Folge, wobei ihre Konvergenz in analoger Weise wie in Definition 3.2.2 definiert ist. 3.2.4 Beispiel. (i) Sei hX, di ein beliebiger metrischer Raum, und sei x ∈ X. Betrachte die konstante Folge x1 = x2 = x3 = . . . = x. Dann gilt lim j→∞ x j = x. Um dies einzusehen, sei ein ǫ ∈ R, ǫ > 0, gegeben. Wir müssen eine Zahl N ∈ N finden, sodass d(x j , x) < ǫ für alle j ≥ N. Wähle N := 1, dann gilt d(x j , x) = d(x, x) = 0 < ǫ für alle j ≥ N . Dieses Beispiel ist natürlich in gewissem Sinne trivial, denn die Folgenglieder x j sind ja schon alle gleich dem Grenzwert x, kommen diesem also natürlich beliebig nahe. (ii) Sei X = R und d = d2 die euklidische Metrik d2 (x, y) = |x − y|. Dann gilt lim j→∞ 1j = 0. Um dies einzusehen, sei ein ǫ ∈ R, ǫ > 0, gegeben. Wir müssen eine Zahl N ∈ N finden, sodass | 1j − 0| = 1j < ǫ gilt, wenn nur j ≥ N. Dazu benützen wir die Tatsache, dass N als Teilmenge von R nicht nach oben beschränkt ist. Wähle N ∈ N mit 1ǫ < N. Für alle j ∈ N mit j ≥ N gilt dann 1j ≤ N1 < ǫ. (iii) Aus dem letzten Beispiel zusammen mit Bemerkung 3.2.3 schließen wir auf lim j→∞ (1 + 1j ) = 1, da |(1 + 1j ) − 1| = 1j → 0. (iv) Sei q ∈ R, 0 ≤ q < 1, und betrachte die Folge (qn )n∈N . Dann gilt limn→∞ qn = 0. Um das einzusehen, können wir q > 0 voraussetzen, da sonst die betreffliche Folge identisch gleich Null ist. Wir verwenden zum Beweis die Bernoullische Ungleichung aus Lemma 2.3.6. Setzt man in der Bernoullischen Ungleichung x = q1 − 1 > 0, so erhält man 1 q !n ! 1 ≥1+n −1 . q Da R archimedisch angeordnet ist, gibt es zu jedem ǫ > 0 eine Zahl N ∈ N mit 1 + N( q1 − 1) > 1ǫ und damit auch ( 1q )N > 1ǫ , also qN < ǫ. Es folgt d(0, qn ) = qn ≤ qN < ǫ für alle n ≥ N. (v) Sei z ∈ C mit |z| < 1. Setzen wir q := |z|, so folgt aus dem vorherigen Beispiel, dass d(0, zn ) = |zn − 0| = qn → 0 für n → ∞. Also gilt auch limn→∞ zn = 0 in C. 3.2.5 Beispiel. Es gibt viele Folgen, die nicht konvergieren. Die Folge zn := in in C, dh. i, −1, −i, 1, i, −1, −i, 1, . . . , KAPITEL 3. DER GRENZWERT 58 zum Beispiel, ist divergent, wobei wir immer, wenn wir nichts anderes explizit angeben, C mit der euklidischen Metrik versehen. Um das nachzuprüfen, nehmen wir an, dass zn → z für ein gewisses z ∈ C. Wählt man N ∈ N, sodass |zn − z| < 21 für alle n ≥ N, und nimmt ein n0 ≥ N, welches durch 4 teilbar ist, so folgt der Widerspruch 2 = |1 − (−1)| = |zn0 − zn0 +2 | ≤ |zn0 − z| + |z − zn0 +2 | < 1 1 + = 1. 2 2 Es gelten folgende, zu (3.3) äquivalente Konvergenzbedingungen. 3.2.6 Lemma. Sei hX, di ein metrischer Raum, x ∈ X und (xn )n∈N eine Folge aus X. Dann gilt limn→∞ xn = x, dh. es gilt (3.3), genau dann, wenn für gewisse K ∈ (0, +∞) und α ∈ (0, +∞) ∪ {+∞} ∀ǫ ∈ (0, α) ∃N ∈ N : d(xn , x) < K · ǫ für alle n ≥ N. (3.4) Die Konvergenz von (xn )n∈N gegen x ist auch äquivalent zu (3.3) bzw. (3.4), wenn man in diesen Bedingungen · · · < ǫ bzw. · · · < K · ǫ durch · · · ≤ ǫ bzw. · · · ≤ K · ǫ ersetzt. Beweis. Offenbar folgt (3.4) aus (3.3). Gelte umgekehrt (3.4). Für ǫ > 0 gilt min Kǫ , α2 ∈ (0, α). Nimmt man diese Zahl als ǫ in (3.4), so gibt es ein N ∈ N, sodass ǫ α ≤ ǫ, für alle n ≥ N . , d(xn , x) < K · min K 2 Also gilt auch (3.3). Dass aus (3.3) bzw. (3.4) die jeweiligen Bedingungen mit ≤ anstatt < folgt, ist klar, da aus < ja immer ≤ folgt. Für die Umkehrung wende die Bedingungen mit ≤ statt < auf 2ǫ an. Man erhält dann · · · ≤ 2ǫ < ǫ bzw. · · · ≤ K · 2ǫ < K · ǫ. ❑ 3.2.7 Definition. Ist (xn )n∈N eine Folge und n : N → N eine streng monoton wachsende Funktion6, dh. n(1) < n(2) < n(3) < . . . , so nennt man (xn( j) ) j∈N eine Teilfolge von (xn )n∈N . Folgende elementare Sachverhalte sind von großer Bedeutung und werden in Beweisen immer wieder Verwendung finden. 3.2.8 Satz. Sei hX, di ein metrischer Raum und sei (xn )n∈N eine Folge von Elementen aus X. (i) Die Folge (xn )n∈N hat höchstens einen Grenzwert. (ii) (xn )n∈N konvergiert gegen x ∈ X genau dann, wenn es ein k ∈ N gibt, sodass (xn )n∈Z≥k gegen x ∈ X konvergiert. Es kommt also nicht auf endlich viele Folgenglieder an, ob und wogegen eine Folge konvergiert. (iii) Ist limn→∞ xn = x und k ∈ N, so konvergieren auch (xn+k )n∈N und (xn−k )n∈Z≥k+1 gegen x. (iv) Ist limn→∞ xn = x, so konvergiert auch jede Teilfolge (xn( j) ) j∈N gegen x. 6 Klarerweise ist eine solche Funktion n immer injektiv, und es gilt n( j) ≥ j. 3.2. DER GRENZWERT IN METRISCHEN RÄUMEN 59 Beweis. Wir zeigen zunächst (i). Es gelte xn → x und xn → y, wobei x , y, dh. d(x, y) > 0. Wähle N1 ∈ N, sodass d(xn , x) < d(x,y) 3 , n ≥ N1 , und N2 ∈ N, sodass d(x,y) d(xn , y) < 3 , n ≥ N2 . Dann folgt für N := max{N1 , N2 } der Widerspruch d(x, y) ≤ d(x, xN ) + d(xN , y) < d(x, y) d(x, y) 2d(x, y) + = < d(x, y) , 3 3 3 Wir zeigen auch noch (iv). Die restlichen Aussagen sind noch elementarer nachzuweisen. Sei also (xn( j) ) j∈N eine Teilfolge der gegen x konvergenten Folge (xn )n∈N . Ist ǫ > 0, so gibt es ein N ∈ N, sodass d(xn , x) < ǫ, wenn nur n ≥ N. Ist nun i0 ∈ N so groß, dass n(i0 ) ≥ N (z.B. i0 = N), so folgt für i ≥ i0 auch n(i) ≥ N und somit d(xn(i) , x) < ǫ. Somit gilt lim j→∞ xn( j) = x. ❑ 3.2.9 Beispiel. (i) Ist p ∈ N, so gilt limn→∞ n1p = 0. Das folgt unmittelbar aus Satz 3.2.8 und der ist. Tatsache, dass diese Folge eine Teilfolge von n1 n∈N (ii) Sei z ∈ C, |z| < 1. Betrachte die Folge (die sogenannte geometrische Reihe) S n := n X zk = 1 + z + z2 + . . . + zn . k=0 Aus (2.10) folgt 1n − zn = (1 − z)(1n−1 + 1n−2 z + . . . + 1zn−2 + zn−1 ) = (1 − z)(1 + z + . . . + zn−1 ) , und wir erhalten zn 1 − . (3.5) 1−z 1−z Sei nun beliebig ǫ > 0 vorgegeben. Wähle N ∈ N mit |z|n < ǫ, n ≥ N (vgl. Beispiel 3.2.4, (iv)), dann folgt S n−1 = S n−1 − ǫ |z|n 1 = < , n≥ N. 1−z |1 − z| |1 − z| Wegen Lemma 3.2.6 gilt somit S n−1 → 1 limn→∞ S n = 1−z . 1 1−z , und wegen Satz 3.2.8 auch 3.2.10 Lemma. Sei hX, di ein metrischer Raum und seien (xn )n∈N , (yn )n∈N Folgen von Elementen von X, sodass limn→∞ xn = x und limn→∞ yn = y. Dann folgt lim d(xn , yn ) = d(x, y). n→∞ Beweis. Zunächst wollen wir folgende Ungleichung d(a1 , b1 ) − d(a2 , b2 ) ≤ d(a1 , a2 ) + d(b1 , b2 ), a1 , a2 , b1 , b2 ∈ X . (3.6) beweisen. Aus der Dreiecksungleichung folgt d(a1 , b1 ) − d(a2 , b1 ) ≤ d(a1 , a2 ) sowie d(a2 , b1 ) − d(a1 , b1 ) ≤ d(a1 , a2 ). Also gilt d(a1 , b1 ) − d(a2 , b2 ) ≤ d(a1 , b1 ) − d(a2 , b1 ) + d(a2 , b1 ) − d(a2 , b2 ) ≤ KAPITEL 3. DER GRENZWERT 60 d(a1 , a2 ) + d(b1 , b2 ) . Sei nun ǫ > 0 und N ∈ N so groß, dass d(xn , x), d(yn , y) < 2ǫ , wenn n ≥ N. Aus (3.6) folgt |d(xn , yn ) − d(x, y)| ≤ d(xn , x) + d(yn , y) < ǫ für alle n ≥ N. ❑ Ein weiterer Begriff, der im Zusammenhang mit konvergenten Folgen auftritt, ist der der Beschränktheit. 3.2.11 Definition. Sei hX, di ein metrischer Raum, und sei Y ⊆ X. Dann heißt Y beschränkt, wenn es eine Zahl C > 0 und einen Punkt x0 ∈ X gibt, sodass d(x0 , y) ≤ C, y ∈ Y . Eine Folge (xn )n∈N heißt beschränkt, wenn die Bildmenge {xn : n ∈ N} beschränkt ist. Allgemeiner heißt eine Funktion f : E → X beschränkt, wenn die Bildmenge f (E) beschränkt ist. Die Menge Y ist also beschränkt, wenn sie ganz in einem gewissen Kreis7 (Mittelpunkt x0 , Radius C) liegt. 3.2.12 Bemerkung. Y ist beschränkt genau dann, wenn es zu jedem Punkt x ∈ X eine Zahl C x > 0 gibt mit d(x, y) ≤ C x , y ∈ Y. Denn ist x ∈ X gegeben, so setze C x := d(x, x0 ) + C. Dann gilt für jedes y ∈ Y d(x, y) ≤ d(x, x0 ) + d(x0 , y) ≤ d(x, x0 ) + C = C x . Mit Hilfe dieser Tatsache sieht man auch, dass Y ⊆ C (Y ⊆ R) versehen mit der euklidischen Metrik genau dann beschränkt ist, wenn für ein gewisses C > 0 gilt, dass ∀x ∈ Y ⇒ |x| = d(x, 0) ≤ C. Im Falle Y ⊆ R stimmt somit diese Definition von Beschränktheit mit der von Definition 2.2.4 überein. 3.2.13 Proposition. In einem metrischen Raum ist jede konvergente Folge (xn )n∈N auch beschränkt. Beweis. Wähle N ∈ N mit d(xn , x) < 1 für alle n ≥ N. Setzt man C := 1 + max{d(x1 , x), . . . , d(xN−1 , x)} , so erhält man d(xn , x) ≤ C für jedes n ∈ N. ❑ Insbesondere gibt es zu jeder konvergenten reell- bzw. komplexwertigen Folge (xn )n∈N ein Konstante C > 0, sodass |xn | ≤ C, n ∈ N. 3.2.14 Bemerkung. Die Umkehrung von Proposition 3.2.13 ist falsch und zwar in jedem metrischen Raum, der mehr als einen Punkt enthält. In der Tat gilt für x, y ∈ X mit x , y, dass die Folge x, y, x, y, x, y, x, . . . zwar beschränkt, aber nicht konvergent ist. 7 Ein Kreis in einem metrischen Raum hX, di ist hier zu verstehen als {y ∈ X : d(x0 , y) ≤ C}. 3.3. FOLGEN REELLER UND KOMPLEXER ZAHLEN 61 3.2.15 Beispiel. Man betrachte die Folge (S n )n∈N aus Beispiel 3.2.9, (ii), für den Fall |z| = 1 aber z , 1. Wegen (3.5) gilt Sn = 1 − zn+1 ; 1−z n+1 | 2 also |S n | ≤ 1+|z |1−z| = |1−z| . Die Folge (S n )n∈N ist damit beschränkt. Sie ist aber nicht konvergent, denn gemäß den Ergebnissen im nächsten Abschnitt wäre dann auch (zn )n∈N konvergent. Das ist aber nicht der Fall. Man setze z.B. z = i oder z = −1. 3.3 Folgen reeller und komplexer Zahlen Wir wollen uns hier zunächst mit dem metrischen Raum hR, di beschäftigen, und folgendes einfaches, aber sehr nützliches Lemma bringen. 3.3.1 Lemma. Für zwei konvergente Folgen (xn )n∈N , (yn )n∈N reeller Zahlen mit den Grenzwerten x bzw. y gilt: (i) Ist c ∈ R mit x < c (c < x), so gibt es ein N ∈ N, sodass xn < c (c < xn ) für alle n ≥ N. (ii) Ist x < y, so gibt es ein N ∈ N, sodass xn < yn für alle n ≥ N. (iii) Gilt ab einem gewissen N ∈ N die Ungleichung xn ≤ yn , so folgt x ≤ y. Beweis. (ii) Setzt man ǫ = y−x 2 , so folgt aus der Konvergenz die Existenz eines N ∈ N, sodass und |yn − y| < y−x |xn − x| < y−x 2 2 für n ≥ N. Somit gilt −(yn − y) − (x − xn ) ≤ |yn − y| + |x − xn | < (y − x) ; also yn − xn = (y − x) + (yn − y) + (x − xn ) > 0. (i) Folgt aus (ii), wenn wir (yn )n∈N ((xn )n∈N ) als die identische Folge (c)n∈N wählen. (iii) Wäre x > y, so würde aus (ii) folgen, dass xn > yn für alle n ≥ k mit einem hinreichend großen k ∈ N. Das widerspricht der Annahme. ❑ Der nächste Satz dient häufig als Werkzeug zur Berechnung von Grenzwerten. 3.3.2 Satz (Einschluss-Satz). Seien (xn )n∈N , (yn )n∈N und (an )n∈N drei reelle Folgen mit xn ≤ an ≤ yn für alle bis auf endlich viele n ∈ N. Existieren zudem die Grenzwerte limn→∞ xn und limn→∞ yn , und gilt lim xn = lim yn , n→∞ n→∞ so existiert auch der Grenzwert limn→∞ an und stimmt mit dem gemeinsamen Grenzwert von (xn )n∈N und (yn )n∈N überein. KAPITEL 3. DER GRENZWERT 62 Beweis. Setze a := limn→∞ xn . Zu ǫ > 0 wähle N ∈ N mit |xn − a|, |yn − a| < ǫ und xn ≤ an ≤ yn für n ≥ N. Für solche n folgt −ǫ < xn − a ≤ an − a ≤ yn − a < ǫ, d.h. |an − a| < ǫ. ❑ 3.3.3 Beispiel. Als einfaches Beispiel betrachte man die Folge leicht, dass 1 1 0≤ 2 ≤ , für n ≥ 3. n − 3n + 3 n Also folgt mit Satz 3.3.2, dass limn→∞ 1 n2 −3n+3 1 n2 −3n+3 n∈N . Man sieht = 0. 3.3.4 Beispiel. Jede Zahl x ∈ R ist Limes einer Folge (rn )n∈N bestehend aus rationalen Zahlen. Um das einzusehen, wähle gemäß Satz 2.6.3 für jedes n ∈ N eine Zahl rn ∈ Q, sodass x < rn < x + 1n . . Aus Satz 3.3.2 folgt limn→∞ rn = x. Genauso gibt eine Folge irrationaler Zahlen größer x, die gegen x konvergiert. Arbeitet man mit größerer mathematischen Strenge, so muss man obiges Argument folgendermaßen präzisieren: Nach Satz 2.6.3 ist die Menge Mn der r ∈ Q mit x < r < x + 1 n nicht leer. Nun sei ρ einfach eine nach dem Auswahlaxiom existierende Funktion von N nach ∪n∈N Mn , sodass ρ(n) ∈ Mn . Nun setze einfach rn = ρ(n). Mit einer etwas feineren Argumentation kann man (rn )n∈N sogar streng monoton fallend (rn1 > rn2 wenn n1 < n2 ) wählen. Dazu definiert man rn induktiv so, dass x < rn < min(x + 1n , rn−1 ). Genauso kann man eine streng monoton wachsende Folge aus Q konstruieren, die gegen x konvergiert. Lässt man auch hier mehr Strenge walten, so benötigt man zur Existenz der Folge (rn )n∈N den Rekursionssatz: Für jedes y > x und jedes n ∈ N ist die Menge Q ∩ (x, min(y, x + 1n )) nicht leer. Sei ̺ : N × (x, +∞) → Q eine Auswahlfunktion, sodass ̺(n, y) ∈ Q ∩ (x, min(y, x + 1n )). Nun sei a := (1, r1 ) ∈ N × ((x, +∞) ∩ Q) =: A und g : A → A definiert durch g(n, y) = (n + 1, ̺(n, y)). Nach dem Rekursionssatz gibt es eine Funktion φ : N → A mit φ(1) = a und φ(n + 1) = g(φ(n)). Ist für n ∈ N nun rn die zweite Komponente von φ(n), so hat (rn )n∈N die geforderten Eigenschaften. Sei F ⊆ R nach oben beschränkt und x := sup F. Gemäß der Definition des Supremums gilt (x − 1n , x] ∩ F , ∅ für alle n ∈ N. Wählt man für jedes n ∈ N eine reelle Zahl xn ∈ (x − n1 , x] ∩ F, so erhält man eine Folge (xn )n∈N , in F, die gegen sup F konvergiert. Man kann ähnlich wie oben (xn )n∈N sogar monoton wachsend wählen. Entsprechendes gilt für nach unten beschränkte Mengen und deren Infimum. Im nächsten Satz wollen wir zeigen, dass die algebraischen Operationen und die Betragsfunktion auf R und C mit dem Grenzwertbegriff verträglich sind. 3.3.5 Satz (Rechenregeln für Folgen). Seien (zn )n∈N und (wn )n∈N konvergente Folgen reeller oder komplexer Zahlen, limn→∞ zn =: z, limn→∞ wn =: w, und sei λ ∈ R bzw. λ ∈ C. Dann gilt für k ∈ N 3.3. FOLGEN REELLER UND KOMPLEXER ZAHLEN 63 (i) limn→∞ |zn | = |z|, limn→∞ z̄n = z̄. (ii) limn→∞ (zn + wn ) = z + w, limn→∞ (−zn ) = −z. (iii) Ist z = 0, also zn → 0, n → ∞, und ist (un )n∈N eine beschränkte Folge aus R bzw. C, dann gilt limn→∞ (zn · un ) = 0. (iv) limn→∞ (λzn ) = λz und limn→∞ (zn · wn ) = z · w. (v) limn→∞ zkn = zk . (vi) Falls z , 0 ist, gilt limn→∞ 1 zn = 1z . √ √ (vii) Ist zn ∈ R und zn ≥ 0, so folgt limn→∞ k zn = k z. 3.3.6 Bemerkung. Bis auf den letzten Punkt werden wir Satz 3.3.5 für komplexe Folgen beweisen. Fast derselbe Beweis funktioniert für reellwertige Folgen. Man kann aber die Rechenregeln für reellwertige Folgen auch aus denen für komplexwertige Folgen herleiten, da – wie wir gleich zeigen wollen – eine Folge (xn )n∈N in R genau dann konvergiert, wenn (xn + i0)n∈N in C konvergiert. Dabei gilt limn→∞ (xn + i0) = (limn→∞ xn ) + i0. Ist (xn )n∈N eine reellwertige Folge, welche gegen ein x ∈ R konvergiert, so konvergiert (xn + i0)n∈N gegen x + i0, da ja |(xn + i0) − (x + i0)| = |xn − x| → 0; vgl. Bemerkung 3.2.3. Konvergiert umgekehrt für eine reellwertige Folge (xn )n∈N die Folge (xn + i0)n∈N in C gegen x + iy ∈ C, so muss wegen 0 ≤ max(|xn − x|, |0 − y|) ≤ |(xn + i0) − (x + iy)| → 0, n → ∞, gemeinsam mit Satz 3.3.2 folgen, dass xn → x und |y| → 0, d.h. y = 0. Beweis. (Satz 3.3.5) (i) Zu ǫ > 0 wähle N ∈ N, sodass |zn −z| < ǫ für n ≥ N. Mit der Dreiecksungleichung nach unten erhält man |zn | − |z| ≤ |zn − z| < ǫ, |z̄n − z̄| = |zn − z| < ǫ. Man kann limn→∞ |zn | = |z| auch als Spezialfall von Lemma 3.2.10 sehen: |zn | = d(zn , 0) → d(z, 0) = |z|. (ii) Sei ǫ > 0 gegeben. Wähle N so, dass |zn − z| < n ≥ N. Es gilt für solche n ǫ 2 und auch |wn − w| < |(zn + wn ) − (z + w)| = |(zn − z) + (wn − w)| ≤ |zn − z| + |wn − w| < ǫ 2 für alle ǫ ǫ + = ǫ. 2 2 Also ist (zn + wn )n∈N konvergent und der Grenzwert ist z + w. Weiters gilt für N so groß, dass |zn − z| < ǫ, wenn nur n ≥ N, auch |(−zn ) − (−z)| = | − (zn − z)| = |zn − z| < ǫ, n ≥ N. Also konvergiert (−zn )n∈N gegen −z. KAPITEL 3. DER GRENZWERT 64 (iii) Ist C > 0 so, dass |un | ≤ C, n ∈ N, und ist ǫ > 0, so gibt es wegen zn → 0 ein N ∈ N, sodass |zn | < Cǫ , n ≥ N. Es folgt |zn ·un | < ǫ für alle n ≥ N, also zn ·un → 0. (iv) Ist N so groß, dass |zn − z| < ǫ für n ≥ N, so gilt |λzn − λz| = |λ| · |zn − z| < λ · ǫ, n ≥ N. Gemäß (3.4) folgt daher λzn → λz. Um zn wn → zw nachzuweisen, sei daran erinnert, dass gemäß Proposition 3.2.13 konvergente Folgen beschränkt sind. Nach (ii) konvergiert (zn − z) gegen Null, und mit (iii) daher auch (zn − z)wn → 0, n → ∞. Der schon bewiesene Teil von (iv) gibt nun zusammen mit (ii) n→∞ zn wn = (zn − z)wn + zwn −→ 0 + zw. (v) Das folgt durch vollständige Induktion nach k aus (iv). (vi) Sei nun z , 0. Wegen (i) und Lemma 3.3.1 folgt aus zn → z für hinreichend großes n, dass |zn | > |z|2 . Es folgt die Abschätzung 1 − 1 = |z − zn | ≤ |z − z | · 2 , n zn z |z| · |zn | |z|2 und damit wird die Differenz 1 zn − 1 z für große n beliebig klein. (vii) Sei zunächst z > 0. Wegen (i) und Lemma 3.3.1 folgt aus zn → z die Existenz von N ∈ N, sodass für n ≥ N sicher zn > 2z > 0 und |zn − z| < ǫ. Gemäß (2.10) gilt für solche n √ √ |zn − z| ≤ | k zn − k z| = √ k−1 √ k−2 √ √ √ √ k k k | z + z zn + . . . + k zn k−2 k z + k zn k−1 | |zn − z| ǫ pk z k−1 < pk z k−1 , + 2 | k 2 | 2 2 + ...+ 2 2 + 2 √ √ da klarerweise auch z > 2z . Gemäß (3.4) folgt k zn → k z. pk z k−1 pk z k−2 pk z pk z k−2 pk z Ist z = 0, so sei ǫ > 0 vorgegeben. Ist nun N ∈ N so, dass zn = |zn − 0| < ǫ k für n ≥ N, dann folgt aus der Monotonie der Wurzelfunktion (vgl. Bemerkung 2.7.7) √ √ √ | k zn − 0| = k zn < ǫ. Also k zn → 0. ❑ 3.3.7 Beispiel. (i) Wegen limn→∞ n1 = 0 folgt aus Satz 3.3.5, (vii), dass limn→∞ √p1n = 0. Zusammen mit Satz 3.3.5, (v), erhält man also, dass für alle r ∈ Q, r > 0, lim n→∞ 1 =0. nr 3.4. MONOTONE FOLGEN 65 √ √ (ii) Um für xn = n3 + 1 − n3 + 2n den Grenzwert zu berechnen, verwenden wir (2.10) und erhalten √ n3 + 1 − Wegen √ (n3 + 1) − (n3 + 2n) n3 + 2n = √ = √ n3 + 1 + n3 + 2n 1 − 2n = q √ √ 3 n + 1 + n3 + 2n n+ 0≤ q n+ 1 1 n2 q + n+ 2 n 1 n −2 q 1 + n+ n2 . 2 n 1 ≤ √ n ergibt Satz 3.3.2, dass der mittlere Ausdruck gegen Null konvergiert. Zusammen mit Satz 3.3.5, (iv), folgt limn→∞ xn = 0. √ (iii) Die Folge xn = n n konvergiert gegen 1. In der Tat gilt für die Folge an := xn − 1, dass an ≥ 0 und (1 + an )n = n. Nach dem Binomischen Lehrsatz gilt ! n X n(n − 1) 2 n k n−k an . n = (an + 1)n = an 1 ≥ 1 + 2 k k=0 Damit folgt a2n ≤ xn → 1, n → ∞. 2(n−1) n(n−1) = 2 n → 0. Gemäß Satz 3.3.5, (vii), gilt an → 0 und damit (iv) Ist q > 0 fest, so gilt limn→∞ gilt für n ≥ q Nach Satz 3.3.2 folgt verwende Satz 3.3.5. √n q = 1. Betrachte zunächst den Fall q ≥ 1. Dann 1≤ √ √n q ≤ nn. √n q → 1. Im Fall 0 < q < 1 betrachte 1 √ nq = q n 1 q und (v) Um für z ∈ C mit |z| < 1 und√ k ∈ N den Grenzwert limn→∞ nk · zn zu berechnen, sei N ∈ N so groß, dass | nk · z| < 1+|z| 2 (< 1) für alle n ≥ N, was wegen √ k limn→∞ n · |z| = |z| zusammen mit Lemma 3.3.1 möglich ist. Für n ≥ N gilt dann !n 1 + |z| k n 0 ≤ |n · z | ≤ , 2 und somit limn→∞ nk · zn = 0. 3.4 Monotone Folgen Bisher haben wir zwar gesehen, was aus der Konvergenz einer oder mehrerer Folgen folgt. Das Problem, ob eine gegebene Folge konvergiert oder nicht haben wir jedoch nicht betrachtet. Die definierende Eigenschaft von R, vollständig angeordnet zu sein, wird uns in R die Existenz von Grenzwerten bestimmter Folgen liefern. 3.4.1 Definition. Eine Folge (an )n∈N in R heißt monoton wachsend, falls an ≤ an+1 für alle n ∈ N, dh. a1 ≤ a2 ≤ a3 ≤ . . . KAPITEL 3. DER GRENZWERT 66 Sie heißt monoton fallend, falls an ≥ an+1 für alle n ∈ N, dh. a1 ≥ a2 ≥ a3 ≥ . . . Eine Folge heißt monoton, wenn monoton wachsend oder monoton fallend ist. 3.4.2 Satz. Sei (xn )n∈N eine monoton wachsende und nach oben beschränkte Folge. Dann konvergiert (xn )n∈N , wobei lim xn = sup{xn : n ∈ N} . n→∞ Entsprechend konvergiert eine monoton fallende und nach unten beschränkte Folge (xn )n∈N gegen inf{xn : n ∈ N}. Beweis. Sei (xn )n∈N monoton wachsend und nach oben beschränkt. Somit existiert x := sup{xn : n ∈ N}. Wir zeigen, dass limn→∞ xn = x. Sei ǫ > 0. Wegen x − ǫ < x kann x − ǫ keine obere Schranke der Menge {xn : n ∈ N} sein. Es gibt also ein N ∈ N mit xN > x − ǫ. Wegen der Monotonie folgt auch xn > x − ǫ für alle n ≥ N. Da stets x ≥ xn gilt, erhält man für n ≥ N 0 ≤ x − xn < ǫ, und damit |xn − x| < ǫ. Für monoton fallende Folgen schließt man in analoger Art und Weise. ❑ 3.4.3 Beispiel. (i) Betrachte die Folge n1 . Gemäß Beispiel 2.6.2 gilt inf{ n1 : n ∈ N} = 0. Also n∈N folgt aus Satz 3.4.2, dass limn→∞ 1n = 0. Dieses Konvergenzverhalten haben wir übrigens auch schon in Beispiel 3.2.4, (ii), festgestellt. (ii) Die Bedingung in Satz 3.4.2 ist für Konvergenz, aber nicht notwen hinreichend n dig. Betrachte dazu die Folge (−1) . n n∈N √ √ (iii) Nach dem Rekursionssatz Satz 2.3.3 ist durch a1 = 2 und an+1 = 2 + an eine Folge in [0, +∞) wohldefiniert. Wir behaupten, dass dabei an ≤ 2 und an ≤ an+1 für alle n ∈ N, was wir mittels vollständiger Induktion zeigen wollen. q √ √ √ Für n = 1 gilt offenbar a1 = 2 ≤ 2 und a1 = 2 ≤ 2 + 2 ≤ a2 . √ √ Gelte nun an √ ≤ 2 und an √≤ an+1 . Daraus folgt an+1 = 2 + an ≤ 2 + 2 = 2 und auch an+1 = 2 + an ≤ 2 + an+1 = an+2 . Gemäß Satz √ 3.4.2 konvergiert (an )n∈N gegen a = sup{an : n ∈ N}, welches sicher a ≥ a1 = 2 > 0 erfüllt. Um a genau zu berechnen, sei bemerkt, dass auch (vgl. Satz 3.3.5) p √ a = lim an+1 = lim 2 + an = 2 + a . n→∞ n→∞ 2 Somit erfüllt a die Gleichung a − a − 2 = 0. Also gilt a = 2 oder a = −1, wobei die zweite Möglichkeit wegen a > 0 ausgeschlossen werden kann. (iv) Für n ∈ N sei 1 en = 1 + n !n 1 und fn = 1 + n !n+1 . 3.4. MONOTONE FOLGEN 67 Offenbar gilt immer 1 < en < fn . Wir rechnen mit Hilfe der Version der Bernoullische Ungleichung aus Beispiel 2.3.11 !n+1 ! 1 n+1 en+1 1 1 + n+1 n + 1 n2 + 2n + 1 − 1 = = 1+ = en n n n2 + 2n + 1 1 + 1n n+1 1 1− n (n + 1)2 !n+1 > ! 1 n+1 n n 1 − (n + 1) = = 1. n+1 (n + 1)2 n n+1 Ähnlich gilt fn fn+1 1 = 1+ 1 n 1+ 2 n+1 n + 2n 1 n n+2 !n+2 1 + 1n n2 + 2n + 1 = n = 1 n+1 n2 + 2n 1 + n+1 !n+2 ! n 1 n n+1 > =1. 1 + (n + 2) 2 = n+1 n + 2n n+1 n Also ist (en )n∈N streng monoton wachsend und ( fn )n∈N streng monoton fallend. Wegen 1 < en < fn ≤ f1 = 4 für alle n ∈ N sind diese Folgen auch beschränkt, und somit konvergent, wobei ! 1 lim fn = lim 1 + · en = 1 · lim en . n→∞ n→∞ n→∞ n Den gemeinsamen Grenzwert dieser Folgen nennt man die Eulersche Zahl e. Für nach oben beschränkte, aber nicht notwendigerweise monotone Folgen gilt folgende schwächere Aussage. 3.4.4 Lemma. Sei (xn )n∈N eine beschränkte Folge aus R. Für N ∈ N sei yN := inf{xn : n ≥ N}. Dann ist die Folge (yN )N∈N monoton wachsend, beschränkt, und konvergiert daher gegen sup{yN : N ∈ N}. Also existiert der sogenannte Limes Inferior lim inf xn := sup inf xn = lim inf xn . n→∞ N∈N n≥N N→∞ n≥N Schließlich gibt es eine Teilfolge (xn( j) ) j∈N von (xn )n∈N , die ebenfalls gegen lim inf n→∞ xn konvergiert. Entsprechendes gilt, wenn man alle Infima durch Suprema und umgekehrt ersetzt. Also ist (zN )N∈N mit zN = sup{xn : n ≥ N} monoton fallend und beschränkt. Ihren Grenzwert nennt man Limes Superior lim sup xn := inf sup xn = lim sup xn . n→∞ N∈N n≥N N→∞ n≥N Beweis. Gemäß Voraussetzung gilt |xn | ≤ C, n ∈ N für ein reelles C > 0. Somit existiert für jedes N ∈ N yN := inf{xn : n ≥ N} ≤ C , KAPITEL 3. DER GRENZWERT 68 und in Folge auch y := sup{yN : N ∈ N}. Aus {xn : n ≥ N + 1} ⊆ {xn : n ≥ N} folgt yN+1 ≥ yN , und aus Satz 3.4.2 die Tatsache limn→∞ yn = y, wobei ym ≤ y für alle m ∈ N. Wir definieren nun rekursiv eine Teilfolge8 (xn( j) ) j∈N von (xn )n∈N , indem wir zunächst n(1) = 1 setzen. Ist n( j) ∈ N definiert, so existiert wegen yn( j)+1 ≤ y ein n( j + 1) ∈ N derart, dass n( j + 1) > n( j) und yn( j)+1 = inf{xk : k > n( j)} ≤ xn( j+1) < y + 1 . j+1 1 Wegen yn( j) ≤ yn( j)+1 ≤ xn( j+1) < y + j+1 liefert das Einschlusskriterium Satz 3.3.2 die Konvergenz von (xn( j) ) j∈N gegen y. Der Beweis für den Limes Superior verläuft entsprechend. ❑ 3.4.5 Fakta. 1. Aus inf n≥N xn ≤ supn≥N xn , N ∈ N folgt unmittelbar lim inf xn ≤ lim sup xn . n→∞ n→∞ 2. Weiters folgt aus den Rechenregeln für Suprema und Infima sofort, dass lim supn→∞ (−xn ) = − lim inf n→∞ xn sowie lim supn→∞ an ≤ lim supn→∞ bn und lim inf n→∞ an ≤ lim inf n→∞ bn für beschränkte Folgen (an )n∈N , (bn )n∈N mit an ≤ bn ab einem Index N ∈ N. 3. Ist (xn )n∈N konvergent, so folgt aus Lemma 3.4.4 und Satz 3.2.8, (iv), dass lim inf xn = lim xn = lim sup xn . n→∞ n→∞ (3.7) n→∞ 4. Gilt umgekehrt y := lim inf n→∞ xn = lim supn→∞ xn , so gibt es zu jedem ǫ > 0 ein N1 ∈ N, sodass y − ǫ < inf n≥N xn ≤ y für alle N ≥ N1 , und ein N2 ∈ N, sodass y ≤ supn≥N < y + ǫ für alle N ≥ N2 . Für N ≥ max(N1 , N2 ) folgt y − ǫ < inf xn ≤ xN ≤ sup < y + ǫ , n≥N n≥N und damit die Konvergenz von (xn )n∈N gegen y; also gilt (3.7). 5. Aus lim supn→∞ xn = limN→∞ supn≥N xn zusammen mit Satz 2.6.3 und Lemma 3.3.1 zeigt man, dass lim supn→∞ xn < ξ genau dann, wenn es ein q < ξ gibt, sodass xn ≤ q für alle bis auf endlich viele n ∈ N. Entsprechendes gilt für lim inf n→∞ xn > ξ. 6. Ähnlich gilt lim supn→∞ xn > ξ genau dann, wenn es ein q > ξ gibt, sodass xn ≥ q für unendlich viele n ∈ N. Entsprechendes gilt für lim inf n→∞ xn < ξ. 7. In der Tat ist lim supn→∞ xn jene eindeutige Zahl x, für die gilt: Für jedes ǫ > 0 gibt es nur für endlich viele n ∈ N, die der Ungleichung xn ≥ x + ǫ genügen, wogegen für unendlich viele n ∈ N die Ungleichung xn ≥ x − ǫ gilt. Auch hier gilt entsprechendes für lim inf n→∞ xn . 8 Dass man so verfahren kann, wird durch den Rekursionssatz gewährleistet. 3.5. CAUCHY-FOLGEN 69 3.5 Cauchy-Folgen Um in Allgemeinen metrischen Räumen Folgen auf Konvergenz zu untersuchen, führt man den Begriff der Cauchy-Folge ein. 3.5.1 Definition. Sei hX, di ein metrischer Raum. Eine Folge (xn )n∈N von Elementen aus X heißt Cauchy-Folge9, falls ∀ǫ ∈ R, ǫ > 0 ∃N ∈ N : d(xn , xm ) < ǫ für alle n, m ≥ N . (3.8) 3.5.2 Bemerkung. Da es wegen Satz 2.6.3 zwischen jedem ǫ ∈ R, ǫ > 0 und der Zahl 0 ein ε ∈ Q mit 0 < ε < ǫ gibt, erhält man eine zu Definition 3.5.1 äquivalente Definition, wenn man in (3.8) statt ∀ǫ ∈ R, ǫ > 0 . . . den Ausdruck ∀ǫ ∈ Q, ǫ > 0 . . . schreibt. Aus dem selben Grund lässt sich die Konvergenz einer Folge durch (3.3) charakterisieren, wenn man in eben dieser Gleichung ∀ǫ ∈ Q, ǫ > 0 . . . anstatt ∀ǫ ∈ R, ǫ > 0 . . . schreibt. Ähnlich wie in Proposition 3.2.13 gilt. 3.5.3 Proposition. Sei (xn )n∈N eine Cauchy-Folge. Dann ist {xn : n ∈ N} beschränkt. Beweis. Wähle N ∈ N mit d(xn , xm ) < 1 für n, m ≥ N. Setzt man C := 1 + max{d(x1 , xN ), . . . , d(xN−1 , xN )} , so gilt d(xn , xN ) ≤ C für jedes n ∈ N. ❑ Aus dem nächsten Resultat erkennt man einen Zusammenhang zum Begriff der Konvergenz. 3.5.4 Proposition. Ist die Folge (xn )n∈N konvergent, so ist sie eine Cauchy-Folge. Beweis. Sei ǫ > 0 gegeben. Aus der Definition der Konvergenz folgt die Existenz einer Zahl N ∈ N mit der Eigenschaft, dass d(xn , x) < 2ǫ , n ≥ N. Hier bezeichnet x den Grenzwert der Folge (xn )n∈N , der zwar nach Voraussetzung existiert, über den sonst aber nichts bekannt zu sein braucht. Dann gilt nach der Dreiecksungleichung für n, m ≥ N ǫ ǫ d(xn , xm ) ≤ d(xn , x) + d(x, xm ) < + = ǫ. 2 2 ❑ Also ist jede konvergente Folge eine Cauchy-Folge. Würde nun umgekehrt jede Cauchy-Folge konvergieren, so könnten wir die Konvergenz einer Folge nachweisen, ohne ihren Grenzwert explizit in der Hand zu haben. Leider ist dies bei vielen metrischen Räumen nicht der Fall. 3.5.5 Definition. Ein metrischer Raum hX, di heißt vollständig, wenn jede CauchyFolge von Elementen aus X in X einen Grenzwert besitzt. 9 Augustin Louis Cauchy. 21.8.1789 Paris - 22.5.1857 Sceaux (bei Paris) KAPITEL 3. DER GRENZWERT 70 3.5.6 Beispiel. Die rationalen Zahlen sind nicht vollständig. Dazu betrachte man z.B. eine √ Folge (rn )n∈N bestehend aus rationalen Zahlen wie in Beispiel 3.3.4, die gegen 2 ∈ R \ Q konvergiert. Diese ist eine Cauchy-Folge in R und daher auch in Q. Sie konvergiert aber nicht √ in Q. Denn würde sie das tun, so würde sie in R einerseits gegen 2 und andererseits gegen einen Grenzwert in Q konvergieren. Das widerspricht der Eindeutigkeit des Grenzwertes in R. 3.5.7 Lemma. Sei (xn )n∈N eine Cauchy-Folge in einem metrischen Raum hX, di, die eine konvergente Teilfolge hat. Dann ist (xn )n∈N konvergent. Proof. Sei (xn(k) )k∈N die konvergente Teilfolge mit limk→∞ xn(k) = x. Zu ǫ > 0 wähle N1 so groß, dass d(xn , xm ) < ǫ für n, m ≥ N1 . Wähle N2 so groß, dass d(xn(k) , x) < ǫ für k ≥ N2 . Setze N := max{N1 , N2 }. Wählt man nun k ≥ N, so folgt n(k) ≥ k ≥ N, und man erhält für n ≥ N d(xn , x) ≤ d(xn , xn(k) ) + d(xn(k) , x) < ǫ + ǫ = 2ǫ. Das wichtigste Beispiel für einen vollständige metrischen Raum sind die reellen Zahlen. 3.5.8 Satz (Cauchysches Konvergenzkriterium). Sei (xn )n∈N eine Cauchy-Folge reeller Zahlen. Dann existiert eine reelle Zahl x, sodass (xn )n∈N gegen x konvergiert. Beweis. Gemäß Proposition 3.5.3 ist die Cauchy-Folge (xn )n∈N beschränkt. Nach Lemma 3.4.4 hat (xn )n∈N eine konvergente Teilfolge. Schließlich konvergiert gemäß Lemma 3.5.7 auch die Folge (xn )n∈N selbst. ❑ 3.5.9 Beispiel. Der metrische Raum X = [0, 1] versehen mit der euklidischen Metrik ist auch vollständig, denn ist (xn )n∈N eine Cauchy-Folge in X, so ist sie das auch in R. Wegen Satz 3.5.8 gilt limn→∞ xn = x für ein x ∈ R. Wegen 0 ≤ xn ≤ 1, n ∈ N, folgt aus Lemma 3.3.1, (iii), dass auch x ∈ X. Also hat jede Cauchy-Folge in X einen Grenzwert in X. Ist dagegen etwa X = (0, 1] versehen mit der euklidischen Metrik, so ist n1 n∈N eine Cauchy-Folge in X. Sie hat aber in X keinen Grenzwert, denn sonst würde 1 n n∈N auch in R gegen diesen Grenzwert x ∈ X ⊆ R und andererseits gegen 0 streben. Wegen 0 < X muss x , 0 im Widerspruch zu Satz 3.2.8, (i). 3.6 Konvergenz in weiteren metrischen Räumen Wir betrachten die Menge R p (p ∈ N) und versehen diesen mit den drei schon vorgestellten Metriken d1 , d2 , d∞ . Wie bereits bemerkt, unterscheiden sich diese Metriken voneinander. 3.6. KONVERGENZ IN WEITEREN METRISCHEN RÄUMEN 71 Der Unterschied ist aber nicht allzu groß. In der Tat werden wir sehen, dass wenn eine Folge bezüglich einer der drei Metriken konvergiert, diese dann auch bezüglicher der anderen zwei konvergiert10. Der Grund dafür liegt in der Ungleichungskette max {|xk |} ≤ k=1,...,p p X k=1 |xk |2 21 ≤ p X k=1 |xk | ≤ p · max {|xk |} . k=1,...,p (3.9) Das zweite ≤“ sieht man durch quadrieren. Das erste und dritte ist klar. ” 3.6.1 Proposition. Sei (xn )n∈N eine Folge von Punkten xn = (xn,1 , . . . , xn,p ) ∈ R p , und x = (x1 , . . . , x p ) ∈ R p . Dann impliziert limn→∞ xn = x bezüglich einer der Metriken d1 , d2 , d∞ auch limn→∞ xn = x bezüglich der anderen zwei Metriken aus d1 , d2 , d∞ . Die Konvergenz von (xn )n∈N gegen x bezüglich einer und daher aller dieser Metriken ist wiederum äquivalent zur komponentenweisen Konvergenz 11 lim xn,k = xk für alle k = 1, . . . , p . n→∞ (3.10) Insbesondere konvergiert eine Folge (zn )i∈N komplexer Zahlen gegen ein z ∈ C genau dann, wenn12 lim Re(zn ) = Re z und lim Im(zn ) = Im z . n→∞ n→∞ Beweis. Aus Ungleichung (3.9) schließen wir auf d∞ (xn , x) ≤ d2 (xn , x) ≤ d1 (xn , x) ≤ p · d∞ (xn , x). Das Einschlusskriterium Satz 3.3.2 liefert nun sofort, dass, wenn eine der Folgen d1 (xn , x) n∈N , d2 (xn , x) n∈N bzw. d∞ (xn , x) n∈N eine Nullfolge ist, es dann die beiden anderen Folgen auch sind. Aus Bemerkung 3.2.3 folgt, dass die Konvergenzbegriffe bzgl. der drei Metriken übereinstimmen. Sei nun limn→∞ xn = x bezüglich bezüglich einer dieser Metriken und daher insbesondere bezüglich d∞ . Für k = 1, . . . , p gilt 0 ≤ |xn,k − xk | ≤ max {|xn, j − x j |} = d∞ (xn , x) . j=1,...,p Wieder nach dem Einschlusskriterium Satz 3.3.2 zusammen mit Bemerkung 3.2.3 folgt limn→∞ xn,k = xk . Sei umgekehrt (3.10) vorausgesetzt und ǫ > 0 gegeben. Wähle N1 , . . . , N p , sodass für k = 1, . . . , p folgt |xn,k − xk | < ǫ, n ≥ Nk . Setzt man N := max{N1 , . . . , N p }, so folgt d∞ (xn , x) = max {|xn,k − xk |} < ǫ . k=1,...,p Also gilt xn → x bezüglich d∞ . ❑ 10 Es sei aber hier auch darauf hingewiesen, dass es auf ein und der selben Menge Metriken d, d̃ geben kann, sodass eine gewissen Folge (xn )n∈N in dieser Menge bezüglich d konvergiert, aber bezüglich d̃ divergiert. 11 Diese Konvergenz versteht sich in R bezüglich der euklidischen Metrik. 12 Vergleiche Bemerkung 3.3.6. KAPITEL 3. DER GRENZWERT 72 3.6.2 Beispiel. Man betrachte die Folge (xn )n∈N im R3 gegeben durch n X 1 1 n xn = · (−1) , 2 − 3n, . n 2k k=0 P Wegen | n1 · (−1)n | = 1n → 0 und 1n · nk=0 21k ≤ n2 → 0 konvergieren die erste und die dritte Komponente gegen 0. Die zweite konvergiert wegen n1 (2 − 3n) = 2n − 3 gegen −3. Also konvergiert unsere Folge bezüglich d1 , d2 , d∞ gegen (0, −3, 0). 3.6.3 Korollar. Der Raum R p versehen mit einer der Metriken d1 , d2 , d∞ ist vollständig. Insbesondere sind die komplexen Zahlen vollständig. Beweis. Zunächst sei bemerkt, dass wenn eine Folge (xn )n∈N von Punkten des R p eine Cauchy-Folge bezüglich einer der Metriken d1 , d2 , d∞ ist, so ist sie das wegen d∞ (xn , xm ) ≤ d2 (xn , xm ) ≤ d1 (xn , xm ) ≤ p · d∞ (xn , xm ) auch bezüglich der beiden anderen Metriken. Sei nun (xn )n∈N eine Cauchy-Folge von Punkten des R p (bzgl. d1 , d2 , d∞ ), wobei xn = (xn,1 , . . . , xn,p ). Dann gibt es zu jedem vorgegebenen ǫ > 0 eine Zahl N ∈ N mit d∞ (xn , xm ) < ǫ für n, m ≥ N. Es folgt für jedes k ∈ {1, . . . , p} |xn,k − xm,k | ≤ d∞ (xn , xm ) < ǫ, n, m ≥ N , d.h. jede der Folgen (xn,k )n∈N , k = 1, . . . , p, ist eine Cauchy-Folge reeller Zahlen. Daher existieren y1 , . . . , y p ∈ R mit lim xi,k = yk , k = 1, . . . , p . i→∞ Wegen Proposition 3.6.1 folgt limn→∞ xn = y mit y = (y1 , . . . , y p ). ❑ 3.6.4 Bemerkung. Die in Satz 3.3.5 hergeleiteten Rechenregeln gelten zum Teil auch in R p , wenn R p mit der euklidischen Metrik und mit den Verknüpfungen +“ und ” skalares Multiplizieren“ wie aus der Linearen Algebra bekannt versehen wird. Sind ” p also (xn )n∈N , (yn )n∈N Folgen in R , die gegen x bzw. y konvergieren, und ist (λn )n∈N eine gegen ein λ ∈ R konvergente Folge in R, so gilt (i) limn→∞ (xn + yn ) = x + y. (ii) limn→∞ λn xn = λx. (iii) limn→∞ (xn , yn ) = (x, y) (∈ R) (vgl. (3.2)). Das folgt aus Proposition 3.6.1, da man die jeweiligen Konvergenzen auf die Komponenten von R p zurückführen kann. Eine andere Möglichkeit, diese Behauptungen zu p beweisen, besteht darin, den euklidischen qPAbstand d2 (x, y) zweier Punkte x, y ∈ R als p 2 kx − yk2 zu schreiben, wobei kxk2 = k=1 |xk | , und im Beweis von Satz 3.3.5 den Betrag durch k.k ersetzt. Siehe Bemerkung 3.1.7. 3.7. KONVERGENZ GEGEN UNENDLICH 73 Dass es auf ein und derselben Menge zwei Metriken geben kann, sodass die Konvergenz einer Folge bezüglich der einen Metrik nicht die Konvergenz bezüglich der anderen bedingt, zeigt folgendes Beispiel. 3.6.5 Beispiel. Man betrachte R einerseits versehen mit der Euklidischen Metrik d2 , also die von |.| induzierte Metrik, und andererseits mit der diskreten Metrik d aus Beispiel 3.1.5, (iv). Außerdem betrachte man die Folge n1 , welche bekannterweise gegen 0 konn∈N vergiert. Bezüglich d tut sie das nicht, da ja immer d(0, 1n ) = 1, n ∈ N. Man zeigt unschwer, dass eine Folge (xn )n∈N bezüglich d genau dann gegen x konvergiert, wenn xn = x ab einem Index n0 . 3.6.6 Beispiel. Sei p eine feste Primzahl. Die Folge (pn )n∈N ist bezüglich der Metrik d(p) auf Z gegen 0 konvergent, bezüglich der euklidischen Metrik d2 auf Z jedoch divergent. Um das einzusehen, sei ǫ > 0 gegeben. Wählt man N ∈ N mit p1N < ǫ, so gilt für alle n ≥ N 1 1 d(p) (pn , 0) = n ≤ N < ǫ . p p Angenommen es existiere x ∈ Z, sodass pn → x bezüglich d2 . Wähle N ∈ N, sodass d2 (pn , x) < 1, n ≥ N. Dann folgt mit der Bernoullischen Ungleichung 1 + n(p − 1) ≤ pn = d2 (pn , 0) ≤ d2 (pn , x) + d2 (x, 0) < 1 + |x|, n ≥ N , und weiter, dass n(p − 1) ≤ |x|, n ≥ N, was der Tatsache widerspricht, dass R archimedisch angeordnet ist. Tatsächlich sind in hZ, d2 i nur die ab einem Index konstanten Folgen konvergent, da konvergente Folgen auch CauchyFolgen sind, und damit insbesondere ab einem gewissen Index der Abstand zweier Folgenglieder kleiner als 1 ist. Zwei verschiedene ganze Zahlen haben aber sicher einen Abstand von mindestens 1. 3.7 Konvergenz gegen unendlich Die Folge xn = n, n ∈ N, als Folge in R ist nicht konvergent. Sie ist ja nicht einmal beschränkt. Trotzdem zeigt sie ein doch recht determiniertes Verhalten. Aus dem Bauch heraus würde man sagen, dass sie gegen unendlich“ strebt. ” 3.7.1 Definition. Eine Folge (xn )n∈N aus R heißt konvergent gegen +∞, in Zeichen xn → +∞, n → ∞, falls ∀M > 0 ∃N ∈ N : xn > M für n ≥ N . (3.11) Entsprechend sagen wir, dass eine Folge (xn )n∈N aus R gegen −∞ strebt, in Zeichen xn → −∞, n → ∞, wenn ∀M < 0 ∃N ∈ N : xn < M für n ≥ N . (3.12) Folgen, die im obigen Sinne gegen +∞ oder −∞ streben, heißen auch bestimmt divergent. 3.7.2 Bemerkung. Unmittelbar aus (3.11) bzw. (3.12) und Lemma 3.3.1, (i), erkennt man, dass sich für eine Folge (xn )n∈N und ein x ∈ R die Konvergenzen limn∞∞ xn = +∞ und limn∞∞ xn = x gegenseitig ausschließen. Genauso kann limn∞∞ xn = −∞ und limn∞∞ xn = x nicht gleichzeitig stattfinden. Ebenso schließen sich limn∞∞ xn = +∞ und limn∞∞ xn = −∞ gegenseitig aus. KAPITEL 3. DER GRENZWERT 74 Ist (xn )n∈N in R und x ∈ R oder x = ±∞, so kann man x = limn→∞ xn einheitlich folgendermaßen schreiben: (∀ξ ∈ R, ξ < x ∃N ∈ N : ∀n ≥ N ⇒ xn > ξ) ∧ (∀η ∈ R, η > x ∃N ∈ N : ∀n ≥ N ⇒ xn < η). Für die Konvergenzbegriffe aus Definition 3.7.1 gelten ähnliche Regeln, wie bei der Konvergenz gegen Zahlen. 3.7.3 Satz. Für Folgen (xn )n∈N und (yn )n∈N aus R, sodass limn→∞ xn = +∞, gelten folgende Aussagen. (i) Ist die Menge {yn : n ∈ N, n ≥ k} für ein gewisses k ∈ N nach unten beschränkt, dann gilt lim (xn + yn ) = +∞. n→∞ (ii) limn→∞ (−xn ) = −∞. (iii) Ist yn ≥ C für ein gewisses C > 0 und für alle n ∈ N, n ≥ k mit einem gewissen k ∈ N, so gilt limn→∞ xn yn = +∞. (iv) Ist xn ≤ yn , für alle n ∈ N, n ≥ k für einen gewissen Index k ∈ N, so folgt limn→∞ yn = +∞. (v) Seien alle bis auf endlich viele, d.h. alle ab einem Index k ∈ N, yn positiv (negativ). Dann gilt limn→∞ yn = +∞ (−∞) genau dann, wenn limn→∞ y1n = 0. (vi) Sei (yn )n∈N monoton wachsend (fallend). Ist (yn )n∈N beschränkt, so ist diese Folge konvergent gegen eine reelle Zahl. Ist (yn )n∈N unbeschränkt, so konvergiert sie gegen +∞ (−∞). Analoge Aussagen gelten im Fall limn→∞ xn = −∞. Beweis. (i) Sei C eine untere Schranke von {yn : n ∈ N, n ≥ k}. Zu M > 0 wähle N so groß, dass xn > M − C für alle n ≥ N, so folgt für n ≥ max(N, k) xn + yn > (M − C) + C = M ; also (xn + yn ) → +∞. (ii) Folgt unmittelbar aus xn > M ⇔ −xn < −M. (iii) Wähle N so, dass xn > M C für n ≥ N und sodass N ≥ k. Dann folgt für n ≥ N auch xn yn > d.h. xn yn → +∞. (iv) Ist xn > M, so erst recht yn > M. M · C = M, C 3.7. KONVERGENZ GEGEN UNENDLICH 75 (v) Seien alle yn mit n ≥ k positiv. Wir nehmen zuerst an, dass y1n → 0. Zu vorgegebenem M wähle N ≥ k so groß, dass für n ≥ N gilt y1n < M1 . Es folgt yn > M. Gilt umgekehrt yn → +∞, und ist ǫ > 0, so wähle N so groß, dass für n ≥ N gilt yn > 1ǫ . Daraus folgt | y1n | = y1n < ǫ. (vi) Ist (yn )n∈N beschränkt, so folgt die Aussage aus Satz 3.4.2. Im Fall der Unbeschränktheit gibt es eben wegen dieser zu jedem M > 0 ein N ∈ N, sodass yN > M. Wegen der Monotonie folgt dann auch yn > M für alle n ≥ N ❑ 3.7.4 Beispiel. Sei q ∈ R und betrachte die Folge qn , n ∈ N. Dann gilt +∞ , falls q > 1 1 , falls q = 1 lim qn = 0 , falls −1 < q < 1 n→∞ ∄ , falls q ≤ −1 Dabei haben wir den Fall 0 ≤ q < 1 schon in Beispiel 3.2.9 behandelt. Der Fall q = 1 ist klar. Für q > 1 folgt aus 0 < 1q < 1 durch Anwendung von Satz 3.7.3, dass qn → +∞. Ist −1 < q < 0, so beachte |qn | = |q|n → 0. Ist q ≤ −1, so hat man qn ≥ 1 für n gerade und qn ≤ −1 für n ungerade. Insbesondere ist der Abstand zweier aufeinanderfolgender Folgenglieder ≥ 2, und wir sehen, dass qn keine Cauchy-Folge und erst recht keine konvergente Folge sein kann. Konvergenz gegen +∞ oder −∞ kann aber auch nicht stattfinden, denn dann müssten ja die Folgenglieder insbesondere ab einem Index alle das gleiche Vorzeichen haben. 3.7.5 Beispiel. Seien p, q aus R[x], p, q , 0, dh. zwei Polynome mit reellen Koeffizienten ungleich dem Nullpolynom. Betrachte die Folge xn := p(n) q(n) für alle n ∈ N mit q(n) , 0. Da Polynome nur endlich viele Nullstellen haben, ist xn sicher für alle n ∈ N, n ≥ n0 mit einem gewissen n0 ∈ N definiert. Schreiben wir p und q als p(x) = am xm + . . . + a0 und q(x) = bk xk + . . . + b0 mit am , bk , 0 an, so gilt gilt 0 , am bk , lim xn = +∞ , n→∞ −∞ , falls falls falls falls m<k m=k m > k, abmk > 0 m > k, abmk < 0 Um dieses einzusehen, betrachte zuerst den Fall, dass m ≤ k, und schreibe xn = am nm + am−1 nm−1 + . . . + a0 am nm−k + am−1 nm−1−k + . . . + a0 n−k = . bk nk + bk−1 nk−1 + . . . + b0 bk + bk−1 n−1 + . . . + b0 n−k Dann konvergiert der Nenner dieses Bruches gegen bk , 0. Ist m < k, so konvergiert der Zähler gegen 0, insgesamt also xn → 0. Ist m = k, so strebt der Zähler gegen am und wieder folgt unsere Behauptung. KAPITEL 3. DER GRENZWERT 76 R −∞ +∞ Abbildung 3.1: Veranschaulichung von R Ist m > k, so schreiben wir xn als nm−k am + am−1 n−1 + . . . + a0 n−m . bk + bk−1 n−1 + . . . + b0 n−k Also gilt xn = nm−k yn , wobei yn → abmk . Nach Lemma 3.3.1 hat yn für hinreichend große Indizes dasselbe Vorzeichen, wie abmk . Wegen x1n → 0 folgt aus Satz 3.7.3 das behauptete Konvergenzverhalten für xn . 3.7.6 Beispiel. Ist (xn )n∈N eine Folge aus R, die nicht nach oben beschränkt ist, es also kein reelles C > 0 gibt mit xn ≤ C für alle n ∈ N, so hat (xn )n∈N eine Teilfolge (xn(k) )k∈N , die limk→∞ xn(k) = +∞ erfüllt. Dazu wählt man n(1) ∈ N so, dass xn(1) ≥ 1, und definiert n(k + 1) ∈ N rekursiv so, dass n(k + 1) > n(k) und xn(k+1) ≥ k + 1. Aus Satz 3.7.3, (iv), folgt dann wegen xn(k) ≥ k, dass limk→∞ xn(k) = +∞. Am Ende diese Kapitels wollen wir eine Möglichkeit vorstellen, wie man die eingeführte Konvergenz gegen ±∞ als herkömmliche Konvergenz in einem metrischen Raum auffassen kann. Als erstes müssen wir ±∞ als Elemente unseres Raumes anerkennen, denn eine Folge von Elementen eines Raumes X kann gegen ein Element von X konvergieren aber nicht gegen irgendetwas. Betrachte also die Menge R = R ∪ {+∞, −∞}, wobei +∞ und −∞ zwei verschiedene formale Elemente sind, die nicht in R liegen. Nun versehen wir die Menge R in naheliegender Weise mit einer Relation: x ≤ y : ⇐⇒ (x ≤ y, x, y ∈ R) oder x = −∞ oder y = +∞ . Diese Relation ist offensichtlicherweise eine Totalordnung, die die Supremumseigenschaft hat. Somit lässt sich R folgendermaßen veranschaulichen. 3.7.7 Lemma. Die Funktion φ : R → (−1, 1), wobei φ(x) = y . Inverse φ−1 : (−1, 1) → R ist gegeben durch φ−1 (y) = 1−|y| x 1+|x| , bildet R bijektiv auf das offene Intervall (−1, 1) ab. Ihre Schließlich sind φ und ihre Inverse φ−1 streng monoton wachsend. Beweis. Als erstes wollen wir festhalten, dass für x ∈ R stets |φ(x)| < 1, d.h. φ(x) ∈ (−1, 1) gilt, und dass φ(x) das gleiche Vorzeichen wie x hat. y , so folgt Ist ψ : (−1, 1) → R definiert durch ψ(y) = 1−|y| φ ◦ ψ(y) = 1 und ψ ◦ φ(x) = 1 y 1−|y| |y| + 1−|y| = y = y, (1 − |y|) + |y| x 1+|x| |x| − 1+|x| = x = x. (1 + |x|) − |x| Somit ist nach Satz 1.2.18 die Abbildung φ bijektiv und ψ ist die Inverse von φ. Für die behaupteten Monotonieeigenschaft seien x1 , x2 ∈ R mit x1 = 0 oder x2 = 0 oder sgn(x1 ) = sgn(x2 ). Wegen x1 |x2 | = |x1 |x2 gilt dann x1 < x2 ⇔ x1 (1 + |x2 |) = x1 + x1 |x2 | < x2 + x2 |x1 | = x2 (1 + |x1 |) ⇔ φ(x1 ) < φ(x2 ). Da x und φ(x) dasselbe Vorzeichen haben, folgt für den verbleibenden Fall x1 , x2 , 0, sgn(x1 ) = − sgn(x2 ), wobei o.B.d.A. x1 < x2 , dass sowohl x1 < 0 < x2 als auch φ(x1 ) < 0 < φ(x2 ). ❑ 3.7. KONVERGENZ GEGEN UNENDLICH 77 +∞ φ R [−1, 1] φ−1 −∞ Abbildung 3.2: Die Abbildung φ Nun setzten wir φ fort zu einer Abbildung R → [−1, 1], indem wir φ(x) := x 1+|x| 1 −1 , falls , falls , falls x∈R x = +∞ x = −∞ definieren. Offensichtlicher ist diese Fortsetzung, die wir ebenfalls φ nennen wollen, auch bijektiv und streng monoton wachsend, wobei y , falls −1 < y < 1 1−|y| φ−1 (y) := +∞ , falls y=1 −∞ , falls y = −1 Wir definieren nun eine Metrik auf R, indem wir die euklidische Metrik mittels φ nach R übertragen. 3.7.8 Definition. Definiere eine Abbildung d : R × R → R als d(x, y) := φ(x) − φ(y) . 3.7.9 Lemma. Die Abbildung d ist eine Metrik. Dabei konvergiert eine Folge (xn )n∈N in R gegen ein x ∈ R bezüglich d genau dann, wenn die Folge (φ(xn ))n∈N in [−1, 1] gegen φ(x) ∈ [−1, 1] bezüglich der euklidischen Metrik d2 konvergiert. Beweis. Da die Abbildung (a, b) 7→ |a − b| eine Metrik und φ injektiv ist, verifizieren die verlangten Eigenschaften (M1)(M3) von d folgendermaßen. Setze a := φ(x), b := φ(y), dann gilt (M1): d(x, y) = |a − b| ≥ 0, und d(x, y) = 0 genau dann, wenn a = b. Da φ injektiv ist, ist dieses äquivalent dazu das x = y. (M2): d(x, y) := |a − b| = |b − a| = d(y, x) (M3): Sei zusätzlich z ∈ R und setze c := φ(z). Dann ist d(x, z) = |a − c| ≤ |a − b| + |b − c| = d(x, y) + d(y, z) . Die Aussage über die Konvergenz folgt leicht aus Bemerkung 3.2.3, da xn → x (bzgl. d) ⇔ d(xn , x) = d2 (φ(xn ) → 0 ⇔ φ(xn ) → φ(x) (bzgl. d2 ). ❑ Wir wissen jetzt also, was es bedeutet, dass eine Folge reeller Zahlen in hR, di gegen +∞ bzw. −∞ konvergiert. Haben wir unser Modell nun richtig in dem Sinne gebaut, dass dieser Begriff von Konvergenz gegen ±∞ tatsächlich mit dem eingangs eingeführten Begriff von Konvergenz gegen ±∞ übereinstimmt? 3.7.10 Proposition. Sei (xn )n∈N eine Folge reeller Zahlen. Dann gilt limn→∞ xn = +∞ im Sinne einer Konvergenz im metrischen Raum hR, di genau dann, wenn (3.11) gilt. Analog gilt limn→∞ xn = −∞ in hR, di genau dann, wenn (3.12) gilt. Bleibt die Folge weg von ±∞, so bleibt unser alter Konvergenzbegriff reeller Zahlen erhalten: Sei x ∈ R, dann gilt limn→∞ xn = x in hR, di genau dann, wenn limn→∞ xn = x in R bezüglich der euklidischen Metrik d2 . KAPITEL 3. DER GRENZWERT 78 Beweis. Angenommen xn → +∞ in hR, di. Zu gegebenen M > 0 gegeben setze ǫ := 1 − φ(M) > 0, und wähle N ∈ N mit d(xn , +∞) < ǫ, n ≥ N. Dann folgt 1 − φ(xn ) = |φ(xn ) − 1| = d(xn , +∞) < ǫ = 1 − φ(M) , und daher φ(M) < φ(xn ), also xn > M. Gelte umgekehrt (3.11), und sei 0 < ǫ < 1 gegeben. Setze M := φ−1 (1 − ǫ) > 0, und wähle N ∈ N so, dass xn > M für n ≥ N. Dann folgt d(xn , +∞) = |φ(xn ) − 1| = 1 − φ(xn ) < 1 − φ(M) = ǫ, n ≥ N . Wir sehen, dass xn → +∞ in hR, di äquivalent zu (3.11) ist. Die Behauptung für xn → −∞ sieht man genauso. Sei nun x ∈ R, und xn → x in R bezüglich d2 . Dann folgt, wegen unserer Rechenregeln für Folgen, Satz 3.3.5, dass auch φ(xn ) → φ(x). Wegen Lemma 3.7.9 erhalten wir xn → x in hR, di. Gelte nun xn → x in hR, di, d.h. φ(xn ) → φ(x) in R (Lemma 3.7.9). Die Abbildung φ−1 ist von der gleichen Gestalt wie φ, und wir schließen wieder wegen unserer Rechenregeln für Folgen, dass xn = φ−1 (φ(xn )) → φ−1 (φ(x)) = x in R bezüglich d2 . ❑ Wir haben nun unser Zahlensystem etwas erweitert, um den Begriff des Strebens gegen unendlich“ als Konvergenz in ” metrischen Räumen interpretieren zu können. Wir haben dabei jedoch auch sehr viel verloren, nämlich unsere algebraischen Operationen + und ·. Gemäß Satz 3.7.3 macht es zwar Sinn x + (+∞) = +∞, −(+∞) = −∞, y(+∞) = +∞, 1 = 0, usw. ±∞ für x, y ∈ R, y > 0 zu setzen, damit die Operationen mit den Grenzwertregeln verträglich bleiben. Aber wie sollte man z.B. +∞ + (−∞) oder 0 · (+∞) definieren? Als einfachstes Beispiel betrachte man xn = 2n, yn = n. Es gilt xn , yn → +∞. Es gilt aber xn − yn = n → +∞, was auf (+∞) − (+∞) = +∞“ deuten würde, wogegen yn − xn = −n → −∞, also (+∞) − (+∞) = −∞“. ” ” 3.8 Unendliche Reihen Wir sind schon einmal einer Folge (S n )n∈N begegnet, die von der speziellen Gestalt P S n = nk=0 ak mit gewissen Zahlen ak war. In Beispiel 3.2.9 haben wir nämlich die Folge S n = 1 + z + . . . + zn mit |z| < 1 betrachtet. Dort haben wir gezeigt, dass diese 1 konvergiert. Das heißt also, dass für große Werte von Folge gegen den Grenzwert 1−z Pn k 1 n die Summe k=0 z den Wert 1−z beliebig gut approximiert. Es ist also naheliegend zu schreiben ∞ X 1 = zk . 1 − z k=0 3.8.1 Definition. Sei (ak )k∈N eine Folge reeller oder komplexer Zahlen13 . Bezeichne mit S n , n ∈ N die n-te Partialsumme S n := a1 + a2 + . . . + an . Die Folge (S n )n∈N nennen wir auch die Reihe mit den Summanden ak . Hat die Folge (S n )n∈N einen Grenzwert, so sagen wir die Reihe sei konvergent. In diesem Fall nennen wir ihren Grenzwert lim S n die Summe der Reihe und benützen n→∞ die Schreibweise ∞ X ak := lim S n . k=1 n→∞ Falls der Grenzwert lim S n nicht existiert, so heißt die Reihe divergent. n→∞ 13 Allgemeiner kann (a ) k k∈N auch eine Folge von Elementen eines metrischen Raumes sein, auf dem man eine Verknüpfung + hat; zum Beispiel im R p . 3.8. UNENDLICHE REIHEN 79 Sind die ak alle reell und, gilt lim S n = +∞ bzw. lim S n = −∞ im Sinne von n→∞ n→∞ Definition 3.7.1, so heißt die Reihe konvergent gegen +∞ bzw. −∞ und schreibt ∞ X ak = +∞ bzw. k=1 ∞ X k=1 ak = −∞. Man nennt die Reihe dann auch bestimmt divergent gegen +∞ bzw. −∞. Um die Notation zu vereinfachen, benützt man die Schreibweise ∞ P Reihe (S n )n∈N selbst, und sagt dann ∞ P Ausdrücke, wie etwa ∞ P ak auch für die k=1 ak sei konvergent oder divergent. k=1 ak haben eine sinngemäß analoge Interpretation durch k=6 Grenzwerte von Partialsummen. 3.8.2 Bemerkung. Eine unendliche Reihe ist per definitionem die Folge ihrer Partialsummen, d.h. die Theorie der Reihen ist ein Spezialfall jener der Folgen. Umgekehrt kann man auch jede Folge reeller oder komplexer Zahlen als Folge der Partialsummen einer Reihe auffassen: Ist (cn )n∈N irgendeine Folge, so setze a1 := c1 , a2 := c2 − c1 , a3 := c3 − c2 , . . . , ak := ck − ck−1 , . . . . Dann gilt cn = n P ak . k=1 Auf Grund der Definition einer unendlichen Reihe als Limes ihrer Partialsummen können wir Aussagen über Folgen sofort auf Reihen übertragen. 3.8.3 Korollar. Sind ∞ P ak , und k=1 Es gilt ∞ P bk konvergent, so ist auch k=1 k=1 Ist P∞ (ak + bk ) konvergent. k=1 ∞ ∞ ∞ X X X (ak + bk ) = ak + bk . P∞ ∞ P k=1 k=1 und λ eine feste (reelle oder komplexe) Zahl, so sind auch k=1 ak konvergent P∞ ā und (λa ) konvergent. Weiters gilt k k k=1 k=1 ∞ X āk = ∞ X k=1 k=1 ak , ∞ ∞ X X (λak ) = λ · ak . k=1 k=1 Beweis. Für die entsprechenden Partialsummen S n = n P n P k=1 (ak + bk ) gilt S n + T n = Un . k=1 Weiters gilt für Vn = n P (λak ) und Wn = k=1 n P ak , T n = n P bk und Un = k=1 āk sicher Vn = λS n und Wn = S̄ n . Also k=1 folgen auch diese Rechenregeln aus den entsprechenden Regeln für Folgen. ❑ Beim letzten Beweis haben wir die Rechengesetze wie Kommutativität, Distributivität u.ä. für endliche Summen benützt. Das Verhalten dieser Rechenregeln bei unendlichen Reihen ist wesentlich komplizierter, vgl. u.a. Beispiel 5.4.1. 3.8.4 Fakta. KAPITEL 3. DER GRENZWERT 80 1. Man beachte, dass man endlich viele Reihenglieder beliebig abändern kann, ohne das Konvergenzverhalten zu stören. Das gilt deshalb, weil sich dabei die neue Folge der Partialsummen ab einem gewissen Index von der alten nur um eine additive Konstante unterscheidet. Natürlich verändert sich dabei die Summe der Reihe. P P∞ Ähnlich konvergiert für ein k ∈ Z \ {0} mit ∞ n=1 an auch die Reihe n=1 an+k , wobei man im Falle k < 0 die Summanden ak+1 , . . . , a−1 , a0 alle Null setzt. In PN PN+k P der Tat gilt für k > 0 immer n=1 an+k = n=1 an − kn=1 an und damit für N → ∞, dass mit der rechten Seite auch die linke konvergiert. Für k < 0 gilt PN PN+k n=1 an für alle N ∈ N, N > −k. n=1 an+k = P 2. Hat man eine konvergente Reihe ∞j=1 a j gegeben, so dürfen beliebig Klammern gesetzt werden, ohne das Konvergenzverhalten der Reihe zu verändern. Exakt formuliert bedeutet das, dass für jede streng monoton wachsende Folge (k(n))n∈N natürlicher Zahlen ∞ ∞ X X aj = An , j=1 n=1 gilt, wobei A1 = a1 + · · · + ak(1) und An = ak(n−1)+1 + · · · + ak(n) für n ≥ 2. Dieser Sachverhalt folgt aus der einfachen Beobachtung, dass die Folge der ParP tialsummen unserer neuen Reihe ∞ A genau die Teilfolge (S k(n) )n∈N der Folge P∞n=1 n (S k )k∈N der Partialsummen von j=1 a j ist; vgl. Satz 3.2.8, (iv). P Die Umkehrung gilt hier nicht. Es kann nämlich vorkommen, dass ∞ n=1 An konP∞ vergiert, aber k=1 ak nicht. Man betrachte nur die Reihe 1 − 1 + 1 − 1 + . . . und klammere immer zwei aufeinanderfolgende Summanden ein. 3. Sind ∞ P k=1 ak und ∞ P bk zwei konvergente Reihen mit reellen Summanden, sodass k=1 ak ≤ bk für alle k ∈ N, so gilt für die Partialsummen klarerweise auch n P k=1 n P k=1 ak ≤ bk für alle n ∈ N. Aus Lemma 3.3.1 erhalten wir dann für die Grenzwerte dieser zwei Folgen von Partialsummen ∞ X k=1 ak ≤ ∞ X bk . k=1 Ist nun zusätzlich sogar al < bl für zumindest ein l ∈ N, so folgt al + δ ≤ bl für n n P P ein hinreichend kleines δ > 0. Somit gilt für n ≥ l, dass δ + ak ≤ bk . Für k=1 n → ∞ folgt wieder aus Lemma 3.3.1, dass ∞ X ak < δ + k=1 ∞ X k=1 ak ≤ ∞ X bk . k=1 3.8.5 Beispiel. Betrachte die Reihe ∞ P k=1 S n := 1 k(k+1) . n X k=1 Wegen 1 k(k+1) = 1 k − 1 k+1 gilt ! n X 1 1 1 1 =1− = − . k(k + 1) k=1 k k + 1 n+1 k=1 3.8. UNENDLICHE REIHEN Die Reihe ∞ P k=1 1 k(k+1) 81 konvergiert also gegen lim S n = 1. Reihen, deren Grenzwert n→∞ sich derartig berechnen lässt, nennt man auch Teleskopreihen. Lässt man die ersten drei Terme weg, d.h. ersetzt sie durch 0, so gilt für die entsprechenden Partialsummen S n′ stets (n ≥ 3) ! 3 1 1 1 1 1 − → . S n′ = S n − − − = 1− 1·2 2·3 3·4 n+1 4 4 Somit ist die Reihe ∞ P 1 k(k+1) k=4 ebenfalls konvergent. Ihre Summe ist Fasst man immer zwei Summanden der Reihe die Reihe ∞ P k=1 ∞ P k=1 2 (2k−1)(2k+1) , 1 k(k+1) 1 4 . zusammen, so erhält man welche nach Fakta 3.8.4, 2, ebenfalls die Summe 1 hat. 3.8.6 Bemerkung. Aus dem entsprechenden Resultat für Folgen erhält man, dass eiP ne Reihe ∞ bestehend aus komplexen Zahlen genau dann konvergiert, wenn die n=1 z Pn P∞ reellen Reihen ∞ n=1 Re zn und n=1 Im zn beide konvergieren. In diesem Fall gilt ∞ X zn = ( n=1 ∞ X Re zn ) + i( n=1 ∞ X Im zn ). n=1 Folgendes Resultat liefert uns eine einfache notwendige Bedingung für die Konvergenz einer Reihe. Wie wir in Beispiel 3.8.9 sehen werden, ist diese notwendige Bedingung bei weitem nicht hinreichend. 3.8.7 Proposition. Ist ∞ P ak konvergent, so folgt limk→∞ ak = 0. k=1 Beweis. Betrachte die Reihe ∞ P k=1 bk , wobei b1 = 0 und bk+1 = ak für k ∈ N. Sind (S n )n∈N und (T n )n∈N die Folgen der Partialsummen von ∞ P ak bzw. S n − Tn = k=1 ak − n X bk , so folgt k=1 k=1 n X ∞ P ak−1 = an . k=2 Wegen T n+1 = S n folgt aus Satz 3.2.8, dass (T n )n∈N gegen den gleichen Grenzwert, wie (S n )n∈N konvergiert. Somit erhalten wir S n − T n = an → 0. ❑ 3.8.8 Lemma. Sei R, ak ≥ 0. ∞ P k=1 ak eine Reihe mit reellen nichtnegativen Summanden, d.h. ak ∈ (i) Die Reihe ist genau dann konvergent, wenn die Folge (S n )n∈N der Partialsummen n ∞ P P beschränkt ist. In diesem Fall ist auch ak ≤ ak für alle n ∈ N. Anderenfalls k=1 ist sie bestimmt gegen +∞ divergent. k=1 KAPITEL 3. DER GRENZWERT 82 (ii) Ist ∞ P k=1 bk eine divergente Reihe nichtnegativer reeller Zahlen mit ak ≥ bk , k ∈ N, so ist auch ∞ P ak divergent (Minorantenkriterium). k=1 (iii) Ist ∞ P k=1 bk eine konvergente Reihe nichtnegativer reeller Zahlen mit ak ≤ bk , k ∈ N, so ist auch ∞ P ak konvergent (Majorantenkriterium), und ∞ P k=1 k=1 ak ≤ ∞ P bk . k=1 Beweis. Wegen der Voraussetzung ak ≥ 0 ist (S n )n∈N monoton wachsend. Somit folgt (i) aus Satz 3.7.3, (vi). Die behauptete Ungleichung gilt, da im Falle der Konvergenz der monoton wachsenden Folge (S n )n∈N der Grenzwert gemäß Satz 3.4.2 nichts anderes als sup{S n : n ∈ N} ist. ∞ P bk , so ist auch Ist nun bk ≥ 0 und (T n )n∈N der Folge Partialsummen der Reihe k=1 diese monoton wachsend. Ist diese divergent, und ak ≥ bk , so gilt sicherlich S n ≥ T n . Also kann die Folge (S n )n∈N nicht beschränkt sein. ∞ P Ist dagegen bk konvergent, und ak ≤ bk , so ist S n ≤ T n , und mit (T n )n∈N ist auch k=1 die Folge (S n )n∈N ist nach oben beschränkt. Die behauptete Ungleichung folgt aus Fakta 3.8.4, 3. ❑ 3.8.9 Beispiel. Betrachte die harmonische Reihe ∞ X 1 k=1 k . Diese Reihe ist nicht konvergent. Genauer gesagt ist sie bestimmt divergent gegen +∞. Betrachtet man nämlich die Partialsummen S n = 1 + 21 + · · · + n1 , so ist diese monoton wachsend. Für die Existenz des Limes ist es also notwendig und hinreichend, dass diese Folge beschränkt ist; vgl. Lemma 3.8.8, i. Somit wäre auch jede Teilfolge beschränkt. Nun gilt jedoch S 2l = 1 + 1+ 1 1 1 1 1 1 1 1 1 + + + + + + + +...+ l ≥ 2 3 4 5 6 7 8 9 2 1 1 1 1 1 1 1 1 1 1 + + + + + + + +...+ l = 1+l · , 2 | 4 {z4} | 8 8 {z8 8} 16 2 2 = 21 = 12 Insbesondere ist die Teilfolge (S 2l )l∈N nicht beschränkt. 3.8.10 Beispiel. Durch Vergleich mit der harmonischen Reihe ist nach dem Minoran∞ P 1 14 tenkriterium die Reihe kα für α < 1 divergent . k=1 14 Bemerke, dass wir kα erst für rationales α definiert haben. 3.9. KONVERGENZKRITERIEN 83 3.8.11 Lemma (Cauchysches Konvergenzkriterium). Die Reihe ∞ P ak mit reellen oder k=1 komplexen Summanden ist genau dann konvergent, wenn gilt n X ak < ǫ, n > m ≥ N. ∀ǫ > 0 ∃N ∈ N : k=m+1 (3.13) Beweis. Da R und C vollständig metrische Räume sind, ist die Konvergenz der n P Folge der Partialsummen S n = ak mit der Tatsache gleichbedeutend, dass (S n )n∈N k=1 P eine Cauchy-Folge ist. Wegen S n −S m = nk=m+1 ak ist das aber zu (3.13) äquivalent. ❑ Wir werden später weitere Konvergenzkriterien kennenlernen. Diesen Abschnitt beenden wir mit einer weiteren ganz wichtigen Begriffsbildung. 3.8.12 Definition. Sei (ak )k∈N eine Folge reeller oder komplexer Zahlen. Die Reihe P∞ P∞ k=1 ak heißt absolut konvergent, wenn die Reihe der Beträge k=1 |ak | konvergiert. 3.8.13 Lemma. Jede absolut konvergente Reihe ist auch konvergent. Beweis. Laut Voraussetzung und P gemäß Lemma 3.8.11 gibt es zu jedem ǫ > 0 ein P N ∈ N, sodass nk=m+1 |ak | = nk=m+1 |ak | < ǫ für alle n > m ≥ N. Daraus und der Dreiecksungleichung erhält man n n X X ak ≤ | ak |< ǫ . k=m+1 k=m+1 Wieder wegen Lemma 3.8.11 konvergiert damit die Reihe. ❑ Die Umkehrung von Lemma 3.8.13 gilt im Allgemeinen nicht. P k+1 1 3.8.14 Beispiel. Die alternierende harmonische Reihe ∞ k=1 (−1) k ist konvergent, wie man aus dem Leibnizschen Konvergenzkriterium, Korollar 3.9.7, weiter unten erP 1 kennt. Die Reihe der Beträge ∞ k=1 k ist gemäß Beispiel 3.8.9 aber divergent. 3.9 Konvergenzkriterien Wir wollen das Majorantenkriterium ausnützen, um durch Vergleich mit der geometrischen Reihe zwei oft einsetzbare hinreichende Bedingungen für die absolute Konvergenz einer Reihe herzuleiten. 3.9.1 Satz (Wurzelkriterium). Sei ∞ P an eine Reihe mit reellen oder komplexen Sum- n=1 manden. Gibt es eine feste Zahl q ∈ [0, 1) und ein N ∈ N, sodass pn |an | ≤ q für alle n ≥ N , (3.14) √ oder gilt die äquivalente Bedingung, dass ( n |an |)n∈N beschränkt ist mit ∞ √ P lim supn→∞ n |an | < 1, so ist die Reihe an absolut konvergent. n=1 KAPITEL 3. DER GRENZWERT 84 p Gibt es dagegen eine Teilfolge (an(k) )k∈N mit n(k) |an(k) | ≥ 1, k ∈ N, so ist die Rei∞ √ P he an divergent. Diese Teilfolgenbedingung ist sicher dann erfüllt, wenn ( n |an |)n∈N n=1 √ nach oben nicht beschränkt ist oder wenn lim supn→∞ n |an | > 1. √ Beweis. Dass (3.14) zur Beschränktheit von ( n |an |)n∈N samt der Bedingung √n lim supn→∞ |an | < 1 äquivalent ist, folgt unmittelbar aus Fakta 3.4.5, 5. ∞ √ P Aus n |an | ≤ q folgt |an | ≤ qn für alle n ≥ N. Da die Reihe qn konvergiert, ∞ P zeigt das Majorantenkriterium aus Lemma 3.8.8, dass auch n=N n=N |an |, und damit ∞ P n=1 |an | konvergiert. √ Ist ( n |an |)n∈N nach oben p nicht beschränkt, so haben√wir in Beispiel 3.7.6 eine Teilfolge konstruiert, die n(k) |an(k) | ≥ k, k ∈ N, erfüllt. Ist ( n |an |)n∈N nach oben beschränkt √ und gilt lim supn→∞ n |an | > 1, so folgt aus Fakta 3.4.5, p √ 6, und Lemma 3.3.1, (i), dass n(k) |an(k) | > 1, k ∈ N, für eine gewisse Teilfolge von ( n |an |)n∈N . p Gibt es eine Teilfolge (an(k) )k∈N mit n(k) |an(k) | ≥ 1, so folgt |an(k) | ≥ 1. Also kann (|an(k) |)k∈N keine und damit auch (an )n∈N keine Nullfolge sein. Wegen Proposition 3.8.7 ∞ P ist an divergent. n=1 ❑ 3.9.2 Beispiel. (i) Betrachte die Reihe P∞ 1 n=1 (3+(−1)n )n . s n Die Folge der n-ten Wurzeln 1 1 = (3 + (−1)n )n (3 + (−1)n) hat zwar keinen Grenzwert, aber ihre Glieder sind alle ≤ 12 . Somit kann man auch Satz 3.9.1 anwenden. Der Grenzwert der Reihe lässt sich mit Hilfe der hergeleiteten Regeln für Reihen berechnen: ∞ X n=1 ! X ∞ ∞ ∞ X X 1 1 1 1 1 = + + = = n n 2k−1 2k 2k−1 (3 + (−1) ) 2 4 2 42k k=1 k=1 k=1 ∞ ∞ X 1 1 X 1 2 + = 2 k k 4 16 1− k=1 k=1 1 4 − 1 + (ii) Wie wir in Beispiel 3.9.8 sehen werden ist die Reihe 1 − 1 . 1 1 − 16 ∞ P n=1 1 nα für rationales α > 1 absolut konvergent. Das Wurzelkriterium können wir wegen (vgl. Satz 3.3.5 und Beispiel 3.3.7) pn √ lim sup |n−α | = lim ( n n)−α = 1 | {z } n→∞ n→∞ <1 weder dazu verwenden, um auf absolute Konvergenz noch auf Divergenz zu schließen. 3.9. KONVERGENZKRITERIEN 3.9.3 Satz (Quotientenkriterium). Sei 85 ∞ P an eine Reihe mit reellen oder komplexen n=1 Summanden. Gibt es eine feste Zahl q ∈ [0, 1) und ein N ∈ N, sodass15 |an+1 | ≤ q für alle n ≥ N , |an | (3.15) | oder gilt die äquivalente Bedingung, dass ( |a|an+1 )n∈Z≥N für ein gewissen N ∈ N ben| ∞ P |an+1 | an absolut konvergent. schränkt ist mit lim supn→∞ |an | < 1, so ist die Reihe n=1 Gibt es dagegen einen Index N ∈ N, sodass an , 0 und ∞ P die Reihe an divergent. |an+1 | |an | ≥ 1 für n ≥ N, so ist n=1 | )n∈Z≥N samt der Bedingung Beweis. Dass (3.15) zur Beschränktheit von ( |a|an+1 n| |an+1 | lim supn→∞ |an | < 1 äquivalent ist, folgt unmittelbar aus Fakta 3.4.5, 5. Unter dieser Voraussetzung gilt |an+1 | ≤ q|an| für alle n ≥ N. Durch vollständige Induktion erhalten wir |aN | |an | ≤ qn N für alle n ≥ N , q q √n woraus |an | ≤ q · n |aqNN | für n ≥ N folgt. Da der zweite Faktor mit n → ∞ gegen 1 √ ′ ′ strebt, gilt wegen Lemma 3.3.1, (i), dass n |an | < 1+q 2 für alle n ≥ N mit einem N ≥ N. Also können wir das Wurzelkriterium anwenden und erhalten die absolute Konvergenz. | ≥ 1 für n ≥ N folgt |an+1 | ≥ |an | ≥ · · · ≥ |aN | > 0. Also kann (an )n∈N keine Aus |a|an+1 n| Nullfolge sein. ❑ 3.9.4 Beispiel. P zn (i) Betrachte die Reihe ∞ n=0 n! , wobei n! := 1 · 2 · 3 · . . . · n die Zahl n-faktorielle bezeichnet und z ∈ C beliebig ist. Diese Reihe ist konvergent, denn es gilt n+1 z 1· 2· ...·n |z| = (n+1)! |z| = → 0. zn 1 · 2 · . . . · n · (n + 1) n +1 n! Insbesondere ist auch der Limes Superior der linken Seite gleich Null und damit kleiner 1. (ii) Bezeichne mit τ(n) die Anzahl der Teiler der natürlichen Zahl n. Wir betrachten P n die Reihe ∞ n=1 τ(n)x wobei x > 0 ist. Wegen τ(n) ≤ n gilt pn pn √ τ(n)xn = x · τ(n) ≤ x · n n → x . Ist also x < 1, so ist die Reihe konvergent. Für x ≥ 1 ist sie sicher divergent, denn dann bilden die Summanden keine Nullfolge. Im Beweis von Satz 3.9.3 haben wir das Wurzelkriterium verwendet, um das Quotientenkriterium herzuleiten. Also ist ersteres stärker, wenn auch nicht immer am 15 Dies beinhaltet die Bedingung an , 0 für n ≥ N. KAPITEL 3. DER GRENZWERT 86 praktiabelsten. Das eben betrachtete Beispiel – genauso wie Beispiel 3.9.2 – ist gerade eines, wo uns das Wurzelkriterium zum Ziel führt, das Quotientenkriterium aber versagen würde. Denn ist n > 2 eine Primzahl, so gilt τ(n) = 2. Weiters ist n sicher ungerade, und damit kann n + 1 keine Primzahl sein. Also gilt τ(n + 1) ≥ 3. Wir erhalten damit τ(n + 1)xn+1 3 ≥ · x. τ(n)xn 2 Für x ≥ 32 ist daher der Quotient ≥ 1. Da es unendlich viele Primzahlen gibt, können wir somit das Quotientenkriterium nicht anwenden. Die nächsten Kriterien basieren auf folgendem, auch später verwendeten Lemma. 3.9.5 Lemma. Seien a1 , . . . , am und b1 , . . . , bm komplexe oder reelle Zahlen, so gilt m X n=1 an bn = am βm − wobei die βn die Partialsummen n P m−1 X (an+1 − an )βn , n=1 b j = βn bezeichnen. j=1 Beweis. m−1 X n=1 m X n=2 (an+1 − an )βn = an βn−1 − m−1 X n=1 m−1 X n=1 an+1 βn − an βn = am βm−1 − am βm − am bm − m−1 X n=2 m−1 X n=2 m−1 X an βn = n=1 an (βn − βn−1 ) − a1 β1 = an bn − a1 b1 = am βm − m X an bn . n=1 ❑ 3.9.6 Satz (Dirichletsches16 Kriterium). Sei (an )n∈N eine monotone Nullfolge reeller Zahlen und sei (bn )n∈N eine Folge reeller oder komplexer Zahlen. Gilt für eine Zahl C>0 N X bn ≤ C, N ∈ N, n=1 so ist die Reihe ∞ P an bn konvergent. n=1 Beweis. Sei N so groß, dass |an | < ǫ für n ≥ N. Dann folgt für m > k ≥ N aus Lemma 3.9.5 und der Dreiecksungleichung m m m−1 n X X X X |an+1 − an | an bn ≤ am bi + bi . n=k+1 n=k+1 i=k+1 i=k+1 16 Johann Peter Gustav Lejeune Dirichlet. 13.2.1805 Düren (bei Aachen) - 5.5.1859 Göttingen 3.9. KONVERGENZKRITERIEN 87 P P P Wegen | ni=k+1 bi | ≤ | ki=1 bi | + | ni=1 bi | ≤ 2C schätzen wir diesen Ausdruck weiter nach oben durch m−1 X 2C|am | + 2C |an+1 − an | n=k+1 ab. Voraussetzungsgemäß haben die Ausdrücke der Form (an+1 − an ) niemals verschiedenes Vorzeichen. Also gilt m−1 m−1 X X 2C |am | + |an+1 − an | = 2C |am | + (an+1 − an ) ≤ n=k+1 n=k+1 2C (|am | + |am | + |ak+1 |) ≤ 2C · 3ǫ. Nach dem Cauchyschen Kriterium, Lemma 3.8.11, ist die Reihe ∞ P an bn konvergent. n=1 3.9.7 Korollar (Leibniz17Kriterium). Sei ∞ P ❑ (−1)n an eine alternierende Reihe, d.h. an ∈ n=1 R, an ≥ 0, n ∈ N. Ist (ak )k∈N monoton fallend und gilt lim an = 0, so konvergiert n→∞ ∞ P n (−1) an . n=1 Beweis. Setze im Dirichletschen Kriterium bn = (−1)n . ❑ 3.9.8 Beispiel. Für α > 1 ist die Reihe ∞ P k=1 1 kα konvergent18. m+1 Wegen m+1 m → 1 kann man m ∈ N so wählen, dass m ≤ α. Nach dem Majorantenkriterium genügt es, die Behauptung für den Exponenten m+1 m zu zeigen. ∞ P Betrachte die nach dem Leibnizschen Kriterium konvergente Reihe (−1)k+1 11 . k=1 km Fassen wir immer je zwei Summanden zusammen, so konvergiert nach Fakta 3.8.4, 2, auch die Reihe ! ∞ X 1 1 . − 1 1 m (2k) m k=1 (2k − 1) Nun ist 1 (2k − 1) 1 m − (2k) 1 1 1 1 m = (2k) m − (2k − 1) m 1 m (2k − 1) (2k) (2k) − (2k − 1) 1 m 1 = 1 1 (2k − 1) m (2k) m · ≥ 1 1 m−2 m−1 (2k − 1) m + . . . + (2k) m (2k − 1) m + (2k − 1) m 1 1 1 = · m+1 ≥ m−1 2 m+1 (2k) m m(2k) m m2 m k m ∞ P 1 Nach dem Majorantenkriterium folgt somit, dass auch die Reihe m+1 konvergiert. · (2k) m−1 m + (2k) m−2 m k=1 k 3.9.9 Korollar (Abelsches19 Kriterium). Sei die reell- oder komplexwertige Reihe monotone und beschränkte Folge aus R. Dann ist die Reihe ∞ P ∞ P bn konvergent, und sei (an )n∈N eine n=1 an bn konvergent. n=1 17 Gottfried Wilhelm Leibniz. 1.7.1646 Leipzig - 14.11.1716 Hannover dass wir kα erst für rationales α definiert haben. 19 Niels Henrik Abel. 5.8.1802 Finnö (Norwegen) - 6.4.1829 Froland (Norwegen) 18 Bemerke, m KAPITEL 3. DER GRENZWERT 88 Beweis. Gemäß Satz 3.4.2 konvergiert die Folge (an )n∈N gegen ein a. Für N → ∞ existiert in N X an bn = n=1 N X n=1 (an − a)bn + a N X bn n=1 für jeden der beiden Summanden auf derPrechten Seite der Grenzwert, denn die Reihe Dirichletschen Kriterium und die Reihe ∞ n=1 bn nach Voraussetzung. P∞ n=1 (an − a)bn konvergiert nach dem ❑ 3.9.10 Satz (Kriterium von Raabe20 ). Sei (an )n∈N eine Folge reeller oder komplexer Zahlen. Gibt es eine Zahl β > 1, sodass ab einem Index k0 alle ak , 0 sind, und |ak+1 | β ≤ 1 − , k ≥ k0 , |ak | k so ist die Reihe ∞ P ak absolut konvergent. k=1 Ist ab einem gewissen Index k0 jedoch konvergent. |ak+1 | |ak | ≥ 1− 1 k, so ist sie nicht absolut konvergent, also höchstens bedingt Beweis. Für k ≥ k0 gilt wegen unserer Voraussetzung k|ak+1 | ≤ k|ak | − β|ak | und daher (β − 1)|ak | ≤ (k − 1)|ak | − k|ak+1 |. (3.16) Wegen β > 1 ist (k−1)|ak | > k|ak+1 | > 0. Somit ist die Folge ((k−1)|ak |)k∈Z≥2 monoton und beschränkt, und daher konvergent. Daraus ergibt sich die Konvergenz der Folge (in k) k X n=2 ((n − 1)|an | − n|an+1 |) = |a2 | − k|ak+1 | P von Partialsummen. Wegen (3.16) konvergiert die Reihe ∞ n=1 |an |. |ak+1 | 1 Gilt nun |a | ≥ 1 − k für k ≥ k0 (> 1), so folgt k|ak+1 | ≥ (k − 1)|ak | ≥ (k0 − 1)|ak0 | := α > 0. Also ist |ak+1 | ≥ k P nach dem Minorantenkriterium kann ∞ n=1 |an | nicht konvergieren. α k, und ❑ Wir wollen noch anmerken, dass man die Konvergenz von ( n1α )n∈N für α ∈ N, n ≥ 2, mit dem Kriterium von Raabe und der Bernouillsche Ungleichung zeigen kann. 20 Josef Ludwig Raabe. 1801 - 1859 Kapitel 4 Die Konstruktion der reellen Zahlen Wir wollen in diesem Kapitel die am Anfang verschobene Konstruktion der reellen Zahlen nachholen und zeigen, dass diese eindeutig dadurch charakterisiert sind, dass R ein vollständig angeordneter Körper ist. 4.1 Existenz 4.1.1 Bemerkung. Hat man die reellen Zahlen als vollständig angeordneten Körper zur Verfügung – was ja noch nicht der Fall ist, so wissen wir aus Beispiel 3.3.4, dass sich jedes x ∈ R als Grenzwert einer Folge bestehend aus rationalen Zahlen darstellen lässt. Diese Folgen sind gemäß Proposition 3.5.4 auch Cauchy-Folgen. Da R ein vollständig metrischer Raum ist, konvergiert andererseits jede CauchyFolge bestehend aus rationalen Zahlen gegen ein x ∈ R. Dabei konvergieren offenbar zwei solche Folgen genau dann gegen dieselbe reelle Zahl, wenn die Differenzenfolge eine Nullfolge ist. Die Überlegung in Bemerkung 4.1.1 legt es nahe, einen vollständig angeordneten Körper mit Hilfe von rationalen Cauchy-Folgen zu konstruieren, wobei zwei solche Folgen zu identifizieren sind, wenn ihre Differenzenfolge eine Nullfolge ist. Ein Problem dabei ist, dass wir die Begriffe Cauchy-Folge bzw. konvergente Folge in Definition 3.5.1 bzw. Definition 3.2.2 mit Hilfe der reellen Zahlen definiert haben, da in (3.8) bzw. (3.3) die ǫ > 0 aus den reellen Zahlen sind. Wie wir Bemerkung 3.5.2 gesehen haben, können wir diese ǫ > 0 auch aus Q wählen, und erhalten den selben Begriff von Cauchy-Folge bzw. von konvergenter Folge. Eine weitere Obstruktion ist, die Tatsache, dass wir Konvergenztheorie immer von Folgen in metrischen Räumen betrieben haben. Die Metrik hat definitionsgemäß aber Werte in R. Diesem Problem können wir dadurch begegnen, dass wir den Begriff des metrischen Raumes hX, di leicht dadurch verändern, dass wir annehmen, dass d nur Werte in Q hat; siehe Definition 3.1.1 und Bemerkung 3.1.2. Ein solcher metrischer Raum ist klarerweise hQ, di, wobei d(x, y) = |x − y|. Eine Folge (xn )n∈N in einem solchen metrischen Raum X heißt dann konvergent 89 KAPITEL 4. DIE KONSTRUKTION DER REELLEN ZAHLEN 90 gegen x ∈ X, wenn ∀ǫ ∈ Q, ǫ > 0 ∃N ∈ N : d(xn , x) < ǫ für alle n ≥ N , und sie heißt Cauchy-Folge, wenn ∀ǫ ∈ Q, ǫ > 0 ∃N ∈ N : d(xn , xm ) < ǫ für alle m, n ≥ N . Fasst man eine Q-wertige Metrik wieder als R-wertig auf, so wissen wir aus Bemerkung 3.5.2, dass diese Konvergenzbegriffe mit den schon bekannten übereinstimmen. Die Konstruktion eines vollständig angeordneten Körpers erfolgt nun in einigen Schritten. (i) Sei X die Menge aller rationalen Cauchy-Folgen, und sei ∼⊆ X × X die Relation (rn )n∈N ∼ (sn )n∈N : ⇐⇒ lim (rn − sn ) = 0. n→∞ Diese Relation ist eine Äquivalenzrelation. Dabei ist Reflexivität und Symmetrie klar. Um die Transitivität nachzuweisen, seien (rn )n∈N ∼ (sn )n∈N und (sn )n∈N ∼ (tn )n∈N gegeben. Es ist limn→∞ (rn − sn ) = limn→∞ (sn − tn ) = 0, und somit gilt für die Summe dieser Folgen limn→∞ (rn − tn ) = 0. Also ist (rn )n∈N ∼ (tn )n∈N . Es sei bemerkt, dass wir die verwendeten Regeln für Folgen in Q-wertigen metrischen Räumen nicht hergeleitet haben, obwohl wir sie hier und im Folgenden des öfteren verwenden. Das zu tun ist aber nur eine Abschreibübung für die Ergebnisse aus Proposition 3.5.3, Lemma 3.3.1 und Satz 3.3.5 indem wir immer dann, wenn von R die Rede ist, diese durch Q ersetzen. (ii) Unser Ziel soll sein, X/∼ zu einem vollständig angeordneten Körper zu machen. Dazu brauchen wir Operationen, die wir zunächst auf X definieren: (rn )n∈N + (sn )n∈N := (rn + sn )n∈N , −(rn )n∈N := (−rn )n∈N , (rn )n∈N · (sn )n∈N := (rn · sn )n∈N . Mit (rn )n∈N , (sn )n∈N sind auch (rn )n∈N + (sn )n∈N , −(rn )n∈N und (rn )n∈N · (sn )n∈N Cauchy-Folgen. Um das z.B. für die Multiplikation zu zeigen, sei C ∈ Q, C > 0, sodass |rn |, |sn | ≤ C, n ∈ N (siehe Proposition 3.5.3), und rechne |rn sn − rm sm | ≤ |rn sn − rn sm | + |rn sm − rm sm | ≤ C|sn − sm | + C|rn − rm |. Dieser Ausdruck ist kleiner als ein vorgegebenes rationales ǫ > 0, wenn man N so groß wählt, dass ǫ für m, n ≥ N. |sn − sm |, |rn − rm | < 2C (iii) Da die Verknüpfungen + und · gliedweise definiert sind, folgt aus den Rechenregeln auf Q, dass für + und · das Kommutativgesetz, das Assoziativgesetz und das Distributivgesetz gelten. Klarerweise gilt auch (rn )n∈N + (0)n∈N = (rn )n∈N , − (rn )n∈N + (rn )n∈N = (0)n∈N , (rn )n∈N · (1)n∈N = (rn )n∈N . Wir können aber X nicht zu einem Körper machen, denn ist (rn )n∈N , (0)n∈N , so können wir noch lange keine multiplikativ Inverses dazu finden. 4.1. EXISTENZ 91 (iv) Die Äquivalenzrelation ∼ lässt sich nun mit Hilfe obiger Verknüpfungen charakterisieren: (rn )n∈N ∼ (sn )n∈N ⇔ (rn )n∈N + (−(sn )n∈N ) ist Nullfolge, und (rn )n∈N ist Nullfolge ⇔ (rn )n∈N ∼ (0)n∈N . Daraus sieht man leicht, dass obige Verknüpfungen mit den Operationen verträglich sind. Sind nämlich (rn )n∈N ∼ (rn′ )n∈N und (sn )n∈N ∼ (s′n )n∈N , so folgt (rn )n∈N + (sn )n∈N ∼ (rn′ )n∈N + (s′n )n∈N , −(rn )n∈N ∼ −(rn′ )n∈N sowie (rn )n∈N · (sn )n∈N ∼ (rn′ )n∈N · (s′n )n∈N . Letztere Relation etwa folgt aus (rn )n∈N · (sn )n∈N + (−(rn′ )n∈N · (s′n )n∈N ) = rn (sn − s′n ) + s′n (rn − rn′ ) n∈N ∼ (0)n∈N , da mit (sn − s′n )n∈N und (rn − rn′ )n∈N auch rn (sn − s′n ) + s′n (rn − rn′ ) sind. n∈N Nullfolgen (v) Setzt man1 P = {(rn )n∈N ∈ X : ∃δ ∈ Q, δ > 0, rn ≥ δ für fast alle n ∈ N}, und −P = {(−rn )n∈N ∈ X : (rn )n∈N ∈ P}, so gehört jede Folge (rn )n∈N ∈ X zu genau einer der drei Teilmengen P, [(0)n∈N ]∼ , − P. Ist (rn )n∈N ∼ (ρn )n∈N , so gehört (ρn )n∈N zur selben Teilmenge. Beweis. Da nicht gleichzeitig −rn ≥ δ und rn ≥ δ für fast alle n ∈ N sein kann, folgt −P ∩ P = ∅. Aus (rn )n∈N ∼ (0)n∈N folgt rn → 0. Also unterschreitet |rn | jedes vorgegebene δ > 0, wenn nur n hinreichend groß ist. (rn )n∈N kann damit weder in P noch in −P liegen. Seien (rn )n∈N , (ρn )n∈N ∈ X äquivalent, aber beide nicht äquivalent zu (0)n∈N . Also sind beide keine Nullfolgen. Für (rn )n∈N bedeutet das ∃δ ∈ Q, δ > 0 : ∀N ∈ N ∃ : m(N) ≥ N : |rm(N) | ≥ δ . (4.1) Sei N ∈ N, sodass |rn − rm | < 4δ , |ρn − rn | < 4δ , m, n ≥ N. Aus der Dreiecksungleichung folgt unmittelbar |ρn − rm | < 2δ und weiter δ δ |rn | ≥ |rm | − |rn − rm | > |rm | − , |ρn | ≥ |rm | − |ρn − rm | > |rm | − . 4 2 (4.2) Wählt man hier m = m(N) wie in (4.1), so folgt wegen |rm | ≥ δ aus |rn − rm | < und |ρn − rm | < 2δ , dass δ 4 sgn(rn ) = sgn(rm ) = sgn(ρn ) . Aus (4.2) folgt |rn |, |ρn | ≥ 2δ . Also liegen (rn )n∈N und (ρn )n∈N gemeinsam in P bzw. −P je nach dem Vorzeichen von rm . ❑ 1 Fast alle bedeutet hier alle bis auf endlich viele“. ” 92 KAPITEL 4. DIE KONSTRUKTION DER REELLEN ZAHLEN (vi) Man sieht auch ganz leicht, dass aus (rn )n∈N , (sn )n∈N ∈ P folgt, dass (rn )n∈N + (sn )n∈N , (rn )n∈N · (sn )n∈N ∈ P. (vii) Nun betrachten wir X/∼ und definieren [(rn )n∈N ]∼ + [(sn )n∈N ]∼ := [(rn )n∈N + (sn )n∈N ]∼ , [(rn )n∈N ]∼ · [(sn )n∈N ]∼ := [(rn )n∈N · (sn )n∈N ]∼ , −[(rn )n∈N ]∼ = [−(rn )n∈N ]∼ , P/∼ = {[(rn )n∈N ]∼ : (rn )n∈N ∈ P}. Aus (iv) wissen wir, dass die Verknüpfungen damit wohldefiniert sind und aus (v), dass P/∼ , [(0)n∈N]∼ , −P/∼ paarweise disjunkte Mengen sind, deren Vereinigung X/∼ ist. Nun übertragen sich das Kommutativgesetz, das Assoziativgesetz und das Distributivgesetz für + und · . Die Restklasse [(0)n∈N ]∼ ist das additiv neutrale Element, und [(1)n∈N ]∼ ist das multiplikativ neutrale Element. Weiters ist −[(rn )n∈N ]∼ das additiv Inverse von [(rn )n∈N ]∼ . Was X/∼ noch fehlt, ein Körper zu sein, ist die Existenz einer multiplikativ Inversen. Dazu sei [(rn )n∈N ]∼ , [(0)n∈N ]∼ . Nach (v) wissen wir, dass |rn | > δ für ein rationales δ > 0 und alle n ∈ N, n ≥ N. Also gilt für m, n ≥ N 1 − 1 ≤ |rn − rm | , rn rm δ und wir sehen, dass (qn )n∈N mit qn = r1n für n ≥ N, und qn = 0 für n < N, eine Cauchy-Folge ist, und dass [(rn )n∈N ]∼ · [(qn )n∈N ]∼ = [(1)n∈N ]∼ . Schließlich ist hX/∼ , +, ·, P/∼i wegen (vi) sogar ein angeordneter Körper. Wir bemerken noch, dass wegen (v) für die Ordnung ≤ auf X/∼ gilt, dass [(rn )n∈N ]∼ < [(sn )n∈N ]∼ ⇔ rn + δ ≤ sn , n ≥ N für ein δ > 0 und ein N ∈ N. Insbesondere gilt folgt aus rn ≤ sn , n ≥ N für ein N ∈ N, dass [(rn )n∈N ]∼ ≤ [(sn )n∈N ]∼ . (viii) Die Abbildung r 7→ [(r)n∈N ]∼ von Q nach X/∼ ist offenbar nicht identisch gleich [(0)n∈N]∼ und mit der Addition und Multiplikation verträglich. Somit ist dies die eindeutige Abbildung φ : Q → X/∼ aus Proposition 2.5.8, die für jeden angeordneten Körper existiert. Wegen Proposition 2.5.8 ist diese Abbildung auch injektiv und mit −, < und ≤ verträglich. (ix) hX/∼ , +, ·, P/∼i ist ein archimedisch angeordneter Körper, denn für jedes [(rn )n∈N ]∼ ∈ X/∼ , ist (rn )n∈N eine Cauchy-Folge und daher beschränkt. Da Q archimedisch angeordnet ist, gibt es ein N ∈ N, sodass rn ≤ N, n ∈ N. Das bedingt aber [(rn )n∈N ]∼ ≤ [(N)]∼ < [(N + 1)]∼, womit [(rn )n∈N ]∼ keine obere Schranke von {[(k)n∈N ]∼ : k ∈ N} sein kann. (x) Nun wollen wir zeigen, dass unser Körper vollständig angeordnet ist. Dazu sei A ⊆ X/∼ eine nach oben beschränkte, nicht leere Menge. Wegen dem vorherigen Punkt gilt somit A ≤ [(N+ )]∼ für ein festes N+ ∈ N. Wegen A , ∅ existiert 4.2. EINDEUTIGKEIT 93 ebenfalls nach dem vorherigen Punkt auch ein N− ∈ Z, sodass [(N− )]∼ keine untere Schranke von A ist. Für j ∈ N sei 1j! Z die Menge aller rationalen Zahlen der Form qp mit p ∈ Z und 1 q = j!. Man sieht leicht, dass Z ⊆ 1j! Z ⊆ ( j+1)! Z ⊆ Q. Weiters sei D j = {r ∈ 1 Z : A ≤ [(r)n∈N ]∼ } , j! für die D j ⊆ D j+1 gilt. Wegen N+ ∈ D j ist D j nicht leer und wegen N− < D j ist D j nach unten beschränkt. Somit ist ( j!)(D j − N− ) + 1 eine nicht leere Teilmenge von N und hat somit ein Minimum. Also existiert auch das Minimum x j von D j . Wegen D j ⊆ D j+1 gilt x j+1 ≤ x j . Wegen D j = {r ∈ 1j! Z : x j ≤ r} ist die Zahl y j := x j − 1j! ∈ 1j! Z das Maximum aller r ∈ 1j! Z, die keine obere Schranke von A sind, also das Maximum von 1j! Z \ D j . 1 Aus 1j! Z \ D j ⊆ ( j+1)! Z \ D j+1 folgt y j+1 ≥ y j . Wegen 0 ≤ xm − xn < xm − yn ≤ xm − ym = 1 m! und 0 ≤ yn − ym < xn − ym ≤ xm − ym = 1 für m < n , m! für m < n gilt (xn )n∈N , (yn )n∈N ∈ X, wobei (xn )n∈N ∼ (yn )n∈N ; also s := [(xn )n∈N ]∼ = [(yn )n∈N ]∼ . Nun gilt A ≤ s, denn anderenfalls gäbe es ein a ∈ A mit s < a und gemäß Satz 2.6.3 weiter ein r ∈ Q mit s < [(r)n∈N ] < a. Für j0 ∈ N mit r ∈ j10 ! Z – ein solches gibt es offenbar – gilt r ∈ 1j! Z \ D j und somit r ≤ y j für alle j ≥ j0 . Es folgt der Widerspruch [(r)n∈N ] ≤ [(yn )n∈N ]∼ = s. Nun ist s die kleinste obere Schranke von A, da aus A ≤ b < s wieder mit Satz 2.6.3 die Existenz eines r ∈ Q mit A ≤ b < [(r)n∈N ] < s folgte. Für j0 ∈ N mit r ∈ j10 ! Z gilt r ∈ D j und somit x j ≤ r für alle j ≥ j0 . Das ergibt aber den Widerspruch s = [(xn )n∈N ]∼ ≤ [(r)n∈N ]. Also können wir uns nun sicher sein, dass es vollständig angeordnete Körper gibt. 4.2 Eindeutigkeit 4.2.1 Satz. Ist hK, +, ·, Pi ein vollständig angeordneter Körper und hX/∼ , +, ·, P/∼i der soeben konstruierte Körper, dann gibt es eine eindeutige Abbildung φ̃ : X/∼ → K, die nicht identisch gleich 0K und mit Addition und Multiplikation verträglich ist. Diese Abbildung ist dann auch bijektiv, mit − sowie mit den Ordnungen < und ≤ verträglich. Beweis. Nach Proposition 2.5.8 gibt es eine verknüpfungs- und ordnungstreue injektive Abbildung φ : Q → K. Wegen Bemerkung 3.5.2 sind die Bilder von Nullfolgen bzw. Cauchy-Folgen wieder Nullfolgen bzw. Cauchy-Folgen. Ist [(rn )n∈N ]∼ ∈ X/∼ , so definieren wir φ̃([(rn )n∈N ]∼ ) := lim φ(rn ). n→∞ KAPITEL 4. DIE KONSTRUKTION DER REELLEN ZAHLEN 94 Man beachte, dass der Grenzwert existiert, da K wegen Satz 3.5.8 ein vollständig angeordneter Körper ist, und dass der Grenzwert nicht von der Wahl des Repräsentanten (rn )n∈N der Restklasse [(rn )n∈N ]∼ abhängt. Ist nämlich (rn )n∈N ∼ (sn )n∈N , so folgt lim φ(rn ) = lim φ(sn ) + lim φ(rn − sn ) = lim φ(sn ). n→∞ n→∞ n→∞ n→∞ φ̃ ist injektiv, da [(rn )n∈N ]∼ = [(sn )n∈N ]∼ ⇔ lim (rn − sn ) = 0 ⇔ n→∞ lim φ(rn − sn ) = 0 ⇔ lim φ(rn ) = lim φ(sn ). n→∞ n→∞ n→∞ Die Surjektivität folgt aus der Tatsache, dass jede Zahl aus K durch eine Folge rationaler Zahlen approximiert werden kann; vgl. Beispiel 3.3.4. Die Verträglichkeit mit + folgt aus (siehe Satz 3.3.5) φ̃([(rn )n∈N ]∼ + [(sn )n∈N ]∼ ) = lim φ(rn + sn ) = n→∞ lim φ(rn ) + lim φ(sn ) = φ̃([(rn )n∈N ]∼ ) + φ̃([(sn )n∈N ]∼ ), n→∞ n→∞ und die für − sowie · zeigt man genauso. Um die Verträglichkeit mit der Ordnung zu zeigen sei bemerkt, dass wegen Lemma 3.3.1 und Satz 2.6.3 φ̃([(rn )n∈N ]∼ ) ∈ P ⇔ lim φ(rn ) > 0 ⇔ ∃δ > 0, φ(rn ) ≥ δ für alle n ≥ N. n→∞ Da φ ordnungstreu ist, bedeutet das aber genau [(rn )n∈N ]∼ ∈ P/∼ . Sei φ̂ : X/∼ → K eine weitere, mit + und · verträgliche Abbildung mit φ̂ . 0K . Aus φ̂(x)φ̂([(1)n∈N]∼ ) = φ̂(x · [(1)n∈N ]∼ ) = φ̂(x) für ein x ∈ X/∼ mit φ̂(x) , 0K folgt φ̂([(1)n∈N]∼ ) = 1K ; also ist insbesondere die Abbildung r 7→ φ̂([(r)n∈N ]∼ ) nicht identisch gleich 0K und offenbar mit + und · verträglich. Die Eindeutigkeitsaussage in Proposition 2.5.8 impliziert φ̂([(r)n∈N ]∼ ) = φ(r) für alle r ∈ Q, woraus wegen φ̂(a) + φ̂(−a) = φ̂([(0)n∈N]∼ ) = 0K und daher φ̂(−a) = −φ̂(a) für jedes a ∈ X/∼ auch die Verträglichkeit mit − folgt. Für a , [(0)n∈N]∼ folgt φ̂(a) · φ̂(a−1 ) = φ̂(a · a−1 ) = 1K , und daher φ̂(a) , 0K . Für [(rn )n∈N ]∼ ∈ X/∼ folgt aus [(rn )n∈N ]∼ > [(0)n∈N]∼ wegen Satz 2.7.5 ∃[(sn )n∈N ]∼ ∈ X/∼ , [(sn )n∈N ]∼ , [(0)n∈N ]∼ : [(sn )n∈N ]2∼ = [(rn )n∈N ]∼ . Wegen φ̂([(sn )n∈N ]∼ ) , 0K ⇔ [(sn )n∈N ]∼ , [(0)n∈N ]∼ folgt daraus φ̂([(rn )n∈N ]∼ ) = φ̂([(sn )n∈N ]∼ )2 > 0K . Somit ist φ̂ mit < und daher auch mit ≤ verträglich. Wäre nun φ̂(x) < φ̃(x) für ein x ∈ X/∼ , und sind r, ρ ∈ Q gemäß Satz 2.6.3 so gewählt, dass φ̂(x) < φ(r) < φ(ρ) < φ̃(x), so erhielten wir x < [(r)n∈N ]∼ und [(ρ)n∈N ]∼ < x , (4.3) da aus x ≥ [(r)n∈N ]∼ ( x ≤ [(ρ)n∈N ]∼ ) wegen der Ordnungstreue von φ̂ ( φ̃ ) die Beziehung φ̂(x) ≥ φ̂([(r)n∈N ]∼ ) = φ(r) ( φ̃(x) ≤ φ̃([(ρ)n∈N ]∼ ) = φ(ρ) ) folgt. (4.3) impliziert ρ < r, wogegen φ(r) < φ(ρ) die Ungleichung r < ρ nach sich zieht. Da man genauso aus φ̂(x) > φ̃(x) einen Widerspruch erhält, muss φ̂ = φ̃. ❑ Somit haben wir die Existenz und die Eindeutigkeit eines vollständig angeordneten Körpers und damit auch Satz 2.7.3 bewiesen. 4.2. EINDEUTIGKEIT 95 4.2.2 Bemerkung. Die in diesem Abschnitt angegebene Vorgangsweise aus Q die reellen Zahlen zu konstruieren lässt sich auch anwenden um zu zeigen, dass es zu jedem metrischen Raum hX, di einen vollständigen metrischen Raum hX̂, d̂i gibt, sodass hX, di isometrisch und dicht in hX̂, d̂i enthalten ist. In der Tat nimmt man auch hier die Menge X aller Cauchy-Folgen in hX, di, betrachtet genauso die Äquivalenzrelation ∼, die zwei Folgen identifiziert, falls deren Differenz eine Nullfolge ist, und beweist, dass X/∼ versehen mit einer geeigneten Metrik der gesuchte metrische Raum ist. 96 KAPITEL 4. DIE KONSTRUKTION DER REELLEN ZAHLEN Kapitel 5 Geometrie metrischer Räume 5.1 ǫ-Kugeln, offene und abgeschlossene Mengen Als erstes wollen wir uns dem anschaulich leicht verständlichen Begriff der Kugel in metrischen Räumen zuwenden. 5.1.1 Definition. Sei hX, di ein metrischer Raum und x ∈ X. Dann heißt die Menge Uǫ (x) := {y ∈ X : d(y, x) < ǫ} die offene ǫ-Kugel um den Punkt x, und die Menge Kǫ (x) := {y ∈ X : d(y, x) ≤ ǫ} die abgeschlossene ǫ-Kugel um den Punkt x. 5.1.2 Beispiel. (i) Man betrachte R versehen mit der euklidischen Metrik. Für x ∈ R ist dann Uǫ (x) = (x − ǫ, x + ǫ) und Kǫ (x) = [x − ǫ, x + ǫ]. (ii) Sei X eine Menge, und sei diese mit der diskreten Metrik aus Beispiel 3.1.5 versehen. Ist ǫ ≤ 1, so gilt dann in diesem Raum Uǫ (x) = {x}. Für ǫ > 1 gilt Uǫ (x) = X. (iii) Betrachte R2 , und versehe diese Menge einerseits mit der Metrik, d1 , der euklidischen Metrik d2 und mit d∞ ; siehe Beispiel 3.1.5. Die ǫ-Kugeln Uǫ1 (0) bzgl. d1 sowie Uǫ2 (0) bzgl. d2 bzw. Uǫ∞ (0) bzgl. d∞ lassen sich folgendermaßen darstellen. Uǫ1 (0) Uǫ∞ (0) Uǫ2 (0) ǫ ǫ ǫ ǫ ǫ Abbildung 5.1: ǫ-Umgebungen von 0 97 ǫ KAPITEL 5. GEOMETRIE METRISCHER RÄUME 98 5.1.3 Bemerkung. Die Konvergenz einer Folge (xn )n∈N in metrischen Räumen lässt sich durch obige Mengen folgendermaßen formulieren: x = lim xn ⇔ ∀ǫ > 0 ∃N ∈ N : {xn : n ≥ N} ⊆ Uǫ (x). n→∞ Wegen Uǫ (x) ⊆ Kǫ (x) ⊆ U2ǫ (x) können wir hier genauso Kǫ (x) anstatt Uǫ (x) schreiben. Diese Sichtweise des Grenzwertbegriffes gewinnt zum Beispiel dann an Bedeutung, wenn man den Konvergenzbegriff bezüglich verschiedener Metriken vergleichen will. Betrachten wir etwa die Metriken d und d∞ aus Beispiel 5.1.2, (iii), so folgt aus 2 (3.9), dass Uǫ2 (x) ⊆ Uǫ∞ (x) ⊆ U2ǫ (x). Nimmt man nun obiges Konvergenzkriterium her, so sieht man unmittelbar, dass eine Folge genau dann bzgl. d konvergiert, wenn sie es bzgl. d∞ tut; siehe Proposition 3.6.1. 5.1.4 Definition. Sei hX, di ein metrischer Raum. Eine Teilmenge O von X heißt offen, wenn es zu jedem Punkt x ∈ O eine ǫ-Kugel gibt mit Uǫ (x) ⊆ O. ǫ x ǫ ′′ x′′ ǫ′ x′ O Abbildung 5.2: Offene Mengen 5.1.5 Beispiel. In (R, d) sind z.B. die Mengen (a, b) und R \ {0} offen. Denn ist etwa x ∈ (a, b), b−x so folgt für ǫ = min( x−a 2 , 2 ), dass U ǫ (x) = (x − ǫ, x + ǫ) ⊆ (a, b). Man sieht sofort, dass in jedem metrischen Raum hX, di die Mengen ∅ und X immer offen sind. 5.1.6 Bemerkung. Sei hX, di ein metrischer Raum und sei x ∈ X sowie ǫR, ǫ > 0. Ist y ∈ Uǫ (x), dh. d(x, y) < ǫ, und ist 0 < δ ≤ ǫ − d(x, y), so folgt für z ∈ Uδ (y) aus d(y, z) < δ, dass d(x, z) ≤ d(x, y) + d(y, z) < d(x, y) + δ ≤ d(x, y) + ǫ − d(x, y) = ǫ , und somit z ∈ Uǫ (x). Also gilt Uδ (y) ⊆ Uǫ (x). Insbesondere sind alle offenen Kugeln in metrischen Räumen offen. 5.1. ǫ -KUGELN, OFFENE UND ABGESCHLOSSENE MENGEN 5.1.7 Proposition. Sei hX, di ein metrischer Raum. Dann gilt Ist n ∈ N und sind O1 , . . . , On offene Teilmengen von X, so ist auch 99 Tn i=1 Oi offen. Ist I eine beliebige Indexmenge, und sind Oi offene Teilmengen von X, so auch S i∈I Oi . Beweis. Seien O1 , . . . , On offen und x ∈ O1 ∩ . . . ∩ On . Definitionsgemäß gibt es ǫ1 , . . . , ǫn > 0 mit Uǫi (x) ⊆ Oi , i = 1, . . . , n. Es folgt Umin{ǫ1 ,...,ǫn } (x) = Uǫ1 (x) ∩ . . . ∩ Uǫn (x) ⊆ O1 ∩ . . . ∩ On . Damit ist O1 ∩ . . . ∩ On offen. S Seien Oi , i ∈ I, offen, und x ∈ i∈I Oi . Dann existiert ein i ∈ I mit x ∈ Oi , und S daher ein ǫ > 0 mit Uǫ (x) ⊆ Oi . Insgesamt folgt Uǫ (x) ⊆ i∈I Oi . ❑ 5.1.8 Definition. Sei hX, di ein metrischer Raum, E ⊆ X und x ∈ X. Man nennt x einen Häufungspunkt von E, wenn jede ǫ-Kugel um x einen Punkt aus E \ {x} enthält, dh. ∀ǫ > 0 ⇒ Uǫ (x) ∩ (E \ {x}) , ∅ , oder anders formuliert, ∀ǫ > 0 ∃y ∈ E, x , y : d(x, y) < ǫ. Wenn x ∈ E kein Häufungspunkt ist, so nennen wir ihn isolierten Punkt von E. Das ist also ein Punkt aus E, sodass ∃ǫ > 0, Uǫ (x) ∩ E = {x}. Wir sagen eine Menge A ⊆ X ist abgeschlossen, wenn jeder Häufungspunkt von A schon in A enthalten ist. 5.1.9 Bemerkung. Sei E ⊆ X. Für jedes x ∈ X tritt genau einer der folgenden Fälle ein: (i) x ist isolierter Punkt von E. (ii) x ∈ E und x ist Häufungspunkt von E. (iii) x < E und x ist Häufungspunkt von E. (iv) x < E und x ist nicht Häufungspunkt von E. 5.1.10 Definition. Die Menge aller x, die eine der Bedingungen (i), (ii) oder (iii) erfüllen, wollen wir mit Abschluss der Menge E, in Zeichen c(E), bezeichnen. Sind E ⊆ F ⊆ X derart, dass c(E) ⊇ F, so nennt man E dicht in F. KAPITEL 5. GEOMETRIE METRISCHER RÄUME 100 5.1.11 Fakta. 1. Man zeigt unmittelbar, dass aus E ⊆ F die Inklusion c(E) ⊆ c(F) folgt. 2. Klarerweise ist E ⊆ c(E), wobei c(E) = E genau dann, wenn E abgeschlossen ist. 3. Für ein x ∈ X gilt x ∈ c(E) genau dann, wenn ∀ǫ > 0 ∃y ∈ E : d(x, y) < ǫ bzw. genau dann, wenn ∀ǫ > 0 ⇒ E ∩ Uǫ (x) , ∅. (5.1) 4. Ist x ∈ c(c(E)), so folgt aus dieser Bedingung angewandt auf c(c(E)), dass c(E) ∩ U 2ǫ (x) für beliebiges ǫ > 0 ein y enthält. Nochmals diese Bedingung angewandt auf c(E) ergibt E ∩ U 2ǫ (y) , ∅, was zusammen mit U 2ǫ (y) ⊆ Uǫ (x) (siehe Bemerkung 5.1.6) E∩Uǫ (x) , ∅ nach sich zieht. Also gilt x ∈ c(E) und somit c(c(E)) ⊆ c(E). Die umgekehrte Inklusion gilt ohnehin, dh. c(c(E)) = c(E). Insbesondere ist c(E) immer abgeschlossen. 5. In jeder ǫ-Kugel Uǫ (x) um einen Häufungspunkt x von E liegen sogar unendlich viele Punkte von E \ {x}. Denn angenommen es wären nur endlich viele x1 , . . . , xn , so erhielten wir mit δ := min{ǫ, d(x, x1 ), . . . , d(x, xn )} > 0 den Widerspruch Uδ (x) ∩ E \ {x} = ∅. 5.1.12 Beispiel. Sei E = [0, 1) ∪ {2} als Teilmenge von R. Dann ist 1 ein Häufungspunkt von E, da jede ǫ-Kugel (1 − ǫ, 1 + ǫ) um 1 sicherlich Punkte aus E enthält – etwa max(1 − 12 ǫ, 12 ). Da 1 nicht zu E gehört, ist E nicht abgeschlossen. Für x ∈ [0, 1) und jedes ǫ > 0 gilt sicher x < y := min( x+1 1 , x + ǫ) < min(x + ǫ, 1) , 2 2 also y ∈ E ∩ Uǫ (x) \ {x}. Somit sind auch alle Punkte aus [0, 1) Häufungspunkt von E. Für x < [0, 1] folgt mit ǫ = min(|x|, |x − 1|) sicherlich E ∩ Uǫ (x) \ {x} = ∅, womit [0, 1] genau die Menge aller Häufungspunkte von E und 2 ein isolierter Punkt ist. Also gilt schließlich c(E) = [0, 1] ∪ {2}. Ist hX, di ein beliebiger metrischer Raum, so sind auch ∅ und X abgeschlossen. Erstere Menge hat offenbar keine Häufungspunkte und enthält somit trivialerweise alle solchen, und X enthält auch alle seine Häufungspunkte, da diese ja als Punkte von X definiert sind. Ist hX, di ein beliebiger metrischer Raum, und E ⊆ X eine endliche Teilmenge, so hat E keine Häufungspunkte, besteht daher nur aus isolierten Punkten und ist daher immer abgeschlossen. 5.1. ǫ -KUGELN, OFFENE UND ABGESCHLOSSENE MENGEN 101 5.1.13 Lemma. Ein Punkt x ist ein Häufungspunkt einer Menge E genau dann, wenn es eine Folge (xn )n∈N von Punkten xn ∈ E \ {x} gibt mit xn → x. Ein Punkt x liegt genau dann in c(E), wenn es eine Folge (xn )n∈N von Punkten xn ∈ E gibt mit xn → x. Beweis. Ist x Häufungspunkt von E, so gibt es zu jedem n ∈ N ein xn ∈ E \ {x} mit d(x, xn ) < n1 , also xn → x. Ist x isolierter Punkt von E, so konvergiert die identische Folge x = xn , n ∈ N gegen x. Diese Folge ist klarerweise aus E. Sei nun umgekehrt x = limn→∞ xn für eine Folge aus E. Ist für ein n ∈ N, xn = x, so folgt trivialerweise x = xn ∈ E ⊆ c(E). Im Fall xn , x für alle n ∈ N ist die Folge (xn )n∈N sicher in E \ {x} enthalten, und zu jedem ǫ > 0 gibt es ein N ∈ N, sodass ∅ , {xn : n ≥ N} ⊆ Uǫ (x). Jedes Element der Menge auf der linken Seite ist in Uǫ (x) ∩ E \ {x} enthalten. x ist somit Häufungspunkt von E. ❑ 5.1.14 Beispiel. Ist F ⊆ R abgeschlossen und nach oben beschränkt, so sei x := sup F. Nach Beispiel 3.3.4 gibt es in F eine Folge, die gegen sup F konvergiert. Die Abgeschlossenheit von F impliziert sup F ∈ F, d.h. sup F = max F. Entsprechendes gilt für nach unten beschränkte Mengen und deren Infimum. Ist hX, di ein beliebiger metrischer Raum, so ist jede abgeschlossene Kugel Kǫ (x) abgeschlossen. Ist nämlich y ∈ c(Kǫ (x)) von Kǫ (x), so gibt es gemäß Lemma 5.1.13 eine Folge (yn )n∈N aus Kǫ (x) mit limn→∞ yn = y. Wegen Lemma 3.2.10 und Lemma 3.3.1 folgt d(x, y) = lim d(x, yn ) ≤ ǫ . n→∞ Also haben wir y ∈ Kǫ (x). Somit gilt c(Kǫ (x)) = Kǫ (x), weshalb Kǫ (x) abgeschlossen ist; vgl. Fakta 5.1.11. Die rationalen Zahlen liegen dicht in R. In der Tat haben wir in Beispiel 3.3.4 für ein beliebiges x ∈ R eine Folge aus Q \ {x} konstruiert haben, die gegen x konvergiert. Wegen Lemma 5.1.13 ist x somit Häufungspunkt von Q. 5.1.15 Proposition. Ist hX, di ein metrischer Raum und A ⊆ X, so sind folgende Aussagen äquivalent. (i) Ac (= X \ A) ist offen. (ii) A ist abgeschlossen. (iii) Ist (xn )n∈N eine Folge von Punkten aus A und ist (xn )n∈N konvergent, so liegt auch ihr Grenzwert in A. Beweis. (i) ⇒ (ii): Ein Punkt x ∈ c(A) kann nicht in Ac liegen, denn anderenfalls folgt aus Ac offen, dass Uǫ (x) ⊆ Ac für ein ǫ > 0, und damit der Widerspruch Uǫ (x) ∩ A = ∅ zu (5.1). Also muss x ∈ A und daher A = c(A). KAPITEL 5. GEOMETRIE METRISCHER RÄUME 102 (ii) ⇒ (i): Da A abgeschlossen ist, ist jedes x ∈ Ac kein Häufungspunkt von A. Also gibt es ein ǫ > 0 mit Uǫ (x)∩A = Uǫ (x)∩A\{x} = ∅. Das ist aber gleichbedeutend mit Uǫ (x) ⊆ Ac . Also ist Ac offen. (ii) ⇔ (iii): Folgt unmittelbar aus der Tatsache, dass A genau dann abgeschlossen ist, wenn c(A) = A, und aus Lemma 5.1.13. ❑ Diese einfache Charakterisierung von abgeschlossenen Mengen zusammen mit n [ i=1 Ai c = n [ \ \ c (Ai )c (Aci ), Ai = i=1 i∈I i∈I und Proposition 5.1.7 liefert uns sofort das folgende 5.1.16 Korollar. Sei hX, di ein metrischer Raum. Dann gilt S Sind n ∈ N und A1 , . . . , An abgeschlossen, so auch ni=1 Ai . Ist I eine beliebige Indexmenge, und sind alle Mengen Ai , i ∈ I, abgeschlossen, T so folgt, dass auch i∈I Ai abgeschlossen ist. 5.1.17 Beispiel. Korollar 5.1.16 gestattet uns z.B. Einheitskreislinie T = {z ∈ C : |z| = 1} als abgeschlossene Teilmenge von C zu identifizieren. In der Tat ist T = K1 (0) ∩ (U1 (0))c , und damit Durchschnitt von abgeschlossenen Mengen. Man betrachte M = {z ∈ C : Re z ≥ 0} als Teilmenge von C. Ist (zn )n∈N eine Folge aus M, die gegen z ∈ C konvergiert, so muss nach Proposition 3.6.1 die Folge (Re zn )n∈N in R gegen Re z konvergieren. Wegen Lemma 3.3.1 folgt aus Re zn ≥ 0, n ∈ N, dass auch Re z ≥ 0 und damit z ∈ M. Nach Proposition 5.1.15 ist M abgeschlossen. Die Teilmenge {z ∈ C : 0 ≤ Re z ≤ 1} von C lässt sich als Durchschnitt von {z ∈ C : Re z ≥ 0} und {z ∈ C : Re z ≤ 1} schreiben. Nach dem vorhergehenden Beispiel ist die erste Menge abgeschlossen. Entsprechendes gilt für die zweite Menge. Also ist {z ∈ C : 0 ≤ Re z ≤ 1} der Durchschnitt von abgeschlossenen Mengen und damit selber abgeschlossen. Das Quadrat {z ∈ C : Re z ∈ [0, 1], Im z ∈ [0, 1]} ist der Durchschnitt der abgeschlossenen Mengen {z ∈ C : 0 ≤ Re z ≤ 1} und {z ∈ C : 0 ≤ Im z ≤ 1}, und daher auch abgeschlossen. Da die Menge {z ∈ C : Re z ≥ 0} abgeschlossen ist, folgt, dass ihr Komplement M := {z ∈ C : Re z < 0} in C offen ist. Das kann man auch direkt nachweisen: Ist z ∈ M beliebig, so wähle ǫ = − Re z > 0. Ist w ∈ Uǫ (z), so folgt wegen − Re z + Re w ≤ | Re z − Re w| ≤ |z − w| und damit − Re w ≥ − Re z − |z − w| > − Re z − ǫ = 0, dass auch w ∈ M, und daher Uǫ (z) ⊆ M. 5.1. ǫ -KUGELN, OFFENE UND ABGESCHLOSSENE MENGEN 103 Das Quadrat M = {z ∈ C : Re z ∈ (0, 1), Im z ∈ (0, 1)} lässt sich als Durchschnitt von endlich vielen offenen Mengen schreiben: M = {z ∈ C : Re z > 0}∩{z ∈ C : Re z < 1}∩{z ∈ C : Im z > 0}∩{z ∈ C : Im z < 1} . Sie ist daher selber offen. Um sich c(M) für M aus dem vorherigen Beispiel auszurechnen, sei zunächst bemerkt, dass c(M) ⊆ c({z ∈ C : Re z ∈ [0, 1], Im z ∈ [0, 1]}) = {z ∈ C : Re z ∈ [0, 1], Im z ∈ [0, 1]}; vgl. Fakta 5.1.11. Sei nun z ∈ C mit Re z ∈ [0, 1], Im z ∈ [0, 1]. Im Fall Re z ∈ (0, 1), Im z ∈ (0, 1) gilt offenbar z ∈ M ⊆ c(M). Anderenfalls muss Re z = 0, Re z = 1, Im z = 0 oder Re z = 1 sein. 1 + i Im z)n∈N eine Folge aus M, die gegen z konvergiert, Im ersten Fall ist ( n+1 dh. z ∈ c(M). In den anderen Fällen konstruiert man ähnliche Folgen und erhält genauso z ∈ c(M). Insgesamt gilt also c(M) = {z ∈ C : Re z ∈ [0, 1], Im z ∈ [0, 1]} . Betrachte die Teilmenge M von R definiert durch [ 1 1 M= ( , ). n+1 n n∈2N Diese Menge ist als Vereinigung von offenen Mengen offen. S Um alle Häufungspunkte zu ermitteln, sei zunächst x ∈ x ≤ n1 für ein n ∈ 2N. Für jedes ǫ > 0 gilt M ∩ Uǫ (x) \ {x} ⊇ ( 1 1 1 n∈2N [ n+1 , n ], also n+1 ≤ 1 1 , ) ∩ (x − ǫ, x + ǫ) \ {x} = n+1 n 1 1 max(x − ǫ, ), min(x + ǫ, ) \ {x} . n+1 n 1 1 ≤ x ≤ n1 immer max(x−ǫ, n+1 ) < min(x+ǫ, 1n ), folgt M ∩Uǫ (x)\{x} , Da für n+1 1 1 + 2k aus M heraus ∅. Somit ist x ein Häufungspunkt. Da die Folge 12 2k+1 k∈N gegen 0 konvergiert, muss auch 0 ein Häufungspunkt sein; vgl. Lemma 5.1.13. Also ist die Menge [ " 1 1# , H = {0} ∪ n+1 n n∈2N in der Menge aller Häufungspunkte von M enthalten. Ist andererseits x ein Häufungspunkte von M und (x j ) j∈N eine Folge aus M mit Grenzwert x, so gibt es zwei Möglichkeiten: 1 1 , n ) existieren, so gibt Falls für jedes n ∈ 2N nur endlich viele j ∈ N mit x j ∈ ( n+1 1 es zu jedem ǫ > 0 ein K ∈ N mit 2K+2 < ǫ und in Folge nur endlich viele j ∈ N S 1 mit x j ∈ k∈{1,...,K} ( 2k+1 , 2k1 ). Insbesondere gibt es ein J ∈ N, sodass xj ∈ M \ [ ( k∈{1,...,K} [ 1 1 1 1 , )⊆ ( , ) 2k + 1 2k 2k + 1 2k k∈{K+1,k+2,... } ⊆ (− 1 1 , ) ⊆ (−ǫ, ǫ), 2K + 2 2K + 2 KAPITEL 5. GEOMETRIE METRISCHER RÄUME 104 für alle j ≥ J, womit x = lim j→∞ x j = 0. 1 Falls es ein n ∈ 2N gibt, sodass x j ∈ ( n+1 , 1n ) für unendlich viele j ∈ N, so liegt 1 1 , 1n ) ⊆ [ n+1 , 1n ]. Wegen Satz 3.2.8 ist x auch eine Teilfolge von (x j ) j∈N ganz in ( n+1 1 , 1n ] liegt. Grenzwert dieser Teilfolge, der wegen Lemma 3.3.1 auch in [ n+1 Also haben wir gezeigt, dass jeder Häufungspunkte von M in H liegt, und damit H genau die Menge der Häufungspunkte von M ist. Schließlich gilt noch c(M) = M ∪ H = H. Um zu zeigen, dass es außerhalb von H keine anderen Häufungspunkte von M gibt, kann man alternativ auch R \ H = (−∞, 0) ∪ [ n∈2N ( 1 1 1 , ) ∪ ( , +∞) n+2 n+1 2 nachweisen und damit R \ H als offen bzw. H als abgeschlossen identifizieren. Als abgeschlossene Teilmenge enthält H daher alle Häufungspunkte von H und damit auch von M. 5.2 Kompaktheit Wir wollen auch Häufungspunkte für Folgen einführen. 5.2.1 Definition. Sei hX, di ein metrischer Raum. Dann heißt ein x ∈ X Häufungspunkt einer Folge (xn )n∈N , falls es eine gegen x konvergente Teilfolge von (xn )n∈N gibt. 5.2.2 Lemma. Sei (xn )n∈N eine Folge in einem metrischen Raum hX, di. (i) Konvergiert (xn )n∈N gegen x, so ist x der einzige Häufungspunkt. (ii) Ist (xn( j) ) j∈N eine Teilfolge von (xn )n∈N , so ist die Menge aller Häufungspunkte von (xn( j) ) j∈N eine Teilmenge von der Menge aller Häufungspunkte von (xn )n∈N . (iii) x ist Häufungspunkt der Folge (xn )n∈N genau dann, wenn für jedes N ∈ N der Punkt x in c({xn : n ≥ N}) liegt. Beweis. (i) Das folgt unmittelbar aus Satz 3.2.8, da Teilfolgen konvergenter Folgen auch gegen den Grenzwert der Folge streben. (ii) Da jede Teilfolge von (xn( j) ) j∈N erst recht eine Teilfolge von (xn )n∈N ist, muss jeder Häufungspunkt von (xn( j) ) j∈N auch einer von (xn )n∈N sein. (iii) Sei zunächst x Häufungspunkt der Folge (xn )n∈N . Also x = lim j→∞ xn( j) . Wir halten N fest und wählen J ∈ N, sodass n(J) ≥ N. Dann ist (xn( j+J) ) j∈N eine Folge in {xn : n ≥ N}, die gegen x konvergiert. Es folgt x ∈ c({xn : n ≥ N}) nach Lemma 5.1.13. Ist umgekehrt x ∈ c({xn : n ≥ N}) für alle N ∈ N, so sei n(1) ∈ N, sodass d(x, xn(1) ) < 1. Haben wir n(1) < · · · < n(k) gewählt, so sei n(k + 1) ∈ N mit n(k + 1) > n(k) derart, dass d(x, xn(k+1) ) < 1 k+1 . So ein n(k + 1) existiert, weil x ∈ c({xn : n ≥ n(k)+ 1}). Wir haben somit eine Teilfolge konstruiert, die gegen x konvergiert. x ist somit Häufungspunkt der Folge (xn )n∈N . ❑ Bezüglich Häufungspunkte von Folgen aus R haben wir 5.2. KOMPAKTHEIT 105 5.2.3 Proposition. Sei (xn )n∈N eine beschränkte Folge reeller Zahlen. Dann ist lim supn→∞ xn ( lim inf n→∞ xn ) der größte (kleinste) Häufungspunkt von (xn )n∈N . Insbesondere hat jede beschränkte Folge reeller Zahlen mindestens einen Häufungspunkt. Außerdem ist (xn )n∈N konvergent genau dann, wenn ihr Limes Inferior mit dem Limes Superior übereinstimmt, bzw. genau dann, wenn (xn )n∈N genau einen Häufungspunkt hat. Beweis. Dass lim inf n→∞ xn und lim supn→∞ xn Häufungspunkte von (xn )n∈N sind, folgt aus Lemma 3.4.4. Ist y ein weiterer Häufungspunkt samt dazugehöriger Teilfolge (xn( j) ) j∈N , so folgt sup{xn : n ≥ n( j)} ≥ xn( j) für alle j ∈ N, und daher y = lim xn( j) ≤ lim sup{xn : n ≥ n( j)} = lim sup{xn : n ≥ N} = lim sup xn . j→∞ j→∞ N→∞ n→∞ Entsprechend zeigt man lim inf n→∞ xn ≤ y. Dass (xn )n∈N genau dann konvergiert, wenn lim inf n→∞ xn = lim supn→∞ xn haben wir in Fakta 3.4.5 gesehen. Da lim inf n→∞ xn der kleinste und lim supn→∞ xn der größte Häufungspunkt ist, gibt es genau einen solchen, wenn der kleinste und der größte übereinstimmen. ❑ 5.2.4 Beispiel. Man betrachte die Folge xn = (−1)n (1 + n1 ), n ∈ N in R. Die Teilfolge 1 1 konvergiert für k → ∞ gegen 1, und die Teilfolge x2k−1 = −1 − 2k−1 x2k = 1 + 2k konvergiert für k → ∞ gegen −1. Also sind −1 und 1 Häufungspunkte unserer Folge. Angenommen x ∈ R wäre ein weiterer Häufungspunkt. Dann gäbe es eine Teilfolge (xn( j) ) j∈N , die gegen x konvergierte. Nun sei J1 = { j ∈ N : n( j) ist ungerade} und J2 = { j ∈ N : n( j) ist gerade}. ˙ 2 , und somit ist zumindest eine dieser Mengen unendlich. Klarerweise ist N = J1 ∪J Ist J1 unendlich, so gibt es eine streng monoton wachsende Bijektion j : N → J1 ; vgl. Lemma 2.3.15. Also ist (xn( j(k)) )k∈N eine Teilfolge von (xn( j) ) j∈N und somit ebenfalls gegen x konvergent. Andererseits konvergiert aber xn( j(k)) = −1 − 1 n( j(k)) wegen n( j(k)) ≥ k gegen −1. Also muss x = −1. Ist J2 unendlich, so folgt analog x = 1. Jedenfalls haben wir gezeigt, dass −1, 1 die einzigen Häufungspunkte sind. Aus Proposition 5.2.3 folgt schließlich lim inf xn = −1, lim sup xn = 1. n→∞ n→∞ Folgender Satz ist ein sehr wichtiges Ergebnis der Analysis. 5.2.5 Satz (Bolzano1 -Weierstraß2 ). Sei (xn )n∈N eine beschränkte Folge in R p (versehen mit der euklidischen Metrik). Dann hat (xn )n∈N einen Häufungspunkt. 1 Bernard 2 Karl Bolzano. 5.10.1781 Prag - 18.12.1848 Prag Theodor Wilhelm Weierstraß. 31.10.1815 Ostenfelde (Westfalen) - 19.12.1897 Berlin KAPITEL 5. GEOMETRIE METRISCHER RÄUME 106 Beweis. Wir zeigen den Satz durch vollständige Induktion nach p. Für Folgen in R folgt der Satz aus Proposition 5.2.3. Angenommen der Satz gilt für p ∈ N. Sei (xn )n∈N eine beschränkte Folge in R p+1 , wobei xn = (xn,1 , . . . , xn,p+1 ). Aus der Definition von d2 folgt für alle n ∈ N |xn,p+1 | ≤ d2 (0, xn ) und d2 (0, (xn,1, . . . , xn,p ))2 ≤ d2 (0, xn ) . | {z } ∈R p Da (xn )n∈N in R p+1 beschränkt ist, sind es auch (xn,p+1 )n∈N in R und (xn,1 , . . . , xn,p ) n∈N in R p . Da wir den Satz im Fall p = 1 schon gezeigt haben, gibt es eine in R konvergente Teilfolge (xn( j),p+1 ) j∈N von (xn,p+1 )n∈N . Laut Induktionsvoraussetzung hat dann aber auch (xn( j),1 , . . . , xn( j),p ) j∈N eine konvergente Teilfolge (xn( j(k)),1 , . . . , xn( j(k)),p ) k∈N in Rp . Man beachte, dass (xn( j(k)),p+1 )k∈N als Teilfolge der konvergenten Folge (xn( j),p+1 ) j∈N auch konvergiert. Nach Proposition 3.6.1 konvergiert daher auch (xn( j(k)) )k∈N in R p+1 . ❑ 5.2.6 Definition. Sei hX, di ein metrischer Raum, und sei K ⊆ X mit der Eigenschaft, dass jede Folge (xn )n∈N aus K einen Häufungspunkt in K hat. Dann heißt K kompakt. 5.2.7 Beispiel. Man betrachte R. Die Teilmenge N von R ist nicht kompakt, da die Folge (n)n∈N keine konvergente Teilfolge besitzt. Das Intervall (0, 1] ist auch nicht kompakt, da die Folge ( n1 )n∈N gegen 0 konvergiert und somit in (0, 1] keinen Häufungspunkt besitzt. Ist K ⊆ R p eine abgeschlossene und beschränkte Menge, so hat nach Satz 5.2.5 jede Folge einen Häufungspunkt, der nach Proposition 5.1.15 zu K gehört. Insbesondere sind alle abgeschlossenen Intervalle [a, b] in R und allgemeiner alle abgeschlossenen Kugeln Kr (x) in R p kompakt. Wir sammeln einige elementare Eigenschaften von kompakten Teilmengen. 5.2.8 Proposition. Sei hX, di ein metrischer Raum. Dann gilt: (i) Ist K ⊆ X kompakt, dann ist K abgeschlossen. (ii) Ist K ⊆ X kompakt, und F ⊆ X abgeschlossen, sodass F ⊆ K, dann ist auch F kompakt. (iii) Kompakte Teilmengen sind beschränkt. Beweis. (i) Wir verwenden Proposition 5.1.15. Sei x = limn→∞ xn für eine Folge aus K. Nun gibt es definitionsgemäß eine gegen ein y ∈ K konvergente Teilfolge von (xn )n∈N . Andererseits konvergieren Teilfolgen von gegen x konvergenten Folgen ebenfalls gegen x. Nun sind aber Grenzwerte eindeutig. Also gilt x = y ∈ K. 5.2. KOMPAKTHEIT 107 (ii) Sei F ⊆ K abgeschlossen. Ist (xn )n∈N eine Folge aus F, so ist sie trivialerweise auch eine Folge aus K. Also gilt x = lim j→∞ xn( j) für eine Teilfolge (xn( j) ) j∈N und ein x ∈ K. Nun ist aber F abgeschlossen, und somit folgt aus Proposition 5.1.15, dass x ∈ F. Also enthält jede Folge in F eine gegen einen Punkt in F konvergente Teilfolge. (iii) Sei y ∈ X. Wäre K nicht beschränkt, so wäre auch {d(y, x) : x ∈ K} ⊆ R nicht beschränkt. Also könnten wir zu jedem n ∈ N ein xn ∈ K finden, sodass d(y, xn ) ≥ n. Aus der Kompaktheit folgt die Existenz einer konvergenten Teilfolge xn( j) → x, j → ∞. Aus Lemma 3.2.10 folgt d(y, xn( j) ) → d(y, x). Das widerspricht aber d(y, xn( j) ) ≥ n( j), j ∈ N. ❑ Aus Proposition 5.2.8 und Beispiel 5.2.7 erhalten wir folgende Charakterisierung für die Kompaktheit einer Teilmenge von R p . Diese Charakterisierung der Kompaktheit gilt jedoch nicht in allen metrischen Räumen. 5.2.9 Korollar. Eine Teilmenge K von R p ist genau dann kompakt, wenn sie abgeschlossen und beschränkt ist. 5.2.10 Beispiel. Das Intervall (−∞, c] mit c ∈ R ist zwar abgeschlossen, aber nicht beschränkt in R und somit nicht kompakt. Die Menge M = {(x, y) ∈ R2 : 2x2 + 4x + y2 − y − 3 ∈ [7, 13]} ist kompakt in R2 versehen mit d2 . Wegen Korollar 5.2.9 müssen wir zeigen, dass M abgeschlossen und beschränkt ist. Dazu ((ξn , ηn ))n∈N sei eine beliebige Folge aus M mit Grenzwert (ξ, η) ∈ R2 . Können wir nun zeigen, dass (ξ, η) ∈ M, so ist M gemäß Proposition 5.1.15 abgeschlossen. Wegen (ξn , ηn ) ∈ M gilt für alle n ∈ N 7 ≤ 2ξn2 + 4ξn + η2n − ηn − 3 ≤ 13 . Für n → ∞ folgt mit Proposition 3.6.1 und Lemma 3.3.1 7 ≤ 2ξ2 + 4ξ + η2 − η − 3 ≤ 13 , und somit tatsächlich (ξ, η) ∈ M. Um die Beschränktheit zu zeigen, bemerken wir zunächst, dass für (x, y) ∈ R2 2x2 + 4x + y2 − y − 3 = 1 1 1 21 2(x + 1)2 + (y − )2 − 3 − 2 − ≥ (x + 1)2 + (y − )2 − . 2 4 2 4 Damit ist M in der Menge n o 21 1 ≤ 13 = (x, y) ∈ R2 : (x + 1)2 + (y − )2 − 2 4 r n 73 o 1 2 (x, y) ∈ R : d s ((x, y), (−1, )) ≤ , 2 4 108 KAPITEL 5. GEOMETRIE METRISCHER RÄUME also in der abgeschlossenen Kugel K √ 73 ((−1, 21 )) in R2 bzgl. d2 enthalten. 4 Wir wollen diesen Abschnitt mit einem Konvergenzkriterium für Folgen beenden. 5.2.11 Lemma. Eine Folge (xn )n∈N in einem metrischen Raum hX, di konvergiert genau dann gegen einen Punkt x ∈ X, wenn jede Teilfolge von (xn )n∈N den Punkt x als Häufungspunkt hat – oder äquivalent wenn jede Teilfolge von (xn )n∈N wiederum eine Teilfolge hat, die gegen x konvergiert. Gilt {xn : n ∈ N} ⊆ K für eine kompakte Teilmenge K von X, so ist die Konvergenz von (xn )n∈N gegen x sogar dazu äquivalent, dass (xn )n∈N höchstens x als Häufungspunkt hat. Beweis. Falls x = limn→∞ xn , so ist x nach Lemma 5.2.2 der einzige Häufungspunkt von (xn )n∈N und auch von allen ihren Teilfolgen. Falls (xn )n∈N nicht gegen x konvergiert, so bedeutet das ∃ǫ > 0 : ∀N ∈ N ∃n ≥ N, d(xn , x) ≥ ǫ . Daraus definieren wir induktiv eine Teilfolge (xn(k) )k∈N . Sei n(1) ∈ N, sodass d(xn(1) , x) ≥ ǫ. Ist n(k) ∈ N definiert, so sei n(k + 1) die kleinste Zahl in N, sodass n(k + 1) ≥ n(k) + 1 und d(xn(k+1) , x) ≥ ǫ. Nun kann (xn(k) )k∈N den Punkt x nicht als Häufungspunkt haben, da wir sonst für die entsprechende Teilfolge den Widerspruch 0 = d(x, x) = lim d(x, xn(k( j)) ) ≥ ǫ. j→∞ erhielten. Somit haben wir den ersten Teil des Lemmas gezeigt. Gilt nun {xn : n ∈ N} ⊆ K für eine kompakte Teilmenge K von X, so hat (xn(k) )k∈N immer mindestens einen Häufungspunkt y, der auch Häufungspunkt von (xn )n∈N ist. Falls diese nur höchstens x als Häufungspunkt hat, so muss y = x sein, und wir erhalten wie oben einen Widerspruch. ❑ 5.3 Gerichtete Mengen und Netze Bei der Motivation des Grenzwertbegriffes für Folgen haben wir gesagt eine Folge (xn )n∈N solle konvergent gegen x heißen, wenn für alle hinreichend großen Indizes das Folgenglied xn beliebig nahe an x herankommt. Für den weiteren Aufbau der Analysis verwenden wir ähnliche Grenzwertbegriffe z.B. für Funktionen f : (a, b) → R. Dabei soll f (t) konvergent für t → b gegen x heißen, wenn f (t) beliebig nahe an x herankommt, sobald t nur hinreichend nahe an b zu liegen kommt. Um nicht jedes Mal eine neue Konvergenztheorie aufbauen zu müssen, wollen wir einen allgemeinen Grenzwertbegriff einführen, von dem alle von uns benötigten Grenzwertbegriffe Spezialfälle sind. Was bei den Folgen die natürlichen Zahlen waren, ist bei unserem allgemeinen Konzept die gerichtete Menge. 5.3.1 Definition. Sei I eine nicht leere Menge, und sei eine Relation auf I. Dann heißt (I, ) eine gerichtete Menge, wenn folgender drei Bedingungen genügt. 5.3. GERICHTETE MENGEN UND NETZE 109 Reflexivität: ∀i ∈ I : i i Transitivität: ∀i, j, k ∈ I : i j ∧ j k ⇒ i k Richtungseigenschaft: ∀i, j ∈ I ∃k ∈ I : i k ∧ j k. (5.2) An dieser Stelle sei explizit herausgehoben, dass wir hier weder Symmetrie noch Antisymmetrie fordern. Im Allgemeinen muss (I, ) auch keine Totalordnung sein. 5.3.2 Beispiel. (i) Neben (N, ≤) ist jede Totalordnung eine gerichtete Menge. Also etwa ((0, +∞), ≤), ((a, b), ≥), ((a, b), ≤), wobei a, b ∈ R, a < b. Die Eigenschaft (5.2) wird bei einer Totalordnung zum Beispiel vom Maximum zweier Elemente erfüllt. (ii) Sei a, b, c ∈ R, a < b < c. Setze I := [a, b) ∪ (b, c] und definiere eine Relation auf I durch x y : ⇐⇒ |y − b| ≤ |x − b| . Dann ist reflexiv, transitiv, und je zwei Punkte sind vergleichbar. Also ist hI, i eine gerichtete Menge. Man beachte, dass nicht antisymmetrisch und somit keine Halbordnung ist. (iii) Die gerichtete Menge aus dem letzten Beispiel ist ein Spezialfall des folgenden Konzeptes. Sei hX, dX i ein metrischer Raum, D ⊆ X und z ein Häufungspunkt von D. Auf D \ {z} definieren wir durch x y : ⇐⇒ dX (y, z) ≤ dX (x, z) Mit dieser Relation wird D\{z} zu einer gerichteten Menge, wobei – salopp gesagt – ein Punkt bezüglich der Relation weiter oben als ein anderer ist, wenn er näher an z liegt. (iv) Ist M eine nichtleere Menge, so ist die Potenzmenge P(M) versehen mit ⊆ eine gerichtete Menge. Die Menge E(M) aller endlichen Teilmengen von M versehen mit ⊆ ist ebenfalls eine gerichtete Menge. (v) Wir nennen eine endliche Teilmenge Z eines Intervalls [a, b] eine Zerlegung dieses Intervalls, wenn a, b ∈ Z. Die Menge aller solchen Zerlegungen wird mit Z bezeichnet. Versieht man Z mit der Relation ⊆, so erhalten wir eine gerichtete Menge. KAPITEL 5. GEOMETRIE METRISCHER RÄUME 110 n(R) (vi) Wir nennen das Paar R = ((ξ j )n(R) j=0 ; (η j ) j=1 ) eine Riemann-Zerlegung eines Intervalls [a, b], falls a = ξ0 < ξ1 < · · · < ξn(R) = b; η j ∈ [ξ j−1 , ξ j ], j = 1, . . . , n(R), und nennen |R| := max{(ξ j − ξ j−1 ) : j = 1, . . . , n(R)} die Feinheit der Zerlegung. Weiters sei R1 R2 :⇔ |R2 | ≤ |R1 |. Ist R die Menge aller solcher Zerlegungen, dann ist (R, ) eine gerichtete Menge. In diesem Beispiel ist sicher nicht antisymmetrisch. Dieser gerichteten Menge und der aus dem letzten Beispiel werden wir bei der Einführung das Integrals wieder begegnen. (vii) Sei I = N × N und (n1 , m1 ) (n2 , m2 ) :⇔ n1 ≤ n2 ∧ m1 ≤ m2 . (5.3) Dann ist (I, ) eine gerichtete Menge. Diese gerichtete Menge dient für Konvergenzbetrachtungen bei Doppelfolgen. (viii) Sind allgemeiner I und J gerichtete Mengen versehen mit Relationen I bzw. J , dann ist (I × J, ) ebenfalls eine gerichtete Menge, wenn wir (i1 , j1 ) (i2 , j2 ) :⇔ i1 I i2 ∧ j1 J j2 (5.4) definieren. 5.3.3 Definition. In Analogie zu den Folgen nennen wir eine Abbildung x : I → X ein Netz bzw. eine Moore-Smith-Folge in der Menge X über der gerichteten Menge (I, ), und schreiben diese als (xi )i∈I . Entsprechend Definition 3.2.2 sagen wir, dass ein Netz (xi )i∈I in einem metrischen Raum hX, di gegen einen Punkt x ∈ X konvergiert, falls ∀ǫ > 0 ∃i0 ∈ I : d(xi , x) < ǫ für alle i i0 . (5.5) In diesem Falle schreiben wir x = lim xi . i∈I 5.3.4 Beispiel. (i) Wie bei den Folgen sieht man, dass konstante Netze xi = x, i ∈ I, immer gegen x konvergieren. (ii) Als konkreteres Beispiel betrachte man die gerichtete Menge ([−1, 0) ∪ (0, 1], ), wobei x y ⇔ |y| ≤ |x|, und f (t) = t2 . Dann konvergiert das Netz ( f (t))t∈[−1,0)∪(0,1] gegen Null: p p Zu gegebenen ǫ > 0 sei t0 = 2ǫ . Aus t t0 folgt |0− f (t)| = |t2 | ≤ |t02 | = 2ǫ 2 < ǫ. (iii) Hat eine gerichtete Menge (I, ) mindestens ein maximales Element, dh. es gibt ein j ∈ I mit j i für alle i ∈ I, – das ist wegen (5.2) sicher der Fall, wenn I endlich ist –, so konvergiert ein Netz (xi )i∈I genau dann, wenn x j = xk für alle maximalen j, k ∈ I, und zwar gegen x j , wobei j ∈ I ein solch maximales Element ist. Insbesondere konvergiert (xi )i∈I , wenn es genau ein maximales Element j in I gibt und zwar gegen x j . 5.3. GERICHTETE MENGEN UND NETZE 111 (iv) Man überzeugt sich leicht, dass eine Folge (xn )n∈N in einem metrischen Raum hX, di genau dann eine Cauchy-Folge ist, wenn lim(m,n)∈N×N d(xm , xm ) = 0, wobei N × N wie in (5.3) gerichtet ist. Für Netze gelten viele der für Folgen hergeleiteten Ergebnisse. Die Beweise sind im Wesentlichen die selben, wie für Folgen. Meist muss nur ≤ durch ersetzt werden. 5.3.5 Fakta. 1. Der Grenzwert ist eindeutig – vgl. Satz 3.2.8, (i) : Ist (xi )i∈I ein Netz, und sei angenommen, dass xi → x und xi → y mit x , y. Setze ǫ := d(x,y) > 0. Dann gibt es wegen xi → x einen Index i1 , sodass für alle 3 i ∈ I mit i1 i gilt d(xi , x) < ǫ. Wegen xi → y gibt es auch i2 ∈ I, sodass für alle i ∈ I mit i2 i gilt d(xi , y) < ǫ. Für i ∈ I mit i1 i und i2 i – solche gibt es gemäß (5.2) – erhalten wir den Widerspruch d(x, y) ≤ d(x, xi ) + d(xi , y) < 2 d(x, y) . 3 2. Die Tatsache, dass es bei Folgen auf endlich viele Glieder nicht ankommt, hat auch eine Verallgemeinerung für Netze; siehe Satz 3.2.8, (ii). Ist nämlich k ∈ I, so ist auch (Ik , ) mit Ik = {i ∈ I : k i} eine gerichtete Menge und lim xi = lim xi , i∈I i∈Ik (5.6) wobei der rechte Grenzwert genau dann existiert, wenn der linke existiert. 3. Im Allgemeinen sind konvergente Netze nicht beschränkt. Aber da ein gegen ein x konvergentes Netz {xi : i i0 } ⊆ Uǫ (x) für ein i0 ∈ I erfüllt, ist zumindest das Netz (xi )i∈Ii0 beschränkt. 4. Man betrachte zwei Netze (xi )i∈I , (yi )i∈I über derselben gerichteten Menge (I, ) in einem metrischen Raum hX, di, die gegen x bzw. y konvergieren. Dann gilt (siehe Lemma 3.2.10) lim d(xi , yi ) = d(x, y). (5.7) i∈I Eine genauere Betrachtung verdient das Analogon von Teilfolgen. 5.3.6 Definition. Sind (I, I ) und (J, J ) zwei gerichtete Mengen, ist X eine Menge und (xi )i∈I ein Netz in X, so heißt (xi( j) ) j∈J eine Teilnetz von (xi )i∈I , wenn i : J → I derart ist, dass3 ∀i0 ∈ I ∃ j0 ∈ J : ∀ j J j0 ⇒ i( j) I i0 . Ist (J, J ) = (N, ≤), so heißt (xi( j) ) j∈J = (xi(n) )n∈N eine Teilfolge 4 . 5.3.7 Lemma. Sei hX, di ein metrischer Raum, (I, ) eine gerichtete Menge und (xi )i∈I ein Netz in X. Ist (J, J ) eine weitere gerichtete Menge derart, dass (xi( j) ) j∈J ein Teilnetz von (xi )i∈I ist, so folgt aus x = limi∈I xi , dass auch x = lim j∈J xi( j) . 3 Dies ist eigentlich eine Bedingung an die gerichteten Mengen (I, ) und (J, ) und nicht an das konI J krete Netz. 4 Im Gegensatz zu Teilfolgen von Folgen verlangen wir hier nicht, dass i : N → I streng monoton ist. KAPITEL 5. GEOMETRIE METRISCHER RÄUME 112 Beweis. Ist x = limi∈I xi , und ǫ > 0, so gibt es ein i0 ∈ I, sodass d(x, xi ) < ǫ wenn i i0 . Ist nun j0 ∈ J, sodass i( j) i0 für alle j J j0 , so folgt d(x, xi( j) ) < ǫ wenn j J j0 . Also gilt x = lim j∈J xi( j) . ❑ 5.3.8 Fakta. Wir zählen einige Sätze, Rechenregeln, etc. auf, die wir für Folgen hergeleitet haben, und die sich auf Netze mit praktisch denselben Beweisen übertragen lassen. 1. Sind (xi )i∈I und (yi )i∈I 5 konvergente Netze in R, und gilt xi ≤ yi für alle i, die k für ein k ∈ I sind, so folgt (vgl. Lemma 3.3.1) lim xi ≤ lim yi . i∈I (5.8) i∈I Ist umgekehrt limi∈I xi < limi∈I yi , so gilt xi < yi für alle i k mit einem gewissen k ∈ I. 2. Seien (xi )i∈I , (yi )i∈I und (ai )i∈I Netze in R über derselben gerichteten Menge, sodass xi ≤ ai ≤ yi für alle i i0 mit einem gewissen i0 ∈ I. Gilt lim xi = lim yi , i∈I i∈I so existiert auch der Grenzwert limi∈I ai und stimmt mit dem gemeinsamen Grenzwert von (xi )i∈I und (yi )i∈I überein; vgl. Satz 3.3.2. 3. Für zwei konvergente Netze (zi )i∈I und (wi )i∈I über derselben gerichteten Menge (I, ) in R oder in C gilt lim(zi + wi ) = (lim zi ) + (lim wi ) , lim(zi · wi ) = (lim zi ) · (lim wi ) , i∈I i∈I i∈I i∈I i∈I i∈I (5.9) lim −zi = − lim zi , lim |zi | = lim zi . i∈I i∈I i∈I i∈I Da Netze i.A. nicht beschränkt sind, verläuft der Beweis für · eine Spur anders, als im Beweis von Satz 3.3.5: Sei ǫ > 0 oBdA. so, dass ǫ ≤ 1. Seien i1 , i2 so groß, dass i i1 ⇒ |zi − z| < ǫ und i i2 ⇒ |wi − w| < ǫ. Insbesondere gilt für solche i auch |wi | ≤ |w| + ǫ ≤ |w| + 1. Gemäß Definition 5.3.1 gibt es ein i0 i1 , i2 . Für i i0 folgt |zi wi − zw| = |(zi − z)wi + z(wi − w)| ≤ |zi − z| · |wi | + |z| · |wi − w| < ǫ|wi | + |z|ǫ ≤ (|w| + 1 + |z|)ǫ. In Analogie zu (3.4) folgt daraus zi wi → zw, i ∈ I. 4. Ist (zi )i∈I ein Netz in R oder C, sodass zi , 0, i ∈ I, und limi∈I zi = z , 0. Dann folgt limi∈I z1i = 1z ; vgl. Satz 3.3.5. 5 Klarerweise ist dabei nicht ausgeschlossen, dass eines dieser Netze konstant ist. 5.3. GERICHTETE MENGEN UND NETZE 113 5. Ist (xi )i∈I ein monoton wachsendes Netz in R, dh. i j ⇒ xi ≤ x j und ist {xi : i ∈ I} nach oben beschränkt, so folgt (vgl. Satz 3.4.2) lim xi = sup{xi : i ∈ I} . i∈I (5.10) Entsprechende Aussagen gelten für monoton fallende Netze. Zum Nachweis von (5.10) wollen wir hier den Beweis angeben, der fast wörtlich der selbe, wie für Satz 3.4.2 ist. Da (xi )i∈I nach oben beschränkt ist, existiert x := sup{xi : i ∈ I}. Wir zeigen, dass limi∈I xi = x. Sei ǫ > 0. Wegen x − ǫ < x kann x − ǫ keine obere Schranke der Menge {xi : i ∈ I} sein. Es gibt also ein i0 ∈ I mit xi0 > x − ǫ. Wegen der Monotonie folgt auch xi > x − ǫ für alle i i0 . Da stets x ≥ xi gilt, erhält man für i i0 0 ≤ x − xi < ǫ, und damit |xi − x| < ǫ. 6. Sei (xi )i∈I ein Netz von Punkten xi = (xi,1 , . . . , xi,p ) ∈ R p , und y = (y1 , . . . , y p ) ∈ R p . Dann gilt limi∈I xi = y bezüglich einer der Metriken d1 , d2 oder d∞ genau dann, wenn lim xi,k = yk für alle k = 1, . . . , p . (5.11) i∈I 5.3.9 Bemerkung. Genauso wie für Folgen kann man definieren, was es heißt, dass ein reellwertiges Netz (xi )i∈I gegen ±∞ konvergiert: ∀M > 0 ∃i0 ∈ I : ±xi > M für alle i i0 . Offenbar schließt sich die Konvergenz von (xi )i∈I gegen +∞ und gegen −∞ gegenseitig aus. Genauso kann (xi )i∈I nicht gleichzeitig gegen ±∞ und gegen eine reelle Zahl konvergieren. Ist (xi )i∈I ein Netz in R und x ∈ R oder x = ±∞, so kann man x = limi∈I xi einheitlich folgendermaßen schreiben: (∀ξ ∈ R, ξ < x ∃i0 ∈ I : ∀i i0 ⇒ xi > ξ) ∧ (∀η ∈ R, η > x ∃i0 ∈ I : ∀i i0 ⇒ xi < η). (5.12) Es gelten sinngemäß die Aussagen in Satz 3.7.3 auch für reellwertige Netze (xi )i∈I , (yi )i∈I : (i) Gilt yi ≥ K für alle i k mit festen K ∈ R, k ∈ I, so folgt aus limi∈I xi = +∞ auch limi∈I (xi + yi ) = +∞. (ii) Gilt yi ≥ C für alle i k mit festen C > 0, k ∈ I, so folgt aus limi∈I xi = +∞ auch limi∈I (xi · yi ) = +∞. (iii) Ist xi ≤ yi für alle i k mit festem k ∈ I, so folgt aus limi∈I xi = +∞ auch limi∈I yi = +∞. (iv) limi∈I xi = +∞ ⇔ limi∈I (−xi ) = −∞. (v) Gilt yi > 0 (yi < 0) für alle i k mit festem k ∈ I, so gilt limi∈I yi = +∞ (limi∈I yi = −∞) genau dann, wenn limi∈I y1i = 0. 114 KAPITEL 5. GEOMETRIE METRISCHER RÄUME (vi) Sei (yi )i∈I monoton wachsend (fallend). Ist (yi )i∈I nach oben (nach unten) beschränkt, so ist dieses Netz konvergent gegen eine reelle Zahl. Im anderen Fall gilt limi∈I yi = +∞ (limi∈I yi = −∞). In der Tat gibt es zu jedem M > 0 ein i0 ∈ I mit yi0 > M. Wegen der Monotonie folgt auch yi ≥ yi0 > M für alle i i0 . Schließlich wollen wir das Analogon zu Cauchy-Folge betrachten. 5.3.10 Definition. Sei hX, di ein metrischer Raum und (I, ) eine gerichtete Menge. Dann heißt ein Netz (xi )i∈I in X Cauchy-Netz, wenn ∀ǫ > 0 ∃i0 ∈ I : d(xi , x j ) < ǫ ∀i, j i0 . (5.13) Die Bedingung (5.13) ist offenbar zu lim(i, j)∈I×I d(xi , x j ) = 0 äquivalent, wenn man I × I wie in (5.4) zu einer gerichteten Menge macht. Für Folgen ist (5.13) genau die Cauchy-Folgen Bedingung. Also liegt die Aussage des nächsten Lemma nahe. 5.3.11 Lemma. In einem metrischen Raum ist jedes konvergente Netz auch ein Cauchy-Netz. In einem vollständigen metrischen Raum ist ein Netz genau dann konvergent, wenn es ein Cauchy-Netz ist. Beweis. Ist (xi )i∈I ein Netz, und konvergiert dieses gegen x ∈ X, so gibt es zu jedem ǫ > 0 ein i0 ∈ I, sodass d(xi , x) < 2ǫ für i i0 . Wegen der Dreiecksungleichung folgt d(xi , x j ) < ǫ für i, j i0 ; also (5.13). Gilt umgekehrt (5.13) in einem vollständigen metrischen Raum, so definieren wir induktiv eine Folge in ∈ I, n ∈ N, durch die Forderung, dass 1 , i, j in , n indem wir zuerst i1 ∈ I so wählen, dass d(xi , x j ) < 1 für i, j i1 . Zu gegebenem in ∈ I 1 wähle dann gemäß (5.13) jn+1 ∈ I so, dass d(xi , x j ) < n+1 für i, j jn+1 . Nun sei in+1 ∈ I gemäß (5.2) so gewählt, dass in+1 in , jn+1 . Offensichtlich ist (xin )n∈N eine Cauchy-Folge und damit konvergent gegen ein x ∈ X. Ist n ≤ m, so folgt aus d(xim , xin ) < 1n durch Grenzübergang m → ∞ die Tatsache, dass d(x, xin ) ≤ n1 , n ∈ N. Ist nun ǫ > 0, so wähle n ∈ N, sodass n2 ≤ ǫ. Für i in folgt in+1 in und d(xi , x j ) < d(x, xi ) ≤ d(x, xin ) + d(xin , xi ) < bzw. xi ∈ Uǫ (x), und somit konvergiert (xi )i∈I gegen x. 2 ≤ ǫ, n ❑ 5.4 Unbedingte Konvergenz und Umordnen von Reihen Ist M irgendeine Menge und ist jedem i ∈ M eine Zahl ai aus R oder C zugeordnet, P so eröffnet uns der Begriff des Netzes eine Möglichkeit Ausdrücken wie i∈M ai sogar einen Sinn zu geben, wenn M nicht endlich und nicht abzählbar unendlich ist. 5.4. UNBEDINGTE KONVERGENZ UND UMORDNEN VON REIHEN 115 Ist M abzählbar unendlich, so könnten wir einfach eine Bijektion σ : N → M P P hernehmen und i∈M ai einfach als ∞ n=1 aσ(n) definieren. Das hat aber den Schönheitsfehler, dass diese Definition von dem σ abhängt. 5.4.1 Beispiel. Sei M = N und a j = alternierende harmonische Reihe (−1) j+1 j S := für j ∈ M. Ist σ = idN so erhalten wir die ∞ X (−1)n+1 n=1 n , welche nach dem Leibnizkriterium, Korollar 3.9.7, konvergiert. Ordnen wir die Summanden in einer anderen Reihenfolge an, dh. betrachten wir die Bijektion σ : N → N definiert durch σ(3k − 2) = 2k − 1, σ(3k − 1) = 4k − 2, σ(3k) = 4k für k ∈ N, so erhalten wir ∞ X (−1)σ(n)+1 n=1 σ(n) 1 1 1 1 1 1 1 1 1 1 1 − + − − +... = =1− − + − − + − 2 4 | 3 {z6} 8 | 5 {z10 7 {z14} 16 |{z} } 12 | = 12 = 61 1 = 14 1 = 10 S 1 1 1 1 1 1 1 1 1 1 1 1 1 1 − + − + − + − +... = 1− + − + − +... = . 2 4 6 8 10 12 14 16 2 2 3 4 5 6 2 Die Summe einer Reihe kann also von der Reihenfolge der Summanden abhängen. Tatsächlich kann man eine konvergente aber nicht absolut konvergente Reihe stets so umordnen, dass jede beliebige Summe einschließlich ±∞, oder gar eine divergente Reihe, herauskommt, vgl. Satz 5.4.6. Zu der nichtleeren Menge M sei E = E(M) die Menge aller endlichen Teilmengen von M. Setzt man A B :⇔ A ⊆ B, so ist (E, ) eine gerichtete Menge, denn ⊆ ist Reflexivität und Transitivität sind klar. Sind A, B ∈ E, so folgt A ∪ B ∈ E und A, B ⊆ A ∪ B. Also ist auch (5.2) erfüllt. 5.4.2 Definition. Sei M , ∅ und sei a j für jedes j ∈ M eine reelle bzw. komplexe P P Zahl. Falls das Netz ( j∈A a j )A∈E in R bzw. C konvergiert, so sagen wir, dass j∈M a j 6 unbedingt konvergiert und setzen X X aj . a j = lim j∈M A∈E j∈A Ist s dieser Grenzwert, so bedeutet das also X ∀ǫ > 0 ∃A0 ⊆ M, A0 endlich : ∀A ⊇ A0 , A endlich ⇒ a j − s < ǫ. (5.14) j∈A Der Ausdruck “unbedingte Konvergenz rührt daher, dass es bei diesem Grenzwert” begriff nicht darauf ankommt, in welcher Reihenfolge aufsummiert wird; siehe Fakta 5.4.3, 4. 5.4.3 Fakta. 6 Die Summe über die leere Indexmenge sei dabei per definitionem Null. KAPITEL 5. GEOMETRIE METRISCHER RÄUME 116 1. Man zeigt ganz einfach, dass für unbedingt konvergente Reihen Rechenregeln gelten, die denen in Korollar 3.8.3 entsprechen, dh. (λ, µ, a j , b j ∈ R (C), j ∈ M) X X X (λa j + µb j ) = λ a j + µ b j j∈M j∈M j∈M in dem Sinn, dass die linke Seite unbedingt konvergiert, wenn die Summen rechts es tun. P 2. Das Netz ( j∈A |a j |)A∈E ist offenbar monoton wachsend. Gemäß (5.10) ist es also genau denn konvergent, falls es beschränkt ist, dh. X |a j | ≤ C für alle A ∈ E (5.15) j∈A mit einem festen C > 0. Dabei gilt X X |a j | = sup |a j |. j∈M A∈E j∈A P Falls (5.15) nicht gilt, so konvergiert ( j∈A |a j |)A∈E im Sinne von Bemerkung P 5.3.9 gegen +∞. Wir schreiben j∈M |a j | = +∞ dafür. P Gilt konvergiert auch j∈M a j unbedingt, denn ist A0 ∈ E so groß, dass P (5.15), so P j∈A |a j | − j∈B |an | < ǫ, wenn A0 ⊆ A, B ∈ E (vgl. Lemma 5.3.11), so gilt auch7 X X X X X X X a j − a j = |a j | = aj − a j ≤ |a j | − |an | < ǫ . j∈A j∈B j∈A△B j∈A∪B j∈A∩B j∈A\B j∈B\A P Als Cauchy-Netz konvergiert somit ( j∈A a j )A∈E . P 3. Ist P ⊆ M eine nichtleere Teilmenge und konvergiert j∈M a j unbedingt, so P P tut es auch j∈P a j , denn aus der Konvergenz von ( j∈A a j )A∈E(M) folgt, dass dieses Netz auch ein Cauchy-Netz ist. Ist nun ǫ > 0 und A0 ∈ E(M), sodass aus A0 ⊆ A, B ∈ E(M) die Ungleichung X X a j − a j < ǫ, j∈A j∈B folgt, so folgt aus A0 ∩ P ⊆ C, D ∈ E(P) zunächst A0 ⊆ C ∪ A0 , B ∪ A0 ∈ E(M) und damit X X X X X X a j − a j = a j + aj − aj − a j = j∈C j∈D j∈C j∈D j∈A0 \P j∈A0 \P X X a j < ǫ. aj − j∈C∪A0 Also ist auch ( gent. 7A △ P j∈A j∈D∪A0 a j )A∈E(P) ein Cauchy-Netz und wegen Lemma 5.3.11 konver- B = A \ B ∪ B \ A ist die symmetrische Mengendifferenz von A und B. 5.4. UNBEDINGTE KONVERGENZ UND UMORDNEN VON REIHEN 117 4. Ist M̃ eine weitere Menge – es kann auch M̃ = M sein – und σ : M̃ → M eine P P Bijektion, so konvergiert j∈M a j genau dann unbedingt, wenn j∈ M̃ aσ( j) es tut. Denn ist ǫ > 0 und A0 , sodass (5.14) gilt, und ist σ−1 (A0 ) ⊆ A ∈ E( M̃), so folgt wegen A0 ⊆ σ(A) ∈ E(M) X X X aσ( j) − s = aσ( j) − s = ak − s < ǫ . j∈A σ( j)∈σ(A) k∈σ(A) P Also gilt (5.14) für j∈ M̃ aσ( j) . Die Umkehrung ergibt sich durch dasselbe Argument angewendet auf σ−1 . P 5. Im Falle M = N folgt aus der unbedingten Konvergenz von j∈N a j die KonverP∞ genz von n=1 an im Sinne von Definition 3.8.1 gegen den gleichen Grenzwert. PN P Es ist nämlich ( n=1 a) = ( j∈A(N) a j )N∈N mit A(N) := {1, . . . , N} eine TeilP n N∈N folge des Netzes ( j∈A a j )A∈E(N) im Sinne von Definition 5.3.6, da es zu jedem A ∈ E(N) ein N ∈ N gibt sodass {1, . . . , n} ⊇ A für alle n ≥ N. P P 6. Angenommen ∞ C := ∞ n=1 an konvergiert absolut, dh. n=1 |an | < +∞ konvergiert P im Sinne von Definition 3.8.1, so konvergiert j∈N |a j | auch unbedingt, denn für jedes A ∈ E(N) gibt es ein N ∈ N mit A ⊆ {1, . . . , N}. Wegen X j∈A ist das Netz ( P j∈A |a j | ≤ N X n=1 |an | ≤ C |a j |)A∈E beschränkt. Aus 2 folgt dann auch die unbedingte Konvergenz von P P herigen Punkt gilt dabei j∈N a j = ∞ n=1 an . P j∈N a j . Wegen dem vor- Aus Fakta 5.4.3, 6 und 5 erkennen wir insbesondere, dass für M = N die KonverP P genz von ∞ j∈N |a j | ist. Nun n=1 |an | äquivalent zu der unbedingten Konvergenz von gilt sogar 5.4.4 Satz. Für reelle oder komplexe Koeffizienten a j , j ∈ M, sind folgende Aussagen äquivalent. P j∈M |a j | konvergiert unbedingt. P j∈M a j konvergiert unbedingt. P Für M = N ist das zur absoluten Konvergenz von ∞ n=1 an äquivalent. P Beweis. Wegen Fakta 5.4.3, 2, folgt aus der unbedingten Konvergenz von j∈M |a j | P auch die von j∈M a j . Für die Umkehrung seien die a j zunächst reell. Wir schreiben M als M = { j ∈ M : a j ≥ 0} ∪˙ { j ∈ M : a j < 0} {z } | {z } | =:M+ =:M− KAPITEL 5. GEOMETRIE METRISCHER RÄUME 118 Wegen Fakta 5.4.3, 3 und 1, folgt aus der unbedingten Konvergenz von P P die von C1 := j∈M+ a j und C2 := j∈M− (−a j ). Wegen X X X (−a j ) ≤ C1 + C2 aj + |a j | = j∈A P j∈M a j auch j∈A∩M− j∈A∩M+ P für jedes A ∈ E(M) folgt die unbedingte Konvergenz von j∈M |a j | aus Fakta 5.4.3, 2. P Sind die a j komplex, so folgt aus der unbedingten Konvergenz von j∈M a j mit P P (5.11) auch die von j∈M Re a j und j∈M Im a j . Nach dem schon gezeigten konvergieP P ren dann j∈M | Re a j | und j∈M | Im a j | unbedingt, was wegen |a j | ≤ | Re a j | + | Im a j | P und Fakta 5.4.3, 2, auch die von j∈M |a j | nach sich zieht. P Die Äquivalenz zur absoluten Konvergenz von ∞ n=1 an haben wir schon oben gesehen. ❑ Da für reell- bzw. komplexwertige Reihen absolute und unbedingte Konvergenz dasselbe bedeuten, nennen wir Reihen, die konvergent, aber nicht absolut konvergent sind, auch bedingt konvergent. P 5.4.5 Korollar. Die Reihe ∞ absolut k=1 bk mit reellen oder komplexen Summanden sei P konvergent. Dann ist für jede Bijektion σ : N → N auch die Umordnung ∞ k=1 bσ(k) absolut konvergent und hat die gleiche Summe. Beweis. Das folgt unmittelbar aus Satz 5.4.4 und Fakta 5.4.3, 4. ❑ Nun wollen wir Korollar 5.4.5 umkehren. ∞ P 5.4.6 Satz. Sei die Reihe ak reeller Zahlen konvergent mit der Summe S , aber nicht k=1 absolut konvergent. Dann gibt es zu jeder vorgegebenen Zahl S ′ ∈ R ∪ {±∞} eine ∞ ∞ P P bk = S ′ . Weiters gibt es Umordnungen bk die Umordnung (bk )k∈N , bk = aσ(k) , mit k=1 k=1 divergieren – aber nicht bestimmt divergieren. Beweis. Bezeichne mit a+k := max(ak , 0), a−k := min(ak , 0), d.h. die Folgen der positiven bzw. negativen Terme ak . Wir überlegen zuerst, dass ∞ X ∞ X a+k = +∞, k=1 k=1 a−k = −∞ (5.16) gelten muss. Zunächst sind die Partialsummen dieser Reihen monotone Folgen, haben also einen Grenzwert in R ∪ {±∞}. Angenommen einer der beiden wäre endlich, z.B. ∞ P a+k = S + < ∞. Dann folgt k=1 N X a−k = k=1 und somit N X k=1 N X k=1 | ak |= ak − N X k=1 N X k=1 N→∞ a+k −→ S − := S − S + > −∞. a+k − N X k=1 im Widerspruch zur Voraussetzung, dass N→∞ a−k −→ S + − S − < ∞, ∞ P k=1 ak nicht absolut konvergiert. 5.4. UNBEDINGTE KONVERGENZ UND UMORDNEN VON REIHEN 119 P ′ Sei nun S ′ ∈ R gegeben. Wir konstruieren eine Umordnung ∞ k=1 bk , die gegen S + + + + konvergiert. Zuerst addiert man Summanden a1 , a2 , a3 , . . . , an1 , bis man das erste Mal > S ′ ist, dann Summanden a−1 , a−2 , . . . , a−l1 bis die Gesamtsumme das erste mal wieder < S ′ ist. Dann a+n1 +1 , a+n1 +2 , . . . , a+n2 bis man das erste Mal wieder > S ′ ist. So verfährt man weiter. Wegen (5.16) ist das stets möglich. ∞ P ak . Ist S n′ eine Partialsumme, Man erhält in dieser Weise eine Umordnung von k=1 so ist S n′ − S ′ beschränkt nach oben durch das letzte aufgetretene a+k und nach unten durch das letzte aufgetretene a−k . Wegen lim ak = 0 gilt auch k→∞ lim (S n′ − S ′ ) = 0. n→∞ In analoger Weise verfährt man, wenn man eine Umordnung konstruieren möchte, die bestimmt divergiert gegen +∞ oder −∞, oder nicht einmal bestimmt divergiert. ❑ 5.4.7 Bemerkung. Obiger Beweis verwendet bei der Definition der Umordnung implizit den Rekursionssatz. Die Tatsache, dass die dadurch definierte Funktion bijektiv auf N ist und dass sie das gewünschte leistet, bedarf eigentlich eines strengeren Beweises. Für den interessierten Leser bringen wir anschließend einen wasserdichten Beweis. Wir zeigen wie oben, dass (5.16) zutrifft. Nun sei M1 := {n ∈ N : an ≥ 0}, M2 := {n ∈ N : an < 0}. ˙ 2 . Wäre M1 endlich, so hätten wir a+n = 0 für n > max(M1 ), was aber (5.16) Offensichtlicherweise gilt N = M1 ∪M widerspricht. Also ist M1 und mit einer ganz ähnlichen Argumentation auch M2 unendlich. Nun sei Fn die Menge aller Funktionen f : {1, . . . , n} → N, die folgende beiden Bedingungen erfüllen: (i) 1 ≤ i < j ≤ n, f (i), f ( j) ∈ M1 ⇒ f (i) < f ( j) und 1 ≤ i < j ≤ n, f (i), f ( j) ∈ M2 ⇒ f (i) < f ( j). (ii) f (i) ∈ M1 ⇒ {1, . . . , f (i)} ∩ M1 ⊆ f ({1, . . . , i}) und f (i) ∈ M2 ⇒ {1, . . . , f (i)} ∩ M2 ⊆ f ({1, . . . , i}). Fn ist nicht leer, da - wie man sich leicht überzeugt - die Funktion f (1) = min(M1 ), f (2) = min(M1 \ { f (1)}), . . . , f (n) = min(M1 \ { f (1), .S. . , f (n − 1)}) in dieser Menge liegt. n∈N Fn (⊆ N × N) und definiere g : F → F folgendermaßen: Sei f ∈ F , also f ∈ Fn für ein n ∈ N. Falls Pn Setze F = ′ j=1 a f ( j) < S , so sei g( f ) : {1, . . . , n + 1} → N die Fortsetzung von f , sodass g( f )(n + 1) = min(M1 \ f ({1, . . . , n})). Diese Fortsetzung liegt tatsächlich in Fn+1 ⊆ F . Um das zu sehen, sei 1 ≤ i < j ≤ n + 1, sodass beide Zahlen g( f )(i), g( f )( j) gleichzeitig entweder in M1 oder in M2 liegen. Ist j ≤ n, dann folgt f (i) = g( f )(i), f ( j) = g( f )( j) ∈ M1 (M2 ) und daher g( f )(i) = f (i) < f ( j) = g( f )( j). Falls j = n+1, dann ist g( f )(n+1) = min(M1 \ f ({1, . . . , n})) ∈ M1 . Wegen i ∈ {1, . . . , n} muss auch g( f )(i) = f (i) ∈ M1 . Falls g( f )(n + 1) ≤ f (i), so wäre nach (ii), g( f )(n + 1) = f (k) für ein k ≤ i ≤ n, und damit g( f )(n + 1) = f (k) < M1 \ f ({1, . . . , n}), was aber nicht sein kann. Also gilt g( f )(n + 1) > f (i) und g( f ) erfüllt (i). Um (ii) zu zeigen, sei g( f )(i) ∈ M1 (M2 ) für ein i ∈ {1, . . . , n + 1}. Falls i ≤ n, so folgt {1, . . . , g( f )(i)} ∩ M1 = {1, . . . , f (i)} ∩ M1 ⊆ f ({1, . . . , i}) = g( f )({1, . . . , i}). Dasselbe gilt für M2 . Sei nun i = n + 1. Dann ist g( f )(n + 1) ∈ M1 . Ist k ∈ M1 mit k < g( f )(n + 1), so muss k in f ({1, . . . , n}) sein, da wir sonst P den Widerspruch g( f )(n + 1) = min(M1 \ f ({1, . . . , n})) ≤ k bekämen. Ist dagegen nj=1 a f ( j) ≥ S ′ , so sei g( f ) : {1, . . . , n + 1} → N die Fortsetzung von f , sodass g( f )(n + 1) = min(M2 \ f ({1, . . . , n})). Man zeigt genauso wie oben, dass auch in diesem Fall g( f ) ∈ Fn+1 ⊆ F . Ist nun noch a ∈ F1 definiert durch a(1) = 1, so gibt es nach dem Rekursionssatz (Satz 2.3.3) eine Abbildung φ : N → F , sodass φ(1) = a und φ(n + 1) = g(φ(n)). Wir setzen σ= [ φ(n). n∈N Durch vollständige Induktion zeigt man leicht, dass φ(n) ∈ Fn und dass φ(m) eine Fortsetzung von φ(n) für alle m, n ∈ N, m > n ist. Man sieht daher sofort, dass σ : N → N eine Funktion ist, wobei σ|{1,...,n} = φ(n). KAPITEL 5. GEOMETRIE METRISCHER RÄUME 120 Weiters ist σ injektiv, da für i < j ∈ N, unter der zusätzlichen Voraussetzung σ(i), σ( j) ∈ M1 (M2 ) nach (i) die Relation σ(i) = φ(N)(i) < φ(N)( j) = σ( j) mit irgendeinem N ≥ i, j folgt. Ist σ(i) ∈ M1 ∧ σ( j) ∈ M2 bzw. σ(i) ∈ M2 ∧ σ( j) ∈ M1 , so muss auch σ(i) , σ( j), da M1 ∩ M2 = ∅. σ ist sogar surjektiv. Dazu sei k ∈ N. Wir nehmen an, dass k ∈ M1 . Wäre k < σ(N), so folgt aus σ( j) ∈ M1 wegen σ( j) = φ( j)( j) und (ii), dass σ( j) < k. Also gilt {k, k + 1, . . . } ∩ σ(N) ⊆ M2 . Da σ injektiv ist, muss dieser Schnitt unendlich viele Zahlen enthalten. Wegen (ii) ist mit m ∈ σ(N), m > k, auch {k, k + 1, . . . , m} ⊆ σ(N), und somit {k, k + 1, . . . } = {k, k + 1, . . . } ∩ σ(N) ⊆ M2 . Somit hätten wir den Widerspruch, dass M1 endlich ist. Entsprechend führt auch k ∈ M2 und k < σ(N) auf einen Widerspruch. P ′ Nun gilt es noch zu zeigen, dass ∞ j=1 aσ( j) = S . Dazu sei ǫ > 0, und wähle k1 ∈ M1 (k2P∈ M2 ) so, dass |ak | < ǫ für alle k ≥ k1 (k ≥ k2 ). Das ist möglich, da die Folge der Summanden der konvergenten Reihe ∞ j=1 a j ja eine Nullfolge bildet. Sei N die kleinste Zahl in N, sodass σ(N) > k1 , σ(N) > k2 und sodass σ(N) ∈ M1 ∧ σ(N + 1) ∈ M2 oder σ(N) ∈ M2 ∧ σ(N + 1) ∈ M1 . Für ein k ≥ N+1 sei m ∈ {N, . . . , k−1} die größte Zahl mit σ(m) ∈ M1 ∧σ(m+1) ∈ M2 oder σ(m) ∈ M2 ∧σ(m+1) ∈ M1 . Im ersten Fall muss dann σ(m + 1), . . . , σ(k) ∈ M2 und im zweiten σ(m + 1), . . . , σ(k) ∈ M1 . Wegen g(σ|{1,...,l} ) = σ|{1,...,l+1} muss im ersten Fall m−1 m k−1 m−1 X X X X aσ( j) + aσ(m) . aσ( j) = aσ( j) ≤ aσ( j) < S ′ ≤ m−1 X aσ( j) + aσ(m) = j=1 j=1 In jedem Fall gilt m X j=1 j=1 j=1 j=1 und im zweiten aσ( j) ≤ k−1 X j=1 aσ( j) < S ′ ≤ m−1 X aσ( j) . j=1 k X aσ( j) − S ′ ≤ |aσ (k)| + |aσ(m) | < 2ǫ. j=1 5.4.8 Bemerkung. Korollar 5.4.5 zusammen mit Satz 5.4.6 wird auch Riemannscher Umordnungssatz genannt. Für komplexwertige Reihen gilt Satz 5.4.6 nicht. Für den folgenden Satz schreiben wir unsere nichtleere Menge M als disjunkte Vereinigung [ ˙ M= Mi i∈I mit nichtleerer Indexmenge I und nichtleeren Mengen Mi , i ∈ I. 5.4.9 Proposition. Sind die a j , j ∈ M, reelle oder komplexe Zahl, und konvergiert P P s := j∈M a j unbedingt, so konvergieren alle Ausdrücke si := j∈Mi a j , i ∈ I, unbeP P P P dingt genauso wie i∈I j∈Mi a j – dazu sagen wir kurz, dass i∈I j∈Mi a j unbedingt konvergiert –, wobei X XX aj = aj . (5.17) j∈M i∈I j∈Mi P Beweis. Wegen Fakta 5.4.3, 3, konvergieren alle Ausdrücke si = j∈Mi a j , i ∈ I, unbedingt. Zu ǫ > 0 sei A0 ∈ E(M), sodass aus A0 ⊆ A ∈ E(M) die Ungleichung X s − a j < ǫ j∈A folgt. Dann ist K0 := {i ∈ I : Mi ∩ A0 , ∅} sicherlich auch endlich. Für jedes endliche K ⊇ K0 bezeichne #K seine Mächtigkeit. Wähle nun für jedes i ∈ K ein Bi ∈ E(Mi ), sodass X ǫ si − , wenn Bi ⊆ B ∈ E(Mi ) . a j < #K j∈B 5.4. UNBEDINGTE KONVERGENZ UND UMORDNEN VON REIHEN 121 Da man Bi sicherlich größer machen kann, ohne diese Bedingung zu verlieren, können wir annehmen, dass auch Bi ⊇ Mi ∩ A0 . S S Mit A := i∈K Bi ⊇ i∈K0 Mi ∩ A0 = A0 folgt X X X X si − s − si ≤ s − a j + a j < 2ǫ . i∈K Also gilt s = limK∈E(I) P i∈K i∈K j∈A j∈Bi si . P P ❑ Im Allgemeinen kann man aber nicht von der Existenz von i∈I j∈Mi a j auf die P unbedingte Konvergenz von j∈M a j schließen; vgl. Beispiel 5.4.11. Es gilt jedoch 5.4.10 Lemma. Sind die a j , j ∈ M, reelle oder komplexe Zahl, und konvergieren alle P P P Ausdrücke j∈Mi |a j |, i ∈ I, unbedingt genauso wie i∈I j∈Mi |a j | – dazu sagen wir P P P kurz, dass i∈I j∈Mi |a j | unbedingt konvergiert –, so konvergiert auch j∈M |a j | unbeP P P P P P dingt . In dem Fall gilt i∈I j∈Mi |a j | = j∈M |a j | und i∈I j∈Mi a j = j∈M a j . P Beweis. Konvergieren alle Ausdrücke j∈Mi |a j |, i ∈ I, unbedingt genauso wie C := P P i∈I j∈Mi |a j |, so folgt für jedes A ∈ E(M) mit K = {i ∈ I : Mi ∩ A , ∅} XX X X X |a j | ≤ C. |a j | ≤ |a j | = j∈A i∈K j∈Mi i∈K j∈A∩Mi Aus Fakta 5.4.3, 2, folgt somit die unbedingte Konvergenz von Die behaupteten Gleichungen folgen aus Proposition 5.4.9. P j∈M |a j |. ❑ Die beiden letzten Resultate lassen sich zum Beispiel auf so genannte Doppelreihen anwenden. Dazu sei M = N×N, und sei zu jedem (m, n) ∈ N×N eine reelle (komplexe) Zahl am,n gegeben. P Wegen Satz 5.4.4 sind die unbedingte Konvergenz von (m,n)∈N×N |am,n| und von P (m,n)∈N×N am,n äquivalent. Wegen Proposition 5.4.9 und Lemma 5.4.10 angewandt Ṡ auf die Zerlegung N × N = i∈N {i} × N ist das auch zur unbedingten Konvergenz P P von |a | äquivalent. Wegen Fakta 5.4.3, 6, bedeutet letzteres genau, dass P∞ i∈N j∈N i, j |a | für alle i ∈ N konvergiert genauso wie i, j j=1 ∞ X ∞ X i=1 j=1 |ai, j | < +∞. (5.18) Analoges gilt für die vertauschte Reihenfolge. Trifft eine dieser äquivalenten Bedingungen zu, so konvergieren folgende Ausdrücke unbedingt und es gilt XX X XX ai, j = am,n = ai, j . (5.19) i∈N j∈N (m,n)∈N×N Ṡ j∈N j∈N Zerlegt man schließlich N × N in N × N = d∈N≥2 {(k, l) ∈ N × N : k + l = d} – also in die Diagonalen {(k, l) ∈ N × N : k + l = d} –, so erhalten wir aus Proposition 5.4.9, dass auch folgender Ausdruck unbedingt konvergiert und (5.19) mit d−1 X X ak,d−k (5.20) d∈N≥2 k=1 KAPITEL 5. GEOMETRIE METRISCHER RÄUME 122 übereinstimmt. Dieser Ausdruck konvergiert sogar unbedingt, wenn man die Summanden durch ihre Beträge ersetzt. P Dass die unbedingte Konvergenz von (m,n)∈N×N am,n notwendig dafür ist, dass die Ausdrücke ganz links und ganz rechts übereinstimmen, zeigt 5.4.11 Beispiel. Seien die Zahl ai, j der (i, j)-te Eintrag von 1 + 0 + 0 + 0 + .. . + −1 + + 1 + + 0 + + 0 + .. . = 1 + + 0 + −1 + 1 + 0 + .. . + + + = 0 + + + + 0 + 0 + −1 + 1 + .. . + ... = 0 + ... = 0 + ... = 0 + ... = 0 .. . = 1\0 = 0 = + 0 + ... = P P P P Dann gilt i∈N j∈N ai, j = 0 und j∈N i∈N ai, j = 1. + P P∞ 5.4.12 Korollar. Sind die beiden Reihen ∞ m=1 am und n=1 bn absolut konvergent, so konvergiert X am bn (m,n)∈N×N unbedingt, wobei X (m,n)∈N×N ∞ i−1 ∞ ∞ X X X X ak bi−k = am · bn . am bn = m=1 k=1 i=2 n=1 Der mittlere Ausdruck konvergiert dabei auch absolut. Beweis. Wegen8 ∞ X ∞ X m=1 n=1 |am bn | = ∞ X m=1 |am | · | ∞ X |bn | = n=1 {z } ∞ X m=1 ∞ X |am | · |bn | < +∞ n=1 <+∞ P folgt aus der Bedingung (5.18), dass S := (m,n)∈N×N am · bn unbedingt konvergent. Nach (5.19) und Fakta 5.4.3, 1, gilt X XX X X X lim S = ai · b j = lim ai · b j = lim ai · lim b j = A∈E(N) B∈E(N) A∈E(N) B∈E(N) i∈A i∈N j∈N j∈B i∈A j∈B ∞ ∞ ∞ ∞ X X X X X X ai · bn = lim lim ai · bn = am · bn . A∈E(N) A∈E(N) i∈A n=1 i∈A n=1 m=1 n=1 8 Diese Gleichung ist am besten von rechts nach links zu lesen. In dieser Reihenfolge erkennt man am besten, dass alle vorkommenden Reihen konvergieren. 5.5. GRENZWERTE VON FUNKTIONEN 123 P Pi−1 S = ∞ i=2 k=1 ak bi−k ergibt sich sofort aus (5.20), wenn man bedenkt, dass aus der unbedingten auch die absolute Konvergenz folgt. ❑ 5.4.13 Beispiel. Definiere eine Funktion exp : C → C durch exp(z) := ∞ X zn , z ∈ C. n! n=0 Zunächst müssen wir diese Definition rechtfertigen, also zeigen, dass diese Reihe konvergiert. Für jedes feste z ∈ C gilt n+1 z (n+1)! z lim zn = lim = 0. n→∞ n→∞ (n + 1) n! P zn Nach dem Quotientenkriterium ist die Reihe ∞ n=0 n! für jedes feste z ∈ C absolut konvergent. Wir wollen für zwei Zahlen z, w ∈ C das Produkt exp(z) exp(w) ausrechnen. Dazu verwenden wir Summation längs der Diagonalen. Wir erhalten aus Korollar 5.4.12 unter Beachtung einer Indexverschiebung exp(z) · exp(w) = k ∞ X X k=0 j=0 zk− j w j . (k − j)! j! Nach dem Binomischen Lehrsatz gilt k X j=0 1 zk− j w j = (z + w)k , (k − j)! j! k! und wir erhalten exp(z) exp(w) = ∞ X 1 (z + w)k = exp(z + w) . k! k=0 Die Funktion exp heißt auch die Eulersche9 Exponentialfunktion. Sie ist eine der wichtigsten Funktionen, die es in der Mathematik gibt. Wir werden sie zum Beispiel auch dafür benützen um Funktionen wie sin z oder cos z zu definieren, vgl. den Abschnitt über elementare Funktionen. 5.5 Grenzwerte von Funktionen In diesem Abschnitt wollen wir vornehmlich Grenzwerte über gerichtete Mengen betrachten, die folgende Eigenschaft haben. 5.5.1 Definition. Wir sagen, dass eine gerichtete Menge (I, ) Teilfolgen gestattet, wenn es eine abzählbare Teilmenge L von I gibt, sodass ∀i ∈ I ∃ j ∈ L : i j . 9 Leonhard Euler. 15.4.1707 Basel - 18.9.1783 St.Petersburg (5.21) KAPITEL 5. GEOMETRIE METRISCHER RÄUME 124 Es sei hier angemerkt, dass nicht alle gerichteten Mengen Teilfolgen gestatten. Wie wir im folgenden Lemma 5.5.2 sehen werden, bedeutet die Eigenschaft gestattet ” Teilfolgen“, dass man hinreichend viele Teilfolgen konstruieren kann, damit man von der Konvergenz von Teilfolgen auf die Konvergenz eines gegebenen Netzes schließen kann. 5.5.2 Lemma. Sei hX, di ein metrischer Raum, (I, ) eine gerichtete Menge und (xi )i∈I ein Netz in X. Gestattet (I, ) Teilfolgen, so gilt x = limi∈I xi genau dann, wenn limn→∞ xi(n) = x für jede Teilfolge von (xi )i∈I . Beweis. Falls x = limi∈I xi , so folgt aus Lemma 5.3.7, dass auch limn→∞ xi(n) = x für alle Teilfolgen von (xi )i∈I . Konvergiert umgekehrt (xi )i∈I nicht gegen x, so gibt es ein ǫ > 0, sodass ∀i ∈ I ∃k ∈ I, k i : d(xk , x) ≥ ǫ. (5.22) Daraus konstruieren wir eine Teilfolge, die nicht gegen x konvergiert. Dazu sei j : N → L bijektiv, wobei L wie in Definition 5.5.1 ist. Sei i1 ∈ I, i1 j(1) mit d(xi1 , x) ≥ ǫ; vgl. (5.22). Sind i1 · · · im ∈ I definiert, so sei i ∈ I, i im , i j(m + 1). Gemäß (5.22) gibt es ein im+1 i, sodass d(xim+1 , x) ≥ ǫ. Zu jedem i ∈ I gibt wegen (5.21) es ein m0 ∈ N, sodass j(m0 ) i. Wegen im j(m), m ∈ N, folgt im im0 j(m0 ) i für alle m ≥ m0 . Also ist (xin )n∈N eine Teilfolge, sodass d(xin , x) ≥ ǫ. Sie kann somit nicht gegen x konvergieren. ❑ Sei hX, dX i ein metrischer Raum, D ⊆ X, z ein Häufungspunkt von D und auf D \ {z} definiert als x y : ⇐⇒ dX (x, z) ≥ dX (y, z) wie in Beispiel 5.3.2, (iii). (D \ {z}, ) ist dann eine gerichtete Menge. Weiters sei f : D \ {z} → Y eine Funktion, wobei hY, dY i ein weiterer metrischer Raum ist. 5.5.3 Definition. Konvergiert das Netz ( f (t))t∈D\{z} , so schreiben wir für den Grenzwert auch lim f (t) := lim f (t), (5.23) t→z t∈D\{z} und nennen ihn Grenzwert der Funktion f für t → z. 5.5.4 Fakta. 1. Es gilt limt→z f (t) = y genau dann, wenn ∀ǫ > 0 ∃δ > 0 : ∀t ∈ D \ {z}, dX (t, z) < δ ⇒ dY ( f (t), y) < ǫ . (5.24) In der Tat gilt gemäß der Definition der Konvergenz eines Netzes limt∈D\{z} f (t) = y genau dann, wenn ∀ǫ > 0 ∃t0 ∈ D\ {z} : ∀t ∈ D\ {z}, dX (t, z) ≤ dX (t0 , z) ⇒ dY ( f (t), y) < ǫ . (5.25) Falls (5.25) zutrifft, so setze man zu einem ǫ > 0, δ = dX (t0 , z). Offenbar gilt dann (5.24). Gilt umgekehrt (5.24), und wählt man dem entsprechend zu ǫ > 0 ein passendes δ > 0, so gibt es ein t0 ∈ D \ {z} ∩ Uδ (z), da z ja Häufungspunkt von D ist. Für t t0 folgt dann dX (t, z) < δ und somit dY ( f (t), y) < ǫ. 5.5. GRENZWERTE VON FUNKTIONEN 125 2. Die gerichtete Menge (D \ {z}, ) gestattet Teilfolgen, denn setzt man L = {tn : n ∈ N} für irgendeine Folge (tn )n∈N aus D \ {z} mit tn → z für n → ∞ – nach Lemma 5.1.13 gibt es eine solche – so ist L abzählbar und zu gegebenem t ∈ D \ {z} gibt es wegen dX (tn , z) → 0, n → ∞ ein n ∈ N mit dX (tn , z) ≤ dX (t, z) – also tn t. Also hat L die Eigenschaft (5.21). 3. Für ein Netz (ti )i∈I aus D \ {z} gilt limi∈I ti = z genau dann, wenn ( f (ti ))i∈I ein Teilnetz von ( f (t))t∈D\{z} ist. Um das einzusehen, sei daran erinnert, dass gemäß Definition 5.3.6 ( f (ti ))i∈I genau dann ein Teilnetz ist, wenn ∀t0 ∈ D \ {z} ∃i0 ∈ I : dX (ti , z) ≤ dX (t0 , z) für alle i i0 . (5.26) Setzt man limi∈I ti = z voraus, so gibt es zu t0 ∈ D \ {z} wegen ǫ := dX (t0 , z) > 0 ein i0 ∈ I mit dX (ti , z) < ǫ = dX (t0 , z) für alle i i0 , also insbesondere (5.26). Gilt umgekehrt (5.26) und ist ǫ > 0, so gibt es – da z Häufungspunkt von D ist – ein t0 ∈ D \ {z} mit dX (t0 , z) < ǫ und eben wegen (5.26) ein i0 ∈ I mit dX (ti , z) ≤ dX (t0 , z) < ǫ für alle i i0 , also limi∈I ti = z. 4. Wegen Lemma 5.5.2 zusammen mit den vorherigen beiden Punkten gilt lim f (t) = y ⇔ ∀(tn )n∈N aus D \ {z}, lim tn = z ⇒ lim f (tn ) = y . (5.27) t→z n→∞ n→∞ 5. Aus (5.24) erkennt man unmittelbar, dass für ein C ⊆ D, das z ebenfalls als Häufungspunkt hat, aus limt→z f (t) = y auch limt→z f |C\{z} (t) = y folgt. Dabei ist letzterer Grenzwert als limt∈C\{z} f (t) zu verstehen, wobei für s, t ∈ C \ {z} auch s t ⇔ dX (s, z) ≥ dX (t, z). Aus limt→z f |C\{z} (t) = y folgt im allgemeinen aber nicht limt→z f (t) = y, vgl. Beispiel 5.5.7. 6. Ist ρ > 0 beliebig, so gilt wegen dem vorherigen Punkt, dass aus limt→z f (t) = y auch limt→z f |Uρ (z)∩D (t) = y folgt, da z ja auch ein Häufungspunkt von Uρ (z) ∩ D ist. Gelte umgekehrt limt→z f |Uρ (z)∩D\{z} (t) = y für ein ρ > 0. Zu ǫ > 0 gibt es also ein δ > 0, sodass aus t ∈ Uρ (z) ∩ D \ {z}, dX (t, z) < δ immer dY ( f (t), y) < ǫ folgt. Aus t ∈ D \ {z} mit dX (t, z) < min(δ, ρ) ergibt sich dann t ∈ Uρ (z) ∩ D \ {z}, dX (t, z) < δ und damit dY ( f (t), y) < ǫ. Also gilt limt→z f (t) = y. Alternativ kann man die Äquivalenz von limt→z f |Uρ (z)∩D (t) = y und limt→z f (t) = y auch mit Hilfe von (5.6) herleiten, da beide Aussagen wegen (D \ {z})s = KdX (s,z) (z) ∩ D \ {z} = (Uρ (z) ∩ D \ {z})s für ein s ∈ Uρ (z) ∩ D \ {z} zu limt∈D\{z}s f (t) = y äquivalent sind. 5.5.5 Beispiel. Ist X = Y = D ein beliebiger metrischer Raum, z ∈ X ein Häufungspunkt davon, so gilt für f (t) = t sicher limt→z t = z, wie man z.B. aus (5.27) sofort erkennt. KAPITEL 5. GEOMETRIE METRISCHER RÄUME 126 Wir wollen lim t→0 √ 1 − t2 t2 1− √ 2 berechnen, wobei das als der Limes limt∈(−1,1)\{0} 1− t21−t mit der gerichteten Menge ((−1, 1) \ {0}, ) gerichtet durch s t ⇔ |s| ≥ |t| zu verstehen ist. √ √ Aus 1 − (1 − t2 ) = (1 − 1 − t2 )(1 + 1 − t2 ) folgt wegen der für Netze gültigen Rechenregeln lim t→0 1− √ 1 − (1 − t2 ) 1 − t2 = lim = √ t→0 t2 (1 + t2 1 − t2 ) 1 1 = . √ √ 2 1+ 1−t 1 + limt→0 1 − t2 p Nun ist aber wegen der für Folgen gültigen Rechenregeln limn→∞ 1 − tn2 = 1 für √ jede gegen 0 konvergente Folge (tn )n∈N . Aus Fakta 5.5.4 folgt limt→0 1 − t2 = 1, und der zu berechnende Grenzwert ist 21 . lim t→0 Betrachtet man √ 1− 1−t2 t2 als Funktion etwa auf (− 18 , 81 ) \ {0}, so wissen wir, dass wegen Fakta 5.5.4, 6, ebenfalls √ 1− 1−t2 t2 → 0 für t ∈ (− 81 , 81 ) \ {0}, t → 0. Die Schreibweise – hier sei etwa D = (−1, 1) mit X = R und z = 0 – limt→0 f (t) = y aus Definition 5.5.3 besagt, dass der Funktionswert f (t) beliebig nahe an y herankommt, wenn das Argument t nur hinreichend nahe an 0 ist. Oft ist man in der Situation, dass diese Annäherung nur von einer Seite stattfindet. 5.5.6 Fakta. 1. Sei X = R und D = (a, b) für a, b ∈ R, a < b. Ist nun z = b und f eine Funktion, die zumindest auf D definiert ist und Werte in einem metrischen Raum Y hat, so schreibt man für limt∈D\{b} f (t) = y auch lim f (t) = y . t→b− Man spricht von dem linksseitigen Grenzwert. . Analog definiert man für D = (a, b) und z = a den rechtsseitigen Grenzwert limt→a+ f (t) = y als limt∈D\{a} f (t) = y, wenn f eine Funktion auf D = (a, b) mit Werten in einem metrischen Raum Y ist. 2. Sind a, b, c ∈ R, a < b < c, und ist f : (a, b) ∪ (b, c) → Y eine Funktion, so gilt y = lim f (t) ⇔ y = lim f (t) und y = lim f (t) . t→b t→b− t→b+ (5.28) Dass aus y = limt→b f (t) sich die beiden anderen Grenzwerte ergeben, folgt sofort aus Fakta 5.5.4, 5. Gelten umgekehrt y = limt→b− f (t) und y = limt→b+ f (t), so gibt es zu einem ǫ > 0 gemäß (5.24) Zahlen δ+ , δ− > 0, sodass aus t ∈ (b, c), |t − b| < δ+ oder t ∈ (a, b), |t − b| < δ− immer dY ( f (t), y) < ǫ folgt. Mit δ := min(δ− , δ+ ) folgt aus t ∈ (a, b) ∪ (b, c), |t − b| < δ die Ungleichung dY ( f (t), y) < ǫ; also y = limt→b f (t). 5.5. GRENZWERTE VON FUNKTIONEN 127 5.5.7 Beispiel. Sei f : R → R definiert als f (t) = sgn(t). Dann gilt limt→0+ f (t) = 1, da f |(0,+∞) ≡ 1, und limt→0− f (t) = −1, da f |(−∞,0) ≡ −1; vgl. Beispiel 5.3.4, (i). Wegen (5.28) kann dann limt→0 f (t) gar nicht existieren. Sei f : (0, +∞) → R definiert als f (t) = t2 [ 1t ]. Dabei bezeichnet für reelles x der Ausdruck [x] die größte ganze Zahl, die kleiner oder gleich x ist. Diese wird als Gaußklammer bezeichnet. Wegen limt→0+ t = 0 (vgl. (5.9) und Beispiel 5.5.5) und mit Fakta 5.3.8, 2, folgt aus 0 ≤ t2 [ 1t ] ≤ t für t > 0, dass limt→0+ f (t) = 0. 5.5.8 Definition. Ist f eine auf (a, +∞) definierte Funktion mit Werten in einem metrischen Raum Y, und versieht man (a, +∞) mit der Relation ≤, so erhält man ebenfalls eine gerichtete Menge. Für den möglichen Grenzwert limt∈(a,+∞) f (t) schreibt man auch limt→+∞ f (t). Entsprechend definiert man Grenzwerte für t → −∞. Die hier zugrunde liegende gerichtete Menge gestattet auch Teilfolgen, wobei ( f (tn ))n∈N genau dann eine solche ist, wenn tn → +∞ für n → ∞. Also gilt (5.27) auch wenn z = +∞. Entsprechendes gilt für −∞. 5.5.9 Bemerkung. Sei f : (a, b) → Y eine Funktion, wobei a, b ∈ R ∪ {−∞, +∞} mit a < b. Um limt→b− f (t) – im Sinne von Definition 5.5.8 im Fall b = +∞ und im Sinne Definition 5.5.3 im Falle b ∈ R – zu bestimmen, ist es manchmal zweckmäßig für eine gewisse bijektive, streng monotone Abbildung φ : (c, d) → (a, b) mit c, d ∈ R ∪ {−∞, +∞}, c < d, den Grenzwert lim f ◦ φ(s) für monoton wachsendes φ s→d− bzw. lim f ◦ φ(s) für monoton fallendes φ s→c+ zu eruieren. Dieser Grenzwert stimmt dann mit dem ursprünglich gesuchten limt→b− f (t) überein. In der Tat kann man für monoton wachsendes φ das Netz ( f (t))t∈(a,b) als das Teilnetz f ◦ φ(φ−1 (t)) t∈(a,b) des Netzes f ◦ φ(s) s∈(c,d) betrachten, da zu s0 ∈ (c, d) das Element t0 := φ(s0 ) ja derart ist, dass wegen der Monotonie von φ−1 aus t t0 – hier bedeutet das t ≥ t0 – immer φ−1 (t) ≥ φ−1 (t0 ) = s0 , daher φ−1 (t) s0 , folgt. Entsprechend argumentiert man für monoton fallendes φ. Ähnlich kann man vorgehen, wenn limt→a+ f (t) zu bestimmen ist. 5.5.10 Beispiel. Betrachte g : (0, +∞) → R definiert als g(t) = t12 [t]. Um limt→+∞ g(t) zu berechnen, betrachte die monoton fallende Bijektion φ(s) = 1s von (0, +∞) auf sich selbst. Aus Beispiel 5.5.7 ist bekannt, dass " # 2 1 lim g ◦ φ(s) = lim s =0. s→0+ s→0+ s Gemäß Bemerkung 5.5.9 gilt dann auch limt→+∞ g(t) = 0. KAPITEL 5. GEOMETRIE METRISCHER RÄUME 128 Schließlich wollen wir auch noch definieren, was limz→∞ f (z) = y bedeutet, wenn f : D → Y mit einem nicht beschränkten D ⊆ C und einem metrischen Raum Y. Dazu versehen wir D mit der Richtung z w ⇔ |z| ≤ |w|, und setzen lim f (z) := lim f (z) , z→∞ z∈D falls dieser Grenzwert existiert. Manchmal schreibt man dafür auch lim|z|→+∞ f (z). Die gerichtete Menge (D, ) gestattet ebenfalls Teilfolgen, wobei limz→∞ f (z) = y genau dann, wenn f (zn ) → y für alle komplexen Folgen (zn )n∈N mit |zn | → +∞. 5.5.11 Beispiel. Man sieht leicht ein, dass limz→∞ Netze aus Fakta 5.3.8 folgt (a0 , . . . , an ∈ C) 1 z = 0. Mit den Rechenregeln für lim an + an−1 z−1 + . . . + a0 z−n = an . z→∞ Für an , 0 folgt daraus (siehe Bemerkung 5.3.9) lim |an zn + an−1 zn−1 + . . . + a0 | = lim |zn | · |an + an−1 z−1 + . . . + a0 z−n | = +∞ . z→∞ z→∞ Kapitel 6 Reelle und komplexe Funktionen 6.1 Stetigkeit Sei f eine Funktion und sei x ein Punkt ihres Definitionsbereiches. Sagen wir dass diese Funktion stetig an der Stelle x ist, so verstehen wir darunter anschaulich, dass der Funktionswert f (t) sich beliebig wenig von f (x) unterscheidet, wenn nur t hinreichend nahe bei x ist. Wir sehen, dass man diesem Begriff Sinn geben kann, wenn man verlangt, dass Definitionsbereich und Wertebereich der betrachteten Funktion metrische Räume sind. 6.1.1 Definition. Seien hX, dX i und hY, dY i metrische Räume und D ⊆ X, und sei f : D → Y eine Funktion. Weiters sei x ∈ D. Dann heißt f stetig an der Stelle x, wenn gilt ∀ǫ > 0 ∃δ > 0 : dY ( f (t), f (x)) < ǫ wenn t ∈ D mit dX (t, x) < δ , oder äquivalent ∀ǫ > 0 ∃δ > 0 : f (UδX (x) ∩ D) ⊆ UǫY ( f (x)) , Ist f an jeder Stelle x ihres Definitionsbereiches D stetig, so heißt f stetig auf D. Die Menge aller stetigen Funktionen von X nach Y wird mit C(X, Y) bezeichnet. 6.1.2 Beispiel. Sei f : X → Y eine konstante Funktion, d.h. f (x) := y0 , x ∈ X. Dann ist f stetig, denn ist x ∈ X und ǫ > 0, so wähle etwa δ = 1. Für alle t ∈ X mit dX (t, x) < δ gilt sicher dY ( f (t), f (x)) = dY (y0 , y0 ) = 0 < ǫ . Die identische Abbildung, f (x) := idX (x) = x, x ∈ X, ist stetig. Um das einzusehen seien x ∈ X und ǫ > 0 gegeben. Mit δ = ǫ folgt für alle t ∈ X, dX (t, x) < δ, dass dX ( f (t), f (x)) = dX (t, x) < δ = ǫ . Allgemeiner gilt, dass jede isometrische Abbildung 1 f : X → Y stetig ist, da zu x ∈ X und ǫ > 0 mit δ = ǫ wieder für alle t ∈ X, dX (t, x) < δ dY ( f (t), f (x)) = dX (t, x) < δ = ǫ . 1 Isometrisch bedeutet dY ( f (x), f (y)) = dX (x, y). 129 KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 130 f (x) + ǫ f (x) f (x) − ǫ x−δ x x+δ Abbildung 6.1: ǫ-δ Kriterium für f : I (⊆ R) → R Die Einbettungsabbildungen ιyj : R → R p für j = 1, . . . , p und für y ∈ R p definiert durch ξ 7→ (0, . . . , ξ − y j , 0 . . . , 0) + y |{z} j−te Stelle sind isometrisch und daher stetig, wenn man R und R p mit d2 versieht. Insbesondere sind die Abbildungen ι1 : R → C, x 7→ x + i0 und ι2 : R → C, y 7→ 0 + iy stetig. Die Abbildung z 7→ z̄ als Funktion auf C ist isometrisch und daher stetig. Sei f : C → R die Funktion z 7→ |z|. Dann ist f stetig. Denn bei gegebenen z ∈ C und ǫ > 0 wähle δ := ǫ. Für alle w ∈ C mit |w − z| < δ gilt wegen der Dreiecksungleichung nach unten | f (w) − f (z)| = |w| − |z| ≤ |w − z| < δ = ǫ . p Sei π j : R p → R, j = 1, . . . , p, die Funktion x = (xi )i=1 7→ x j . Diese ist p überall stetig, denn bei gegebenen (xi )i=1 ∈ R p und ǫ > 0 wähle δ = ǫ. Für alle p p p (ti )i=1 ∈ R p mit d2 ((xi )i=1 , (ti )i=1 ) < δ gilt p p |x j − t j | ≤ d2 ((xi )i=1 , (ti )i=1 ) < ǫ. Genauso zeigt man, dass auch die Abbildungen π j : C p → C, j = 1, . . . , p, p definiert durch z = (zi )i=1 7→ z j stetig sind, wobei C p und C mit d2 versehen sind; vgl. Beispiel 3.1.5, (iii). Sei f : R → R die Funktion f (x) := [x]. Dabei bezeichnet [x] wieder die Gaußklammer. Diese Funktion ist stetig an jeder Stelle x ∈ R \ Z, und nicht stetig an jeder Stelle x ∈ Z: Ist x ∈ R \ Z, und ist ǫ > 0 gegeben, so wähle δ > 0, sodass das Intervall (x − δ, x + δ) keine ganze Zahl enthält. Dann ist f auf (x − δ, x + δ) konstant, und somit gilt | f (t) − f (x)| = 0 < ǫ, falls |t − x| < δ . Ist dagegen x ∈ Z, so enthält das Intervall (x − δ, x + δ) für jedes δ > 0 sowohl Zahlen t, die größer als x sind, als auch Zahlen t, die kleiner als x sind. Nun ist 6.1. STETIGKEIT 131 aber für t− < x sicher f (t− ) < f (x) und – da ja beide Werte ganze Zahlen sind – | f (t− ) − f (x)| ≥ 1. Wir können also für kein ǫ mit 0 < ǫ ≤ 1 ein δ finden, das der geforderten Bedingung genügt. 6.1.3 Fakta. Seien hX, dX i und hY, dY i metrische Räume, x ∈ D ⊆ X, und sei f : D → Y eine Funktion. 1. Unmittelbar aus der Definition der Stetigkeit folgt, dass die Stetigkeit bei x eine lokale Eigenschaft ist, d.h. f ist bei x stetig genau dann, wenn es ein ρ > 0 gibt, sodass f |Uρ (x)∩D stetig bei x ist. 2. Ist x ein isolierter Punkt von D, dann ist f immer stetig bei x. Ist nämlich δ > 0 so, dass Uδ (x)∩D = {x}, so folgt f (Uδ (x)∩D) = { f (x)} ⊆ Uǫ ( f (x)) für beliebiges ǫ > 0. 3. Ist f : D → Y stetig auf D, so sicherlich auch f |C auf jeder Teilmenge C ⊆ D. Also sind Einschränkungen stetiger Abbildungen wieder stetig. Nun wollen wir die Stetigkeit an einer Stelle mit Hilfe verschiedener Grenzwertbegriffe charakterisieren. 6.1.4 Proposition. Seien hX, dX i und hY, dY i metrische Räume, D ⊆ X, und sei f : D → Y eine Funktion. Ist x ∈ D ein fester Punkt, dann sind äquivalent: (i) f ist stetig an der Stelle x. (ii) Ist x kein isolierter Punkt, so gilt limt→x f (t) = f (x), wobei wir diesen Limes verstehen als Limes des Netzes ( f (t))t∈D\{x} , wo D \ {x} mit der Relation t u : ⇐⇒ dX (u, x) ≤ dX (t, x) zu einer gerichteten Menge wird, vgl. Definition 5.5.3. (iii) Für jede Folge (tn )n∈N aus D \ {x} mit limn→∞ tn = x gilt limn→∞ f (tn ) = f (x). (iv) Für jede Folge (tn )n∈N aus D mit limn→∞ tn = x gilt limn→∞ f (tn ) = f (x). (v) Für jedes Netz (ti )i∈I aus D mit limi∈I ti = x gilt limi∈I f (ti ) = f (x). Beweis. (i) ⇐⇒ (ii): Im Falle, dass x ein isolierter Punkt von D ist, wissen wir schon, dass f bei x stetig ist. Sei also x nicht isolierter Punkt von D. Die Stetigkeit von f an der Stelle x bedeutet nach Definition ∀ǫ > 0 ∃δ > 0 : dY ( f (t), f (x)) < ǫ wenn t ∈ D mit dX (t, x) < δ . Die Beziehung limt→x f (t) = f (x) bedeutet gemäß Definition 5.5.3, ∀ǫ > 0 ∃δ > 0 : dY ( f (t), f (x)) < ǫ wenn t ∈ D \ {x} mit dX (t, x) < δ . Also sind diese beiden Aussagen äquivalent. (ii) ⇐⇒ (iii): Das haben wir schon in Fakta 5.5.4 gesehen. (6.1) 132 KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN (v) ⇒ (iv) ⇒ (iii): (iv) ist Spezialfall von (v) und genauso (iii) von (iv). (i) ⇒ (v): Sei ǫ > 0, dann gibt es ein δ > 0 mit f (Uδ (x)) ⊆ Uǫ ( f (x)). Sei nun i0 ∈ I mit xi ∈ Uδ (x), i i0 . Für diese i folgt f (xi ) ∈ Uǫ ( f (x)), und daraus die behauptete Grenzwertbeziehung. ❑ Eine immer wieder verwendete Eigenschaft der Stetigkeit folgt unmittelbar aus Proposition 6.1.4, (iv): 6.1.5 Korollar. Sind f, g : D → Y beide stetig und gilt f (x) = g(x) für alle x in einer Teilmenge E ⊆ D, so gilt auch f (x) = g(x) für alle x ∈ c(E) ∩ D. Insbesondere stimmen zwei stetige f und g auf D überein, wenn sie das nur auf einer dichten Teilmenge E von D tun. Beweis. Zu x ∈ D ∩ c(E) gibt es eine Folge (xn )n∈N in E ⊆ D, sodass xn → x. Wegen f (xn ) = g(xn ) und aus der Stetigkeit beider Funktionen folgt f (x) = lim f (xn ) = lim g(xn ) = g(x). n→∞ n→∞ ❑ Viele stetige Funktionen lassen sich mit Hilfe des nächsten Lemmas als solche identifizieren. 6.1.6 Lemma. Seien hX, dX i und hY, dY i metrische Räume, D ⊆ X, E ⊆ Y und f : D → Y und g : E → Z mit f (D) ⊆ E. Ist f bei x ∈ D und g bei f (x) stetig ist, so ist g ◦ f : D → Z bei x stetig. Beweis. Zu ǫ > 0 gibt es wegen der Stetigkeit von g ein δ′ > 0, sodass g(Uδ′ ( f (x)) ∩ E) ⊆ Uǫ (g( f (x))), und wegen der Stetigkeit von f ein δ > 0, sodass f (Uδ (x) ∩ D) ⊆ Uδ′ ( f (x)). Setzt man das zusammen und beachtet, dass auch f (Uδ (x) ∩ D) ⊆ f (D) ⊆ E, so erhält man (g ◦ f )(Uδ (x) ∩ D) ⊆ g(Uδ′ ( f (x)) ∩ E) ⊆ Uǫ (g( f (x))). ❑ 6.1.7 Beispiel. Aus unseren Rechenregeln für Folgen (Satz 3.3.5) folgern wir mit Hilfe der Folgencharakterisierung der Stetigkeit (Proposition 6.1.4, (iv)), dass die algebraischen Operationen ( ( R2 → R R → R +: −: (x, y) 7→ x + y x 7→ −x ( ( R \ {0} → R \ {0} R2 → R ·: .−1 : (x, y) 7→ x · y x 7→ 1x stetig sind. Genauso sind die algebraischen Operationen auf C stetig. Hier sind R, R2 , C, C2 alle mit der euklidischen Metrik d2 versehen, wobei C und C2 als metrischer Raum mit R2 bzw. R4 indentifiziert wird; vgl Beispiel 3.1.5, (iii). 2 . 2 Diese Feststellung gilt für den reellen Fall auch, wenn man d1 oder d∞ hernimmt; vgl. Proposition 3.6.1. 6.1. STETIGKEIT 133 6.1.8 Korollar. Sei hX, di ein metrischer Raum, x ∈ D ⊆ X, λ ∈ R, und seien f, g : D → R Funktionen. Dann ist die Abbildung t 7→ ( f (t), g(t)) von D nach R2 genau dann bei x stetig, wenn f und g es sind. Sind f und g stetig bei x, so auch die Abbildungen von D nach R. t 7→ λ · f (t), t 7→ f (t) + g(t), t 7→ f (t)g(t) Ist f stetig bei x und gilt f (t) , 0, t ∈ D, so ist auch t 7→ x stetig. 1 f (t) von D nach R bei Die selben Aussagen sind wahr, wenn wir R durch C ersetzen. Beweis. Für eine beliebige Folge (xn )n∈N aus D mit limn→∞ xn = x gilt gemäß Proposition 3.6.1, dass limn→∞ f (xn ) = f (x) gemeinsam mit limn→∞ g(xn ) = g(x) genau dann, wenn limn→∞ ( f (xn ), g(xn)) = ( f (x), g(x)). Wegen Proposition 6.1.4, (iv), folgt daher die erste Behauptung. Für bei x stetige f und g sind t 7→ f (t)+g(t), t 7→ f (t)·g(t) und t 7→ f 1(t) Zusammensetzungen von einer bei x stetigen und einer überall stetigen Funktion. Zum Beispiel ist t 7→ f (t)g(t) die Zusammensetzung von t 7→ ( f (t), g(t)) und (u, v) 7→ uv; siehe Beispiel 6.1.7. Für g(t) = λ ist das konstante g stetig. Also ist auch t 7→ λ· f (t) stetig. ❑ 6.1.9 Bemerkung. Mit fast identer Argumentation sieht man, dass für Abbildungen f1 , . . . , f p : D → R mit x ∈ D ⊆ X für einen metrischen Raum X genau dann alle diese Abbildungen stetig in x sind, wenn die Abbildung t 7→ ( f1 (t), . . . , f p (t)) von D nach R p stetig in x ist. Diese Feststellung können wir auch so formulieren, dass eine Abbildung φ : D → R p genau dann stetig ist, wenn alle Abbildungen π j ◦ φ : D → R für j = 1, . . . , p stetig sind. Entsprechendes gilt für Abbildungen f1 , . . . , f p : D → C. 6.1.10 Beispiel. Weil x 7→ x als Abbildung von R nach R stetig ist, folgt mit Korollar 6.1.8 nacheinander auch die Stetigkeit der Abbildungen x 7→ x · x, x 7→ x · x · x usw. . Also sind die Abbildungen x 7→ xm von R nach R für jedes m ∈ N stetig genauso wie die konstante Abbildung x 7→ x0 := 1. Wieder mit einigen Anwendungen von Korollar 6.1.8 folgt, dass für jedes Polynom p mit reellen Koeffizienten an , . . . , a0 ∈ R die Abbildung x 7→ p(x) = an xn + · · · + a0 , R → R . Für zwei Polynomen p und q mit reellen Koeffizienten betrachten wir die ratiop(x) nale Funktion f : D → R definiert durch f (x) = q(x) mit D = {x ∈ R : q(x) , 0}. Wegen Fakta 6.1.3, 3, sind p|D und q|D stetig und wegen Korollar 6.1.8 auch 3 f . 3 Wem diese Tatsache trivial vorkommt, der versuche zu Fuß“, d.h. durch explizite Angabe einer Zahl δ ” 3 zu vorgegebenen ǫ und x, zu überprüfen, dass etwa die Funktion f (x) = x x+x+1 2 +1 auf ihrem Definitionsbereich R stetig ist. KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 134 Für ein Polynom p mit komplexen Koeffizienten an , . . . , a0 ∈ C können wir auch die Abbildung z 7→ an zn +· · ·+a0 = p(z) als Abbildung von C nach C betrachten. Man zeigt wie im vorherigen Beispiel, dass auch diese Abbildung stetig ist. Für zwei Polynomen p und q mit komplexen Koeffizienten ist auch die rationale p(z) mit D = {z ∈ C : q(z) , 0} Funktion f : D → C definiert durch f (z) = q(z) stetig. Für zwei Polynome p und q mit komplexen Koeffizienten sind auch die Funktiop(x) nen x 7→ p(x) und x 7→ q(x) als Abbildungen von R nach C sowie x 7→ q(x) als Abbildungen von {x ∈ R : q(x) , 0} von R nach C stetig, denn sie lassen sich schreiben als Zusammensetzung der stetigen Abbildung ι1 : x 7→ x + i0 und der entsprechenden Funktion aus dem letzten Punkt. Da für ein lineares Funktional f : R p → R der Ausdruck f (x) als Linearkombination der Einträge von x ∈ R p geschrieben werden kann, folgt leicht mit Hilfe von Proposition 6.1.4, (iv), dass ein jedes solches f stetig ist. Daraus und mit Hilfe von Bemerkung 6.1.9 sieht man allgemeiner, dass auch alle linearen Abbildungen A : R p → Rq stetig sind. Entsprechendes gilt für C-linearen Abbildungen A : C p → Cq . Aus dem letzten Beispiel oder direkt mit Hilfe von Proposition 6.1.4, (iv), zusammen mit Bemerkung 6.1.9 erkennt man auch, dass (x, y) 7→ x + y als Abbildung von R2p R p × R p nach R p sowie (λ, x) 7→ λx als Abbildung von R p+1 R × R p nach R p stetig sind. Entsprechendes gilt im komplexen Fall. 6.1.11 Beispiel. Ist D ⊆ R p , Y ein metrischer Raum und f : D → Y stetig, so folgt aus Beispiel 6.1.2, Fakta 6.1.3, 3 und Lemma 6.1.6 für alle j = 1, . . . , p und alle y ∈ R p die Stetigkeit von f ◦ ιyj : {t ∈ R : ιyj (t) ∈ D} → Y. Umgekehrt kann man aber nicht von der Stetigkeit aller f ◦ ιyj auf die von f schließen, wie die Funktion f : R2 → R definiert durch ξη , (ξ, η) , (0, 0) ξ2 +η2 f (ξ, η) := 0 , (ξ, η) = (0, 0) zeigt. Diese Funktion ist bei (0, 0) nicht stetig, da etwa f ( 1n , 1n ) = 1 2 für alle n ∈ N. Die folgende mengentheoretisch orientierte Charakterisierung der Stetigkeit einer Funktion spielt eine wichtige Rolle. Man beachten, dass dabei für die Funktion f der Definitionsbereich gleich dem ganzen metrischen Raum X ist. 6.1.12 Proposition. Seien hX, dX i und hY, dY i metrische Räume, und sei f : X → Y eine Funktion. Dann sind äquivalent: (i) f ist stetig. (ii) Für jede in hY, dY i offene Teilmenge B von Y ist f −1 (B) = {x ∈ X : f (x) ∈ B} offen in hX, dX i. (iii) Für jede in hY, dY i abgeschlossene Teilmenge F von Y ist das Urbild f −1 (F) = {x ∈ X : f (x) ∈ F} abgeschlossen in hX, dX i. 6.1. STETIGKEIT 135 Beweis. (i) ⇒ (ii): Sei B ⊆ Y offen, und sei x ∈ f −1 (B). Da B offen ist und f (x) ∈ B, folgt Uǫ ( f (x)) ⊆ B für ein ǫ > 0. Wegen der Stetigkeit existiert δ > 0 mit f (Uδ (x)) ⊆ Uǫ ( f (x)) ⊆ B, d.h. mit Uδ (x) ⊆ f −1 (B). Also enthält f −1 (B) mit jedem Punkt eine ganze δ-Kugel, d.h. f −1 (B) ist offen. (ii) ⇒ (i): Sei ǫ > 0 und x ∈ X gegeben. Die Menge Uǫ ( f (x)) ist offen, also ist auch f −1 (Uǫ ( f (x))) offen. Wegen x ∈ f −1 (Uǫ ( f (x))) existiert ein δ > 0, sodass Uδ (x) ⊆ f −1 (Uǫ ( f (x))). Das heißt aber gerade f (Uδ (x)) ⊆ Uǫ ( f (x)). (ii) ⇔ (iii): Das folgt sofort aus Proposition 5.1.15 und der Tatsache, dass f −1 (M c ) = f −1 (M)c . ❑ 6.1.13 Proposition. Seien hX, dX i und hY, dY i metrische Räume, und sei f : D → Y eine stetige Funktion. Ist K ⊆ D kompakt, so ist auch f (K) ⊆ Y kompakt und damit auch beschränkt. Beweis. Sei (yn )n∈N eine Teilfolge in f (K), und sei xn ∈ K, sodass f (xn ) = yn . Wegen der Kompaktheit von K gibt es eine gegen ein x ∈ K konvergente Teilfolge (xn(k) )k∈N von (xn )n∈N . Aus der Stetigkeit folgt f (x) = lim f (xn(k) ) = lim yn(k) . k→∞ k→∞ Also hat (yn )n∈N eine konvergente Teilfolge mit Grenzwert aus f (K). Also ist f (K) kompakt und wegen Proposition 5.2.8. ❑ 6.1.14 Korollar. Sei hX, dX i ein metrischer Raum, D ⊆ X, f : D → R stetig, und sei K ⊆ D kompakt. Dann ist f auf K beschränkt und nimmt ein Maximum und ein Minimum an, d.h. es gibt Punkte xmax , xmin ∈ K mit f (xmax ) = max f (x), f (xmin ) = min f (x) . x∈K x∈K Insbesondere nimmt jede auf einem reellen Intervall [a, b] definierte und stetige reellwertige Funktion ein Maximum und ein Minimum an. Beweis. Nach Proposition 6.1.13 ist f (K) ⊆ R kompakt, und wegen Proposition 5.2.8 damit beschränkt und abgeschlossen. Wegen Beispiel 5.1.14 ist sup f (K) = max f (K) = f (xmax ) für ein xmax ∈ K. Entsprechend zeigt man die Aussage für das Minimum. ❑ 6.1.15 Proposition. Seien hX, dX i und hY, dY i metrische Räume und D ⊆ X kompakt. Ist f : D → Y stetig und injektiv, so ist es auch f −1 : ran( f ) → D ⊆ X. Beweis. Sei (yn )n∈N eine Folge in ran f mit yn → y, und setze xn = f −1 (yn ), n ∈ N. Wegen der Kompaktheit von D hat jede beliebige Teilfolge (xn(m) )m∈N von (xn )n∈N seinerseits eine Teilfolge (xn(m(l)) )l∈N mit xn(m(l)) → x, l → ∞ für ein x in D. Aus der Stetigkeit folgt yn(m(l)) = f (xn(m(l)) ) → f (x) für l → ∞. Da (yn(m(l)) )l∈N als Teilfolge auch gegen y konvergiert, folgt f (x) = y und mit der Injektivität x = f −1 (y). KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 136 Gemäß Lemma 5.2.11 konvergiert daher ( f −1 (yn ))n∈N gegen f −1 (y). Also ist f −1 in y stetig. ❑ 6.1.16 Beispiel. Sei n ∈ N. Für ein festes c > 0 sei f : [0, c] → R definiert durch die Vorschrift f (t) = tn . Wegen Beispiel 6.1.10 und Fakta 6.1.3, 3, ist f stetig. Zudem gilt f ([0, c]) = [0, cn ], vgl. Bemerkung 2.7.7. √ Die Umkehrfunktion f −1 : [0, cn ] → [0, c] ⊆ R, t 7→ n t, ist gemäß Proposition 6.1.15 stetig. Wegen cn → +∞ für c → +∞ und da die Stetigkeit wegen Fakta 6.1.3, 1, √ eine lokale Eigenschaft ist, folgt sogar die Stetigkeit von n . : [0, +∞) → R. Die Stetigkeit der Wurzelfunktion kann man auch mit Hilfe von Satz 3.3.5, (vii), leicht zeigen. 6.2 Der Zwischenwertsatz Sei I ⊆ R ein Intervall. Die Anschauung von Stetigkeit legt nahe, dass mit I auch f (I) ein Intervall ist. 6.2.1 Bemerkung. Man überlegt sich leicht, dass I ⊆ R genau dann ein Intervall ist, d.h. genau dann eine der Formen (a, b ∈ R, a < b,) ∅, (a, b), [a, b], [a, a], (a, b], [a, b), (a, +∞), (−∞, a), [a, +∞), (−∞, a], R, hat, wenn für I gilt ∀x, y ∈ I, x < y ⇒ [x, y] ⊆ I. Um zu rechtfertigen, dass f (I) wieder ein Intervall ist, werden wir eine weitere charakteristische Eigenschaft von Intervallen herleiten. 6.2.2 Definition. Dazu nennen wir eine Teilmenge E eines metrischen Raumes zusammenhängend, wenn man E nicht als Vereinigung zweier nichtleerer getrennter Mengen schreiben kann. Dabei heißen A und B getrennt, wenn c(A) ∩ B = A ∩ c(B) = ∅. 6.2.3 Proposition. Sei I ⊆ R. Dann ist I genau dann ein Intervall, wenn I zusammenhängend ist. Beweis. Im Falle, dass I nur ein oder gar kein Element enthält – also I = {x} oder I = ∅ –, erkennt man sofort mit Bemerkung 6.2.1 und Definition 6.2.2, dass I ein Intervall und I auch zusammenhängend ist. Wir können also für den Rest des Beweises annehmen, dass I zumindest zwei verschiedene Elemente enthält. Angenommen es existieren x, y ∈ I, x < y, sodass [x, y] * I. Wähle z ∈ [x, y] \ I und setze A := (−∞, z] ∩ I, B := [z, +∞) ∩ I. Dann sind A und B disjunkt, und jeder Häufungspunkt t von A ist in (−∞, z], da diese Menge ja abgeschlossen ist. Wegen z < I folgt t < B und damit c(A) ∩ B = ∅. Genauso sieht man A ∩ c(B) = ∅. Also ist I nicht zusammenhängend. Sei umgekehrt I nicht zusammenhängend. Dann können wir I als A ∪ B mit nichtleeren A, B schreiben, wobei c(A) ∩ B = A ∩ c(B) = ∅. Wähle x ∈ A und y ∈ B, und sei o.B.d.A. angenommen, dass x < y. Man betrachte t = sup(A ∩ [x, y]). Insbesondere ist x ≤ t ≤ y. Weiters folgt aus t ∈ c(A ∩ [x, y]) ⊆ c(A) (siehe Beispiel 3.3.4), dass t < B, und somit x ≤ t < y. 6.2. DER ZWISCHENWERTSATZ 137 Wir wollen nun [x, y] * I zeigen, was im Fall t < A, sofort aus t ∈ [x, y] \ (A ∪ B) = [x, y] \ I folgt. Im Fall t ∈ A, folgt aus t < c(B) die Existenz einer ǫ-Kugel (t − ǫ, t + ǫ), sodass (t − ǫ, t + ǫ) ∩ B = ∅ . Also ist t + 2ǫ < B, und weil y ∈ B, gilt x < t + 2ǫ < t + ǫ ≤ y bzw. t + 2ǫ ∈ (x, y). Wegen t = sup(A∩[x, y]) kann t+ 2ǫ aber nicht in A liegen. Also t+ 2ǫ ∈ [x, y]\(A∪ B) = [x, y]\ I und daher [x, y] * I. ❑ 6.2.4 Proposition. Seien hX, dX i und hY, dY i metrische Räume, D ⊆ X, und sei f : D → Y eine stetige Funktion. Ist E ⊆ D zusammenhängend, so auch f (E). Beweis. Angenommen f (E) wäre nicht zusammenhängend. Dann gilt f (E) = A∪B mit A, B , ∅ und c(A)∩B = A∩c(B) = ∅. Für die nichtleeren Mengen E∩ f −1 (A), E∩ f −1 (B) folgt E = E ∩ f −1 (A) ∪ E ∩ f −1 (B) , E ∩ f −1 (A) ∩ E ∩ f −1 (B) = ∅. Zu jedem x ∈ c E ∩ f −1 (A) ∩ E ∩ f −1 (B) gibt es wegen Lemma 5.1.13 eine gegen x konvergente Folge (xn )n∈N aus E ∩ f −1 (A). Es folgt limn→∞ f (xn ) = f (x), und somit f (x) ∈ c f (E ∩ f −1 (A)) ⊆ c(A). Andererseits ist f (x) ∈ f E ∩ f −1 (B) ⊆ B im Widerspruch zu c(A) ∩ B = ∅. Also kann nur c E ∩ f −1 (A) ∩ E ∩ f −1 (B) = ∅. Entsprechend gilt c E ∩ f −1 (B) ∩ E ∩ f −1 (A) = ∅, und E wäre somit nicht zusammenhängend, was unserer Annahme widerspricht. ❑ 6.2.5 Beispiel. Wir werden später sehen, dass die Einheitskreislinie T = {z ∈ C : |z| = 1} als das Bild von [0, 2π) unter der stetigen Abbildung x 7→ exp(ix) geschrieben werden kann. Nach Proposition 6.2.4 identifizieren wir damit T als zusammenhängend. 6.2.6 Korollar (Zwischenwertsatz). Sei I ⊆ D ein Intervall und f : I → R stetig. Dann ist auch f (I) ein Intervall. Ist insbesondere c ∈ R mit (−∞ ≤) inf f (I) < c < sup f (I) (≤ +∞), so existiert ein Punkt x ∈ I mit f (x) = c. Insbesondere gilt: Ist f stetig auf [a, b] und c eine Zahl zwischen f (a) und f (b), dh. f (a) < c < f (b) oder f (b) < c < f (a), so existiert ein Punkt x ∈ (a, b) mit f (x) = c. Beweis. Mit I ist nach Proposition 6.2.4 auch f (I) ⊆ R zusammenhängend, und somit nach Proposition 6.2.3 ein Intervall. Wählt man α, β ∈ f (I) mit inf x∈I f (x) < α < c < β < supx∈I f (x), dann enthält f (I) das ganze Intervall [α, β] (siehe Bemerkung 6.2.1). Also gibt es ein x ∈ I mit f (x) = c. ❑ 6.2.7 Beispiel. Die Funktion f : [0, +∞) → R definiert durch f (t) = tn für ein festes n ∈ N ist stetig. In Bemerkung 2.7.7 hatten wir in Folge der Existenz von n-ten Wurzeln – vgl. Satz 2.7.5 – schon festgestellt, dass f ([0, +∞)) = [0, +∞). KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 138 sup f (I) f (I) f (x) = c inf f (I) x I Abbildung 6.2: Veranschaulichung des Zwischenwertsatzes Ohne Satz 2.7.5 zu verwenden, können wir das auch aus Korollar 6.2.6 herleiten. In der Tat folgt aus Korollar 6.2.6, dass f ([0, +∞)) ein Intervall ist. Wegen f (t) ≥ 0 für t ∈ [0, +∞) folgt f ([0, +∞)) ⊆ [0, +∞). Aus limt→∞ f (t) = +∞ schließen wir, dass das Intervall f ([0, +∞)) beliebig große Zahlen enthält, also nicht beschränkt sein kann. Zusammen mit f (0) = 0 folgt daraus, dass f ([0, +∞)) nur von der Form [0, +∞) sein kann. Da f streng monoton wachsend und somit f : [0, +∞) → [0, +∞) bijektiv ist, folgt somit auch ohne Satz 2.7.5, dass tn = x für jedes reelle x ≥ 0 eine eindeutige Lösung in [0, +∞) hat – also dass es eindeutige n-te Wurzeln von Zahl aus [0, +∞) in [0, +∞) gibt. 6.3 Gleichmäßige Stetigkeit Die Definition der Stetigkeit einer Funktion f : D → Y lautet, in logischen Formeln angeschrieben, ∀x ∈ D ∀ǫ > 0 ∃δ > 0 : ∀t ∈ D : dX (t, x) < δ ⇒ dY ( f (t), f (x)) < ǫ . (6.2) Die Zahl δ, die es zu jedem ǫ geben muss, hängt im Allgemeinen nicht nur von ǫ, sondern auch von der Stelle x ab. 6.3.1 Beispiel. Betrachte die Funktion f (x) = x−1 : R+ → R+ . Ist x ∈ R und ǫ > 0 gegeben, so berechnet man: 1 1 δ − = . x x + δ (x + δ)x 2 ǫx Damit dieser Ausdruck ≤ ǫ ist, darf δ höchstens 1−ǫ x sein. Man sieht, dass diese größt mögliche Wahl von δ immer kleiner wird, je kleiner x wird, und tatsächlich für x → 0 ebenfalls gegen 0 strebt. Man kann in diesem Beispiel also tatsächlich zu gegebenem ǫ kein δ finden das von x unabhängig ist. 6.3. GLEICHMÄSSIGE STETIGKEIT 139 Sollte eine Funktion nun so beschaffen sein, dass dieses Phänomen nicht auftritt, sollte also zu gegebenem ǫ stets ein δ existieren, welches für alle x funktioniert, so nennt man die Funktion gleichmäßig stetig. 6.3.2 Definition. Seien hX, dX i und hY, dY i metrische Räume, und sei f : D → Y eine Funktion. Dann heißt f gleichmäßig stetig, wenn gilt ∀ǫ > 0 ∃δ > 0 ∀x, t ∈ D : dX (t, x) < δ ⇒ dY ( f (t), f (x)) < ǫ . Vergleicht man diese Definition mit der Formel (6.2), so sieht man, dass man hier den Allquantor ∀x ∈ X und den Existenzquantor ∃δ > 0 vertauscht hat. Dies wird also nicht den gleichen, sondern einen stärkeren Begriff liefern. Ist f gleichmäßig stetig, so ist f auch stetig. Wie wir am obigen Beispiel sehen, gilt die Umkehrung nicht. Interessant in diesem Zusammenhang ist nun der folgende Satz. 6.3.3 Satz. Seien hX, dX i und hY, dY i metrische Räume, und D ⊆ X kompakt. Dann ist jede stetige Funktion f : D → Y sogar gleichmäßig stetig. Beweis. Nehme man das Gegenteil an. Dann gibt es ein ǫ > 0, sodass es für alle n ∈ N Punkte xn , yn ∈ D gibt, sodass dX (xn , yn ) < 1n und dY ( f (xn ), f (yn )) ≥ ǫ. Die Folgen (xn )n∈N (yn )n∈N haben wegen der Kompaktheit von D Häufungspunkte x bzw. y. Somit gilt x = lim xn(k) , y = lim yn(k) k→∞ k→∞ für Teilfolgen (xn(k) )k∈N und (yn(k) )k∈N . Aus dX (xn(k) , yn(k) ) < 3.2.10, dass dX (x, y) = lim dX (xn(k) , yn(k) ) = 0, 1 n(k) folgt mit Lemma k→∞ also x = y und somit f (x) = f (y). Andererseits folgt aus der Stetigkeit zusammen mit Lemma 3.3.1 der offensichtliche Widerspruch dY ( f (x), f (y)) = dY ( lim f (xn(k) ), lim f (yn(k) )) = lim dY ( f (xn(k) ), f (yn(k) )) ≥ ǫ. k→∞ k→∞ k→∞ ❑ 6.3.4 Beispiel. Für nicht kompaktes E ⊆ R gilt: (i) Es gibt eine auf E stetige Funktion die nicht beschränkt ist. (ii) Es gibt eine auf E stetige und beschränkte Funktion, die kein Maximum hat. (iii) Ist E beschränkt, so gibt es eine auf E stetige, aber nicht gleichmäßig stetige Funktion. Wir betrachten zuerst den Fall, dass E einen Häufungspunkt x0 hat, der nicht zu E gehört (dieser Fall tritt sicher immer dann ein, wenn E beschränkt ist, denn dann würde 1 ist stetig auf E, aber nicht aus abgeschlossen kompakt folgen). Die Funktion x 7→ x−x 0 1 beschränkt. Sie ist auch nicht gleichmäßig stetig. Die Funktion f (x) = 1+(x−x 2 ist 0) stetig auf E und beschränkt (0 < f (x) < 1). Offenbar gilt limx→x0 f (x0 ) = 1, also sup x∈E f (x) = 1. Betrachte nun den Fall, dass E nicht beschränkt ist. (i) folgt mit f (x) = x, (ii) mit x2 f (x) = 1+x 2. In (iii) kann man die Forderung, dass E beschränkt ist, nicht ganz weglassen. Zum Beispiel betrachte E = Z. Dann ist jede Funktion auf E gleichmäßig stetig, denn man kann stets irgendein δ < 1 wählen, z.B. also δ = 21 ). KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 140 6.3.5 Satz. Seien hX, dX i und hY, dY i metrische Räume, wobei hY, dY i sogar vollständig ist. Weiters sei D ⊆ X und f : D → Y gleichmäßig stetig. Dann existiert eine eindeutige gleichmäßig stetige Fortsetzung F : c(D) → Y. Beweis. Sei (xn )n∈N eine Cauchy-Folge von Punkten aus D. Zu ǫ > 0 wähle δ > 0 so, dass dY f (y), f (z) < ǫ für dX (y, z) < δ . (6.3) Weiters wähle N ∈ N so, dass dX (xn , xm ) < δ für alle n, m ≥ N. Dann folgt dY f (xn ), f (xm ) < ǫ, n, m ≥ N, d.h. ( f (xn ))n∈N ist eine Cauchy-Folge in Y. Somit existiert der Limes limn→∞ f (xn ). Sei x ∈ X, und seien (xn )n∈N und (yn )n∈N zwei Folgen von Punkten in D mit xn → x sowie yn → x. Ist ǫ > 0 gegeben und δ > 0 wie in (6.3), so wähle N ∈ N mit dX (xn , x) < δ δ , dX (yn , x) < , n ≥ N. 2 2 Insbesondere gilt dX (xn , yn ) ≤ dX (xn , x) + dX (yn , x) < δ für alle n ≥ N. Es folgt dY ( f (xn ), f (yn )) < ǫ, n ≥ N, und daher dY lim f (xn ), lim f (yn ) ≤ ǫ. n→∞ n→∞ Da ǫ > 0 beliebig war, folgt limn→∞ f (xn ) = limn→∞ f (yn ). Zu jedem Sx ∈ c(D) gibt es definitionsgemäß eine Folge (xn )n∈N mit xn → x. Definiere F(x) := lim f (xn ). n→∞ Wegen der obigen Punkte ist F eine wohldefinierte Funktion von X nach Y. Ist x ∈ D, so betrachte die konstante Folge xn := x. Dann gilt sicher xn → x und f (xn ) → f (x), also F(x) = f (x). Somit ist F eine Fortsetzung von f . Es bleibt zu zeigen, dass F gleichmäßig stetig ist. Sei dazu ǫ > 0 gegeben. Wähle δ > 0 so, dass dY ( f (x), f (y)) < für x, y ∈ D mit dX (x, y) < δ. ǫ 3 Seien nun x, y ∈ c(D) mit dX (x, y) < 3δ . Wähle xn , yn ∈ D mit xn → x, yn → y und N ∈ N mit dX (xn , x) < δ δ ǫ ǫ , dX (yn , y) < , dY (F(x), f (xn )) < , dY (F(y), f (yn )) < , n ≥ N . 3 3 3 3 Dann gilt dX (xn , yn ) < δ und daher dY ( f (xn ), f (yn )) < 3ǫ . Somit erhalten wir dY (F(x), F(y)) < ǫ. Die Eindeutigkeit folgt sofort aus Korollar 6.1.5. ❑ 6.4 Unstetigkeitsstellen Sei hY, dY i ein metrischer Raum, und sei f : (a, b) → Y mit a, b ∈ R, a < b. Weiters sei x ∈ (a, b). f ist gemäß Proposition 6.1.4 genau dann bei x stetig, wenn f (x) = limt→x f (t). In (5.28) haben wir gesehen, dass f (x) = limt→x f (t) genau dann, wenn die Grenzwerte f (x−) := limt→x− f (t) und f (x+) := limt→x+ f (t) existieren und beide mit f (x) übereinstimmen. 6.4.1 Bemerkung. Gilt zumindest f (x) = f (x−) ( f (x) = f (x+)), so spricht man von Linksstetigkeit bzw. linksseitiger Stetigkeit (Rechtsstetigkeit bzw. rechtsseitiger Stetigkeit) der Funktion f bei x. Klarerweise ist f bei x stetig, wenn f bei x sowohl links- als auch rechtsstetig ist. 6.4. UNSTETIGKEITSSTELLEN 141 Ist f nicht stetig, so unterscheidet man folgende Fälle. 6.4.2 Definition. Sei f unstetig bei x. Man sagt, f habe eine Unstetigkeit 1. Art bei x, falls f (x−) := limt→x− f (t) und f (x+) := limt→x+ f (t) existieren, aber nicht beide gleich f (x) sind. Für Unstetigkeiten 1. Art gibt es zwei Möglichkeiten. Entweder f (x−) , f (x+), in welchem Fall man von einer Sprungstelle spricht, oder f (x−) = f (x+) , f (x). Dann spricht man von einer hebbaren Unstetigkeit. Liegt keine Unstetigkeit 1. Art vor, so spricht man von einer Unstetigkeit 2. Art. Den Begriff hebbar“hat man deswegen gewählt, weil man dann f an der Stelle x ” so abändern kann, dass die neue Funktion bei x stetig ist. 6.4.3 Beispiel. Betrachte die Funktion 1 , falls x rational f (x) = 0 , falls x irrational Diese Funktion hat an jeder Stelle x eine Unstetigkeit 2.Art. Sei x g(x) = 0 , falls x rational , falls x irrational g ist stetig bei 0, hat aber an jeder Stelle x , 0 eine Unstetigkeit 2.Art. Es gibt nämlich eine Folge (rn )n∈N aus Q ∩ (x, +∞) und eine Folge (xn )n∈N aus R \ Q ∩ (x, +∞), die beide gegen x konvergieren (vgl. Beispiel 3.3.4). Nun ist aber f (xn ) = 0 → 0 und f (rn ) = rn → x für n → ∞. Nach (5.28) kann somit limt→x+ f (t) nicht existieren. Ähnlich zeigt man, dass auch limt→x− f (t) nicht existiert. Sei h x+2 h(x) = −x −2 x + 2 2 , falls x ∈ (−3, −2) , falls x ∈ [−2, 0) , falls x ∈ [0, 1) 1 −3 −2 −1 0 −1 −2 Dann ist h stetig auf (−3, 1) \ {0} und hat bei 0 eine Sprungstelle. Wir setzen den Begriff der Sinusfunktion (aus der Schule) voraus. Sei 1 KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 142 f 1 sin x f (x) = 0 , x>0 , x≤0 0 1 π Dann ist f stetig auf R \ {0} und hat eine Unstetigkeit 2.Art bei 0. Es können also im Allgemeinen alle möglichen Varianten von Unstetigkeiten auftreten. Thematisch dazu passend wollen wir uns der Fortsetzbarkeit von stetigen Funktionen auf um einen Punkt größere Mengen zuwenden. 6.4.4 Bemerkung. Seien hX, dX i und hY, dY i metrische Räume und D ⊆ X, und sei f : D → Y eine stetige Funktion. Sei weiters x ∈ X \ D. Wir fragen uns, ob wir eine Fortsetzung f˜ : D ∪ {x} → Y von f finden können, die die Eigenschaft stetig zu sein beibehält. Wenn x kein Häufungspunkt von D ist, so sieht man leicht, dass x ein isolierter Punkt von D ∪ {x} ist, und daher jede Fortsetzung f˜ stetig ist. Sei also x ein Häufungspunkt von D. Gibt es eine stetige Fortsetzung f˜, so muss nach Proposition 6.1.4 f˜(x) = limt→x f (t). Existiert umgekehrt limt→x f (t), so setze man limt→x f (t) , falls s = x ˜ f (s) = f (s) , falls s ∈ D Klarerweise ist f˜ eine Fortsetzung von f . Wegen Proposition 6.1.4, (ii), ist f˜ bei x stetig. Andererseits ist wegen Fakta 6.1.3 mit f auch f˜ bei allen t ∈ D stetig. Also ist f˜ eine auf D ∪ {x} stetige Fortsetzung. 6.4.5 Beispiel. Seien a, b, c ∈ R, c ≤ 0, D = (−∞, 0) ∪ (0, +∞) und f : D → R definiert durch b f (x) = a für x < 0 und f (x) = x−c für x > 0. Dann gilt lim x→0− f (t) = a und , falls b , 0, c < 0 −b c lim f (t) = sgn(b) · ∞ , falls b , 0, c = 0 x→0+ 0 , falls b = 0 Aus Bemerkung 6.4.4 wissen wir, dass sich f genau dann zu einer Funktion f˜ : R → R fortsetzen lässt, wenn limt→0 f (t) existiert. Nach (5.28) existiert dieser Grenzwert genau dann, wenn a = b = 0 oder b , 0, c , 0, a = − bc . Dabei muss f˜(0) = 0 bzw. f˜(0) = a = − bc . Die komplexwertige Funktion f (z) = iz + 1 z3 + z 6.5. MONOTONE FUNKTIONEN 143 ist zunächst definiert auf D = {z ∈ C : z3 + z , 0} = C \ {0, i, −i}, dh. f : D → C. Das zu Beispiel 6.1.10 analoge Beispiel für komplexe Polynome zeigt die Stetigkeit von f auf D. Zudem gilt wegen Fakta 5.3.8 lim f (z) = lim z→i z→i i i(z − i) i i i =− . = lim = = z(z + i)(z − i) z→i z(z + i) limz→i z(z + i) 2i2 2 Somit lässt sich f stetig auf D̃ = D ∪ {i} durch f (i) = − 2i fortsetzen. Eine Fortsetzung auf eine noch größere Menge – etwa auf D̃ ∪ {−i} – ist nicht möglich, da dann auch limz→−i f (z) und wegen (5.9) auch limz→−i | f (z)| existieren müsste. Nun gilt aber ( vgl. Bemerkung 5.3.9) lim | f (z)| = lim z→−i z→−i 1 = +∞ , |z| · |z + i| da für den Nenner rechts limz→−i |z| · |z + i| = (limz→−i |z|) · (limz→−i |z + i|) = 0 gilt. 6.5 Monotone Funktionen 6.5.1 Definition. Man sagt, dass für ein Intervall I ⊆ R, eine Funktion f : I → R monoton wachsend ist, falls x < y ⇒ f (x) ≤ f (y) . Gilt sogar x < y ⇒ f (x) < f (y), so sagt man f sei streng monoton wachsend. Analog sagt man, f sei monoton fallend, falls x < y ⇒ f (x) ≥ f (y). Sollte x < y sogar f (x) > f (y) implizieren, so spricht von einer streng monoton fallenden Funktion. Klarerweise ist eine streng monotone Funktion stets injektiv. Nun kommen wir zur Diskussion der Unstetigkeitsstellen monotoner Funktionen. 6.5.2 Proposition. Sei f monoton wachsend auf einem reellen Intervall I, wobei a, b ∈ R ∪ {−∞, +∞}, a < b die Intervallränder bezeichnet. Dann existieren für jeden Punkt x ∈ (a, b) sowohl f (x−) := lim s→x− f (s) als auch f (x+) := limt→x+ f (t), wobei4 sup f (s) = f (x−) ≤ f (x) ≤ f (x+) = inf f (t). (6.4) x<t<b a<s<x Ist x = a ∈ I (x = b ∈ I), so gilt die rechte (linke) Seite von (6.4). Weiters gilt für x < y immer f (x+) < f (y−). Analoge Aussagen gelten für monoton fallende Funktionen. Beweis. Wir beschränken uns auf x ∈ (a, b). Der Fall der Intervallränder betrachtet man in analoger Weise. Der Beweis folgt unmittelbar aus (5.10), da die Grenzwerte in (6.4) ja Grenzwerte monotoner und beschränkter Netze sind. Die Ungleichung in (6.4) folgt leicht aus der Tatsache, dass jeder Punkt aus { f (s) : s ∈ (a, x)} kleiner oder gleich f (x) und f (x) kleiner oder gleich jedem Punkt aus { f (t) : t ∈ (x, b)} ist. Der zweite Teil der Behauptung folgt aus lim f (t) = inf f (t) = inf f (t), lim f (s) = sup f (s) = sup f (s). t→x+ x<t<b x<t<y t→y− a<s<y x<s<y KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 144 f f (x3 +) f (x3 +) f (x3 −) = f (x2 −) f (x2 ) = f (x2 +) x1 x2 x3 f (x1 +) f (x1 ) = f (x1 −) Abbildung 6.3: Veranschaulichung monotoner Funktionen ❑ 6.5.3 Korollar. Sei I ⊆ R ein Intervall, f : I → R eine monoton wachsende Funktion und J = f (I). Das Bild ist genau dann ein Intervall, wenn f stetig ist. Ist f streng monoton wachsend, so ist f −1 : J → I auch streng monoton wachsend. Dabei enthält I genau dann seinen linken (rechten) Intervallrand, wenn J sein Infimum (Supremum) enthält – also J ein Minimum (Maximum) hat. Ist f streng monoton wachsend und stetig, so ist auch f −1 : J → I streng monoton wachsend und stetig. Entsprechende Aussagen gelten für (streng) monoton fallende Funktionen. Beweis. Ist f stetig, so ist wegen Korollar 6.2.6 auch f (I) ein Intervall. Angenommen f ist nicht stetig an einem x ∈ I, das zunächst nicht ein Intervallrand von I sei. Wegen (6.4) muss lim s→x− f (s) < limt→x+ f (t). Es folgt f (τ) ≤ lim f (s) = f (x−), τ < x und f (τ) ≥ lim f (t) = f (x+), τ > x . s→x− 4 Insbesondere t→x+ können in (a, b) nur Unstetigkeitsstellen 1.Art auftreten. 6.5. MONOTONE FUNKTIONEN Also kann f keine Werte im Inter vall f (x−), f (x+) bis auf unter Umständen einen - nämlich f (x) annehmen. 145 f (x+) f (x) f (x−) Ist x der linke Intervallrand von I, so muss nach (6.4) f (x) < limt→x+ f (t). Somit folgt ( f (x), limt→x+ f (t)) ∩ J = ∅. Entsprechend argumentiert man im Fall des rechten Randes. Jedenfalls ist J kein Intervall. Wegen der strengen Monotonie ist f injektiv. Ist x, y ∈ J, x < y, und gilt f −1 (x) ≥ f −1 (y), so folgt wegen der vorausgesetzten Monotonie von f der Widerspruch x = f ( f −1 (x)) ≥ f ( f −1 (y)) = y; also gilt f (x) < f (y), womit f −1 : J → I streng monoton wachsend ist. Enthält I seinen linken Rand5 a, so folgt aus der Monotonie, dass f (a) ≤ f (t), t ∈ I, und somit dass f (a) Minimum von J ist. Hat J = f (I) das Minimum y, so folgt aus der Monotonie von f −1 , dass f −1 (y) ≤ f −1 (x), x ∈ J, und somit dass f −1 (y) Minimum von I ist; also a = f −1 (y) ∈ I. Ist f stetig, so ist J ein Intervall und die streng monoton wachsende Funktion f −1 : J → I hat als Bild genau das Intervall I. Nach dem ersten Punkt muss daher auch f −1 stetig sein. ❑ Wir werden später dieses Korollar verwenden, um z.B. zu zeigen, dass der Logarithmus eine stetige Funktion ist. 6.5.4 Beispiel. Die Funktion f : [0, +∞) → R definiert durch f (t) = tn für ein festes n ∈ N ist stetig und streng monoton wachsend. Korollar 6.5.3 bietet uns nun ei√ ne weitere Möglichkeit, einzusehen, dass f −1 = . von f ([0, +∞)) = [0, +∞) nach [0, +∞) (⊆ R) stetig ist; vgl. Beispiel 6.1.16 und Beispiel 6.2.7. Thematisch zu obigem Ergebnis passt das nächste Lemma, das aus dem Zwischenwertsatz folgt. 6.5.5 Lemma. Seien I, J ⊆ R zwei Intervalle und f : I → J stetig und bijektiv. Dann ist f streng monoton wachsend oder fallend. Beweis. Wäre f weder streng monoton wachsend noch streng monoton fallend, so gibt es x1 < x2 aus I mit f (x1 ) ≥ f (x2 ) und x3 < x4 aus I mit f (x3 ) ≤ f (x4 ). Weil f injektiv ist, muss sogar f (x1 ) > f (x2 ) und f (x3 ) < f (x4 ). Daraus folgt, dass {x1 , x2 , x3 , x4 } zumindest drei Elemente hat. Durch Fallunterscheidungen je nachdem, wie diese Punkte angeordnet sind, findet man immer a < b < c aus {x1 , x2 , x3 , x4 }, sodass entweder f (a) < f (b), f (b) > f (c) oder f (a) > f (b), f (b) < f (c). Man beachte, dass dabei wegen der Injektivität alle drei Werte f (a), f (b), f (c) untereinander verschieden sein müssen. 5I ist daher von der Form [a, a], [a, b], [a, b), [a, +∞) mit b ∈ R, b > a. KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 146 Im ersten Fall ist entweder f (a) ∈ ( f (c), f (b)) oder f (c) ∈ ( f (a), f (b)). Aus Korollar 6.2.6 folgt daher f (a) = f (t) für ein t ∈ (b, c) bzw. f (c) = f (t) für ein t ∈ (a, b), was jedenfalls der Injektivität widerspricht. Im zweiten Fall argumentiert man entsprechend. ❑ 6.6 Gleichmäßige Konvergenz P n Wir haben schon gesehen, dass z.B. die geometrische Reihe ∞ n=0 z für jedes z ∈ C, |z| < 1, konvergiert. Betrachtet man diese Reihe nicht nur für ein festes vorgegebenes z, sondern für alle z, so hat man eine Reihe, deren Summanden Funktionen von z sind, 1 und deren Summe ebenfalls eine Funktion von z nämlich 1−z ist. Betrachten wir also eine Folge ( fn )n∈N von Funktionen, die definiert ist, zum Beispiel, auf einer Menge E ⊆ R und die, zum Beispiel, reelle Werte annimmt. Wir würden gerne erklären, was es bedeutet, dass diese Folge gegen eine Funktion f konvergiert. Um einen vernünftigen Grenzwertbegriff zu bekommen, definieren wir eine Metrik, und zwar eine Metrik auf einer Menge von Funktionen f : E → R. Aber man kann in diesem konkreten Fall auch naiver an die Sache herangehen. Ist ( fn )n∈N , fn : E → R, eine Folge von Funktionen, dann ist für jedes feste x ∈ E sicher ( fn (x))n∈N eine Folge von Zahlen, und für diese wissen wir, was es bedeutet zu konvergieren. 6.6.1 Definition. Sei ∅ , E eine Menge und hY, dY i ein metrischer Raum. Eine Folge ( fn )n∈N , fn : E → Y, heißt punktweise konvergent gegen die Funktion f : E → Y, wenn für jedes feste x ∈ E gilt limn→∞ fn (x) = f (x). Entsprechend definiert man die punktweise Konvergenz von Netzen von Funktionen. Es entsteht die Frage, ob sich Eigenschaften wie etwa die fundamentale Eigenschaft der Stetigkeit der Funktionen fn auf die Grenzfunktion f übertragen. Die folgenden Beispiele illustrieren, dass in dieser Angelegenheit etwas schiefgehen kann. 6.6.2 Beispiel. Betrachte die Funktionen gn : [0, 1] → R, definiert durch gn (x) := xn , n ∈ N. Bekannterweise gilt ( 0 , falls x ∈ [0, 1) lim gn (x) = 1 , falls x = 1 n→∞ Jede der Funktionen gn ist eine stetige Funktionen auf [0, 1], nicht jedoch die Grenzfunktion. Betrachte die Funktionen fn : R → R, definiert durch fn (x) := für jedes x , 0 ∞ X x2 n=0 x2 . (1+x2 )n (1 + x2 )n eine konvergente geometrische Reihe. Ihre Summe ist 1 + x2 , x , 0. Für x = 0 sind alle Summanden = 0, also auch ihre Summe. Man erhält ( ∞ X 1 + x2 , falls x , 0 fn (x) = 0 , falls x = 0 n=0 Dann ist 6.6. GLEICHMÄSSIGE KONVERGENZ 147 Alle Funktionen fn , und damit auch alle Partialsummen obiger Reihe sind stetige Funktionen von x ∈ R, nicht jedoch die Grenzfunktion. Die punktweise Konvergenz von Funktionen ist also nicht stark genug um etwa die Eigenschaft der Stetigkeit zu erhalten. 6.6.3 Definition. Sei ∅ , E eine Menge und hY, dY i ein metrischer Raum. Wir bezeichnen mit B(E, Y) die Menge aller beschränkten Funktionen f : E → Y, d.h. B(E, Y) := f : E → Y : ∃R > 0, y ∈ Y : ∀x ∈ E ⇒ dY ( f (x), y) ≤ R . Man definiert nun die Abbildung ( B(E, Y) × B(E, Y) → R d∞ : ( f, g) 7→ sup{dY ( f (x), g(x)) : x ∈ E} und spricht von der Supremumsmetrik6 . d∞ ( f, g) ist in der Tat eine reelle Zahl, da es wegen f, g ∈ B(E, Y) reelle R1 , R2 > 0 und y1 , y2 ∈ Y gibt, sodass dY ( f (x), y1 ) ≤ R1 und dY (g(x), y2) ≤ R2 und somit dY ( f (x), g(x)) ≤ dY ( f (x), y1 ) + dY (y1 , y2 ) + dY (y2 , g(x)) ≤ R1 + dY (y1 , y2 ) + R2 für alle t ∈ E gilt. Also ist die nichtleere Teilmenge {dY ( f (x), g(x)) : x ∈ E} von R nach oben beschränkt. f g Für reellwertige Funktionen f, g : E → R = Y ist dY (x, y) = |x − y| und daher d∞ ( f, g) = sup x∈E | f (x) − g(x)|. d∞ ( f, g) | f − g| E 6.6.4 Lemma. Die Supremumsmetrik d∞ ist eine Metrik auf der Menge B(E, Y). Beweis. Für f, g ∈ B(E, Y) ist {dY ( f (x), g(x)) : x ∈ E} eine nichtleere Teilmenge von [0, +∞), wodurch d∞ ( f, g) ≥ 0. Dabei gilt offenbar d∞ ( f, g) = sup{dY ( f (x), g(x)) : x ∈ E} = 0 genau dann, wenn {dY ( f (x), g(x)) : x ∈ E} = {0} – also genau dann, wenn dY ( f (x), g(x)) = 0 für jedes x ∈ E. Letzteres ist aber zu f (x) = g(x), x ∈ E – also f = g äquivalent. 6 Identifiziert man R p mit der Menge aller Funktionen von {1, . . . , p} nach R, so stimmt auf R p die Supremumsmetrik hier mit mit der aus Beispiel 3.1.5, (ii), überein. KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 148 Aus dY ( f (x), g(x)) = dY (g(x), f (x)) folgt d∞ ( f, g) = d∞ (g, f ). Ist h eine weitere Funktion, so gilt für festes x ∈ E dY ( f (x), g(x)) ≤ dY ( f (x), h(x)) + dY (h(x), g(x)) , und daher auch dY ( f (x), g(x)) ≤ sup dY ( f (t), h(t)) + sup dY (h(t), g(t)) = d∞ ( f, h) + d∞ (h, g) . t∈E t∈E Da diese Beziehung für jedes x ∈ E gilt, folgt auch d∞ ( f, g) = sup x∈E dY ( f (x), g(x)) ≤ d∞ ( f, h) + d∞ (h, g). ❑ 6.6.5 Definition. Eine Folge ( fn )n∈N von Funktionen aus B(E, Y) heißt gleichmäßig gegen f , wenn limn→∞ fn = f bezüglich d∞ , d.h. wenn ∀ǫ > 0 ∃N ∈ N : d∞ ( fn , f ) ≤ ǫ, n ≥ N, (6.5) oder äquivalent dazu ∀ǫ > 0 ∃N ∈ N : d∞ ( fn , f ) < ǫ, n ≥ N. Entsprechend definiert man die gleichmäßige Konvergenz von Netzen von Funktionen. f fn , n ≥ N f +ǫ f −ǫ E Abbildung 6.4: Veranschaulichung der gleichmäßigen Konvergenz 6.6.6 Bemerkung. Ist f ∈ B(E, Y) und g irgendeine Funktion von E → Y mit der Eigenschaft, dass supt∈E dY ( f (t), g(t)) < ∞, so folgt aus der Dreiecksungleichung, dass auch g eine beschränkte Funktion ist. Ist daher ( fn )n∈N eine Folge aus B(E, Y), und gilt supt∈E dY ( fn (t), g(t)) → 0, so folgt g ∈ B(E, Y) und fn → g gleichmäßig. Der Unterschied zwischen punktweiser und gleichmäßiger Konvergenz liegt darin begründet, dass man ein N finden muss, das für alle x ∈ E funktioniert. In der Tat gilt d∞ ( fn , f ) ≤ ǫ ⇔ ∀x ∈ E ⇒ dY ( fn (x), f (x)) ≤ ǫ, und somit ist (6.5) äquivalent zu ∀ǫ > 0 ∃N ∈ N ∀x ∈ E : dY ( fn (x), f (x)) ≤ ǫ, n ≥ N , 6.6. GLEICHMÄSSIGE KONVERGENZ 149 wogegen punktweise Konvergenz bedeutet ∀x ∈ E ∀ǫ > 0 ∃N ∈ N : dY ( fn (x), f (x)) ≤ ǫ, n ≥ N . Insbesondere sehen wir, dass jede gleichmäßig konvergente Folge auch punktweise konvergiert und zwar zur gleichen Grenzfunktion. 6.6.7 Beispiel. Betrachte nochmals die reellwertigen Funktionen gn (x) := xn , n ∈ N nun definiert für x ∈ [0, 1), vgl. Beispiel 6.6.2. Wir wissen schon, dass gn punktweise gegen die Nullfunktion auf [0, 1) konvergiert. Dabei gilt wegen xn < 1 für x ∈ [0, 1), n ∈ N, und wegen limx→1− xn = 1, dass d∞ (gn , 0) = sup dR (gn (x), 0) = sup |xn | = 1. x∈[0,1) x∈[0,1) Also d∞ (gn , 0) 6→ 0 für n → ∞, d.h. (gn )n∈N konvergiert nicht gleichmäßig gegen die Nullfunktion. gn (x) 1 n=1 n=3 n=7 n = 13 1 2 0 1 2 η 1 x Abbildung 6.5: Graph der Funktionen gn für ausgewählte n ∈ N 6.6.8 Beispiel. Sei η ∈ (0, 1) fest, und betrachtet die Funktionenfolge gn (x) = xn , n ∈ N, auf dem Intervall [0, η]. Klarerweise konvergiert auch diese eingeschränkte Funktionenfolge punktweise gegen die Nullfunktion auf [0, η]. Nun folgt aber wegen d∞ (gn , 0) = sup dR (gn (x), 0) = sup |xn | = ηn , x∈[0,η] x∈[0,η] dass d∞ (gn , 0) → 0 für n → ∞. Also konvergiert gn sogar gleichmäßig gegen die Nullfunktion. 1 2 6.6.9 Beispiel. Man untersuche die Funktionenfolge fn (x) := nxe− 2 nx , x ∈ [0, ∞), n ∈ N, auf gleichmäßige Konvergenz. Dabei greifen wir der Definition der Funktion x 7→ e x für x ∈ R weiter hinten vor. Wir verwenden auch die Tatsache, dass ye−y → 0 für y → +∞. Weiters verwenden wir die Differentialrechnung zur Bestimmung von Extrema. Da dieses Beispiel nur zum besseren Verständnis des Begriffes der gleichmäßigen Konvergenz dient und später nicht verwendet wird, sind diese Vorgriffe gerechtfertigt. KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 150 Zunächst sei bemerkt, dass für alle n ∈ N die Funktion fn (x) stetig ist und fn (x) ≥ 0 für x ∈ [0, ∞). Eine getrennte Untersuchung der Fälle x , 0 und x = 0 liefert punktweise Konvergenz fn (x) → f (x) ≡ 0 für n → ∞. Um ( fn )n∈N auf gleichmäßige Konvergenz gegen die Funktion f (x) ≡ 0 zu untersuchen betrachtet man die Supremumsmetrik d∞ ( fn , 0) = sup dR ( fn (x), 0) = sup | fn (x)|. x∈[0,∞) x∈[0,∞) Da für jedes n ∈ N die Funktion fn (x) nicht negativ ist, fn (0) = 0 und lim x→∞ fn (x) = 0 gilt, folgt, dass fn (x) sogar ein Maximum in [0, ∞) annimmt. Um das Maximum zu berechnen, ist Satz 7.2.2 hilfreich. Für jedes n ∈ N ist fn (x) beliebig oft differenzierbar, und setzt man die erste Ableitung gleich Null, so erhält man 1 1 1 2 2 2 ±1 fn′ (x) = ne− 2 nx − n2 x2 e− 2 nx = e− 2 nx (n − n2 x2 ) = 0 ⇔ x = √ . n Also ist x = √1n die einzige Nullstelle der ersten Ableitung, die in [0, ∞) enthalten ist. Wegen lim x→∞ fn (x) = 0 folgt daher, dass das Maximum der Funktion fn (x) an der Stelle x = √1n liegt. Somit ergibt sich für die Supremumsmetrik 1 1 n d∞ ( fn , 0) = sup | fn (x)| = max | fn (x)| = fn √ = √ e− 2 . x∈[0,∞) n n x∈[0,∞) Daraus folgt d∞ ( fn , 0) 6→ 0 für n → ∞, d.h. ( fn )n∈N konvergiert nicht gleichmäßig gegen die Nullfunktion. fn (x) 7 n=1 n=5 6 n = 20 5 n = 120 4 3 2 1 0 1 2 1 3 2 2 5 2 3 7 2 x Abbildung 6.6: Graph der Funktionen fn für ausgewählte n ∈ N 1 2 6.6.10 Beispiel. Sei η > 0 und betrachtet man die Funktionenfolge fn (x) := nxe− 2 nx , n ∈ N, auf dem Intervall [η, ∞). Aus dem vorigen Beispiel wissen wir bereits, dass die Funktion fn (x) für x > √1n monoton fallend ist. Wegen 1 ∀δ > 0 ∃n0 ∈ N : δ > √ ∀n ≥ n0 n 6.6. GLEICHMÄSSIGE KONVERGENZ 151 gibt es ein n0 ∈ N, sodass √1n < [η, ∞) für alle n ≥ n0 . Daher ergibt sich für n ≥ n0 in diesem Fall für die Supremumsmetrik 1 2 d∞ ( fn , 0) = sup | fn (x)| = max | fn (x)| = fn (η) = nηe− 2 nη . x∈[η,∞) x∈[η,∞) Also folgt d∞ ( fn , 0) → 0 für n → ∞, d.h. ( fn )n∈N konvergiert gleichmäßig gegen die Nullfunktion. Gleichmäßige Konvergenz sichert nun – wie wir auch später immer wieder feststellen werden – , dass sich Grenzübergänge gutmütig verhalten. 6.6.11 Lemma. Sei hX, dX i ein metrischer Raum und hY, dY i ein vollständig metrischer Raum, ∅ , E ⊆ X, und seien f, fn ∈ B(E, Y), n ∈ N. Weiters sei (xk )k∈N eine Folge in E. Ist die Folge ( fn )n∈N auf E gleichmäßig konvergent gegen f , und existiert für jedes n ∈ N der Grenzwert lim fn (xk ) = An , k→∞ dann konvergieren die Folgen (An )n∈N und ( f (xk ))k∈N in Y und zwar gegen denselben Grenzwert. Also gilt lim lim fn (xk ) = lim lim fn (xk ). k→∞ n→∞ n→∞ k→∞ Beweis. Sei ǫ > 0 gegeben. Da ( fn )n∈N → f bezüglich d∞ , ist ( fn )n∈N in B(E, Y) eine Cauchy-Folge. Es existiert also ein N ∈ N, sodass für n, m ≥ N und alle t ∈ E gilt dY ( fn (t), fm (t)) ≤ ǫ. Hält man n und m fest und lässt man t die Folge (xk )k∈N durchlaufen, so folgt mit Lemma 3.2.10 und Lemma 3.3.1 die Beziehung dY (An , Am ) ≤ ǫ. Damit ist (An )n∈N eine Cauchy-Folge in Y und daher konvergent, limn→∞ An =: A. Nun gilt dY ( f (xk ), A) ≤ dY ( f (xk ), fn (xk )) + dY ( fn (xk ), An ) + dY (An , A). Wähle n so groß, dass für alle t ∈ E und insbesondere für alle t = xk dY ( f (t), fn (t)) < ǫ und dY (An , A) < ǫ. Für dieses n existiert ein k0 ∈ N, sodass aus k ≥ k0 die Ungleichung dY ( fn (xk ), An ) < ǫ folgt. Insgesamt erhalten wir dY ( f (xk ), A) < 3ǫ, k ≥ k0 . ❑ 6.6.12 Bemerkung. Wir werden später eine Verallgemeinerung dieses Lemmas für Netze zeigen. Der Beweis davon wird im Wesentlich derselbe sein. 6.6.13 Korollar. Sei hX, dX i ein metrischer Raum und hY, dY i ein vollständig metrischer Raum, ∅ , E ⊆ X, und seien f, fn ∈ B(E, Y), n ∈ N, sodass ( fn )n∈N auf E gleichmäßig gegen f konvergiert. Sind die Funktionen fn alle stetig bei einem x ∈ E, so ist es auch f . Sind alle fn auf ganz E stetig, so ist es auch f . KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 152 k→∞ Beweis. Sei x ∈ E und sei (xk )k∈N eine Folge mit xk −→ x. Aus Lemma 6.6.11 folgt lim f (xk ) = lim lim fn (xk ) = lim lim fn (xk ) = lim fn (x) = f (x). k→∞ k→∞ n→∞ n→∞ k→∞ n→∞ Nach Proposition 6.1.4 ist f bei x stetig. ❑ 6.6.14 Bemerkung. Nach Lemma 5.1.13 erhält man, dass die Menge Cb (E, Y) aller beschränkten und stetigen Funktionen von E → Y, eine abgeschlossene Teilmenge von B(E, Y) versehen mit der Metrik d∞ ist. Dabei ist E Teilmenge eines metrischen Raumes. 6.6.15 Satz. Ist ∅ , E eine Menge und hY, dY i ein vollständig metrischer Raum, so ist hB(E, Y), d∞i ebenfalls ein vollständig metrischer Raum. Somit konvergiert eine Folge ( fn )n∈N von Funktionen aus B(E, Y) genau dann gleichmäßig, wenn es zu jedem ǫ > 0 ein N ∈ N gibt, sodass für alle n, m ≥ N und beliebiges x ∈ E gilt dY ( fn (x), fm (x)) ≤ ǫ. (6.6) Beweis. Klarerweise ist eine konvergente Folge ( fn )n∈N von Funktionen aus B(E, Y) eine Cauchy-Folge. Diese Tatsache gilt ja in allen metrischen Räumen. Sei nun umgekehrt die Cauchy-Bedingung erfüllt. Man beachte, dass (6.6) für alle x ∈ E zu d∞ ( fn , fm ) ≤ ǫ äquivalent ist. Es folgt, dass insbesondere für jedes einzelne x die Folge ( fn (x))n∈N eine CauchyFolge in Y und daher konvergent ist. Also existiert der Grenzwert limn→∞ fn (x) punktweise auf E. Wir setzen f (x) := lim fn (x). n→∞ Wir müssen nun noch zeigen, dass f beschränkt ist und dass die Konvergenz sogar gleichmäßig stattfindet. Sei ǫ > 0 gegeben und wähle N ∈ N so, dass dY ( fn (x), fm (x)) ≤ ǫ für alle n, m ≥ N und alle x ∈ E. Hält man x fest und lässt m → ∞ streben, so folgt für n ≥ N dY ( fn (x), f (x)) ≤ ǫ. Da x beliebig, war folgt d∞ ( fn , f ) ≤ ǫ, n ≥ N, d.h. fn → f gleichmäßig und mit Bemerkung 6.6.6 ist f beschränkt. ❑ 6.7 Reell- und komplexwertige Folgen und Reihen 6.7.1 Definition. Ist Y = R oder Y = C und ∅ , E eine Menge, dann setzt man für f :E→Y k f k∞ := sup | f (x)| (∈ [0, +∞]), x∈E und spricht von der Supremumsnorm. Unmittelbar überprüft man, dass für f, g : E → Y k f k∞ < +∞ ⇔ f ∈ B(E, R) bzw. f ∈ B(E, C) 6.7. REELL- UND KOMPLEXWERTIGE FOLGEN UND REIHEN 153 k f k∞ ≥ 0 und k f k∞ = 0 ⇔ f = 0. Für f, g ∈ B(E, R) bzw. f, g ∈ B(E, C) gilt zudem d∞ ( f, g) = k f − gk∞ und k f k∞ = d∞ ( f, 0), wobei 0 hier die konstante Nullfunktion ist. kλ · f k∞ = |λ| · k f k∞ für λ ∈ R bzw. λ ∈ C, k f + gk∞ ≤ k f k∞ + kgk∞ , k f · gk∞ ≤ k f k∞ · kgk∞ . 6.7.2 Korollar. Sind ( fn )n∈N , (gn )n∈N Folgen von Funktionen aus B(E, R) bzw. B(E, C), die gleichmäßig gegen f bzw. g konvergieren, so gilt lim fn + gn = f + g, lim fn · gn = f · g, n→∞ n→∞ und zwar gleichmäßig. Insbesondere gilt limn→∞ λ · fn = λ · f für alle λ ∈ R bzw. λ ∈ C. Beweis. Wir beweisen exemplarisch nur die zweite Aussage. Es gilt d∞ ( fn gn , f g) = k fn gn − f gk∞ ≤ kgn k∞ · k fn − f k∞ + k f k∞ · kgn − gk∞ . Als konvergente Folge ist (gn )n∈N beschränkt, d.h. kgn k∞ = d∞ (gn , 0) ≤ C, n ∈ N. Somit konvergiert d∞ ( fn gn , f g) gegen Null. ❑ 6.7.3 Definition. Für n ∈ N sei fn : E → R (C). P Man sagt, die Reihe ∞ n=1 fn konvergiert punktweise, wenn für jedes x ∈ E die P∞ Reihe n=1 fn (x) in R (C) konvergiert. P∞ Ist fn ∈ B(E, R) (∈ B(E, C)), n ∈ N, so heißt n=1 fn gleichmäßig konvergent, PN wenn die Folge n=1 fn (.) N∈N von Partialsummen gleichmäßig konvergiert. P Die Reihe ∞ n=1 fn konvergiert absolut als Funktionenreihe, wenn die Reihe P∞ n=1 k fn k∞ konvergiert. P Klarerweise impliziert die absolute Konvergenz von ∞ n=1 fn als Funktionenreihe P∞ die absolute Konvergenz von n=1 fn (x) für jedes x ∈ E. Wir haben aber auch folgendes Ergebnis. 6.7.4 Korollar (Weierstraß Kriterium). Sei ( fn )n∈N eine Folge von beschränkten reellP bzw. komplexwertigen Funktionen auf einer Menge E , ∅. Ist ∞ n=1 fn absolut konvergent als Funktionenreihe, so ist diese Funktionenreihe auch gleichmäßig konvergent. P∞ und somit auch gleichmäßig konvergent, n=1 fn ist sicher dann absolut konvergent,P wenn es Mn ∈ R, Mn ≥ 0, n ∈ N gibt, für die ∞ n=1 Mn konvergiert, und sodass k fn k∞ ≤ Mn , n ∈ N. KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 154 Beweis. Nach dem Majorantenkriterium in Lemma 3.8.8 folgt aus der Konvergenz von P∞ P∞ n=1 Mn die von n=1 k fn k∞ . P N Ist nun letztere Reihe konvergent, so ist die Folge n=1 k fn k∞ von PartialsumN∈N men eine Cauchy-Folge in R. Es gibt somit zu ǫ > 0 ein N ∈ N, sodass für k, m ≥ N P gilt m n=k+1 k fn k∞ ≤ ǫ. Für solche m, k folgt auch m m X X fn ≤ k fn k∞ ≤ ǫ, . n=k+1 n=k+1 P N ∞ Also ist n=1 fn eine Cauchy-Folge in B(E, R) (∈ B(E, C)), und nach Satz 6.6.15 N∈N P konvergent. Somit ist ∞ n=1 fn gleichmäßig konvergent. ❑ Die meisten Konvergenzkriterien für Reihen kann man so anpassen, dass sie auch für Reihen von Funktionen anwendbar sind. Wir wollen das hier aber nicht weiter ausführen. Ein bedeutendes Beispiel für Reihen von Funktionen sind die sogenannten Potenzreihen. 6.7.5 Definition. Sind an ∈ C oder auch nur an ∈ R für n ∈ N ∪ {0}, und ist z ∈ C, so nennt man die komplexwertige Reihe ∞ X an zn n=0 eine Potenzreihen7 . Als Konvergenzradius wollen wir die Zahl R ∈ [0, +∞] mit ∞ X n R = sup |z| : z ∈ C, a z ist konvergent n (6.7) n=0 bezeichnen8. 6.7.6 Beispiel. Wir sind solchen Reihen schon begegnet, z.B. sind die geometrische P P∞ zn n Reihe ∞ n=0 z und die Exponentialreihe n=0 n! Potenzreihen. Erstere konvergiert genau für |z| < 1 und hat somit Konvergenzradius 1. Die Exponentialreihe konvergiert für alle z ∈ C und hat somit Konvergenzradius +∞. P∞ an zn eine Potenzreihe und R ihr Konvergenzradius. P n (i) Für jedes z ∈ C mit |z| > R ist ∞ n=0 an z divergent. P n (ii) Für jedes z ∈ C mit |z| < R ist ∞ n=0 an z sogar absolut konvergent. Insbesondere ist ∞ X n . (6.8) |z| : z ∈ C, a z ist absolut konvergent R = sup n 6.7.7 Satz. Sei n=0 n=0 7 Dabei 8 Da ist es zunächst unerheblich, ob sie jetzt konvergiert oder nicht. für z = 0 die Reihe immer absolut konvergiert, ist diese Menge nicht leer. 6.7. REELL- UND KOMPLEXWERTIGE FOLGEN UND REIHEN 155 P n (iii) Für jedes r ∈ [0, R) ist ∞ n=0 an z auf dem abgeschlossenen Kreis Kr (0) = {z ∈ C : |z| ≤ r} absolut konvergent als Funktionenreihe. Die Funktion z 7→ ∞ X n=0 an zn , z ∈ Kr (0), ist dabei eine stetige und beschränkte Funktion auf Kr (0). Im C r Re −R R Abbildung 6.7: Konvergenzradius (iv) Auf UR (0) = {z ∈ C : |z| < R} ist z 7→ P∞ n=0 an zn eine stetige Funktion9. (v) Der Konvergenzradius lässt sich durch die Koeffizienten an unmittelbar bestimmen durch10 1 . R= √ lim supn→∞ n |an | Gilt dabei an , 0 für alle hinreichend großen n, so gilt auch 1 | lim supn→∞ | aan+1 n ≤R≤ 1 | lim inf n→∞ | aan+1 n . (6.9) Beweis. (i) Folgt sofort aus (6.7). (ii) Folgt aus dem nächsten Punkt. P n (iii) Nach (6.7) gibt es ein komplexes z0 mit r < |z0 | ≤ R, sodass ∞ n=0 an z0 konvergiert. Somit ist die Summandenfolge eine Nullfolge; insbesondere |an zn0 | ≤ C, n ∈ N für ein C > 0. Für |z| ≤ r < |z0 | rechnet man n n z r |an zn | = |an zn0 | · ≤ C · . z0 z0 9 Im 10 Ist Allgemeinen √ ist sie aber nicht mehr beschränkt die Folge ( n |an |)n∈N nicht nach oben beschränkt, so sei 1 √ lim supn→∞ n |an | = 0. 156 KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN n P r Wegen zr0 < 1 konvergiert ∞ n=0 C z0 . PN Die Partialsummen n=0 an zn , N ∈ N, sind Polynome und damit stetig. Da Kr (0) kompakt ist (vgl. Beispiel 5.2.7), sind diese Partialsummen auf Kr (0) beschränkt. Aus dem Weierstraßschen Kriterium (Korollar 6.7.4) angewandt auf E = Kr (0) folgt die absolute Konvergenz als Funktionenreihe und somit die gleichmäßige Konvergenz der entsprechenden Funktionenfolge von Partialsummen auf Kr (0) gegen eine beschränkte Funktion. Nach Korollar 6.6.13 ist die Grenzfunktion sogar stetig auf E = Kr (0). P n (iv) Betrachtet man z 7→ ∞ n=0 an z auf U R (0), so ist auch dies eine stetige Funktion. In der Tat ist die Stetigkeit eine lokale Eigenschaft (siehe Fakta 6.1.3), und man kann zu jedem komplexen z mit |z| < R ein δ > 0 und ein r ∈ [0, R) finden, sodass Uδ (z) ⊆ Kr (0). √ (v) Für jedes z ∈ C mit |z| < lim sup 1 √n |a | gilt lim supn→∞ n |an zn | = |z| · n n→∞ √ P n lim supn→∞ n |an | < 1. Nach dem Wurzelkriterium, Satz 3.9.1, ist ∞ n=0 an z konvergent. Gemäß (6.7) folgt pn lim sup |an | ≤ R. n→∞ Wäre lim sup 1 √n |a | < R, so wähle z ∈ C mit lim sup 1 √n |a | < |z| < R. Wegen n n n→∞ n→∞ (ii) konvergiert die Potenzreihe. Andererseits sieht man ähnlich wie oben, dass √ lim supn→∞ n |an zn | > 1, und mit dem Wurzelkriterium, Satz 3.9.1, folgt die Divergenz der Potenzreihe. Also muss auch 1 lim supn→∞ √n |an | ≥ R. Analog beweist man (6.9) mit Hilfe des Quotientenkriteriums. ❑ 6.7.8 Beispiel. Das Konvergenzverhalten einer Potenzreihe ist durch den obigen Satz relativ gut abgeklärt. Einzig über die Punkte mit |z| = R, wo R der Konvergenzradius ist, hat man keine Aussage. Es können hier tatsächlich auch alle Fälle eintreten. Betrachte dazu die Potenzreihen ∞ ∞ n ∞ X X X z zn . zn , und n n2 n=0 n=0 n=0 P P∞ zn n Alle haben Konvergenzradius 1. Jedoch ist ∞ n=0 z für |z| = 1 divergent, n=0 n2 absolut P zn konvergent, und ∞ n=0 n (nicht absolut) konvergent außer bei z = 1, wo sie divergiert. 6.7.9 Korollar. Sei f (z) := R > 0. P∞ n=0 an zn eine Potenzreihe und ihr Konvergenzradius sei Verschwinden nicht alle an , so gibt es ein δ ∈ (0, R), sodass f (z) , 0 für z ∈ Uδ (0) \ {0}. 6.7. REELL- UND KOMPLEXWERTIGE FOLGEN UND REIHEN 157 P n Sei ∞ n=0 bn z eine weitere Potenzreihen mit Konvergenzradien R̃ > 0. Gibt es eine Menge E ⊆ Umin(R,R̃) (0), die Null als Häufungspunkt hat, und sodass P∞ P∞ n n n=0 an z = n=0 bn z für alle z ∈ E, so folgt an = bn , n ∈ N ∪ {0} und damit R = R̃. Beweis. Sei n0 ∈ N ∪ {0} der erste Index, sodass an0 , 0. Wegen den Rechenregeln P P∞ n n für Reihen konvergiert ∞ n=0 an z genau dann, wenn g(z) = n=0 an+n0 z es tut, wobei n0 im Fall der Konvergenz z g(z) = f (z). Letztere ist also auch eine Potenzreihe mit Konvergenzradius R. Wegen g(0) = an0 , 0 und wegen der Stetigkeit von g auf UR (0) gibt es ein δ ∈ (0, R), sodass |g(z) − g(0)| < |an0 | und somit g(z) , 0 für z ∈ Uδ (0). Also ist auch f (z) , 0 für z ∈ Uδ (0) \ {0}. Um die zweite Aussage zu zeigen betrachte man die Potenzreihe P n h(z) = ∞ n=0 (an − bn )z , die zumindest für |z| < min(R, R̃) konvergiert, und damit einen Konvergenzradius ≥ min(R, R̃) hat. Nach Voraussetzung und den Rechenregeln für Reihen folgt h(z) = 0, z ∈ E. Da 0 ein Häufungspunkt von E ist, widerspricht das aber der ersten Aussage, außer an − bn = 0, n ∈ N. ❑ 6.7.10 Bemerkung. Ist |z| < R, so folgt aus Korollar 3.8.3 ∞ X an (z̄)n = n=0 ∞ X ān zn . (6.10) n=0 P n Insbesondere folgt aus an ∈ R, n ∈ N, und z = x ∈ R, dass auch ∞ n=0 an x ∈ R. P∞ n Ist umgekehrt n=0 an x ∈ R für alle x ∈ R, |x| < R, so folgt aus (6.10), dass die Potenzreihen (beide mit Konvergenzradius R) ∞ X an zn , n=0 ∞ X ān zn n=0 für z ∈ R ∩ UR (0) übereinstimmen. Aus Korollar 6.7.9 folgt an = ān , also an ∈ R. 6.7.11 Bemerkung. Üblicherweise werden auch Reihen der Form ∞ X n=0 an (z − z0 )n (6.11) für ein festes z0 als Potenzreihen bezeichnet. Die hergeleiteten Aussagen für Potenzreihen stimmen sinngemäß offensichtlich auch für solche Reihen. Dabei ist z.B. der Bereich der Konvergenz UR (z0 ) mit entsprechend definierten Konvergenzradius. Funktionen f : D → C mit offenem D ⊆ C heißen analytisch in einem Punkt z0 ∈ D, falls es eine offene Kugel Ur (z0 ) ⊆ D mit r > 0 und eine Potenzreihe der Form (6.11) gibt, sodass r kleiner oder gleich dem Konvergenzradius der Reihe ist und sodass f (z) für alle z ∈ Ur (z0 ) mit dem Grenzwert der Reihe (6.11) übereinstimmt, f also lokal um z0 als Grenzwert einer Potenzreihe dargestellt werden kann. Ist f um jedes z0 ∈ D analytisch, so heißt f analytisch. KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 158 6.8 Die Exponentialfunktion Wir wollen jetzt einige der sogenannten elementaren Funktionen betrachten. Grundlage für alle diese ist die Exponentialfunktion exp(z) = ∞ X zn , z ∈ C. n! n=0 (6.12) Wir haben schon gesehen, dass diese Reihe für alle z ∈ C konvergiert. Sie ist also eine Potenzreihe mit Konvergenzradius +∞. Insbesondere ist exp : C → C stetig. Weitere wichtige elementare Funktionen sind sin und cos. 6.8.1 Definition. Für z ∈ C seien cos z = exp(iz) + exp(−iz) exp(iz) − exp(−iz) , sin z = , 2 2i die sogenannten trigonometrischen Funktionen Cosinus und Sinus. Als Zusammensetzung von stetigen Funktionen sind cos : C → C und sin : C → C auf C stetig (siehe Lemma 6.1.6 und Korollar 6.1.8). 6.8.2 Lemma. Für alle z ∈ C gilt cos z = ∞ X k=0 (−1)k X z2k+1 z2k , sin z = . (−1)k (2k)! (2k + 1)! k=0 ∞ Also sind cos und sin Grenzfunktionen von Potenzreihe11 mit Konvergenzradius +∞. Beweis. Für gerade n = 2k gilt in + (−i)n = 2i2k = 2(−1)k , und für ungerade n = 2k + 1 gilt in + (−i)n = 0. Aus den Rechenregeln für Reihen folgt somit exp(iz) + exp(−iz) X in + (−i)n zn X z2k = = . (−1)k 2 2 n! k=0 (2k)! n=0 ∞ ∞ Analog leitet man die Potenzreihenentwicklung für sin her. ❑ 6.8.3 Satz. Sei z, w ∈ C und x, y ∈ R. Dann gilt (i) exp(z) , 0, exp(z + w) = exp(z) exp(w) und exp(−z) = (exp z)n = exp(zn), n ∈ Z. 1 exp(z) . Schließlich ist (ii) exp(iz) = cos z + i sin z. Allgemeiner gilt die Formel von de Moivre: (cos z + i sin z)n = cos(nz) + i sin(nz), n ∈ Z. (iii) exp(z̄) = exp(z), cos(z̄) = cos(z), sin(z̄) = sin(z). Insbesondere sind exp |R , cos |R , sin |R Funktionen, die R nach R abbilden. (iv) cos y = Re exp(iy), sin y = Im exp(iy) und exp(x + iy) = exp(x)(cos y + i sin y), wobei exp(x) ∈ R. 11 Ganz genau genommen ist eine Reihe der Bauart P∞ c z2k keine Potenzreihe, da sie nicht von der k=0 k P n Form ∞ man aber a2k = ck für k ∈ N ∪ {0} und an = 0 für ungerade n, so überzeugt man n=0 an z ist. Setzt P P 2k n sich leicht davon, dass ∞ genau dann konvergiert, wenn ∞ n=0 an z esPtut, wobei die Grenzwerte k=0 ck z 2k+1 dieser Reihen dann übereinstimmen. Entsprechendes gilt für Reihen der Bauart ∞ k=0 ck z 6.8. DIE EXPONENTIALFUNKTION 159 Im exp(x + iy) = exp(x)(cos y + i sin y) i exp(x) sin y ( x) exp i exp(iy) = cos y + i sin y i sin y 0 −1 cos y 1 exp(x) cos y Re −i Abbildung 6.8: Darstellung der Lage von exp(x + iy) (v) Die Funktion exp eingeschränkt auf die reelle Achse ist eine streng monoton wachsende bijektive Funktion von R auf R+ mit exp(0) = 1. Insbesondere gilt lim exp(x) = +∞, lim exp(x) = 0. x→+∞ x→−∞ (6.13) (vi) | exp(z)| = exp(Re z). Insbesondere gilt | exp(z)| = 1 ⇔ Re z = 0 und (cos y)2 + (sin y)2 = 1. (vii) cos(−z) = cos z und sin(−z) = − sin z. (viii) Es gelten die Summensätze für Sinus und Cosinus cos(z + w) = cos z cos w − sin z sin w, sin(z + w) = sin z cos w + cos z sin w . Beweis. (i) exp(z + w) = exp(z) exp(w) haben wir in Beispiel 5.4.13 gesehen. Die beiden nächsten Aussagen folgen aus exp(−z) · exp(z) = exp(0) = 1. Schließlich folgt (exp z)n = exp(zn), n ∈ N, durch vollständige Induktion, und für n ∈ Z wegen 1 . exp(−zn) = exp(zn) (ii) exp(iz) = cos z + i sin z folgt leicht durch Nachrechnen, und daraus (cos z + i sin z)n = (exp iz)n = exp(inz) = cos(nz) + i sin(nz). (iii) Da die Koeffizienten in den Potenzreihenentwicklungen reell sind, folgt die Aussage sofort aus Bemerkung 6.7.10. (iv) Folgt aus (i) und (ii), da nach dem letzten Punkt exp(x), cos y, sin y ∈ R. (v) Für x > 0 folgt aus der Tatsache, dass alle Koeffizienten in der Potenzreihe (6.12) von exp strikt positiv sind, immer exp(x) > 1 + x > 1. Klarerweise ist exp(0) = 1. 1 Für x < 0 folgt aus (i), dass exp(x) = exp(−x) > 1 − x > 1 und somit exp(x) ∈ 1 (0, 1), exp(x) < 1−x . KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 160 Aus diesen Abschätzungen schließen wir sofort auf (6.13). Aus x < y ergibt sich wegen exp(y) = exp(x + (y − x)) = exp(x) · exp(y − x) > exp(x) die Tatsache, dass exp(x) streng monoton wachsende ist. Nun ist exp(x) : R → R+ stetig. Somit muss wegen Korollar 6.5.3 exp(R) ein offenes Intervall sein, das wegen (6.13) aber nur (0, +∞) = R+ sein kann. (vi) Aus | exp(z)|2 = exp(z) exp(z) = exp(z) exp(z) = exp(z + z) = exp(2 Re z) = exp(Re z)2 und aus der Tatsache, dass | exp(z)| und exp(Re z) positive reelle Zahlen sind, folgt | exp(z)| = exp(Re z). Weiters gilt (cos y)2 + (sin y)2 = | cos y + i sin y|2 = | exp(iy)|2 = exp(0) = 1. (vii) Folgt aus der jeweiligen Potenzreihenentwicklung, da nur gerade bzw. nur ungerade Potenzen vorkommen. (viii) Man setze die Definition von sin und cos ein und rechne die Gleichheit nach. ❑ y 4 3 y = exp(x) 2 1 −3 −2 −1 0 1 2 3 x −1 Abbildung 6.9: Funktionsgraphen der reellen Exponentialfunktion Wie wir unter anderem gerade gesehen haben, ist exp : R → R+ eine Bijektion. 6.8.4 Definition. Mit ln : R+ → R wollen wir die Inverse von exp : R → R+ bezeichnen und sprechen vom natürlichen Logarithmus bzw. vom Logarithmus naturalis. Aus Satz 6.8.3, Korollar 6.5.3 und durch elementares Nachrechnen folgt sofort 6.8.5 Korollar. Die Funktion ln : R+ → R ist eine stetige und streng monoton wachsende Bijektion. Es gilt lim ln x = −∞, lim ln x = +∞ , x→0+ x→+∞ sowie ln(xy) = ln x + ln y, x, y > 0, ln(xn ) = n ln x, x > 0, n ∈ Z . 6.8. DIE EXPONENTIALFUNKTION 161 y y = ln(x) 3 2 1 −1 0 1 2 3 4 5 6 x −1 −2 −3 Abbildung 6.10: Logarithmus naturalis Beachte, dass wir den Logarithmus nur für reelle Werte definiert haben. Dies ist kein Zufall, will man den Logarithmus auch für komplexe Werte definieren, trifft man auf Schwierigkeiten ganz essentieller Natur (vgl. Vorlesung zur Komplexen Analysis). Wir können nun mit Hilfe der Exponentialfunktion die bisher nur für rationale b definierte Ausdrücke ab auch für beliebige b ∈ R definieren. 6.8.6 Korollar. Für a ∈ R+ und b ∈ Q gilt ab = exp(b ln a). Setzen wir ab durch exp(b ln a) auf ganz (a, b) ∈ R+ × R fort, so gilt (a, a1, a2 ∈ R+ , b, b1 , b2 ∈ R) ab1 +b2 = ab1 · ab2 , (a1 a2 )b = ab1 · ab2 . Beweis. Ist b = qp ∈ Q mit p ∈ Z, q ∈ N, so ist exp(b ln a) nach Satz 6.8.3 eine positive reelle Zahl mit der Eigenschaft, dass (exp(b ln a))q = exp(bq ln a) = exp(p ln a) = exp(ln a p ) = a p . . √q Also ist exp(b ln a) = a p . Die Funktionalgleichungen folgen aus denen von exp und ln. ❑ 6.8.7 Bemerkung. Als Zusammensetzung der stetigen Funktionen exp, ln und ·, ist (a, b) 7→ ab auf (a, b) ∈ R+ × R stetig (vgl. Beispiel 6.1.7). Die Funktion exp kann nun selbst mit dieser Notation als allgemeine Potenz angeschrieben werden. Sei dazu e := exp(1), die Eulersche Zahl. Dann gilt nach der Definition der allgemeinen Potenz e x = exp(x ln e) = exp x ln exp(1) = exp(x) . | {z } =1 KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 162 6.8.8 Bemerkung. Wir haben schon festgestellt, dass die Eulersche Exponentialfunktion eine ganz zentrale Rolle spielt. Daher wird auch die reelle Zahl e ein interessantes Objekt sein. Dazu wollen wir hier bemerken, dass man die Eulersche Zahl e, neben P 1 ihrer Definition als e := exp(1) = ∞ n=0 n! auch in vielfacher Weise anders charakterisieren kann. Zum Beispiel kann man zeigen, dass e = lim 1 + n→∞ 1 n z n bzw. ez = lim 1 + , n→∞ n n gilt. Diese Formel gibt auch Anlass zu alternativen Definitionen der Funktion exp(x), nämlich als e x . Dafür muss man allerdings die allgemeine Potenz zuerst –ohne Verwendung von exp – definieren. Dies kann man so machen, dass man von der Funktion √q a p : R+ × Q → R+ ausgeht, und diese mittels stetiger Fortsetzung zu einer Funktion R+ × R → R+ macht. Wie aus der Schule bekannt, ist einer der wichtigsten Naturkonstanten die Zahl π. Mit Hilfe der Funktion cos kann man nun die Existenz dieser Zahl mit all ihren wichtigen Eigenschaften herleiten. 6.8.9 Lemma. Für t ∈ [0, 2] und n ∈ N gilt tn n! ≥ tn+2 (n+2)! . Die Funktion cos : R → R hat eine kleinste positive Nullstelle x0 , die im Intervall (0, 2) liegt. Für x0 gilt sin x0 = 1. Beweis. Durch Umformen ist die zu beweisende Ungleichung äquivalent zu (n + 2)(n + 1) ≥ t2 , und somit richtig. Wir betrachten die Potenzreihenentwicklung von cos in Lemma 6.8.2 und stellen sofort cos 0 = 1 fest. Da man in Reihen Klammern setzen darf, folgt aus dem letzten Punkt ! ∞ 22 24 24l+4 1 22 24 X 24l+2 ≤1− + − − + =− . cos 2 = 1 − 2 4! l=1 (4l + 2)! (4l + 4)! 2 4! 3 Nach dem Zwischenwertsatz Korollar 6.2.6 hat t 7→ cos t im Intervall (0, 2) sicher eine Nullstelle x. Nach Proposition 6.1.12 ist die Menge N = {t ∈ R : cos t = 0} = cos |−1 R ({0}) und daher auch N ∩ [0, +∞) abgeschlossen. In Beispiel 5.1.14 haben wir gesehen, dass N ∩ [0, +∞) ein Minimum hat, welches wegen cos 0 = 1 sicher nicht 0 ist. Also gibt es eine kleinste positive Nullstelle x0 von t 7→ cos t. Aus Satz 6.8.3 folgt wissen wir (cos x0 )2 + (sin x0 )2 = 1, und daher (sin x0 )2 = 1. Nun ist aber wegen dem ersten Punkt ∞ X x4l+3 x4l+1 0 ≥ 0, 0 − sin x0 = (4l + 1)! (4l + 3)! l=0 und somit sin x0 = 1. 6.8. DIE EXPONENTIALFUNKTION 163 ❑ 6.8.10 Definition. Die Zahl π sei jene positive reelle Zahl, sodass tive Nullstelle von cos : R → R ist. π 2 die kleinste posi- y y = sin(x) y = cos(x) 1 −2π − 3π 2 −π − π2 0 π 2 π −1 3π 2 2π x Abbildung 6.11: Funktionsgraphen des reellen Sinus und Cosinus 6.8.11 Satz. (i) exp(±i 2π ) = ±i, exp(±iπ) = −1, exp(±2iπ) = 1. (ii) cos(± 2π ) = 0, cos(±π) = −1, cos(±2π) = 1, sin(± π2 ) = ±1, sin(±π) = 0, sin(±2π) = 0. (iii) exp(z + 2kπi) = exp(z), sin(z + 2kπ) = sin(z), cos(z + 2kπ) = cos(z), z ∈ C, k ∈ Z. . (iv) exp(z) = 1 ⇐⇒ ∃k ∈ Z : z = 2kπi (⇔ z ∈ 2πiZ). (v) cos z = 0 ⇔ ∃k ∈ Z : z = π 2 + πk, und sin z = 0 ⇔ ∃k ∈ Z : z = πk. (vi) Es gilt exp(C) = C \ {0}, wobei exp(z) = exp(ζ) ⇔ z − ζ ∈ 2πiZ. Beweis. (i) Wegen Satz 6.8.3 und Lemma 6.8.9 gilt exp(i π2 ) = cos π2 + i sin π2 = i. Der Rest folgt aus Satz 6.8.3, (i). (ii) Folgt aus (i), indem man Real- und Imaginärteil betrachtet. (iii) exp(z + 2kπi) = exp(z) · exp(2πi)k = exp(z). Daraus folgen durch Einsetzen von Definition 6.8.1 die restlichen Aussagen. (iv) Sei exp(z) = 1 gegeben. Aus Satz 6.8.3 wissen wir, dass damit Re z = 0 und damit z = 0 + iy für ein y ∈ R. Klarerweise ist y = η + 2lπ für ein eindeutiges l ∈ Z und η ∈ [0, 2π)12. Aus (iii) folgt exp(iη) = exp(iy) = 1. Angenommen η , 0. Schreibe η η η exp(i ) = cos + i sin =: u + iv mit u, v ∈ R . 4 4 4 12 Für l nehme man das Maximum von {k ∈ Z : 2kπ ≤ y}. KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 164 Dabei ist wegen 0 < 4η < π2 , und der Definition von π2 , sicherlich u , 0. Im Fall v = 0 wäre exp(i η4 ) = u = ±1 und somit exp(i π2 ) i π η = exp(i( − )) = = ±i . 2 4 exp(i 4η ) ±1 Also ist α = π2 − η4 eine Nullstelle reelle von cos mit α ∈ (0, π2 ) im Widerspruch zur Definition von π2 . Also muss v , 0. Klarerweise gilt auch 1 = exp(iη) = (u + iv)4 = u4 − 6u2 v2 + v4 + i 4uv(u2 − v2 ) . Die rechte Zahl ist genau dann reell, wenn u2 − v2 = 0. Wegen u2 + v2 = 1 ist das äquivalent zu u2 = v2 = 12 . Dann ist aber u4 − 6u2 v2 + v4 = −1 , 1. (v) Es ist cos z = 0 genau dann, wenn exp(iz) = − exp(−iz) = exp(iπ − iz), also wenn exp(2iz − iπ) = 1. Dieses tritt genau dann ein, wenn 2iz−iπ 2πi ∈ Z, d.h. wenn z ∈ π2 + πZ. Analog bestimmt man die Nullstellen des Sinus. (vi) Sei w ∈ C, w , 0, gegeben. Da exp(x) eine Bijektion von R auf R+ ist, gibt es ein w x ∈ R mit exp(x) = |w|. Schreibe exp x = u + iv mit u, v ∈ R. Klarerweise ist u2 + v2 = 1. Insbesondere gilt u ∈ [−1, 1]. Wegen cos 0 = 1 und cos π = −1 gibt es nach dem Zwischenwertsatz (Korollar 6.2.6) gibt es eine t ∈ [0, π] mit u = cos t. Aus u2 + v2 = 1 = (cos t)2 + (sin t)2 folgt v2 = (sin t)2 . Ist v = sin t, so setze y = t. Sonst muss v = − sin t, und dann setze man y = −t. In jedem Falle ist cos y = u und sin y = v und somit w = exp(x)(cos y + i sin y) = exp(x + iy). Ist exp(z) = exp(ζ), so folgt 1 = exp(z − ζ), also z − ζ ∈ 2πiZ. ❑ Jede komplexe Zahl w , 0 lässt sich gemäß Satz 6.8.11 als exp(z) schreiben. Wählt man z so, dass 0 ≤ Im z < 2π, so ist nach Satz 6.8.11, (v), z eindeutig bestimmt. Also ist exp : R × [0, 2π) → C \ {0} bijektiv. 6.8.12 Definition. Ist zu einem gegebenen w ∈ C \ {0} das komplexe z ∈ R × [0, 2π) ⊆ (C) die eindeutige Lösung von exp(z) = w, und setzt man r = exp(Re z) und t = Im z, so erhält man w = exp(Re z) exp(i Im z) = r(cos t + i sin t) . Somit ist (r, t) 7→ r(cos t + i sin t) eine Bijektion T : R+ × [0, 2π) → C \ {0}. Das Paar (r, t) nennt man dabei die Polarkoordinaten von w. Betrachtet man (r, t) 7→ r(cos t + i sin t) als Abbildung von [0, +∞) × [0, 2π), so erreicht man alle komplexen w – auch w = 0 – zu dem Preis, dass diese Abbildung dann nicht mehr injektiv ist. 6.8.13 Bemerkung. 6.8. DIE EXPONENTIALFUNKTION 165 Im w Im z exp(1 + 12 πi) = ie −1 +2πi 2πi 1 +2πi −1 +23 πi 3 2 πi 1 +23 πi exp(z) = w exp( 21 πi) = i √1 (1 2 exp(1 + πi) = −e e = exp(1) 0 −1 +πi πi 1 +πi −1 +21 πi 1 2 πi 1 +21 πi + i) = exp( 41 πi) exp(πi) = −1 1 = exp(0) = exp(2πi) Re w exp( 32 πi) = −i 1 4 πi −1 0 1 exp(1 + 32 πi) = −ie Re z Abbildung 6.12: Exponentialfunktion als Abbildung von C auf C \ {0} Wegen Satz 6.8.11, (iii), kann dabei auch das Intervall [0, 2π) durch irgendein halboffenes Intervall der Länge 2π, z.B. (−π, π], ersetzen. Offensichtlich ist T : R+ × [0, 2π) → C \ {0} als Zusammensetzung von stetigen Funktionen selbst stetig. Die Umkehrung ist nicht stetig: Es gilt limn→∞ exp(−i 1n ) = 1, aber 1 1 lim T −1 (exp(−i )) = lim (1, 2π − ) = (1, 2π) , (1, 0) = T −1 (1). n→∞ n→∞ n n Nimmt man statt [0, 2π) z.B. das Intervall [a, a + 2π), so treten entsprechende Probleme beim Winkel a auf. Nimmt man den kritischen Winkel aus, so sind die Polarkoordinaten in beide Richtungen stetig. 6.8.14 Proposition. Die Abbildung T : R+ × (a, a + 2π) → C \ {r exp(ia) : r ∈ [0, +∞)} ist bijektiv, und T und T −1 sind stetig. Beweis. Es bleibt die Stetigkeit von T −1 : D := C \ {r exp(ia) : r ∈ [0, +∞)} → R+ × (a, a + 2π) zu zeigen. Dazu sei limn→∞ zn = z ∈ D für eine Folge aus D. Somit können wir zn = rn exp(iαn ), n ∈ N, z = r exp(iα), mit rn , r ∈ (0, +∞) und αn , α ∈ (a, a + 2π) schreiben. Wegen rn = |zn |, r = |z| folgt rn → r. Ist (αn(k) )k∈N eine Teilfolge, so hat diese wegen der Kompaktheit von [a, a + 2π] eine gegen ein β ∈ [a, a + 2π] konvergente Teilfolge (αn(k(l)) )l∈N . Somit wäre wegen der Stetigkeit von T exp(iβ) = lim exp(iαn(k(l)) ) = lim l→∞ l→∞ zn(k(l)) z = = exp(iα), rn(k(l)) r und nach Satz 6.8.11 β − α ∈ 2πZ. Also folgt α = β und nach Lemma 5.2.11 gilt αn → α. ❑ 6.8.15 Bemerkung. Wir sehen nun auch, dass es für n ∈ N immer n viele n-te Wurzeln einer jeder Zahl w ∈ C \ {0} in C gibt: Schreiben wir w in Polarkoordinaten w = r(cos t + i sin t), (r, t) ∈ R+ × [0, 2π), so gilt für ein ζ ∈ C exp(ζ)n = w ⇔ exp(nζ) = r(cos t + i sin t) = exp(ln(r) + it) . KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 166 Wegen Satz 6.8.11 ist das genau dann der Fall, wenn nζ = ln(r) + i(t + 2 jπ) für ein j ∈ Z. Da die Lösungen der Gleichung zn = w nur in C \ {0} = exp(C) zu suchen sind, erhalten wir mit ! ! √n t + 2 jπ ln(r) + i(t + 2 jπ) t + 2 jπ = r · cos ∈ C, j ∈ Z , + i sin η j = exp n n n genau alle Lösungen dieser Gleichung. Wieder wegen Satz 6.8.11 sind aber nur η0 , . . . , ηn−1 paarweise verschieden, und für j < {0, . . . , n − 1} stimmt η j mit einem der η0 , . . . , ηn−1 überein. 6.9 Fundamentalsatz der Algebra Als Anwendung der bisher entwickelten Stetigkeitstheorie wollen wir den Fundamentalsatz der Algebra beweisen. Zunächst benötigen wir ein Lemma. 6.9.1 Lemma. Ist p(z) ∈ C[z] vom Grad n, dh. p(z) = an zn + . . . + a0 , an , 0 ein komplexes Polynom, so hat |p(z)| ein Minimum, d.h. es gibt eine Zahl c ∈ C mit |p(c)| ≤ |p(z)| für alle z ∈ C. Beweis. Wir haben in Beispiel 5.5.11 gesehen, dass limz→∞ |an zn + . . . + a0 | = +∞. Insbesondere gibt es eine Zahl R > 0, sodass |p(z)| ≥ |a0 | = |p(0)|, z ∈ C mit |z| > R. Die Kreisscheibe K := {z ∈ C : |z| ≤ R} ist kompakt, und |p(z)| ist, als Zusammensetzung der stetigen Funktionen p und |.|, stetig auf K. Daher wird ein Minimum angenommen, minz∈K |p(z)| = |p(c)| ≤ |p(0)|. Unsere Wahl von R sichert, dass |p(c)| = minz∈C |p(z)|. ❑ 6.9.2 Satz (Fundamentalsatz der Algebra). Sei p(z) = a0 + · · · + an zn ein komplexes Polynom vom Grad n. Dann existieren n nicht notwendigerweise verschiedene Zahlen z1 , . . . , zn ∈ C, sodass n Y (z − zk ). (6.14) p(z) = an k=1 Beweis. Sei h(z) ein Polynom der Form h(z) = 1 + bzk + zk g(z) mit k ∈ N, b ∈ C \ {0} und einem Polynom g, wobei g(0) = 0. Wir zeigen die Existenz eines u ∈ C mit |h(u)| < 1. Dazu wählen wir eine k-te Wurzel von − b1 (vgl. Bemerkung 6.8.15), d.h. eine Zahl d ∈ C mit bdk = −1. Für t ∈ (0, 1] gilt |h(td)| ≤ |1 − tk | + |tk dk g(td)| = 1 − tk + tk |dk g(td)| = 1 − tk (1 − |d k g(td)|) . Wegen |dk g(td)| = 0 für t = 0 folgt aus der Stetigkeit dieses Ausdruckes bei 0, dass |dk g(td)| ≤ 12 für t ∈ (0, δ) mit einem δ > 0. Für jedes solche t gilt |h(td)| ≤ 1 − tk 12 < 1. Nun zeigen wir, dass jedes nichtkonstante Polynom f (z) eine Nullstelle in C hat. Nach Lemma 6.9.1 gibt es ein c ∈ C, sodass | f (c)| = minz∈C | f (z)|. Wäre f (c) , 0, so betrachte f (z + c) = 1 + bk zk + bk+1 zk+1 + . . . + bn zn , bk , 0. h(z) := f (c) 6.9. FUNDAMENTALSATZ DER ALGEBRA 167 Nach dem ersten Beweisschritt existiert ein u ∈ C mit |h(u)| < 1 und daher | f (u + c)| = |h(u)| · | f (c)| < | f (c)| im Widerspruch zu | f (c)| = minz∈C | f (z)|. Wir zeigen nun (6.14) durch Induktion nach dem Grad von p(z). Ist der Grad eins, also p(z) = a1 z + a0 mit a1 , 0, so ist p(z) = a1 (z − (− aa10 )). Stimme nun (6.14) für alle Polynome vom Grad kleiner als n, sei p(z) vom Grad n. Nach dem vorigen Beweisschritt hat p eine Nullstelle z1 . Mittels Polynomdivision und Einsetzen von z = z1 erhält man p(z) = s(z)(z − z1 ). Das Polynom s hat den gleichen Führungskoeffizienten wie p, und lässt sich nach Induktionsvoraussetzung in der angegebenen Weise faktorisieren. ❑ 6.9.3 Bemerkung. Funktionen f : R → C der Bauart f (t) = N X cn exp(itn), n=−N für ein N ∈ N und cn ∈ C, n = 0, . . . , N nennt man trigonometrische Polynome. Man sieht sofort, dass f (t) = exp(iNt) · p(exp(it)), wobei p : C \ {0} → C p(z) = 2N X cn−N zn . n=0 Also ist f stetig und 2π-periodisch. Weiters stimmen zwei trigonometrische Polynome überein, wenn das ihre Koeffizienten tun. Ist nämlich N X cn exp(itn) = n=−N M X dn exp(itn), n=−M PN (cn − dn ) exp(itn) = 0, wobei wir b j = 0, M < wobei o.B.d.A. N ≥ M, so folgt n=−N P n j ≤ N setzten. Es folgt q(exp(it)) = 0, t ∈ R, mit q(z) = 2N n=0 (cn−N − dn−N )z . Also hat das Polynom q(z) unendlich viele Nullstellen und ist damit das Nullpolynom, d.h. cn = dn , n = −N, . . . , N. Schließlich lässt sich jedes trigonometrische Polynom wegen N X cn exp(itn) = n=−N N X cn (cos nt+i sin nt) = c0 + n=−N N X n=1 in der Form a0 + N X n=1 an cos nt + N X (cn +c−n ) cos nt+ N X (cn −ic−n ) sin nt, n=1 bn sin nt, n=1 schreiben. Umgekehrt lässt sich jede Funktion der Bauart (6.15) schreiben als a0 + N X n=1 exp(int) + exp(−int) X exp(int) − exp(−int) + = bn 2 2i n=1 N an (6.15) KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 168 −1 N X X a−n + ib−n an − ibn exp(itn) + a0 + exp(itn). 2 2 n=−N n=1 Somit ist (6.15) eine zweite Art trigonometrische Polynome darzustellen, wobei die Koeffizienten in (6.15) ebenfalls eindeutig sind. 6.10 Weitere wichtige elementare Funktionen Die Funktion π sin x tan : R \ { + πn : n ∈ Z} → R, tan(x) = , 2 cos x wird als Tangens und cot : R \ {πn : n ∈ Z} → R, cot(x) = cos x , sin x als Cotangens bezeichnet. y y = tan(x) y = cot(x) − 3π 2 −2π − π2 −π 3π 2 π 2 0 π Abbildung 6.13: Tangens und Cotangens 2π x 6.10. WEITERE WICHTIGE ELEMENTARE FUNKTIONEN 169 Betrachtet man tan eingeschränkt auf (− 2π , π2 ), so zeigt man elementar, dass tan dieses Intervall bijektiv auf R abbildet. Entsprechend bildet cot das Intervall (0, π) bijektiv auf R ab. Die jeweiligen Umkehrfunktionen heißen arctan (Arcustangens) bzw. arccot (Arcuscotangens). y y = arctan(x) y = arccot(x) π π 2 −π −2π π 0 2π x − π2 Abbildung 6.14: Arcustangens und Arcuscotangens Man kann auch sin auf das Intervall [− 2π , π2 ] einschränken, und erhält eine Bijektion von [− π2 , π2 ] auf [−1, 1]. Die Umkehrfunktion davon heißt arcsin (Arcussinus). Entsprechend bildet cos das Intervall [0, π] bijektiv auf [−1, 1] ab. Die Umkehrfunktion davon heißt arccos (Arcuscosinus). y y = arcsin(x) y = arccos(x) π π 2 −2 −1 0 1 2 x − π2 Abbildung 6.15: Arcussinus und Arcuscosinus Ähnlich wie sin und cos sind Sinus Hyperbolicus sinh und Cosinus Hyperbolicus cosh definiert: cosh z := exp(z) + exp(−z) exp(z) − exp(−z) , sinh z := , z ∈ C. 2 2 KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 170 Die Werte von cosh z und sinh z liegen im allgemeinen in C. Für reelle z = x liegen cosh x und sinh x offensichtlich in R. y 4 3 y = sinh(x) y = cosh(x) 2 1 −3 −2 −1 −1 0 1 2 3 x −2 −3 −4 Abbildung 6.16: Sinus Hyperbolicus und Cosinus Hyperbolicus Da sinh : R → R bijektiv ist, hat er eine Inverse die mit areasinh (Areasinus Hyperbolicus) bezeichnet wird. Die Funktion cosh eingeschränkt auf [0, +∞) bildet dieses Intervall bijektiv auf [1, +∞) ab. Die entsprechende Umkehrfunktion von [1, +∞) auf [0, +∞) heißt areacosh (Areacosinus Hyperbolicus). 6.10. WEITERE WICHTIGE ELEMENTARE FUNKTIONEN y 171 y = areasinh(x) y = areacosh(x) 3 2 1 −6 −5 −4 −3 −2 −1 −1 1 0 2 3 4 5 6 x −2 −3 Abbildung 6.17: Areasinus Hyperbolicus und Areacosinus Hyperbolicus y y = tanh(x) y = coth(x) 1 −2 −1 0 1 2 x −1 Abbildung 6.18: Tangens Hyperbolicus und Cotangens Hyperbolicus sinh x Schließlich ist tanh : R → R definiert durch tanh x = cosh x , und coth : R \ {0} → R cosh x durch coth x = sinh x . Dabei bildet tanh die reellen Zahlen bijektiv auf (−1, 1) und coth die Menge R \ {0} bijektiv auf R \ [−1, 1]. Die entsprechenden Umkehrfunktion heißen areatanh (Areatangens Hyperbolicus) und areacoth (Areacotangens Hyperbolicus). KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN 172 y y = areatanh(x) y = areacoth(x) 2 1 −6 −4 −2 0 2 4 6 x −1 −2 Abbildung 6.19: Areatangens Hyperbolicus und Areacotangens Hyperbolicus 6.11 Abelscher Grenzwertsatz Thematisch passt zu diesem Kapitel – insbesondere zum Begriff der Potenzreihe – der sogenannte Abelsche Grenzwertsatz. P 6.11.1 Satz. Sei P(z) = ∞j=0 a j z j eine Potenzreihe, R ihr Konvergenzradius mit 0 < P R < ∞. Weiters sei z0 ∈ C mit |z0 | = R. Ist die Zahlenreihe s := ∞j=0 a j z0j konvergent, so gilt lim P(tz0 ) = s. (6.16) t→1− Beweis. Sei |z| < R und sn := n X a j z0j , s := lim sn . n→∞ j=0 Laut Voraussetzung existiert der Grenzwert s. Aus Lemma 3.9.5 folgt !j !n ! j+1 !j n−1 n n X X X z z z z j j = sn − − )= s j( a jz = (a j z0 ) z0 z0 z0 z0 j=0 j=0 j=0 z z0 Wegen n z z0 !n ! n−1 !j z z X sj sn + 1 − . z0 j=0 z0 sn → 0 konvergiert die Reihe auf der rechten Seite, und wir erhalten P(z) = ∞ X j=0 Andererseits ist folgt aus P∞ a jz j = 1 − j=0 ζ j = 1 1−ζ s= 1− ! ∞ !j z X z sj , |z| < R. z0 j=0 z0 für |ζ| < 1, dass ! ∞ !j z X z s . z0 j=0 z0 Für |z| < R und N ∈ N folgt !j !j N ∞ z X z z z X |P(z) − s| ≤ 1 − |s − s j | |s − s j | + 1 − z0 j=0 z0 z0 j=N+1 z0 6.11. ABELSCHER GRENZWERTSATZ 173 Ist nun ǫ > 0 und N fest und so groß, dass |s − s j | < ǫ, j > N, so ist das kleiner oder gleich !j X 1 − z N z z 1 − z 0 . |s − s j | +ǫ (6.17) z0 j=0 z0 1 − zz0 Ist z = tz0 , t ∈ (0, 1), so sieht man, dass es ein t0 ∈ (0, 1) gibt, sodass für t > t0 dieser Ausdruck kleiner oder gleich 2ǫ ist. Da ǫ > 0 beliebig war, gilt (6.16). ❑ 6.11.2 Bemerkung. Mit einer etwas feiner Argumentationsweise lässt sich (6.16) folgendermaßen verallgemeinern. Nähert sich z nichttangentiell dem Punkt z0 an, so konvergiert P(z) gegen s. Das bedeutet: Ist Nα , 0 < α < π der Winkelraum Nα = {reiβ ∈ C : r > 0, β ∈ [−α, α]}, Im C α Re α Abbildung 6.20: Winkelraum Nα so gilt lim τ∈Nα , τ→0 P((1 − τ)z0 ) = s. (6.18) Um das einzusehen, bemerke man zunächst, dass für τ = reiβ ∈ Nα mit r = |τ| ≤ cos α (für die Funktion cos siehe den nächsten Abschnitt) 2 |τ|(1 + |1 − τ|) 2 2 |τ| ≤ = ≤ ≤ . 1 − |1 − τ| 2 cos β − r 2 cos α − r cos α 1 − |(1 − τ)|2 Nun folgt man dem Beweis von Satz 6.11.1 bis (6.17). Dann folgt mit z = (1−τ)z0 , |τ| ≤ cos α, τ ∈ Nα !j N z 2 z X |s − s j | . +ǫ |P(z) − s| ≤ 1 − z0 j=0 z0 cos α Für |τ| → 0 konvergiert der erste Summand gegen Null. Also gibt es ein t0 ∈ (0, cos α), sodass |P(z) − s| ≤ ǫ cos3 α , wenn nur |τ| ≤ t0 , τ ∈ Nα . Da ǫ beliebig war, folgt (6.18). 174 KAPITEL 6. REELLE UND KOMPLEXE FUNKTIONEN Kapitel 7 Differentialrechnung Bewegt sich etwa ein Punkt, und bezeichnet s(t) den zum Zeitpunkt t zurückgelegten Weg, so erhält man die Geschwindigkeit zum Zeitpunkt t, indem man s(t + h) − s(t) h betrachtet, und h immer kleiner macht. Um derlei Betrachtungen, die in den Naturwissenschaften eine wichtige Rolle spielen, einen mathematisch exakten Hintergrund zu geben, wollen wir den Begriff der Ableitung einführen. 7.1 Begriff der Ableitung 7.1.1 Definition. Sei f : (a, b) → R (C) und sei x ∈ (a, b). Dann heißt f differenzierbar im Punkt x, falls der Grenzwert lim t→x f (t) − f (x) ∈ R (C) t−x existiert. Dieser heißt dann die Ableitung von f an der Stelle x, und man schreibt dafür f ′ (x) oder ddtf (x). Ist f zumindest auf [a, b) definiert1 , und existiert lim t→a+ f (t) − f (a) ∈ R (C), t−a so spricht man von rechtsseitiger Differenzierbarkeit im Punkt a und schreibt f ′ (a)+ dafür. Entsprechend definiert man die linksseitige Differenzierbarkeit im Punkt b und die linksseitige Ableitung f ′ (b)− . Anschaulich ist die Ableitung f ′ (x) gerade die Steigung der Tangente (in der folgenden Grafik als durchgehende Gerade gezeichnet) am Punkt (x, f (x)). Diese Steigung der Tangente erhält man als Grenzwert der Steigungen der Verbindungsgeraden von (x, f (x)) und (t, f (t)) (als strichlierte Gerade gezeichnet) für t → x. 7.1.2 Fakta. 1 Klarerweise könnte f sogar auf einer noch größeren Menge definiert sein. 175 KAPITEL 7. DIFFERENTIALRECHNUNG 176 f Steigung = f (t)− f (x) t−x Steigung = f ′ (x) t′′ x t′ t Abbildung 7.1: Ableitung als Grenzwert der Differenzenquotienten 1. Wie in Fakta 5.5.6 bemerkt, existiert ein Grenzwert limt→x h(t) genau dann, wenn die beiden einseitigen Grenzwerte limt→x− h(t) und limt→x+ h(t) existieren und übereinstimmen. Also ist f bei x ∈ (a, b) genau dann differenzierbar, wenn f bei x links- und rechtsseitig differenzierbar ist und f ′ (x)− und f ′ (x)+ übereinstimmen. In diesem Fall ist f ′ (x)− = f ′ (x) = f ′ (x)+ . 2. Da nach Lemma 5.3.7 genau dann y = limt→x h(t), wenn für jede gegen x konvergente Folge (tn )n∈N mit tn , x, n ∈ N, folgt, dass h(tn ) → y, ist f bei x genau dann differenzierbar mit Ableitung f ′ (x), wenn für jede solche Folge f ′ (x) = lim n→∞ f (tn ) − f (x) . tn − x Entsprechend lassen sich die einseitigen Ableitungen charakterisieren. 3. Entweder aus der letzten Behauptung oder aus (5.6) folgt, dass die Ableitung f ′ (x) im Falle ihrer Existenz nur vom Aussehen von f lokal bei x, also von f |(x−δ,x+δ) für jedes δ > 0, abhängt. Entsprechendes gilt für einseitige Ableitungen. 4. Wegen (5.11) ist eine Funktion f : (a, b) → C genau dann differenzierbar bei x ∈ (a, b), wenn Re f, Im f : (a, b) → R es sind, wobei f ′ (x) = (Re f )′ (x) + i(Im f )′ (x). Entsprechendes gilt für einseitige Ableitungen. (7.1) 7.1. BEGRIFF DER ABLEITUNG 177 Man kann auch die Differenzierbarkeit von R p -wertigen Funktionen f definieren. Dabei wird es sich herausstellen, dass dass solche Funktionen genau dann differenzierbar sind, wenn alle Komponentenfunktionen π j ◦ f differenzierbar sind. Siehe die Analysis 2 Vorlesung. 7.1.3 Bemerkung. Ist f definiert auf einer offenen Teilmenge der komplexen Zahlen f (w) beund bildet wieder in C hinein ab, so kann man analog f ′ (w) := limz→w f (z)− z−w trachten. Existiert dieser Grenzwert, so heißt f in w komplex differenzierbar. Wir wollen das hier aber nicht weiter verfolgen, denn dies führt zur Theorie der komplexen Analysis, die in einer eigenen Vorlesung behandelt wird. 7.1.4 Beispiel. (i) Für jedes λ ∈ R (C) ist die konstante Funktion f (t) = λ, t ∈ (−∞, +∞), an jeder Stelle x differenzierbar, und ihre Ableitung im Punkt x ist gleich 0. (ii) Die reellwertige Funktion t 7→ f (t) = tn , n ∈ N für t ∈ (−∞, +∞) ist auch an jedem Punkt x differenzierbar mit der Ableitung lim t→x (t − x)(tn−1 + tn−2 x + . . . + txn−2 + tn−1 ) t n − xn = lim = nxn−1 . t→x t−x t−x (iii) Die stetige Funktion 1 t sin t f (t) = 0 , falls t , 0 , falls t = 0 (7.2) ist im Punkt x = 0 nicht differenzierbar. Denn es gilt t sin 1t − 0 1 f (t) − f (0) = = sin . t−0 t−0 t P n (iv) Sei f (z) = ∞ n=0 an z eine Potenzreihe mit Konvergenzradius R > 0. Für die Einschränkung f |(−R,R) : (−R, R) → C gilt lim t→0 ∞ X f (t) − f (0) = lim an tn−1 . t→0 t n=1 P n Diese Potenzreihe rechts konvergiert genau dann, wenn ∞ n=0 an t es tut und hat somit auch Konvergenzradius R. Sie ist daher stetig in t. Also ist obiger Limes gleich a1 . Später werden wir f ′ (x) für alle x ∈ (−R, R) berechnen. (v) Für ein festes w ∈ C gilt lim t→x exp(wt) − exp(wx) exp(w(t − x)) − 1 = exp(wx) lim = t→x t−x t−x exp(wτ) − 1 = w exp(wx), τ wobei die letzte Gleichheit aus (iv) folgt, da der Koeffizient a1 in der Potenzreihe P wn n exp(wτ) = ∞ n=0 n! τ eben w ist. exp(wx) lim τ→0 Setzt man w = 1, so folgt exp′ (x) = exp(x). KAPITEL 7. DIFFERENTIALRECHNUNG 178 (vi) Als weitere Anwendung der Rechnung im letzten Beispiel berechnen wir Im exp(it) − Im exp(ix) sin(it) − sin(ix) = lim = t→x t−x t−x ! exp(it) − exp(ix) Im lim = Im(i exp(ix)) = Re(exp(ix)) = cos(x). t→x t−x sin′ (x) = lim t→x Dabei haben wir die Stetigkeit von z 7→ Im z verwendet. Genauso erhält man cos′ (x) = − sin(x). (vii) Für t ∈ R betrachte die Funktion f t2 t2 sin 1t f (t) = 0 , falls t , 0 , falls t = 0 f (t) −t2 Die Funktion f ist an der Stelle x = 0 differenzierbar mit Ableitung 0, denn es gilt f (t) − f (0) 1 = t sin → 0 für t → 0. t−0 t An einer Stelle x , 0 ist f differenzierbar und es gilt wie wir später sehen werden f ′ (x) = 2x sin 1 1 − cos . x x 7.1.5 Lemma. Ist f im Punkt x differenzierbar, so ist sie dort stetig. Beweis. Aus limt→x f (t)− f (x) t−x = α folgt " # f (t) − f (x) lim f (t) − f (x) = lim (t − x) = α · 0 = 0. t→x t→x t−x ❑ 7.1.6 Bemerkung. Wie man am Beispiel der Funktion f aus (7.2) sieht, gilt die Umkehrung von Lemma 7.1.5 nicht. 7.1.7 Satz. Seien f, g : (a, b) → R (C) beide differenzierbar im Punkt x ∈ (a, b), und α, β ∈ R (C). Dann sind auch α f + βg, f g und (falls g(x) , 0) gf an der Stelle x differenzierbar, und es gilt (α f + βg)′ (x) = α f ′ (x) + βg′ (x), ( f g)′ (x) = f ′ (x)g(x) + f (x)g′ (x) (Produktregel), ′ ′ f (x)g′ (x) (Quotientenregel). gf (x) = f (x)g(x)− g(x)2 7.1. BEGRIFF DER ABLEITUNG 179 Entsprechende Regeln gelten auch für einseitige Ableitungen. Beweis. f (t) − f (x) g(t) − g(x) (α f + βg)(t) − (α f + βg)(x) = α lim + β lim . t→x t→x t−x t−x t−x Da f nach Lemma 7.1.5 bei x stetig ist, folgt aus den Rechenregeln für Grenzwerte (vgl. Abschnitt 5.3) ! ! f (t) − f (x) g(t) − g(x) f (t)g(t) − f (x)g(x) + lim lim = lim f (t) g(x) = t→x t→x t→x t−x t−x t−x lim t→x f (t) − f (x) g(t) − g(x) + g(x) lim = f (x)g′ (x) + f ′ (x)g(x). t→x t−x t−x Die letzte Quotientenregel folgt ebenfalls aus der Stetigkeit und den Rechenregeln für Grenzwerte indem man in f (t) f (x) " # 1 g(t) − g(x) f (t) − f (x) g(t) − g(x) = − f (x) g(x) . t−x g(t)g(x) t−x t−x lim f (t) · lim t→x t→x t → x streben lässt. ❑ n 7.1.8 Beispiel. Wir haben schon gesehen, dass f (t) = t für alle n ∈ N differenzierbar ist mit f ′ (x) = nxn−1 . Um das auch für n ∈ −N zu zeigen verwende man die Quotientenregel: !′ 1 (x|n| )′ n ′ (x ) = |n| = − 2|n| = nx|n|−1−2|n| = nxn−1 . x x Weiters ist eine rationale Funktion in jedem Punkt, wo der Nenner nicht verschwindet, differenzierbar. 7.1.9 Satz (Kettenregel). Sei f : (a, b) → R reellwertig und g : (c, d) → R (C), sodass f (a, b) ⊆ (c, d), und x ∈ (a, b). Ist f bei x und g bei f (x) differenzierbar, so ist g ◦ f bei x differenzierbar, wobei (g ◦ f )′ (x) = g′ ( f (x)) · f ′ (x). Beweis. Die vorausgesetzte Differenzierbarkeit von f bei x lässt sich dadurch charakterisieren, dass die reellwertige Funktion definiert auf (a, b) durch f (t)− f (x) , falls t , x t−x φ(t) = f ′ (x) , falls t = x bei x stetig ist; vgl. Proposition 6.1.4. Genauso ist ψ : (c, d) → R (C) definiert durch g(s)−g( f (x)) , falls s , f (x) s− f (x) ψ(s) = g′ ( f (x)) , falls s = f (x) bei f (x) stetig. Somit gilt für alle t ∈ (a, b) \ {x} – auch für die t mit f (x) = f (t) – (g ◦ f )(t) − (g ◦ f )(x) = ψ( f (t)) · φ(t) . t−x Wegen Lemma 7.1.5, Lemma 6.1.6 und Korollar 6.1.8 ist dieser Ausdruck in x stetig. Also gilt (g ◦ f )′ (x) = limt→x ψ( f (t)) · φ(t) = ψ( f (x)) · φ(x) = g′ ( f (x)) · f ′ (x). ❑ KAPITEL 7. DIFFERENTIALRECHNUNG 180 7.1.10 Bemerkung. Es gelten diverse einseitige Varianten von Satz 7.1.9, deren Beweise fast gleich verlaufen: Ist f : (a, b) → (c, d], g : (c, d] → R (C), x ∈ (a, b), f (x) = d sowie f bei x differenzierbar und g bei f (x) = d linksseitig differenzierbar, so folgt (g ◦ f )′ (x) = g′ ( f (x))− · f ′ (x). Ist f : [a, b) → (c, d), g : (c, d) → R (C), sowie f bei a rechtsseitig differenzierbar und g bei f (a) differenzierbar, so folgt (g ◦ f )′ (a)+ = g′ ( f (a)) · f ′ (a)+ . usw. . 7.1.11 Beispiel. Sei f (x) = x2 sin 1x , x , 0 wie in Beispiel 7.1.4, (vii). Durch Anwendung der Produkt und der Kettenregel ergibt sich (x , 0) !′ ! !′ 1 1 1 1 1 1 1 ′ 2 ′ 2 2 f (x) = (x ) sin + x sin = 2x · sin + x · cos = 2x · sin − cos . · x x x x x x x 7.1.12 Satz. Sei f : (a, b) → (c, d) bijektiv und streng monoton, und bezeichne mit g : (c, d) → (a, b) ihre Umkehrfunktion. Ist f an einer Stelle x differenzierbar und gilt f ′ (x) , 0, so ist g an der Stelle f (x) differenzierbar, und es gilt g′ ( f (x)) = 1 f ′ (x) . Beweis. Wegen Korollar 6.5.3 sind f und g beide stetig. Ist daher (tn )n∈N eine gegen f (x) konvergente Folge aus (c, d) \ { f (x)}, so ist g(tn ) n∈N eine gegen x = g( f (x)) konvergente Folge aus (a, b) \ {x}. Mit τn := g(tn ) folgt lim n→∞ g(tn ) − x g(tn ) − g( f (x)) 1 1 = lim = ′ . = f (τn )− f (x) n→∞ f g(tn ) − f (x) tn − f (x) f (x) limn→∞ τn −x ❑ Auch bei obigem Satz gelten entsprechende Aussagen für einseitige Ableitungen, wenn f und damit auch g an einem/beiden der Ränder definiert ist. 7.1.13 Beispiel. Betrachte die reelle Exponentialfunktion exp : R → R+ . Diese ist stetig und bijektiv. Ihre Umkehrfunktion ist ln : R+ → R. Für ein festes y ∈ R+ und das entsprechende x ∈ R mit y = exp(x) folgt ln′ (y) = ln′ ( f (x)) = 1 1 1 1 = = = . exp′ (x) exp(x) exp(ln(y)) y 7.1.14 Definition. Sei f eine reell- oder komplexwertige Funktion definiert auf einem Intervall I ⊆ R. Ist f an allen x ∈ I differenzierbar, wobei im Falle, dass x der linke bzw. rechte Intervallrand von I ist und dieser in I liegt, die rechts- bzw. linksseitige Differenzierbarkeit gemeint ist, so nennt man die Funktion ( I → R (C) ′ f : x 7→ f ′ (x) Ableitung von f auf I. Ist x der linke bzw. rechte Intervallrand von I und liegt dieser in I, so ist unter f ′ (x) die rechts- bzw. linksseitige Ableitung an der Stelle x zu verstehen. 7.1. BEGRIFF DER ABLEITUNG 181 Einer Funktion f wird also eine weitere Funktion zugeordnet, die die aus f abgeleitete Funktion f ′ genannt wird. Ihr Wert an einer Stelle x ist gerade der Limes des Differenzenquotienten von f bei x. Diese Sichtweise erklärt auch die Schreibweise f ′ (x) aus Definition 7.1.1. Die Schreibweise ddtf (x) erklärt sich aus der Interpretation der Ableitung als Grenzfall des Zuwachses von f dividiert durch den Zuwachs von t. Es ist also sinnvoll von Eigenschaften der Funktion f ′ , wie zum Beispiel Stetigkeit oder auch wieder Differenzierbarkeit zu sprechen. Wie wir in Beispiel 7.1.4, (vii), gesehen haben, muss die Ableitung f ′ nicht notwendigerweise stetig sein. 7.1.15 Definition. Sei f eine reell- oder komplexwertige Funktion definiert auf einem Intervall I ⊆ R, sodass die Ableitung f ′ von f auf ganz I existiert. Ist die Ableitung f ′ an einer Stelle x differenzierbar, so bezeichnet man ( f ′ )′ (x) mit f ′′ (x) und spricht von der zweiten Ableitung von f an der Stelle x. Im Falle, dass x Intervallrand ist, so sei wieder die entsprechende einseitige Ableitung gemeint. Allgemeiner definiert man höhere Ableitungen rekursiv durch f (n) (x) := ( f (n−1) )′ (x), n ∈ N, wann immer f (n−1) auf I definiert ist und bei x differenzierbar ist. Die Funktion f heißt bei x dann n-mal differenzierbar. Existiert f (n) an allen Stellen x ∈ I und ist f (n) stetig auf I, so spricht man von einer n-mal stetig differenzierbaren Funktion. Die Menge aller n-mal stetig differenzierbaren Funktionen auf I wird mit C n (I) bezeichnet. Für n = 0 steht C 0 (I) oder auch C(I) für die Menge aller stetigen reell- oder komplexwertigen Funktion definiert auf dem Intervall I. Mit f ∈ C ∞ (I) wollen wir zum Ausdruck bringen, dass f auf I beliebig oft differenzierbar ist. Aus der Produktregel erhält man mittels vollständiger Induktion die oft nützliche Formel ! n X n (k) (n−k) f g . ( f g)(n) = k k=0 7.1.16 Beispiel. Sei f (x) = x3 − 2x. Dann gilt f ′ (x) = 3x2 − 2, f ′′ (x) = 6x, f ′′′ (x) = 6, f ′′′′ (x) = 0, f (5) (x) = 0, . . . Man sieht genauso, dass jedes Polynom p beliebig oft differenzierbar ist und wenn n der Grad von p ist, p(n+1) (x) = p(n+2) (x) = . . . = 0 gilt. Sei f die Funktion x2 f (x) = −x2 , falls x ≥ 0 , falls x < 0 Die Ableitung von f ist f ′ (x) = |x|. Die zweite Ableitung existiert also an der Stelle x = 0 nicht. KAPITEL 7. DIFFERENTIALRECHNUNG 182 7.2 Mittelwertsätze 7.2.1 Definition. Sei hX, dX i ein metrischer Raum, E ⊆ X und sei f : E → R. Man sagt f hat ein lokales Maximum in einem Punkt x ∈ E, falls ∃ δ > 0 : f (x) ≥ f (t) für t ∈ E ∩ Uδ (x). Analog definiert man ein lokales Minimum. Will man sich nicht festlegen, ob x ein Minimum oder Maximum ist, so spricht man zusammenfassend von einem lokalen Extremum. Man beachte den Unterschied zum Begriff des Maximums. Das ist eine Stelle x ∈ E, sodass für jedes t ∈ E gilt f (x) ≥ f (t), also nicht nur lokal bei x sondern global. Man spricht dann von einem absoluten Maximum. Analog für absolute Minima bzw. zusammenfassend absolute Extrema. Natürlich ist ein absolutes Extremum stets auch ein lokales. 7.2.2 Satz. Hat f : (a, b) → R an einer Stelle x ∈ (a, b) ein lokales Extremum und ist f bei x differenzierbar, so muss f ′ (x) = 0. Beweis. Wir nehmen an, dass x ein lokales Maximum ist. Den Fall eines lokalen Minimums behandelt man analog. Wähle δ > 0 wie in Definition 7.2.1. Es gilt also f (x) ≥ f (t) für alle |t − x| < δ. Im Falle t > x gilt somit f (t) − f (x) ≤ 0, t−x und daher f ′ (x) = limt→x+ f (t)− f (x) t−x ≤ 0. Ist jedoch t < x, so impliziert f (x) ≥ f (t) f (t) − f (x) ≥ 0. t−x Also muss auch f ′ (x) = limt→x− f (t)− f (x) t−x ≥ 0. ❑ Geometrisch bedeutet Satz 7.2.2, dass an einem lokalen Extremum die Tangente an die Kurve y = f (x), falls eine solche existiert, waagrecht liegen muss. 7.2.3 Korollar (Satz von Rolle). Sei f : [a, b] → R stetig und auf (a, b) differenzierbar. Gilt f (a) = f (b) = 0, so gibt es ein ζ ∈ (a, b), sodass f ′ (ζ) = 0. Beweis. Aus Korollar 6.1.14 wissen wir, dass f auf [a, b] ein Maximum und ein Minimum besitzt. Also gibt es x− , x+ ∈ [a, b], sodass f (x− ) ≤ f (t) ≤ f (x+ ), für alle t ∈ [a, b]. 7.2. MITTELWERTSÄTZE 183 Sind beide x− und x+ Randpunkte, d.h. x− , x+ ∈ {a, b}, so muss f (t) = 0 für alle t ∈ [a, b] und daher f ′ (t) = 0 für alle t ∈ (a, b) sein. Ist x− in (a, b) enthalten, so muss nach Satz 7.2.2 f ′ (x− ) = 0. Im Falle x+ ∈ (a, b) schließt man genauso. ❑ a ζ b Abbildung 7.2: Satz von Rolle 7.2.4 Korollar. Sei f : [a, b] → R stetig und n-mal differenzierbar auf (a, b). Weiters habe f mindestens n + 1 Nullstellen in [a, b]. Dann existiert ξ ∈ (a, b) mit f (n) (ξ) = 0. Beweis. Der Fall n = 1 folgt sofort aus Korollar 7.2.3. Angenommen der Satz gelte für n − 1. Wir zeigen ihn für n. Nach Korollar 7.2.3 liegt zwischen je zwei Nullstellen von f mindestens eine Nullstelle von f ′ . Also hat f ′ mindestens n Nullstellen. Nach Induktionsvoraussetzung existiert ein ξ mit f (n) (ξ) = ( f ′ )(n−1) (ξ) = 0. ❑ 7.2.5 Beispiel. Wir wollen zeigen, dass die Gleichung (1 − ln x)2 = x(3 − 2 ln x) in (0, +∞) genau zwei Lösungen hat. Dazu betrachten wir die Funktion f : (0, +∞) → R, f (x) = (1 − ln x)2 − x(3 − 2 ln x). Für diese gilt es zu zeigen, dass f genau zwei Nullstellen hat. Setzt man x = 1, so folgt f (1) = −2 < 0. Andererseits folgt wegen lim x→0+ x(3 − 2 ln x) = 0 lim f (x) = +∞. x→0+ Wegen f (x) ≥ x(2 ln x − 3) ≥ x für x ≥ exp(2) folgt auch lim f (x) = +∞. x→+∞ Insbesondere gibt es ξ, η ∈ R mit 0 < ξ < 1 < η < +∞, sodass f (ξ) > 0, f (η) > 0. Nach dem Zwischenwertsatz muss es einen Punkt α ∈ (ξ, 1) und einen Punkt β ∈ (1, η) geben, sodass f (α) = 0 = f (β). Also hat f mindestens zwei Nullstellen. Um zu zeigen, dass es nicht mehr sein können, berechnen wir 1 ln x − 1 2 4 − 2 ln x + 2x 1 f ′ (x) = 2(ln x − 1) + 2 ln x − 1, f ′′ (x) = 2 2 − 2 + = . x x x2 x x2 Für x ∈ (0, 1] ist ln x ≤ 0 und somit f ′′ (x) > 0. Für x ∈ (1, +∞) gilt wegen x > ln x auch f ′′ (x) > 0. Also hat f ′′ keine Nullstelle. Nach dem Satz von Rolle kann f ′ höchstens eine und weiter f höchstens zwei Nullstellen haben (vgl. Korollar 7.2.4). KAPITEL 7. DIFFERENTIALRECHNUNG 184 7.2.6 Satz (Mittelwertsatz). Sei f : [a, b] → R stetig und auf (a, b) differenzierbar. Dann existiert ein Punkt ζ ∈ (a, b) mit f (b) − f (a) = f ′ (ζ). b−a Beweis. Betrachte die Funktion F : [a, b] → R F(t) := f (t) − f (a) − f (b) − f (a) (t − a). b−a Dann ist F auf [a, b] stetig (vgl. Korollar 6.1.8) und auf (a, b) differenzierbar (vgl. Beispiel 7.1.4, (i), (ii) und Satz 7.1.7), wobei F(a) = F(b) = 0 und für x ∈ (a, b) F ′ (x) = f ′ (x) − f (b) − f (a) . b−a Wenden wir Korollar 7.2.3 an, so folgt sofort die Behauptung. ❑ Für g(t) = t ist Satz 7.2.6 ein Spezialfall folgender Verallgemeinerung. 7.2.7 Satz (Verallgemeinerter Mittelwertsatz). Seien f, g : [a, b] → R stetig und differenzierbar auf (a, b). Weiters gelte g′ (t) , 0 für alle t ∈ (a, b). Dann existiert eine Stelle ζ ∈ (a, b) mit f ′ (ζ) f (b) − f (a) = ′ . (7.3) g(b) − g(a) g (ζ) Beweis. Zunächst existiert nach Satz 7.2.6 ein x ∈ (a, b) mit g(b) − g(a) = g′ (x)(b − a), woraus wir g(b) − g(a) , 0 schließen. Somit ist die Funktion F : [a, b] → R, F(t) = f (t) − f (a) − f (b) − f (a) (g(t) − g(a)), g(b) − g(a) wohldefiniert, stetig und auf (a, b) differenzierbar, wobei F ′ (t) = f ′ (t) − f (b) − f (a) ′ g (t). g(b) − g(a) Weiters gilt F(a) = F(b) = 0. Somit gibt es nach Korollar 7.2.3 ein ζ ∈ (a, b) mit F ′ (ζ) = 0, und daher (7.3). ❑ 7.2.8 Bemerkung. Satz 7.2.6, welcher auch 1. Mittelwertsatz der Differentialrechnung genannt wird, besagt, dass man – falls durchwegs Tangenten existieren – stets eine Tangente findet, welche parallel zur Sekante durch die Punkte (a, f (a)) und (b, f (b)) liegt. Die Stelle ζ aus Satz 7.2.6, an der die Steigung der Kurve gleich der mittleren Steigung im Intervall [a, b] ist, ist nicht eindeutig bestimmt. Satz 7.2.7 heißt auch 2. Mittelwertsatz der Differentialrechnung. Obwohl man es auf den ersten Blick nicht sieht, so hat der Mittelwertsatz doch weitreichende Folgerungen. 7.2. MITTELWERTSÄTZE 185 f (b) f (a) a ζ b Abbildung 7.3: Mittelwertsatz 7.2.9 Korollar. Sei I ⊆ R ein Intervall und f : I → R stetig. Sind a, b die Intervallränder von I, so sei f auf (a, b) differenzierbar. Dann gilt: Ist f ′ (x) ≥ 0 (> 0), für alle x ∈ (a, b), so ist f (streng) monoton wachsend. Ist f ′ (x) ≤ 0 (< 0), für alle x ∈ (a, b), so ist f (streng) monoton fallend. Ist f ′ (x) = 0, für alle x ∈ (a, b), so ist f konstant. Bezüglich der Umkehrung gilt nur, dass, wenn f monoton wachsend (fallend) ist, für ihre Ableitung immer f ′ (x) ≥ 0 (≤ 0) gilt. Beweis. Seien x1 , x2 ∈ I, x1 < x2 . Dann existiert eine Stelle x ∈ (x1 , x2 ) mit f (x2 ) − f (x1 ) = (x2 − x1 ) f ′ (x). Daraus folgt unmittelbar das behauptete Monotonieverhalten. Ist umgekehrt f monoton wachsend (fallend), so gilt für den Differenzenquotient für alle x, t ∈ (a, b) f (t) − f (x) ≥ 0 (≤ 0). t−x Für t → x folgt f ′ (x) ≥ 0 (≤ 0). ❑ 7.2.10 Beispiel. Dass aus der strengen Monotonie einer Funktion f nicht notwendigerweise f ′ (x) > 0 bzw. f ′ (x) < 0 für alle x folgt, sieht man anhand eines einfachen Beispiels. Die Funktion f (x) = x3 ist auf R streng monoton wachsend. Ihre Ableitung f ′ (x) = 3x2 ist nur ≥ 0, aber nicht > 0 für alle x ∈ R. 7.2.11 Bemerkung. Der Schluss f ′ (x) ≡ 0 ⇒ f ≡ c für ein festes c gilt auch für komplexwertige Funktionen. Das sieht man leicht, indem man f in Real- und Imaginärteil aufspaltet; vgl. (7.1). KAPITEL 7. DIFFERENTIALRECHNUNG 186 Obwohl die Ableitung f ′ einer auf einem Intervall (a, b) differenzierbaren Funktion nicht notwendig stetig sein muss, so gilt trotzdem stets die Zwischenwerteigenschaft. 7.2.12 Korollar. Sei I ⊆ R ein Intervall mit den Randpunkten a, b, a < b und f : I → R differenzierbar. Sind x1 , x2 ∈ I und c ∈ R mit f ′ (x1 ) < c < f ′ (x2 ), dann existiert eine Stelle x ∈ (min(x1 , x2 ), max(x1 , x2 )) mit f ′ (x) = c. Ist f ′ (x) , 0 für alle x ∈ I, so gilt entweder immer f ′ (x) > 0, x ∈ I, oder immer f ′ (x) < 0, x ∈ I. Sie sind daher entweder streng monoton wachsend oder streng monoton fallend. Beweis. Wir nehmen zunächst x1 < x2 an. Betrachte die Funktion g : I → R, g(t) = f (t) − ct. Für ihre Ableitung gilt g′ (x1 ) = f ′ (x1 ) − c < 0, g′ (x2 ) = f ′ (x2 ) − c > 0. Sei x ∈ [x1 , x2 ] eine Stelle, an der g ihr Minimum annimmt. Wegen Satz 7.2.2 und g′ (x) = f ′ (x) − c, genügt es x , x1 , x2 zu zeigen. Wegen g′ (x1 ) < 0 existiert ein δ > 0 mit g(t) − g(x1 ) < 0, x1 < t < x1 + δ. t − x1 Also muss g(t) < g(x1 ) für solche Werte von t. Der Punkt x1 scheidet als Kandidat für das Minimum also aus. Wegen g′ (x2 ) > 0 folgt die Existenz eines δ > 0, sodass g(t) − g(x2 ) > 0, x2 − δ < t < x2 . t − x2 Also ist g(t) < g(x2 ) für solche t, und der Punkt x2 kommt daher auch nicht in Frage. Den Fall x1 > x2 führt man durch die Betrachtung von − f auf obigen Fall zurück. Die letzte Aussage folgt sofort aus der eben bewiesenen Zwischenwerteigenschaft. ❑ 7.2.13 Korollar. Sei f differenzierbar auf (a, b). Dann hat f ′ keine Sprungstelle in (a, b). Beweis. An einer Sprungstelle existieren f ′ (x+) := limt→x+ f ′ (t) und f ′ (x−) := limt→x− f ′ (t), es sind jedoch nicht beide gleich f ′ (x). Angenommen es ist f ′ (x+) < f ′ (x), also f ′ (x+) + ǫ ≤ f ′ (x) für ein ǫ > 0. Also gilt f ′ (t) + ǫ ≤ f ′ (x), für alle t ∈ (x, t0 ], 2 für ein t0 > x. Also nimmt f ′ (t) für x < t < t0 keine Werte in ( f ′ (x) − 2ǫ , f ′ (x)) obiger Zwischenwerteigenschaft. ⊆ ( f ′ (t0 ), f ′ (x)) an. Das widerspricht ❑ Wir werden nun Satz 7.2.7 verwenden, um eine sehr nützliche Methode herzuleiten, Limiten zu berechnen. 7.2.14 Satz (Regel von de L’Hospital2 ). Seien f, g : (a, b) → R differenzierbar auf (a, b), wobei a, b, ∈ R ∪ {±∞}, −∞ ≤ a < b ≤ +∞. Für x ∈ (a, b) hinreichend nahe bei a gelte g′ (x) , 0, und lim f (x) = lim g(x) = 0, (7.4) x→a+ x→a+ oder lim g(x) = +∞. x→a+ 2 Guillaume Francois L’Hospital, Marquis de Saint-Mesme, geb.1661 Paris, gest.3.2.1704 Paris (7.5) 7.2. MITTELWERTSÄTZE Dann gilt lim x→a+ 187 f (x) f ′ (x) = A ⇒ lim = A, x→a+ g(x) g′ (x) (7.6) mit A ∈ R ∪ {±∞}. Die analoge Aussage ist richtig, wenn man überall x → a+ durch x → b− oder in (7.5) +∞ durch −∞ ersetzt. Beweis. Da die Grenzwerte in (7.6) nur von den Funktionswerten lokal bei x abhängen (vgl. (5.6)), können wir b nötigenfalls kleiner machen, sodass g′ (x) , 0 auf ganz (a, b). Damit kann g auf (a, b) höchstens eine Nullstelle haben, da sonst nach Korollar 7.2.3 g′ (ζ) = 0 für ein ζ ∈ (a, b). Machen wir b nötigenfalls nochmals kleiner, so können wir auch g(x) , 0 auf ganz (a, b) annehmen. Gilt (7.5), so muss wegen dem Zwischenwertsatz, Korollar 6.2.6, g(x) > 0 für alle x ∈ (a, b) gelten. Außerdem hat nach Korollar 7.2.12 g′ (x) immer das selbe Vorzeichen. Wegen (7.5) gibt es aber sicher a < s < t < b mit g(s) > g(t). Mit dem Mittelwertsatz Satz 7.2.6 folgt daraus g′ (x) < 0 für ein und daher für alle x ∈ (a, b). Also ist g unter der Voraussetzung (7.5) auf ganz (a, b) streng monoton fallend. Sei α ∈ R, α > A, und wähle r ∈ R mit A < r < α. Wegen limt→a+ existiert ein c ∈ (a, b) mit f ′ (t) g′ (t) =A f ′ (t) < r für t ∈ (a, c). g′ (t) Sind dann x, y ∈ (a, c), x < y beliebig, so folgt aus Satz 7.2.7 f ′ (t) f (x) − f (y) = ′ < r, g(x) − g(y) g (t) (7.7) für ein t ∈ (x, y) ⊆ (a, c). Ist die Bedingung (7.4) erfüllt, so lässt man in obiger Beziehung x gegen a streben und erhält f (y) ≤ r < α für y ∈ (a, c). g(y) Ist nun Bedingung (7.5) ist erfüllt, so halte man y in (7.7) fest. Da g auf (a, b) streng monoton fällt und g(x) > 0, folgt ! f (y) f ′ (t) g(x) − g(y) f (y) g(y) f (x) + = ′ + <r 1− , x ∈ (a, c). g(x) g (t) g(x) g(x) g(x) g(x) Lässt man hier x → a+ streben, so konvergiert die rechte Seite gegen r (> α). Also folgt die Existenz eines d ∈ (a, c), sodass f (x) < α, a < x < d. g(x) Wir haben also unter jeder der Voraussetzungen (7.4) und (7.5) nachgewiesen, dass für ein gewisses ρ ∈ (a, b) f (t) < α, wenn nur t ∈ (a, ρ). g(t) KAPITEL 7. DIFFERENTIALRECHNUNG 188 Wendet man das auf − f und −A statt f und A an, so sieht man, dass es auch zu jedem β ∈ R, β < A ein ρ ∈ (a, b) gibt, sodass f (t) > β, wenn nur t ∈ (a, ρ). g(t) Somit folgt lim x→a+ f (x) g(x) = A (vgl. (5.12)). ❑ 7.2.15 Bemerkung. Indem man eine Funktion f : [a, b] → C in Real- und Imaginärteil zerlegt, folgt sofort die Gültigkeit der Regel von de L’Hospital auch wenn f komplexwertig ist (vgl. (7.1)). Die Funktion g muss aber reellwertig sein. 7.2.16 Beispiel. (i) 1 x x→0+ − 12 x lim x ln x = lim x→0+ = 0. (ii) Um lim x→0+ x x zu bestimmen, sei zunächst bemerkt, dass x x = exp(x ln x) für x > 0. Aus dem vorherigen Beispiel und wegen der Stetigkeit von exp gilt nun lim x x = lim exp(x ln x) = exp( lim x ln x) = exp(0) = 1 . x→0+ x→0+ x→0+ 1 (iii) Weil ( n1 n )n∈N eine Teilfolge3 des Netzes (x x ) x∈(0,+∞) ist, wobei (0, +∞) so gerichtet ist, dass x1 x2 ⇔ x1 ≥ x2 , folgt aus dem letzten Beispiel, dass 1 lim n→∞ n ! 1n = 1. Diese Tatsache folgt offenbar auch aus limn→∞ (iv) √n n = 1; vgl. Beispiel 3.3.7. sin x cos x (sin x)′ = lim = lim = 1. x→0+ x x→0+ 1 x→0+ x′ lim Genauso sieht man lim x→0− sin x x = 1. (v) Man betrachte den Grenzwert 1 1 − 2 lim x→0 (sin x)2 x ! Dieser Ausdruck ist von der Form ∞ − ∞. Wir rechnen ! 1 x2 − (sin x)2 1 = − . 2 2 (sin x) x (x sin x)2 3 Siehe Definition 5.3.6! (7.8) 7.2. MITTELWERTSÄTZE 189 Für x → 0 ist dieser Ausdruck von der Form 00 . Also stimmt der Grenzwert in (7.8) nach der Regel von de L’Hospital angewandt auf den rechtsseitigen Grenzwert und den linksseitigen Grenzwert mit 2x − sin(2x) 2x − 2 sin x cos x = lim 2 2 x→0 2x(sin x)2 + x2 sin(2x) x→0 2x(sin x) + 2x sin x cos x lim überein, falls letzterer existiert. Wenden wir die Regel von de L’Hospital nochmals beidseitig an, so erhalten wir (wieder falls der rechte Limes existiert) lim x→0 2 − 2 cos(2x) 1 − cos(2x) = lim . 2(sin x)2 + 4x sin(2x) + 2x2 cos(2x) x→0 (sin x)2 + 2x sin(2x) + x2 cos(2x) Dieser Ausdruck ist wieder von der Form 00 . Wir müssten die Regel von de L’Hospital noch zweimal anwenden, um zu einem Ergebnis zu kommen. Etwas einfach ist es, diesen Grenzwert als 1 − cos(2x) x2 · lim = x→0 x→0 (sin x)2 + 2x sin(2x) + x2 cos(2x) x2 lim lim x→0 1 − cos(2x) 1 · lim x→0 sin x 2 sin(2x) x2 + 4 2x + cos(2x) x zu schreiben. Zweimal de L’Hospital (jeweils für den links- und rechtsseitigen = 2, und wegen lim x→0 sinx x = 1 gilt Grenzwert) liefert lim x→0 1−cos(2x) x2 lim x→0 sin x 2 x 1 + 4 sin(2x) 2x = + cos(2x) 1 1 = . 1+4+1 6 Also ist (7.8) genau 31 . (vi) Eine andere Möglichkeit den Grenzwert (7.8) zu berechnen, besteht darin, die Potenzreihenentwicklung von sin x um 0 zu verwenden: ! ! sin x 1 − ( sinx x )2 1 1 sin x 1 − x · = − = 1 + = x (sin x)2 x2 (sin x)2 (sin x)2 P∞ (−1)n x2n ! ! P∞ (−1)n−1 x2n sin x 1 − n=0 (2n+1)! sin x n=1 (2n+1)! · P · P 1+ = 1+ . 2 n 2n+1 x x ∞ (−1) x ∞ (−1)n x2n+1 2 n=0 n=0 (2n+1)! (2n+1)! 2 Oben und unten durch x dividieren ergibt ! P∞ (−1)n x2n sin x n=0 (2n+3)! · P 1+ . x ∞ (−1)n x2n 2 n=0 (2n+1)! Man beachte, dass alle hier auftretenden Potenzreihen Konvergenzradius +∞ haben. Somit stehen in Zähler und Nenner stetige Funktionen in x (vgl. Satz 6.7.7). Für x → 0 konvergiert die Potenzreihen gegen den nullten Summanden. Also 1 erhalten wir für den Grenzwert (7.8) abermals 2 3!1 = 13 . KAPITEL 7. DIFFERENTIALRECHNUNG 190 (vii) Sei w ∈ C mit einem Realteil, der kleiner als Null ist. Wir wollen zeigen, dass der Grenzwert limt→+∞ t exp(wt) in C die komplexe Zahl 0 ist. Entweder wir betrachten dazu Real- und Imaginärteil des Grenzwertes gesondert, oder – was einfacher ist – wir betrachten den Betrag von t exp(wt) für t > 0 (vgl. Satz 6.8.3): |t exp(wt)| = t exp(t Re w) = t . exp t(− Re w) Wegen − Re w > 0 ist der Grenzwert davon für t → +∞ von der Form stimmt nach Satz 7.2.14 dieser Grenzwert überein mit (siehe (6.13)) +∞ +∞ . Somit exp(t Re w) 1 t′ = 0. = lim = lim t→+∞ t→+∞ − Re w · exp t(− Re w) t→+∞ exp t(− Re w) ′ − Re w lim 7.2.17 Korollar. Sei I ⊆ R ein Intervall mit den Randpunkten a, b, a < b und f : I → R (C) eine Abbildung, die auf (a, b) differenzierbar ist. Ist a ∈ I, f dort stetig und existiert limt→a+ f ′ (t) in R (C), so ist f bei a rechtsseitig differenzierbar, wobei limt→a+ f ′ (t) = f ′ (a)+ . Entsprechendes gilt für t → b−, wenn b ∈ I. Beweis. Wegen der Stetigkeit von f bei a können wir Satz 7.2.14 im reellwertigen Fall bzw. Bemerkung 7.2.15 im komplexwertigen Fall anwenden und erhalten f ′ (a)+ = lim t→a+ f ′ (t) f (t) − f (a) = lim . t→a+ 1 t−a ❑ 7.2.18 Bemerkung. Ist mit der Notation aus Korollar 7.2.17 f reellwertig und gilt a ∈ I sowie limt→a+ f ′ (t) = +∞ (= −∞), so lässt sich Satz 7.2.14 genauso wie im Beweis von Korollar 7.2.17 anwenden, und man erhält, dass f bei a nicht rechtsseitig differenzierbar ist. Entsprechendes gilt für t → b−, wenn b ∈ I. 7.2.19 Bemerkung. Wegen Korollar 7.2.17 gilt f ∈ C 1 (I) genau dann, wenn f ∈ C(I), f |(a,b) ∈ C 1 (a, b) und sich ( f |(a,b) )′ auf ganz I stetig fortsetzen lässt. Dabei bezeichnen a und b wieder die Randpunkte des Intervalls I. 7.2.20 Beispiel. Sei 1 1 e− x f (x) = 0 , falls x > 0 , falls x ≤ 0 f 1 2 0 1 2 3 4 7.3. DER TAYLORSCHE LEHRSATZ 191 Klarerweise ist f auf (−∞, 0] beliebig oft ableitbar mit f (n) (x) = 0, x ≤ 0. 1 Auf (0, +∞) gilt f ′ (x) = x12 e− x , und durch vollständige Induktion sieht man, dass (n ∈ N ∪ {0}) ! 1 −1 (n) f (x) = pn e x , x > 0. x für Polynome pn (x) vom Grad 2n. Nun gilt mit Hilfe der Regel von de L’Hospital Satz 7.2.14 lim f (n) (x) = lim x→0+ y→+∞ p′n (y) pn (y) p(2n) n (y) = lim = · · · = lim = 0, y y y→+∞ e y→+∞ e ey da p(2n) n (y) eine Konstante ist. Wir sehen insbesondere, dass f auf [0, +∞) stetig ist, und dass wegen limt→0+ f ′ (t) = 0 nach Korollar 7.2.17 f ′ (0)+ = 0. Wegen f ′ (0)− = 0 ist f auch bei 0 differenzierbar mit f ′ (0), und somit f ∈ C 1 (R). Wiederholte Anwendung dieses Argumentes auf f ′ , f ′′ usw. zeigt, dass f auf R beliebig oft differenzierbar ist, wobei f (n) (0) = 0, n ≥ 0. 7.3 Der Taylorsche Lehrsatz Wir wollen im folgenden eine gegebene Funktion f auf einem reellen Intervall I durch Polynome approximieren. Für hinreichend oft differenzierbare f werden wir das durch das sogenannte Taylorpolynom zu bewerkstelligen suchen. Eine Motivation des Taylorschen Lehrsatz ergibt sich aus folgenden Interpolationsüberlegungen. Die Gerade, die eine Kurve in einem Punkt am besten approximiert, ist die Tangente (falls sie existiert). Approximiert man die Kurve mit einem Polynom höheren Grades, so kann man hoffen, dass die Approximation genauer wird. Wir haben die Tangente gefunden (eigentlich definiert) als die Grenzlage von Sekanten durch die Punkte (x, f (x)) und (x + △x, f (x + △x)). Da eine Gerade durch zwei Punkte eindeutig bestimmt ist, sind diese Sekanten wohldefinierte Objekte. Ein Polynom vom Grade ≤ n ist eindeutig festgelegt durch die Vorgabe der Werte y0 , . . . , yn an n + 1 verschiedenen Stellen x0 , . . . , xn : n Y X x − xj yk · p(x) = . x − xj j∈{0,...,n}\{k} k k=0 Die Eindeutigkeit folgt aus der Tatsache, dass ein Polynom vom Grad ≤ n höchstens n Nullstellen hat. Betrachten wir nun n + 1 Punkte der Kurve f mit den x-Koordinaten x, x + △x, . . . , x + n△x, und legen ein Polynom p durch diese Punkte. Für große Schrittweiten △x wird das erhaltene Polynom nicht viel mit der Kurve zu tun haben, lässt man jedoch △x → 0 streben, so hofft man auf eine gute Approximation. 7.3.1 Satz (Newtonsche Interpolationsformel). Seien x, △x und Werte y0 , . . . , yn gegeben. Das Polynom, welches durch die Punkte (x, y0 ), (x + △x, y1 ), . . . , (x + n△x, yn ) geht, ist gleich p(x) = y0 + ... + (x − x0 ) △y0 (x − x0 )(x − x1 ) △2 y0 + ··· + 1! △x 2! △x2 (x − x0 )(x − x1 ) . . . (x − xn−1 ) △n y0 , n! △xn wobei wir x j = x + j△x gesetzt haben und △ j y0 die j-te Differenz bezeichnet. Diese ist rekursiv definiert als △yi = yi+1 − yi , △2 yi = △yi+1 − △yi , . . . . Beweis. Offenbar gilt p(x0 ) = y0 . Man erhält p(x1 ) = y0 + (x1 − x0 ) p(x j ) = y0 + (x j − x0 ) ... + △y0 △x = y0 + △x △y0 △x = y0 + (y1 − y0 ) = y1 . Allgemein gilt △y0 (x j − x0 )(x j − x1 ) △2 y0 + +... △x 2 △x2 (x j − x0 ) · · · (x j − x j−1 ) △ j y0 = j! △x j KAPITEL 7. DIFFERENTIALRECHNUNG 192 j△x( j − 1)△x △2 y0 △y0 j!△x j △ j y0 + = + ··· + △x 2 j! △x j △x2 ! ! ! ! j j j j = y0 + △y0 + △2 y0 + · · · + △ j y0 . 0 1 2 j = y0 + j△x Wir zeigen nun mittels Induktion die folgende Behauptung: Für je j + 1 Werte y0 , . . . , y j gilt die Formel yj = ! j X j l △ y0 . l l=0 Der Induktionsanfang j = 0 ist offensichtlich richtig. Sei die Formel also bereits gezeigt für je j Werte. Dann folgt ! j−1 ! j X X j l j l △ y0 + △ j y0 = △ y0 = y0 + l l l=1 l=0 = y0 + = y0 + ! !# j−1 " X j−1 j−1 + △l y0 + (△ j−1 y1 − △ j−1 y0 ) = l − 1 l l=1 ! ! j−1 j−1 X X j − 1 l−1 j−1 l (△ y1 − △l−1 y0 ) + △ y0 + (△ j−1 y1 − △ j−1 y0 ) = l−1 l l=1 l=1 j−2 X j − 1! △l y1 + △ j−1 y1 − = l l=0 | {z } =y j j−2 ! j−1 X X j − 1! j − 1 l △ y0 = y j △l y0 + △ j−1 y0 + y0 + − l l l=1 l=0 Ist f an der Stelle x differenzierbar, so gilt lim△x→0 △y0 △x = lim△x→0 f (x+△x)− f (x) △x ❑ = f ′ (x). Allgemein gilt: 7.3.2 Lemma. Sei f : [a, b] → R stetig und n-mal stetig differenzierbar auf (a, b). Ist x ∈ (a, b), so gilt (y j = f (x + j△x)) lim △x→0 (x−x ) △y (x−x )···(x−x △n y0 = f (n) (x). △xn ) △n y 0 n−1 0 Beweis. Sei p(x) = y0 + 1! 0 △x0 + . . . + n! △xn . Die Funktion h(x) := f (x) − p(x) hat die n + 1 Nullstellen x0 , · · · , xn (∈ (a, b) für △x hinreichend klein). Mit Korollar 7.2.4 folgt die Existenz von ξ ∈ (x0 , xn ) mit h(n) (ξ) = 0. Nun gilt 0 = h(n) (ξ) = f (n) (ξ) − p(n) (ξ) = f (n) (ξ) − Für △x → 0 folgt wegen der Stetigkeit von f (n) auch △n y0 △xn △n y0 . △xn → f (n) (x). ❑ Man erhält also als Grenzfall des in einem Punkt x0 approximierenden Polynoms gerade p(x) = f (x0 ) + (x − x0 ) f ′ (x0 ) + (x − x0 ) (n) (x − x0 )2 ′′ f (x0 ) + · · · + f (x0 ). 2 n! Wählt man den Grad von p immer größer, so wird (hoffentlich) p(x) die Kurve f (x) immer besser annähern. 7.3.3 Definition. Sei n ∈ N, I ⊆ R ein Intervall, y ∈ I fest und f : I → R (C). Weiters sei f mindestens n-mal differenzierbar bei y; vgl. Definition 7.1.15. Das Polynom (in der Variablen x) n X (x − y)k (k) f (y), T n (x) = k! k=0 nennt man dann das n-te Taylorsche Polynom an der Anschlussstelle y. Die Fehlerfunktion Rn (x) := f (x) − T n (x) nennt man das n-te Restglied. 7.3. DER TAYLORSCHE LEHRSATZ 193 Dass T n (x) eine gute Wahl ist, um ein reellwertiges f zu approximieren, folgt aus dem nun folgenden Satz, welcher eine Art Verfeinerung des Mittelwertsatzes ist. 7.3.4 Satz (Taylorscher Lehrsatz). Sei I ⊆ R ein Intervall, und sei n ∈ N ∪ {0}. Weiters sei f : I → R mit f ∈ C n (I) und so, dass f (n) am Inneren von I – also auf I ohne seine Randpunkte – differenzierbar ist, bzw. äquivalent dazu, dass f auf dem Inneren von I sicher n + 1-mal differenzierbar ist. Zu x, y ∈ I, x , y, gibt es immer ein ξ ∈ (min(x, y), max(x, y)), sodass sich das n-te Restglied Rn (x) = f (x) − T n (x) schreiben lässt als (Lagrange Form des Restgliedes) Rn (x) = (x − y)n+1 (n+1) f (ξ). (n + 1)! Beweis. Seien F, G : [min(x, y), max(x, y)] → R definiert durch F(t) = f (x) − n X (x − t)k k=0 k! · f (k) (t), G(t) = (x − t)n+1 . Voraussetzungsgemäß sind beide stetig auf [min(x, y), max(x, y)] und differenzierbar auf (min(x, y), max(x, y)), wobei G′ (t) = −(n + 1)(x − t)n , 0 für t ∈ (min(x, y), max(x, y)) und F ′ (t) = − n n X X (x − t)n (n+1) k(x − t)k−1 (k) (x − t)k (k+1) f (t) + f (t) = − f (t). k! k! n! k=1 k=0 Nach dem verallgemeinerten Mittelwertsatz, Satz 7.2.7, gibt es ein ξ (min(x, y), max(x, y)), sodass ∈ n (n+1) (ξ) − (x−ξ) f (n+1) (ξ) F(y) − F(x) F ′ (ξ) Rn (x) n! f = = = . = ′ n n+1 G(y) − G(x) G (ξ) −(n + 1)(x − ξ) (n + 1)! (x − y) ❑ 7.3.5 Bemerkung. Wählt man im obigen Beweis G(t) = (x−t) p für ein festes aber beliebiges p ∈ N, so erhält man mit derselben Argumentation ein ξ ∈ (min(x, y), max(x, y)), sodass f (n+1) (ξ) Rn (x) = (x − y) p (x − ξ)n−p+1 . n!p Stellt man ξ durch ξ = θx + (1 − θ)y für ein θ ∈ (0, 1) dar, so erhält man die Schlömilchsche Form f (n+1) (ξ) Rn (x) = (x − y)n+1 (1 − θ)n−p+1 . n!p des Restgliedes. Für p = n + 1 erhält man die Lagrange Form und für p = 1 die sogenannte Cauchysche Form des Restgliedes. 7.3.6 Fakta. Sei f : I → R (C) wie in Definition 7.3.3. 1. Man sieht unmittelbar durch Nachrechnen, dass T n (x) ein Polynom höchstens n-ten Grades ist, sodass T n (y) = f (y), T n′ (y) = f ′ (y), . . . , T n(n) (y) = f (n) (y). (7.9) Die höheren Ableitungen von T n verschwinden identisch, da es ein Polynom höchstens n-ten Grades ist. KAPITEL 7. DIFFERENTIALRECHNUNG 194 2. Ist p(x) ein weiteres Polynom höchstens n-ten Grades mit (7.9) (T n ersetzt durch p), so verschwinden die Ableitungen 0-ten bis n-ten Grades von q(x) = p(x) − T n (x) an der Stelle y. Wenden wir Satz 7.3.4 auf die reellen Funktionen Re q(x) und Im q(x) oder auch nur q(x), falls diese reell ist, an, so folgt wegen q(n+1) ≡ 0, dass q(x) = 0. Also definiert die Eigenschaft (7.9) das Polynom T n (x) eindeutig. 3. Ist f selber ein Polynom vom Grad m, so muss insbesondere f (x) = T n (x) für n ≥ m. 4. Für reellwertige Funktionen f gibt Satz 7.3.4 im Falle der Differenzierbarkeit von f (n) am Inneren von I eine Möglichkeit, das Restglied Rn (x) durch (x−y)n+1 (n+1) (ξ) auszudrücken. Das Problem dabei ist, dass man von ξ nur weiß, (n+1)! f dass es zwischen x und y liegt. Nichtsdestotrotz kann man manchmal f (n+1) so gut abschätzen, dass man sicher sagen kann, dass Rn (x) klein wird; vgl. auch Bemerkung 7.3.5. 5. Ist f beliebig oft differenzierbar, so kann man für jedes n ∈ N ∪ {0} das Taylorpolynom T n (x) an der Anschlussstelle y betrachten. Man erhält schließlich die Taylorreihe von f an der Anschlussstelle y: T (x) := ∞ X f (n) (y) (x − y)n . n! n=0 Das ist eine Potenzreihe mit Konvergenzradius R ∈ [0, +∞]. Hier können alle Fälle auftreten. 6. Ist R > 0, so konvergiert die Potenzreihe insbesondere auf (y − R, y + R). Nun kann T (x) auf (y − R, y + R) ∩ I mit der Ausgangsfunktion f (x) übereinstimmen; sie muss es aber nicht. Klarerweise ist T (x) = f (x), x ∈ (y − R, y + R) ∩ I genau dann, wenn Rn (x) → 0 für x ∈ (y − R, y + R) ∩ I. P n 7. Sei ∞ n=0 an z eine Potenzreihe mit Konvergenzradius R > 0, und betrachte die Funktion ∞ X f : (y − R, y + R) → C, f (t) = an (t − y)n . n=0 (l) Wir werden in Proposition 8.7.5 sehen, dass f (y) = l! · al , l ∈ N ∪ {0}. Die P n Taylorreihe von f an der Anschlussstelle y ist somit genau ∞ n=0 an (t − y) , und konvergiert daher auf (y − r, y + R). Das Restglied Rn (x) konvergiert dann klarerweise gegen 0. 7.3.7 Beispiel. Sei n ∈ N ∪ {0}, I ⊆ R ein Intervall, und f : I → R so, dass f ∈ C n (I) und dass f auf dem Inneren des Intervalls I sogar (n + 1)-mal differenzierbar ist. Gilt nun f (n+1) (ξ) = 0 für alle ξ im Inneren von I, so folgt Rn (x) = 0 und daher f (x) = T n (x) für alle x ∈ I. Kurz zusammengefasst bedeutet das, dass genau die Polynome vom Grad ≤ n alle möglichen Lösungen der Differentialgleichung f (n+1) (ξ) = 0, sind. Indem man f in Real- und Imaginärteil zerlegt, folgt diese Tatsache auch für komplexwertige f . 7.3. DER TAYLORSCHE LEHRSATZ 195 7.3.8 Beispiel. Sei f (t) = et . Dann gilt f (n) (t) = et , also f (n) (0) = 1. Wir erhalten ex = wobei Rn (x) = xn+1 ξ (n+1)! e x n X xk + Rn (x), k! k=0 mit ξ ∈ (0, x). Da e die Grenzfunktion einer Potenzreihe ist, – so wurde sie ja eingeführt – muss Rn (x) → 0, vgl. Fakta 7.3.6, 7. Man kann dieses Grenzverhalten aber auch unschwer durch eine elementare Abschätzung von Rn (x) erhalten. Betrachte die Funktion f (t) = ∞ X cos(2k t) . k! k=1 Differenziert man diese Reihe gliedweise, so erhält man ∞ ∞ X −2k sin(2k t) X −22k cos(2k t) , ,... k! k! k=1 k=1 P (2k )l für jedes l ∈ N konvergiert, sind sämtliche dieser Reihen Da ∞ k=1 k! gleichmäßig konvergent auf R. Wie wir später in Korollar 8.7.4 sehen werden, ist die Funktion f daher in jedem Punkt beliebig oft differenzierbar, und ihre Ableitungen werden durch obige Reihen dargestellt. Es gilt daher f ′ (0) = f ′′′ (0) = . . . = f (2k+1) (0) = . . . = 0, und f (2n) (0) = (−1)n ∞ X 22nk n = (−1)n (e4 − 1). k! k=1 Die Taylorreihe von f bei 0 ist also gleich n ∞ X (−1)n (e4 − 1) 2n x . (2n)! n=0 n Wendet man das Quotientenkriterium an, so erhält man (an = (−1)n (e4 −1) (2n)! x2n ) . an+1 (e4n 2 + 1)(e4n + 1) 2 = x −→ ∞, x , 0. an (2n + 2)(2n + 1) Diese Reihe ist für kein x (außer im Trivialfall x = 0) konvergent. Das Taylorpolynom T n (x) der Funktion f aus Beispiel 7.2.20 stets identisch Null. Also ist f ein Beispiel für eine C ∞ -Funktion, deren Taylorreihe bei der Anschlussstelle 0 auf ganz R konvergiert, aber nicht mit f übereinstimmt. Wir haben gesehen, dass für eine differenzierbare Funktion f , welche an einer Stelle x ein lokales Extremum besitzt, f ′ (x) = 0 gelten muss. Wie das Beispiel f (t) = t3 zeigt, gilt die Umkehrung im Allgemeinen nicht. Aus dem Taylorschen Satz erhält man unmittelbar eine hinreichende Bedingung für ein lokales Extremum. KAPITEL 7. DIFFERENTIALRECHNUNG 196 7.3.9 Korollar. Für m ∈ N, m > 1 sei f : (c, d) → R eine zumindest m-mal differenzierbare Funktion, x ∈ (c, d), f (m) bei x stetig, und gelte f ′ (x) = f ′′ (x) = . . . = f (m−1) (x) = 0, f (m) (x) , 0. Ist m gerade, so ist x ein lokales Extremum von f , und zwar ein lokales Minimum falls f (m) (x) > 0 und ein lokales Maximum falls f (m) (x) < 0. Ist dagegen m ungerade, so ist x sicher kein lokales Extremum von f . Beweis. Gemäß Satz 7.3.4 mit Anschlussstelle x und n + 1 = m gilt für t ∈ (c, d) mit einer geeigneten Zwischenstelle ξ zwischen t und x f (t) = f (x) + (t − x)m (m) f (ξ) . m! Ist f (m) (x) > 0, so gilt für ξ in einer hinreichend kleinen Umgebung (x − δ, x + δ) von x ebenfalls f (m) (ξ) > 0. Da ξ zwischen t und x liegt, folgt aus t ∈ (x − δ, x + δ), dass für gerades m (t − x)m (m) f (ξ) > 0 . m! Somit folgt f (t) > f (x), und x ist ein lokales Minimum. Ist m ungerade, so hat (t − x)m für t < x ein anderes Vorzeichen als für t > x. Also ist x kein lokales Extremum. Ganz analog verläuft die Argumentation für f (m) (x) < 0. ❑ 7.3.10 Beispiel. Mit den bisher gesammelten Ergebnissen lassen sich sogenannte Kurvendiskussionen von Funktionen durchführen. f 4 Man betrachte z.B. die Funktion f (x) = x x auf (0, +∞). 3 2 1 0 1 e 1 2 Zunächst ist diese Funktion stetig und beliebig oft differenzierbar. Klarerweise ist sie immer positiv, hat also keine Nullstellen. Um die lokalen Extrema zu finden, betrachte f ′ (x) = x x (1 + ln x), f ′′ (x) = x x−1 + x x (1 + ln x). Die einzige Nullstelle von f ′ (x) ist 1e . Da f ′′ ( 1e ) > 0 folgt aus Korollar 7.3.9, dass diese Stelle ein lokales Minimum ist. Für 0 < x < 1e ist f ′ (x) < 0 also dort monoton fallend, und für 1e < x ist f ′ (x) > 0, also dort monoton wachsend, vgl. Korollar 7.2.9. Insbesondere ist 1e ein absolutes Minimum von f auf (0, +∞). 7.4. STAMMFUNKTION 197 Schließlich haben wir in Beispiel 7.2.16 gesehen, dass limx→0+ f (x) = 1. Wegen x x ≥ e x , x ≥ e gilt auch die Beziehung lim x→+∞ f (x) = +∞. 7.3.11 Beispiel. Wir wollen die Funktion f : (0, +∞) → R f (x) = (1 − ln x)2 − x(3 − 2 ln x). aus Beispiel 7.2.5 weiter diskutieren, für die wir schon berechnet haben, dass ln x − 1 2 4 − 2 ln x + 2x 1 1 + = . f ′ (x) = 2(ln x − 1) + 2 ln x − 1, f ′′ (x) = 2 2 − 2 x x x2 x x2 Zudem haben wir festgestellt, dass f ′′ (x) > 0 für x ∈ (0, +∞) und dass f genau zwei Nullstellen ξ, η hat, wobei 0 < ξ < 1 < η < +∞. Nach dem Satz von Rolle hat dann auch f ′ mindestens eine Nullstelle x0 mit ξ < x0 < η. Wegen f ′′ (x) > 0 und dem Satz von Rolle kann es davon aber nur ein geben, und mit Korollar 7.3.9 erkennen wir aus f ′′ (x0 ) > 0, dass x0 ein lokales Minimum von f ist. In der Tat muss f ′ wegen f ′′ (x) > 0 streng monoton wachsen. Außerdem gilt wegen ′ f (x) ≤ − 1x für x ∈ (0, 1) lim f ′ (x) = −∞, x→0+ ′ und wegen f (x) ≥ 2 ln x − 1 für x > e lim f ′ (x) = +∞. x→+∞ Daraus erkennen wir auch, dass f eine eindeutige Nullstelle haben muss. Wegen der Monotonie von f ′ gilt f ′ (s) < f ′ (x0 ) = 0 < f ′ (t) für 0 < s < x0 < t < +∞. Also ist f auf (0, x0 ) monoton fallend und auf (x0 , +∞) monoton wachsend, weshalb x0 sogar ein globales Minimum von f sein muss. 7.4 Stammfunktion Bei der Integration von Funktionen wird es wichtig sein, zu einer gegebenen Funktion f : [a, b] → R (C) – falls möglich – eine Funktion F : [a, b] → R (C) zu finden, sodass F′ = f . 7.4.1 Definition. Sei I ⊆ R ein Intervall und f : I → R (C). Wir nennen eine Funktion F : I → R (C) eine Stammfunktion von f , wenn F ′ (x) = f (x) für alle x ∈ I. Hat ein f mindestens eine Stammfunktion, so heißt die Gesamtheit aller StammR funktionen von f das unbestimmte Integral von f und wird durch f bezeichnet. 7.4.2 Bemerkung. Mit F ist offensichtlicherweise auch F + c für jedes c ∈ R (C) eine Stammfunktion von f . Sind umgekehrt F1 , F2 zwei Stammfunktionen der selben Funktion f , so gilt (F1 − F2 )′ ≡ 0 auf I. Nach Korollar 7.2.9 bzw. Bemerkung 7.2.11 ist F1 − F2 eine Konstante. Somit gibt es bis auf additive Konstanten eine eindeutige Stammfunktion F, und Z f = {F + c : c ∈ R (C)}. KAPITEL 7. DIFFERENTIALRECHNUNG 198 7.4.3 Beispiel. Ist f : R \ {0} → R gegeben durch f (x) = 1x , so überzeugt man sich sofort, dass F : R \ {0} → R, F(x) = ln |x| die Gleichung F ′ (x) = f (x) für alle x ∈ R \ {0} erfüllt. Für die Funktion G : R \ {0} → R, G(x) = sgn(x) + ln |x| gilt ebenfalls G′ (x) = f (x) für alle x ∈ R \ {0}. Dieser scheinbare Widerspruch zu Bemerkung 7.4.2 lässt sich dadurch erklären, dass R \ {0} ja kein Intervall ist – Korollar 7.2.9 lässt sich darauf also nicht anwenden. Zum Aufsuchen von Stammfunktionen gegebener Funktionen ist folgendes Resultat sehr hilfreich. 7.4.4 Lemma. Seien I, J ⊆ R Intervalle und f, g : I → R (C), sowie α, β ∈ R (C). Weiters sei h : J → I differenzierbar. (i) Haben f und g Stammfunktionen, so auch α f + βg, wobei Z Z Z (α f + βg) = α f +β g . (ii) Sind f und g differenzierbar auf I, sodass f ′ g eine Stammfunktion hat, dann hat auch f g′ eine solche, und Z Z f ′g = f g − f g′ , Regel von der Partiellen Integration. (7.10) (iii) Mit f hat auch ( f ◦ h) · h′ : J → R (C) eine Stammfunktion, wobei Z Z ! (( f ◦ h) · h′ ) = f ◦ h, (Substitutionsregel) Diese drei Beziehungen sind so zu verstehen, dass wenn funktion steht, die Gleichheit bis auf eine Konstante gilt. R · · · für jeweils eine Stamm- Beweis. (i) Sind F und G Stammfunktionen von f und g, so folgt (αF + βG)′ = αF ′ + βG′ = α f + βg. Also ist αF + βG eine Stammfunktion von α f + βg. (ii) Ist H Stammfunktionen von f ′ g, so folgt aus der Produktregel ( f g − H)′ = ( f ′ g + f g′ ) − f ′ g = f g′ . Somit ist f g − H Stammfunktionen von f g′ , und es gilt (7.10). (iii) Ist F Stammfunktionen von f , so folgt aus der Kettenregel in Satz 7.1.9 bzw. Bemerkung 7.1.10, dass (F ◦ h)′ = ( f ◦ h) · h′ . Also ist F ◦ h Stammfunktion von ( f ◦ h) · h′ . ❑ 7.4.5 Bemerkung. Zur Substitutionsregel gibt es folgende Merkregel: Seien I, J ⊆ R wieder Intervalle, f : I → R (C), und h : J → I differenzierbar. Schreiben wir x = h(t) mit t ∈ J und formal dx = h′ (t) dt, so erhält man aus Z ! Z f (x) =: f (x)dx 7.4. STAMMFUNKTION 199 durch Ersetzen von x durch h(t) und dx durch h′ (t) dt Z Z f (h(t)) · h′ (t) dt := (( f ◦ h) · h′ ). Wie gesagt ist das eine Merkregel, die sich beim Bestimmen konkreter Stammfunktionen aber als durchaus praktikabel und übersichtlich herausgestellt hat, siehe etwa Beispiel 7.4.9. 7.4.6 Beispiel. Man kann die Substitutionsregel verwenden, um einfache Differentialgleichungen der Form y′ (t) · f (y(t)) = g(t), t ∈ I, (7.11) zu lösen. Hier sind I, J ⊆ R Intervalle und f : J → R sowie g : I → R stetige Funktionen. Angenommen man hat eine Funktion y : I → J ⊆ R, welche (7.11) erfüllt. Hat f eine Stammfunktion F, so ist nach der Substitutionsregel die Funktion F ◦ y eine Stammfunktion von t 7→ y′ (t) · f (y(t)) und daher auch von g. Kennt man andererseits eine Stammfunktion G von g explizit, so folgt F ◦ y = G + c für eine Konstante c ∈ R. Also hat man eine implizite Beschreibung von y(t). In manchen Fällen lässt sich diese Gleichung nach y auflösen, wodurch man y(t) explizite beschreiben kann. Diese hier beschriebene Methode nennt man auch Trennung der Variablen . 7.4.7 Beispiel. Man betrachte die Differentialgleichung y′ (t) = y(t), t ∈ R. Eine reellwertige Lösung y dieser Differentialgleichung ist y ≡ 0. Angenommen y ist eine weitere reellwertige Lösung mit y(t0 ) < 0 für ein t0 ∈ R. Wegen der Stetigkeit gilt y(t) < 0 für alle t ∈ (t0 − ǫ, t0 + ǫ) =: I. Ist f : I → (−∞, 0) die Funktion f (η) = η1 , so gilt für t ∈ I, y′ (t) · 1 = y′ (t) · f (y(t)) = 1. y(t) Eine Stammfunktion von f ist F(η) = ln(−η), also ist t 7→ ln(−y(t)) eine Stammfunkti1 auf I. Von 1 ist t 7→ t eine Stammfunktion. Es folgt ln(−y(t)) = t+c, t ∈ on von y′ (t)· y(t) I, und weiter y(t) = −ec · et . Also muss y(t) = d · et , t ∈ I für ein reelles d ∈ (−∞, 0). Man beachte, dass wir von der Gültigkeit von y′ (t) = y(t) auf y(t) = d · et , t ∈ I, geschlossen haben, wir uns also zunächst nicht sicher sein können, dass diese Funktion tatsächlich y′ (t) = y(t) löst. Durch Einsetzen zeigt man aber sofort, dass tatsächlich y(t) = d · et , t ∈ R, eine Lösung ist. Wir werden nun einige Funktionstypen auflisten und angeben, wie man die unbestimmten Integrale von diesen bestimmt. (i) Ist Rf (x) = xn , n ∈ N ∪ {0} auf R, so ist F(x) = 1 n+1 ist xn = n+1 x + c. 1 n+1 n+1 x eine Stammfunktion. Also (ii) Ist f (x) = x−n , n ∈ N, n > 1 auf (−∞, 0) oder (0, +∞), so ist F(x) = eine Stammfunktion. 1 −n+1 −n+1 x KAPITEL 7. DIFFERENTIALRECHNUNG 200 (iii) Ist f (x) = x−1 , auf (−∞, 0) oder (0, +∞), so ist F(x) = ln |x|, x , 0 eine Stammfunktion. (iv) Um die Stammfunktion von ln x, x > 0 zu ermitteln, wenden wir die Partielle Integration an: Z Z Z 1 ′ ln(x) = (x ) ln(x) = x ln(x) − x = x(ln(x) − 1) + c. x R sinh x = cosh x + c, cosh x = sinh x + c. R R (vi) sin x = − cos x + c, cos x = sin x + c. (v) R e x = e x + c, R (vii) Sei n ∈ N, n ≥ 2. Mit partieller Integration sieht man Z Z Z n n−1 n−1 cos t = (cos t) · (cos t) = (cos t)(sin t) + (n − 1) (cosn−2 t)(sin t)2 = n−1 (cos t)(sin t) + (n − 1) Z n−2 (cos t) − (n − 1) Z (cosn t). Also erhält man die Rekursionsgleichung Z Z 1 n−1 cosn t = (cosn−1 t)(sin t) + (cosn−2 t). n n (viii) Mit Hilfe von (i) und der Substitutionsregel folgt (k ∈ N, k > 1) Z Z a a a = a ln |x − b| + c, = + c, k (x − b) (x − b) (−k + 1)(x − b)k−1 wobei man diese Funktionen auf einem Intervall betrachtet, das b nicht enthält. R 1 sin : (− π2 , π2 ) → R). (ix) 1+x2 = arctan x + c. (Umkehrfunktion von tan = cos R x 2 ′ (x) Um 1+x 2 zu ermitteln, wende man die Substitutionsregel auf h(x) = x , h (x) = 1 2x und f (y) = 1+y an: Z x 1 = 2 2 1+x Z 2x 1 = 2 2 1+x Z 1 1+y ! = y=x2 1 1 (ln |1 + y|)y=x2 = ln |1 + x2 |. 2 2 R 1 1 (xi) Ganz ähnlich sieht man (1+xx 2 )k = 2(1−k) für k ∈ N, k > 1. (1+x2 )k−1 R (xii) (1+x1 2 )k , k ∈ N, k > 1 lässt sich rekursiv berechnen, indem man t = arctan x ∈ (− π2 , π2 ) substituiert Z Z Z Z 1 1 1 1 = · = = cos2k−2 t = (1 + x2 )k (1 + x2 )k−1 (1 + x2 ) (tan2 t + 1)k−1 Z 2k − 3 1 (cos2k−2 t) · (tan t) + (cos2k−4 t) = 2k − 2 2k − 2 Z 1 x 1 2k − 3 · + . 2k − 2 (1 + x2 )k−1 2k − 2 (1 + x2 )k−1 7.4. STAMMFUNKTION (xiii) Ist nun allgemein f (x) = (D := q − p2 4 201 x+d , (x2 +px+q)k und hat x2 + px + q keine reellen Nullstellen > 0), so schreibe f (x) = (x + 2p ) + (d − 2p ) . 2 ((x + 2p )2 + q − p4 )k R √ Um f (x) zu berechnen, substituiere Dy − 2p = x(y): √ Z Z Dy + D(d − 2p ) 1 f (x) = k . D (1 + y2 )k Dieses Integral lässt sich mit Hilfe der oben behandelten Funktionen lösen. (xiv) Zu guter letzt noch Stammfunktion von C-wertigen Funktionen (w ∈ C): Z Z 1 eix = −ieix + c, ewx = ewx + c, w Z Z 1 wx x wx 1 x e = e − 2 ewx + c. xewx = ewx − w w w w P(x) Um die Stammfunktion einer beliebigen rationalen Funktion R(x) = Q(x) , wobei P(x) und Q(x) zwei reelle Polynome sind, zu ermitteln, werden wir diese in eine Summe von Funktionen entwickeln, deren Stammfunktionen wir eben kennengelernt haben. Als erstes folgt aus dem Euklidischen Algorithmus, dass P(x) = S (x)Q(x) + T (x), wobei S (x) und T (x) reelle Polynome sind, und wobei der Grad von T (x) kleiner als der von Q(x) ist. R R T (x) T (x) ist daher S (x) + Q(x) . Das erste Integral Das Integral von R(x) = S (x) + Q(x) T (x) errechnet man leicht mit Hilfe von (i). Für das zweite müssen wir Q(x) weiter zerlegen. Dazu betrachten wir zuerst die auftretenden Polynome als komplexe Polynome. Das hat den Vorteil, dass sich jedes komplexe Polynom bis auf eine Konstante als Produkt von Faktoren (z − z j ) schreiben lässt. 7.4.8 Satz. Seien T (z), Q(z) zwei komplexe Polynome, sodass der Grad n von Q(z) größer als der von T (z) ist. Schreiben wir Q(z) = an zn + · · · + a0 mit an ∈ C \ {0} als Q(z) = an (z − z1 )ν1 · · · · · (z − zm )νm , wobei zi , z j wenn i , j und wobei ν1 , . . . , νm ∈ N, ν1 + · · · + νm = n, so gibt es eindeutige Zahlen a jk ∈ C, sodass (z ∈ C \ {z1 , . . . , zm }) ν j m T (z) X X a jk = . Q(z) (z − z j )k j=1 k=1 Beweis. Unser Problem ist äquivalent zur Existenz und Eindeutigkeit von Zahlen a jk , sodass für z ∈ C νj m X m X Y 1 T (z) = a jk (z − z j )ν j −k (z − zl )νl . an j=1 k=1 l=1,l, j (7.12) KAPITEL 7. DIFFERENTIALRECHNUNG 202 Betrachte den Vektorraum Cn−1 [z] aller komplexen Polynome vom Grad kleiner n. Dieser hat Dimension n. Kann man nun zeigen, dass die n Stück Polynome (z − z j )ν j −k m Y (z − zl )νl , j = 1, . . . , m, k = 1, . . . , ν j , l=1,l, j linear unabhängig in Cn−1 [z] sind, so bilden sie sogar eine Basis, und unser Satz folgt sofort aus der Linearen Algebra. Wäre m Y X λ jk (z − z j )ν j −k (z − zl )νl = 0, j=1,...,m,k=1,...,ν j l=1,l, j und setzt man z = z1 , . . . , zm , so erhält man λ1ν1 = · · · = λmνm = 0. Nun kann man Qm j=1 (z − z j ) durchdividieren und erhält X j=1,...,m;k=1,...,ν j −1 λ jk (z − z j )ν j −1−k m Y (z − zl )νl −1 = 0. l=1,l, j Wiederholt man obige Argumentation, so folgt λ j(ν j −1) = 0 für alle j ∈ {1, . . . , m}, ν j > 1, usw. bis man schließlich λ jk = 0 für alle j = 1, . . . , m, k = 1, . . . , ν j erhält. ❑ Aus (7.12) sehen wir auch, wie man die Zahlen a jk gewinnen kann. In der Tat, kann man alle auftretenden Polynome ausmultiplizieren, und vergleicht dann die Koeffizienten, die bei jedem zk links und rechts vom Gleichheitszeichen stehen. Diese müssen übereinstimmen, und so erhält man n Gleichungen für n Unbekannte. Etwas weniger Arbeit hat man, wenn man den eben gebrachten Beweisgedanken einfließen lässt. Man kann nämlich in (7.12) nacheinander z = z1 , . . . , zm setzen und erhält so a jν j ganz leicht. Wir kehren zu unseren reellen Polynomen T (x) und Q(x) zurück. Wenn wir auf diese Satz 7.4.8 anwenden, hat das den Nachteil, dass man eine Partialbruchzerlegung mit möglicherweise nicht nur reellen Komponenten erhält. Um das wieder zu reparieren, schließt man zuerst aus Q(z̄) = Q(z) – Q(z) hat ja reelle Koeffizienten –, dass mit z j auch z̄ j eine Nullstelle von Q(z) ist, und dass diese die gleiche Vielfachheit ν j haben. Somit sind die Nullstellen von Q(z) von der Form x1 , . . . , x p , z1 , . . . zq , z̄1 , . . . z̄q , wobei x j ∈ R und z j ∈ C+ := {z ∈ C : Im z > 0}. Die Partialbruchzerlegung aus Satz 7.4.8 lässt sich nun schreiben als ! µj p νj q X X c jk b jk T (z) X X a jk = . + + Q(z) (z − x j )k j=1 k=1 (z − z j )k (z − z̄ j )k j=1 k=1 T (z̄) T (z) = Q(z) , folgt aus der Eindeutigkeit der komplexen PartialbruchzerleDa aber auch Q(z̄) gung a jk ∈ R und c jk = b̄ jk , und man erhält ! ! c jk b j (z − z̄ j )k + b̄ j (z − z j )k b jk = , + (z − z j )k (z − z̄ j )k (z2 − 2z Re(z j ) + |z j |2 )k wobei die Polynome in Zähler und Nenner reell sind. Summiert man nun über k auf, und bringt die Summe auf gemeinsamen Nenner, so erhält man eine Funktion der Form T j (z) , (z2 + B jz + C j )µ j 7.4. STAMMFUNKTION 203 wobei T j (z) ein reelles Polynom mit Grad kleiner 2µ j ist, und B j = −2 Re(z j ), C j = |z j |2 . Durch wiederholte Anwendung des Euklidischen Algorithmus kann man dieses Polynom als µj X T j (z) = (d jk z + e jk )(z2 + B j z + C j )µ j −k k=1 anschreiben. Somit folgt die Zerlegung ν µ j j XX d jk z + e jk T (z) X X a jk = + , k 2 + B z + C )k Q(z) (z − x ) (z j j j j=1 k=1 j=1 k=1 p q (7.13) welche nur reellen Zahlen beinhaltet. Dabei haben die z2 + B j z + C j klarerweise keine reellen Nullstellen. Zur Praktischen Berechnung der Koeffizienten a jk in (7.13) multipliziert man Q(z) links und rechts, und führt einen Koeffizientenvergleich durch. Durch Einsetzen von z = x j lassen R T (x)sich die a jν j auch schneller berechnen. Um Q(x) zu berechnen, genügt es nun die einzelnen Summanden in der Partialbruchzerlegung zu integrieren, und diese dann zu summieren. R 7.4.9 Beispiel. Wir wollen das Integral tan x dx auf einem Intervall I berechnen, wobei keine Nullstelle von cos x enthalten darf: Z Z Z 1 sin x i − dx =h dt = tan x dx = t=cos x cos x t dt=− sin xdx = − ln |t| + C = − ln | cos x| + C . Diese Methode beruht darauf, dass unser Integrand von der Gestalt f (t(x)) t′ (x) ist, und noch dazu mit einer sehr einfachen Funktion f . Daher können wir die Substitutionsregel unmittelbar anwenden und die entstehende Funktion leicht integrieren. R 7.4.10 Beispiel. Wir wollen das Integral x2 sin x dx auf einem beliebigen Intervall berechnen. Wir verwenden partielle Integration: Z Z Z 2 2 2 x sin x dx = x (− cos x) − 2x(− cos x) dx = −x cos x + 2 x cos x dx = = −x2 cos x + 2 x sin x − Z sin x dx = −x2 cos x + 2x sin x + 2 cos x + C Mit dieser Methode kann man zum Beispiel alle Integrale von der Form Z Z Z P(x)e x dx, P(x) sin x dx, P(x) cos x dx , mit einem Polynom P berechnen. 7.4.11 Beispiel (Integration von R(e x )). Hat man eine Funktion f der Gestalt f (x) = R(e x ), wobei R eine rationale Funktion ist, so kann man deren Integral stets mit Hilfe der Substitution t = e x auf das Integral einer rationalen Funktion bringen. Denn es gilt, mit t = e x , Z Z 1 x R(t) dt R(e ) dx =h t=ex i t dt=e x dx dx= 1t dt 204 KAPITEL 7. DIFFERENTIALRECHNUNG 7.4.12 Beispiel. Wir wollen das Integral R Z e2x − 1 dx = ex + 2 Z e2x −1 e x +2 dx auf R berechnen. Zunächst gilt (e x )2 − 1 dx =h ex + 2 t=e x dx= 1t dt Z i t2 − 1 1 · dt t+2 t Man beachte, dass nach der Substitution t(x) = t in (0, +∞) liegt; also immer positiv ist. Nun haben wir ein Integral einer rationalen Funktion auf (0, +∞) zu berechnen. Dazu schreiben wir t2 + 2t − 2t − 1 2t + 1 t2 − 1 1 t2 − 1 = =1− · = 2 t+2 t t(t + 2) t + 2t t2 + 2t und versuchen nun den zweiten Summanden in Partialbrüche zu zerlegen: A B (A + B)t + 2A 2t + 1 = + = t(t + 2) t t+2 t(t + 2) Koeffizientenvergleich führt auf A = 1 2 und B = 32 . Also haben wir 1 3 t2 − 1 1 · =1− − t+2 t 2t 2(t + 2) und daher Z t2 − 1 1 1 3 · dt = t − ln t − ln(t + 2) = t+2 t 2 2 = ex − x 3 − ln(e x + 2) 2 2 7.4.13 Beispiel (Integration von R(sin x, cos x)). Hat man eine Funktion f der Gestalt f (x) = R(sin x, cos x), wobei R eine rationale Funktion ist, so kann man deren Integral stets mit Hilfe der Substitution t = tan 2x auf das Integral einer rationalen Funktion bringen. Denn es gilt, mit t = tan 2x , x sin x = 2 sin cos x = cos2 2 tan 2 x x cos = 2 2 1 + tan2 x 2 x 1 − tan2 x − sin2 = 2 2 1 + tan2 = x 2 x 2 2t 1 + t2 = 1 − t2 1 + t2 1 x 2 dt dt = (1 + tan2 ) also dx = dx 2 2 1 + t2 Literaturverzeichnis [EL] K.Endl,W.Luh: Analysis I-III, Aula Verlag, Wiesbaden 1986. [F] G.M.Fichtenholz: Differential- und Integralrechnung I-III, Deutscher Verlag der Wissenschaften, Berlin 1964. [H] H.Heuser: Lehrbuch der Analysis 1,2, Teubner Verlag, Stuttgart 1989. [L] S.Lang: A first course in calculus, Springer Verlag, Heidelberg 1986. [R] W.Rudin: Principles of Mathematical Analysis, McGraw-Hill, New York 1953, third edition 1976. [W] W.Walter: Analysis 1, Springer Verlag, Heidelberg, New York Tokoyo. 205 Index C(I), 181 C(X, Y), 129 C 0 (I), 181 C ∞ (I), 181 C n (I), 181 Cb (E, Y), 152 C[z], 166 R, 40 Z, 26 ǫ-Kugel, 97 limi∈I xi , 110 limt→+∞ f (t), 127 limt→−∞ f (t), 127 limt→z f (t), 124 limz→∞ f (z), 128 P, 33 B(E, Y), 147 d(x, y), 52 d1 (x, y), 54 d2 (x, y), 52 d∞ ( f, g), 147 d∞ (x, y), 55 C+ , 202 Q, 34 R[x], 75 C, 46 Cn−1 [z], 202 N, 16 überall definiert, 4 Abbildung, 4 identische, 4 isometrische, 129 Abel Kriterium, 87 Abelscher Grenzwertsatz, 172 Ableitung einer Funktion, 180 höhere, 181 im Punkt x, 175 linksseitige, 175 rechtsseitige, 175 Abschluss, 99 absolut konvergent, 83 Addition, 9, 20 alternierende harmonische Reihe, 83 analytisch, 157 analytisch in einem Punkt, 157 Anschlussstelle, 192 Antisymmetrie, 12 Arcuscosinus, 169 Funktionsgraph, 169 Arcuscotangens, 169 Funktionsgraph, 169 Arcussinus, 169 Funktionsgraph, 169 Arcustangens, 169 Funktionsgraph, 169 Areacosinus Hyperbolicus, 170 Funktionsgraph, 171 Areacotangens Hyperbolicus, 171 Funktionsgraph, 172 Areasinus Hyperbolicus, 170 Funktionsgraph, 171 Areatangens Hyperbolicus, 171 Funktionsgraph, 172 Assoziativität, 7, 20 Auswahlaxiom, 62 Axiome, 9 Bernoullische Ungleichung, 19 beschränkt, 13 nach oben, 13 nach unten, 13 beschränkte Folge, 60 Menge, 60 Betrag komplexer Zahlen, 48 bijektiv, 6 Bildmenge, 5 Cauchy-Folge, 69 206 INDEX Cauchy-Netz, 114 Cauchy-Schwarzsche Ungleichung, 53 Cauchysches Konvergenzkriterium Folgen, 70 Reihen, 82 Cauchysches Restglied, 193 Charakteristik, 38 Cosinus, 158 Funktionsgraph, 163 Cosinus Hyperbolicus, 169 Funktionsgraph, 170 Cotangens, 168 Funktionsgraph, 168 Cotangens Hyperbolicus Funktionsgraph, 171 Dedekindscher Schnitt, 44 Definitionsbereich, 5 Definitionsmenge, 4 dicht, 99 Dichteeigenschaft, 39 Differentialgleichung, 194, 199 Differentialgleichungen Trennung der Variablen, 199 Differenz, 2 differenzierbar n-mal, 181 im Punkt x, 175 rechtsseitig, 175 stetig, 181 Dirichlet Kriterium, 86 diskrete Metrik, 55 Distributivgesetz, 3 Distributivität, 20 divergent, 56, 78 bestimmt, 73 Dividieren mit Rest, 33 domain, 5 Doppelreihen, 121 Dreiecksungleichung, 16, 52 Dreiecksungleichung nach unten, 16 Einheitskreislinie, 102, 137 Einschränkung, 5 Elemente, 1 endlich, 25 Euklidischer Algorithmus, 201, 203 Eulersche Exponentialfunktion, 123 Eulersche Zahl, 67, 161 Existenz des neutralen Elementes, 20 207 Exponentialfunktion, 123, 158 Funktionsgraph, 160 Extremum absolutes, 182 lokales, 182 faktorielle, 85 Folge, 56 Cauchy-Folge, 69 monoton fallende, 66 monoton wachsende, 65 monotone, 66 Rechenregeln für, 62 streng monoton fallend, 62 Formel von de Moivre, 158 Fortsetzung, 5 Funktion, 4 beschränkte, 60, 147 bijektive, 6 Einschränkung, 5 Fortsetzung, 5 injektive, 6 monoton fallende, 143 monoton wachsende, 143 stetige, 129 streng monoton fallende, 30, 143 streng monoton wachsende, 30, 143 surjektive, 6 unstetige, 141 zusammengesetzte, 7 Funktionen trigonometrische, 158 Funktionswert, 4 Gaußklammer, 127 Gaußsche Zahlenebene, 48 gerichtete Menge, 108 Graph, 4 Grenzwert einer Funktion, 124 einseitige, 126 linksseitiger, 126 rechtsseitiger, 126 Häufungspunkt einer Folge, 104 einer Menge, 99 harmonische Reihe, 82 hebbare Unstetigkeit, 141 Hintereinanderausführung, 7 INDEX 208 imaginäre Einheit, 46 Imaginärteil, 46 Induktions -anfang, 19 -prinzip, 19 -schritt, 19 Varianten d., 24 Infimum, 13 injektiv, 6 Integral unbestimmtes, 197 Intervall, 136 Involution, 27 isolierter Punkt, 99 isometrische Abbildung, 129 Körper angeordneter, 12 archimedisch angeordneter, 39 vollständig angeordneter, 40 Kürzungsregel, 20 kartesisches Produkt, 2 Kommutativität, 20 kompakt, 106 Komplement, 2 komplex differenzierbar, 177 konjugiert komplexen, 48 konvergent, 56, 78 absolut, 83 bedingt, 118 gegen ±∞, 73 gegen x, 56 gleichmäßig, 148 punktweise, 146 Konvergenz gleichmäßige einer Funktionenfolge, 148 absolute einer Funktionenreihe, 153 einer Folge, 56 eines Netzes, 110 gleichmäßige einer Funktionenreihe, 153 komponentenweise, 71 punktweise einer Funktionenfolge, 146 punktweise einer Funktionenreihe, 153 unbedingte, 115 Konvergenzradius, 154 Kurvendiskussionen, 196 Lagranges Restglied, 193 leere Menge, 1 Leibniz Kriterium, 87 Lemma vom iterierten Supremum, 43 Limes Inferior, 67 Limes Superior, 67 linksstetig, 140 Logarithmus natürlicher, 160 naturalis, 160 Logarithmus naturalis Funktionsgraph, 161 lokale Eigenschaft, 131 Mächtigkeit, 25 Majorantenkriterium, 82 Maximum, 13 absolutes, 182 lokales, 182 Menge, 1 abgeschlossene, 99 Bild, 5 Differenz-, 2 Distributivgesetz-, 3 leere, 1 Ober-, 1 offene, 98 Potenz-, 3 Schnitt-, 2 Teil-, 1 Vereinigungs-, 2 zusammenhängende, 136 Mengen getrennte, 136 Mengengleichheit, 1 Metrik, 52 euklidische, 52 Supremums-, 147 metrischer Raum vollständiger, 69 Minimum, 13 absolutes, 182 lokales, 182 Minkowskische Ungleichung, 53 Minorantenkriterium, 82 Mittel arithmetisches, 12 Mittelwertsatz, 184 monoton fallend, 66, 143 monoton wachsend, 65, 143 INDEX Moore-Smith-Folge, 110 Multiplikation, 9, 20 Nachfolgerabbildung, 16 natürliche Zahlen, 16 Netz, 110 Cauchy-, 114 Teilfolge, 111 Teilnetz, 111 Norm, 56 obere Schranke, 13 Obermenge, 1 Partialbruchzerlegung komplexe, 201 reelle, 203 Partialsumme, 78 Pi, 163 Polarkoordinaten, 164 Polynom trigonometrisches, 167 Potenzmenge, 3 Potenzreihe, 157 Potenzreihen, 154 Primfaktorzerlegung, 33 Primzahl, 33 Produktregel, 178 Quotientenkörper, 39 Quotientenkriterium, 85 Quotientenregel, 178 Raabe Kriterium, 88 range, 5 Raum metrischer, 52 Realteil, 46 rechtsstetig, 140 Reflexivität, 12 Regel von de L’Hospital, 186 Regel von der Partiellen Integration, 198 Reihe, 78 alternierende harmonische, 83 bestimmt divergente, 79 divergente, 78 geometrische, 59 harmonische, 82 konvergent gegen ±∞, 79 konvergente, 78 Potenzreihen, 154 209 Rechenregeln für, 79 Summe der, 78 Teleskop-, 81 Relationen, 7 Relationenprodukt, 7 Riemann-Zerlegung, 110 Riemannscher Umordnungssatz, 120 Satz 1. Mittelwertsatz der Differenzialrechnung, 184 2. Mittelwertsatz der Differenzialrechnung, 184 Cauchysches Konvergenzkriterium, 70, 82 Einschluss-, 61 Fundamentalsatz der Algebra, 166 Grenzwert- Abelscher, 172 Leibniz Kriterium, 87 Rekursions-, 17 Riemannscher Umordnungs-, 120 Taylorscher Lehrsatz, 193 von Bolzano-Weierstraß, 105 von Rolle, 182 Zwischenwertsatz, 137 Schlömilchsches Restglied, 193 Schnittmenge, 2 Sinus, 158 Funktionsgraph, 163 Sinus Hyperbolicus, 169 Funktionsgraph, 170 Sprungstelle, 141 Stammfunktion, 197 stetig, 129 an der Stelle x, 129 gleichmäßig, 139 linksseitig, 140 rechtsseitig, 140 streng monoton fallend, 143 streng monoton wachsend, 143 Substitutionsregel, 198 Summensätze, 159 Supremum, 13 Supremumsnorm, 152 surjektiv, 6 symmetrische Mengendifferenz, 116 Tangens, 168 Funktionsgraph, 168 Tangens Hyperbolicus 210 Funktionsgraph, 171 Taylorreihe, 194 Taylorsche Polynom, 192 Teilfolge, 58 Teilfolge eines Netzes, 111 Teilfolgen gestattet, 123 Teilmenge, 1 Teilnetz, 111 teilt, 33 Totalität, 12 Transitivität, 12 Trennung der Variablen, 199 Unstetigkeit 1. Art, 141 2. Art, 141 hebbare, 141 Sprungstelle, 141 untere Schranke, 13 Urbild, 5 vollständiges, 5 Vereinigungsmenge, 2 Verknüpfung, 9 vollständige Induktion, 19 Weierstraß Kriterium, 153 Wertebereich, 5 Wertevorrat, 4 wohldefiniert, 4 Wurzel einer komplexen Zahl, 165 einer reellen Zahl ≥ 0, 42 Wurzelkriterium, 83 Zahl komplexe, 46 rationale, 34 Zahlen natürliche, 16 positive, 12 Zerlegung, 109 Zielmenge, 4 INDEX