Analysis I (2012-13) Frank Müller 7. Februar 2013 Dieses Skript umfasst den Stoff der Vorlesung Analysis I gehalten im Wintersemester 2012/13. Die kleingedruckten Passagen enthalten zusätzliche Informationen (den Stoff der in früheren Semestern angebotenen Ergänzungen). Die Vorlesung wird im Sommersemester 2013 fortgesetzt. Inhaltsverzeichnis 1 Zahlen, Folgen, Reihen 1 Zahlen und Körper . . . . . . . . . . . . 2 Vollständige Induktion . . . . . . . . . . 3 Die Definition der reellen Zahlen . . . . 4 Folgen und Reihen . . . . . . . . . . . . 5 Vollständigkeit reeller Zahlen . . . . . . 6 Punktmengen in R . . . . . . . . . . . . 7 Die komplexen Zahlen . . . . . . . . . . 8 Konvergenzkriterien für Reihen (in C) . 9 Potenzreihen . . . . . . . . . . . . . . . 10 Der d-dimensionale Raum und metrische . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Räume 2 Funktionen und Stetigkeit 1 Beispiele und Grenzwerte von Funktionen . . . 2 Der Stetigkeitsbegriff . . . . . . . . . . . . . . . 3 Kompakta und gleichmäßige Stetigkeit . . . . . 4 Funktionenfolgen und gleichmäßige Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 13 18 27 34 40 47 53 63 67 . . . . 81 81 88 92 94 3 Differential- und Integralrechnung 99 1 Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 2 Lokale Extrema, Mittelwertsatz, Konvexität . . . . . . . . . . . . . . 106 3 Die elementaren Funktionen . . . . . . . . . . . . . . . . . . . . . . . 113 Kapitel 1 Zahlen, Folgen, Reihen 1 Zahlen und Körper Grundlegend für alle Mathematik sind selbstverständlich die Zahlen. Und nach dem deutschen Mathematiker Leopold Kronecker sind die einzig göttlichen Zahlen“ die ” natürlichen Zahlen N := {1, 2, 3, . . .} oder zusammen mit dem Nullelement 0: N0 := N ∪ {0} = {0, 1, 2, 3, . . .}. Nehmen wir noch die negativen Zahlen hinzu, so erhalten wir die ganzen Zahlen: Z := {x : x ∈ N0 oder − x ∈ N} = {0, ±1, ±2, ±3, . . .}. (Hier sehen Sie übrigens die drei typischen Schreibweisen von Mengen: die aufzählende Schreibweise, die Definition als Vereinigung, Durchschnitt, Differenz, ... von anderen Mengen und die Definition durch Angabe der Eigenschaften ihrer Elemente.) Je zwei Zahlen a, b ∈ Z lassen sich verknüpfen durch Addition a + b ∈ Z und Multiplikation a · b = ab ∈ Z, wie wir sie aus der Schule kennen. Bezüglich der Addition von ganzen Zahlen haben wir folgende Rechenregeln, die wir als gegeben annehmen wollen: Axiome der Addition. (A1) Kommutativität: Für alle a, b ∈ Z gilt a + b = b + a. (A2) Assoziativität: Für alle a, b, c ∈ Z gilt (a + b) + c = a + (b + c). (A3) Existenz des Nullelements 0: Es existiert ein neutrales Element 0 ∈ Z, d.h. für alle a ∈ Z gilt a + 0 = a. (A4) Existenz des Negativen: Für alle a ∈ Z existiert ein −a ∈ Z, so dass a + (−a) = 0 richtig ist. 1 2 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Die Existenz des Negativen (A4) zeichnet die ganzen Zahlen gegenüber N0 aus. Zusätzlich haben wir das folgende Distributivgesetz. (D) Für alle a, b, c ∈ Z gilt a · (b + c) = a · b + a · c. Bemerkung: Man kann die natürlichen Zahlen mittels der Peanoschen Axiome zusammen mit der Addition und Multiplikation induktiv erklären und anschließend durch die Lösung der Gleichungen n + x = 0 für n ∈ N formal auf die ganzen Zahlen erweitern; siehe z.B. Rannachers Skript, Abschnitt 1.2. Innerhalb der ganzen Zahlen können i.A. keine Gleichungen der Form q·x=p für gegebene p ∈ Z, q ∈ N (1.1) gelöst werden. Hierzu erweitern wir Z auf die Menge der rationalen Zahlen { } p Q := x = : p ∈ Z, q ∈ N , q wobei x = pq für die (eindeutige) Lösung der Gleichung (1.1) steht. Wir verzichten auf die formal exakte Definition über Äquivalenzklassen und verweisen wieder auf Rannachers Skript, Abschnitt 1.2. (Mit x = pq löst auch ap aq für jedes a ∈ N die Gleichung (1.1); diese ungekürzten“ Brüche müssten identifiziert werden.) Die Arbeit ” mit Äquivalenzklassen werden wir später bei der Konstruktion der reellen Zahlen üben. Man beachte noch, dass sich für q = 1 die Lösung von (1.1) zu x = p ∈ Z ergibt, d.h. wir haben Z ⊂ Q. Wir zeigen unten in Satz 1.1, dass in Q zusätzlich zu den Gesetzen (A1)–(A4) und (D) (nun natürlich für a, b, c ∈ Q) auch die folgenden Regeln gelten: Axiome der Multiplikation. (M1) Kommutativität: Für alle a, b ∈ Q gilt a · b = b · a. (M2) Assoziativität: Für alle a, b, c ∈ Q gilt (a · b) · c = a · (b · c). (M3) Existenz des Einselements 1: Es existiert ein neutrales Element 1 ∈ Q \ {0}, d.h. für alle a ∈ Q gilt a · 1 = a. (M4) Existenz der Inversen: Für alle a ∈ Q \ {0} existiert ein a−1 ∈ Q, so dass a · a−1 = 1 richtig ist. Natürlich gelten (M1)–(M3) schon in Z, wesentlich ist also die Existenz der Inversen (M4). In obigen Axiomen haben wir übrigens Addition und Multiplikation wie folgt auf Q fortgesetzt: Für x1 = pq11 , x2 = pq22 ∈ Q setzen wir x1 + x2 := p 1 q2 + p 2 q1 ∈ Q, q1 q2 x1 · x2 = x1 x2 := p1 p2 ∈ Q. q1 q2 (1.2) 1. ZAHLEN UND KÖRPER 3 Dies scheint Ihnen natürlich aus der Schule völlig klar (Regeln der Bruchrechnung), ergibt sich aber erst aus der Definition der rationalen Zahlen und den gewünschten Rechenregeln als einzig sinnvolle Wahl! Definition 1.1: Ein Tripel (K, +, ·) heißt Körper mit der nichtleeren Grundmenge K und den Rechenoperationen +, ·, wenn mit a, b ∈ K auch a+b ∈ K und a·b ∈ K gilt und die Körperaxiome (A1)–(A4), (M1)–(M4) und (D) für beliebige Elemente aus K erfüllt sind. Wenn klar ist, welche Rechenoperationen benutzt werden, schreiben wir auch einfach K für den betrachten Körper. Bemerkung: In einem Körper können wir noch Subtraktion und Division erklären: a − b := a + (−b) ∈ K für a, b ∈ K, a := a · b−1 ∈ K für a ∈ K, b ∈ K \ {0}. b Wie bereits oben behauptet haben wir den: Satz 1.1: Die Menge Q der rationalen Zahlen ist (zusammen mit + und ·) ein Körper. Beweis: Für den Beweis dürfen wir die Rechenregeln (A1)–(A4), (M1)–(M3) und (D) nur in Z anwenden, wo wir diese ja als bekannt vorausgesetzt haben; wir schreiben dafür (A1)Z usw. 1. Wir beginnen mit den Axiomen der Addition: (A1) können wir direkt nachrechnen: Mit x1 = pq11 , x2 = pq22 haben wir wegen (A1)Z , (M1)Z und der Definition (1.2): x1 + x2 = Ist zusätzlich x3 = p3 , q3 (x1 + x2 ) + x3 p1 q2 + p2 q1 q1 q2 (A1)Z ,(M 1)Z = p 2 q1 + p 1 q2 = x2 + x1 . q2 q1 so finden wir weiter = (D)Z ,(M 1)Z = (A2)Z ,(M 2)Z = (M 1)Z ,(D)Z = = (p1 q2 + p2 q1 )q3 + p3 (q1 q2 ) p1 q2 + p2 q1 p3 + = q1 q2 q3 (q1 q2 )q3 ((p1 q2 )q3 + (q1 p2 )q3 ) + p3 (q2 q1 ) (q1 q2 )q3 p1 (q2 q3 ) + (q1 (p2 q3 ) + (p3 q2 )q1 ) q1 (q2 q3 ) p1 (q2 q3 ) + (p2 q3 + p3 q2 )q1 q1 (q2 q3 ) p1 p2 q3 + p3 q2 + = x1 + (x2 + x3 ), q1 q2 q3 also (A2). Zum Beweis von (A3) und (A4) sei zunächst q ∈ N beliebig. Dann gilt nach (A3)Z und (D)Z : q · 0 = q · (0 + 0) = q · 0 + q · 0, also q · 0 = 0 nach Subtraktion von q · 0 auf beiden Seiten unter Beachtung von (A2)Z und (A4)Z . Folglich löst x = 0 die Gleichung (1.1) mit p = 0, d.h. wir haben nach der Definition der rationalen Zahlen: 0 für alle q ∈ N. 0= q 4 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Sei nun x = p q mit p ∈ Z, q ∈ N beliebig. Dann erhalten wir mit (1.2): x+0= p 0 p·1+q·0 + = q 1 q·1 (M 3)Z = p+0 q also (A3). Schließlich folgern wir mit dem Negativen −x := x + (−x) = −p pq + (−p)q p + = q q q·q (M 1)Z ,(D)Z = (A3)Z = −p q (p + (−p))q q·q p = x, q ∈ Q von x noch: (A4)Z = 0 q · q q 0 = 0, q (M 3)Z = d.h. (A4) ist erfüllt. 2. Die Axiome der Multiplikation: Die Gesetze (M1) und (M2) folgen in einfacher Weise aus der Definition (1.2) und den entsprechenden Gesetzen in Z, ganz analog zum Beweis von (A1), (A2) in Teil 1. Wegen 1 = 11 haben wir für x = pq : x·1= p q also (M3). Das Inverse zu x = x−1 p·1 p 1 · = q 1 q·1 (M 3)Z = p = x, q ̸= 0 (d.h. p ̸= 0) erklären wir zu { q , falls p ∈ N p := ∈ Q. −q , falls − p ∈ N −p (M 3) Im ersten Fall ist dann offenbar x · x−1 = 1, wenn man noch pp = Z 1 für beliebige p ∈ N beachtet. Im zweiten Fall benötigen wir noch die folgende Beobachtung: Für beliebiges p ∈ Z gilt p + (−1) · p (M 3)Z ,(M 1)Z = (D) p · 1 + p · (−1) = Z p · (1 + (−1)) = p · 0 = 0, also −p = (−1)p. Damit berechnen wir x · x−1 = p −q · q −p (M 1)Z = p · ((−1) · q) (−p) · q (M 1)Z ,(M 2)Z = (−p) · q = 1, (−p) · q also (M4). 3. Schließlich beweisen wir das Distributivgesetz (D) in Q: Mit x1 = berechnen wir x1 · (x2 + x3 ) = (M 3) = (D)Z ,(M 2)Z = (M 2)Z ,(M 1)Z = = p1 , q1 x2 = p2 , q2 x3 = p3 q3 p1 p2 q3 + p3 q2 (D)Z p1 (p2 q3 ) + p1 (p3 q2 ) · = q1 q2 q3 q1 (q2 q3 ) (p1 (p2 q3 ) + p1 (p3 q2 ))q1 (q1 (q2 q3 ))q1 ((p1 p2 )q3 )q1 + ((p1 p3 )q2 )q1 ((q1 q2 )q3 )q1 (p1 p2 )(q1 q3 ) + (p1 p3 )(q1 q2 ) (q1 q2 )(q1 q3 ) p1 p2 p1 p3 + = x1 · x2 + x1 · x3 . q1 q2 q1 q3 Also ist Q ein Körper. q.e.d. Es stellt sich nun heraus, dass auch der Bereich der rationalen Zahlen i.A. nicht ausreicht. Z.B. besitzt die einfache Gleichung x2 = 2 (1.3) 1. ZAHLEN UND KÖRPER 5 keine Lösung in Q. Wäre nämlich x = ( pq )2 p q eine Lösung mit p ∈ Z, q ∈ N teilerfremd, p2 q2 so müsste also = = 2 bzw. p2 = 2q 2 gelten. Damit wäre aber p2 und daher auch p durch 2 teilbar, d.h. p = 2l mit einem l ∈ Z und folglich q2 = p2 = 2l2 . 2 Also wäre auch q 2 und somit q durch 2 teilbar, im Widerspruch zur Annahme, dass p und q teilerfremd sind. Bemerkung: Wir haben soeben ein wichtiges Beweisprinzip in der Mathematik benutzt, den indirekten Beweis oder Beweis durch Widerspruch: Um unter den Voraussetzungen (V) eine Aussage (A) zu beweisen, nimmt man an, dass (A) falsch ist und zeigt, dass dann eine der Voraussetzungen (V) oder eine andere, bereits bewiesene Aussage (B) nicht erfüllt sein kann. Hierbei benutzt man eine der Grundannahmen der Mathematik: Eine Aussage (A) ist entweder wahr oder falsch. √ Aus der Schule wissen wir, dass x =√ 2 ein guter Kandidat zur Lösung von (1.3) ist. Nach dem eben Gesagten ist aber 2 keine rationale Zahl. Wir werden später Q konstruktiv durch einen Abschlussprozess auf den Bereich der reellen Zahlen R erweitern. R entspricht dann der gesamten Zahlengeraden. Um schließlich auch Gleichungen wie x2 + 1 = 0 lösen zu können, werden wir R zu den komplexen Zahlen C erweitern; diese kann man sich in der Gaußschen Zahlenebene veranschaulichen. Insgesamt haben wir also die Zahlenbereiche N ⊂ Z ⊂ Q ⊂ R ⊂ C. Die größten Bereiche Q, R, C haben die Eigenschaft, Körper im Sinne der Definition 1.1 zu sein; für Q haben wir dies bereits gezeigt, für R und C wird dies aus der Konstruktion folgen. Hingegen sind N und Z keine Körper; beiden fehlt die Inverse, d.h. (M4) ist verletzt, den natürlichen Zahlen fehlt auch das Negative und sogar das Nullelement 0. Ein Körper muss nach (A3) und (M3) mindestens zwei Elemente enthalten, nämlich das Nullelement 0 und das Einselement 1. Umgekehrt kann man jede zweielementige Menge M = {x, y} durch geeignete Definition der Verknüpfungen zu einem Körper machen: + x y x x y y y x und · x y x x x y x y (1.4) 6 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Hierbei wird x als Nullelement und y als Einselement interpretiert. Wir werden nun einige Folgerungen der Körperaxiome angeben, deren Aussagen Ihnen zum Teil offensichtlich erscheinen mögen. Allerdings gelten diese Rechenregeln in beliebigen Körpern, also z.B. auch für die komplexen Zahlen. Durch diese Vorgehensweise ersparen wir uns später ermüdende Wiederholungen. Satz 1.2: In einem Körper (K, +, ·) gelten folgende Rechenregeln: (a) Die Gleichung a + x = b besitzt für beliebig vorgegebene a, b ∈ K genau eine Lösung x ∈ K. Insbesondere sind das Nullelement 0 und das negative Element eindeutig bestimmt. (b) Die Gleichung ax = b besitzt für beliebig vorgegebene a ∈ K \ {0}, b ∈ K genau eine Lösung x ∈ K. Insbesondere sind das Einselement 1 und das inverse Element eindeutig bestimmt. (c) Für alle x ∈ K gilt x · 0 = 0 und (−1) · x = −x. (d) Für alle x ∈ K gilt −(−x) = x und falls zusätzlich x ̸= 0 auch (x−1 )−1 = x. (e) Für alle x, y ∈ K \ {0} ist xy ̸= 0 richtig. (f ) Für alle x, y ∈ K ist −(x + y) = −x − y richtig und falls zusätzlich x, y ̸= 0 gilt auch (xy)−1 = x−1 y −1 . Beweis: (a) Wir zeigen zunächst, dass x := b + (−a) = b − a die Gleichung a + x = b löst, d.h. wir beweisen die Existenz einer Lösung: a+x a + (b − a) = (A4) = 0+b (A1) = (A1) = b+0 a + ((−a) + b) (A3) = (A2) = (a + (−a)) + b b. Die Eindeutigkeit der Lösung ergibt sich wie folgt: Angenommen es gibt zwei Lösungen x1 , x2 , d.h. a + x1 = b = a + x2 . Addieren wir von rechts auf beiden Seiten −a, so folgt (a + x1 ) + (−a) = (a + x2 ) + (−a) (A1),(A2) =⇒ (A4) =⇒ (A3) =⇒ wie behauptet. x1 + (a + (−a)) = x2 + (a + (−a)) x1 + 0 = x2 + 0 x1 = x2 , 1. ZAHLEN UND KÖRPER 7 (b) Existenz: x := a−1 b ist Lösung, denn ax = a(a−1 b) (M 2) = (aa−1 )b (M 4) = 1·b (M 1) = b·1 (M 3) = b. Eindeutigkeit: Für zwei Lösungen x1 , x2 hätten wir ax1 = b = ax2 und nach Multiplikation mit a−1 von rechts: (ax1 )a−1 = (ax2 )a−1 (M 1),(M 2) x1 (aa−1 ) = x2 (aa−1 ) (M 4) x1 · 1 = x2 · 1 =⇒ =⇒ (M 3) =⇒ x1 = x2 . (c) x · 0 = 0: Nach (A3) gilt 0 + 0 = 0 und folglich (D) x · 0 + x · 0 = x · (0 + 0) = x · 0. Addition von −(x·0) auf beiden Seiten von rechts (und Ausnutzen der Axiome (A2), (A4) und (A3)) liefert die Behauptung. (−1) · x = −x: Es gilt x + (−1) · x (M 3),(M 1) = (D) x · 1 + x · (−1) = x · (1 + (−1)) (A4) = x · 0 = 0. Die Eindeutigkeit des Negativen – siehe (a) – liefert die Behauptung. (d) −(−x) = x: Per Definition ist −(−x) erklärt durch die Gleichung −x + (−(−x)) = 0. Andererseits gilt auch −x + x (A1) = x + (−x) (A4) = 0. Da aber die Lösung y ∈ K der Gleichung −x + y = 0 nach (a) eindeutig ist, folgt x = −(−x). (x−1 )−1 = x: Wegen x ̸= 0 ist auch x−1 ̸= 0; wäre nämlich x−1 = 0, so hätten wir 1 = x · x−1 = x · 0 = 0, (c) im Widerspruch zu (M3). Also ist (x−1 )−1 erklärt, nämlich als Lösung von x−1 (x−1 )−1 = 1. Andererseits haben wir (M 1) (M 4) x−1 x = xx−1 = 1. Da aber die Gleichung x−1 y = 1 nach (b) eine eindeutige Lösung y ∈ K besitzt folgt x = (x−1 )−1 . (e) Beweis durch Widerspruch: Angenommen, es gibt x, y ∈ K \ {0} mit xy = 0. Nach Multiplikation mit y −1 (beachte y ̸= 0) von rechts folgt x (M 3) = x·1 (M 4) = x(yy −1 ) (M 2) = (c) (xy)y −1 = 0 · y −1 = 0, also ein Widerspruch zur Voraussetzung x ̸= 0. Somit ist die Behauptung richtig. 8 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN (f) −(x + y) = −x − y: Per Definition ist (x + y) + (−(x + y)) = 0 richtig. Andererseits berechnen wir m.H. von (A1)-(A4): (x + y) + (−x − y) = x + (y + (−y − x)) = x + ((y + (−y)) − x) = x + (0 − x) = x + ((−x) + 0) = x + (−x) = 0. Da wieder nach (a) die Gleichung (x+y)+z = 0 eindeutig lösbar ist, folgt −(x+y) = −x−y. (xy)−1 = x−1 y −1 : Da sowohl z = (xy)−1 als auch z = x−1 y −1 die Gleichung (xy)z = 1 lösen – letzteres sieht man analog zur obigen Rechnung unter Benutzung von (M1)-(M4) – liefert die Eindeutigkeitsaussage in (b) sofort (xy)−1 = x−1 y −1 . q.e.d. Bemerkung: In Mehrfachsummen und Mehrfachprodukten lassen wir i.F. die Klammern meist weg, also a+b+c+. . . und a·b·c·. . . für a, b, c, . . . ∈ K, denn wegen (A2) und (M2) spielt die Reihenfolge der Summierung bzw. Multiplikation keine Rolle. Ebenso können wir in Mehrfachsummen und Mehrfachprodukten die Reihenfolge der Summanden bzw. Faktoren beliebig vertauschen. Für das in der Analysis wesentliche Rechnen mit Ungleichungen benötigen wir noch eine Anordnung“, wir müssen also entscheiden können, ob ein Element eines ” Körpers größer“ oder kleiner“ als ein anderes Element ist. Hierzu verwenden wir ” ” die folgende Definition 1.2: Wir nennen einen Körper K angeordnet, wenn gewisse Elemente x ∈ K als positiv ausgezeichnet sind (in Zeichen: x > 0), wobei folgende Regeln erfüllt seien: Anordnungsaxiome (O1) Für jedes x ∈ K gilt genau eine der drei Beziehungen x > 0, −x > 0. x = 0, Die x ∈ K mit −x > 0 heißen die negativen Elemente. (O2) Für alle x, y ∈ K mit x > 0 und y > 0 gilt x+y >0 und xy > 0. Bemerkungen: 1. (O1) ist das sogenannte Trichotomiegesetz, bei (O2) spricht man von der Abgeschlossenheit von >“ bezüglich der Addition und Multiplikation. ” 2. Der Körper Q der rationalen Zahlen ist natürlich angeordnet mittels x>0 :⇐⇒ x= p mit p, q ∈ N q 1. ZAHLEN UND KÖRPER 9 Dann sind die x = pq mit −p, q ∈ N gerade die negativen Zahlen. Dies entspricht unserer Vorstellung der Anordung von Q auf der Zahlengeraden (vgl. auch Definition 1.3 unten). 3. Aus der Konstruktion von R wird folgen, dass auch die reellen Zahlen einen angeordneten Körper bilden. Hingegen stellt sich C als nicht angeordneter Körper heraus. 4. Auch der Körper ({x, y}, +, ·) mit den in (1.4) erklärten Relationen +, · kann nicht angeordnet werden: Da x das Nullelement ist, müsste für y entweder y > x oder −y > x gelten. Per Definition ist −y ∈ {x, y} Lösung von y + (−y) = x. Nach (1.4) ist dann aber −y = y, Widerspruch! Definition 1.3: (Größer- und Kleinerrelation) In einem angeordneten Körper definieren wir: x > y :⇐⇒ x − y > 0, x < y :⇐⇒ y > x ⇐⇒ y − x > 0, x ≥ y :⇐⇒ x > y oder x = y, x ≤ y :⇐⇒ x < y oder x = y. Satz 1.3: In einem angeordneten Körper K gelten folgende Aussagen: (a) Für je zwei Elemente x, y ∈ K gilt genau eine der Relationen x < y, x = y, x > y. (b) Transitivität: Für alle x, y, z ∈ K gilt: x < y und y < z implizieren x < z. (c) Translationsinvarianz: Für alle x, y, a ∈ K gilt: Aus x < y folgt x + a < y + a. (d) Skalierungsinvarianz: Für alle x, y, a ∈ K mit x < y und a > 0 gilt xa < ya. (e) Spiegelung: Für alle x, y ∈ K mit x < y haben wir −x > −y. (f ) Für alle x ∈ K \ {0} ist x2 > 0 richtig; insbesondere gilt 1 > 0. (g) Für jedes x ∈ K mit x > 0 ist x−1 > 0 erfüllt. (h) Für alle x, y ∈ K mit 0 < x < y gilt x−1 > y −1 . Bemerkung: Wegen Satz 1.3 (a) sind in einem angeordneten Körper für je zwei Elemente x, y ∈ K das Minimum und Maximum wohl definiert: { { x, falls x ≤ y x, falls x ≥ y min{x, y} := , max{x, y} := . y, sonst y, sonst 10 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Beweis von Satz 1.3: Wir werden die Körperaxiome und deren Folgerungen aus Satz 1.2 ohne Kommentar benutzen. (a) Wende (O1) auf x − y an und benutze Definition 1.3. (b) Per Voraussetzung ist y − x > 0 und z − y > 0, so dass (O2) liefert z − x = (y − x) + (z − y) > 0 bzw. x < z. (c) Aus der Voraussetzung y − x > 0 folgt sofort (y + a) − (x + a) = y − x > 0 bzw. x + a < y + a. (d) Wegen y − x > 0 und a > 0 liefert (O2) ya − xa = (y − x)a > 0 bzw. xa < ya, wie behauptet. (e) Es gilt (−x) − (−y) = y − x > 0 nach Voraussetzung, also −x > −y. (f) Für x > 0 folgt x2 = x · x > 0 aus (O2). Für x < 0 multiplizieren wir diese Ungleichung mit −x > 0 durch und erhalten aus (d): −x2 < 0 bzw. x2 = −(−x2 ) > 0 nach Definition 1.3. Schließlich beachten wir noch 1 = 1 · 1 > 0. (g) Es sei x > 0 und angenommen es gilt x−1 < 0, d.h. −x−1 > 0. Aus (O2) folgt dann aber −1 = −xx−1 = x(−x−1 ) > 0 bzw. 1 < 0, im Widerspruch zu (f). (h) Wegen x > 0 und y > x erhalten wir aus (b) auch y > 0 und (O2) liefert xy > 0: Aus (g) folgt also x−1 y −1 = (xy)−1 > 0. Wenden wir nun (d) mit a = x−1 y −1 auf die Ungleichung x < y an, so folgt (d) y −1 = x−1 y −1 x < x−1 y −1 y = x−1 , wie behauptet. q.e.d. Wie bereits angemerkt, gibt es Körper, die nicht angeordnet werden können, wie etwa die komplexen Zahlen C. Manchmal kann man aber zumindest einen Ab” standsbegriff“ einführen, die Elemente also in einem gewissen Sinne bewerten“: ” Definition 1.4: Ein Körper K heißt bewerteter Körper, wenn eine Abbildung | · | : K → K existiert, die jedem Element x ∈ K eindeutig ein Element |x| ∈ K zuordnet und für die folgende Regeln gelten: 1. ZAHLEN UND KÖRPER 11 (a) Positivität: Für jedes x ∈ K gilt |x| ≥ 0 und |x| = 0 ⇐⇒ x = 0. (b) Multiplikativität: Für alle x, y ∈ K gilt |x · y| = |x| · |y|. (c) Dreiecksungleichung: Für beliebige x, y ∈ K haben wir |x + y| ≤ |x| + |y|. Die Abbildung | · | : K → K nennt man dann auch Betragsfunktion. Wir werden später sehen, dass C ein bewerteter Körper ist. Bevor wir Rechenregeln in bewerteten Körpern ableiten wollen, zeigen wir, dass jeder angeordnete Körper auch bewertet ist; dies gilt also insbesondere für Q und später auch für R: Satz 1.4: Zu einem x ∈ K aus dem angeordneten Körper K erklären wir den (Absolut-)Betrag als { x, falls x ≥ 0 |x| := . (1.5) −x, sonst Dann ist K mit der Betragsfunktion aus (1.5) ein bewerteter Körper. Bemerkung: Für den in (1.5) erklärten Absolutbetrag gilt |x| = max{x, −x} für alle x ∈ K und folglich −|x| ≤ x ≤ |x| für alle x ∈ K; dies folgt sofort aus Satz 1.3 (b) und (e) . Beweis von Satz 1.4: Wir haben die drei Eigenschaften (a)-(c) aus Definition 1.4 nachzuprüfen (die Regeln aus Satz 1.2 benutzen wir kommentarlos). (a) Sowohl |x| ≥ 0 für alle x ∈ K als auch die Äquivalenz |x| = 0 ⇐⇒ x = 0 entnimmt man sofort der Definition des Betrages und Definition 1.3. (b) Falls x ≥ 0, y ≥ 0, so gilt xy ≥ 0 gemäß (O2) und folglich auch |xy| = xy = |x| |y|. Falls x < 0, y ≥ 0, so folgt xy ≤ 0 nach Satz 1.3 (d); also finden wir |xy| = −(xy) = (−x)y = |x| |y|. Entsprechend lässt sich der Fall x ≥ 0, y < 0 behandeln. Gelte schließlich x < 0, y < 0, also −x > 0, −y > 0. Dann liefert (O2): xy = −(−x)y = (−x)(−y) > 0. Also haben wir auch in diesem Fall |xy| = xy = (−x)(−y) = |x| |y|. 12 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN (c) Wegen x ≤ |x|, y ≤ |y| haben wir nach Satz 1.3 (c): x + y ≤ |x| + y ≤ |x| + |y|. Entsprechend folgt aus −x ≤ |x|, −y ≤ |y| auch −(x + y) = −x − y ≤ |x| + |y|. Insgesamt ergibt sich also |x + y| = max{x + y, −(x + y)} ≤ |x| + |y|, wie behauptet. q.e.d. Satz 1.5: (Rechnen in bewerteten Körpern) Sei K ein bewerteter Körper mit Betragsfunktion | · | : K → K. (a) Für jedes x ∈ K ist | − x| = |x| richtig. (b) Für jedes x ∈ K \ {0} ist |x−1 | = |x|−1 erfüllt. (c) Für beliebige x, y ∈ K gilt |x − y| ≥ |x| − |y|. x |x| . (d) Für alle x, y ∈ K mit y ̸= 0 gilt = y |y| Beweis: (a) Die Multiplikativität liefert für x = y = 1 zunächst |1| = |1 · 1| = |1| · |1| bzw. 1 = |1|. Setzen wir x = y = −1 ein, so folgt 1 = |1| = |(−1)(−1)| = |−1|2 . Wegen der Positivität ist | − 1| > 0 richtig. Aufgrund von 0 = | − 1|2 − 12 = (| − 1| − 1)(| − 1| + 1), muss also | − 1| = 1 gelten. Für beliebige x ∈ K finden wir nun | − x| = |(−1)x| = | − 1| |x| = 1 · |x| = |x|, wie behauptet. (b) Wegen xx−1 = 1 und |1| = 1 liefert die Multiplikativität: |x| |x−1 | = |xx−1 | = |1| = 1. Also ist |x−1 | das inverse Element zu |x|, d.h. |x|−1 = |x−1 |. (c) Mit der Dreiecksungleichung berechnen wir |x| = |(x − y) + y| ≤ |x − y| + |y| bzw. |x| − |y| ≤ |x − y| und (a) |y| = |(y − x) + x| ≤ |x − y| + |x| also bzw. − (|x| − |y|) ≤ |x − y|, { } |x − y| ≥ max |x| − |y|, −(|x| − |y|) = |x| − |y|. 2. VOLLSTÄNDIGE INDUKTION 13 (d) Mit der Relation (b) und der Multiplikativität berechnen wir |x| x −1 −1 −1 , = |xy | = |x| |y | = |x| |y| = y |y| wie behauptet. q.e.d. Beispiel: Im Körper R erklärt man das arithmetische bzw. geometrische Mittel zweier Zahlen x, y ≥ 0 gemäß √ 1 mA (x, y) := (x + y), mG (x, y) := xy. 2 √ √ Für diese gilt die Ungleichung mA (x, y) ≥ mG (x, y). In der Tat haben wir für a := x und b := y: 0 ≤ (a − b)2 = a2 − 2ab + b2 ⇐⇒ 1 2 (a + b2 ) ≥ ab, 2 also √ 1 (x + y) ≥ xy. 2 Gleichheit tritt übrigens genau dann auf, wenn x = y richtig ist. Das Rechnen in R, insbesondere mit rationalen Potenzen, werden wir später genauer entwickeln. Für den späteren Gebrauch bemerken wir noch, dass Q sogar ein archimedisch angeordneter Körper ist, d.h. neben den Ordnungsaxiomen (O1) und (O2) gilt noch Folgendes: Archimedisches Axiom. (O3) Zu je zwei Elementen x, y ∈ Q mit x, y > 0 existiert eine natürliche Zahl n ∈ N, so dass gilt nx > y. Zum Beweis von (O3) in Q seien x = pq , y = rs mit p, q, r, s ∈ N zwei beliebig gewählte, positive rationale Zahlen. Wählen wir dann n := rq + 1 ∈ N, so folgt nx = (rq + 1) p p r p = rp + = (ps) + ≥ y · 1 + x > y, q q s q wie behauptet. Wir werden hieraus folgern, dass auch R archimedisch angeordnet ist. Bemerkung: Archimedes hat (O3) geometrisch formuliert: Hat man zwei Strecken auf einer Geraden, so kann man, in dem man die kürzere hinreichend oft abträgt, die längere übertreffen. 2 Vollständige Induktion Wir lernen nun ein wichtiges Beweisprinzip kennen und anwenden, welches darauf beruht, dass jede Zahl n ∈ N0 = N ∪ {0} einen eindeutig definierten Nachfolger, 14 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN nämlich n + 1 ∈ N, besitzt. Will man jetzt eine Aussage A(n) für alle n ≥ n0 mit einem n0 ∈ N0 beweisen (d.h. man möchte eigentlich unendlich viele Aussagen A(n) in Abhängigkeit von n zeigen), dann geht man wie folgt vor: Beweisprinzip der vollständigen Induktion. Eine Aussage A(n) gilt für alle n ∈ N0 mit n ≥ n0 ∈ N0 , falls man folgendes beweisen kann: (IA) Induktionsanfang: Die Aussage A(n0 ) ist richtig. (IS) Induktionsschritt: Für alle n ≥ n0 gilt: Wenn A(n) richtig ist, so ist auch A(n + 1) richtig. Die Wirkungsweise ist klar: Sind (IA) und (IS) erfüllt und angenommen, es existiert ein n > n0 , für das A(n) nicht gilt. Wegen (IS) ist dann auch A(n − 1) falsch und dann A(n − 2), A(n − 3) usw. Nach n − n0 Schritten würde also folgen, dass auch A(n0 ) falsch ist, im Widerspruch zu (IA). Als erste Anwendung beweisen wir den Satz 2.1: (Bernoullische Ungleichung) Sei K ⊃ N ein angeordneter Körper und x ∈ K mit x ≥ −1 sei gewählt. Dann gilt für alle n ∈ N0 die Ungleichung (1 + x)n ≥ 1 + nx. Bemerkung: Die n-te Potenz ist dabei für a ∈ K wie folgt induktiv erklärt: a0 := 1, an+1 := an · a für n ∈ N. Für a ̸= 0 erhalten wir dann auch negative Potenzen: a−n := (a−1 )n für alle n ∈ N. Rechenregeln: Für alle a, b ∈ K \ {0} und n, m ∈ Z gilt: (i) an am = an+m . (ii) (an )m = anm . (iii) an bn = (ab)n . Beweis von Satz 2.1: mittels vollständiger Induktion. (IA) n = 0: Wir haben zu zeigen, dass A(0) gilt, also in unserem Fall (1 + x)0 ≥ 1 + 0 · x. Das ist offenbar richtig. 2. VOLLSTÄNDIGE INDUKTION 15 (IS) n → n + 1: Es sei A(n), also (1 + x)n ≥ 1 + nx, für ein n ∈ N0 richtig (genannt Induktionsvoraussetzung (IV)). Zu zeigen ist A(n + 1), d.h. (1 + x)n+1 ≥ 1 + (n + 1)x. Hierzu berechnen wir m.H. der Induktionsvoraussetzung (beachte 1 + x > 0): (1 + x)n+1 = (1 + x)n (1 + x) (IV ) ≥ (1 + nx)(1 + x) = 1 + nx + x + nx2 ≥ 1 + (n + 1)x, d.h. A(n + 1) gilt. Also ist auch der Induktionsschritt (IS) erfüllt und nach dem Prinzip der vollständigen Induktion gilt die Aussage für alle n ∈ N0 . q.e.d. Satz 2.2: Für jede natürliche Zahl n ∈ N gilt 1 + 2 + 3 + ... + n = n(n + 1) . 2 Bemerkung: Die Punkte deuten an, dass die Summation in der gleichen Weise fortgesetzt wird. Dies kann man m.H. von Summen- und Produktzeichen wie folgt kompakter schreiben: Hat man viele, eventuell unendlich viele Variablen, so benutzt man statt a, b, c, . . . sinnvoller die Bezeichnungen a1 , a2 , a3 , . . .. Die natürlichen Zahlen 1, 2, 3, . . . heißen hierbei Indizes und dienen der Unterscheidung der Variablen ak , k ∈ N. Für n ∈ N Variablen a1 , a2 , . . . , an setzen wir n ∑ k=1 n ∏ ak := a1 + a2 + . . . + an ak := a1 · a2 · . . . · an (Summe), (Produkt). k=1 Hierbei kann man die Indexmenge 1, . . . , n natürlich auch durch andere (endliche) Teilmengen von N oder allgemeiner von Z ersetzen. Die Formel in Satz 2.2 liest sich nun (ak := k für k = 1, . . . , n): n ∑ k= k=1 n(n + 1) . 2 Beweis von Satz 2.2: mit vollständiger Induktion. (IA) n = 1: Offenbar gilt 1 ∑ k=1 k = 1 und 1·(1+1) 2 = 1, d.h. A(1) ist korrekt. 16 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN n ∑ (IS) n → n+ 1: Die Induktionsvorraussetzung = k=1 n(n+1) 2 gelte für ein n ∈ N. Für den Beweis von (IS) berechnen wir m.H. der Induktionsvoraussetzung (IV): n+1 ∑ k = n ∑ k=1 k + (n + 1) (IV ) = k=1 n(n + 1) + (n + 1) 2 n(n + 1) + 2(n + 1) (n + 1)(n + 2) = , 2 2 d.h. es folgt A(n + 1). Somit gilt die Aussage für alle n ∈ N. = q.e.d. Satz 2.3: (geometrische Reihe) Für alle x ∈ K \ {1} im Körper K und alle n ∈ N gilt n−1 ∑ 1 − xn . 1−x xk = k=0 Beweis (vollständige Induktion): ∑ (IA) n = 1: Es gilt 0k=0 xk = x0 = 1 und 1−x1 1−x = 1, also A(1). (IS) n → n + 1: Die zu beweisende Relation gelte für festes n ∈ N (IV). Wir berechnen dann ∑ (n+1)−1 xk = n ∑ xk = k=0 k=0 = 1− xn n−1 ∑ xk + xn (IV ) = k=0 xn (1 1 − xn + xn 1−x + − x) 1 − xn+1 = , 1−x 1−x wie behauptet. q.e.d. Definition 2.1: Wir erklären für n, k ∈ N0 die Binomialkoeffizienten ( ) k ∏ n−j+1 n(n − 1) · . . . · (n − k + 1) n := = . k j 1 · 2 · ... · k j=1 Bemerkung: Offenbar gilt ( ) { n! n k!(n−k)! , falls k ≤ n = k 0, falls k > n mit der bekannten Fakultät: 0! := 1, Insbesondere halten wir (n ) 0 = 1, (n ) 1 n! := n ∏ l. l=1 = n und (n ) k = ( n n−k ) für k ≤ n fest. 2. VOLLSTÄNDIGE INDUKTION 17 Hilfssatz 2.1: Für alle natürlichen Zahlen k, n ∈ N gilt die Relation ( ) ( ) ( ) n n−1 n−1 = + . k k−1 k (Veranschaulichung: Pascalsches Dreieck). Beweis: Für k ≥ n ist nach obiger Bemerkung nichts zu zeigen. Sei also k < n. Dann finden wir ( ) ( ) n−1 n−1 (n − 1)! (n − 1)! + = + k−1 k (k − 1)!(n − k)! k!(n − k − 1)! k(n − 1)! + (n − 1)!(n − k) = k!(n − k)! ( ) n! n = = , k!(n − k)! k wie behauptet. q.e.d. Satz 2.4: (Binomischer Lehrsatz) Sei K Körper und n ∈ N0 beliebig. Dann gilt für alle a, b ∈ K die Identität n ( ) ∑ n k n−k a b . (a + b) = k n (2.1) k=0 Beweis: durch vollständige Induktion über n. (IA) n = 0: Wegen x0 = 1 für alle x ∈ K haben wir ( ) 0 ∑ 0 k 0−k a b = 1 = (a + b)0 , k k=0 d.h. (IA) gilt. (IS) n → n + 1: (2.1) gelte für festes n ∈ N0 . Wir beachten (a + b)n+1 = (a + b)n a + (a + b)n b und formen die Terme getrennt um. Zunächst gilt ( ) ( ) n+1 n ∑ n k n−k+1 ∑ n k n−k+1 n (IV ) (a + b) b = a b = a b , k k k=0 ( k=0 ) n n+1 wobei wir noch = 0 benutzt haben. Zur Behandlung des Terms (a + b)n a verwenden wir noch die offensichtliche Beziehung n ∑ k=0 xk+1 = n+1 ∑ k=1 xk (Indexverschiebung) 18 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN für beliebige Summanden x1 , x2 , . . . , xn+1 ∈ K. Wir erhalten ( ) ( ) n+1 n ∑ n k+1 n−k ∑ n n (IV ) (a + b) a = a b = ak bn−k+1 . k k−1 k=0 k=1 Insgesamt ergibt sich also unter Beachtung von Hilfssatz 2.1: ( ) ( ) n+1 n+1 ∑ n k n−k+1 ∑ n k n−k+1 n+1 a b + a b (a + b) = k−1 k k=0 k=1 ( ) ( )] ( ) n+1 ∑[ n n n 0 n+1 k n−k+1 = + a b + a b k−1 k 0 k=1 ( ) ( ) n+1 ∑ n + 1 k n+1−k n + 1 0 n+1−0 HS 2.1 = a b + a b k 0 k=1 ( ) n+1 ∑ n + 1 k n+1−k = a b , k k=0 also Relation (2.1) für n + 1. 3 q.e.d. Die Definition der reellen Zahlen Wir haben die Notwendigkeit der Einführung der reellen Zahlen bereits erkannt, da die Lösung von x2 −2 = 0 nicht rational ist, was übrigens schon in√ der Antike bekannt war. Aus der Schule wissen wir, dass die positive Lösung x = 2 eine unendliche Dezimalbruchdarstellung besitzt √ 2 = 1, 414213562 . . . (bekannt sind ungefähr die ersten 5 Millionen Nachkommastellen!) Wenn wir die Darstellung an der n-ten Nachkommastelle abbrechen, haben wir xn := n ∑ ak ∈ Q für n = 1, 2, . . . 10k (3.1) k=0 mit Zahlen ak ∈ {0, 1, 2, . . . , 9} für alle k ∈ N0 (a0 = 1, a1 = 4, a2 = 1, . . . ). Definition 3.1: Eine Abbildung f : N → K vermöge n 7→ xn := f (n) heißt Zahlenfolge {xn }n∈N (oder {xn }n , {xn }n=1,2,... ) im Körper K. Wir schreiben kurz {xn }n∈N ⊂ K. Das Element xn heißt n-tes Glied der Zahlenfolge. Für K = Q sprechen wir von rationalen (Zahlen-)Folgen. Die Idee ist nun, die rationale Zahlenfolge {xn }n∈N mit den in (3.1) erklärten √ Gliedern mit der irrationalen Zahl 2 zu identifizieren. Dazu schätzen wir die 3. DIE DEFINITION DER REELLEN ZAHLEN 19 Streuung“ der Folge wie folgt ab: Für beliebiges N ∈ N seien m, n ≥ N und ” o.B.d.A. n > m. Dann folgt |xn − xm | = Def. 1.4 (c) ≤ l:=k−m−1 = Satz 2.3 = = ∑ ∑ m ∑ n ak n ak ak − = 10k 10k 10k k=0 n ∑ k=0 a k k ≤ 10 k=m+1 n−m−1 ∑ ( k=m+1 n ∑ k=m+1 10 = 10k n ( 1 )k−1 ∑ 10 k=m+1 n−m−1 ∑ ( ( 1 )m 1 )l 1 )l+m = 10 10 10 l=0 l=0 ( 1 )m 1 − ( 1 )n−m ( 1 )m 1 10 ≤ 1 1 10 10 1 − 10 1 − 10 ( )m ( )N 10 1 10 1 ≤ . 9 10 9 10 (3.2) Wir benötigen nun noch folgenden Hilfssatz 3.1: Sei b ∈ Q positiv, so gilt: (a) Ist b > 1, so existiert zu jedem K ∈ Q mit K > 0 ein n ∈ N mit der Eigenschaft bn > K. (b) Ist 0 < b < 1, so existiert zu jedem δ ∈ Q mit δ > 0 ein n ∈ N mit der Eigenschaft bn < δ. Beweis: (a) Wegen b > 1 ist x := b − 1 > 0 richtig. Also ist die Bernoullische Ungleichung, Satz 2.1, anwendbar: Für alle n ∈ N gilt bn = (1 + x)n ≥ 1 + nx. Nach dem Archimedischen Axiom (O3), welches ja in Q gilt, können wir nun n ∈ N speziell so wählen, dass nx > K ausfällt. Dann folgt bn ≥ 1 + nx > 1 + K > K. (b) Wegen 0 < b < 1 ist b̂ := 1b > 1 richtig. Nach (a) existiert zu K̂ := mit b̂n > K̂ ⇐⇒ bn = (b̂n )−1 < K̂ −1 = δ, wie behauptet. 1 δ ein n ∈ N q.e.d. 20 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Bemerkung: Der Beweis zeigt, dass die Aussage von Hilfssatz 3.1 richtig bleibt, wenn wir Q durch einen beliebigen, archimedisch angeordneten Körper K ⊃ N ersetzen. 1 <1 Wir wenden nun Hilfssatz 3.1 auf unsere Ungleichung (3.2) an mit b = 10 9 und δ = 10 ε > 0 für beliebig gewähltes ε ∈ Q mit ε > 0. Es existiert also ein N = N (ε) ∈ N mit |xn − xm | ≤ 10 ( 1 )N 10 < δ = ε für alle m, n ≥ N (ε). 9 10 9 (3.3) Das bedeutet, die Streuung“ der Folge {xn }n wird für hinreichend große Glieder ” beliebig klein. Die Ungleichung (3.2) und damit auch (3.3) gilt übrigens für beliebige rationale Folgen der Form (3.1) mit ak ∈ {0, 1, 2, . . . , 9}. Definition 3.2: Eine rationale Zahlenfolge {xn }n heißt Cauchyfolge, wenn gilt: Zu jedem ε ∈ Q mit ε > 0 existiert ein N = N (ε) ∈ N so, dass |xn − xm | < ε für alle m, n ≥ N (ε) erfüllt ist. Definition 3.3: Eine rationale Zahlenfolge {xn }n heißt Nullfolge, falls gilt: Zu jedem rationalen ε > 0 existiert ein N = N (ε) ∈ N so, dass |xn | < ε für alle n ≥ N (ε) richtig ist. Man sagt auch, {xn }n konvergiert gegen 0. Bemerkungen: 1. Jede Nullfolge ist auch Cauchyfolge: Wähle N = N (ε) ∈ N so, dass |xn | < für alle n ≥ N (ε) gilt. Dann folgt für m, n ≥ N (ε): |xn − xm | ≤ |xn | + |xm | < ε 2 ε ε + = ε. 2 2 Die Umkehrung ist natürlich falsch, wie etwa das Beispiel {xn }n = {1 + ( 12 )n }n zeigt. 2. Beispiel: { n1 }n ist Nullfolge. In der Tat existiert nach (O3) zu jedem rationalen ε > 0 ein N = N (ε) ∈ N mit N ε > 1. Also folgt 1 1 1 <ε = ≤ n n N für alle n ≥ N (ε). 3. DIE DEFINITION DER REELLEN ZAHLEN 21 Wir wollen nun die reellen Zahlen durch rationale Cauchyfolgen darstellen. Da aber einige Folgen, wie wir sehen werden, die gleiche reelle Zahl darstellen, müssen wir diese identifizieren im Sinne einer Äquivalenzrelation: Definition 3.4: Eine Äquivalenzrelation auf einer beliebigen Menge M ist eine Beziehung zwischen je zwei ihrer Elemente a, b ∈ M , in Zeichen a ∼ b, mit folgenden Eigenschaften: Für jedes geordnete Paar (a, b) ∈ M × M steht fest, ob a ∼ b richtig oder falsch ist, und es gelten: (R) Reflexivität: Für alle a ∈ M gilt: a ∼ a. (S) Symmetrie: Für alle a, b ∈ M gilt: a ∼ b =⇒ b ∼ a. (T) Transitivität: Für alle a, b, c ∈ M gilt: a ∼ b und b ∼ c =⇒ a ∼ c. Zwei Elemente a, b ∈ M nennen wir äquivalent, wenn a ∼ b gilt. Zu a ∈ M heißt die Menge { } [a] := x ∈ M : x ∼ a die zugehörige Äquivalenzklasse. Ein x ∈ [a] nennen wir dann Repräsentant der Äquivalenzklasse [a]. Bemerkung: Jedes Element a ∈ M gehört zu genau einer Äquivalenzklasse. Wir können also M als disjunkte Vereinigung ihrer Äquivalenzklassen darstellen: ∪ M= [a]. a∈M Bevor wir auf der Menge aller rationalen Cauchyfolgen eine Äquivalenzrelation erklären, geben wir noch ein paar einfache Beispiele: 1. Die Gleichheitsrelation auf einem geordneten Körper K ist eine Äquivalenzrelation. Für je zwei Zahlen a, b ∈ K gilt nämlich entweder a = b oder a ̸= b und offenbar sind (R), (S) und (T) erfüllt. 2. Die Ungleichrelation (nicht reflexiv und transitiv), die Kleinerrelation (nicht reflexiv und symmetrisch) und die Kleinergleichrelation (nicht symmetrisch) sind z.B. keine Äquivalenzrelationen. 3. Auf der Menge G aller Geraden in der Ebene ist durch die Relation g1 ∼ g2 :⇐⇒ g1 ist parallel zu g2 eine Äquivalenzrelation definiert. Die Äquivalenzklasse von g ∈ G sind die zu g parallelen Geraden. 22 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN 4. Für M = Z definiert a−b ∈Z 2 eine Äquivalenzrelation. Die zugehörigen Äquivalenzklassen sind die geraden und die ungea∼b :⇐⇒ raden Zahlen. Satz 3.1: Auf der Menge F := {{xn }n ⊂ Q : {xn }n ist Cauchyfolge} der rationalen Cauchyfolgen ist durch {xn }n ∼ {yn }n :⇐⇒ {xn − yn }n ist Nullfolge eine Äquivalenzrelation definiert. Zwei Folgen {xn }n , {yn }n sind also äquivalent, wenn zu jedem rationalen ε > 0 ein N = N (ε) ∈ N existiert mit |xn − yn | < ε für alle n ≥ N . Beweis: Wir prüfen (R), (S) und (T) nach: (R) Ist klar, denn {xn − xn }n = {0}n ist die konstante Nullfolge. (S) Falls {xn }n ∼ {yn }n , dann existiert also zu jedem rationalen ε > 0 ein N (ε) ∈ N mit |yn − xn | = |xn − yn | < ε für alle n ≥ N (ε). Somit ist auch {yn − xn }n Nullfolge, d.h. {yn }n ∼ {xn }n . (T) Seien {xn }n ∼ {yn }n und {yn }n ∼ {zn }n . Dann gibt es zu jedem rationalen ε > 0 Zahlen N1 (ε), N2 (ε) ∈ N mit ε für alle n ≥ N1 (ε), |xn − yn | < 2 ε |yn − zn | < für alle n ≥ N2 (ε). 2 { } Setzen wir nun N = N (ε) := max N1 (ε), N2 (ε) ∈ N, so folgt |xn − zn | ≤ |xn − yn | + |yn − zn | < ε ε + = ε für alle n ≥ N (ε), 2 2 also {xn }n ∼ {zn }n , wie behauptet. {1 + ( 12 )n }n und {1}n sind z.B. äquivalent. Ebenso gilt Beispiel: Die Folgen 1 n {( 3 ) }n , da beide und somit auch ihre Differenz Nullfolgen sind. q.e.d. { n1 }n ∼ Wir kommen nun zur zentralen Definition 3.5: (Die reellen Zahlen) Die Menge der reellen Zahlen R erklären wir als die Menge aller Äquivalenzklassen rationaler Cauchyfolgen im Sinne von Satz 3.1. Jede rationale Cauchyfolge {an }n definiert also genau eine reelle Zahl α ∈ R durch α := [an ] := [{an }n ]. 3. DIE DEFINITION DER REELLEN ZAHLEN 23 Bemerkung: Wir nennen α ∈ R rational, falls ein Repräsentant {an }n von α existiert mit an = pq (mit p ∈ Z, q ∈ N) für alle n ∈ N; sonst heißt α irrational. Die konstanten rationalen Folgen sind also Repräsentanten der rationalen reellen Zahlen. In diesem Sinne gilt Q ⊂ R, wir schreiben kurz pq := [ pq ]. (Hier ist übrigens auch die Äquivalenzklassenbildung enthalten, die wir bei der etwas laxen Definition der rationalen Zahlen in § 1 unterschlagen haben: Ungekürzte“ rationale Zahlen ” werden mit gekürzten“ identifiziert, denn { ap }n mit a ∈ N und { pq }n gehören aq ” offenbar zur gleichen Äquivalenzklasse.) Im Folgenden zeigen wir über Definition 3.5, dass R ein archimedisch angeordneter Körper ist, wobei wir natürlich noch die Rechenoperationen und den Begriff der Positivität in R erklären müssen. Wir beginnen mit dem Hilfssatz 3.2: Jede rationale Cauchyfolge {xn }n ist beschränkt, d.h. es existiert ein rationales c > 0, so dass |xn | ≤ c für alle n ∈ N gilt. Beweis: Gemäß Definition 3.2 gibt es speziell zu ε = 1 ein N ∈ N mit |xn − xm | < 1 für alle n, m ≥ N . Damit folgt insbesondere für m = N : |xn | = |(xn − xN ) + xN | ≤ |xn − xN | + |xN | < |xN | + 1 für alle n ≥ N. Setzen wir c := max{|x1 |, . . . , |xN −1 |, |xN | + 1}, so folgt die Behauptung. q e.d. Hilfssatz 3.3: (a) Sind {an }n , {bn }n ⊂ Q Cauchyfolgen, so gilt dies auch für {an + bn }n und {an · bn }n . (b) Sind {xn }n , {yn }n ⊂ Q weitere Cauchyfolgen mit {an }n ∼ {xn }n und {bn }n ∼ {yn }n , dann folgt {an + bn }n ∼ {xn + yn }n und {an · bn }n ∼ {xn · yn }n . Beweis: (a) Es existiert zu vorgegebenem δ > 0 ein N = N (δ) ∈ N, so dass |an − am | < δ, |bn − bm | < δ für alle m, n ≥ N (δ). Wähle nun ε > 0 rational beliebig. Setzen wir N1 (ε) := N ( 2ε ), so folgt |(an + bn ) − (am + bm )| ≤ |an − am | + |bn − bm | < ε also ist {an + bn }n Cauchyfolge. für alle m, n ≥ N1 (ε), 24 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Nach Hilfssatz 3.2 existiert ferner ein rationales c > 0 mit |an | ≤ c, |bn | ≤ c für alle n ∈ N. ε Setzen wir nun N2 (ε) := N ( 2c ), so folgt auch |an bn − am bm | = |an (bn − bm ) + bm (an − am )| ≤ |an | |bn − bm | + |bm | |an − am | (ε ε) c + = ε für alle m, n ≥ N2 (ε), 2c 2c < d.h. {an bn }n ist Cauchyfolge. (b) Für den Beweis der ersten Aussage ist zu zeigen, dass {(an + bn ) − (xn + yn )}n Nullfolge ist. Wegen |an − xn | < ε, |bn − yn | < ε für beliebiges ε > 0 und alle n ≥ N (ε), erhalten wir |(an + bn ) − (xn + yn )| ≤ |an − xn | + |bn − yn | < 2ε für alle n ≥ N (ε). Da ε > 0 beliebig war, folgt die Behauptung (gehe über ε → 2ε ). Um zu zeigen, dass auch {an bn − xn yn }n Nullfolge ist, beachten wir wieder |an |, |yn | ≤ c für alle n ∈ N und mit geeignetem c > 0 gemäß Hilfssatz 3.2. Wir finden dann |an bn − xn yn | = |an (bn − yn ) + yn (an − xn )| ≤ |an | |bn − yn | + |yn | |an − xn | < 2εc wie behauptet. für alle n ≥ N (ε), q.e.d. Bemerkung: Mit Hilfssatz 3.3 können wir bereits Addition und Multiplikation sowie das Negative in R erklären; siehe Definition 3.7 unten. Um aber auch die Existenz der Inversen zu sichern, benötigen wir noch zwei weitere Hilfssätze, für deren Beweis wir die folgende Definition nutzen: Definition 3.6: Ist {xn }n ⊂ K eine Zahlenfolge und seien unendlich viele natürliche Zahlen 1 ≤ n1 < n2 < n3 < . . . gewählt (also {nk }k ⊂ N mit nk < nk+1 für alle k ∈ N). Dann heißt {xnk }k∈N = {xn1 , xn2 , xn3 , . . .} Teilfolge von {xn }n . Hilfssatz 3.4: Es sei {xn }n ⊂ Q eine Cauchyfolge. Dann tritt genau einer der folgenden Fälle ein: (a) {xn }n ist Nullfolge. (b) Typ A+ : Es existiert ein rationales δ > 0 und ein N ∈ N mit xn > δ für alle n ≥ N. 3. DIE DEFINITION DER REELLEN ZAHLEN 25 (c) Typ A− : Es existiert ein rationales δ > 0 und ein N ∈ N mit −xn > δ für alle n ≥ N. Beweis: Wir zeigen, dass, falls (a) nicht gilt, genau einer der Fälle (b) oder (c) eintreten muss. Sei also {xn }n keine Nullfolge. Dann gibt es also ein rationales δ > 0 und eine Teilfolge {xnk }k mit |xnk | ≥ 2δ für alle k ∈ N. Da {xn }n Cauchyfolge ist, existiert andererseits ein N ∈ N mit |xn − xm | < δ für alle m, n ≥ N . Wählen wir p ∈ N so groß, dass np ≥ N ist, so folgt speziell für m = np : |xn − xnp | < δ für alle n ≥ N. Wir unterscheiden nun zwei Fälle: (i) xnp ≥ 2δ: Dann folgt xn = xnp + (xn − xnp ) ≥ 2δ − |xn − xnp | > 2δ − δ = δ für alle n ≥ N, also gehört {xn }n zum Typ A+ . (ii) xnp ≤ −2δ: Dann haben wir −xn = −xnp − (xn − xnp ) ≥ 2δ − |xn − xnp | > δ für alle n ≥ N, d.h. {xn }n gehört zum Typ A− . q.e.d. Die Definition der Inversen ergibt sich nun aus dem folgenden Hilfssatz 3.5: Seien die Cauchyfolgen {xn }n , {yn }n ⊂ Q zueinander äquivalent und keine Nullfolgen. Ferner gelte xn , yn ̸= 0 für alle n ∈ N. Dann sind auch {x−1 n }n −1 und {yn }n Cauchyfolgen, und es gilt −1 {x−1 n }n ∼ {yn }n . Beweis: 1. Nach Hilfssatz 3.4 existiert ein δ > 0, so dass |xn | > δ, |yn | > δ für alle n ∈ N gilt. Damit folgt: 1 xm − xn 1 1 − = < 2 |xn − xm | für alle m, n ∈ N. xn xm xn xm δ Da {xn }n Cauchyfolge ist, existiert zu beliebigem ε > 0 ein N̂ (ε) ∈ N, so dass |xn −xm | < εδ 2 −1 −1 richtig ist. Es folgt |x−1 n − xm | < ε für alle m, n ≥ N̂ (ε), d.h. {xn }n ist Cauchyfolge. Die entsprechenden Überlegungen zeigen, dass auch {yn−1 }n Cauchyfolge ist. 2. Wegen 1 yn − xn 1 1 − = < 2 |xn − yn | xn yn xn yn δ für alle n ∈ N −1 folgt aus der Nullfolgeneigenschaft von {xn − yn }n sofort {x−1 n }n ∼ {yn }n , wie behauptet. q.e.d. 26 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Bemerkung: Die Bedingung xn ̸= 0 für alle Glieder einer Nicht-Nullfolge {xn }n kann immer durch Übergang zu einer äquivalenten Folge {x̂n }n mittels eventueller Addition von n1 zum n-ten Glied erreicht werden. Alternativ kann man das durch Wegstreichen der (gemäß Hilfssatz 3.4) endlich vielen Glieder xn = 0 erreichen, denn: Jede Teilfolge einer Cauchyfolge ist zu ihr äquivalent. Definition 3.7: (Rechenoperationen in R) • Für α = [an ] ∈ R, β = [bn ] ∈ R setzen wir α + β := [an + bn ] ∈ R (Summe), α · β = αβ := [an bn ] ∈ R (Produkt). • Die neutralen Elemente der Addition und Multiplikation sind erklärt als 0 := [0] ∈ R, 1 := [1] ∈ R. • Das Negative und das Inverse erklären wir wie folgt: – Zu α = [an ] setzen wir −α := [−an ] ∈ R. – Zu α = [an ] ̸= 0 mit einem Repräsentanten {an }n , der an ̸= 0 für alle n ∈ N erfüllt, setzen wir α−1 := [a−1 n ]. Bemerkung: Wegen der Hilfssätze 3.3 und 3.5 sind alle Größen wohl definiert. Zum Beispiel ist nach Hilfssatz 3.3 (a) mit {an }n und {bn }n auch {an bn }n eine rationale Cauchyfolge, also [an bn ] ∈ R. Und nach Hilfssatz 3.3 (b) ist die Definition von αβ unabhängig von der Wahl der Repräsentanten {an }n , {bn }n . Definition 3.8: (Positivität in R) Eine reelle Zahl α = [an ] heißt positiv, in Zeichen α > 0, falls {an }n zum Typ A+ aus Hilfssatz 3.4 gehört. Bemerkung: Da für ein weiteres Element {bn }n der Äquivalenzklasse [an ] die Folge {an − bn }n Nullfolge ist, ist auch Definition 3.8 unabhängig von der Wahl des Repräsentanten. Satz 3.2: (R, +, ·) mit den in Definition 3.5, 3.7 und 3.8 erklärten reellen Zahlen, Rechenoperationen und Positivität ist ein archimedisch angeordneter Körper. Beweis: 1. Dass R ein Körper ist, folgt per Konstruktion aus der Tatsache, dass Q ein Körper ist. Z.B. ist 1 = [1] in der Tat das neutrale Element der Multiplikation: Ist nämlich α = [an ], so folgt {an · 1}n ∼ {an }n , also gilt α · 1 = [an · 1] = [an ] = α für alle α ∈ R. 4. FOLGEN UND REIHEN 27 2. R ist auch angeordnet, denn nach Hilfssatz 3.4 und Definitionen 3.7, 3.8 gilt für jede reelle Zahl α genau eine der Beziehungen α > 0, α = 0 oder −α > 0, also (O1). Und (O2) ist aus Definition 3.7 wieder offensichtlich. Die in Definition 3.8 erklärte Positivität auf R impliziert also in der Tat eine Ordnung. Mit ihr können wir wie in den Definitionen 1.3 und 1.4 die Größerbzw. Kleinerrelationen und den Betrag erklären. 3. Schließlich ist in R auch das Archimedische Axiom (O3) erfüllt: Sind nämlich α = [ak ] > 0, β = [bk ] > 0 gewählt, so suchen wir n ∈ N mit nα > β. Da α > 0 gilt, ist {ak }k vom Typ A+ , siehe Hilfssatz 3.4. Also gibt es ein rationales δ > 0 und ein N ∈ N, so dass ak > δ für alle k ≥ N richtig ist. Andererseits ist {bk }k nach Hilfssatz 3.2 beschränkt, d.h. es existiert ein rationales c > 0 mit 0 < bk < c für alle k ≥ N . Wir wählen nun n ∈ N mit nδ > c (beachte: Q ist archimedisch!) und berechnen nak > nδ = c + (nδ − c) > bk + (nδ − c) für alle k ≥ N. Wegen nδ − c > 0 ist also die Folge {ck }k mit ck := nak − bk vom Typ A+ , d.h. [n][ak ] − [bk ] = [nak − bk ] > 0 und somit ist nα − β > 0 bzw. nα > β, wie behauptet. 4 q.e.d. Folgen und Reihen Wir betrachten nun reelle Zahlenfolgen {xn }n ⊂ R, vgl. Definition 3.1. Analog zum rationalen Fall erklären wir Definition 4.1: • Eine Folge {xn }n ⊂ R heißt Cauchyfolge, falls zu jedem (reellen) ε > 0 ein N = N (ε) ∈ N existiert mit |xn − xm | < ε für alle m, n ≥ N (ε). • Eine Folge {xn }n ⊂ R heißt Nullfolge, falls zu jedem ε > 0 ein N = N (ε) ∈ N existiert mit |xn | < ε für alle n ≥ N (ε). Definition 4.2: Eine Folge {xn }n ⊂ R nennen wir konvergent gegen α ∈ R, wenn {xn − α}n eine Nullfolge ist. Wir schreiben dann lim xn = α n→∞ oder xn → α (n → ∞). α heißt der Grenzwert der Folge {xn }n . Schließlich nennen wir eine Folge divergent, wenn sie nicht konvergiert. 28 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Bemerkungen: 1. ∞ ist das Symbol für den unendlich fernen Punkt oder einfach Unendlich. 2. Offenbar gilt xn → α (n → ∞) genau dann, wenn |xn − α| → 0 (n → ∞). 3. Geometrische Deutung: Das Intervall (α − ε, α + ε) := {x ∈ R : |x − α| < ε} für α ∈ R und ε > 0 enthält alle reellen Zahlen, die von α einen Abstand kleiner ε haben. Wir nennen (α − ε, α + ε) eine ε-Umgebung von α. Eine Folge konvergiert genau dann gegen α, wenn in jeder ε-Umgebung von α fast alle Glieder der Folge liegen. Dabei bedeutet fast alle“, alle bis auf endlich viele ” Ausnahmen. 4. Der Grenzwert einer Folge {xn }n ⊂ R ist eindeutig bestimmt. Gäbe es nämlich α, β ∈ R mit xn → α und xn → β für n → ∞, dann finden wir zu beliebig vorgegebenem ε > 0 ein N = N (ε) ∈ N mit |xn − α| < 2ε und |xn − β| < 2ε für alle n ≥ N . Daher folgt insbesondere für n = N : |α − β| ≤ |α − xN | + |β − xN | < ε. Also muss α = β gelten. Aus der Konstruktion der reellen Zahlen folgt nun unmittelbar der Hilfssatz 4.1: Ist {xn }n eine rationale Cauchyfolge und α := [xn ], so folgt xn → α (n → ∞). Beweis: Ist ε = [εn ] ∈ R mit ε > 0 beliebig, so haben wir zu zeigen, dass ein N (ε) > 0 existiert mit |xk − α| < ε für alle k ≥ N (ε). Wegen ε > 0 gibt es per Definition ein δ > 0 und ein N̂ (ε) ∈ N, so dass εn > δ für alle n ≥ N̂ (ε) gilt. Da nun {xn }n Cauchyfolge ist, gibt es ein N (ε) ≥ N̂ (ε), so dass |xk − xn | < 2δ für alle k, n ≥ N (ε) gilt. Also ist {εn − |xk − xn |}n vom Typ A+ für jedes feste k ≥ N (ε). Und wegen |β| = [|yn |] für beliebiges β = [yn ] ∈ R erhalten wir [ ] 0 < εn − |xk − xn | = [εn ] − [xk − xn ] = ε − |xk − α|, bzw. |xk − α| < ε für alle k ≥ N (ε). q.e.d. Wir werden übrigens in § 5 zeigen, dass auch jede reelle Cauchyfolge einen Grenzwert in R besitzt. Beim Umgang mit Grenzwerten haben wir nun folgende Rechenregeln: Satz 4.1: Seien {xn }n , {yn }n ⊂ R zwei Folgen mit xn → α, yn → β (n → ∞). Dann gelten (a) Es konvergieren auch {xn + yn }n und {xn yn }n mit lim (xn + yn ) = α + β, n→∞ lim (xn yn ) = αβ. n→∞ 4. FOLGEN UND REIHEN 29 (b) Falls zusätzlich β ̸= 0 und yn ̸= 0 für alle n ∈ N richtig ist, so konvergiert auch { xynn }n mit xn α lim = . n→∞ yn β (c) Gilt xn ≥ yn für alle n ≥ N mit einem N ∈ N, so ist auch α ≥ β erfüllt. (d) Jede Teilfolge {xnk }k ⊂ {xn }n (vgl. Definition 3.6) konvergiert und es gilt limk→∞ xnk = α. Wir halten noch die folgende direkte Konsequenz aus Satz 4.1 (a) fest: Folgerung 4.1: Konvergieren {xn }n , {yn }n ⊂ R und sind a, b ∈ R beliebig, so konvergiert auch {axn + byn }n mit lim (axn + byn ) = a lim xn + b lim yn . n→∞ n→∞ n→∞ Beweis von Satz 4.1: (a) folgt analog zu den entsprechenden Aussagen über rationale Cauchyfolgen, Hilfssatz 3.3 (a), aus der Dreiecksungleichung und der Beschränktheit konvergenter Folgen (siehe Satz 4.2 unten). Die Beweise von (c) und (d) sind Übungsaufgaben. Wir zeigen (b): Wegen |β| > 0 gibt es ein N ∈ N mit |yn − β| < |β| 2 für |β| alle n ≥ N . Wir folgern |yn | ≥ |β| − |yn − β| > 2 > 0 und somit x 1 2 n α − = |βxn − αyn | ≤ |βxn − αyn | für n ≥ N. yn β |yn | |β| |β|2 Nach (a) bzw. Folgerung 4.1 konvergiert βxn − αyn → βα − αβ = 0 (n → ∞), also ist { xynn − αβ }n Nullfolge, wie behauptet. q.e.d. Beispiele: 1. Die konstante Folge {a}n = {a, a, a, . . .} für ein a ∈ R konvergiert trivialerweise gegen a. 2. limn→∞ 3n n+1 = 3. Denn es gilt für beliebiges ε > 0: 3 3n 3n − 3(n + 1) − 3 = < ε, = n+1 n+1 n+1 falls n ≥ N (ε) mit N (ε) ≥ 3ε . 3. limn→∞ 2nn = 0. Mit vollständiger Induktion zeigt man nämlich 2n ≥ n2 für alle n ≥ 4 (Übungsaufgabe). Es folgt 21n ≤ n12 bzw. 2nn ≤ n1 und somit n 1 n n − 0 = n ≤ < ε 2 2 n { 1} für n ≥ N > max 3, . ε 30 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN 4. Die Folge {xn }n = {(−1)n }n konvergiert nicht. Sonst müsste z.B. für ε = 1 ein N ∈ N existieren mit |xn − α| < 1 für alle n ≥ N , wobei α ∈ R der Grenzwert der Folge sei. Insbesondere für xn und xn+1 mit n ≥ N hätten wir dann den Widerspruch 2 = |xn − xn+1 | ≤ |xn − α| + |xn+1 − α| < 2. Also ist {(−1)n }n divergent. 5. limn→∞ 5n3 +8n2 n3 −4 = 5. Wir kürzen 5 + 8 n1 5n3 + 8n2 = . n3 − 4 1 − n43 Da { n1 }n Nullfolge ist, konvergieren nach Satz 4.1 (a) und Folgerung 4.1 auch {5 + 8 n1 }n und {1 − 4 n13 }n , nämlich gegen 5 bzw. 1. Satz 4.1 (b) liefert dann lim (5 + 8 n1 ) 5 5n3 + 8n2 n→∞ = = = 5. lim 4 n→∞ n3 − 4 1 lim (1 − n3 ) n→∞ Bevor wir weitere Beispiele untersuchen, benötigen wir noch die folgende Definition 4.3: Eine Folge {xn }n ⊂ R heißt nach oben (bzw. unten) beschränkt, falls ein c ∈ R existiert mit xn ≤ c (bzw. xn ≥ c) für alle n ∈ N. Falls sogar |xn | ≤ c für alle n ∈ N gilt, heißt die Folge beschränkt. Bemerkung: Eine Folge ist genau dann beschränkt, wenn sie nach oben und unten beschränkt ist. Satz 4.2: Jede konvergente Folge {xn }n ⊂ R ist beschränkt. Beweis: Zu ε = 1 existiert ein N ∈ N mit |xn − α| < 1 für alle n ≥ N , wobei α = limn→∞ xn sei. Wir haben also |xn | ≤ |xn − α| + |α| < 1 + |α| für alle n ≥ N. Also ist {xn }n beschränkt mit c := max{1 + |α|, |x1 |, . . . , |xN −1 |}. q.e.d. Bemerkung: Die Umkehrung des Satzes gilt natürlich nicht; z.B. ist {(−1)n }n offenbar beschränkt aber nach obigem Beispiel 4 nicht konvergent. 4. FOLGEN UND REIHEN 31 Beispiele: 1. Fibonacci-Zahlen: f1 := 0, f2 := 1 und rekursiv fn := fn−1 + fn−2 . Das gibt {fn }n = {0, 1, 1, 2, 3, 5, 8, . . .}. Die Folge {fn }n ist unbeschränkt: Durch vollständige Induktion zeigt man nämlich fn ≥ n−2 für alle n ∈ N, und {n − 2}n ist offensichtlich nicht nach oben beschränkt. Nach Satz 4.2 ist die Folge der Fibonacci-Zahlen also divergent. 2. Die Folge {xn }n für ein x ∈ R. Das Konvergenzverhalten hängt von x ab, wir unterscheiden vier Fälle. (i) Für |x| < 1 gilt limn→∞ xn = 0, da nach Hilfssatz 3.1 (b) – der nun natürlich auch in R gilt – zu jedem ε > 0 ein N = N (ε) ∈ N existiert mit |x|N < ε und folglich |xn − 0| = |x|n ≤ |x|N < ε für alle n ≥ N (ε). (ii) Für x = 1 haben wir die konstante Folge {1n }n = {1}n mit limn→∞ 1n = 1. (iii) Für x = −1 haben wir die divergente Folge {(−1)n }n . (iv) Für |x| > 1 ist {xn }n unbeschränkt nach Hilfssatz 3.1 (a), also divergent gemäß Satz 4.2. Definition 4.4: (Bestimmte Divergenz) Eine Folge {xn }n ⊂ R heißt bestimmt divergent gegen +∞ (bzw. gegen −∞), wenn zu jedem c ∈ R ein N ∈ N existiert, so dass xn > c (bzw. xn < c) für alle n ≥ N richtig ist. Wir schreiben dann lim xn = +∞ n→∞ (bzw. lim xn = −∞). n→∞ Bemerkung: Offensichtlich divergiert {xn }n genau dann bestimmt gegen +∞, wenn {−xn }n bestimmt gegen −∞ divergiert. Beispiele: 1. Die Folge {n}n divergiert bestimmt gegen +∞. Das erklärt auch die Schreibweise limn→∞ , die nun eigentlich genauer limn→+∞ lauten müsste. 2. Nach obigem Beispiel divergiert die Folge der Fibonacci-Zahlen bestimmt gegen +∞. 3. Für b > 1 divergiert {bn }n bestimmt gegen +∞, vgl. Hilfssatz 3.1 (a). 32 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN 4. Die Folge {(−1)n n}n ist divergent, aber nicht bestimmt divergent. Ist nämlich (−1)n n > c für ein n ∈ N und ein c ≥ 21 , so folgt für das (n + 1)-te Glied der Folge: (−1)n+1 (n + 1) = −(−1)n n − (−1)n < −c + 1 ≤ c. Satz 4.3: (a) Es sei {xn }n ⊂ R bestimmt divergent gegen +∞ oder −∞. Dann gilt xn ̸= 0 für alle n ≥ n0 mit einem n0 ∈ N, und {xn−1 }n≥n0 ist eine Nullfolge. (b) Es sei {xn }n Nullfolge mit xn > 0 (bzw. xn < 0) für alle n ≥ N . Dann ist {x−1 n }n≥N bestimmt divergent gegen +∞ (bzw. gegen −∞). Beweis: Wir zeigen nur (a) und überlassen (b) zur Übung. Sei {xn }n bestimmt divergent gegen +∞. Dann existiert zu beliebigem ε > 0 ein N (ε) ∈ N mit xn > 1ε für alle n ≥ N (ε). Insbesondere folgt xn > 0 für n ≥ n0 := N (1). Weiter finden wir 0 < x−1 n <ε bzw. |x−1 n |<ε für alle n ≥ N (ε), d.h. {x−1 n }n≥n0 ist Nullfolge. Gilt schließlich limn→∞ xn = −∞, so gehen wir zur negativen Folge {−xn }n über. q.e.d. Bemerkung: Mit den Symbolen +∞, −∞ wird R zu der erweiterten Zahlengeraden R := {−∞} ∪ R ∪ {+∞}, die wir gemäß −∞ < x < +∞ für alle x ∈ R anordnen können. Allerdings ist R kein Körper, wie auch immer Addition und Multiplikation in R erklärt werden. Definition 4.5: (Unendliche Reihen) Sei {xk }k ⊂ R eine Folge, so erklären wir die zugehörigen Partialsummen sn := n ∑ xk = x1 + x2 + . . . + xn . k=1 Die Folge {sn }n ⊂ R der Partialsummen heißt dann (unendliche) Reihe. Konvergiert {sn }n , so sagen wir, dass die zugehörige Reihe konvergiert und schreiben für den Grenzwert (∑ ) ∞ n ∑ xk := lim sn = lim xk . k=1 n→∞ n→∞ k=1 4. FOLGEN UND REIHEN 33 Bemerkungen: ∑ 1. Etwas lax schreiben wir meist auch ∞ k=1 xk für die Folge der Partialsummen, also als Symbol für die Reihe selbst (unabhängig von deren Konvergenz). 2. Eine Reihe ist also eine spezielle Folge, nämlich die von Partialsummen. Umgekehrt kann man jede Folge {yn }n auch durch eine Reihe darstellen, denn es gilt n ∑ yn = y1 + (yk − yk−1 ) (Teleskopsumme). k=2 auf ∑ die Folge der Partialsummen ergibt sich 3. Aus Folgerung 4.1 angewendet ∑∞ sofort:∑Konvergieren k=1 xk und ∞ k=1 yk und sind a, b ∈ R, so konvergiert auch ∞ (ax + by ), und es gilt k k k=1 ∞ ∑ (axk + byk ) = a ∞ ∑ xk + b yk . k=1 k=1 k=1 ∞ ∑ Beispiele: 1. Es gilt limn→∞ n n+1 = limn→∞ yk − yk−1 = 1 1 1+ n = 1. Setzen wir yn = n , n+1 so folgt andererseits k 2 − (k2 − 1) k k−1 1 − = = k+1 k k(k + 1) k(k + 1) für k ≥ 2 und somit ∑ ∑ n 1 ∑ 1 1 = yn = y1 + (yk − yk−1 ) = + = . n+1 2 k(k + 1) k(k + 1) n n n k=2 k=2 k=1 Wir erhalten also ∞ ∑ k=1 ∑ 1 1 n = lim = lim = 1. n→∞ n→∞ n + 1 k(k + 1) k(k + 1) n k=1 2. Unendliche geometrische Reihe: ∞ ∑ xk . Für |x| < 1 gilt nach Satz 2.3 und k=0 einem der obigen Beispiele: ∞ ∑ k=0 k x = lim n→∞ n ∑ k=0 ) 1 − xn+1 1 ( 1 = 1 − x lim xn = . (4.1) n→∞ 1 − x n→∞ 1−x 1−x xk = lim 34 5 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Vollständigkeit reeller Zahlen Wir widmen uns nun wieder dem Studium der reellen Zahlen. Insbesondere werden wir die sogenannte Vollständigkeit“ von R beweisen, die der eigentliche Grund für ” die Konstruktion von R war und die reellen Zahlen gegenüber den rationalen Zahlen auszeichnet. Aus der Vollständigkeit folgt auch die Lösbarkeit der Gleichung xs = c in R, wobei s ∈ N beliebig und c ∈ R positiv ist. Wir beginnen mit der Definition 5.1: Eine Menge M ⊂ R heißt dicht in R, falls es zu jedem x ∈ R eine Folge {xn }n ⊂ M so gibt, dass lim xn = x gilt. n→∞ Bemerkung: Ist M ⊂ R dicht in R, so lässt sich jede reelle Zahl also beliebig gut durch Elemente aus M approximieren. Natürlich liegt R selbst dicht in R. Erstes Hauptziel des Paragraphen ist der folgende Satz 5.1: Q liegt dicht in R. Für den Beweis benötigen wir noch die anschließende einfache Folgerung des Archimedischen Axioms: Hilfssatz 5.1: Zu jeder Zahl x ∈ R existiert genau ein ν ∈ Z, so dass ν ≤ x < ν + 1 richtig ist. Beweis: Übungsaufgabe! Beweis von Satz 5.1: Zu gegebenem x ∈ R konstruieren wir mittels vollständiger Induktion eine Folge {xn }n ⊂ Q von Dezimalbrüchen xn = n ∑ ak · 10−k ∈ Q mit a0 ∈ Z, ak ∈ {0, 1, . . . , 9} für k ∈ N, k=0 so dass xn → x (n → ∞) erfüllt ist. 1. Sei zunächst 0 ≤ x < 1 richtig. Wir behaupten, dass dann eine Folge {ak }k ⊂ {0, 1, . . . , 9} und eine Nullfolge {ξn }n ⊂ R so existieren, dass für alle n ∈ N gilt n ∑ x= ak · 10−k + ξn und 0 ≤ ξn < 10−n . (5.1) k=1 Offenbar folgt daraus die Behauptung mit a0 = 0. (IA) n = 1. Wegen 0 ≤ x · 10 < 10 und Hilfssatz 5.1 existiert ein a1 ∈ {0, 1, 2, . . . , 9}, so dass a1 ≤ x·10 < a1 +1 richtig ist. Mit ξ1 := x−a1 ·10−1 haben wir dann x = a1 · 10−1 + ξ1 und 0 ≤ ξ1 < 10−1 . 5. VOLLSTÄNDIGKEIT REELLER ZAHLEN 35 (IS) n → n + 1: Angenommen wir haben die Darstellung (5.1) für ein n ∈ N. Dann ist 0 ≤ ξn ·10n+1 < 10 richtig und wieder nach Hilfssatz 5.1 existiert ein an+1 ∈ {0, 1, . . . , 9} mit an+1 ≤ ξn · 10n+1 < an+1 + 1. Setzen wir noch ξn+1 := ξn − an+1 · 10−(n+1) , so finden wir (IV ) x = n ∑ ak 10−k + ξn = k=1 n+1 ∑ ak · 10−k + ξn+1 k=1 und 0 ≤ ξn+1 < 10−(n+1) , wie behauptet. 2. Sei nun x ∈ R beliebig. Nach Hilfssatz 5.1 existiert ein ν ∈ Z mit ν ≤ x < ν +1. Dann gilt für y := ∑x − ν natürlich 0 ≤ y < 1 und nach 1) existiert eine Folge {yn }n mit yn = nk=1 ak · 10−k , ak ∈ {0, 1, . . . , 9}, so dass yn → y (n → ∞) richtig ist. Also hat xn := ν + yn die gesuchte Form mit a0 := ν ∈ Z, und es gilt xn → x (n → ∞), wie behauptet. q.e.d. Bemerkung: Der Beweis von Satz 5.1 bestätigt übrigens unsere Vorstellung, dass sich jede reelle Zahl als (unendlicher) Dezimalbruch darstellen lässt. Wir haben hier nämlich ∞ ∑ ak · 10−k = a0 , a1 a2 a3 . . . x = lim n→∞ k=0 gezeigt. Allerdings ist diese Darstellung nicht eindeutig, denn z.B. lässt sich die Zahl 1 sowohl als 1, 00000 . . . schreiben, als auch als 0, 999999 . . . = ∞ ∑ n=1 9 · 10−n = 9 · ∞ ( ∑ 1 )n 9 (4.1) −9 = 1 − 9 = 1. 10 1 − 10 n=0 Das zentrale Ergebnis dieses Paragraphen (und eigentlich des gesamten Kapitels) ist nun der folgende Satz 5.2: (Cauchysches Konvergenzkriterium) Eine Folge {xn }n ⊂ R ist genau dann konvergent, wenn {xn }n eine Cauchyfolge ist. Definition 5.2: Ein bewerteter Körper K heißt vollständig, wenn jede Cauchyfolge {xn }n ⊂ K einen Grenzwert x ∈ K besitzt. Bemerkungen: 1. Obiger Satz enthält also die Aussage, dass R vollständig ist; genau das ist die zusätzliche Eigenschaft von R gegenüber Q. 36 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN 2. Wir haben Cauchyfolgen und Konvergenz bisher nur in R erklärt. Hierzu benötigt man aber nur einen Abstandsbegriff“, der in bewerteten Körpern ” erklärt ist; vgl. Satz 1.4 und die anschließende Bemerkung. Insbesondere ist Definition 5.2 in C sinnvoll, vgl. § 7. Beweis von Satz 5.2: • ⇒“: Sei {xn }n konvergent mit Grenzwert x ∈ R. Dann existiert zu jedem ” ε > 0 ein N = N (ε) ∈ N mit |xn − x| < 2ε für alle n ≥ N . Folglich haben wir |xn − xm | ≤ |xn − x| + |xm − x| < ε für alle m, n ≥ N (ε), d.h. {xn }n ist Cauchyfolge. • ⇐“: Sei nun {xn }n Cauchyfolge. Dann existiert zu beliebigem ε > 0 ein ” N = N (ε) ∈ N, so dass |xn − xm | < 2ε für alle m, n ≥ N (ε). Zu jedem xn , n ∈ N, existiert nach Satz 5.1 ein an ∈ Q mit |xn − an | < 4ε . Somit folgt |an − am | ≤ |an − xn | + |xn − xm | + |xm − am | < ε für alle m, n ≥ N (ε). Also ist {an }n eine rationale Cauchyfolge und nach Hilfssatz 4.1 gilt an → x (n → ∞) mit der reellen Zahl x := [an ]. Wählen wir noch N̂ (ε) ∈ N so groß, dass |x − an | < 3ε 4 für alle n ≥ N̂ (ε), so erhalten wir schließlich |x − xn | ≤ |x − an | + |an − xn | < 3ε ε + =ε 4 4 für alle n ≥ N̂ (ε), d.h. die Folge {xn }n konvergiert gegen x. q.e.d. So kompakt sich das Cauchysche Konvergenzkriterium auch formulieren lässt, so ist es doch etwas unanschaulich. Genau umgekehrt verhält es sich mit dem folgenden, praktischen Intervallschachtelungs-Prinzip: Zunächst benötigen wir aber noch die Definition 5.3: (Intervalle reeller Zahlen) Zu a, b ∈ R erklären wir: • offenes Intervall: (a, b) := {x ∈ R : a < x < b}. • abgeschlossenes Intervall: [a, b] := {x ∈ R : a ≤ x ≤ b}. • halboffene Intervalle: (a, b] := {x ∈ R : a < x ≤ b}, [a, b) := {x ∈ R : a ≤ x < b}. Die Punkte a und b heißen Endpunkte des Intervalls. 5. VOLLSTÄNDIGKEIT REELLER ZAHLEN 37 Bemerkungen: 1. Für a > b sind alle angegebenen Intervalle leer. Für a = b sind offene und halboffene Intervalle leer, während das abgeschlossene Intervall [a, a] nur den Punkt a enthält. 2. Es kann auch a = −∞ und b = +∞ gewählt werden, wenn der jeweilige Endpunkt nicht zum Intervall gehört. 3. Mit |I| = diam(I) := b − a ≥ 0 bezeichnen wie den Durchmesser oder Länge eines nichtleeren Intervalls I mit den Endpunkten a ≤ b. Offensichtlich gilt für beliebige x, x′ ∈ I dann |x − x′ | ≤ |I|. Satz 5.3: (Intervallschachtelungsprinzip) Es sei I1 ⊃ I2 ⊃ . . . ⊃ In ⊃ In+1 ⊃ . . . eine absteigende Folge von nichtleeren abgeschlossenen Intervallen in R mit der Eigenschaft lim |In | = 0. (5.2) ∩ Dann gibt es genau eine reelle Zahl x mit x ∈ In für alle n ∈ N, d.h. {x} = In . n→∞ n∈N Bemerkung: Die Aussage scheint offensichtlich: Eine Folge von ineinander liegenden Intervallen, deren Durchmesser gegen 0 geht, zieht sich auf einen Punkt zusammen. Jedoch wird die Aussage in Q falsch, da der gemeinsame Punkt dann keine rationale Zahl sein muss. Beweis von Satz 5.3: Schreiben wir In = [an , bn ], so besagt Formel (5.2), dass zu jedem ε > 0 ein N = N (ε) ∈ N existiert mit 0 ≤ bn − an < ε für alle n ≥ N (ε). Sind nun m, n ≥ N , so folgt am , an ∈ IN und somit |an − am | ≤ |IN | = bN − aN < ε für alle m, n ≥ N (ε), d.h. {an }n ist eine Cauchyfolge. Nach Satz 5.2 existiert daher ein Punkt x ∈ R mit limn→∞ an = x. Nun gilt am ≤ an ≤ bm für beliebiges m ∈ N und alle n ≥ m. Gemäß Satz 4.1 (c) liefert der Grenzübergang n → ∞ nun am ≤ x ≤∩bm bzw. x ∈ Im für alle m ∈ N. Gäbe es schließlich ein weiteres Element x′ ∈ n∈N In , so hätten wir für beliebiges ε > 0: |x − x′ | ≤ bN − aN < ε mit dem oben bestimmten N = N (ε). Also folgt x = x′ . q.e.d. Bemerkung: Die Konstruktion zeigt, dass für eine Intervallschachtelung mit In = ∩ [an , bn ] und {x} = In gilt n∈N lim an = x = lim bn . n→∞ n→∞ 38 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Satz 5.4: Sei c > 0 eine beliebige reelle Zahl. Dann besitzt die Gleichung xs = c für jedes s ∈ N genau eine positive Lösung x ∈ R. Beweis: • Eindeutigkeit: Sind x1 , x2 ∈ R zwei positive Lösungen von xs1 = xs2 = c, so folgt aus der Summenformel der geometrischen Reihe: 0 = xs1 − xs2 = (x1 − x2 ) s−1 ∑ xj1 x2s−j−1 , j=0 also x1 = x2 . • Existenz: (i) Sei zunächst c ∈ (0, 1). Wir konstruieren induktiv eine Intervallschachtelung I1 ⊃ I2 ⊃ . . ., für die gilt: ( 1 )n−1 In := [an , bn ], |In | = , asn ≤ c ≤ bsn für alle n ∈ N. (5.3) 2 Setzen wir I1 = [a1 , b1 ] := [0, 1], so gilt (5.3) offenbar für n = 1. Haben wir die gesuchte Schachtelung bis zu einem n ∈ N konstruiert, so setzen wir xn := 21 (an + bn ) ∈ In und erklären { [an , xn ], falls xsn ≥ c In+1 = [an+1 , bn+1 ] := . [xn , bn ], falls xsn < c Dann ist offenbar In+1 ⊂ In richtig, und wir haben |In+1 | = 21 ( 12 )n−1 = ( 21 )n sowie asn+1 ≤ c ≤ bsn+1 , also (5.3) für n + 1. ∩ Nach Satz 5.3 existiert nun genau ein x ∈ n∈N In , d.h. an ≤ x ≤ bn und somit s s s an ≤ x ≤ bn für alle n ∈ N. Nun liefert auch Jn := [asn , bsn ] eine Intervallschachtelung, denn offenbar gilt Jn+1 ⊂ Jn für alle n ∈ N und wir berechnen |Jn | = bsn − asn = (bn − an ) Da aber nun c, xs ∈ ∩ n∈N ( 1 )n−1 → 0 (n → ∞). ajn bs−j−1 ≤s n 2 j=0 s−1 ∑ Jn richtig ist, liefert Satz 5.3: xs = c. (ii) Für c = 1 löst offenbar x = 1 die Gleichung xs = c. Für c > 1 ist c̃ := c−1 ∈ (0, 1) erfüllt. Mit der in (i) konstruierten positiven Lösung x̃ der Gleichung x̃s = c̃ löst dann x := x̃−1 > 0 die Gleichung xs = c. q.e.d. Definition 5.4: Die in Satz 5.4 konstruierte eindeutige Lösung x > 0 von xs = c √ heißt s-te Wurzel von c > 0, und wir schreiben s c. Ist q = rs ∈ Q (r ∈ Z, s ∈ N) beliebig, so setzen wir für die q-te Potenz von c > 0: √ r cq = c s := ( s c)r . Bemerkung: Für alle x, y > 0 und p, q ∈ Q gelten die Rechenregeln xp y p = (xy)p , xp xq = xp+q , (xp )q = xpq . Ebenfalls mittels Intervallschachtelung beweisen wir den fundamentalen 5. VOLLSTÄNDIGKEIT REELLER ZAHLEN 39 Satz 5.5: (Bolzano–Weierstraß) Jede beschränkte Folge {xn }n ⊂ R besitzt eine konvergente Teilfolge. Beweis: Da {xn }n beschränkt ist, existiert ein c > 0 mit −c ≤ xn ≤ c für alle n ∈ N. Wir konstruieren nun eine Intervallschachtelung I1 ⊃ I2 ⊃ . . . mit den Eigenschaften • Ik enthält unendlich viele Glieder der Folge {xn }n , • |Ik | = 2c · ( 12 )k−1 für alle k ∈ N. Wir starten dazu mit I1 := [−c, c] und definieren im k-ten Schritt Ik+1 wie folgt: Ist Ik = [ak , bk ], so setzen wir yk := 12 (ak + bk ) und erklären [ak , yk ], falls [ak , yk ] unendlich viele Glieder von {xn }n enthält Ik+1 = [ak+1 , bk+1 ] := . [yk , bk ], sonst Wir konstruieren nun eine Teilfolge {xnk }k mit xnk ∈ Ik für alle k ∈ N induktiv wie folgt: • Für k = 1 setzen wir n1 = 1, also xn1 = x1 ∈ I1 . • Ist xnk ∈ Ik für ein k ∈ N, so existiert per Konstruktion ein nk+1 > nk mit xnk+1 ∈ Ik+1 (da in Ik+1 wieder unendlich viele Glieder von {xn }n liegen). Wir haben also ak ≤ xnk ≤ bk für alle k ∈ N. Nach Satz 5.3 und der anschließenden Bemerkung liefert der Grenzübergang k → ∞: x = lim ak ≤ lim xnk ≤ lim bk = x k→∞ k→∞ k→∞ mit einem x ∈ R. Also konvergiert {xnk }k gegen x, wie behauptet. q.e.d. Definition 5.5: x ∈ R heißt Häufungswert einer Folge {xn }n , wenn es eine Teilfolge {xnk }k gibt mit lim xnk = x. k→∞ Satz 5.5 besagt also: Jede beschränkte Folge hat einen Häufungswert. Beispiele: 1. {(−1)n }n besitzt die Häufungswerte −1 und +1. 2. {n}n besitzt keine Häufungswerte, da jede Teilfolge unbeschränkt und damit nach Satz 4.2 divergent ist. 3. Es gibt aber auch unbeschränkte Folgen mit Häufungswerten, z.B. hat {[1 + (−1)n ]n}n den Häufungswert 0, da gilt x2k−1 = 0 für alle k ∈ N. 40 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Definition 5.6: Eine Folge {xn }n ⊂ R heißt (i) monoton wachsend (bzw. fallend), falls xn ≤ xn+1 (bzw. xn ≥ xn+1 ) für alle n ∈ N gilt. (ii) streng monoton wachsend (bzw. fallend), falls xn < xn+1 (bzw. xn > xn+1 ) für alle n ∈ N richtig ist. Bemerkung: Die Sprechweise ist leider nicht eindeutig. In der Literatur wird häufig z.B. für monoton wachsende Folge auch schwach monoton wachsende“ oder mo” ” noton nicht fallende“ Folge geschrieben. Satz 5.6: (Monotone Konvergenz) Jede beschränkte monotone Folge {xn }n ⊂ R ist konvergent. Beweis: Sei {xn }n monoton fallend. Da {xn }n beschränkt ist, existiert nach dem Satz von BolzanoWeierstraß eine konvergente Teilfolge {xnk }k . Aus der Relation xnk ≥ xnl für alle k ≤ l erhalten wir nach Grenzübergang l → ∞ die Ungleichung xnk ≥ x := lim xnl l→∞ für alle k ∈ N. Zu beliebigem ε > 0 gibt es nun ein k0 = k0 (ε) ∈ N mit |xnk − x| < ε für alle k ≥ k0 (ε). Wir setzen N = N (ε) := nk0 (ε). Für jedes n ≥ N existiert dann ein k ≥ k0 mit nk ≤ n < nk+1 . Die Monotonie liefert nun xnk ≥ xn ≥ xnk+1 ≥ x, bzw. xnk − x ≥ xn − x ≥ 0. Zusammen mit der Konvergenz der Teilfolge {xnk }k folgt |xn − x| ≤ |xnk − x| < ε für alle n ≥ N (ε), wie behauptet. Der Fall einer monoton wachsenden Folge {xn }n ergibt sich nun durch Übergang zur monoton fallenden Folge {−xn }n . q.e.d. Bemerkung: Satz 5.6 liefert ein handliches Konvergenzkriterium. Z.B. ist jeder Dezimalbruch monoton wachsend.; vgl. Satz 5.1. Übrigens ist jede monoton wachsende Folge nach unten beschränkt, nämlich durch x1 . Entsprechend ist jede monoton fallende Folge nach oben durch x1 beschränkt. 6 Punktmengen in R Ist M eine Menge mit endlich vielen Elementen, so kann man diese mittels 1, 2, . . . , n durchnummerieren: M = {a1 , a2 , . . . , an } mit n = Anzahl der Elemente. Wir sagen, M ist abzählbar. Um die Situation für unendliche Mengen zu untersuchen, erinnern wir zunächst an den Begriff einer Bijektion oder bijektiven Abbildung f : M → N zwischen zwei Mengen M, N : • f ist surjektiv, falls zu jedem y ∈ N ein x ∈ M mit f (x) = y existiert, d.h. f (M ) = N . 6. PUNKTMENGEN IN R 41 • f ist injektiv, falls für x1 , x2 ∈ M mit x1 ̸= x2 gilt f (x1 ) ̸= f (x2 ). • f ist bijektiv, wenn f surjektiv und injektiv ist. Definition 6.1: Eine unendliche Menge M heißt (unendlich) abzählbar, wenn eine Bijektion f : N → M existiert. Anderenfalls heißt M überabzählbar. Bemerkungen: 1. Ist M unendlich abzählbar, so gibt es also eine Folge {xn }n , so dass M = {xn : n ∈ N}. Wir schreiben auch kurz (und etwas unexakt) M = {xn }n . 2. Zwei Mengen M, N , für die eine Bijektion f : M → N existiert, heißen gleichmächtig. Eine unendlich abzählbare Menge ist also gleichmächtig zu den natürlichen Zahlen. Beispiele: 1. Die Menge N der natürlichen Zahlen ist abzählbar mit der identischen Abbildung f : N → N, n 7→ n. 2. Die ganzen Zahlen Z sind abzählbar mit der Bijektion { 1 falls n gerade ist 2 n, , f (n) := 1 (1 − n), falls n ungerade ist 2 n ∈ N. 3. Sind M und N abzählbar, so ist auch M ∪ N abzählbar. Deutlich allgemeiner gilt der folgende Satz 6.1: Die Vereinigung abzählbar vieler abzählbarer Mengen Mn , n ∈ N, ist abzählbar. Beweis: Wir schreiben Mn = {xnm : m ∈ N} für n ∈ N. Die Elemente der Vereinigungsmenge ∪ Mn = {xnm : m, n ∈ N} n∈N können wir wie folgt abzählen: M1 : M2 : M3 : M4 : .. . x11 → ↙ x21 ↓ ↗ x31 ↙ x41 ↓ x12 x22 x32 x42 . ↗ .. x13 → x14 ↗ ↙ x23 x24 ↙ ↗ x33 x34 ↗ x43 x44 .. .. . . ... ↗ ... ... , ... 42 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN also mit der Abzählung y1 := x11 , y2 := x12 , y3 := x21 , y4 := x31 , . . . Eventuell doppelt auftretende Elemente werden bei der Abzählung einfach übergangen. q.e.d. Folgerung 6.1: Die Menge der rationalen Zahlen ist abzählbar. Beweis: Wir setzen Mn := { m n : m ∈ Z} für n ∈ N. Da Z abzählbar ist, ist auch Mn abzählbar für jedes n ∈ N. Und nach Satz 6.1 gilt dies auch für die Vereinigung {m } ∪ Mn = : m ∈ Z, n ∈ N = Q, n n∈N wie behauptet. q.e.d. Folgerung 6.1 besagt, dass die rationalen Zahlen gleichmächtig zu den natürlichen Zahlen sind. Diese Aussage wird für die reellen Zahlen falsch: Satz 6.2: Die Menge der reellen Zahlen ist überabzählbar. Beweis (Cantorsches Diagonalverfahren): Wir zeigen, dass bereits die Menge (0, 1) = {x ∈ R : 0 < x < 1} überabzählbar ist. Wäre nämlich (0, 1) abzählbar, so gäbe es eine Folge {xn }n mit (0, 1) = ∞ ∑ {xn : n ∈ N}. Nach Satz 5.1 können wir jedes xn als Dezimalbruch darstellen: xn = anm · 10−m m=1 mit anm ∈ {0, 1, . . . , 9} für alle n, m ∈ N, also x1 = 0, a11 a12 a13 a14 . . . , x2 = 0, a21 a22 a23 a24 . . . , x3 = 0, a31 a32 a33 a34 . . . , x4 = 0, a41 a42 a43 a44 . . . Wir betrachten nun y = ∞ ∑ cm · 10−m ∈ (0, 1) mit m=1 { cm := amm + 2, falls amm ≤ 4, amm − 2, falls amm > 4 . Dann gilt also |cm − amm | = 2 für alle m ∈ N. Also unterscheidet sich y von xm an der m-ten Nachkommastelle mindestens um 2, so dass folgt |y − xm | ≥ 10−m für alle m ∈ N und insbesondere y ̸∈ {xn : n ∈ N}. Also war die Annahme falsch, d.h. (0, 1) und damit auch R sind überabzählbar. q.e.d. Folgerung 6.2: Die Menge der irrationalen Zahlen R \ Q ist überabzählbar. Beweis: Anderenfalls wäre nach Folgerung 6.1 auch (R \ Q) ∪ Q = R abzählbar, im Widerspruch zu Satz 6.2. q.e.d. Wir untersuchen nun Teilmengen von R genauer und beginnen mit der 6. PUNKTMENGEN IN R 43 Definition 6.2: Eine Menge M ⊂ R heißt nach oben (bzw. unten) beschränkt, wenn ein c ∈ R existiert mit x≤c (bzw. x ≥ c) für alle x ∈ M. Man nennt dann c obere (bzw. untere) Schranke von M . Schließlich heißt die Menge M beschränkt, wenn sie sowohl nach oben als auch nach unten beschränkt ist. Bemerkungen: 1. M ist genau dann beschränkt, wenn ein c > 0 existiert mit |x| ≤ c für alle x ∈ M. 2. Die zu einer beschränkten Folge {xn }n ⊂ R gehörige Menge {xn : n ∈ N} ist offenbar beschränkt. Definition 6.3: (a) Ist M ⊂ R nach oben beschränkt, so heißt σ ∈ R kleinste obere Schranke oder Supremum von M , i.Z. σ = sup M , falls folgendes gilt: (i) σ ist obere Schranke von M , d.h. x ≤ σ für alle x ∈ M . (ii) Für jede weitere obere Schranke σ̂ von M gilt σ ≤ σ̂. (b) Entsprechend heißt τ ∈ R größte untere Schranke oder Infimum, i.Z. τ = inf M , zu einer nach unten beschränkten Menge M ⊂ R, wenn gilt (i) τ ist untere Schranke von M . (ii) Für jede weitere untere Schranke τ̂ von M gilt τ ≥ τ̂ . Aus der Definition ist sofort klar, dass Infimum und Supremum, wenn sie existieren, eindeutig bestimmt sind. Außerdem haben wir die folgende Charakterisierung von Infimum und Supremum: Hilfssatz 6.1: Sei M ⊂ R nach oben beschränkt. Dann gilt σ = sup M genau dann, wenn σ obere Schranke ist und zu jedem ε > 0 ein x ∈ M existiert mit x ≥ σ − ε. Entsprechend ist τ = inf M für eine nach unten beschränkte Menge M ⊂ R genau dann richtig, wenn τ untere Schranke ist und zu jedem ε > 0 ein x ∈ M existiert mit x ≤ τ + ε. Beweis: Übungsaufgabe! Satz 6.3: Jede nichtleere, nach oben (bzw. unten) beschränkte Menge M ⊂ R besitzt ein Supremum (bzw. Infimum). 44 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Beweis: Wir zeigen nur die Existenz des Supremums. Die des Infimums folgt dann durch Übergang zur Menge −M := {x ∈ R : −x ∈ M }. Zum Beweis betrachten wir wieder eine Intervallschachtelung: Wir konstruieren Intervalle In = [xn , cn ] mit In+1 ⊂ In für alle n ∈ N, so dass gilt: |In | ≤ ( 1 )n−1 2 (c1 − x1 ), xn ∈ M, cn ist obere Schranke an M. (6.1) • n = 1: Da M nichtleer und nach oben beschränkt ist, existiert ein x1 ∈ M und ein c1 mit x ≤ c1 für alle x ∈ M . • n → n + 1: Sei In = [xn , cn ] konstruiert mit den Eigenschaften (6.1). Dann setzen wir yn := 12 (xn + cn ) und erklären In+1 wie folgt: (i) Falls M ∩ [yn , cn ] = ∅, dann ist yn obere Schranke an M und wir setzen xn+1 := xn ∈ M , cn+1 := yn . (ii) Falls M ∩ [yn , cn ] ̸= ∅, so existiert ein xn+1 ≥ yn mit xn+1 ∈ M . Dann setzen wir cn+1 := cn . Offenbar ist dann (6.1) erfüllt für In+1 und wir haben In+1 ⊂ In . Nach Satz 5.3 und der ∩ anschließenden Bemerkung konvergieren die Folgen {xn }n und {cn }n gegen σ ∈ n∈N In . Wir zeigen noch σ = sup M : Wegen x ≤ cn für alle x ∈ M und n ∈ N liefert Grenzübergang x ≤ σ für alle x ∈ M , d.h. σ ist obere Schranke. Gäbe es eine obere Schranke σ̂ < σ, so wäre σ − σ̂ > 0. Wegen limn→∞ xn = σ existierte dann ein N ∈ N mit |xN − σ| < σ − σ̂ und folglich xN ≥ σ − |xN − σ| > σ − (σ − σ̂) = σ̂, im Widerspruch zu xN ∈ M . q.e.d. Beispiele: 1. Sei [a, b) ein halboffenes Intervall mit a < b. Dann gilt inf[a, b) = a, sup[a, b) = b. In der Tat ist a offenbar untere Schranke von [a, b) := {x ∈ R : a ≤ x < b}. Und jede weitere untere Schranke a′ muss a′ ≤ a erfüllen, d.h. a = inf[a, b). Andererseits ist offenbar b obere Schranke für [a, b). Und ist ε > 0 beliebig gewählt, so setzen wir x := max{a, b − ε}. Dann ist x ∈ [a, b) und x ≥ b − ε richtig, und nach Hilfssatz 6.1 gilt b = sup[a, b). : n ∈ N} ist inf A = 1 erfüllt, denn es gelten n+1 > 1 für alle n ∈ N und 2. Für A := { n+1 n n n+1 ≤ 1 + ε für beliebiges ε > 0 und hinreichend großes n ∈ N. lim n = 1, also auch n+1 n n→∞ 6. PUNKTMENGEN IN R 45 Bemerkungen: 1. Obige Beispiele zeigen, dass inf M zur Menge M dazu gehören kann oder nicht. Wenn inf M ∈ M gilt, so schreiben wir auch min M := inf M für das Minimum von M . Ebenso sprechen wir vom Maximum von M , falls sup M ∈ M gilt und schreiben dann max M := sup M . Man beachte, dass für Mengen mit endlich vielen Elementen immer min M = inf M und max M = sup M erfüllt sind. 2. Für nach oben bzw. nach unten unbeschränkte Mengen M ⊂ R schreiben wir auch sup M = +∞ bzw. inf M = −∞. Wir wenden uns nun wieder reellen Folgen zu. In Definition 5.5 haben wir den Begriff des Häufungswertes einer Folge {xn }n als Grenzwert einer Teilfolge {xnk }k erklärt. Betrachtet man alle Häufungswerte einer Folge, wird man auf die folgenden Begriffe geführt: Definition 6.4: Sei {xn }n ⊂ R eine beschränkte Folge und bezeichne H die Menge ihrer Häufungswerte. Wir setzen dann lim inf xn := inf H (Limes inferior), n→∞ lim sup xn := sup H (Limes superior). n→∞ Bemerkung: Offenbar ist H beschränkt, wenn {xn }n beschränkt ist. Man beachte noch lim inf (−xn ) = − lim sup xn , lim sup(−xn ) = − lim inf xn . n→∞ n→∞ n→∞ n→∞ Beispiel: Die Folge {xn }n = {(−1)n + n1 }n ist offenbar beschränkt und wir haben die konvergenten Teilfolgen x2k = 1 + 1 → 1 (k → ∞), 2k x2k−1 = −1 + 1 → −1 (k → ∞). 2k − 1 Also gilt H = {−1, 1} und lim inf n→∞ xn = −1, lim supn→∞ xn = 1. Man beachte, dass lim inf n→∞ xn und lim supn→∞ xn zu H gehören. Dies ist immer so: Satz 6.4: lim inf n→∞ xn ist der kleinste, lim supn→∞ xn der größte Häufungswert einer beschränkten Folge {xn }n ⊂ R, d.h. lim inf xn = min H, n→∞ lim sup xn = max H. n→∞ 46 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Beweis: Wir haben zu zeigen, dass ξ := lim inf n→∞ xn = inf H ∈ H richtig ist, also eine Teilfolge {xnk }k mit limk→∞ xnk = ξ existiert. Angenommen es gäbe keine solche Teilfolge. Dann existiert also ein ε > 0 und ein N ∈ N, so dass |ξ − xn | ≥ ε für alle n ≥ N erfüllt ist. Andererseits ist ξ = inf H, nach Hilfssatz 6.1 gibt es also ein y ∈ H mit ε ξ≤y≤ξ+ . 2 (6.2) (6.3) Zum Häufungswert y ∈ H existiert eine Teilfolge {xnk }k von {xn }n mit xnk → y (k → ∞). Wir wählen nun k̂ so groß, dass nk̂ ≥ N und |xnk̂ − y| < 2ε gilt. Wegen ξ ≤ y haben wir dann ξ − xnk̂ ≤ y − xnk̂ < 2ε und folglich liefert (6.2) sogar ξ ≤ xnk̂ − ε. Aus (6.3) folgt schließlich xnk̂ < (6.3) ε + y ≤ ξ + ε ≤ xnk̂ − ε + ε = xnk̂ , 2 also der Widerspruch xnk̂ < xnk̂ . Somit muss doch lim inf n→∞ xn ∈ H gelten. Durch Übergang zur Folge {−xn }n folgt schließlich noch lim supn→∞ xn ∈ H. q.e.d. Satz 6.5: (Charakterisierung von lim sup) Sei {xn }n ⊂ R eine beschränkte Folge und η ∈ R. Dann ist η = lim supn→∞ xn genau dann erfüllt, wenn gilt: (i) η ist Häufungswert von {xn }n . (ii) Für alle ε > 0 existiert ein N = N (ε) ∈ N, so dass gilt xn < η + ε für alle n ≥ N (ε). Beweis: • ⇒“: Sei also η = lim supn→∞ xn . Nach Satz 6.4 ist dann η ∈ H, also (i) erfüllt. ” Wäre (ii) falsch, so gäbe es ein ε > 0 und eine Teilfolge {x′k }k = {xnk }k mit x′k ≥ η + ε für alle k ∈ N. (6.4) Da {x′k }k beschränkt ist, existiert nach dem Satz von Bolzano–Weierstraß eine weitere Teilfolge {x′kl }l ⊂ {x′k }k ⊂ {xn }n und ein ζ ∈ R mit x′kl → ζ (l → ∞). Also ist ζ ∈ H und somit ζ ≤ η. Andererseits liefert aber (6.4) angewendet auf {x′kl }l nach Grenzübergang l → ∞: ζ ≥ η + ε, Widerspruch! • ⇒“: Seien nun (i) und (ii) erfüllt. Wäre η ̸= lim supn→∞ xn = max H, so gäbe ” es ein ζ ∈ H mit ζ > η. Wir setzen ε := ζ−η 2 . Für die Teilfolge {xnk }k mit limk→∞ xnk = ζ existiert dann ein k̂ ∈ N, so dass nk̂ ≥ N (ε) und |xnk̂ − ζ| < ε richtig ist. Aus (ii) für n = nk̂ erhalten wir dann xnk̂ < η + ε = η + ζ −η ζ −η =ζ− = ζ − ε < xnk̂ , 2 2 Widerspruch! Also ist η = max H, wie behauptet. q.e.d. 7. DIE KOMPLEXEN ZAHLEN 47 Wir halten noch die entsprechende Aussage für den Limes inferior fest: Satz 6.6: (Charakterisierung von lim inf) Sei {xn }n eine beschränkte Folge und ξ ∈ R. Dann ist ξ = lim inf n→∞ xn genau dann erfüllt, wenn gilt: (i) ξ ist Häufungswert von {xn }n . (ii) Für alle ε > 0 existiert ein N = N (ε) ∈ N, so dass gilt xn > ξ − ε für alle n ≥ N (ε). Bemerkungen: 1. Ohne Beweis notieren wir die Identitäten ( ) lim sup xn = lim sup{xk : k ≥ n} , n→∞ n→∞ ) ( lim inf xn = lim inf{xk : k ≥ n} . n→∞ n→∞ Diese Darstellungen werden häufig auch als Definition von lim sup und lim inf verwendet. Sie sind zwar etwas unanschaulich, haben aber den Vorteil, dass sie auch für unbeschränkte Folgen Sinn machen: Ist {xn }n etwa nach oben unbeschränkt, so ist sup{xk : k ≥ n} = +∞ für alle n ∈ N. Dann setzen wir lim sup xn = +∞. n→∞ Entsprechend ist für eine nach unten unbeschränkte Folge lim inf xn = −∞. n→∞ 2. Als Übungsaufgabe zeige man: Eine Folge {xn }n ⊂ R ist genau dann konvergent gegen α ∈ R, wenn sie beschränkt ist und wenn gilt lim inf xn = α = lim sup xn . n→∞ 7 n→∞ Die komplexen Zahlen Ausgehend von der reellen Ebene R2 = R × R der geordneten Paare z = (x, y) ∈ R2 , wollen wir nun den Körper der komplexen Zahlen C definieren. Hierzu erklären wir Addition und Multiplikation wie folgt: Für z1 = (x1 , y1 ), z2 = (x2 , y2 ) setzen wir z1 + z2 := (x1 + x2 , y1 + y2 ) (komplexe Addition), z1 · z2 = z1 z2 := (x1 x2 − y1 y2 , x1 y2 + x2 y1 ) (komplexe Multiplikation). (7.1) Geometrisch entspricht die Addition in C der Vektoraddition in R2 . Eine geometrische Deutung der komplexen Multiplikation folgt erst im 3. Kapitel. 48 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Satz 7.1: (R2 , +, ·) ist ein Körper mit Nullelement: 0 := (0, 0), Einselement: 1 := (1, 0), negativem Element: zu z = (x, y) setzen wir −z := (−x, −y), ( x −y ) inversem Element: zu z = (x, y) ̸= 0 setzen wir z −1 := x2 +y 2 , x2 +y 2 . Wir schreiben (C, +, ·) oder einfach C für den Körper der komplexen Zahlen. Beweis: 1. Die Axiome (A1) und (A2) sind offensichtlich, indem man die entsprechenden Gesetze für R komponentenweise benutzt. Ebenso folgt auch (A3) mit dem oben erklärten Nullelement. Schließlich haben wir für z = (x, y): (7.1) z + (−z) = ( ) x + (−x), y + (−y) = (0, 0) = 0, also (A4). 2. (M1) ist wieder klar, da die komplexe Multiplikation symmetrisch bezüglich der Vertauschungen x1 ↔ x2 und y1 ↔ y2 ist. Zum Beweis von (M2) betrachten wir z1 = (x1 , y1 ), z2 = (x2 , y2 ), z3 = (x3 , y3 ) und berechnen (z1 z2 )z3 = (x1 x2 − y1 y2 , x1 y2 + x2 y1 ) · (x3 , y3 ) ( ) = (x1 x2 − y1 y2 )x3 − (x1 y2 + x2 y1 )y3 , (x1 x2 − y1 y2 )y3 + (x1 y2 + x2 y1 )x3 und z1 (z2 z3 ) = (x1 , y1 ) · (x2 x3 − y2 y3 , x2 y3 + x3 y2 ) ( ) = x1 (x2 x3 − y2 y3 ) − y1 (x2 y3 + x3 y2 ), x1 (x2 y3 + x3 y2 ) + y1 (x2 x3 − y2 y3 ) . Ein Vergleich der rechten Seiten zeigt (M2). Mit dem oben erklärten Einselement (1, 0) haben wir für beliebiges z = (x, y) ∈ C: z · 1 = (x, y) · (1, 0) = (x · 1 − y · 0, x · 0 + y · 1) = (x, y) = z, also (M3). Schließlich gilt auch (M4), denn wir berechnen mit der Inversen zu z = (x, y) ̸= 0: ( x −y ) zz −1 = (x, y) · , x2 + y 2 x2 + y 2 ( x −y −y x ) = x 2 −y 2 ,x 2 +y 2 2 2 2 x +y x +y x +y x + y2 = (1, 0) = 1. 3. Das Distributivgesetz lässt sich leicht als Übungsaufgabe nachrechnen. Bemerkungen: 1. Wir können wieder Subtraktion und Division erklären: z1 − z2 := z1 + (−z2 ), z1 := z1 · z2−1 , z2 falls z2 ̸= 0. q.e.d. 7. DIE KOMPLEXEN ZAHLEN 49 2. Es gelten alle für beliebige Körper abgeleiteten Rechenregeln. Insbesondere sind Null- und Einselement sowie negatives und inverses Element eindeutig bestimmt. Wir wollen nun den Körper R als Unterkörper von C identifizieren: Hierzu betrachten wir die Teilmenge { } CR := z = (x, y) ∈ C : y = 0 . Für beliebige z1 = (x1 , 0), z2 = (x2 , 0) ∈ CR erhalten wir dann aus (7.1): (x1 , 0) + (x2 , 0) = (x1 + x2 , 0), (x1 , 0) · (x2 , 0) = (x1 · x2 , 0). Also sind mit z1 , z2 ∈ CR auch z1 + z2 , z1 · z2 ∈ CR . Ferner gilt 0, 1 ∈ CR . Und mit z ∈ CR ist offenbar auch −z ∈ CR und für z ̸= 0 auch z −1 ∈ CR richtig. Also ist CR ein Unterkörper von C, d.h. eine Teilmenge von C, die bez. der Rechenoperationen in C einen Körper bildet. Da außerdem die komplexe Addition und Multiplikation von Elementen aus CR in der ersten Komponente den reellen Operationen entsprechen, können wir CR mit R identifizieren durch den Körperisomorphismus: i : R → CR , x 7→ (x, 0). In diesem Sinne gilt also R ⊂ C. Geometrisch: In der komplexen Ebene C werden die Zahlen auf der x-Achse als reelle Zahlen aufgefasst; man spricht daher von der reellen Achse. Die y-Achse heißt imaginäre Achse. Die wichigste komplexe Zahl ist die imaginäre Einheit i := (0, 1). Sie hat die Eigenschaft i2 = (0, 1) · (0, 1) = (−1, 0) = −1, d.h. z = i ist Lösung der Gleichung z 2 + 1 = 0. Mit i berechnen wir für beliebige z = (x, y) ∈ C: x + iy = (x, 0) + (0, 1)(y, 0) = (x, y) = z. (7.2) 50 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Die linke Seite dieser Gleichung werden wir i.F. als Schreibweise für die komplexe Zahl z verwenden, also z = x + iy, x, y ∈ R. Dabei heißt x Realteil und y Imaginärteil von z, und wir schreiben x = Re z, y = Im z. Zwei Zahlen z1 , z2 ∈ C stimmen genau dann überein, wenn sowohl ihr Real- als auch ihr Imaginärteil übereinstimmen. Wir bemerken, dass man mit komplexen Zahlen wie mit reellen rechnen kann, wenn man (7.2) beachtet. Z.B. ist z 2 = (x + iy)2 = x2 + 2ixy + (iy)2 (7.2) = x2 + 2ixy + i2 y 2 = x2 + 2ixy − y 2 richtig, also Re(z 2 ) = x2 − y 2 , Im(z 2 ) = 2xy. Schließlich sei angemerkt, dass C nicht angeordnet werden kann: Gäbe es nämlich den Begriff der Positivität, so dass (O1) und (O2) aus Definition 1.2 erfüllt sind, so folgte daraus z.B. für i ̸= 0 nach Satz 1.3 (f): i2 > 0. Wegen Formel (7.2) ist aber i2 = −1 < 0, denn es gilt 1 = 12 > 0, Widerspruch! Wir werden aber gleich sehen, dass wir C bewerten können. Definition 7.1: Sei z = x + iy ∈ C, so heißt z := x − iy die konjugiert komplexe Zahl zu z; Sprechweisen: z konjugiert“ oder z quer“. Mit ” ” √ |z| := x2 + y 2 bezeichnen wir den Betrag von z. Bemerkungen: 1. Die Konjugation z 7→ z entspricht geometrisch einer Spiegelung an der reellen Achse. Es gelten die Rechenregeln 1 Re z = (z + z), 2 Im z = 1 (z − z) 2i (7.3) sowie z = z, z1 + z2 = z1 + z2 , z1 · z2 = z1 · z2 . (7.4) 7. DIE KOMPLEXEN ZAHLEN 51 2. Der Betrag |z| von z ∈ C entspricht geometrisch dem Abstand zum Nullpunkt (gemessen in der euklidischen Metrik). Es gilt |z|2 = z · z, |z| = |z|. (7.5) Satz 7.2: Der Betrag in C hat folgende Eigenschaften: (a) Es gilt |z| ≥ 0 für alle z ∈ C und |z| = 0 ⇔ z = 0. (b) Für alle z1 , z2 ∈ C ist |z1 z2 | = |z1 | |z2 | erfüllt. (c) Für alle z1 , z2 ∈ C ist |z1 + z2 | ≤ |z1 | + |z2 | richtig. Also ist C ein bewerteter Körper im Sinne von § 1. Bemerkung: Die geometrische Deutung der komplexen Addition als Vektoraddition im R2 erklärt nun auch den Begriff Dreiecksungleichung für die Relation (c). Beweis von Satz 7.2: (a) |z| √ ≥ 0 für alle z ∈ C ist per Definition klar. Und wir bemerken |z| = x2 + y 2 = 0 gdw. x2 + y 2 = 0 gdw. x = y = 0 gdw. z = 0. (b) Für z1 , z2 ∈ C berechnen wir √ (7.4) √ (z1 z2 )(z1 z2 ) = (z1 z2 )(z1 z2 ) √ (7.5) √ (z1 z1 )(z2 z2 ) = |z1 |2 |z2 |2 = |z1 | |z2 |, = |z1 z2 | = |z1 z2 |2 (7.5) = √ wie behauptet. (c) Wir beachten |z| ≥ |Re z| für beliebige z ∈ C. Damit erhalten wir |z1 + z2 |2 (7.5) = (7.4),(7.5) = (7.3) = (b),(7.5) ≤ (z1 + z2 )(z1 + z2 ) (7.4) = z1 z1 + (z1 z2 + z2 z1 ) + z2 z2 |z1 |2 + (z1 z2 + z1 z2 ) + |z2 |2 |z1 |2 + 2Re(z1 z2 ) + |z2 |2 |z1 |2 + 2|z1 | |z2 | + |z2 |2 = (|z1 | + |z2 |)2 , und die Behauptung folgt. q.e.d. Wir wollen nun Punktfolgen {zn }n im Körper C betrachten und erklären in Analogie zu den Definitionen 4.1-4.3: 52 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Definition 7.2: Eine Folge {zn }n ⊂ C heißt • beschränkt, falls ein c > 0 existiert mit |zn | ≤ c für alle n ∈ N. • Cauchyfolge, falls für alle ε > 0 ein N (ε) ∈ N existiert mit |zn − zm | < ε für alle m, n ≥ N (ε). • konvergent gegen z ∈ C, falls für alle ε > 0 ein N (ε) ∈ N existiert mit |zn − z| < ε für alle n ≥ N (ε). Wir schreiben lim zn = z oder zn → z (n → ∞). n→∞ • Nullfolge, falls {zn }n gegen 0 konvergiert. Bemerkung: Nennen wir {ζ ∈ C : |z −ζ| < ε} wieder eine ε-Umgebung von z ∈ C, so konvergiert {zn }n genau dann gegen z, wenn in jeder (noch so kleinen) ε-Umgebung von z fast alle Glieder der Folge liegen. In C ist eine ε-Umgebung von z, geometrisch gesehen, eine (offene) Kreisscheibe um z vom Radius ε > 0; wir schreiben daher auch { } Kε (z) := ζ ∈ C : |z − ζ| < ε . Wir wollen nun zeigen, dass C auch vollständig ist. Zur Vorbereitung notieren wir den folgenden Hilfssatz 7.1: Eine Folge {zn }n ⊂ C ist genau dann konvergent (bzw. Cauchyfolge, Nullfolge, beschränkt), wenn die reellen Folgen {Re(zn )}n und {Im(zn )}n konvergent (bzw. Cauchyfolgen, Nullfolgen, beschränkt) sind. Für konvergente Folgen {zn }n gilt lim zn = lim Re(zn ) + i lim Im(zn ). n→∞ n→∞ n→∞ Beweis: Die Aussagen ergeben sich sofort aus den Relationen |Re z| ≤ |z|, |Im z| ≤ |z|, die man leicht als Übungsaufgabe bestätigt. |z| ≤ |Re z| + |Im z|, q.e.d. Satz 7.3: (Cauchysches Konvergenzkriterium in C) Eine Folge {zn }n ⊂ C ist genau dann konvergent, wenn sie Cauchyfolge ist. Insbesondere ist C ein vollständiger (bewerteter) Körper. 8. KONVERGENZKRITERIEN FÜR REIHEN (IN C) 53 Beweis: Aus Hilfssatz 7.1 und dem Cauchyschen Konvergenzkriterium in R folgern wir: {zn }n ist konvergent HS 7.1 ⇐⇒ {Re(zn )}n , {Im(zn )}n ⊂ R sind konvergent Satz 5.2 ⇐⇒ {Re(zn )}n , {Im(zn )}n ⊂ R sind Cauchyfolgen HS 7.1 ⇐⇒ {zn }n ist Cauchyfolge, wie behauptet. q.e.d. Als Übung beweist man noch den folgenden Satz 7.4: (Rechenregeln für komplexe Grenzwerte) • Ist {zn }n ⊂ C eine konvergente Folge, so konvergiert auch {zn }n und es gilt lim zn = lim zn . n→∞ n→∞ • Ist {ζn }n ⊂ C eine weitere konvergente Folge, so konvergieren auch {zn + ζn }n und {zn · ζn }n mit lim (zn + ζn ) = lim zn + lim ζn , n→∞ n→∞ ) ) ( ( lim (zn · ζn ) = lim zn · lim ζn . n→∞ n→∞ n→∞ n→∞ • Gilt schließlich noch ζn ̸= 0 für alle n ∈ N und limn→∞ ζn ̸= 0, so konvergiert auch { zζnn }n mit (z ) lim zn n lim = n→∞ . n→∞ ζn lim ζn n→∞ 8 Konvergenzkriterien für Reihen (in C) In § 4 haben wir Reihen in R definiert und den Begriff der Konvergenz einer Reihe eingeführt. Mit dem in § 7 gegebenen Konvergenzbegriff ∑ für Folgen in C sagen wir nun entsprechend: Ist {zk }k∈N ⊂ C, so heißt die∑Reihe ∞ k=1 zk konvergent, wenn n die Folge der Partialsummen {s } mit s := z , n ∈ N, konvergiert. Wir n n n k k=1 ∑∞ schreiben wieder z sowohl für die Reihe als auch, wenn existent, für den k=1 k Grenzwert (∑ ) n ∞ ∑ lim sn = lim zk =: zk , n→∞ n→∞ k=1 k=1 54 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN also den Wert oder die Summe der Reihe. Wenden wir Hilfssatz 7.1 auf die Folge ∑∞ {sn }n der Partialsummen an, so folgt ∑ noch: Die komplexe Reihe k=1 zk konvergiert ∑ ∞ genau dann, wenn ∞ Re(z ) und k k=1 k=1 Im(zk ) konvergieren, und es gilt ∞ ∑ zk = k=1 ∞ ∑ Re(zk ) + i k=1 ∞ ∑ Im(zk ). k=1 ∑ Wenn die Reihe ∞ k=1 zk nicht konvergent ist, heißt sie divergent. Wenn zk = xk ∈ R für alle k ∈ N und lim sn = ±∞ n→∞ gilt, so heißt die Reihe bestimmt divergent (gegen ±∞). ∑ Es sei schließlich angemerkt, dass wir natürlich auch Reihen der Form ∞ k=k0 zk mit einem k0 ∈ N0 (oder sogar k0 ∈ Z) betrachten können (und ∑ werden). Falls klar ist, über welche k summiert wird, schreiben wir auch kurz k zk für die Reihe bzw. ihren Wert. Im vorliegenden Paragraphen werden wir eine Anzahl wichtiger Konvergenzkriterien für Reihen kennenlernen, die wir (soweit sinnvoll) in C formulieren und die als Spezialfall natürlich auch für reelle Reihen gelten. Wir beginnen mit dem Konvergenzkriterium für Reihen) Satz 8.1: (Cauchysches ∑∞ Eine Reihe z in C konvergiert genau dann, wenn für beliebige ε > 0 ein k=1 k N = N (ε) ∈ N existiert, so dass gilt ∑ n zk < ε für alle n > m ≥ N (ε). (8.1) k=m+1 Beweis: Wir bemerken ∑ ∑ m ∑ n n |sn − sm | = zk − zk = zk für alle n > m. k=1 k=1 k=m+1 Also ist (8.1) äquivalent dazu, dass {sn }n eine Cauchyfolge bildet und somit ∑ nach Satz 7.3 auch äquivalent zur Konvergenz der Folge {sn }n bzw. der Reihe k zk . q.e.d. ∑ Bemerkung: Satz 8.1 zeigt übrigens auch: Die Reihe ∞ konvergiert (bzw. dik=1 zk ∑ ∞ vergiert) genau dann, wenn für beliebige k0 ∈ N die Reihe k=k0 zk konvergiert (bzw. divergiert). Die ersten endlich vielen Glieder beeinflussen das Konvergenzverhalten der Reihe also nicht (aber natürlich ihren Wert). Das folgende Kriterium eignet sich eher zum Ausschluss der Konvergenz: 8. KONVERGENZKRITERIEN FÜR REIHEN (IN C) Satz 8.2: Wenn ∑∞ k=1 zk 55 (zk ∈ C für alle k ∈ N) konvergiert, so muss gelten lim zk = 0. k→∞ ∑ Beweis: Sei k zk konvergent und ε > 0 beliebig gewählt. Nach Satz 8.1 existiert dann ein N (ε) ∈ N mit |zn | < ε für alle n > N (ε) (wende (8.1) mit m = n − 1 an). Also ist {zn }n Nullfolge. q.e.d. ∑ k k Zum Beispiel divergiert also die Reihe ∞ k=1 (−1) , da {(−1) }k keine Nullfolge ist. Wie wir am Beispiel der harmonischen Reihe jetzt sehen werden, ist das Kriterium aus Satz 8.2 nicht hinreichend: Beispiel: Harmonische Reihe ∞ ∑ k=1 1 k. Zwar bildet { k1 }k eine Nullfolge, aber die Reihe ist nicht konvergent. In der Tat gilt für beliebiges m ∈ N: ∑ 2m ∑ 2m 1 1 m 1 ≥ = = . k 2m 2m 2 k=m+1 k=m+1 Also ist das Cauchysche Konvergenzkriterium (8.1) für ε < 1 2 nicht erfüllbar. Für reelle Reihen mit nichtnegativen Einträgen gilt der folgende ∑ Satz 8.3: Die Reihe ∞ k=1 xk mit xk ∈ R und xk ≥ 0 für alle k ∈ N konvergiert genau dann, wenn die zugehörige Folge der Partialsummen beschränkt ist. Bemerkung: Falls die Folge der Partialsummen einer (komplexen) Reihe beschränkt ist, sagen wir die Reihe ist beschränkt und schreiben ∑∞ k=1 zk ∞ ∑ zk < +∞. k=1 Die Folge Reihe. ∑∞ k=1 (−1) k ist ein Beispiel einer beschränkten, aber nicht konvergenten ∑ Beweis von Satz 8.3: Wegen xk ≥ 0 ist die Folge der Partialsummen sn = nk=1 xk monoton wachsend. Satz 5.6 über die monotone Konvergenz liefert also die Konvergenz der Reihe, wenn wir ihre Beschränktheit voraussetzen. Umgekehrt ist natürlich jede konvergente Reihe auch beschränkt. q.e.d. 56 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Im Falle sogenannter alternierender Reihen haben wir die folgende Aussage: Satz 8.4: (Konvergenzkriterium von Leibniz) Ist {xk }k ⊂ R eine monoton fallende Nullfolge, so konvergiert die Reihe ∞ ∑ (−1)k xk . k=1 Wir verzichten an dieser Stelle auf einen Beweis, da sich Satz 8.4 als Spezialfall von Satz 9.3 ergeben wird. Beispiel: Die Reihen ∞ ∑ (−1)k k=1 ∞ ∑ k=0 ( alternierende harmonische Reihe), k (−1)k 2k + 1 ( Leibnizreihe) konvergieren offenbar nach Satz 8.4. Wir werden später berechnen ∞ ∑ (−1)k k=1 k = − log 2, ∞ ∑ (−1)k π = . 2k + 1 4 k=0 Definition 8.1: Eine komplexe Reihe ∑ Reihe ∞ k=1 |zk | konvergiert. ∑∞ k=1 zk heißt absolut konvergent, wenn die Bemerkungen: 1. Jede absolut konvergente Reihe konvergiert auch im gewöhnlichen Sinn: Denn nach der Dreiecksungleichung in C gilt n n ∑ ∑ |zk | z ≤ k k=m+1 für alle n > m, k=m+1 und Satz 8.1 liefert die Behauptung. 2. Es gibt Reihen, die zwar im gewöhnlichen Sinn aber nicht absolut konvergieren, z.B. die alternierende harmonische Reihe. ∑ ∑∞ 3. Sind ∞ absolut konvergente Reihen, so ist auch jede k=1 zk und k=1 ζk zwei∑ (komplexe) Linearkombination ∞ k=1 (αzk + βζk ) mit α, β ∈ C absolut konvergent; dies folgt aus Satz 7.4 angewendet auf die Folge der Partialsummen. Entsprechendes gilt natürlich auch für Linearkombinationen konvergenter Reihen. 8. KONVERGENZKRITERIEN FÜR REIHEN (IN C) 57 Eines der wichtigsten Konvergenzkriterien enthält nun der folgende Satz 8.5: (Majorantenkriterium) Zwei Folgen {zk }k ⊂ C und {µk }k ⊂ R mit |zk | ≤ µk für alle k ∈ N ∑∞ ∑∞ seien gegeben. Dann gilt: Konvergiert die Reihe µ , so konvergiert k k=1 k=1 zk ∑ ∑ absolut. Die Reihe k µk heißt Majorante von k zk . Beweis: Zu beliebigem ε > 0 existiert nach Satz 8.1 ein N (ε) ∈ N mit n ∑ n ∑ |zk | ≤ k=m+1 für alle n > m ≥ N (ε). µk < ε k=m+1 Wiederum nach Satz 8.1 konvergiert also auch lut. ∑ k |zk |, d.h. ∑ k zk konvergiert absoq.e.d. Folgerung 8.1: (Minorantenkriterium) Sind {xk }k , {µk }k ⊂ R gegeben mit xk ≥ µk ≥ 0 für alle k ∈ N ∑∞ ∑ und divergiert k=1 µk , so divergiert auch k=1 xk . Die Reihe k µk heißt Mino∑ rante von k xk . ∑ ∑ Beweis: Wäre nämlich k xk konvergent, so wäre k µk nach Satz 8.5 ebenfalls konvergent, Widerspruch! q.e.d. ∑∞ Beispiele: ∑ k 1. Die Reihe ∞ k=0 z konvergiert absolut für |z| < 1 und divergiert für |z| > 1. Ersteres folgt aus Satz 8.5, da ∞ ∑ (4.1) |z|k = k=0 1 1 − |z| eine konvergente Majorante ist. Und letzteres aus Satz 8.2, da {z k }k keine Nullfolge ist für |z| > 1. 2. Die Reihe ∑∞ 1 k=1 kα konvergiert (absolut) für rationales α ≥ 2. Wir haben nämlich 0< also ist mit ∑∞ 2 k=1 k(k+1) 1 1 2 ≤ 2 ≤ kα k k(k + 1) für alle k ∈ N, eine Majorante, die gemäß des vorletzten Beispiels in § 4 konvergiert ∞ ∑ k=1 ∑ 2 1 =2 = 2. k(k + 1) k(k + 1) ∞ k=1 58 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Sehr nützlich ist auch der folgende Satz 8.6: ∑∞(Quotientenkriterium) Es sei k=1 zk eine komplexe Reihe mit zk ̸= 0 für alle k ∈ N. Dann gilt: (a) Existiert ein q ∈ (0, 1) und ein k0 ∈ N mit z k+1 ≤ q < 1 für alle k ≥ k0 , zk ∑ so konvergiert die Reihe ∞ k=1 zk absolut. (b) Existiert ein k0 ∈ N, so dass gilt z k+1 ≥1 zk für alle k ≥ k0 , dann divergiert die Reihe. Beweis: (a) Es gilt ( ) |zk | ≤ |zk0 |q −k0 q k für alle k ≥ k0 , wie man leicht ∑ mit vollständiger Induktion zeigt. Nach Satz 8.5 konvergiert also die Reihe k zk absolut, da sie (ab dem k0 -ten Glied) die konvergente Majorante ∞ ∞ ∑ ( ) ( )∑ |zk0 |q −k0 q k = |zk0 |q −k0 qk k=k0 k=k0 besitzt. (b) Offensichtlich gilt |zk | ≥ |zk0 | > ∑ 0 für alle k ≥ k0 . Also bildet {zk }k keine Nullfolge, nach Satz 8.2 ist somit k zk divergent. q.e.d. Bemerkung: Wir können in Satz 8.6 (a) die Voraussetzung nicht durch die schwächere Bedingung z k+1 < 1 für alle k ≥ k0 zk ∑ 1 ersetzen, wie das Beispiel der divergenten harmonischen Reihe ∞ k=1 k zeigt. Umgekehrt ist die ∑ dort1angegebene Bedingung aber auch keine notwendige Bedingung, denn z.B. ∞ k=1 k2 konvergiert wie oben gesehen, aber es gilt z k2 k+1 → 1 (k → ∞). = zk (k + 1)2 8. KONVERGENZKRITERIEN FÜR REIHEN (IN C) 59 Beispiele: 1. Die Reihe ∑∞ k2 k=1 2k konvergiert, denn mit xk := k2 2k haben wir x (k + 1)2 1( 1 )2 8 k+1 (k + 1)2 2k = = 1 + ≤ <1 = xk 2k+1 k 2 2k 2 2 k 9 Satz 8.6 (a) liefert die Behauptung. ∑ kk 2. Die Reihe ∞ k=1 k! divergiert, denn mit xk = kk k! für alle k ≥ 3. gilt x ( k + 1 )k k+1 (k + 1)k+1 k! = ≥ 1 für alle k ∈ N, = xk (k + 1)! k k k wir können also Satz 8.6 (b) anwenden. ∑ zk 3. Die komplexe Exponentialreihe ∞ k=0 k! konvergiert absolut für beliebiges z ∈ k C. Mit zk := zk! gilt nämlich z |z|k+1 k! 1 |z| k+1 ≤ = = k zk (k + 1)! |z| k+1 2 für alle k ≥ 2|z| − 1. Als Übungsaufgabe beweise man noch den folgenden Satz 8.7: ∑∞(Wurzelkriterium) Es sei k=1 zk eine komplexe Reihe. Dann gilt: (a) Existiert ein q ∈ (0, 1) und ein k0 ∈ N mit √ k |zk | ≤ q < 1 für alle k ≥ k0 , ∑ so konvergiert ∞ k=1 zk absolut. (b) Gilt lim sup √ k |zk | > 1, k→∞ so divergiert die Reihe. Wir wenden uns nun dem Produkt von absolut konvergenten Reihen zu: Satz 8.8:∑(Cauchyscher Produktsatz) ∑∞ Es seien ∞ z , ζ komplexe, absolut konvergente Reihen. Setzen wir k=1 k l=1 l cj := j ∑ k=1 zk ζj−k+1 für j ∈ N, 60 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN ∑ so konvergiert auch die Reihe ∞ j=1 cj absolut, und es gilt die Cauchysche Produktformel (∑ )( ∑ ) ∑ ∞ ∞ ∞ zk ζl = cj . k=1 j=1 l=1 Beweis: 1. Wir erklären die Partialsummen n ∑ zk , rn := sn := rn sn = (∑ n zk ζl , tn := n ∑ cj . j=1 l=1 k=1 Dann gilt n ∑ ) ∑ ) )( ∑ n n (∑ n n ∑ ζl = zk ζl =: zk ζl . k=1 l=1 k=1 k,l=1 l=1 Diese Schreibweise für eine (endliche)Doppelsumme ist offenbar sinnvoll, da die Reihenfolge der Summation irrelevant ist. Setzen wir { } Qn := (k, l) ∈ N × N : 1 ≤ k ≤ n, 1 ≤ l ≤ n , so haben wir ∑ rn sn = zk ζl . (8.2) (k,l)∈Qn Die Definition der cj lässt sich auch schreiben als ∑ cj = zk ζl , k+l=j+1 k,l∈N so dass sich für die n-te Partialsumme der cj ergibt ∑ tn = zk ζl ; (8.3) (k,l)∈Dn hierbei haben wir noch { } Dn := (k, l) ∈ N × N : k + l ≤ n + 1 gesetzt. Da nun Dn ⊂ Qn für jedes n ∈ N richtig ist, haben wir insgesamt ∑ rn sn − tn = zk ζl für alle n ∈ N. (8.4) (k,l)∈Qn \Dn 2. Setzen wir noch rn∗ := n ∑ |zk |, s∗n := k=1 so finden wir wie in (8.2): rn∗ s∗n = n ∑ |ζl |, l=1 ∑ |zk | |ζl |, n ∈ N. (8.5) (k,l)∈Qn Nun beachten wir Q2n \ D2n ⊂ Q2n \ Qn , da Qn ⊂ D2n für alle n ∈ N richtig ist. Damit können wir abschätzen ∑ ∑ (8.4) ≤ |r2n s2n − t2n | = z ζ |zk | |ζl | k l (k,l)∈Q2n \D2n ≤ ∑ (k,l)∈Q2n \Qn |zk | |ζl | (k,l)∈Q2n \D2n ∗ = |r2n s∗2n − rn∗ s∗n | → 0 (n → ∞), (8.5) 8. KONVERGENZKRITERIEN FÜR REIHEN (IN C) 61 ∑ ∑ da k |zk | und k |ζk | konvergieren, also auch das Produkt ihrer Partialsummen {rn∗ s∗n }n eine Cauchyfolge bildet. Ganz entsprechend folgt aus Q2n−1 \ D2n−1 ⊂ Q2n−1 \ Qn auch ∗ |r2n−1 s2n−1 − t2n−1 | ≤ |r2n−1 s∗2n−1 − rn∗ s∗n | → 0 (n → ∞). Da schließlich |r2n s2n − r2n−1 s2n−1 | → 0 (n → ∞) gilt (denn {rn sn }n konvergiert), haben {t2n }n und {t2n−1 }n den gleichen Grenzwert, nämlich lim tn = lim (rn sn ) = ( lim rn )( lim sn ), n→∞ n→∞ n→∞ wie behauptet. 3. Zum Beweis der absoluten Konvergenz von t∗n := ∑ n ∑ j n→∞ cj betrachten wir noch |cj |, n ∈ N. j=1 Wie in (8.3) erhalten wir dann 0 ≤ t∗n ≤ ∑ (k,l)∈Dn |zk | |ζl | ≤ ∑ |zk | |ζl | = rn∗ s∗n ≤ K (8.5) für alle n ∈ N (k,l)∈Qn ∑ ∑ mit K := ( k |zk |)( l |ζl |) < +∞. Also ist {t∗n }n beschränkt, monoton wachsend und nach Satz 5.6 somit auch konvergent. q.e.d. Schließlich untersuchen wir das Verhalten von Reihen unter Umordnungen. ∑∞ ∑∞ Definition 8.2: ∑∞Sei k=1 zk eine komplexe Reihe. Dann heißt k=1 ζk eine Umordnung von k=1 zk , wenn es eine bijektive Abbildung σ : N → N gibt, so dass gilt ζn = zσ(n) für alle n ∈ N. σ heißt unendliche Permutation der Reihenglieder. Für endliche Summen ist die Reihenfolge der Summation bekanntlich irrelevant für das Ergebnis; jede Umordnung einer endlichen Summe liefert also den gleichen Wert. Bei unendlichen Reihen muss das nicht gelten: ∑ Definition 8.3: Wir nennen eine komplexe konvergente Reihe ∞ k=1 zk unbedingt konvergent, wenn jede ihrer Umordnungen ebenfalls konvergiert und den gleichen ∑∞ Wert wie die ursprüngliche Reihe besitzt. Anderenfalls heißt k=1 zk bedingt konvergent. Satz 8.9: (Dirichletscher Umordnungssatz) Eine komplexe konvergente Reihe ist genau dann unbedingt konvergent, wenn sie absolut konvergent ist. 62 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Beweis: Wir zeigen nur, dass jede absolut konvergente Reihe auch unbedingt konvergent ist. Die umgekehrte Aussage folgt aus dem anschließenden ∑∞ ∑∞Satz 8.10. Sei also k=1 zk absolut konvergent, d.h. k=1 |zk | < +∞. Dann existiert nach Satz 8.1 zu jedem ε > 0 ein N = N (ε) ∈ N , so dass ∑ N +p |zk | < k=N +1 richtig ist. Ist nun so dass gilt ∑∞ k=1 ε 2 für alle p ∈ N ζk eine beliebige Umordnung von ∑ k (8.6) zk , so existiert ein K ∈ N mit K ≥ N , {z1 , . . . , zN } ⊂ {ζ1 , . . . , ζK }. (8.7) ∑n Es bezeichne sn := k=1 zk bzw. tn := k=1 ζk die n-ten Partialsummen der beiden Reihen. Aus (8.6) und (8.7) folgt dann ∑n |sn − tn | < ε ε + =ε 2 2 für alle n > K ≥ N, da sich die Terme z1 , . . . , zN aufheben und die übrigen Terme in den Summen sn bzw. tn jeweils durch (8.6) ∑abgeschätzt werden können. Es folgt also limn→∞ |sn − tn | = 0. Bezeichnet nun s den Wert von k zk , so folgt |tn − s| ≤ |tn − sn | + |sn − s| → 0 (n → ∞), d.h. auch ∑ k ζk konvergiert gegen s, wie behauptet. q.e.d. Satz 8.10: (Riemannscher Umordnungssatz) ∑ x konvergent, aber nicht absolut konvergent, so gibt es zu Ist die reelle Reihe ∞ k=1 k ∑ ∑∞ ∞ jedem t ∈ R eine Umordnung k=1 ξk der Reihe, so dass t = k=1 ξk gilt. Bemerkungen: ∑ ∑ 1. Ist ∑ k Re(zk ) k zk eine komplexe, unbedingt konvergente Reihe, so sind auch Satz 8.10 müssen die reellen Reiund k Im(zk ) unbedingt konvergent. Nach ∑ hen absolut konvergent sein, also ist auch k zk absolut konvergent. Das vervollständigt den Beweis von Satz 8.9. ∑ 2. Man kann sogar Umordnungen k ξk einer beliebigen reellen ∑ konvergenten, aber nicht absolut konvergenten Reihe konstruieren, so dass k ξk = ±∞ gilt (Übungsaufgabe). Beweis von Satz 8.10: 1. Zu {xk }k setzen wir pk := max{0, xk }, qk := − min{0, xk }, k ∈ N. Dann gilt Da pk , qk ≥ 0, ∑ k xk = pk − qk , |xk | = pk + qk für alle k ∈ N. xk konvergiert, muss |xk | → 0 (k → ∞) gelten und folglich auch lim pk = lim qk = 0. k→∞ k→∞ (8.8) 9. POTENZREIHEN 63 Außerdem haben wir Wäre nämlich z.B. ∑ pk = ∑ k ∑ k qk = +∞. (8.9) k pk < +∞, so konvergiert auch ∑ ∑ ∑ ∑ qk = (pk − xk ) = pk − xk . k k k k ∑ ∑ Dann wäre aber auch ∑ im Widerspruch zur nicht absoluten k |xk | = k (pk +qk ) konvergent,∑ Konvergenz der Reihe k xk . Entsprechend zeigt man k qk = +∞. 2. Wir zerlegen nun die Folge {xk }k in die Teilfolgen der positiven Glieder {ak }k und nichtpositiven Glieder {bk }k . Nach (8.8) und (8.9) bilden beide Nullfolgen und es gilt ∑ ∑ ak = +∞, bk = −∞. k k Nun wählen wir n1 als kleinste natürliche Zahl, so dass zu unserem vorgegebenen t ∈ R gilt n1 ∑ ak > t. k=1 Dann wählen wir n2 als kleinste natürliche Zahl, so dass n1 ∑ ak + n2 ∑ bk < t k=1 k=1 richtig ist. Danach bestimmen wir ein kleinstes n3 > n1 wiederum so, dass gilt n1 ∑ ak + k=1 n2 ∑ bk + n3 ∑ ak > t. k=n1 +1 k=1 Es ist klar, wie dieses Verfahren fortgesetzt und welche Umordnung der ursprünglichen Reihe dabei erstellt wird. Da n1 , n2 , n3 , . . . jeweils minimal gewählt waren, muss gelten n1 −1 ∑ k=1 ak ≤ t, n1 ∑ n2 −1 ak + k=1 ∑ bk ≥ t, . . . k=1 (ersteres nur, falls t ≥ 0 ist). Somit haben die zugehörigen Teilsummen höchstens einen Abstand von an1 , bn2 , an3 , bn4 , . . . zu t. Da aber sowohl {ak }k als auch {bk }k Nullfolgen sind, konvergieren die Partialsummen der umgeordneten Reihe gegen t, wie behauptet. q.e.d. 9 Potenzreihen Wir wollen nun noch spezielle komplexe Reihen betrachten, nämlich Reihen der Form ∞ ∑ P(z) = ak z k k=0 mit den Koeffizienten ak ∈ C (k ∈ N0 ) und der Variablen z ∈ C. Die Partialsummen ∑ Pn (z) := nk=0 ak z k einer Potenzreihe sind für alle n ∈ N komplexe Polynome. Wir kennen bereits zwei Beispiele von Potenzreihen, welche wohl auch die beiden wichtigsten sind: 64 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN ∞ ∑ • Geometrische Reihe: z k , d.h. ak = 1 für alle k ∈ N0 . k=0 ∞ ∑ • Exponentialreihe: k=0 zk k! , d.h. ak = 1 k! für alle k ∈ N0 . Während letztere für alle z ∈ C absolut konvergiert, konvergiert die geometrische Reihe absolut für |z| < 1 und divergiert für |z| > 1. I.A. hängt also das Konvergenzverhalten einer Potenzreihe von der Wahl der Variablen z ab. Genauer haben wir den folgenden Satz 9.1: (Cauchy-Hadamard) √ ∑∞ k k |ak | ∈ Für eine Potenzreihe P(z) = k=0 ak z setzen wir α := lim supk→∞ [0, +∞) ∪ {+∞}. Erklären wir dann +∞, falls α = 0 α−1 , falls α ∈ (0, +∞) , R := 0, falls α = +∞ (9.1) so konvergiert P(z) für |z| < R absolut und divergiert für |z| > R. Bemerkungen: 1. Die in (9.1) erklärte Größe R ∈ [0, +∞) ∪ {+∞} heißt Konvergenzradius der Reihe P(z). Die Kreisscheibe KR := {z ∈ C : |z| < R} nennen wir das Konvergenzgebiet. 2. Wir setzen folgende Regeln für das Rechnen mit +∞ fest: 1 = +∞, 0 1 , +∞ (+∞) · x = +∞ für x ∈ R mit x > 0. Dann liest sich (9.1) also R = α1 . Beweis von Satz 9.1: Offenbar gilt |z| < R (bzw. |z| > R) genau dann, wenn |z|α < 1 (bzw. |z|α > 1) also √ lim sup k |ak z k | < 1 k→∞ (bzw. > 1) √ richtig ist. Wegen Satz 6.5 ist für lim supk→∞ k |ak z k | < 1 der Fall (a) aus Satz 8.7 √ ∑ k k konvergiert absolut. Im Fall lim sup k gültig, d.h. a z |a k z | > 1 divergiert k→∞ k k ∑ k P(z) = k ak z nach Satz 8.7 (b). q.e.d. Als sehr praktisch erweist sich der folgende 9. POTENZREIHEN 65 ∑ k Satz 9.2: Ist P(z) = ∞ k=0 ak z im Punkt z0 ∈ C \ {0} konvergent, so konvergiert P(z) absolut für alle z ∈ C mit |z| < |z0 |. ∑ Beweis: Da k ak z0k konvergiert, gilt limk→∞ |ak z0k | = 0. Insbesondere ist {|ak z0k |}k beschränkt, es gibt also ein c > 0 mit |ak z0k | ≤ c für alle k ∈ N0 . Sei nun z ∈ C mit |z| < |z0 | bzw. q := | zz0 | ∈ [0, 1) beliebig gewählt. Dann folgt z k |ak z | = ≤ cq k für alle k ∈ N0 . z0 ∑ ∑ k c k Wegen q ∈ [0, 1) konvergiert die Reihe k cq = c k q = 1−q und nach dem Majorantenkriterium, Satz 8.5, konvergiert auch P(z) absolut für |z| < |z0 |, wie behauptet. q.e.d. |ak z0k | k Wir wollen nun einen Satz beweisen, der u.a. Aussagen über das Konvergenzverhalten auf dem Rand des Konvergenzgebietes macht und außerdem das Konvergenzkriterium von Leibniz als Spezialfall enthält. Wir beginnen mit dem ∑ ist, und sei Hilfssatz 9.1: Sei {zk }k∈N0 ⊂ C eine Folge, so dass ∞ k=0 zk beschränkt ∑ {ak }k ⊂ R eine monoton fallende Nullfolge. Dann konvergiert die Reihe ∞ k=0 ak zk . ∑ Beweis: Wir wollen Satz 8.1 anwenden, also den Ausdruck | n große k=m+1 ak zk | für hinreichend ∑ m, n ∈ N0 mit n > m klein bekommen. Dazu setzen wir für festes m ∈ N0 : sn := n z k=m+1 k für n > m. Mit vollständiger Induktion zeigt man dann leicht die Relation n ∑ ak zk = sn an + k=m+1 n−1 ∑ sk (ak − ak+1 ) für alle n > m. k=m+1 Da {ak }k eine monoton fallende Nullfolge ist, gilt ak ≥ ak+1 ≥ 0 für alle k ∈ N0 . Daher können wir abschätzen n n−1 ∑ ∑ ≤ |sn |an + a z |sk |(ak − ak+1 ) k k k=m+1 k=m+1 ≤ [ ] n−1 ∑ { } max |sm+1 |, . . . , |sn | an + (ak − ak+1 ) = { } am+1 · max |sm+1 |, . . . , |sn | k=m+1 für n > m. Da nun {ak }k Nullfolge ist, existiert zu jedem ε > 0 ein N (ε) ∈ N, so dass 0 ≤ ak < ε für alle k ≥ N (ε) richtig ist. Ferner gibt es ein c > 0 mit |sn | ≤ c für alle n ∈ N, denn {sn }n ist beschränkt nach Voraussetzung. Insgesamt folgt ∑ n a z für alle n > m ≥ N (ε), k k < cε k=m+1 also nach Satz 8.1 die Konvergenz der Reihe. q.e.d. Satz 9.3: Ist∑ {ak }k∈N0 eine monoton fallende Nullfolge, so konvergiert die Potenzk reihe P(z) = ∞ k=0 ak z für alle z ∈ C \ {1} mit |z| ≤ 1. 66 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Beweis: Aus der Summenformel der geometrischen Reihe, Satz 2.3, erhalten wir für beliebige z ∈ C \ {1} mit |z| ≤ 1: ∑ n k 1 − z n+1 1 + |z|n+1 2 z = ≤ ≤ 1−z |1 − z| |1 − z| für alle n ∈ N. k=0 Somit ist P(z). ∑ k z k für solche z beschränkt, Hilfssatz 9.1 liefert also die Konvergenz von q.e.d. Bemerkung: Setzen wir in Satz 9.3 speziell z = −1 ein, so folgt die Konvergenz der ∑ k Reihe ∞ a k=0 k (−1) . Dies ist gerade die Aussage des Leibnizschen Konvergenzkriteriums, Satz 8.4. Satz 9.4: (Cauchyscher ∑∞ Produktsatz ∑∞für Potenzreihen) k Sind die Potenzreihen k=0 ak z ∑ und k=0 bk z k für |z| < R absolut konvergent, so k gilt dies auch für die Potenzreihe ∞ k=0 ck z mit den Koeffizienten ck := k ∑ al bk−l , k ∈ N0 , l=0 und wir haben die Identität (∑ ∞ k=0 ak z k )( ∑ ∞ ) bk z k = (∑ ∞ ) ck z k . k=0 k=0 Beweis: Dies ergibt sich nach einer Indexverschiebung k → k + 1 aus Satz 8.8, wenn man noch ) (∑ k k ∑ l k−l (al z )(bk−l z ) = al bk−l z k = ck z k l=0 l=0 beachtet. q.e.d. Bemerkung: Alle Resultate lassen sich direkt auf komplexe Potenzreihen der Form Pz0 (z) := ∞ ∑ ak (z − z0 )k k=0 übertragen. Das Konvergenzgebiet von Pz0 (z) ist dann eine Kreisscheibe KR (z0 ) = {z ∈ C : |z − z0 | < R} vom Radius R ∈ [0, +∞) ∪ {+∞} um den Entwicklungspunkt z0 ∈ C. Die bisher betrachteten Potenzreihen P(z) sind also Spezialfälle von Pz0 (z) mit z0 = 0. 10. DER D-DIMENSIONALE RAUM UND METRISCHE RÄUME 10 67 Der d-dimensionale reelle Raum Rd und metrische Räume Für den Umgang mit Funktionen in den folgenden Kapiteln benötigen wir noch einige topologische Begriffe. Da wir Funktionen sowohl in R als auch C (also für Punkte aus R2 ) betrachten wollen, führen wir an dieser Stelle allgemeiner den ddimensionalen (reellen) Raum Rd mit d ∈ N ein: (i) Wir betrachten die Menge aller d-Tupel x = (x1 , . . . , xd ) ∈ Rd := R × . . . × R, wobei zwei Punkte x = (x1 , . . . , xd ), y = (y1 , . . . , yd ) ∈ Rd gleich heißen, wenn ihre Koordinaten übereinstimmen, d.h. xk = yk für alle k = 1, . . . , d. Das Element 0 = (0, . . . , 0) ∈ Rd heißt Nullpunkt oder Ursprung des Rd . (ii) Sind x, y ∈ Rd beliebig, so erklären wir die Addition auf Rd gemäß x + y := (x1 + y1 , . . . , xd + yd ) ∈ Rd . Ist ferner λ ∈ R gewählt, so definieren wir die skalare Multiplikation durch λx := (λx1 , . . . , λxd ) ∈ Rd . Bemerkungen: 1. Den R2 veranschaulichen wir uns wie üblich in der Ebene, den Punkten x = (x1 , x2 ) ∈ R2 entsprechen die Vektoren ⃗x = (x1 , x2 ). Dann entspricht die Addition in R2 der Vektoraddition und die skalare Multiplikation der Skalierung eines Vektors. 2. Die Addition in Rd , d ∈ N, genügt den Axiomen (A1)-(A4) aus § 1 mit dem neutralen Element 0 = (0, . . . , 0) ∈ Rd und dem negativen Element −x := (−x1 , . . . , −xd ) ∈ Rd . Zusammen mit der skalaren Multiplikation spricht man dann von einer Vektorraumstruktur, d.h. Rd ist ein (reeller) Vektorraum. Hierzu müssen – was bei uns offenbar der Fall ist – zusätzlich folgende Axiome erfüllt sein: (S1) λ(µx) = (λµ)x für alle λ, µ ∈ R, x ∈ Rd , (S2) λ(x + y) = λx + λy, (λ + µ)x = λx + µx für alle λ, µ ∈ R, x, y ∈ Rd , (S3) 1 · x = x für alle x ∈ Rd . 3. Während man R1 und R2 mit einer Körperstruktur ausstatten kann, nämlich mit der von R bzw. C, ist das für d ≥ 3 nicht mehr möglich. Trotzdem können wir (wie in R und C) einen Abstandsbegriff erklären m.H. der folgenden 68 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Definition 10.1: Seien x, y ∈ Rd , so erklären wir deren (euklidisches) Skalarprodukt oder auch inneres Produkt als ⟨x, y⟩ = x · y := d ∑ x j yj . (10.1) j=1 Die (euklidische) Länge oder den Betrag von x ∈ Rd definieren wir als |x| := √ ⟨x, x⟩ = (∑ d )1 2 x2j . j=1 Schließlich heißt |x − y| = (∑ d )1 (xj − yj ) 2 2 j=1 der (euklidische) Abstand zweier Punkte x, y ∈ Rd . Bemerkungen: 1. (Rd , ⟨·, ·⟩) heißt euklidischer Vektorraum; wir schreiben kurz Rd und stellen uns diesen mit dem euklidischen Abstandsbegrif ausgestattet vor. Es sei aber angemerkt, dass es viele weitere Abstandsbegriffe im Rd gibt. 2. Das in (10.1) erklärte Skalarprodukt hat die Eigenschaften ⟨x, y⟩ = ⟨y, x⟩ (Symmetrie) ⟨λx + µy, z⟩ = λ⟨x, z⟩ + µ⟨y, z⟩ ⟨x, x⟩ ≥ 0, ⟨x, x⟩ = 0 ⇔ x = 0 (10.2) (Bilinearität) (Positivität) (10.3) (10.4) für beliebige x, y, z ∈ Rd und λ, µ ∈ R (Übungsaufgabe). 3. Im R2 entspricht der Betrag gerade dem in C erklärten Betrag, in R1 dem in R erklärten Absolutbetrag. Der Abstand | · | hat sehr ähnliche Eigenschaften wie der Betrag in R oder C (das erklärt auch das verwendete Symbol): Satz 10.1: Für alle x, y ∈ Rd und λ ∈ R gilt (i) |x| ≥ 0 und |x| = 0 ⇔ x = 0. (ii) |λx| = |λ| |x|. (iii) |x + y| ≤ |x| + |y| ( Dreiecksungleichung). 10. DER D-DIMENSIONALE RAUM UND METRISCHE RÄUME 69 Bemerkung: Also unterscheidet sich nur (ii) von der entsprechenden Eigenschaft |xy| = |x| |y| des Betrages in R bzw. C. Dies ist im Rd i.A. falsch, es gilt aber der berühmte Satz 10.2: (Cauchy-Schwarzsche Ungleichung) Sind x, y ∈ Rd beliebig, so gilt |⟨x, y⟩| ≤ |x| |y|. (10.5) Gleichheit tritt genau dann ein, wenn x = ty oder y = tx mit einem t ∈ R gilt, d.h. wenn x, y linear abhängig sind. Beweis: Falls y = 0 gilt, ist nichts zu zeigen. Sei also y ̸= 0. Dann folgt (10.4) 0 ≤ |x + ty|2 (10.2),(10.3) = |x|2 + 2t⟨x, y⟩ + t2 |y|2 für alle t ∈ R. Das ist bekanntlich genau dann der Fall, wenn ⟨x, y⟩2 ≤ |x|2 |y|2 gilt, und nach Wurzelziehen erhalten wir (10.5). Andererseits hat die Gleichung 0 = |x + ty|2 = |x|2 + 2t⟨x, y⟩ + t2 |y|2 bekanntlich genau dann eine Lösung t ∈ R, wenn ⟨x, y⟩2 ≥ |x|2 |y|2 gilt. Wegen (10.5) ist also |x + ty| = 0 für ein t ∈ R genau dann erfüllt, wenn ⟨x, y⟩2 = |x|2 |y|2 richtig ist, wie behauptet. q.e.d. Beweis von Satz 10.1: (i) entspricht (10.4), und (ii) folgt unmittelbar aus (10.2), (10.3). Zum Beweis von (iii) berechnen wir (10.5) |x + y|2 = |x|2 + 2⟨x, y⟩ + |y|2 ≤ |x|2 + 2|x| |y| + |y|2 = (|x| + |y|)2 , also nach Wurzelziehen die behauptete Dreiecksungleichung. q.e.d. Bemerkung: Aus der Dreiecksungleichung folgt wie in Satz 1.5 (c) noch die umgekehrte Dreiecksungleichung |x − y| ≥ |x| − |y| für alle x, y ∈ Rd . Mit Hilfe des Betrages im Rd können wir nun auch die Begriffe für Folgen in R bzw. C auf den Rd übertragen: Definition 10.2: Eine Folge {xn }n∈N ⊂ Rd mit den Gliedern xn = (xn1 , . . . , xnd ) ∈ Rd für n ∈ N heißt 70 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN • beschränkt, falls ein c > 0 existiert mit |xn | ≤ c für alle n ∈ N, • Cauchyfolge, wenn für alle ε > 0 ein N (ε) ∈ N existiert mit |xn − xm | < ε für alle m, n ≥ N (ε), • konvergent gegen den Grenzwert x ∈ Rd , wenn es für alle ε > 0 ein N (ε) ∈ N gibt mit |xn − x| < ε für alle n ≥ N (ε); Schreibweise limn→∞ xn = x oder xn → x (n → ∞), • Nullfolge, wenn {xn }n gegen 0 ∈ Rd konvergiert. Ferner heißt y ∈ Rd Häufungswert von {xn }n , wenn eine Teilfolge {xnk }k ⊂ {xn }n existiert mit limk→∞ xnk = y. Z.B. ist also {xn }n ⊂ Rd gegen x ∈ Rd konvergent, wenn in jeder ε-Umgebung Bε (x) := {y ∈ Rd : |y − x| < ε} fast alle Glieder der Folge liegen. Man beachte, dass Bε (x) in R = R1 ein offenes Intervall, in R2 eine Kreisscheibe um x vom Radius ε > 0 und in Rd für d ≥ 3 eine Kugel um x vom Radius ε > 0 ist. Bemerkung: Zur Übung beweise man folgende Rechenregeln für Grenzwerte im Rd : Sind {xn }n , {yn }n ⊂ Rd konvergente Folgen mit limn→∞ xn = x und limn→∞ yn = y, so folgt • Sind α, β ∈ R beliebig, so konvergiert auch {αxn + βyn }n mit αxn + βyn → αx + βy (n → ∞). • Es gilt ⟨xn , yn ⟩ → ⟨x, y⟩ und |xn | → |x| für n → ∞. • Ist {αn }n ⊂ R eine Folge mit αn → α (n → ∞), so gilt αn xn → αx (n → ∞). Satz 10.3: (Cauchysches Konvergenzkriterium in Rd ) Eine Folge {xn }n ⊂ Rd ist genau dann konvergent, wenn {xn }n Cauchyfolge ist. Der Beweis erfolgt genau wie der des Cauchyschen Konvergenzkriteriums in C, Satz 7.3, in dem man die Aussage auf die Komponentenfolgen {xnj }n , j = 1, . . . , d, zurückführt mittels des folgenden Hilfssatz 10.1: Eine Folge {xn }n ⊂ Rd ist genau dann beschränkt (bzw. konvergent, Cauchyfolge, Nullfolge), wenn alle Komponentenfolgen {xnj }n ⊂ R, j = 1, . . . , d, beschränkt (bzw. konvergent, Cauchyfolgen, Nullfolgen) sind. Für konvergente Folgen {xn }n gilt lim xn = n→∞ ( ) lim xn1 , . . . , lim xnd . n→∞ n→∞ 10. DER D-DIMENSIONALE RAUM UND METRISCHE RÄUME 71 Beweis: Als Übungsaufgabe zeigt man: Ist y = (y1 , . . . , yd ) ∈ Rd beliebig, so gelten die Ungleichungen |yj | ≤ |y| für j = 1, . . . , d, |y| ≤ d ∑ |yk |. k=1 Hieraus ergeben sich sofort die Behauptungen. q.e.d. Satz 10.4: (Bolzano-Weierstraß in Rd ) Jede beschränkte Folge {xn }n ⊂ Rd besitzt eine konvergente Teilfolge. Beweis: Vollständige Induktion über die Raumdimension d ∈ N. • d = 1: Das ist die Aussage von Satz 5.5. • d → d + 1: Die Aussage sei für beschränkte Folgen {xn }n ⊂ Rd mit einem d ∈ N erfüllt. Sei nun {x̃n }n ⊂ Rd+1 beschränkt mit den Folgengliedern x̃n = (x̃n1 , . . . x̃nd , x̃n,d+1 ) = (xn , ξn ) mit xn := (x̃n1 , . . . , x̃nd ), ξn := x̃n,d+1 . Damit sind auch {xn }n ⊂ Rd und {ξn }n ⊂ R beschränkt. Nach Induktionsvoraussetzung existiert also eine konvergente Teilfolge {x′k }k = {xnk }k von {xn }n mit limk→∞ x′k = x ∈ Rd . Die entsprechende Teilfolge {ξk′ }k = {ξnk }k ⊂ R von {ξn }n muss zwar nicht konvergieren, ist aber sicher beschränkt. Also gibt es nach Satz 5.5 eine weitere Teilfolge {ξk′ l }l ⊂ {ξk′ }k mit liml→∞ ξk′ l = ξ ∈ R. Die entsprechende Teilfolge {x′kl }l ⊂ {x′k }k konvergiert auch gegen x, so dass schließlich für {x̃′kl }l gilt lim x̃′kl = lim (x′kl , ξk′ l ) l→∞ l→∞ HS 10.1 = (x, ξ), wie behauptet. q.e.d. Bemerkung: Satz 10.4 für d = 2 liefert auch: Jede beschränkte Folge {xn }n ⊂ C besitzt eine konvergente Teilfolge. Denn die Beträge in R2 und C stimmen überein. Wir wollen nun Teilmengen M ⊂ Rd betrachten und beginnen mit der Definition 10.3: Eine Teilmenge M ⊂ Rd nennen wir • offen, wenn zu jedem x0 ∈ M ein r > 0 existiert, so dass gilt Br (x0 ) = {x ∈ Rd : |x − x0 | < r} ⊂ M. 72 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN • abgeschlossen, wenn für jede konvergente Folge {xn }n ⊂ M gilt x0 := lim xn ∈ M. n→∞ Beispiele: 1. Intervalle in R: • Das offene Intervall (a, b) = {x ∈ R : a < x < b} ist im Sinne von Definition 10.3 offen. Ist nämlich x0 ∈ (a, b) gewählt, so setzen wir r := min{x0 − a, b − x0 } > 0. Für x ∈ Br (x0 ) folgt dann x = x0 + (x − x0 ) ≥ x0 − |x − x0 | > x0 − r ≥ x0 − (x0 − a) = a, also x > a und entsprechend x < b, also x ∈ (a, b) und somit Br (x0 ) ⊂ (a, b). • Das abgeschlossene Intervall [a, b] = {x ∈ R : a ≤ x ≤ b} ist abgeschlossen im Sinne von Definition 10.3. Ist nämlich {xn }n ⊂ [a, b] konvergent mit xn → x0 (n → ∞), so folgt a ≤ xn ≤ b und nach Grenzübergang n → ∞ auch a ≤ x0 ≤ b, also x0 ∈ [a, b]. • Das halboffene Intervall [a, b) ist weder offen noch abgeschlossen. Denn die konvergente Folge {b − n1 }n≥N ⊂ [a, b) mit hinreichend großem N ∈ N hat den Grenzwert limn→∞ (b − n1 ) = b ̸∈ [a, b). Und für a ∈ [a, b) gilt offenbar Br (a) ̸⊂ [a, b) für alle r > 0. 2. Kugeln in Rd : • BR (ξ) ⊂ Rd ist offen für beliebige R > 0, ξ ∈ Rd . Ist nämlich x0 ∈ BR (ξ) beliebig, so ist r := R − |x0 − ξ| > 0. Für x ∈ Br (x0 ) haben wir dann die Abschätzung |x − ξ| ≤ |x − x0 | + |x0 − ξ| < r + |x0 − ξ| = R, also x ∈ BR (ξ) und somit Br (x0 ) ⊂ BR (ξ). Man bezeichnet daher BR (ξ) auch als offene Kugel im Rd . • Im Gegensatz dazu ist B̂R (ξ) := {x ∈ Rd : |x − ξ| ≤ R} abgeschlossen und heißt abgeschlossene Kugel im Rd . Ist nämlich {xn }n ⊂ B̂R (ξ) mit xn → x0 (n → ∞) beliebig, so liefert Grenzübergang n → ∞ in der Ungleichung |xn − ξ| ≤ R für alle n ∈ N: R ≥ lim |xn − ξ| = lim (xn − ξ) = |x0 − ξ|, n→∞ also x0 ∈ B̂R (ξ). n→∞ 10. DER D-DIMENSIONALE RAUM UND METRISCHE RÄUME 73 • Die Kugelschale Sϱ,R (ξ) := BR (ξ) \ Bϱ (ξ) = {x ∈ Rd : ϱ ≤ |x − ξ| < R} mit 0 < ϱ < R ist weder offen noch abgeschlossen. Für x0 ∈ Sϱ,R (ξ) mit |x0 − ξ| = ϱ gilt nämlich Br (x0 ) ̸⊂ Sϱ,R (ξ) für alle r > 0, da ξ−x0 z.B. y := x0 + ε |ξ−x für hinreichend kleines ε ∈ (0, r) zwar in Br (x0 ) aber nicht in 0| Sϱ,R (ξ) liegt, d.h. Sϱ,R (ξ) ist nicht offen. Und andererseits finden wir für konvergentes {xn }n ⊂ Sϱ,R (ξ) mit |xn −ξ| = R− n1 , n ≥ N , die Relation limn→∞ xn =: x0 ̸∈ Sϱ,R (ξ), d.h. Sϱ,R (ξ) ist auch nicht abgeschlossen. 3. Q ist weder offen noch abgeschlossen. 4. Rd und ∅ sind die einzigen Teilmengen von Rd , die sowohl offen als auch abgeschlossen sind. Wir erinnern an den Begriff der Komplementärmenge oder des Komplements einer Menge M ⊂ Rd , nämlich M c := Rd \ M = {x ∈ Rd : x ̸∈ M }. Satz 10.5: Eine Menge M ⊂ Rd ist genau dann offen, wenn ihr Komplement M c abgeschlossen ist. Weiter ist M genau dann abgeschlossen, wenn M c offen ist. Beweis: Es genügt, die erste Aussage zu beweisen. Die zweite folgt dann unmittelbar aus der Relation (M c )c = M . • ⇒“: Sei M ⊂ Rd offen. Wäre dann M c nicht abgeschlossen, so gäbe es eine ” konvergente Folge {xn }n ⊂ M c mit xn → x0 ̸∈ M c (n → ∞). Das heißt aber x0 ∈ M , und da M offen ist, gäbe es eine Kugel Br (x0 ) ⊂ M mit geeignetem Radius r > 0. Da andererseits |xn − x0 | → 0 (n → ∞) gilt, müsste aber xn ∈ Br (x0 ) ⊂ M für hinreichend großes n ∈ N erfüllt sein, im Widerspruch zu {xn }n ⊂ M c . Also ist M c abgeschlossen. • ⇐“: Sei nun M c abgeschlossen. Wäre M nicht offen, so gäbe es ein x0 ∈ M ” mit Br (x0 ) ̸⊂ M für alle r > 0. Wählen wir insbesondere r = n1 , so gäbe es also xn ∈ B 1 (x0 ) mit xn ∈ M c für alle n ∈ N. Für die so gewählte Folge n {xn }n ⊂ M c gölte dann aber |xn − x0 | < n1 → 0 (n → ∞). Und da M c abgeschlossen ist, müsste x0 ∈ M c folgen, Widerspruch! Also ist M offen. q.e.d. Notation: Meist werden wir offene Mengen mit dem (ggf. indizierten) Symbol Ω ⊂ Rd und abgeschlossene Mengen mit A ⊂ Rd bezeichnen. Satz 10.6: (a) Sind Ω1 , . . . , Ωn ⊂ Rd offen, so gilt dies auch für n ∩ j=1 Ωj . 74 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN (b) Sind A1 , . . . , An ⊂ Rd abgeschlossen, so ist auch n ∪ Aj abgeschlossen. j=1 (c) Sei J eine beliebige Indexmenge∪und {Ωj }j∈J eine Familie offener Mengen. Dann ist auch die Vereinigung Ωj := {x ∈ Rd : x ∈ Ωj für ein j ∈ J} j∈J offen. (d) Ist {Aj }j∈J eine Familie abgeschlossener Mengen mit beliebiger Indexmenge ∩ J, so ist auch der Durchschnitt Aj := {x ∈ Rd : x ∈ Aj für alle j ∈ J} j∈J abgeschlossen. Beweis: Wegen Satz 10.5 und der allgemeinen Relationen (∪ j∈J )c Mj = ∩ j∈J Mjc , (∩ j∈J )c Mj = ∪ Mjc j∈J genügt es die (nahezu trivialen) Aussagen (a) und (c) zu beweisen (Übungsaufgabe). q.e.d. Definition 10.4: Sei M ⊂ Rd eine beliebige Menge. Dann heißt ein Punkt x0 ∈ Rd : • innerer Punkt von M , wenn ein r > 0 mit Br (x0 ) ⊂ M existiert. • Randpunkt von M , wenn zu jedem r > 0 Punkte y ∈ M und z ∈ M c mit y, z ∈ Br (x0 ) existieren. • Häufungspunkt von M , wenn zu jedem r > 0 ein x ∈ M \ {x0 } existiert mit x ∈ Br (x0 ). • isolierter Punkt von M , wenn x0 ∈ M gilt und x0 kein Häufungspunkt von M ist. Die Menge der inneren Punkte von M ⊂ Rd heißt das Innere von M ; wir schreiben int M oder M̊ . Die Menge der Randpunkte heißt Rand von M und wird mit ∂M bezeichnet. Schließlich heißt M := M ∪ ∂M der Abschluss von M . Bemerkungen: Ein Punkt x0 ∈ Rd ist offenbar genau dann Häufungspunkt von M ⊂ Rd , wenn eine Folge {xn }n ⊂ M \ {x0 } existiert mit xn → x0 (n → ∞). Ferner ist x0 genau dann Randpunkt von M , wenn zwei Folgen {yn }n ⊂ M und {zn }n ⊂ M c existieren mit yn → x0 , zn → x0 (n → ∞). 10. DER D-DIMENSIONALE RAUM UND METRISCHE RÄUME 75 Satz 10.7: Für eine beliebige Menge M ⊂ Rd gelten die folgenden Aussagen: (i) ∂M = ∂(M c ). (ii) M ist genau dann offen, wenn M = int M gilt. (iii) M = int M ∪ ∂M , ∂M = M \ int M . (iv) Ist {xn }n ⊂ M konvergent, so gilt limn→∞ xn =: x0 ∈ M . (v) M ist abgeschlossen ⇔ ∂M ⊂ M ⇔ M = M . Beweis: (i) und (ii) sind aus den Definitionen sofort klar. Wir beweisen (iii)-(v): (iii) Wir zeigen M \ int M ⊂ ∂M . In der Tat: Ist x0 ∈ M \ int M , so gilt Br (x0 ) ̸⊂ M für alle r > 0. D.h. für jedes r > 0 existieren y := x0 ∈ M , z ∈ M c mit y, z ∈ Br (x0 ), also folgt x0 ∈ ∂M . Aus der Definition von M folgt nun M = M ∪ ∂M = (M \ int M ) ∪ int M ∪ ∂M = int M ∪ ∂M und damit auch ∂M = M \ int M , wie behauptet. (iv) Sei {xn }n ⊂ M konvergent und x0 = limn→∞ xn . Falls x0 ∈ int M gilt, ist nichts zu zeigen wegen int M ⊂ M ⊂ M . Sei also x0 ̸∈ int M , d.h. es gilt Br (x0 ) ̸⊂ M für alle r > 0. Also existiert zu jedem n ∈ N ein zn ∈ M c mit |zn − x0 | < n1 , d.h. zn → x0 (n → ∞). Nach obiger Bemerkung folgt x0 ∈ ∂M ⊂ M , also die Behauptung. (v) Zunächst ist ∂M ⊂ M ⇔ M = M wieder per Definition klar. Wir beweisen die erste Äquivalenz: ⇒“: Sei M abgeschlossen und x0 ∈ ∂M gewählt. Dann existiert eine Folge {xn }n ⊂ M mit ” xn → x0 (n → ∞). Und es folgt x0 ∈ M wegen der Abgeschlossenheit von M , also ∂M ⊂ M . ⇐“: Sei umgekehrt ∂M ⊂ M . Und sei eine konvergente Folge {xn }n ⊂ M gewählt. Nach ” (iv) gilt dann x0 := limn→∞ xn ∈ M = M ∪ ∂M = M , also ist M abgeschlossen. q.e.d. Beispiel: Für die offene Kugel BR (ξ) im Rd gilt: int BR (ξ) = BR (ξ), BR (ξ) = {x ∈ Rd : |x − ξ| ≤ R} = B̂R (ξ), ∂BR (ξ) = {x ∈ Rd : |x − ξ| = R} =: SR (ξ). Mit S d−1 := {x ∈ Rd : |x| = 1} = S1 (0) bezeichnen wir die Einheitssphäre im Rd . Definition 10.5: Eine Teilmenge M ⊂ Rd heißt • beschränkt, falls ein R > 0 existiert mit M ⊂ BR (0); anderenfalls nennen wir M unbeschränkt. • kompakt, falls M beschränkt und abgeschlossen ist. 76 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Bemerkung: Ist M nichtleer und beschränkt, so ist der Durchmesser diam M := sup{|x − y| : x, y ∈ M } wohl definiert, d.h. diam M ist endlich und eindeutig bestimmt. Satz 10.8: Eine Teilmenge K ⊂ Rd ist genau dann kompakt, wenn jede Folge {xn }n ⊂ K eine konvergente Teilfolge {xnl }l enthält mit lim xnl =: x0 ∈ K. l→∞ Bemerkung: Eine Menge K nennt man folgenkompakt, wenn jede Folge {xn }n ⊂ K eine Teilfolge {xnl }l enthält mit xnl → x0 ∈ K (l → ∞). Satz 10.8 besagt also, dass für Teilmengen des Rd Kompaktheit und Folgenkompaktheit äquivalent sind. Für Teilmengen aus unendlich dimensionalen“ (metrischen) Räumen gilt dies i.A. nicht ” mehr, siehe aber Satz 10.10 unten. In solchen Räumen wird der Begriff der Kompaktheit abweichend von Definition 10.5, nämlich durch die Heine-Borel-Eigenschaft“, ” erklärt. Im Rd ist auch diese Eigenschaft äquivalent zu unserer Definition; vgl. Analysis 2. Beweis von Satz 10.8: ⇒“: Sei K beschränkt und abgeschlossen. Eine beliebige Folge {xn }n ⊂ K ist dann ” beschränkt und nach Satz 10.4 existiert eine konvergente Teilfolge {xnl }l ⊂ K. Da nun K abgeschlossen ist, gilt liml→∞ xnl =: x0 ∈ K. ⇐“: Nun sei K folgenkompakt. Dann ist K offenbar abgeschlossen. Wäre K nicht ” beschränkt, so gäbe es zu jedem n ∈ N ein xn ∈ M mit xn ̸∈ Bn (0). Somit gilt |xn | > n für alle n ∈ N, d.h. aus {xn }n können wir keine konvergente Teilfolge auswählen, Widerspruch! Also ist K kompakt. q.e.d. Definition 10.6: Eine Teilmenge S ⊂ M heißt dicht in M ⊂ Rd , wenn zu jedem x0 ∈ M eine Folge {xn }n ⊂ S existiert mit xn → x0 (n → ∞). Zum Beispiel liegt Qd dicht in Rd , denn zu beliebigem x0 = (x01 , . . . , x0d ) ∈ Rd können wir nach Satz 5.1 Folgen {xnj }n ⊂ Q, j = 1, . . . , d, finden mit xnj → x0j (n → ∞) und folglich Qd ∋ xn := (xn1 , . . . , xnd ) → (x01 , . . . , x0d ) = x0 für n → ∞. Abschließend wollen wir den Begriff des metrischen Raumes angeben und kurz diskutieren: Definition 10.7: Sei X eine beliebige Menge und zu je zwei Punkten x, y ∈ X existiere eine reelle Zahl d(x, y) mit den folgenden Eigenschaften: 10. DER D-DIMENSIONALE RAUM UND METRISCHE RÄUME 77 (a) d(x, y) > 0 für alle x, y ∈ X mit x ̸= y; d(x, x) = 0 für alle x ∈ X. (b) d(x, y) = d(y, x) für alle x, y ∈ X. (c) Dreiecksungleichung: d(x, y) ≤ d(x, z) + d(z, y) für alle x, y, z ∈ X. Dann nennen wir (X, d) einen metrischen Raum und die Abbildung d = d(x, y) : X × X → R die Metrik oder den Abstand auf X. Beispiele: 1. Jede Teilmenge X ⊂ Rd ist ein metrischer Raum mit der Metrik d(x, y) := |x − y|, x, y ∈ X, wie sofort aus Satz 10.1 folgt. 2. Sei X ein beliebiger linearer Vektorraum über R und es existiere eine Abbildung ∥ · ∥ : X → R, genannt Norm auf X, mit folgenden Eigenschaften: (a) ∥x∥ ≥ 0 für alle x ∈ X; ∥x∥ = 0 ⇔ x = 0. (b) ∥λx∥ = |λ| ∥x∥ für alle x ∈ X, λ ∈ R. (c) Dreiecksungleichung: ∥x + y∥ ≤ ∥x∥ + ∥y∥ für alle x, y ∈ X. Dann nennt man X, oder genauer (X, ∥ · ∥), einen normierten Vektorraum; z.B. ist also der euklidische Raum Rd mit der euklidischen Länge ∥ · ∥ := | · | ein normierter Vektorraum. Aus (a)-(c) folgt wie in Beispiel 1 wieder, dass jede Teilmenge Y ⊂ X eines normierten Vektorraumes auch metrischer Raum ist mit der Metrik d(x, y) := ∥x − y∥, x, y ∈ Y. Wir werden später Funktionenräume“ als Beispiele normierter Vektorräume ” kennenlernen. Diese sind, anders als der Rd , i.A. unendlich dimensional. 3. Wir können jede beliebige Menge X zu einem metrischen Raum machen mit der diskreten Metrik { 1, falls x ̸= y d(x, y) := , x, y ∈ X. 0, falls x = y Die Beispiele 1 und 2 zeigen also, dass man Mengen mit verschiedenen Metriken ausstatten kann; die folgenden topologischen Begriffe hängen dann ganz wesentlich von der gewählten Metrik ab. 78 KAPITEL 1. ZAHLEN, FOLGEN, REIHEN Die Begriffe Konvergenz und Cauchyfolge für Folgen {xn }n ⊂ Rd aus Definition 10.2 lassen sich nun sofort auf Folgen {xn }n ⊂ X aus einem metrischen Raum (X, d) übertragen, indem man den Abstand |x − y| durch d(x, y) ersetzt; z.B. heißt {xn }n ⊂ X konvergent (bzgl. d) gegen x ∈ X, wenn zu jedem ε > 0 ein N = N (ε) ∈ N existiert mit d(xn , x) < ε für alle n ≥ N. x heißt dann wieder Grenzwert oder Limes der Folge und wir schreiben xn → x (n → ∞) oder x = limn→∞ xn . Man rechnet leicht nach, dass wieder jede konvergente Folge in (X, d) auch Cauchyfolge ist. Die Umkehrung gilt jedoch i.A. nicht, sondern nur in vollständigen metrischen Räumen, vgl. Definition 5.2. Die topologischen Begriffe Offenheit und Abgeschlossenheit, innerer Punkt, Randpunkt, Häufungspunkt und isolierter Punkt sowie Inneres, Rand und Abschluss aus den Definitionen 10.3, 10.4 übertragen sich nun wörtlich auf Teilmengen metrischer Räume, wenn wir noch die r-Umgebung oder r-Kugel um x0 ∈ X gemäß Br (x0 ) := {x ∈ X : d(x, x0 ) < r} erklären. Bezeichnet M c := X \ M das Komplement einer Teilmenge M ⊂ X, so haben wir Satz 10.9: Mit den oben erklärten Begriffen bleiben die Aussagen der Sätze 10.510.7 in jedem metrischen Raum (X, d) richtig. Beweis: Durch wörtliches Übertragen der Beweise. q.e.d. Der Begriff der Beschränktheit einer Menge aus Definition 10.5 macht in einem metrischen Raum (X, d) wenig Sinn, da X kein ausgezeichnetes Element 0 enthalten muss. Wir nutzen daher den Begriff des Durchmessers, vgl. die Bemerkung im Anschluss an Definition 10.5: Definition 10.8: Ist (X, d) metrischer Raum, so erklären wir den Durchmesser von M ⊂ X gemäß diam M := sup{d(x, y) : x, y ∈ M }, diam ∅ := 0. Gilt diam M < +∞, so heißt M beschränkt, sonst unbeschränkt. Wie bereits im Anschluss an Satz 10.8 bemerkt, gilt dieser in metrischen Räumen i.A. nicht mehr. Erklären wir den Begriff Folgenkompaktheit wieder analog zum Rd , so haben wir jedoch den Satz 10.10: Jede folgenkompakte Teilmenge M eines metrischen Raumes (X, d) ist abgeschlossen und beschränkt. 10. DER D-DIMENSIONALE RAUM UND METRISCHE RÄUME 79 Beweis: • Abgeschlossenheit: Ist {xn }n ⊂ M konvergent gegen x0 ∈ X, so konvergiert auch jede Teilfolge {xnk }k ⊂ {xn }n gegen x0 . Die Folgenkompaktheit liefert also x0 ∈ M . • Beschränktheit: Wäre M unbeschränkt, also sup{d(x, y) : x, y ∈ M } = +∞ erfüllt, so gäbe es Punkte xn , yn ∈ M mit d(xn , yn ) ≥ n für alle n ∈ N. Zu beliebigem x0 ∈ M können wir dann zu einer Teilfolge {zk′ }k ⊂ M von {xn }n oder {yn }n übergehen mit d(zk′ , x0 ) ≥ k für alle k ∈ N. Dann enthält aber {zk′ }k offenbar keine in M konvergente Teilfolge, im Widerspruch zur Folgenkompaktheit. q.e.d. Kapitel 2 Funktionen und Stetigkeit 1 Beispiele und Grenzwerte von Funktionen Definition 1.1: • Es sei D ⊂ Rn (n ∈ N) eine beliebige, nichtleere Menge. Jedem Punkt x ∈ D werde vermöge der Funktion f : D → Rd (d ∈ N) genau ein Wert y = f (x) ∈ Rd zugeordnet. Man schreibt auch x 7→ f (x) oder f = f (x) oder y = f (x) für die Funktion. In Koordinaten haben wir d Funktionen f1 (x1 , . . . , xn ), . . . , fd (x1 , . . . , xn ), x = (x1 , . . . , xn ) ∈ D, mit ( ) (y1 , . . . , yd ) = y = f (x) = f1 (x1 , . . . , xn ), . . . , fd (x1 , . . . , xn ) . • Die Menge D ⊂ Rn heißt Definitionsbereich der Funktion f : D → Rd , die Menge W := {f (x) : x ∈ D} =: f (D) ist der Wertebereich von f . Schließlich ist der Graph von f erklärt als { } graph f := (x, f (x)) : x ∈ D ⊂ Rn × Rd = Rn+d . Bemerkungen: 1. Eine Funktion ist also eine Abbildung zwischen Teilmengen n- bzw. d-dimensionaler reeller Räume, nämlich f : D → W , D ⊂ Rn , W ⊂ Rd . Daher sprechen wir gleichwertig von Funktionen und Abbildungen. 2. Gilt speziell n = 2 oder/und d = 2, so können wir D bzw. W mit einer komplexen Struktur ausstatten, d.h. D ⊂ C bzw. W ⊂ C auffassen. So kann z.B. jede Funktion f : D → R2 als Funktion f : D → C interpretiert werden. In diesem Sinne sind Funktionen f : D → R also Spezialfälle von Funktionen f : D → C. 81 82 KAPITEL 2. FUNKTIONEN UND STETIGKEIT 3. Analog können wir natürlich Funktionen zwischen metrischen Räumen erklären: Seien (X, d), (Y, δ) zwei metrische Räume und D ⊂ X eine nichtleere Teilmenge. Dann ordnet f : D → Y jedem x ∈ D einen eindeutigen Wert y = f (x) ∈ Y zu. Die Begriffe Definitionsbereich, Wertebereich und Graph übertragen sich wörtlich; eine komponentenweise Darstellung ist natürlich i.A. nicht möglich. Definition 1.2: Eine Funktion f : D → Rd heißt beschränkt, wenn ein c ∈ R so existiert, dass gilt |f (x)| ≤ c für alle x ∈ D. Anderenfalls heißt die Funktion unbeschränkt. Bemerkung: Eine Funktion f : D → Rd ist also genau dann beschränkt, wenn ihr Wertebereich W = f (D) ⊂ Rd beschränkt ist. Letztere Eigenschaft definiert auch beschränkte Funktionen zwischen metrischen Räumen. Beispiele: 1. Für den Fall d = 1 lässt sich der Graph von f : D → R, also die Punkte (x, f (x)) ∈ Rn+1 , x ∈ D, als Höhenfunktion über D ⊂ Rn veranschaulichen (→ Berglandschaft). Alternativ (für n ≥ 2) kann man sich die Funktion durch Niveaumengen veranschaulichen. Hierzu skizziert man Γf (c) := {x ∈ D : f (x) = c}, die Niveaumenge zum Niveau c ∈ R. Zum Beispiel skizziere man die Niveaumengen (hier Niveaulinien) für f = (x1 , x2 ) := x21 − x22 , x = (x1 , x2 ) ∈ R2 . Man beachte, dass f unbeschränkt ist, da Γ(c) ̸= ∅ für alle c ∈ R gilt. Konvention: Für n = 2, d = 1 schreibt man häufig x1 =: x, x2 =: y und y =: z, also z = f (x, y). 2. Eine Funktion f : D → Rd , d ≥ 2, kann man als Vektorfeld interpretieren, indem man an jeden Punkt x ∈ D ⊂ Rn den Vektor f (x) ∈ Rd anheftet“. ” Diese Interpretation spielt vor allem in der Physik eine Rolle, etwa bei der Beschreibung von Kraftfeldern. 3. Weiter lässt sich f : D → Rd , d ≥ 2, für D ⊂ Rn mit n = 1 als Kurve und für n = 2 als Fläche im Rd interpretieren. Ist allgemeiner 2 ≤ n < d, so spricht man von einer n-dimensionalen Fläche im Rd . Dabei heißt m := d − n ∈ N die Codimension der Fläche. 1. BEISPIELE UND GRENZWERTE VON FUNKTIONEN 83 Speziell lässt sich für g : D → R mit D ⊂ Rn , n ≥ 2, der Graph von g als n-dimensionale Fläche im Rn+1 interpretieren: f (x) := (x, g(x)) : D → Rn+1 . In diesem Fall ist also die Codimension m = (n + 1) − n = 1; man spricht dann von einer Hyperfläche. 4. Jedes komplexe Polynom f (z) = an z n + an−1 z n−1 + . . . + a1 z + a0 (a0 , . . . , an ∈ C) ist eine Funktion f : C → C. Auch Potenzreihen P(z) = ∞ ∑ ak z k (al ∈ C für alle l ∈ N0 ) k=0 sind komplexe Funktionen P : KR (0) → C, wobei R ∈ [0, +∞) ∪ {+∞} den Konvergenzradius der Reihe bezeichne. Alle nichtkonstanten Polynome sind unbeschränkt! 5. Funktionen müssen keine geschlossene Darstellung besitzen. Beispiele sind die Signumfunktion −1, x < 0 0, x=0 : R→R sgn(x) := +1, x > 0 oder die Dirichletsche Sprungfunktion { 1, x ∈ Q : R → R. f (x) := 0, x ∈ R \ Q Beide Funktionen sind beschränkt. 6. Die wohl wichtigsten Beispiele von Funktionen auf metrischen Räumen sind durch Integrale gegeben. Z.B. werden wir insbesondere für stetige Funktionen f : [a, b] → R, −∞ < a < b < +∞, das Riemann-Integral erklären: ∫b I(f ) := f (x) dx. a Es wird sich zeigen, dass der Raum C 0 ([a, b]) der auf [a, b] stetigen, reellwertigen Funktionen ein normierter und damit ein metrischer Raum ist. Also stellt I : C 0 ([a, b]) → R eine Funktion auf C 0 ([a, b]) dar. Reellwertige Funktionen auf metrischen Räumen nennt man Funktionale. 84 KAPITEL 2. FUNKTIONEN UND STETIGKEIT Definition 1.3: Sei D ⊂ Rn und x0 ein Häufungspunkt von D. Zu der Funktion f : D → Rd gäbe es ein a ∈ Rd , so dass für alle ε > 0 ein δ = δ(ε) > 0 existiere mit der Eigenschaft |f (x) − a| < ε für alle x ∈ D mit 0 < |x − x0 | < δ. (1.1) Dann heißt a der Grenzwert oder Limes der Funktion f = f (x) im Punkt x0 und wir schreiben lim f (x) = a oder f (x) → a (x → x0 ). x→x0 Man sagt auch: f (x) konvergiert gegen a, wenn x gegen x0 strebt. Geometrisch: Es gilt limx→x0 f (x) = a genau dann, wenn für alle ε > 0 ein δ = δ(ε) > 0 existiert, so dass f (x) ∈ Bε (a) für alle x ∈ Bδ′ (x0 ) ∩ D richtig ist. Hier bezeichnet Bδ′ (x0 ) := Bδ (x0 ) \ {x0 } die punktierte Kugel. Satz 1.1: Für f : D → Rd , x0 Häufungspunkt von D ⊂ Rn , gilt f (x) → a (x → x0 ) genau dann, wenn für jede Folge {xp }p ⊂ D \ {x0 } mit xp → x0 (p → ∞) die Beziehung limp→∞ f (xp ) = a gilt. Beweis: • ⇒“: Sei also limx→x0 f (x) = a erfüllt und {xp }p ⊂ D \ {x0 } eine Folge mit ” xp → x0 (p → ∞). Zu beliebig vorgegebenem ε > 0 wählen wir δ = δ(ε) > 0 wie in Definition 1.3 und N = N (ε) ∈ N so, dass gilt 0 < |xp − x0 | < δ(ε) für alle p ≥ N (ε). Dann folgt aus Formel 1.1 |f (xp ) − a| < ε für alle p ≥ N (ε), also limp→∞ f (xp ) = a. • ⇐“: Sei nun limp→∞ f (xp ) = a richtig für jede Folge {xp }p ⊂ D \ {x0 } ” mit limp→∞ xp = x0 . Angenommen es gilt nicht limx→x0 f (x) = a, d.h.: Es gibt ein ε > 0, so dass für alle δ > 0 ein x ∈ D existiert mit 0 < |x − x0 | < δ und |f (x) − a| ≥ ε. Wählen wir speziell δ = p1 , so finden wir also xp ∈ D mit 0 < |xp − x0 | < p1 und |f (xp ) − a| ≥ ε > 0 für alle p ∈ N. Da dann aber für die Folge {xp }p ⊂ D \ {x0 } gilt limp→∞ xp = x0 , müsste nach Voraussetzung |f (xp ) − a| → 0 (p → ∞) erfüllt sein, Widerspruch! Also gilt doch limx→x0 f (x) = a. q.e.d. 1. BEISPIELE UND GRENZWERTE VON FUNKTIONEN 85 Satz 1.2: (Rechenregeln für Funktionsgrenzwerte) Seien Funktionen f, g : D → Rd erklärt mit limx→x0 f (x) = a, limx→x0 g(x) = b, wobei x0 Häufungspunkt von D ⊂ Rn sei. Dann gelten die Rechenregeln: lim [λf (x) + µg(x)] = λa + µb x→x0 für alle λ, µ ∈ R, lim ⟨f (x), g(x)⟩ = ⟨a, b⟩ x→x0 und für d = 2, also f, g : D → C, auch lim [λf (x) + µg(x)] = λa + µb x→x0 für alle λ, µ ∈ C, lim f (x)g(x) = ab, x→x0 lim x→x0 f (x) a = , g(x) b falls g ̸= 0 in D und b ̸= 0 ist. Beweis: Mit Satz 1.1 ergeben sich die Aussagen sofort aus den entsprechenden Rechenregeln für Folgengrenzwerte. Zur Übung kann man die Aussagen auch direkt über die ε-δ-Definition“ 1.1 beweisen. ” q.e.d. Bemerkung: Die Definition und Schreibweise von Grenzwerten aus Definition 1.3 überträgt sich wieder auf Funktionen f : D → Y , D ⊂ X, zwischen metrischen Räumen (X, d), (Y, δ), indem man |x − x0 | durch d(x, x0 ) und |f (x) − a| durch δ(f (x), a) ersetzt. Die geometrische Deutung bleibt also wörtlich erhalten. Auch Satz 1.1 bleibt natürlich richtig. Hingegen machen die Rechenregeln aus Satz 1.2 nur für Y = Rd bzw. Y = C Sinn, die Linearität auch in normierten Räumen Y . Wir betrachten noch einige spezielle Grenzprozesse für Funktionen einer reellen Veränderlichen: Definition 1.4: Es seien D ⊂ R und f : D → Rd gegeben. (i) Gilt (x0 , x0 + α) ⊂ D und gibt es ein a ∈ Rd , so dass für alle ε > 0 ein δ = δ(ε) ∈ (0, α) existiert mit |f (x) − a| < ε für alle x0 < x < x0 + δ, so heißt a der rechtsseitige Limes von f an der Stelle x0 ; wir schreiben dann f (x0 +) := lim f (x) = a x→x0 + oder f (x) → a (x → x0 +). (ii) Gilt (x0 − α, x0 ) ⊂ D und gibt es ein a ∈ Rd , so dass für alle ε > 0 ein δ = δ(ε) ∈ (0, α) existiert mit |f (x) − a| < ε für alle x0 − δ < x < x0 , 86 KAPITEL 2. FUNKTIONEN UND STETIGKEIT so heißt a der linksseitige Limes von f an der Stelle x0 ; wir schreiben dann f (x0 −) := lim f (x) = a oder x→x0 − f (x) → a (x → x0 −). (iii) Gilt (β, +∞) ⊂ D, so sagen wir, f (x) konvergiert gegen b ∈ Rd für x → +∞, wenn f ( 1t ) → b (t → 0+) gilt; wir schreiben dann lim f (x) = b x→+∞ oder f (x) → b (x → +∞). (iv) Ist schließlich (−∞, β) ⊂ D, so sagen wir, f (x) konvergiert gegen b ∈ Rd für x → −∞, wenn f ( 1t ) → b (t → 0−) richtig ist; wir schreiben dann lim f (x) = b x→−∞ oder f (x) → b (x → −∞). Bemerkung: Ist f : D → Rd , D ⊂ R und (x0 − α, x0 + α) \ {x0 } ⊂ D, so besitzt f in x0 genau dann den Grenzwert limx→x0 f (x) =: a, wenn gilt lim f (x) = a = lim f (x). x→x0 − x→x0 + Beispiele: 1. Für die Signumfunktion sgn(x) : R → R gilt in x0 = 0: lim sgn(x) = −1, x→0− lim sgn(x) = +1. x→0+ Also besitzt sgn(x) in x0 = 0 keinen Grenzwert. 2. Für die Funktion f (x) := x1 : (0, +∞) → R gilt limx→+∞ f (x) = 0, denn wir haben f ( 1t ) = t → 0 (t → 0+). Definition 1.5: Sei D ⊂ Rn und x0 ∈ D Häufungspunkt. Wir sagen, eine Funktion f : D → R konvergiert gegen +∞ (bzw. −∞) für x → x0 , wenn zu jedem c > 0 ein δ > 0 existiert mit f (x) > c (bzw. f (x) < −c) für alle x ∈ Bδ′ (x0 ) ∩ D. Wir schreiben lim f (x) = ±∞ x→x0 oder f (x) → ±∞ (x → x0 ). 1. BEISPIELE UND GRENZWERTE VON FUNKTIONEN 87 Bemerkungen: 1. Man erweitert entsprechend für Funktionen f : D → R, D ⊂ R, die einseitigen Grenzwerte aus Definition 1.4 auf Werte ±∞. Auch die Verallgemeinerung der Definitionen 1.4 bzw. 1.5 auf metrische Räume im Bild- bzw. Urbildbereich ist offensichtlich. 2. Wie in Satz 4.3 aus Kap. 1 sieht man leicht: Sei f : D → R, D ⊂ Rn , x0 Häufungspunkt von D, mit f (x) > 0 nahe“ x0 . Dann gilt ” ⇔ lim f (x) = +∞ x→x0 lim x→x0 1 = 0. f (x) Entsprechendes gilt im Falle n = 1 für die einseitigen Grenzwerte. Beispiele: √ 1. limx→0+ x = 0. Ist nämlich ε > 0 beliebig, so wählen wir δ = δ(ε) := ε2 > 0 √ und erhalten 0 < x < ε für 0 < x < δ(ε). Nach der letzten Bemerkung folgt √ noch limx→+∞ x = +∞, denn 1 lim √ x→+∞ x 2. Wir wissen bereits Satz 1.2: Def. 1.4 (iii) = lim t→0+ √ t = 0. → 0 (x → +∞). Somit liefern die Rechenregeln aus 1 x 7− 7x − 2 = lim x→+∞ 3x + 1 x→+∞ 3 + lim 2 x 1 x 7 = . 3 √ √ 3. Für beliebiges a ∈ R gilt limx→+∞ ( x + a − x) = 0, denn für positives x > −a folgt aus Beispiel 1 √ √ √ √ √ √ |( x + a − x)( x + a + x)| √ 0 ≤ | x + a − x| = √ x+a+ x |a| |a| = √ √ < √ → 0 (x → +∞). x x+a+ x 4. limx→+∞ x3 +1 x2 +1 = +∞. Denn wir haben lim x→+∞ 1+ 1 x2 + 1 = lim · lim x→+∞ x x→+∞ 1 + x3 + 1 also die Behauptung aus obiger Bemerkung. 1 x2 1 x3 = 0 · 1 = 0, 88 2 KAPITEL 2. FUNKTIONEN UND STETIGKEIT Der Stetigkeitsbegriff Definition 2.1: Seien D ⊂ Rn , x0 ∈ D und eine Funktion f : D → Rd gegeben. Dann heißt f in x0 stetig, wenn zu jedem ε > 0 ein δ = δ(ε) > 0 existiert, so dass gilt |f (x) − f (x0 )| < ε für alle x ∈ D mit |x − x0 | < δ. Anderenfalls heißt f in x0 unstetig. Bemerkungen: 1. Ist x0 ∈ D isolierter Punkt von D, so ist offenbar jede Funktion f : D → Rd in x0 stetig. 2. Die Stetigkeit ist eine lokale Eigenschaft“, d.h.: Ist f in x0 stetig (bzw. un” stetig) und ändern wir f in D \ Br (x0 ) für ein r > 0 beliebig ab, so bleibt die resultierende Funktion in x0 stetig (bzw. unstetig). 3. Definition 2.1 überträgt sich wörtlich auf Funktionen f : D → Y , D ⊂ X, zwischen metrischen Räumen (X, d), (Y, δ), wenn man |f (x) − f (x0 )| durch δ(f (x), f (x0 )) und |x − x0 | durch d(x, x0 ) ersetzt. Auch der folgende Satz bleibt richtig: Satz 2.1: (Charakterisierung der Stetigkeit) Sei f : D → Rd auf D ⊂ Rn erklärt und sei x0 ∈ D Häufungspunkt. Dann sind folgende Aussagen äquivalent: (i) f ist stetig in x0 . (ii) Es gilt lim f (x) = f (x0 ). x→x0 (iii) Für jede Folge {xp }p ⊂ D mit xp → x0 (p → ∞) gilt lim f (xp ) = f (x0 ). p→∞ Beweis: Sofort aus den Definitionen 1.3 und 2.1 sowie Satz 1.1. In (iii) kann die Forderung xp ̸= x0 aus Satz 1.1 offenbar fallen gelassen werden. q.e.d. Satz 2.2: (Rechenregeln) (a) Sind f, g : D → Rd stetig in x0 ∈ D, so gilt dies auch für das Skalarprodukt ⟨f, g⟩ und jede Linearkombination λf + µg mit λ, µ ∈ R. (b) Sind f, g : D → C stetig in x0 ∈ D, so gilt dies auch für jede Linearkombination λf + µg mit λ, µ ∈ C, das Produkt f g und, falls g ̸= 0 in D, auch für den Quotienten fg . Beweis: Sofort aus Satz 1.2 und Satz 2.1. q.e.d. 2. DER STETIGKEITSBEGRIFF 89 Beispiele: ∑ 1. Polynomfunktionen p(z) = nk=0 ak z k mit Koeffizienten a0 , . . . , an ∈ C sind in jedem Punkt z0 ∈ C stetig nach Satz 2.2, da dies für die konstante f1 (z) := c ∈ C und die lineare Funktion f2 (z) := z erfüllt ist. 2. Die Dirichletsche Sprungfunktion f (x) := { 1, x ∈ Q 0, x ∈ R \ Q ist in keinem Punkt aus R stetig. Die Funktion { x, x ∈ Q f (x) := 0, x ∈ R \ Q ist in x = 0 und nur dort stetig (→ Übungsaufgaben). 3. Die Signumfunktion −1, x < 0 0, x=0 sgn(x) := 1, x>0 ist für alle x ∈ R \ {0} stetig und in x = 0 unstetig. Satz 2.3: (Komposition stetiger Funktionen) Seien Funktionen f : D → Rd und g : E → Rm gegeben mit D ⊂ Rn , E ⊂ Rd und f (D) ⊂ E. Weiter seien f in x0 ∈ D und g in y0 = f (x0 ) ∈ E stetig. Dann ist auch die Komposition h := g ◦ f : D → Rm in x0 stetig. Beweis: Da für isolierte Punkte x0 ∈ D nichts zu zeigen ist, können wir annehmen, dass x0 Häufungspunkt von D ist. Sei nun {xp }p ⊂ D \ {x0 } mit xp → x0 (p → ∞) eine beliebige Folge. Nach Satz 2.1 gilt dann lim f (xp ) = f (x0 ) = y0 . p→∞ Somit folgt wiederum nach Satz 2.1 lim h(xp ) = lim g(f (xp )) = g(y0 ) = h(x0 ), p→∞ p→∞ also die behauptete Stetigkeit von h = g ◦ f . q.e.d. Definition 2.2: Eine Funktion f : D → Rd , D ⊂ Rn , nennen wir stetig (auf D), wenn f in allen Punkten x ∈ D stetig ist. Mit C 0 (D, Rd ) bezeichnen wir die Klasse aller auf D stetigen Funktionen. Für d = 1 schreiben wir auch kurz C 0 (D) := C 0 (D, R) und für d = 2 auch C 0 (D, C) := C 0 (D, R2 ). 90 KAPITEL 2. FUNKTIONEN UND STETIGKEIT Bemerkung: Gemäß Satz 2.2 wird C 0 (D, Rd ) durch die Verknüpfungen (f + g)(x) := f (x) + g(x), (λf )(x) := λf (x) für x ∈ D zu einem (unendlich dimensionalen) Vektorraum. Wir wollen nun die Umkehrfunktion zu einer injektiven Funktion f : D → Rd mit D ⊂ Rn betrachten, d.h. die Funktion f −1 : W → Rn mit W := f (D), die durch die Forderung f (x) = y ⇔ f −1 (y) = x für x ∈ D, y ∈ W eindeutig bestimmt ist. Satz 2.4: (Stetigkeit der Umkehrfunktion) Sei K ⊂ Rn kompakt und f : K → Rd sei stetig und injektiv mit Wertebereich W := f (K). Dann ist auch die Umkehrfunktion f −1 : W → Rn von f stetig auf W . Beweis: Sei y0 ∈ W beliebig gewählt und sei {yp }p ⊂ W mit yp → y0 (p → ∞). Zu zeigen ist dann xp := f −1 (yp ) → f −1 (y0 ) =: x0 (p → ∞). Die Folge {xp }p ⊂ K ist beschränkt, da K beschränkt ist. Sei nun ξ ∈ Rn ein beliebiger Häufungspunkt von {xp }p und {xpk }k eine Teilfolge mit xpk → ξ (k → ∞). Da K abgeschlossen ist, gilt ξ ∈ K. Die Stetigkeit von f liefert also f (xpk ) → f (ξ) (k → ∞). Andererseits wissen wir f (xpk ) = f (f −1 (ypk )) = ypk → y0 (k → ∞), also f (ξ) = y0 = f (x0 ), so dass die Injektivität von f liefert ξ = x0 für alle Häufungspunkte von {xp }p . Das bedeutet lim xp = x0 , wie behauptet. p→∞ q.e.d. Bemerkung: Auch die Sätze 2.3 und 2.4 bleiben für Funktionen zwischen metrischen Räumen richtig, wenn man in Satz 2.4 noch kompakt“ durch folgenkompakt“ er” ” setzt; vgl. Kap. 1, § 10. Wir wollen uns nun der Frage nach der Existenz einer stetigen Umkehrfunktion für reellwertige Funktionen einer reellen Veränderlichen widmen. Wir beginnen mit einem Satz, der von unabhängigem Interesse ist: Satz 2.5: (Zwischenwertsatz von Bolzano-Weierstraß) Sei f : [a, b] → R stetig mit f (a) ̸= f (b). Dann existiert zu jedem Wert c zwischen f (a) und f (b) mindestens ein ξ ∈ (a, b) mit f (ξ) = c. 2. DER STETIGKEITSBEGRIFF 91 Beweis: Wir können f (a) < c < f (b) annehmen; anderenfalls gehen wir zu −f und −c über. Wir betrachten nun die Menge M := {x ∈ [a, b] : f (x) < c}, die offenbar nichtleer und beschränkt ist. Setzen wir ξ := sup M , so gibt es eine Folge {xp }p ⊂ M mit xp → ξ (p → ∞); vgl. Hilfssatz 6.1 aus Kap. 1. Die Stetigkeit von f liefert also f (ξ) = limp→∞ f (xp ) ≤ c, und nach Voraussetzung folgt ξ < b. Wäre nun f (ξ) < c, so gäbe es wegen der Stetigkeit von f ein δ ∈ (0, b − ξ), so dass gilt f (x) < c für alle x ∈ [ξ, ξ + δ), im Widerspruch zur Wahl von ξ = sup M . Also folgt f (ξ) = c. q.e.d. Folgerung 2.1: Sei I ⊂ R ein beliebiges, nicht notwendig beschränktes Intervall und f : I → R eine stetige Funktion. Dann ist auch f (I) ⊂ R ein Intervall. Beweis: Wir setzen I ∗ = f (I) und ξ := inf I ∗ ∈ R ∪ {−∞}, η := sup I ∗ ∈ R ∪ {+∞}. Wir zeigen nun (ξ, η) ⊂ I ∗ : Ist nämlich y ∈ (ξ, η) beliebig, so gibt es gemäß Hilfssatz 6.1 aus Kap. 1 Zahlen a, b ∈ I mit ξ ≤ f (a) < y < f (b) ≤ η. Nach dem Zwischenwertsatz existiert nun ein x ∈ (a, b) ⊂ I mit f (x) = y, d.h. y ∈ I ∗ . Wir erhalten, dass I ∗ eines der folgenden Intervalle sein muss: (ξ, η), [ξ, η), (ξ, η] oder [ξ, η]. ∗ Sonst gäbe es nämlich ein z ∈ I mit z < ξ oder z > η, im Widerspruch zur Definition von ξ und η. q.e.d. Definition 2.3: Eine Funktion f : D → R, D ⊂ R, heißt monoton wachsend (bzw. fallend), wenn f (x) ≤ f (y) (bzw. f (x) ≥ f (y)) für alle x, y ∈ D mit x < y erfüllt ist. f heißt streng monoton wachsend (bzw. fallend), wenn gilt f (x) < f (y) (bzw. f (x) > f (y)) für alle x, y ∈ D mit x < y. Satz 2.6: Sei I ⊂ R ein nichtleeres Intervall. Dann besitzt jede stetige, streng monotone Funktion f : I → R eine stetige, streng monotone Umkehrfunktion f −1 : I ∗ → R mit dem Intervall I ∗ := f (I). Beweis: Zunächst ist eine streng monotone Funktion offensichtlich injektiv. Also existiert die Umkehrfunktion f −1 : I ∗ → R, und nach Folgerung 2.1 ist I ∗ ein Intervall. O.B.d.A. sei nun f streng monoton wachsend, sonst gehen wir zu −f über. Dann ist auch f −1 streng monoton wachsend. Zu zeigen bleibt also die Stetigkeit von f −1 : 92 KAPITEL 2. FUNKTIONEN UND STETIGKEIT • Sei dazu zunächst y0 ∈ int I ∗ . Dann ist auch x0 := f −1 (y0 ) ∈ int I aufgrund der Monotonie. Also existiert ein ε > 0 mit [x0 − ε, x0 + ε] ⊂ I, und nach Satz 2.4 ist f −1 stetig auf f ([x0 − ε, x0 + ε]), also insbesondere in f (x0 ) = y0 . • Sei nun y0 ̸∈ int I ∗ . Dann ist y0 ein Endpunkt von I ∗ , sagen wir der linke Endpunkt. Somit muss, wieder wegen der Monotonie, auch x0 := f −1 (y0 ) linker Endpunkt von I sein. Es gibt dann ein ε > 0, so dass gilt [x0 , x0 + ε] ⊂ I und nach Satz 2.4 ist f −1 stetig auf f ([x0 , x0 + ε]) und insbesondere in f (x0 ) = y0 . q.e.d. 3 Stetige Funktionen auf Kompakta, gleichmäßige Stetigkeit Wir haben in Paragraph 2 gesehen, dass stetige, injektive Funktionen auf kompakten Teilmengen des Rn eine stetige Umkehrfunktion besitzen. In diesem Paragraphen wollen wir weitere Eigenschaften kennenlernen, die Kompakta als Definitionsgebiete auszeichnen. Wir beginnen mit dem Satz 3.1: Ist K ⊂ Rn kompakt und f ∈ C 0 (K, Rd ), dann ist auch f (K) ⊂ Rd kompakt. Beweis: Sei {yp }p ⊂ f (K) eine beliebige Folge. Zu jedem yp gibt es (mindestens) ein xp ∈ K mit f (xp ) = yp . Da K kompakt ist, können wir nach Kap. 1, Satz 10.8 aus {xp }p ⊂ K eine konvergente Teilfolge {xpl }l auswählen mit liml→∞ xpl =: x0 ∈ K. Die Stetigkeit von f ergibt nun ypl = f (xpl ) → f (x0 ) =: y0 ∈ f (K) für l → ∞. Wiederum Satz 10.8 aus Kap. 1 liefert die behauptete Kompaktheit von f (K). q.e.d. Eines der wichtigsten Hilfsmittel der Analysis enthält der folgende Satz 3.2: (Weierstraßscher Hauptlehrsatz) Sei K ⊂ Rn kompakt und nichtleer und sei f ∈ C 0 (K, R). Dann gibt es Punkte x, x ∈ K, so dass gilt f (x) ≤ f (x) ≤ f (x) für alle x ∈ K. Bemerkung: Relation (3.1) können wir auch schreiben als f (x) = inf f (K) =: inf f (x) = inf f, x∈K K f (x) = sup f (K) =: sup f (x) = sup f. x∈K K (3.1) 3. KOMPAKTA UND GLEICHMÄSSIGE STETIGKEIT 93 Das heißt: Eine stetige, auf einem Kompaktum erklärte Funktion nimmt dort ihr Infimum (=Minimum) bzw. Supremum (=Maximum) an. Die Aussage wird offenbar falsch, wenn man eine der Voraussetzungen fallen lässt. Beweis von Satz 3.2: Nach Satz 3.1 ist f (K) ⊂ R beschränkt und abgeschlossen. Inbesondere existieren also m := inf f ∈ R, K m := sup f ∈ R. K Nach Hilfssatz 6.1 aus Kap. 1 gibt es nun zwei Folgen {xp }p , {xp }p ⊂ K mit f (xp ) → m, f (xp ) → m (p → ∞). (3.2) Da K kompakt ist, können wir andererseits konvergente Teilfolgen {xpl }l , {xpl }l auswählen mit x := liml→∞ xpl ∈ K und x := liml→∞ xpl ∈ K. Die Stetigkeit von f liefert dann (3.3) f (xpl ) → f (x), f (xpl ) → f (x) (l → ∞). Ein Vergleich von (3.2) und (3.3) ergibt also f (x) = m ≤ f (x) ≤ m = f (x) für alle x ∈ K, wie behauptet. q.e.d. Für die Formulierung des dritten grundlegenden Resultats benötigen wir noch die folgende Verschärfung des Stetigkeitsbegriffs: Definition 3.1: Sei D ⊂ Rn und f : D → Rd gegeben. Dann heißt f gleichmäßig stetig auf D, wenn zu jedem ε > 0 ein δ = δ(ε) > 0 existiert, so dass gilt |f (x) − f (x′ )| < ε für alle x, x′ ∈ D mit |x − x′ | < δ. (3.4) Bemerkung: Für eine stetige Funktion f ∈ C 0 (D, Rd ) gilt (3.4) ebenfalls, jedoch mit einem i.A. von x, x′ ∈ D abhängigen δ = δ(ε, x, x′ ). Jede gleichmäßig stetige Funktion ist also stetig. Die Umkehrung gilt jedoch nicht, wie etwa das Beispiel f (x) := x1 , x ∈ (0, 1], zeigt: Angenommen es gäbe z.B. für ε = 1 ein δ > 0, so dass |f (x) − f (x′ )| < 1 für alle x, x′ ∈ (0, 1] mit |x − x′ | < δ richtig ist. Speziell für 0 < x < min{δ, 12 } und x′ = 2x folgte dann aber |x−x′ | = x < δ und |f (x)−f (x′ )| = 1 1 | x1 − 2x | = 2x > 1, Widerspruch! Satz 3.3: (Heine) Ist K ⊂ Rn kompakt und f ∈ C 0 (K, Rd ), so ist f gleichmäßig stetig. 94 KAPITEL 2. FUNKTIONEN UND STETIGKEIT Beweis: Angenommen, f ist nicht gleichmäßig stetig. Dann gibt es also ein ε > 0, so dass für alle δ > 0 Punkte x, x′ ∈ K mit |x − x′ | < δ existieren, für die gilt |f (x) − f (x′ )| ≥ ε. Wählen wir insbesondere δ = p1 , p ∈ N, so finden wir also Folgen {xp }p , {x′p }p ⊂ K mit 1 für alle p ∈ N (3.5) |xp − x′p | < p und |f (xp ) − f (x′p )| ≥ ε für alle p ∈ N. (3.6) Da nun K kompakt ist, existiert nach Satz 10.8 aus Kap. 1 eine konvergente Teilfolge {xpl }l ⊂ {xp }p mit liml→∞ xpl = x0 ∈ K. Für die entsprechende Teilfolge {x′pl }l ⊂ {x′p }p liefert (3.5) ebenfalls liml→∞ x′pl = x0 . Und aus der Stetigkeit von f und (3.6) folgern wir 0 = |f (x0 ) − f (x0 )| = lim f (xpl ) − lim f (x′pl ) = lim |f (xpl ) − f (x′pl )| ≥ ε > 0, l→∞ l→∞ l→∞ also einen Widerspruch! q.e.d. Bemerkungen: 1. Im obigen Beispiel f (x) = kompakt. 1 x, x ∈ (0, 1], ist zwar f stetig aber (0, 1] nicht 2. Die drei Sätze dieses Paragraphen bleiben für Funktionen auf kompakten Teilmengen metrischer Räume richtig, wenn man den Kompaktheitsbegriff nach Heine-Borel benutzt. Für den Beweis verwendet man, dass dieser in metrischen Räumen äquivalent zur Folgenkompaktheit ist. 4 Funktionenfolgen und gleichmäßige Konvergenz Wir betrachten nun Folgen {fn }n von Funktionen fn : D → Rd , die alle auf ein und derselben nichtleeren Menge D ⊂ Rm erklärt seien. Definition 4.1: Eine Funktionenfolge {fn }n mit fn : D → Rd , n ∈ N, heißt punktweise konvergent auf D ⊂ Rm , wenn die Punktfolge {fn (x)}n ⊂ Rd für jedes x ∈ D konvergent ist. Die Grenzwerte f (x) := lim fn (x), n→∞ x ∈ D, definieren dann eine Funktion f : D → Rd , den sogenannten punktweisen Limes der Funktionenfolge {fn }n . Schreibweise: fn → f (n → ∞) auf D. 4. FUNKTIONENFOLGEN UND GLEICHMÄSSIGE KONVERGENZ 95 Beispiele: 1. D = [0, 1] ⊂ R, fn (x) := xn . {fn }n konvergiert bekanntlich punktweise gegen die Funktion { 0, x ∈ [0, 1) . f (x) := 1, x = 1 1 2. D = [0, +∞), gn (x) := x n . Dann konvergiert {gn }n punktweise gegen { 1, x ∈ (0, +∞) g(x) := . 0, x = 0 Die Beispiele zeigen, dass der punktweise Limes einer Folge stetiger Funktionen nicht wieder stetig sein muss. Um beim Grenzübergang in der Klasse der stetigen Funktionen zu bleiben, benötigen wir einen stärkeren Konvergenzbegriff, der auf Weierstraß zurückgeht: Definition 4.2: Eine Folge {fn }n von Funktionen fn : D → Rd mit D ⊂ Rm heißt gleichmäßig konvergent gegen f : D → Rd , in Zeichen fn → → f (n → ∞) auf D, wenn zu jedem ε > 0 ein N = N (ε) ∈ N existiert mit |fn (x) − f (x)| < ε für alle x ∈ D und n ≥ N (ε). (4.1) Bemerkung: Formel (4.1) gilt natürlich auch für den punktweisen Limes einer Funktionenfolge, allerdings mit einem i.A. von x ∈ D abhängigen N = N (ε, x) ∈ N. Satz 4.1: (Weierstraßscher Konvergenzsatz) Die Folge {fn }n stetiger Funktionen fn : D → Rd konvergiere auf D ⊂ Rm gleichmäßig gegen f : D → Rd . Dann ist f stetig auf D. Beweis: Nach Definition 4.2 gibt es zu beliebig gewähltem ε > 0 ein N = N (ε) ∈ N mit ε für alle x ∈ D. (4.2) |fN (x) − f (x)| < 3 Sei nun x0 ∈ D gewählt. Da fN stetig ist, finden wir ein δ = δ(ε) > 0, so dass gilt |fN (x) − fN (x0 )| < ε 3 für alle x ∈ D mit |x − x0 | < δ. Mit der Dreiecksungleichung erhalten wir nun aus (4.2) und (4.3) |f (x) − f (x0 )| ≤ |f (x) − fN (x)| + |fN (x) − fN (x0 )| + |fN (x0 ) − f (x0 )| ε ε ε < + + = ε für alle x ∈ D mit |x − x0 | < δ, 3 3 3 (4.3) 96 KAPITEL 2. FUNKTIONEN UND STETIGKEIT wie behauptet. q.e.d. Der nächste Satz besagt insbesondere, dass der Raum der stetigen Funktionen“ ” im unten zu präzisierenden Sinne vollständig ist: Satz 4.2: (Cauchys Konvergenzkriterium bei gleichmäßiger Konvergenz) Sei {fn }n eine Folge von Funktionen fn : D → Rd , D ⊂ Rm . Dann konvergiert {fn }n genau dann gleichmäßig (gegen ein f : D → Rd ), wenn zu jedem ε > 0 ein N = N (ε) ∈ N existiert mit |fn (x) − fk (x)| < ε für alle x ∈ D und n, k ≥ N (ε). (4.4) Beweis: • ⇒“: Sei fn → → f (n → ∞) auf D erfüllt. Dann existiert zu beliebigem ε > 0 ” ein N (ε) ∈ N mit |fn (x) − f (x)| < 2ε für alle x ∈ D und n ≥ N (ε). Mit der Dreiecksungleichung folgt dann (4.4). • ⇐“: Sei umgekehrt (4.4) erfüllt. Wegen der Vollständigkeit des Rd existiert ” dann der punktweise Limes f (x) = limk→∞ fk (x), x ∈ D. Wenden wir (4.4) auf 2ε statt ε an und gehen zur Grenze k → ∞ über, so folgt |fn (x) − f (x)| = lim |fn (x) − fk (x)| ≤ k→∞ ε < ε für alle x ∈ D, n ≥ N (ε), 2 also fn → → f (n → ∞) auf D. Q.e.d. Definition 4.3: Auf dem (Vektor)-Raum der stetigen, beschränkten Funktionen Cb0 (D, Rd ) := {f ∈ C 0 (D, Rd ) : f ist beschränkt} für nichtleeres D ⊂ Rm erklären wir die Supremumsnorm ∥f ∥D := sup |f (x)| < +∞. x∈D Bemerkungen: 1. Falls D = K ⊂ Rm kompakt ist, ist nach Satz 3.2 jede Funktion f ∈ C 0 (K, Rd ) beschränkt. 2. Als Übungsaufgabe prüft man nach, dass die Supremumsnorm tatsächlich eine Norm mit den Eigenschaften (a)-(c) auf V = Cb0 (D, Rd ) ist; vgl. Kap. 1, § 10. Also ist (V, ∥ · ∥D ) ein normierter und damit auch ein metrischer Raum. 3. Für Funktionenfolgen {fn }n ⊂ V = Cb0 (D, Rd ) gilt: 4. FUNKTIONENFOLGEN UND GLEICHMÄSSIGE KONVERGENZ • fn → → f ∈ V (n → ∞) auf D ⇔ 97 ∥fn − f ∥D → 0 (n → ∞). • Eigenschaft (4.4) ist äquivalent zu ∥fn − fk ∥D < ε für alle n, k ≥ N (ε). Wir erhalten die Folgerung 4.1: Der Vektorraum V = Cb0 (D, Rd ) der stetigen, beschränkten Funktionen auf D ⊂ Rm ist vollständig bez. der Supremumsnorm, d.h. (V, ∥ · ∥D ) ist ein vollständiger normierter Raum oder Banachraum. Beweis: Sofort aus den Sätzen 4.1 und 4.2. q.e.d. Wir wollen nun, analog zu komplexen Reihen, Funktionenreihen untersuchen: Definition 4.4: Ist {fk }k eine Folge fk : D → C, D ⊂ Rm , so heißt ∑ ∑∞ von Funktionen die zugehörige Funktionenreihe k=1 fk = k fk gleichmäßig konvergent, wenn die Folge der Partialsummen sn (x) := n ∑ fk (x), x ∈ D, k=1 gleichmäßig konvergiert. Bemerkungen: Gilt {fk }k ⊂ C 0 (D, C), so ist auch {sn }n ⊂ C 0 (D, C). Konvergiert also 1. ∑ ∞ k=1 fk gleichmäßig, so ist die Grenzfunktion (=Wert der Funktionenreihe) eine stetige Funktion nach Satz 4.1. 2. Wir beschränken uns hier auf komplexwertige Funktionenreihen, da wir bisher nur komplexe Reihen betrachtet haben. Man kann die Aussagen leicht auf Rd -wertige Funktionenreihen übertragen, indem man die entsprechenden Ergebnisse aus Kap. 1, § 8 auf Reihen in Rd erweitert. Satz 4.3: (Majorantenkriterium für Funktionenreihen) Sei D ⊂ Rm und {fk }k eine Folge von Funktionen fk : D → C. Ferner sei {ck }k ⊂ R eine Punktfolge mit der Eigenschaft |fk (x)| ≤ ck für alle x ∈ D. (4.5) ∑∞ ∑∞ Falls dann k=1 ck konvergiert, so k=1 fk gleichmäßig auf D. Die ∑ ∑ konvergiert Reihe k ck heißt Majorante von k fk . 98 KAPITEL 2. FUNKTIONEN UND STETIGKEIT Beweis: Sei ε > 0 gewählt. Satz 8.1 aus Kap. 1 und (4.5) liefern zunächst n ∑ |fk (x)| ≤ k=m+1 n ∑ ck < ε für alle x ∈ D und n > m ≥ N (ε) k=m+1 mit geeignetem N (ε) ∈ N. Aus der Dreiecksungleichung folgt dann ∑ n ∑ n |fk (x)| < ε fk (x) ≤ |sn (x) − sm (x)| = k=m+1 k=m+1 für alle x ∈ D und n > m ≥ N (ε). Satz 4.2 liefert also die Behauptung. q.e.d. Als Folgerung halten wir das folgende wichtige Resultat fest: ∑ k Satz 4.4: Es seien {ak }k ⊂ C, R ∈ (0, +∞) ∪ {+∞} und P(z) := ∞ k=0 ak z eine in KR (0) = {z ∈ C : |z| < R} konvergente Potenzreihe. Dann ist P : KR (0) → C stetig. Beweis: Sei z0 ∈ KR (0) beliebig, so folgt z0 ∈ KR0 (0) mit R0 := 12 (|z0 | + R) < R. k Nun ist für D := KR0 (0) die Folge {ak z k }k ⊂ C 0 (D, C) durch {|ak |R ∑0 }k ⊂ kR majorisiert im Sinne von (4.5), und nach Satz 9.2 aus Kap. 1 konvergiert k |ak |R0 . Satz 4.3 liefert also die gleichmäßige Konvergenz der Potenzreihe P auf D. Und nach Satz 4.1 ist P stetig auf D, also insbesondere auch im Punkt z0 ∈ D. Da z0 ∈ KR (0) beliebig war, folgt P ∈ C 0 (KR (0), C), wie behauptet. q.e.d. Folgerung 4.2: Die komplexe Exponentialfunktion exp z = ez := ∞ ∑ zk k=0 k! ist auf ganz C stetig. Wir werden exp z genauer im nächsten Kapitel untersuchen und hieraus auch die weiteren elementaren Funktionen wie Sinus, Cosinus, Hyperbelfunktionen, Logarithmus und allgemeine Potenz ableiten. Kapitel 3 Differential- und Integralrechnung in einer reellen Veränderlichen 1 Differenzierbarkeit Wir untersuchen Funktionen einer reellen Veränderlichen f : I → Rd für d ∈ N. Hier und im Folgenden sei I ⊂ R ein (nicht notwendig beschränktes) Intervall. Wir beginnen mit einem der wichtigsten Begriffe der Analysis überhaupt: Definition 1.1: Eine Funktion f : I → Rd heißt differenzierbar an der Stelle t0 ∈ I, falls der Grenzwert f (t0 + h) − f (t0 ) f (t) − f (t0 ) = lim t→t h→0 h t − t0 0 f ′ (t0 ) := lim (1.1) existiert. f ′ (t0 ) heißt (erste) Ableitung oder Differentialquotient von f an der Stelle t0 . Alternativ schreiben wir auch df (t0 ), dt Df (t0 ) oder f˙(t0 ) für die Ableitung. Falls t0 ein Randpunkt von I ist, so ist der Grenzwert h → 0 in (1.1) als einseitiger Grenzwert h → 0+ bzw. h → 0− aufzufassen. Die Funktion f : I → Rd heißt differenzierbar (auf I), wenn f in jedem Punkt t0 ∈ I differenzierbar ist. 99 100 KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG Bemerkungen: 1. Geometrische Interpretationen: (a) Der Differenzenquotient ∆h f (t0 ) := f (t0 + h) − f (t0 ) h einer Funktionf : I → R ist die Steigung der Sekante an graph f durch (t0 , f (t0 )) und (t0 + h, f (t0 + h)). Bei Grenzübergang h → 0 geht die Sekante in die Tangente { } T := (t, y) ∈ R2 : y = f ′ (t0 )(t − t0 ) + f (t0 ) an graph f im Punkt (t0 , f (t0 )) über; f ′ (t0 ) ist die Steigung der Tangente. (b) Für eine Kurve f : I → Rd im Rd sind ∆h f (t0 ) Sekantenvektoren in Rd und f ′ (t0 ) wird als Tangentenvektor an die Kurve im Punkt f (t0 ) interpretiert (und abgetragen). 2. Zum Beispiel sind die Funktionen f (t) := t, g(t) := c mit einer Konstanten c ∈ R für alle t ∈ R differenzierbar und es gilt f ′ (t) = 1, g ′ (t) = 0 für alle t ∈ R. 3. Falls f : I → Rd differenzierbar ist, so kann man die Zuordnung t 7→ f ′ (t) wieder als Funktion f ′ : I → Rd interpretieren. Ist f ′ differenzierbar in t0 ∈ I, so können wir f ′′ (t0 ) := (f ′ )′ (t0 ) bilden, die zweite Ableitung von f an der Stelle t0 , mit den alternativen Schreibweisen f ′′ (t0 ) = d2 f (t0 ) = D2 f (t0 ) = f¨(t0 ). dt2 Ist f ′ auf ganz I differenzierbar, so fassen wir f ′′ : I → Rd wiederum als Funktion auf. Falls allgemein die (n − 1)-te Ableitung f (n−1) : I → Rd für ein n ∈ N definiert und in t0 ∈ I differenzierbar ist, wobei f (0) := f gesetzt wird, so erklären wir die n-te Ableitung von f in t0 als f (n) (t0 ) := (f (n−1) )′ (t0 ). Wir schreiben dann auch dn f f (n) (t0 ) = n (t0 ) = Dn f (t0 ). dt Wenn die n-te Ableitung f (n) auf ganz I existiert, so heißt f n-mal differenzierbar. 1. DIFFERENZIERBARKEIT 101 Satz 1.1: Ist f : I → Rd gegeben, so sind die folgenden Aussagen äquivalent: (i) f ist in t0 ∈ I differenzierbar. (ii) Es existiert ein a ∈ Rd und eine in t0 stetige Funktion φ : I → Rd mit φ(t0 ) = 0, so dass gilt f (t) = f (t0 ) + (t − t0 )a + (t − t0 )φ(t) für alle t ∈ I. (1.2) Beweis: • ⇒“: Sei f in t0 differenzierbar. Wir setzen dann a := f ′ (t0 ) und ” f (t) − f (t0 ) − a, falls t ∈ I \ {t } 0 t − t0 φ(t) := . 0, für t = t0 Offenbar ist dann φ in t0 stetig mit φ(t0 ) = 0, und Umstellen liefert die gesuchte Darstellung (1.2). • ⇐“: Haben wir umgekehrt (1.2), so liefert Umstellen für t ̸= t0 : ” f (t) − f (t0 ) = a + φ(t) → a (t → t0 ), t − t0 also die Differenzierbarkeit von f in t0 . q.e.d. Bemerkung: Der Beweis zeigt, dass a eindeutig bestimmt ist und dass gilt a = f ′ (t0 ). Die Darstellung (1.2) liefert also eine lineare Approximation von f durch L(t) := f (t0 ) + (t − t0 )f ′ (t0 ), t ∈ R. Setzen wir noch ψ(t) := a + φ(t) für t ∈ I, so haben wir die zu (1.2) äquivalente Darstellung f (t) = f (t0 ) + (t − t0 )ψ(t), t ∈ I, (1.3) wobei nun ψ : I → Rd in t0 stetig ist und ψ(t0 ) = f ′ (t0 ) erfüllt. Folgerung 1.1: Eine in t0 ∈ I differenzierbare Funktion f : I → Rd ist in t0 stetig. Beweis: Sofort aus Darstellung (1.2) oder (1.3). q.e.d. Bemerkungen: 1. Die Umkehrung von Folgerung 1.1 gilt nicht, wie etwa das Beispiel f (t) := |t| im Punkt t0 = 0 zeigt. Es gibt sogar stetige, nirgends differenzierbare Funktionen; siehe S. Hildebrandt: Analysis 1 (Springer-Verlag), S. 192. 102 KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 2. Eine Funktion f = (f1 , . . . , fd ) : I → Rd ist genau dann in t0 ∈ I differenzierbar, wenn alle Komponentenfunktionen f1 , . . . , fd in t0 differenzierbar sind; dann gilt ( ) f ′ (t0 ) = f1′ (t0 ), . . . , fd′ (t0 ) . 3. Wie die Stetigkeit ist auch die Differenzierbarkeit (in einem Punkt) eine lokale Eigenschaft. Für komplexwertige Funktionen gelten folgende Rechenregeln: Satz 1.2: Sind f, g : I → C in t0 ∈ I differenzierbar, so gilt dies auch für λf + µg mit beliebigen λ, µ ∈ C, f · g und, falls g ̸= 0 auf I, auch für fg , und wir haben: (λf + µg)′ (t0 ) = λf ′ (t0 ) + µg ′ (t0 ) für λ, µ ∈ C, (f g)′ (t0 ) = f ′ (t0 )g(t0 ) + f (t0 )g ′ (t0 ) (Produktregel), ( f )′ f ′ (t0 )g(t0 ) − f (t0 )g ′ (t0 ) (t0 ) = (Quotientenregel). g g(t0 )2 (1.4) (1.5) (1.6) Beweis: Nach Satz 1.1 und der anschließenden Bemerkung haben wir die Darstellungen f (t) = f (t0 ) + (t − t0 )ψ(t), g(t) = g(t0 ) + (t − t0 )χ(t), mit in t0 stetigen Funktionen ψ, χ : I → C, die ψ(t0 ) = f ′ (t0 ), χ(t0 ) = g ′ (t0 ) erfüllen. Damit folgen λf (t) + µg(t) = [λf (t0 ) + µg(t0 )] + (t − t0 )[λψ(t) + µχ(t)], [ ] f (t) · g(t) = [f (t0 )g(t0 )] + (t − t0 ) ψ(t)g(t0 ) + f (t0 )χ(t) + (t − t0 )ψ(t)χ(t) , f (t) g(t) = f (t0 ) ψ(t)g(t0 ) − f (t0 )χ(t) + (t − t0 ) . g(t0 ) g(t)g(t0 ) Wiederum Satz 1.1 liefert die Behauptung. q.e.d. Bemerkung: Eine (1.4) entsprechende Regel gilt natürlich auch für Funktionen f, g : I → Rd , dann mit λ, µ ∈ R. Formel (1.5) ist für solche Funktionen durch die Relation ⟨f, g⟩′ (t0 ) = ⟨f ′ (t0 ), g(t0 )⟩ + ⟨f (t0 ), g ′ (t0 )⟩ zu ersetzen (Übungsaufgabe). (1.7) 1. DIFFERENZIERBARKEIT 103 Beispiele: 1. = nxn−1 für n ∈ N0 und beliebiges x ∈ R. Denn für n = 0, 1 ist die Aussage klar und durch Induktionsschluss n → n + 1 haben wir: Mit xn ist nach Satz 1.2 auch xn+1 = xn · x differenzierbar und es gilt d (xn ) dx d n+1 (x ) dx = (IV ) = 2. d n (x · x) dx (1.5) = (xn )′ x + xn x′ nxn−1 x + xn · 1 = (n + 1)xn . d (x−n ) dx = −nx−n−1 für n ∈ N und x ∈ R \ {0}. Denn nach Beispiel 1 und Satz 1.2 ist x−n = x1n in R \ {0} differenzierbar, und es gilt d −n (1.6) (1)′ · xn − 1 · (xn )′ (x ) = = −nx−n−1 . dx x2n Insgesamt haben wir also d ν (x ) = νxν−1 dx für alle ν ∈ Z und x ∈ R \ {0}. Definition 1.2: Für beliebige k ∈ N0 erklären wir den Vektorraum C k (I, Rd ) aller k-mal stetig differenzierbaren Funktionen f : I → Rd , die auf I Ableitungen bis zur k-ten Ordnung besitzen und für die f (k) : I → Rd stetig ist. Weiter erklären wir C ∞ (I, Rd ) := ∩ C k (I, Rd ), k∈N0 den Vektorraum der unendlich oft stetig differenzierbaren Funktionen. Schließlich schreiben wir auch C k (I) bzw. C k (I, C) für die reell- bzw. komplexwertigen k-mal stetig differenzierbaren Funktionen (k ∈ N0 ∪ {∞}) auf I. Bemerkung: Dass C k (I, Rd ) ein Vektorraum ist für alle k ∈ N0 ∪ {∞}, folgt aus Satz 1.2. Nach Folgerung 1.1 sind alle Ableitungen f (= f (0) ), f ′ (= f (1) ), . . . , f (k) einer Funktion f ∈ C k (I, Rd ) stetig auf I. Insbesondere folgt C k (I, Rd ) ⊂ C l (I, Rd ) für l ≤ k. Wir untersuchen nun die Komposition zweier differenzierbarer Funktionen: Satz 1.3: (Kettenregel) Seien I, J ⊂ R Intervalle und f : I → R, g : J → Rd zwei Funktionen mit f (I) ⊂ J. Falls f in x0 ∈ I und g in y0 := f (x0 ) ∈ J differenzierbar sind, so ist auch die Komposition h := g ◦ f : I → Rd in x0 differenzierbar, und es gilt h′ (x0 ) = g ′ (f (x0 ))f ′ (x0 ). (1.8) 104 KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG Beweis: Aus Satz 1.1 und der anschließenden Bemerkung entnehmen wir f (x) = f (x0 ) + (x − x0 )ψ(x), g(y) = g(y0 ) + (y − y0 )χ(y) mit in x0 bzw. y0 = f (x0 ) stetigen Funktionen ψ : I → R, χ : J → Rd , für die ψ(x0 ) = f ′ (x0 ) bzw. χ(y0 ) = g ′ (y0 ) gilt. Es folgt also ( ) g(f (x)) = g(f (x0 )) + f (x) − f (x0 ) χ(f (x)) [ ] = g(f (x0 )) + (x − x0 )) χ(f (x))ψ(x) . Und da die Funktion χ(f (x))ψ(x) nach Satz 2.3 aus Kap. 2 wieder stetig ist in x0 , ist h = g ◦ f nach Satz 1.1 differenzierbar und es gilt h′ (x0 ) = χ(f (x))ψ(x)x=x = g ′ (f (x0 ))f ′ (x0 ), 0 wie behauptet. q.e.d. Wir wenden uns nun wieder der Untersuchung der Umkehrfunktion einer injektiven Funktion f : I → R zu: Satz 1.4: (Ableitung der Umkehrfunktion) Sei f : I → R eine stetige Funktion, die das Intervall I ⊂ R bijektiv auf I ∗ := f (I) abbilde. Ist dann f in x0 ∈ I differenzierbar und gilt f ′ (x0 ) ̸= 0, so ist auch die Umkehrfunktion g := f −1 : I ∗ → R in y0 := f (x0 ) differenzierbar und es gilt g ′ (y0 ) = 1 f ′ (x0 ) . (1.9) Beweis: Da f streng monoton ist, ist I ∗ nach Satz 2.6 aus Kap. 2 wieder ein Intervall und g = f −1 stetig auf I ∗ . Ist also {yn }n ⊂ I ∗ \{y0 } eine beliebige (nun existierende) Folge mit limn→∞ yn = y0 , so gilt lim g(yn ) = g(y0 ) = x0 . n→∞ Setzen wir noch xn := g(yn ) ∈ I \ {x0 } für n ∈ N, so haben wir [ f (x ) − f (x ) ]−1 g(yn ) − g(y0 ) xn − x0 n 0 = = , yn − y0 f (xn ) − f (x0 ) xn − x0 n ∈ N. (1.10) Da f in x0 differenzierbar ist mit f ′ (x0 ) ̸= 0, können wir in (1.10) zur Grenze n → ∞ übergehen und erhalten lim n→∞ g(yn ) − g(y0 ) 1 = ′ . yn − y0 f (x0 ) Nach Satz 1.1 aus Kap. 2 existiert also der Grenzwert limy→y0 es gilt (1.9). g(y)−g(y0 ) y−y0 = g ′ (y0 ) und q.e.d. 1. DIFFERENZIERBARKEIT 105 Beispiel: Die Funktion f (x) := xn , n ∈ N, bildet [0, +∞) bijektiv auf [0, +∞) ab √ mit der Umkehrfunktion g(y) = f −1 (y) = n y. Für x > 0 gilt f ′ (x) = nxn−1 > 0, so dass Satz 1.4 liefert ( √ )′ 1 1 1 n y = = y n −1 . √ n−1 n n( y) n Für die Potenzfunktion f (x) := xq , x > 0, mit einem q = rs ∈ Q (r ∈ Z, s ∈ N) folgt somit nach der Kettenregel: [ √ ][ 1 1 −1 ] d √ f ′ (x) = ( s x)r = r( s x)r−1 xs = qxq−1 . dx s Wir beschließen den Paragraphen mit der Untersuchung einer Funktionenfolge fn : I → Rd , n ∈ N. In § 5 (dort noch einmal als Satz 5.7 angegeben) werden wir folgende Aussage beweisen: Satz 1.5: Sei I = [a, b] und {fn }n eine Folge von Funktionen fn ∈ C 1 (I, Rd ) für alle n ∈ N. Falls dann gilt fn → f (n → ∞), fn′ → → g (n → ∞) auf I, so folgt für den punktweisen Limes f ∈ C 1 (I, Rd ), und es gilt f ′ = g auf I. Falls also {fn }n punktweise und die Ableitungen {fn′ }n gleichmäßig konvergieren (auf einem kompakten Intervall), dann können wir Limesbildung und Differentiation vertauschen (Vertauschung zweier Grenzprozesse! ): ) ) (d d( fn (x) = lim lim fn (x) auf I. n→∞ dx dx n→∞ Wir wenden Satz 1.5 nun auf Potenzreihen an: ∑ k Satz 1.6: Es sei f (x) := ∞ k=0 ak x , ak ∈ C, eine Potenzreihe mit Konvergenzradius R ∈ (0, +∞) ∪ {+∞}. Dann gehört f : (−R, R) → C zur Klasse C 1 ((−R, R), C) und es gilt ∞ ∑ kak xk−1 , x ∈ (−R, R). f ′ (x) = k=1 Bemerkung: Die formal durch gliedweises Differenzieren der Reihe erhaltene Potenzreihe hat also den gleichen Konvergenzradius und stimmt mit der tatsächlichen Ableitung der Reihe überein. ∑∞ k−1 Beweis von Satz 1.6: Wir zeigen, dass die formal differenzierte Reihe, also g(x) := ∑ , für k=1 kak x ∞ jedes R0 ∈ (0, R) gleichmäßig auf [−R0 , R0 ] konvergiert: In der Tat majorisiert ja k=1 k|ak |R0k−1 die Reihe g(x) in [−R0 , R0 ] und nach dem Wurzelkriterium konvergiert letztere: √ k ) ( √ k √ R0 k k |ak | = < 1. lim sup k|ak |R0k−1 = R0 · lim sup √ k R R0 k→∞ k→∞ 106 KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG → g (n → ∞) auf [−R0 , R0 ], wobei Satz 4.3 aus Kap. 2 liefert gleichmäßige Konvergenz gn → ∑n also die k−1 wir noch gn (x) := ka x für die n-te Partialsumme gesetzt haben. Da natürlich fn → k k=1 f (n → ∞) auf [−R0 , R0 ] richtig ist (sogar gleichmäßig nach Satz 4.3 aus Kap. 2) und da fn′ = gn für alle n ∈ N gilt, liefert Satz 1.5 nun f ∈ C 1 ([−R0 , R0 ], C) sowie f ′ (x) = g(x) = ∞ ∑ kak xk−1 auf [−R0 , R0 ]. k=1 Da schließlich R0 ∈ (0, R) beliebig war, folgt die Behauptung. q.e.d. ∑ k Folgerung 1.2: Die Reihe f (x) = ∞ k=0 ak x (ak ∈ C für k ∈ N0 ) konvergiere auf (−R, R) für ein R ∈ (0, +∞) ∪ {+∞}. Dann folgt f ∈ C ∞ ((−R, R), C) und für die n-te Ableitung gilt f (n) (x) = ∞ ∑ k(k − 1)(k − 2) . . . (k − n + 1)ak xk−n auf (−R, R). (1.11) k=n Beweis: Nach Satz 1.6 ist f ∈ C 1 ((−R, R), C) und f ′ ist wieder eine (auf R eingeschränkte) Potenzreihe mit Konvergenzradius R > 0. Wenden wir Satz 1.6 sukzessive auf f ′ , f ′′ , f ′′′ , . . . an, so folgt f ∈ C ∞ ((−R, R), C). Formel (1.11) beweist man schließlich mit vollständiger Induktion. q.e.d. 2 Lokale Extrema, Mittelwertsatz, Konvexität Ein wichtiges Teilgebiet der Analysis ist die Behandlung von Extremwertaufgaben. Hierfür grundlegend ist die Definition 2.1: Es sei f : I → R auf dem Intervall I ⊂ R erklärt. Wir sagen, f hat in x0 ∈ I ein lokales Minimum (bzw. lokales Maximum), wenn ein r > 0 so existiert, dass gilt f (x) ≥ f (x0 ) (bzw. f (x) ≤ f (x0 )) für alle x ∈ I ∩ (x0 − r, x0 + r). (2.1) Gilt in (2.1) die strikte Ungleichung für x ̸= x0 , so hat f in x0 ein striktes lokales Minimum (bzw. Maximum). Falls schließlich (2.1) für alle x ∈ I gilt, sprechen wir von einem globalen Minimum (bzw. globalen Maximum). Bemerkung: Zusammenfassend heißen lokale Minima und Maxima auch lokale Extrema und x0 wird lokale Minimal-, Maximal- oder Extremalstelle genannt (entsprechend im globalen Fall). Als Synonym für lokal“ wird auch relativ verwendet, statt ” global“ sagen wir auch absolut. ” Satz 2.1: (Fermat; notwendige Extremalbedingung 1. Ordnung) Besitzt f : I → R in einem inneren Punkt x0 ∈ int I des Intervalls I ⊂ R ein lokales Extremum und ist f in x0 differenzierbar, so folgt f ′ (x0 ) = 0. 2. LOKALE EXTREMA, MITTELWERTSATZ, KONVEXITÄT 107 Beweis: O.B.d.A. sei f in x0 minimal (sonst gehen wir zu −f über). Da x0 innerer Punkt ist, gibt es ein ε > 0, so dass (x0 − ε, x0 + ε) ⊂ I gilt. Somit folgt f (x) − f (x0 ) f (x) − f (x0 ) = f ′ (x0 ) = lim ≥ 0, x→x0 − x→x0 + x − x0 x − x0 0 ≥ lim also f ′ (x0 ) = 0. q.e.d. Bemerkungen: 1. Betrachte f (x) := x, I = [0, 1]. Dann ist x0 = 0 (sogar globales) Minimum, aber es gilt f ′ (0) = 1. Also darf x0 in Satz 2.1 kein Randpunkt sein. 2. Die Bedingung f ′ (x0 ) = 0 ist nicht hinreichend für ein Extremum, wie etwa das Beispiel f (x) := x3 , x ∈ (−1, 1), mit f ′ (0) = 0 zeigt. Definition 2.2: Ist f : I → R im inneren Punkt x0 ∈ int I differenzierbar und gilt f ′ (x0 ) = 0, so heißt x0 stationärer oder kritischer Punkt von f . Bemerkung: Satz 2.1 besagt also: Jede innere lokale Extremalstelle von f ist stationär. Geometrisch bedeutet dies, dass die Tangente T = {(x, y) : y = f (x0 ) + f ′ (x0 )(x − x0 )} an graph f im Punkt (x0 , f (x0 )) parallel zur x-Achse verläuft. Satz 2.2: (Satz von Rolle) Sei f : [a, b] → R stetig in [a, b] und differenzierbar in (a, b). Gilt zusätzlich f (a) = f (b), so existiert ein ξ ∈ (a, b) mit der Eigenschaft f ′ (ξ) = 0. Beweis: Falls f ≡ const gilt, folgt f ′ ≡ 0 auf [a, b]. Sei also f ̸≡ const auf [a, b]. Dann existiert ein x0 ∈ (a, b) mit f (x0 ) ̸= f (a), also o.B.d.A. f (x0 ) > f (a). Damit folgt sup[a,b] f > f (a) = f (b). Nach dem Weierstraßschen Hauptlehrsatz, Satz 3.2 aus Kap. 2, nimmt also f ihr (globales) Maximum in einem inneren Punkt ξ ∈ (a, b) an und nach Satz 2.1 gilt f ′ (ξ) = 0. q.e.d. Wir können nun den Satz von Rolle zum Beweis eines der meistgebrauchten Sätze der Differential- und Intergalrechnung nutzen, nämlich von Satz 2.3: (Mittelwertsatz) Es sei f : [a, b] → R stetig in [a, b] und differenzierbar in (a, b). Dann gibt es ein ξ ∈ (a, b), so dass gilt f (b) − f (a) = f ′ (ξ)(b − a). (2.2) Bemerkung: Geometrisch heißt das, dass ein ξ ∈ (a, b) so existiert, dass die Tangente an (ξ, f (ξ)) parallel zur Sekante durch (a, f (a)) und (b, f (b)) verläuft. Satz 2.3 ergibt sich sofort als Spezialfall aus dem folgenden 108 KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG Satz 2.4: (Allgemeiner Mittelwertsatz) Gegeben seien zwei stetige Funktionen f, g : [a, b] → R, die differenzierbar auf (a, b) seien. Weiter gelte g ′ ̸= 0 auf (a, b). Dann existiert ein ξ ∈ (a, b), so dass gilt f (b) − f (a) f ′ (ξ) = ′ . g(b) − g(a) g (ξ) Beweis: Nach dem Rolleschen Satz gilt g(a) ̸= g(b). Wir betrachten die Hilfsfunktion φ(x) := f (x) − f (b) − f (a) [g(x) − g(a)], g(b) − g(a) x ∈ [a, b]. Offenbar ist φ stetig in [a, b], differenzierbar in (a, b) und es gilt φ(a) = φ(b) = f (a). Wieder nach dem Rolleschen Satz existiert somit ein ξ ∈ (a, b) mit 0 = φ′ (ξ) = f ′ (ξ) − f (b) − f (a) ′ g (ξ), g(b) − g(a) also nach Umstellen die Behauptung. q.e.d. Folgerung 2.1: (Monotonieverhalten) Ist f ∈ C 0 ([a, b]) differenzierbar in (a, b), so haben wir: (i) Gilt f ′ (x) > 0 (bzw. f ′ (x) ≥ 0, f ′ (x) < 0, f ′ (x) ≤ 0) auf (a, b), so ist f streng monoton wachsend (bzw. monoton wachsend, streng monoton fallend, monoton fallend) auf [a, b]. (ii) Ist umgekehrt f monoton wachsend (bzw. monoton fallend) auf [a, b], so gilt f ′ (x) ≥ 0 (bzw. f ′ (x) ≤ 0) auf (a, b). (iii) Es gilt f ′ (x) ≡ 0 in (a, b) genau dann, wenn f (x) ≡ const auf [a, b] richtig ist. Bemerkung: Strenge Monotonie impliziert nicht f ′ (x) > 0 bzw. f ′ (x) < 0 auf (a, b). Beispiel: f (x) = x3 , x ∈ (−1, 1). Beweis von Folgerung 2.1: (i) Wir betrachten nur den Fall f ′ (x) > 0 auf (a, b); die anderen Aussagen folgen analog. Seien x1 , x2 ∈ [a, b] mit x1 < x2 gewählt. Nach Satz 2.3 existiert dann ein ξ ∈ (x1 , x2 ) mit f (x2 ) − f (x1 ) = f ′ (ξ)(x2 − x1 ) > 0, also f (x1 ) < f (x2 ), wie behauptet. 2. LOKALE EXTREMA, MITTELWERTSATZ, KONVEXITÄT 109 (ii) Sei f monoton wachsend (bzw. fallend). Dann gilt für beliebiges x0 ∈ (a, b) und hinreichend kleines h ̸= 0: f (x0 + h) − f (x0 ) ≥0 h (bzw. ≤ 0). Grenzübergang h → 0 liefert die Behauptung. (iii) Ist f konstant, so verschwindet die Ableitung bekanntlich identisch. Ist umgekehrt f ′ (x) ≡ 0 auf (a, b), so ist f nach (i) sowohl monoton wachsend als auch fallend auf [a, b] und somit konstant. q.e.d. Folgerung 2.2: Sei f ∈ C 0 ([a, b]) in (a, b) differenzierbar und x0 ∈ (a, b) sei kritischer Punkt von f . Dann gelten: (i) Falls f ′ (x) < 0 (bzw. f ′ (x) > 0) in (a, x0 ) und f ′ (x) > 0 (bzw. f ′ (x) < 0) in (x0 , b) richtig ist, so hat f in x0 ein striktes globales Minimum (bzw. Maximum). (ii) Falls f ′ (x) < 0 oder f ′ (x) > 0 für alle x ∈ (a, b) \ {x0 } gilt, so ist x0 weder Minimum noch Maximum von f . Beweis: Folgerung 2.1 (i) entnehmen wir < f ′ (x) < > 0 für a < x < x0 ⇒ f (x0 ) > f (x) für a ≤ x < x0 , > f ′ (x) < > 0 für x0 < x < b ⇒ f (x0 ) < f (x) für x0 < x ≤ b. Das liefert unmittelbar die Behauptungen. q.e.d. Beispiel: Unter allen Rechtecken gegebenem Umfangs hat das Quadrat den größten Flächeninhalt. Denn: Es ist F = ab der Flächeninhalt des Rechtecks mit Seitenlängen a, b > 0. Und U = 2(a + b) ist der fixierte Umfang. Setzen wir b = U2 − a in F ein, so erhalten wir (U ) F = F (a) = a −a , 2 Wegen F ′ (a) = ′ − 4a) ist a0 = 1 (U 2 in (0, a0 ) und F (a) < 0 in Maximum über [0, U 2 (a0 , U2 U 4 [ U] a ∈ 0, . 2 einziger kritischer Punkt für F . Außerdem gilt F ′ (a) > 0 ). Also hat F nach Folgerung 2.2 in a0 = ]. Schließlich beachten wir noch b0 := mit Seitenlänge a0 = U 4 U 2 U 4 ihr striktes globales −a0 = a0 , d.h. F wird für das Quadrat maximal. Satz 2.5: (Hinreichende Extremalbedingung) Es sei f ∈ C 1 (I, R) (I ⊂ R Intervall) und in x0 ∈ int I sei f zweimal differenzierbar mit f ′ (x0 ) = 0 und f ′′ (x0 ) > 0 (bzw. f ′′ (x0 ) < 0). Dann besitzt f in x0 ein striktes relatives Minimum (bzw. Maximum). 110 KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG Bemerkung: Die oben angegebene Bedingung ist nicht notwendig, wie das Beispiel f (x) = x4 , x ∈ R, mit dem strikten Minimum x0 = 0 zeigt. ′ ′ (x0 ) Beweis von Satz 2.5: Es gelte f ′′ (x0 ) = limx→x0 f (x)−f > 0 (der Fall f ′′ (x0 ) < 0 x−x0 ergibt sich nach Übergang zu −f ). Dann existiert ein ε > 0, so dass [x0 −ε, x0 +ε] ⊂ I und f ′ (x) − f ′ (x0 ) > 0 für alle x ∈ (x0 − ε, x0 + ε) \ {x0 } x − x0 erfüllt ist. Wegen f ′ (x0 ) = 0 bedeutet dies f ′ (x) < 0 für alle x ∈ (x0 − ε, x0 ), f ′ (x) > 0 für alle x ∈ (x0 , x0 + ε). Nach Folgerung 2.2 hat f in x0 ein striktes Minimum auf [x0 − ε, x0 + ε], also ein striktes lokales Minimum. q.e.d. Folgerung 2.3: (Notwendige Extremalbedingung 2. Ordnung) Sei f ∈ C 1 (I, R) auf dem Intervall I ⊂ R gegeben und sei x0 ∈ Int I eine relative Minimalstelle (bzw. Maximalstelle) von f . Dann gilt f ′′ (x0 ) ≥ 0 (bzw. f ′′ (x0 ) ≤ 0). Beweis: Ist x0 relative Minimalstelle und gölte f ′′ (x0 ) < 0, so wäre x0 nach Satz 2.5 auch strikte relative Maximalstelle, Widerspruch! Also muss doch f ′′ (x0 ) ≥ 0 gelten. Entsprechend folgt die Aussage für Maximalstellen. q.e.d. Wir wollen noch eine Folgerung des allgemeinen Mittelwertsatzes angeben, die sehr hilfreich bei der Berechnung von Grenzwerten ist: Satz 2.6: (L’Hospitalsche Regel) Es seien f, g : I → R zwei differenzierbare Funktionen auf dem Intervall I = (a, b). Es gelte g ′ ̸= 0 auf I, und es existiere der Limes f ′ (x) =: c ∈ R. x→a+ g ′ (x) lim Dann folgt: (i) Falls limx→a+ f (x) = limx→a+ g(x) = 0 gilt, so ist g ̸= 0 auf I richtig und es gilt f (x) lim = c. x→a+ g(x) (ii) Falls limx→a+ f (x) = ±∞, limx→a+ g(x) = ±∞ gilt, so existiert ein x0 ∈ (a, b) mit g ̸= 0 für x ∈ (a, x0 ] und es gilt lim x→a+ f (x) = c. g(x) 2. LOKALE EXTREMA, MITTELWERTSATZ, KONVEXITÄT 111 Analoge Aussagen haben wir für den Grenzwert x → b−. Beweis: (i) Zunächst können wir f und g stetig (zu 0) in den Punkt x = a fortsetzen. Der Satz von Rolle liefert dann g ̸= 0 auf (a, b), und nach dem allgemeinen Mittelwertsatz gibt es zu jedem hinreichend kleinen h > 0 ein ϑ = ϑ(h) ∈ (0, 1) mit der Eigenschaft f (a + h) − f (a) f ′ (a + ϑh) f (a + h) = = ′ . g(a + h) g(a + h) − g(a) g (a + ϑh) Für h → 0+ (und somit a+ϑh → a+) erhalten wir die Existenz des Grenzwertes limx→a+ und die Relation f (a + h) f ′ (a + ϑh) f (x) lim = lim = lim ′ = c, x→a+ g(x) h→0+ g(a + h) h→0+ g (a + ϑh) f (x) g(x) wie behauptet. (ii) Wir fixieren zunächst x1 ∈ (a, x0 ] beliebig. Zu beliebigem x ∈ (a, x1 ) existiert dann nach dem allgemeinen Mittelwertsatz ein ξ ∈ (x, x1 ) mit f ′ (ξ) f (x) − f (x1 ) f (x) = = m(x), g ′ (ξ) g(x) − g(x1 ) g(x) wobei wir m(x) := 1− 1− f (x1 ) f (x) g(x1 ) g(x) , (2.3) x ∈ (a, x1 ), gesetzt haben. Für festgehaltenes x1 sehen wir m(x) → 1 und damit auch x → a+. Wir wählen nun zu vorgegebenem ε > 0 zunächst x1 so nahe an a, dass gilt ′ f (t) − c < ε für alle t ∈ (a, x1 ), ′ g (t) 1 m(x) → 1 für (2.4) also insbesondere für t = ξ ∈ (x, x1 ). Dann wählen wir δ > 0 so klein, dass gilt a + δ ≤ x1 und 1 − 1 < ε für alle x ∈ (a, a + δ). (2.5) m(x) Damit erhalten wir ′ (2.3) 1 f ′ (ξ) f (x) 1 f (ξ) 1 − c = − c ≤ − c + − 1 |c| g(x) m(x) g ′ (ξ) m(x) g ′ (ξ) m(x) (2.4),(2.5) < also (x) limx→a+ fg(x) ε(1 + ε + |c|) für alle x ∈ (a, a + δ), = c, wie behauptet. q.e.d. Bemerkung: Satz 2.6 lässt sich noch erweitern: Einerseits gilt die entsprechende Aussage auch für c = ±∞, andererseits auch für a = −∞ bzw. b = +∞ (Übungsaufgabe). Definition 2.3: Eine Funktion f : I → R, I ⊂ R Intervall, heißt konvex, wenn für alle x1 , x2 ∈ I und alle λ ∈ (0, 1) gilt f (λx1 + (1 − λ)x2 ) ≤ λf (x1 ) + (1 − λ)f (x2 ). (2.6) Die Funktion f heißt konkav, wenn −f konvex ist. Gilt schließlich in (2.6) die strikte Ungleichung für x1 ̸= x2 , so heißt f streng konvex; gilt dies für −f , so nennen wir f streng konkav. 112 KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG Satz 2.7: Sei I ⊂ R ein Intervall und f : I → R ∈ C 2 (I). Dann ist f genau dann konvex, wenn f ′′ (x) ≥ 0 für alle x ∈ I gilt. Bemerkung: Es folgt sofort: f ∈ C 2 (I) ist genau dann konkav, wenn f ′′ (x) ≤ 0 auf I gilt. Eine Verschärfung f ∈ C 2 (I) streng konvex ⇔ f ′′ > 0“ von Satz 2.7 gilt ” übrigens nicht, wie das Beispiel f (x) = x4 , x ∈ R, zeigt; siehe aber Folgerung 2.4 unten. Beweis von Satz 2.7: • ⇐“: Sei zunächst f ′′ (x) ≥ 0 in I erfüllt. Nach Folgerung 2.1 ist dann f ′ : I → R monoton ” wachsend. Seien x1 , x2 ∈ I und λ ∈ (0, 1) gewählt, so können wir o.B.d.A. x1 < x2 annehmen und setzen x := λx1 + (1 − λ)x2 ∈ (x1 , x2 ). Nach dem Mittelwertsatz finden wir ξ1 ∈ (x1 , x) und ξ2 ∈ (x, x2 ) mit f (x2 ) − f (x) f (x) − f (x1 ) = f ′ (ξ1 ) ≤ f ′ (ξ2 ) = . x − x1 x2 − x Beachten wir noch x − x1 = (1 − λ)(x2 − x1 ) und x2 − x = λ(x2 − x1 ), so folgt f (x) − f (x1 ) f (x2 ) − f (x) ≤ 1−λ λ und nach Umstellen schließlich (2.6), d.h. f ist konvex. • ⇒“: Sei nun f : I → R konvex und wir nehmen an, dass nicht f ′′ (x) ≥ 0 auf I gilt. Dann ” existiert ein x0 ∈ int I mit f ′′ (x0 ) < 0. Wir erklären nun die Hilfsfunktion φ(x) := f (x) − f ′ (x0 )(x − x0 ), x ∈ I. Offenbar gilt φ ∈ C 2 (I) und φ′ (x0 ) = 0, φ′′ (x0 ) = f ′′ (x0 ) < 0. Nach Satz 2.5 besitzt also φ in x0 ein striktes lokales Maximum, und insbesondere finden wir ein h > 0, so dass [x0 − h, x0 + h] ⊂ I sowie φ(x0 − h) < φ(x0 ), φ(x0 + h) < φ(x0 ) erfüllt sind. Hieraus erhalten wir f (x0 ) = φ(x0 ) > ) ) 1( 1( φ(x0 − h) + φ(x0 + h) = f (x0 − h) + f (x0 + h) . 2 2 (2.7) Setzen wir schließlich x1 := x0 −h, x2 := x0 +h und λ = 12 , so haben wir x0 = λx1 +(1−λ)x2 und (2.7) besagt f (λx1 + (1 − λ)x2 ) > λf (x1 ) + (1 − λ)f (x2 ), was ein Widerspruch zur vorausgesetzten Konvexität von f ist. Also gilt doch f ′′ (x) ≥ 0 auf I. q.e.d. Der Beweis der Richtung ⇐“ in Satz 2.7 lässt sich offenbar so modifizieren, dass ” man das nachstehende Ergebnis erhält: Folgerung 2.4: Gilt f ∈ C 2 (I, R) und f ′′ (x) > 0 (bzw. < 0) auf dem Intervall I ⊂ R, so ist f streng konvex (bzw. streng konkav) auf I. 3. DIE ELEMENTAREN FUNKTIONEN 3 113 Die elementaren Funktionen In Kap. 2, Folgerung 4.2 haben wir die komplexe Exponentialfunktion oder kurz eFunktion ∞ ∑ zk ez = exp z := , z ∈ C, k! k=0 erklärt und als stetig auf ganz C erkannt. In diesem Paragraphen werden wir Eigenschaften von ez untersuchen und weitere sogenannte elementare Funktionen“ aus ” ihr erklären. Satz 3.1: (Funktionalgleichung der e-Funktion) Für beliebige z1 , z2 ∈ C gilt die Identität exp(z1 + z2 ) = exp z1 · exp z2 . Beweis: Da die Exponentialreihe für beliebige z ∈ C absolut konvergiert, liefern die Cauchysche Produktformel und der Binomische Satz: exp z1 · exp z2 )( ∑ ) ) ∞ ∞ (∑ k ∑ z1k z2k z1l z2k−l = = k! k! l! (k − l)! k=0 k=0 k=0 l=0 ) ( k ( ) ∞ ∞ ∑ ∑ 1 ∑ k l k−l (z1 + z2 )k z1 z2 = = = exp(z1 + z2 ), l k! k! (∑ ∞ k=0 l=0 k=0 wie behauptet. q.e.d. Definition 3.1: Die Zahl e := exp 1 = ∞ ∑ 1 ∈R k! k=0 wird Eulersche Zahl genannt. Bemerkung: Mit der Funktionalgleichung zeigt man leicht (p) p e q = exp für alle p ∈ Z, q ∈ N. q (3.1) Dies erklärt auch die Schreibweise der Exponentialfunktion als Potenz. Wir konzentrieren uns nun auf die Einschränkungen von exp z auf die reelle bzw. imaginäre Achse: 114 KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG Satz 3.2: Die reelle Exponentialfunktion ex = exp x := zur Klasse C ∞ (R) und es gilt exp′ x = d exp x = exp x, dx ∑∞ xk k=0 k! , x ∈ R, gehört x ∈ R. (3.2) Beweis: Gemäß Kap. 1, § 8 ist die Exponentialreihe für alle x ∈ R konvergent. Nach Folgerung 1.2 gilt also exp ∈ C ∞ (R) und wir haben (1.6) exp′ x = ∞ ∞ ∞ ∑ ∑ ∑ 1 1 xl k xk−1 = xk−1 = = exp x, k! (k − 1)! l! k=1 k=1 l=0 wie behauptet. q.e.d. Satz 3.3: Die reelle Exponentialfunktion ex = exp x, x ∈ R, bildet R auf (0, +∞) ab, ist streng monoton wachsend, streng konvex und erfüllt lim exp x = 0, x→−∞ exp 0 = 1, lim exp x = +∞. x→+∞ (3.3) Beweis: Offensichtlich ist f (x) := ex , x ∈ R, reellwertig, da die definierende Reihe nur reelle Koeffizienten besitzt. Insbesondere gilt e0 = 1. Ferner haben wir exp x = 1 + ∞ ∑ xk >0 k! für alle x ∈ [0, +∞) k=1 und nach Satz 3.1 auch exp x = 1 >0 exp(−x) für alle x ∈ (−∞, 0), also insgesamt f (R) ⊂ (0, +∞). Zum Beweis von (3.3) beachten wir lim exp x ≥ lim (1 + x) = +∞ x→+∞ und lim exp x = lim x→−∞ x→−∞ x→+∞ 1 exp(−x) ξ:=−x = lim ξ→+∞ 1 = 0. exp ξ Ist nun y ∈ (0, +∞) beliebig, so existieren also x1 < 0, x2 > 0 mit ex1 < y < ex2 . Nach dem Zwischenwertsatz, Satz 2.7 aus Kap. 2, existiert ein x ∈ (x1 , x2 ) mit f (x) = y, d.h. y ∈ f (R) und insgesamt f (R) = (0, +∞). Schließlich gilt nach Satz 3.2: exp′ x = exp x > 0 für alle x ∈ R, also ist exp x nach Folgerung 2.1 streng monoton wachsend. Und wiederum Satz 3.2 in Verbindung mit Folgerung 2.4 liefert die strenge Konvexität wegen exp′′ x = exp′ x = exp x > 0. q.e.d. Definition 3.2: Die Umkehrfunktion von exp : R → R nennen wir (natürliche) Logarithmusfunktion log : (0, +∞) → R. Für x > 0 heißt y = log x Logarithmus von x. 3. DIE ELEMENTAREN FUNKTIONEN 115 Satz 3.4: Die Funktion log : (0, +∞) → R ist streng monoton, streng konkav, beliebig oft differenzierbar und wir haben log′ x = d 1 log x = dx x für alle x > 0. (3.4) Ferner gelten die Funktionalgleichung log(x1 x2 ) = log x1 + log x2 für alle x1 , x2 > 0 (3.5) sowie lim log x = −∞, x→0+ log 1 = 0, log e = 1, lim log x = +∞. x→+∞ (3.6) Beweis: Zunächst gehört log x nach Satz 1.4 als Umkehrfunktion von x = exp y zur Klasse C 1 ((0, +∞), R) und es gilt log′ x = 1 1 1 = = exp′ (log x) exp(log x) x für x > 0. Wegen x1 ∈ C ∞ ((0, +∞), R) ist nun auch log x ∈ C ∞ ((0, +∞), R) richtig. Außerdem ist log x offenbar streng monoton wachsend, und (3.4) liefert log′′ x = − x12 < 0 für alle x ∈ (0, +∞), d.h. nach Folgerung 2.4 ist log x streng konkav. Zum Beweis von (3.5) seien x1 , x2 > 0 beliebig gewählt. Wir erhalten dann aus Satz 3.1 exp(log x1 + log x2 ) = exp(log x1 ) · exp(log x2 ) = x1 x2 . Nehmen wir auf beiden Seiten den Logarithmus, so folgt die Behauptung (3.5). Schließlich ist natürlich log 1 = log(e0 ) = 0 und log e = log(e1 ) = 1 richtig. Und die Grenzwerte in (3.6) ergeben sich direkt aus der Monotonie und der Relation log((0, +∞)) = R. Damit ist alles gezeigt. q.e.d. Definition 3.3: Für beliebiges α ∈ R erklären wir die (allgemeine) Potenzfunktion x 7→ xα , x ∈ (0, +∞), durch die Formel xα := eα log x = exp(α log x). Satz 3.5: Die allgemeine Potenzfunktion f (x) := xα erfüllt f ∈ C ∞ ((0, +∞), R) und es gelten die Relationen xα y α = (xy)α , xα xβ = xα+β , α log(x ) = α log x, d α (x ) = αxα−1 dx für alle x, y > 0 und beliebige α, β ∈ R. (xα )β = xαβ , (3.7) (3.8) (3.9) 116 KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG Beweis: Nach Ketten- und Produktregel ist f ∈ C ∞ ((0, +∞), R) als Komposition zweier C ∞ Funktionen. Die Relationen (3.7) ergeben sich leicht unter Benutzung der Funktionalgleichungen für Exponential- und Logarithmusfunktion; z.B. berechnen wir xα y α = eα log x eα log y = eα(log x+log y) = eα log(xy) = (xy)α . Formel (3.8) folgt sofort aus der Definition der Potenzfunktion durch Logarithmieren. Schließlich entnehmen wir der Kettenregel d α d α log x d 1 (3.7) (x ) = (e ) = eα log x · (α log x) = xα α = αxα−1 , dx dx dx x wie behauptet. q.e.d. Bemerkung: Wir können auch die allgemeine Exponentialfunktion x 7→ cx = ex log c für festes c > 0 betrachten. Es gilt f (x) := cx ∈ C ∞ (R, R) und f ′ (x) = cx · log c, x ∈ R. Für c > 1 ist also f ′ > 0 und f : R → (0, +∞) bijektiv. Die zugehörige Umkehrfunktion heißt Logarithmus zur Basis c > 1 und wird mit logc : (0, +∞) → R bezeichnet. Der Logarithmus zur Basis e > 1 ist der natürliche Logarithmus (→ Übungen). Definition 3.4: Wir erklären die Cosinusfunktion cos : R → R und die Sinusfunktion sin : R → R gemäß 1 cos x := (eix + e−ix ) = Re (eix ), 2 1 sin x := (eix − e−ix ) = Im (eix ), 2i x ∈ R. Satz 3.6: Die Funktionen cos und sin gehören zur Klasse C ∞ (R, R) mit den Ableitungen d cos′ x = cos x = − sin x, dx (3.10) d ′ sin x = sin x = cos x, x ∈ R. dx Es gilt die Eulersche Formel eix = cos x + i sin x, x ∈ R, (3.11) und die Additionstheoreme cos(x1 + x2 ) = cos x1 cos x2 − sin x1 sin x2 , sin(x1 + x2 ) = cos x1 sin x2 + sin x1 cos x2 , x1 , x2 ∈ R. (3.12) Die Cosinusfunktion ist gerade, die Sinusfunktion ist ungerade, d.h. cos(−x) = cos x, sin(−x) = − sin x, x ∈ R. (3.13) 3. DIE ELEMENTAREN FUNKTIONEN 117 Schließlich haben wir die Potenzreihendarstellungen cos x = ∞ ∑ (−1)l l=0 (2l)! x2l , sin x = ∞ ∑ (−1)l x2l+1 , (2l + 1)! x ∈ R, (3.14) l=0 wobei beide Reihen absolut konvergieren. Beweis: cos, sin ∈ C ∞ (R, R) ist per Definition klar, da exp(±ix) ∈ C ∞ (R, C) gilt d gemäß Satz 1.6. Mit dx (e±ix ) = ±ie±ix berechnen wir 1 1 cos′ x = (ieix − ie−ix ) = − (eix − e−ix ) = − sin x, 2 2i 1 ix 1 ix ′ ix sin x = (ie + ie ) = (e + e−ix ) = cos x, 2i 2 also (3.10). Die Eulersche Formel (3.11) ist direkte Konsequenz der Definition von cos und sin. Und die Funktionalgleichung der Exponentialfunktion liefert in Verbindung mit der Eulerschen Formel: cos(x1 + x2 ) + i sin(x1 + x2 ) = ei(x1 +x2 ) = eix1 eix2 = (cos x1 + i sin x1 )(cos x2 + i sin x2 ) = (cos x1 cos x2 − sin x1 sin x2 ) + i(cos x1 sin x2 + sin x1 cos x2 ). Real- und Imaginärteil dieser Gleichung entsprechen gerade den Formeln (3.12). Formel (3.13) entnimmt man wieder direkt der Definition von cos und sin. Zum Beweis von (3.14) berechnen wir schließlich cos x + i sin x = eix = ∞ ∑ 1 k k i x = k! k=0 = ∞ ∑ l=0 = 1 2l 2l i x + (2l)! ∑ k ∞ ∑ l=0 gerade ∑ 1 k k i x + k! k ungerade 1 k k i x k! 1 i2l+1 x2l+1 (2l + 1)! ∞ ∞ ∑ ∑ (−1)l 2l (−1)l x +i x2l+1 . (2l)! (2l + 1)! l=0 l=0 Vergleich von Real-und Imaginärteil dieser Identität liefert (3.14). Damit ist alles gezeigt. q.e.d. Bemerkung: Wegen eix = e−ix gilt |eix |2 = eix e−ix = 1 für alle x ∈ R. Der Eulerschen Formel entnehmen wir daher die berühmte Relation 1 = cos2 x + sin2 x für alle x ∈ R. Geometrisch stellt f (x) := eix , x ∈ R, eine gleichförmige Bewegung mit Geschwindigkeit 1 auf der Einheitskreislinie dar, denn es gilt |f (x)| ≡ 1, |f ′ (x)| = |ieix | ≡ 1. 118 KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG Cosinus- und Sinusfunktion sind nach Definition die Projektionen dieser Kreisbewegung auf die reelle bzw. imaginäre Achse, weshalb man sie auch als Kreisfunktionen bezeichnet. Wir wollen nun die Nullstellen der Kreisfunktionen untersuchen und beginnen mit dem Satz 3.7: Die Gleichung cos x = 0 besitzt im Intervall [0, 2] genau eine Lösung. Diese kleinste positive Nullstelle von cos bezeichnen wir mit π2 . Es gilt dann cos x > 0 [ π) für alle x ∈ 0, , 2 cos π = 0. 2 Beweis: Zunächst gilt per Definition cos 0 = Re (e0 ) = 1. Und aus der Reihendarstellung von cos ermitteln wir cos x = = x2 x4 x6 x8 x10 x12 + − + − + − +... 2! 4! 6! 8! 10! 12! ) ( ) ( x4 x6 x2 x10 ( x2 ) x2 + − 1− − 1− − ... 1− 2! 4! 6! 7·8 10! 11 · 12 1− Für x = 2 erhalten wir also cos 2 = − 1 26 ( 4 ) 210 ( 4 ) 1 − 1− − 1− − ... < − . 3 6! 7·8 10! 11 · 12 3 Nach dem Zwischenwertsatz, Satz 2.5 aus Kap. 2, existiert also ein ξ ∈ (0, 2) mit cos ξ = 0. Weiter entnehmen wir der Reihendarstellung von sin: cos′ x = = x3 x5 x7 x9 x11 − + − + − +... 3! 5! 7! 9! 11! ( 2 ) 5( 2 ) 9( x x x x x2 ) −x 1 − − 1− − 1− − ... < 0 2·3 5! 6·7 9! 10 · 11 − sin x = −x + für x ∈ (0, 2). Nach Folgerung 2.1 ist also cos in [0, 2] streng monoton fallend und somit injektiv. Insbesondere ist die Nullstelle ξ =: π2 eindeutig bestimmt und der Satz damit bewiesen. q.e.d. Folgerung 3.1: Die Sinusfunktion ist im Intervall [− π2 , π2 ] streng monoton wachsend und es gilt ( π) π sin − = −1, sin 0 = 0, sin = 1. 2 2 Die Cosinusfunktion ist im Intervall [0, π] streng monoton fallend und es gilt cos 0 = 1, cos π = 0, 2 cos π = −1. Beweis: Da cos gerade ist, gilt nach Satz 3.7: sin′ x = cos x > 0 in (− π2 , π2 ), d.h. sin ist in [− π2 , π2 ] streng monoton wachsend nach Folgerung 2.1. Ferner gilt sin 0 = Im (e0 ) = 0 und ( π) ( π) ( π) + sin2 ± = sin2 ± , 1 = cos2 ± 2 2 2 3. DIE ELEMENTAREN FUNKTIONEN 119 also wegen der Monotonie sin(− π2 ) = −1, sin π2 = 1. Schließlich erhalten wir die Aussagen über den Cosinus aus den Regeln der Phasenverschiebung (π ) (π ) cos − x = sin x, sin − x = cos x, x ∈ R, (3.15) 2 2 die man nun sofort aus den Additionstheoremen gewinnt. q.e.d. Satz 3.8: Die Funktionen cos und sin sind 2π-periodisch, d.h. es gilt cos(x + 2π) = cos x, für alle x ∈ R. sin(x + 2π) = sin x (3.16) Ferner haben wir cos(x + π) = − cos x, sin(x + π) = − sin x für alle x ∈ R. Schließlich gilt für die Nullstellenmengen der Funktionen } {π + kπ : k ∈ Z , {x ∈ R : cos x = 0} = 2 {x ∈ R : sin x = 0} = {kπ : k ∈ Z}. π Beweis: Wir bemerken zunächst ei 2 = cos iπ 2 eiπ = (e π 2 + i sin )2 = i2 = −1, π 2 (3.17) (3.18) = i nach Folgerung 3.1. Damit folgt e2iπ = (eiπ )2 = (−1)2 = 1, also cos π = −1, sin π = 0; cos(2π) = 1, sin(2π) = 0. Die Aussagen (3.16) und (3.17) folgen nun wieder unmittelbar aus den Additionstheoremen (3.12). Ferner wissen wir bereits cos x > 0 für alle x ∈ (− π2 , π2 ) und cos π2 = 0. Also folgt die Aussage (3.18) für den Cosinus aus Formel (3.17). Die Nullstellenmenge des Sinus lässt sich daraus m.H. der Phasenverschiebung (3.15) ablesen. q.e.d. Folgerung 3.2: Alle Lösungen der Gleichung eix = 1 haben die Form x = 2kπ mit einem k ∈ Z. Beweis: Wir beachten x) x 1 ( ix e−i 2 ix sin = e 2 − e−i 2 = (e − 1). 2 2i 2i x Also gilt eix = 1 ⇔ sin x2 = 0. Die Behauptung ergibt sich nun aus (3.18). q.e.d. Satz 3.9: (Polarkoordinaten) Jede komplexe Zahl z ∈ C besitzt eine Darstellung z = reiφ = r(cos φ + i sin φ) (3.19) mit einem φ ∈ R und r = |z|. Für z ̸= 0 ist die Darstellung (3.19) eindeutig, wenn wir φ ∈ [0, 2π) fordern. 120 KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG Beweis: 1. Für z = 0 ist r = |z| = 0 und (3.19) gilt mit beliebigem φ ∈ R. Sei also z = x + iy ̸= 0. Dann folgt r := |z| > 0 und ξ := xr , η := yr sind wohldefiniert. Es gilt dann z = r(ξ + iη), ξ 2 + η 2 = 1. (3.20) Insbesondere ist ξ ∈ [−1, 1] = [cos π, cos 0] erfüllt. Nach dem Zwischenwertsatz existiert also ein α ∈ [0, π] mit cos α = ξ. Hieraus folgt noch √ √ η = ± 1 − ξ 2 = ± 1 − cos2 α = ± sin α. Man beachte sin α ≥ 0 wegen (3.18) und sin π2 = 1. • 1. Fall: Für y ≥ 0 ist η ≥ 0, also η = sin α. Dann wählen wir φ := α ∈ [0, π] und erhalten ξ = cos φ, η = sin φ, also aus (3.20) die gesuchte Darstellung (3.19). • 2. Fall: Für y < 0 folgt α ∈ (0, π) und η = − sin α. Mit φ := 2π − α ∈ (π, 2π) erhalten wir dann aus den Symmetrieeigenschaften (3.13) und der Periodizität (3.16): ξ = cos α = cos(2π − φ) = cos φ, η = − sin α = − sin(2π − φ) = sin φ, also wieder (3.19). 2. Man beachte, dass der in Teil 1 des Beweises erklärte Winkel φ in [0, 2π) liegt. Gäbe es ein weiteres ψ ∈ [0, 2π) mit z = reiψ , so folgte eiφ = eiψ bzw. ei(φ−ψ) = 1. Folgerung 3.2 liefert also φ − ψ = 2kπ. Aus |φ − ψ| < 2π folgt nun k = 0 bzw. φ = ψ, wie behauptet. q.e.d. Bemerkungen: 1. φ ∈ [0, 2π) misst den Winkel zwischen der positiven reellen Achse und dem Vektor z = (x, y), gemessen in mathematisch positivem Sinn. Er wird Argument von z genannt und mit φ = arg z bezeichnet. Seine Berechnung gelingt mit Hilfe der Arcus-Funktionen; siehe Bemerkung 1 im Anschluss an Satz 3.11 unten. 2. Auch mit der Forderung φ ∈ [φ0 , φ0 + 2π) für beliebiges φ0 ∈ R ist φ eindeutig festgelegt; vergleiche Teil 2 des obigen Beweises. Aufgrund der Periodizität von cos und sin folgt dann φ = arg z + 2kπ mit einem (eindeutigen) k ∈ Z. φ misst also wieder den Winkel zur positiven x-Achse, wobei nun zusätzlich k-mal um den Ursprung gelaufen wird. Analog führt auch die Forderung φ ∈ (φ0 , φ0 +2π] zu einer eindeutigen Festlegung von φ. 3. DIE ELEMENTAREN FUNKTIONEN 121 3. Die Polarkoordinatendarstellung erlaubt uns eine einfache Interpretation der komplexen Multiplikation: Sind nämlich z1 = |z1 |eiφ1 und z2 = |z2 |eiφ2 mit φ1 , φ2 ∈ [0, 2π) gegeben, so folgt aus der Funktionalgleichung der Exponentialfunktion: z1 · z2 = |z1 | |z2 | ei(φ1 +φ2 ) . Bei der Multiplikation werden also die Beträge multipliziert und die Argumente (= Winkel) addiert. Definition 3.5: Wir erklären die Funktionen sin x , cos x cos x cot x := , sin x tan x := x ̸= π + kπ, k ∈ Z 2 x ̸= kπ, k ∈ Z ( Tangens), ( Cotangens). Satz 3.10: Tangens und Cotangens sind in ihren Definitionsgebieten beliebig oft differenzierbar und es gelten d 1 π tan x = 1 + tan2 x = , x ̸= + kπ, k ∈ Z, dx cos2 x 2 d 1 cot′ x = cot x = −(1 + cot2 x) = − 2 , x ̸= kπ, k ∈ Z. dx sin x tan′ x = (3.21) Ferner haben wir tan(x + π) = tan x, und tan (π ) − x = cot x, 2 sowie die Additionstheoreme cot(x + π) = cot x cot tan(x1 + x2 ) = tan x1 + tan x2 , 1 − tan x1 tan x2 cot(x1 + x2 ) = −1 + cot x1 cot x2 , cot x1 + cot x2 (π 2 ) − x = tan x x1 , x2 , x1 + x2 ̸= π + kπ, k ∈ Z, 2 x1 , x2 , x1 + x2 ̸= kπ, k ∈ Z. Schließlich ist tan in (− π2 , π2 ) streng monoton wachsend mit lim x→− π2 + tan x = −∞, tan 0 = 0, Und cot ist in (0, π) streng monoton fallend mit (π ) lim cot x = +∞, cot = 0, x→0+ 2 lim tan x = +∞. x→ π2 − lim cot x = −∞. x→π− 122 KAPITEL 3. DIFFERENTIAL- UND INTEGRALRECHNUNG Beweis: Direkt aus den Aussagen über die Cosinus-und Sinusfunktion. q.e.d. Aufgrund des Monotonieverhaltens von sin, cos, tan und cot können wir nun auch die entsprechenden Umkehrfunktionen erklären, wenn wir uns auf geeignete Monotonieintervalle beschränken: Wir wählen die Bereiche π π y = sin x, − ≤ x ≤ ⇒ −1 ≤ y ≤ 1, 2 2 y = cos x, 0 ≤ x ≤ π ⇒ −1 ≤ y ≤ 1, y = tan x, − y = cot x, π π <x< ⇒ −∞ < y < +∞, 2 2 0 < x < π ⇒ −∞ < y < +∞. Die zugehörigen Umkehrfunktionen heißen Arcus Sinus, Arcus Cosinus, Arcus Tangens bzw. Arcus Cotangens und werden mit arcsin := sin−1 : [−1, 1] → R, arccos := cos−1 : [−1, 1] → R, arctan := tan−1 : R → R, arccot := cot−1 : R → R bezeichnet. Satz 3.11: Es gelten arcsin, arccos ∈ C ∞ ((−1, 1)) und arctan, arccot ∈ C ∞ (R) und wir haben arcsin′ y = √ 1 1− 1 ′ arctan y = , 1 + y2 y2 , arccos′ y = − √ 1 , y ∈ (−1, 1), 1 − y2 1 arccot′ y = − , y ∈ R. 1 + y2 (3.22) Ferner gelten die Relationen π 2 π arctan y + arccoty = 2 arcsin y + arccos y = für alle y ∈ [−1, 1], für alle y ∈ R. (3.23) Beweis: Da die ersten Ableitungen von sin, tan auf (− π2 , π2 ) und von cos, cot auf (0, π) nicht verschwinden, sind die Umkehrfunktionen in den angegebenen Bereichen einmal differenzierbar nach Satz 1.4 und es gelten 1 1 1 = √ = √ , |y| < 1, sin′ (arcsin y) 1 − y2 1 − sin2 (arcsin y) 1 1 1 arctan′ y = = = , y ∈ R. tan′ (arctan y) 1 + tan2 (arctan y) 1 + y2 arcsin′ y = Entsprechend erhalten wir die ersten Ableitungen für arccos und arccot. Da die Funktionen √ 1 1−y 2 , y ∈ (−1, 1), und y ∈ R, beliebig oft differenzierbar sind, folgen die behaupteten Regularitätseigenschaften der Arcusfunktionen. 1 , 1+y 2 3. DIE ELEMENTAREN FUNKTIONEN 123 Zum Beweis der ersten Relation in (3.23) wenden wir arccos auf die Relation y = sin x = cos( π2 − x), x ∈ [− π2 , π2 ], an: arccos y = π π − x = − arcsin y, 2 2 y ∈ [−1, 1]. Entsprechend wenden wir arccot auf y = tan x = cot( π2 − x), x ∈ R, an und erhalten die zweite Relation in (3.23). q.e.d. Bemerkungen: 1. Die Konstruktion im Beweis von Satz 3.9 und die zeigen, dass sich das Argument arg z einer Zahl bestimmen lässt: (x) , falls y arccos |z| (x) arg z = 2π − arccos , falls y |z| obige Definition von arccos z = x + iy ̸= 0 wie folgt ≥0 ∈ [0, 2π). <0 2. Ausgehend von der komplexen Exponentialfunktion können wir auch die komplexe Cosinus- bzw. Sinusfunktion erklären: 1 cos z := (eiz + e−iz ), 2 sin z := 1 iz (e − e−iz ), 2i z ∈ C. Für z = x ∈ R erhalten wir dann die reellen Kreisfunktionen. Für z = −ix, x ∈ R, erhalten wir die (reellen) Hyperbelfunktionen 1 cosh x := cos(−ix) = (ex + e−x ) 2 1 x sinh x := sin(−ix) = (e − e−x ) 2 (Cosinus hyperbolicus), (Sinus hyperbolicus). Während (cos x, sin x) eine Parametrisierung der Einheitskreislinie liefert, ergibt (cosh x, sinh x) eine Parametrisierung des rechten Astes der Hyperbel {(x, y) ∈ R2 : x2 − y 2 = 1}. Wir verzichten hier auf eine Diskussion der Hyperbelfunktionen und verweisen auf die Literatur und die Übungen.