Ein Skript für Analysis I Chris Preston Wintersemester 2001/02 1 2 Dies ist ein Skript für Analysis I. Die Texte von Lang [10], Königsberger [8] und Amman und Escher [1] haben die Darstellung beeinflusst. Chris Preston Februar, 2003 3 Inhaltsverzeichnis 1 Mengen und Abbildungen 4 2 Der Körper der rationalen Zahlen 12 3 Der Körper der reellen Zahlen 19 4 Der Körper der komplexen Zahlen 26 5 Folgen 30 6 Unendliche Reihen 39 7 Stetige Funktionen 48 8 Folgenkompaktheit 58 9 Trigonometrische Funktionen 61 10 Differentiation 67 11 Mittelwertsätze 80 12 Integration von Regelfunktionen 89 13 Integration und Differentiation 98 14 Das Riemannsche Integral 104 Literatur 110 Index 111 1 Mengen und Abbildungen Sind α und β (mathematische) Objekte, so bedeutet α = β, dass sie gleich sind. Sind sie nicht gleich, so schreibt man α 6= β. Die wichtigsten Typen von Objekten sind Mengen und Abbildungen. Ist X eine Menge und x ein Objekt, so bedeutet x ∈ X, dass x ein Element von X ist. Ist x kein Element von X, so schreibt man x ∈ / X. Fakt 1 Mengen X und Y sind genau dann gleich, wenn sie aus den gleichen Elementen bestehen, d.h., wenn für jedes Objekt x gilt: x ∈ X genau dann, wenn x∈Y. Bekannte Mengen sind: — Die Menge N = {0, 1, 2, . . . } der natürlichen Zahlen. — Die Menge Z = { . . . , −2, −1, 0, 1, 2, . . . } der ganzen Zahlen. — Die Menge Q der rationalen Zahlen. Eine Menge Y heißt Teilmenge einer Menge X (geschrieben Y ⊂ X), wenn jedes Element von Y auch zu X gehört, d.h., wenn y ∈ X für jedes y ∈ Y . Insbesondere gilt N ⊂ Z ⊂ Q. Lemma 1.1 Für Mengen X und Y gilt X = Y genau dann, wenn X ⊂ Y und Y ⊂ X. Beweis Übung. Sei X eine Menge. Ist E(x) ein Ausdruck, der eine Aussage darstellt, wenn für x ein Element von X eingesetzt wird, so heißt E Eigenschaft auf X. Fakt 2 Sei X eine Menge und sei E eine Eigenschaft auf X; dann gibt es eine (eindeutige) Teilmenge von X, die aus allen Elementen x von X besteht, für die E(x) wahr ist; sie wird mit {x ∈ X : E(x)} bezeichnet. Zum Beispiel sei E(n) der Ausdruck 3 < n < 7; dann ist E eine Eigenschaft auf N und {n ∈ N : 3 < n < 7} ist die Teilmenge von N, die aus den Elementen 4, 5 und 6 besteht. Sei Y Teilmenge einer Menge X und sei E(x) der Ausdruck x ∈ / Y . Dann ist E eine Eigenschaft auf X und die Teilmenge {x ∈ X : x ∈ / Y } von X wird mit X \ Y bezeichnet. Sie heißt das Komplement von Y (in X). 4 1 Mengen und Abbildungen 5 Fakt 3 Es gibt eine Menge ∅, die kein Element enthält: Für jedes Objekt x gilt also x ∈ / ∅. Die Menge ∅ heißt leere Menge. Lemma 1.2 Die leere Menge ∅ ist eindeutig, d.h. sie ist die einzige Menge, die kein Element enthält: Ist ∅′ eine Menge mit x ∈ / ∅′ für jedes Objekt x, so ist ∅′ = ∅. Beweis Übung. Die leere Menge ist Teilmenge jeder Menge, d.h., ∅ ⊂ X für jede Menge X. Eine Menge X heißt nichtleer, wenn X 6= ∅, d.h., wenn es mindestens ein Objekt x mit x ∈ X gibt. Fakt 4 Sind x1 , . . . , xn endlich viele Objekte, so gibt es eine (eindeutige) Menge P , die genau aus diesen Elementen besteht: Ist w eine Objekt, so gilt w ∈ P genau dann, wenn w = xk für (mindestens) ein k = 1, . . . , n. Diese Menge P wird mit {x1 , . . . , xn } bezeichnet. Sei I eine nichtleere Menge und für jedes i ∈ I sei Xi eine Menge. Dann heißt {Xi : i ∈ I} Familie von Mengen und I die Indexmenge für diese Familie. (Man merke, dass es hier nicht verlangt wird, dass Xi 6= Xj , falls i 6= j.) Das einfachste Beispiel ist mit I = [n] für ein n ≥ 1, wobei [n] die Teilmenge {1, 2, . . . , n} von N bezeichnet. Eine Familie {Xi : i ∈ [n]} besteht also aus den n Mengen X1 , . . . , Xn . Fakt 5 Zu jeder Familie {Xi : i ∈ I} von Mengen gibt es eine (eindeutige) Menge V mit der Eigenschaft: Für jedes Objekt x gilt x ∈ V genau dann, wenn x ∈ Xi für (mindestens) ein i ∈ I. Die Menge V heißt Vereinigung der Mengen S in der Familie {Xi : i ∈ I} und wird mit i∈I Xi bezeichnet. Fakt 6 Zu jeder Familie {Xi : i ∈ I} von Mengen gibt es eine (eindeutige) Menge D mit der Eigenschaft: Für jedes Objekt x gilt x ∈ D genau dann, wenn x ∈ Xi für alle i ∈ I. Die Menge D heißt Durchschnitt der Mengen in der Familie T {Xi : i ∈ I} und wird mit i∈I Xi bezeichnet. Sind X1 , . . . , Xn endlich viele Mengen, so wird die Vereinigung (bzw. derSDurchschnitt) der Mengen in derTFamilie {Xi : i ∈ [n]} mit X1 ∪ · · · ∪ Xn oder nk=1 Xk (bzw. X1 ∩ · · · ∩ Xn oder nk=1 Xk ) bezeichnet. 1 Mengen und Abbildungen 6 Fakt 7 Zu jeder Menge X gibt es eine (eindeutige) Menge P(X), deren Elemente genau die Teilmengen von X sind. Für jedes Objekt Y gilt also Y ∈ P(X) genau dann, wenn Y eine Menge ist mit Y ⊂ X. Die Menge P(X) heißt Potenzmenge von X. Da ∅ ⊂ X, ist ∅ ∈ P(X); insbesondere ist P(X) stets nichtleer. Die Menge P(∅) besteht aus dem einzigen Element ∅, d.h., P(∅) = {∅}. Seien X und Y Mengen. Eine Abbildung oder eine Funktion f von X nach Y ist eine Vorschrift, die jedem Element von X genau ein Element von Y zuordnet. Das dem Element x ∈ X zugeordnete Element von Y wird mit f (x) bezeichnet. Ist f eine Abbildung, so schreibt man f : X → Y um zu zeigen, dass f eine Abbildung von X nach Y ist. Ist f : X → Y eine Abbildung, so heißt X Definitionsbereich von f und wird mit dom(f ) bezeichnet. Die Teilmenge von Y {y ∈ Y : es gibt ein x ∈ X mit y = f (x)} heißt Bild von f und wird mit im(f ) bezeichnet. Fakt 8 Abbildungen f : X → Y und f ′ : X ′ → Y ′ sind genau dann gleich, wenn gilt: X = X ′ , Y = Y ′ und f (x) = f ′ (x) für jedes x ∈ X. Für jede Menge Y gibt es genau eine Abbildung von ∅ nach Y . Es gibt eine Abbildung von einer Menge X nach ∅ genau dann, wenn X = ∅. Einfache Beispiele von Abbildungen sind: (1) Für jede Menge X gibt es die Identitätsabbildung idX : X → X, die definiert ist durch idX (x) = x für jedes x ∈ X. (2) Ist X eine Menge und Y eine Teilmenge von X, so gibt es die Inklusionsabbildung inY,X : Y → X, die definiert ist durch inY,X (y) = y für jedes y ∈ Y . Insbesondere ist idX = inX,X . (3) Sind X und Y Mengen, so gibt es für jedes y ∈ Y die konstante Abbildung cony : X → Y , die definiert ist durch cony (x) = y für jedes x ∈ X. Fakt 9 Sind X, Y, Z Mengen und f : X → Y und g : Y → Z Abbildungen, so gibt es die Abbildung g ◦ f : X → Z, die definiert ist durch (g ◦ f )(x) = g(f (x)) für alle x ∈ X. Diese Abbildung heißt die Komposition von f und g und wird oft lediglich mit gf bezeichnet. Für jede Abbildung f : X → Y gilt f ◦ idX = f = idY ◦ f . 1 Mengen und Abbildungen 7 Lemma 1.3 (Assoziativität der Komposition) Seien W, X, Y, Z Mengen und f : W → X, g : X → Y und h : Y → Z Abbildungen. Dann gilt h ◦ (g ◦ f ) = (h ◦ g) ◦ f . Beweis Übung. Aufgrund der Assoziativität ist es unnötig, bei Kompositionen Klammern zu setzen, d.h., die Abbildung in Lemma 1.3 kann einfach mit h ◦ g ◦ f bezeichnet werden. Ist f : X → Z eine Abbildung und Y eine Teilmenge von X, so gibt es die Abbildung f|Y = f ◦ inY,X ; also ist f|Y : Y → Z definiert durch f|Y (y) = f (y) für jedes y ∈ Y und heißt Restriktionsabbildung. Insbesondere ist f|X = f . Eine Abbildung f : X → Y heißt injektiv, wenn f (x) 6= f (x′ ) für alle x, x′ ∈ X mit x 6= x′ , surjektiv, wenn es zu jedem y ∈ Y ein x ∈ X mit y = f (x) gibt (d.h., wenn im(f ) = Y ), und bijektiv, wenn sie injektiv und surjektiv ist. Für jede Menge X ist die Identitätsabbildung idX : X → X bijektiv. Ist Y eine Teilmenge von X, so ist die Inklusionsabbildung inY,X : Y → X injektiv; sie ist aber nur dann surjektiv, wenn Y = X. Ist f : X → Z eine injektive Abbildung, so ist die Restriktionsabbildung f|Y : Y → Z auch injektiv für jede Teilmenge Y von X. Lemma 1.4 Seien f : X → Y und g : Y → Z Abbildungen. Sind f und g injektiv (bzw. surjektiv bzw. bijektiv), so ist die Komposition g ◦ f auch injektiv (bzw. surjektiv bzw. bijektiv). Beweis Übung. Lemma 1.5 Seien X, Y Mengen und sei f : X → Y eine Abbildung. (1) Gibt es eine Abbildung g : Y → X mit g ◦ f = idX , so ist f injektiv. (2) Ist X nichtleer und ist f injektiv, so gibt es eine Abbildung g : Y → X mit g ◦ f = idX . (3) Gibt es eine Abbildung g : Y → X mit f ◦ g = idY , so ist f surjektiv. (4) Ist f surjektiv, so gibt es eine Abbildung g : Y → X mit f ◦ g = idY . Beweis Übung. Im Beweis für Lemma 1.5 (4) wird das so genannte Auswahlaxiom benötigt: 1 Mengen und Abbildungen 8 Fakt 10 Sei {Xi : i ∈ S I} eine Familie von nichtleeren Mengen. Dann existiert eine Abbildung f : I → i∈I Xi mit f (i) ∈ Xi für jedes i ∈ I. Satz 1.1 Eine Abbildung f : X → Y ist genau dann bijektiv, wenn es eine Abbildung g : Y → X mit g ◦ f = idX und f ◦ g = idY gibt. In diesem Fall ist g eindeutig bestimmt. Beweis Die Behauptung ist trivial richtig, falls X = ∅; es kann also angenommen werden, dass X nichleer ist. Nehme zunächst an, dass es eine Abbildung g : Y → X mit g ◦ f = idX und f ◦ g = idY gibt. Nach Lemma 1.5 (1) (bzw. nach Lemma 1.5 (3)) ist f dann injektiv (bzw. surjektiv) und damit ist f bijektiv. Nehme nun umgekehrt an, dass f bijektiv ist. Insbesondere ist f injektiv, und folglich gibt es nach Lemma 1.5 (4) eine Abbildung g : Y → X mit g ◦ f = idX . Aber dann gilt auch f ◦ g = idY : Sei y ∈ Y ; da f surjektiv ist, gibt es ein x ∈ X mit y = f (x) und daraus folgt, dass (f ◦ g)(y) = (f ◦ g)(f (x)) = ((f ◦ g) ◦ f )(x) = (f ◦ (g ◦ f ))(x) = (f ◦ idX )(x) = f (idX (x)) = f (x) = y = idY (y) . Dies zeigt, dass (f ◦g)(y) = idY (y) für alle y ∈ Y , d.h., f ◦g = idY . Schließlich muss die Eindeutigkeit von g nachgewiesen werden: Seien g, g ′ : Y → X Abbildungen mit g ◦ f = idX , f ◦ g = idY , g ′ ◦ f = idX und f ◦ g ′ = idY . Dann gilt g ′ = g ′ ◦ idY = g ′ ◦ (f ◦ g) = (g ′ ◦ f ) ◦ g = idX ◦ g = g . Sei f : X → Y eine bijektive Abbildung; nach Satz 1.1 gibt es eine eindeutige Abbildung g : Y → X mit g ◦ f = idX und f ◦ g = idY . Diese Abbildung g heißt die Umkehrabbildung von f und wird mit f −1 bezeichnet, es gilt also f −1 ◦f = idX und f ◦ f −1 = idY . Offensichtlich ist id−1 X = idX für jede Menge X. Lemma 1.6 Sind f : X → Y und g : Y → Z bijektive Abbildungen, so ist (g ◦ f )−1 = f −1 ◦ g −1 . (Erinnerung: Nach Lemma 1.4 ist die Abbildung g ◦ f : X → Z bijektiv.) Beweis Übung. Sei f : X → Y eine Abbildung. Für jedes A ⊂ X heißt die Teilmenge von Y {y ∈ Y : es gibt ein x ∈ A mit y = f (x)} 1 Mengen und Abbildungen 9 das Bild von A unter f und wird mit f (A) bezeichnet. Insbesondere ist f (X) das Bild von f , d.h., f (X) = im(f ). Für jedes B ⊂ Y heißt die Teilmenge von X {x ∈ X : f (x) ∈ B} das Urbild von B unter f und wird mit f −1 (B) bezeichnet. Es gibt eigentlich kein Problem mit dieser Schreibweise, wenn f : X → Y eine bijektive Abbildung ist, da in diesem Fall das Bild einer Teilmenge B von Y unter der Umkehrabbildung f −1 gleich dem Urbild von B unter f ist. Fakt 11 Seien X, Y Mengen; dann gibt es eine (eindeutige) Menge Abb(X, Y ), deren Elemente genau die Abbildungen von X nach Y sind. Für jedes Objekt f gilt also f ∈ Abb(X, Y ) genau dann, wenn f eine Abbildung von X nach Y ist. Sei {Xi : i ∈ I} eine Familie von Mengen und setze V = S i∈I Xi . Die Menge {f ∈ Abb(I, V ) : f (i) ∈ Xi für alle i ∈ I} heißtQdas (cartesische) Produkt der Mengen in der Familie {Xi : i ∈ I} und wird mit i∈I Xi bezeichnet. LemmaQ 1.7 Ist {Xi : i ∈ I} eine Familie von nichtleeren Mengen, so ist das Produkt i∈I Xi auch nichtleer. Beweis Dies ist lediglich eine Umformulierung des Auswahlaxioms. Seien X1 , . . . , Xn endlich viele Mengen;Qin diesem Fall wird das Produkt der Mengen in der Familie {Xi : i ∈ [n]} mit nk=1 Xk oder X1 × · · · × Xn bezeichnet. S Die Menge X1 × · · · × Xn besteht also aus allen Abbildungen f : [n] → nk=1 Xk mit f (k) ∈ Xk für jedes k. Für jedes k = 1, . . . , n sei xk ∈ Xk ; dann gibt es ein eindeutiges Element f ∈ X1 × · · · × Xn mit f (k) = xk für jedes k und dieses Element wird mit (x1 , . . . , xn ) bezeichnet. Ist umgekehrt f ein Element von X1 × · · · × Xn , so gibt es für jedes k ein eindeutiges xk ∈ Xk , so dass f = (x1 , . . . , xn ). Insbesondere gilt (x1 , . . . , xn ) = (x′1 , . . . , x′n ) genau dann, wenn xk = x′k für jedes k. Das Produkt X1 ×· · ·×Xn kann also als Menge aller n-Tupeln (x1 , . . . , xn ) angesehen werden, wobei xk ∈ Xk für jedes k = 1, . . . , n. Seien X und Y Mengen; dann kann und wird das Produkt X × Y angesehen werden als Menge aller geordneten Paare (x, y) mit x ∈ X und y ∈ Y , wobei ‘geordnet’ hier bedeutet, dass (x, y) = (x′ , y ′) genau dann, wenn x = x′ und y = y′. 1 Mengen und Abbildungen 10 Sei X eine Menge; eine Teilmenge R von X ×X wird oft als (binäre) Relation auf X angesehen. In diesem Fall schreibt man meistens x1 R x2 statt (x1 , x2 ) ∈ R. Für jede Menge X gibt es die Relationen = und 6= auf X sowie die Relation ⊂ auf P(X). Auf den Mengen N, Z und Q gibt es ferner die Ordnungsrelationen <, ≤, > und ≥. Eine Relation R auf einer Menge X heißt — reflexiv, wenn x R x gilt für jedes x ∈ X, — transitiv, wenn aus x1 R x2 und x2 R x3 stets x1 R x3 folgt, — symmetrisch, wenn x2 R x1 gilt für alle x1 , x2 ∈ X mit x1 R x2 , — antisymmetrisch, wenn aus x1 R x2 und x2 R x1 stets x1 = x2 folgt. Die Relationen =, ⊂, ≤ und ≥ sind reflexiv, =, ⊂, <, ≤, > und ≥ sind transitiv, = und 6= sind symmetrisch und die Relationen =, ⊂, ≤ und ≥ sind antisymmetrisch. Eine Relation ∼ auf X, die reflexiv, symmetrisch und auch transitiv ist, heißt Äquivalenzrelation auf X. Insbesondere ist = eine Äquivalenzrelation. Wichtiges Beispiel: Sei Q = Z × Z× , wobei Z× = Z \ {0} und definiere eine Relation ∼ auf Q durch: (m1 , n1 ) ∼ (m2 , n2 ) genau dann, wenn m1 n2 = m2 n1 . Dann sieht man leicht, dass ∼ eine Äquivalenzrelation auf Q ist. (Natürlich wird das Element (m, n) von Q normalerweise mit m/n bezeichnet.) Im Folgenden sei ∼ eine Äquivalenzrelation auf einer Menge X. Setze [x] = {y ∈ X : y ∼ x} für jedes x ∈ X; [x] heißt die Äquivalenzklasse (oder Restklasse) von x. Dann gilt insbesondere x ∈ [x] für jedes x ∈ X, da ∼ reflexiv ist. Sind x, y ∈ X, so bedeutet x 6∼ y, dass x ∼ y nicht gilt. Lemma 1.8 (1) Seien x, y ∈ X mit x ∼ y; dann ist [x] = [y]. (2) Seien x, y ∈ X mit x 6∼ y; dann sind die Äquivalenzklassen [x] und [y] disjunkt, d.h., [x] ∩ [y] = ∅. (3) Seien x, y ∈ X; dann gilt entweder [x] = [y] oder [x] ∩ [y] = ∅. Beweis (1) Seien u, v ∈ X mit u ∼ v und sei z ∈ [u]. Dann ist z ∼ u und damit z ∼ v, da ∼ transitiv ist. Folglich ist z ∈ [v], und dies zeigt, dass [u] ⊂ [v], falls u ∼ v. Insbesondere ist [x] ⊂ [y]. Aber y ∼ x, da ∼ symmetrisch ist, und also gilt auch [y] ⊂ [x], d.h., [x] = [y]. (2) Seien x, y ∈ X mit [x] ∩ [y] 6= ∅. Dann gibt es ein Element z ∈ [x] ∩ [y] und damit gilt z ∼ x und z ∼ y. Aber dann ist x ∼ z, da ∼ symmetrisch ist, und 1 Mengen und Abbildungen 11 daraus ergibt sich, dass x ∼ y, da ∼ transitiv ist. Folglich ist [x] ∩ [y] = ∅, falls x 6∼ y. (3) Dies folgt unmittelbar aus (1) und (2). Definiere nun eine Teilmenge von P(X) durch X/∼ = {A ∈ P(X) : es gibt ein x ∈ X mit A = [x]} ; X/∼ heißt die Restklassenmenge modulo ∼. Eine Teilmenge A von P(X) heißt Partition oder Zerlegung von X, wenn es zu jedem x ∈ X genau ein A ∈ A mit x ∈ A gibt. Satz 1.2 Die Restklassenmenge X/∼ ist eine Partition von X. Beweis Sei x ∈ X; dann ist [x] ∈ X/∼ und x ∈ [x]. Sei nun A ein beliebiges Element von X/∼ mit x ∈ A; dann gibt es y ∈ X mit A = [y]. Da x ∈ A = [y], ist damit x ∼ y, und daraus folgt nach Lemma 1.8 (1), dass A = [y] = [x]. Dies zeigt, dass es genau ein A ∈ X/∼ (nämlich A = [x]) mit x ∈ A gibt. Ist A eine Partition von X und x ∈ X, so bezeichnet Ax das eindeutige Element von A mit x ∈ Ax . Satz 1.3 Sei A eine Partition von X und definiere eine Relation ∼ auf X durch: x ∼ y genau dann, wenn Ax = Ay . Dann ist ∼ eine Äquivalenzrelation auf X und A = X/∼. Beweis Dies ist klar. Sei X eine Menge; eine Abbildung ⊕ : X × X → X nennt man Verknüpfung auf X, und in diesem Fall schreibt man meistens x1 ⊕ x2 statt ⊕(x1 , x2 ). Zum Beispiel gibt es auf N die zwei Verknüpfungen + : N × N → N (Addition) und × : N × N → N (Multiplikation). Hier ist eine äußerst wichtige Eigenschaft der natürlichen Zahlen: Fakt 12 (Prinzip der vollständigen Induktion) Sei N eine Teilmenge von N mit 0 ∈ N, für die gilt: Für jedes n ∈ N ist auch n + 1 ∈ N. Dann ist N = N. Satz 1.4 (Beweis durch vollständige Induktion) Für jedes n ∈ N sei An eine Aussage. Nehme an, A0 ist richtig und es gilt: Aus der Richtigkeit von An folgt, dass An+1 auch richtig ist. Dann ist An richtig für jedes n ∈ N. Beweis Sei N = {n ∈ N : An ist richtig}; dann ist 0 ∈ N und für jedes n ∈ N ist auch n + 1 ∈ N. Daraus folgt nach dem Prinzip der vollständigen Induktion, dass N = N, d.h., An ist richtig für jedes n ∈ N. 2 Der Körper der rationalen Zahlen Die rationalen Zahlen Q werden hier als gegeben vorausgesetzt. Insbesondere ist Q ein Beispiel für einen Körper – ein Begriff, der nun eingeführt wird. Ein 5-Tupel (K, +, ·, 0, 1) bestehend aus einer Menge K, einer Verknüpfung + : K×K →K (λ, µ) 7→ λ + µ (genannt Addition), einer Verknüpfung · : K×K →K (λ, µ) 7→ λµ (genannt Multiplikation) und Elementen 0, 1 ∈ K mit 0 6= 1 heißt Körper, wenn folgendes gilt: (K1) (λ + µ) + ν = λ + (µ + ν) für alle λ, µ, ν ∈ K. (K2) λ + µ = µ + λ für alle λ, µ ∈ K. (K3) 0 + λ = λ für alle λ ∈ K. (K4) Zu jedem λ ∈ K gibt es ein Element −λ ∈ K mit (−λ) + λ = 0. (K5) (λµ)ν = λ(µν) für alle λ, µ, ν ∈ K. (K6) λµ = µλ für alle λ, µ ∈ K. (K7) Für alle λ ∈ K gilt 1λ = λ. (K8) Zu jedem λ ∈ K mit λ 6= 0 gibt es ein Element λ−1 ∈ K mit λ−1 λ = 1. (K9) λ(µ + ν) = λµ + λν für alle λ, µ, ν ∈ K. Bemerkung: Nach der üblichen Konvention soll die Addition in K weniger stark binden als die Multiplikation. (λµ + λν bedeutet also (λµ) + (λν).) Die Elemente 0 und 1 heißen das Nullelement oder die Null bzw. das Einselement oder die Eins. Lemma 2.1 Sei (K, +, ·, 0, 1) ein Körper. (1) Das Nullelement 0 ist eindeutig: Ist 0′ ∈ K ein Element mit 0′ + λ = λ für alle λ ∈ K, so ist 0′ = 0. (2) Zu jedem λ ∈ K gibt es genau ein Element −λ ∈ K mit (−λ) + λ = 0. (3) Das Einselement 1 ist eindeutig: Ist 1′ ∈ K ein Element mit 1′ λ = λ für alle λ ∈ K, so ist 1′ = 1. (4) Zu jedem λ ∈ K mit λ 6= 0 gibt es genau ein Element λ−1 ∈ K mit λ−1 λ = 1. 12 2 Der Körper der rationalen Zahlen 13 Beweis (1) Sei 0′ ∈ K ein Element mit 0′ + λ = λ für alle λ ∈ K; insbesondere ist dann 0′ + 0 = 0. Da aber 0 + λ = λ für alle λ ∈ K, ist auch 0 + 0′ = 0′ , und nach (K2) ist 0 + 0′ = 0′ + 0. Damit ist 0′ = 0 + 0′ = 0′ + 0 = 0. (2) Sei λ ∈ K und sei λ′ ∈ K mit λ′ + λ = 0. Unter Anwendung von (K1), (K2), (K3) und (K4) folgt dann, dass λ′ = 0 + λ′ = ((−λ) + λ) + λ′ = (−λ) + (λ + λ′ ) = (−λ) + (λ′ + λ) = (−λ) + 0 = 0 + (−λ) = −λ . (3) Sei 1′ ∈ K ein Element mit 1′ λ = λ für alle λ ∈ K; insbesondere ist dann 1′ · 1 = 1. Da aber 1λ = λ für alle λ ∈ K, ist auch 1 · 1′ = 0′ , und nach (K6) ist 1 · 1′ = 1′ · 1. Damit ist 1′ = 1 · 1′ = 1′ · 1 = 1. (4) Sei λ ∈ K und sei λ′ ∈ K \ {0} mit λ′ λ = 1. Unter Anwendung von (K5), (K6), (K7) und (K8) folgt dann, dass λ′ = 1λ′ = (λ−1 λ)λ′ = λ−1 (λλ′ ) = λ−1 (λ′ λ) = λ−1 1 = 1λ−1 = λ−1 . Wenn aus dem Kontext klar ist, welche Verknüpfungen + und · und Elemente 0 und 1 gemeint sind, dann wird lediglich K statt (K, +, ·, 0, 1) geschrieben. Ist K ein Körper, so wird eine Verknüpfung − : K×K →K (λ, µ) 7→ λ − µ (genannt Subtraktion) durch λ − µ = λ + (−µ) definiert. Die rationalen Zahlen Q mit der üblichen Addition und Multiplikation bilden einen Körper. (Das Nullelement ist 0 und das Einselement ist 1.) Ist K ein Körper, so wird die Teilmenge K \ {0} von K mit K × bezeichnet. Ein Körper K heißt angeordnet bezüglich einer Teilmenge P von K × , wenn gilt: (1) Für jedes λ ∈ K × ist genau eines von λ und −λ in P . (2) Für alle λ, µ ∈ P ist λ + µ ∈ P und λµ ∈ P . Insbesondere ist der Körper Q angeordnet bezüglich der Teilmenge PQ = {λ ∈ Q : λ > 0} von Q× . Dies ist aber die einzige Möglichkeit: Lemma 2.2 Ist Q angeordnet bezüglich einer Teilmenge P , so ist P = PQ . 2 Der Körper der rationalen Zahlen 14 Beweis Übung. Sei K ein Körper angeordnet bezüglich einer Teilmenge P von K × ; dann wird eine Relation > auf K definiert durch: Es gilt λ > µ genau dann, wenn λ − µ ∈ P . Insbesondere ist P = {λ ∈ K : λ > 0}. Vorübergehend wird > die von P abgeleitete Größer-Relation genannt. Die von PQ abgeleitete Größer-Relation auf Q ist natürlich nichts anderes als die übliche Größer-Relation > auf den rationalen Zahlen. Satz 2.1 Sei K ein Körper angeordnet bezüglich einer Teilmenge P von K × . Dann besitzt die von P abgeleitete Größer-Relation > folgende Eigenschaften: (1) Es gilt nicht 0 > 0. (2) Für jedes λ ∈ K × gilt genau eines von λ > 0 und −λ > 0. (3) Es gilt λ + µ > 0 und λµ > 0 für alle λ, µ ∈ K mit λ > 0, µ > 0. (4) Es gilt λ > µ genau dann, wenn λ − µ > 0. Ist umgekehrt > irgendeine Relation auf einem Körper K, die (1), (2), (3) und (4) erfüllt, und P = {λ ∈ K : λ > 0}, dann ist P eine Teilmenge von K × , K ist angeordnet bezüglich P und > ist die von P abgeleitete Größer-Relation. Beweis (1) Dies ist klar, da 0 ∈ / P und P = {λ ∈ K : λ > 0}. (2) Dies ist auch klar, da für jedes λ ∈ K × genau eines von λ ∈ P und −λ ∈ P gilt, und P = {λ ∈ K : λ > 0}. (3) Seien λ, µ ∈ K mit λ > 0, µ > 0. Dann ist λ ∈ P und µ ∈ P und damit auch λ + µ ∈ P und λµ ∈ P . Folglich ist λ + µ > 0 und λµ > 0. (4) Es gilt λ > µ genau dann, wenn λ − µ ∈ P , d.h., λ > µ gilt genau dann, wenn λ − µ > 0. Ist K ein Körper angeordnet bezüglich einer Teilmenge P von K × , so wird dann meistens lediglich von einem angeordneten Körper K geredet. Die von P abgeleitete Größer-Relation wird mit > bezeichnet und die Teilmenge P nicht mehr explizit erwähnt. Im Folgenden sei K ein angeordneter Körper. Wie in Q wird die Relation < definiert durch: Es gilt λ < µ genau dann, wenn µ > λ. Folglich gilt λ < µ genau dann, wenn µ − λ ∈ P . Satz 2.2 Die folgenden Rechenregeln gelten für die Relationen < und >: (1) Sind λ, µ ∈ K mit λ 6= µ, so ist genau eine der Aussagen λ < µ und µ < λ richtig. 2 Der Körper der rationalen Zahlen 15 (2) Sind λ, µ, ν ∈ K mit λ < µ und µ < ν, so ist λ < ν. (3) Es gilt λ < µ genau dann, wenn −λ > −µ. (4) Sind λ, µ ∈ K mit λ < µ, so ist λ + ν < µ + ν für alle ν ∈ K. (5) Sind λ, µ, ν, ̺ ∈ K mit λ < µ und ν < ̺, so ist λ + ν < µ + ̺. (6) Sind λ, µ ∈ K mit λ < µ und ν > 0, so ist νλ < νµ. (7) Sind λ, µ ∈ K mit λ < µ und ν < 0, so ist νµ < νλ. (8) Für jedes λ ∈ K × ist λλ > 0; insbesondere ist 1 > 0. (9) Ist λ ∈ K × mit λ > 0, so ist λ−1 > 0. (10) Sind λ, µ ∈ K × mit λ > 0 und µ > λ, so ist µ−1 < λ−1 . Beweis (1) Dies ist klar. (2) Sind λ, µ, ν ∈ K mit λ < µ und µ < ν, so ist µ − λ ∈ P und ν − µ ∈ P und damit ν − λ = (ν − µ) + (µ − λ) ∈ P , d.h., λ < ν. (3) Es gilt λ < µ genau dann, wenn µ − λ ∈ P , und −λ > −µ gilt genau dann, wenn −λ − (−µ) ∈ P . Aber −λ − (−µ) = −λ + µ = µ − λ. (4) Sind λ, µ ∈ K mit λ < µ, so ist µ − λ ∈ P und damit (µ + ν) − (λ + ν) = µ − λ ∈ P für alle ν ∈ K, d.h., λ + ν < µ + ν für alle ν ∈ K. (5) Sind λ, µ, ν, ̺ ∈ K mit λ < µ und ν < ̺, so ist µ − λ ∈ P und ̺ − ν ∈ P und damit auch (µ + ̺) − (λ + ν) = (µ − λ) + (̺ − ν) ∈ P , d.h., λ + ν < µ + ̺. (6) Sind λ, µ ∈ K mit λ < µ und ν > 0, so ist µ − λ ∈ P und ν ∈ P und damit auch νµ − νλ = ν(µ − λ) ∈ P , d.h., νλ < νµ. (7) Sind λ, µ ∈ K mit λ < µ und ν < 0, so ist µ − λ ∈ P und −ν ∈ P und damit auch νλ − νµ = (−ν)(µ − λ) ∈ P , d.h., νµ < νλ. (8) Ist λ ∈ P , so ist λλ ∈ P und damit λλ > 0. Ist dagegen −λ ∈ P , so ist wieder λλ = (−λ)(−λ) ∈ P , d.h., λλ > 0. Folglich ist λλ > 0 für alle λ ∈ K × , da für jedes λ ∈ K × genau eines von λ und −λ in P ist. Insbesondere ist 1 = 1 · 1 > 0. (9) Sei λ ∈ K × mit λ > 0; dann ist λ−1 ∈ K × und damit ist genau eines von λ−1 und −λ−1 in P . Aber −λ−1 ∈ P ist nicht möglich, da dann −1 = λ(−λ−1 ) ∈ P wäre und daher 1 ∈ / P (im Widerspruch zu 1 > 0). Also ist λ−1 ∈ P , d.h., −1 λ > 0. (10) Seien λ, µ ∈ K × mit λ > 0 und µ > λ; also sind λ ∈ P , µ − λ ∈ P und µ = (µ − λ) + λ ∈ P , und nach (9) ist (µ − λ)−1 > 0, d.h., (µ − λ)−1 ∈ P . Daraus folgt, dass λµ(µ − λ)−1 ∈ P , d.h., λµ(µ − λ)−1 > 0. Aber (λ−1 − µ−1 )λµ(µ − λ)−1 = (µ − λ)(µ − λ)−1 = 1 , 2 Der Körper der rationalen Zahlen 16 d.h., λµ(µ − λ)−1 = (λ−1 − µ−1 )−1 und damit ist nach (9) λ−1 − µ−1 > 0, d.h., µ−1 < λ−1 . Wie in Q werden die Relationen ≤ und ≥ auf K definiert durch: Es gilt λ ≤ µ genau dann, wenn λ < µ oder λ = µ, und λ ≥ µ genau dann, wenn λ > µ oder λ = µ. Für jedes λ ∈ K sei der (Absolut)-Betrag |λ| von λ definiert durch λ , falls λ ≥ 0, |λ| = −λ , falls λ < 0. Satz 2.3 Der Absolut-Betrag hat folgende Eigenschaften: (1) Für jedes λ ∈ K ist |λ| ≥ 0 und |λ| = 0 gilt genau dann, wenn λ = 0. (2) Für alle λ, µ ∈ K ist |λµ| = |λ||µ|. Insbesondere ist |−λ| = |λ|. (3) Für alle λ, µ ∈ K ist |λ + µ| ≤ |λ| + |µ| (Dreiecksungleichung). (4) Für alle λ, µ ∈ K ist ||λ| − |µ|| ≤ |λ − µ| (Umgekehrte Dreiecksungleichung). Beweis (1) Für jedes λ ∈ K gilt genau eines von λ = 0, λ > 0 und λ < 0. Ist λ > 0, so ist |λ| = λ > 0, und |λ| = 6 0. Ist λ < 0, so ist |λ| = −λ > 0, und wieder ist |λ| = 6 0. Schließlich ist |0| = 0. Für jedes λ ∈ K ist also |λ| ≥ 0 und |λ| = 0 gilt genau dann, wenn λ = 0. (2) Sind λ ≥ 0 und µ ≥ 0, so ist λµ ≥ 0 und damit |λµ| = λµ = |λ||µ|. Ist λ < 0 und µ ≥ 0, so ist λµ = −(−λ)µ ≤ 0 und damit ist |λµ| = −λµ = (−λ)µ = |λ||µ|. Genauso gilt |λµ| = |λ||µ|, wenn λ ≥ 0 und µ < 0. Sind schließlich λ < 0 und µ < 0, so ist λµ = (−λ)(−µ) > 0 und damit ist |λµ| = λµ = (−λ)(−µ) = |λ||µ|. Insbesondere ist |−λ| = |−1 · λ| = |−1||λ| = 1 · |λ| = |λ| für jedes λ ∈ K. (3) Gilt λ ≥ 0 und µ ≥ 0 oder λ < 0 und µ < 0, so stellt man leicht fest, dass |λ + µ| = |λ| + |µ|. Nehme also ohne Beschränkung der Allgemeinheit an, dass λ ≥ 0 und µ < 0; damit ist |λ| = λ und |µ| = −µ. Ist λ + µ ≥ 0, so ist |λ + µ| = λ + µ und daraus ergibt sich, dass |λ| + |µ| − |λ + µ| = λ + (−µ) − (λ + µ) = (−µ) + (−µ) ≥ 0 . Ist andererseits λ + µ < 0, so ist |λ + µ| = −(λ + µ) und hier ist |λ| + |µ| − |λ + µ| = λ + (−µ) + (λ + µ) = λ + λ ≥ 0 . In beiden Fällen ist |λ| + |µ| − |λ + µ| ≥ 0, d.h., |λ + µ| ≤ |λ| + |µ|. (4) Nach (3) ist |λ| = |(λ −µ) + µ| ≤ |λ −µ| + |µ| und damit ist |λ| −|µ| ≤ |λ −µ|. Genauso gilt |µ| − |λ| ≤ |µ − λ| = |λ − µ|. Folglich ist ||λ| − |µ|| ≤ |λ − µ|: Ist |λ| − |µ| ≥ 0, so ist ||λ| − |µ|| = |λ| − |µ| ≤ |λ − µ|; ist andererseits |λ| − |µ| < 0, so ist wieder ||λ| − |µ|| = −(|λ| − |µ|) = |µ| − |λ| ≤ |λ − µ|. 2 Der Körper der rationalen Zahlen 17 Satz 2.4 Sei n ≥ 2 und seien λ1 , . . . , λn ∈ K. (1) Es gibt ein eindeutiges λ ∈ K, für das gilt: λk ≤ λ für alle k = 1, . . . , n und λj = λ für mindestens ein j. Das Element λ wird mit max{λk : 1 ≤ k ≤ n} oder max{λ1 , . . . , λn } bezeichnet. (2) Es gibt ein eindeutiges λ′ ∈ K, für das gilt: λk ≥ λ′ für alle k = 1, . . . , n und λj = λ′ für mindestens ein j. Das Element λ′ wird mit min{λk : 1 ≤ k ≤ n} oder min{λ1 , . . . , λn } bezeichnet. Beweis Übung. Satz 2.5 Sei m ≥ 2 und λ1 , . . . , λm , ε ∈ K mit ε > 0 und 0 < λk+1 − λk < ε für jedes k = 1, . . . , m − 1. Ferner seien µ, ν ∈ K mit λ1 ≤ µ < ν ≤ λm und ν − µ ≥ ε. Dann gibt es ein k mit µ < λk < ν. Beweis Übung. Für jedes n ∈ N wird das Element |1 + 1 +{z· · · + 1} von K mit n bezeichnet. Da n−mal 1 = 1 > 0 und n + 1 = n + 1 für jedes n ∈ N, sieht man leicht, dass n > 0 für alle n ≥ 1. Für jedes λ ∈ K und jedes n ∈ N wird das Element |λλ {z · · · λ} von K n−mal mit λn bezeichnet, wobei λ0 = 1. Lemma 2.3 (Bernoullische Ungleichung) Sei λ ∈ K mit λ > −1. Dann gilt (1 + λ)n ≥ 1 + nλ für alle n ∈ N. Beweis Für jedes n ∈ N sei An die Aussage, dass (1 + λ)n ≥ 1 + nλ für alle λ > −1 gilt. Dann ist A0 richtig, da (1 + λ)0 = 1 = 1 + 0λ. Sei also n ∈ N und nehme an, dass An richtig ist. Für λ ∈ K mit λ > −1 ist dann (1 + λ)n+1 = (1 + λ)n (1 + λ) ≥ (1 + nλ)(1 + λ) = 1 + nλ + λ + nλ2 = 1 + (n + 1)λ + nλ2 = 1 + n + 1λ + nλ2 ≥ 1 + n + 1λ , da λ + 1 > 0 und λ2 ≥ 0, und folglich ist An+1 auch richtig. Daraus ergibt sich nach Satz 1.4, dass An für alle n ∈ N richtig ist. Lemma 2.4 Sei λ ∈ K mit 0 < λ < 1. Für jedes n ∈ N gilt dann (1 + λ)n < 1 + 3n λ . 2 Der Körper der rationalen Zahlen 18 Beweis Für jedes n ∈ N sei An die Aussage, dass (1 + λ)n < 1 + 3n λ für alle λ ∈ K mit 0 < λ < 1 gilt. Da (1 + λ)0 = 1 < 1 + 30 λ, ist A0 richtig. Sei also n ∈ N und nehme an, dass An richtig ist. Für λ ∈ K mit 0 < λ < 1 ist dann (1 + λ)n+1 = (1 + λ)n (1 + λ) < (1 + 3n λ)(1 + λ) = 1 + 3n λ + λ + 3n λ2 ≤ 1 + 3n λ + λ + 3n λ = 1 + (3n + 3n + 1)λ ≤ 1 + (3n + 3n + 3n )λ = 1 + (3 3n )λ = 1 + 3n+1 λ , und folglich ist An+1 auch richtig. Daraus ergibt sich nach Satz 1.4, dass An für alle n ∈ N richtig ist. 3 Der Körper der reellen Zahlen Ziel dieses Abschnittes ist es, den Körper R der reellen Zahlen einzuführen. Ein Körper K heißt Körpererweiterung eines Körpers F , wenn F ⊂ K und die Addition (bzw. die Multiplikation) in F die Einschränkung der Addition (bzw. der Multiplikation) in K ist. (Dies bedeutet: Für alle λ, µ ∈ F muss λ+µ = λ⊕µ und λ × µ = λ ⊗ µ gelten, wobei + und × (bzw. ⊕ und ⊗) die Addition und die Multiplikation in F (bzw. in K) sind.) Ist K eine Körpererweiterung von F , so ist die Null (bzw. die Eins) in F auch die Null (bzw. die Eins) in K. Der Körper R wird als angeordnete Körpererweiterung von Q eintreten, (d.h. als ein angeordneter Körper, der gleichzeitig eine Körpererweiterung von Q ist). Im Folgenden sei K eine beliebige angeordnete Körpererweiterung von Q (wobei nicht auszuschließen ist, dass K = Q). Als Vorbereitung auf die Definition von R werden die Eigenschaften von K untersucht. Lemma 3.1 Die Größer-Relation > auf K ist eine Erweiterung der üblichen Größer-Relation > auf Q. (Dies bedeutet: Sind x, y ∈ Q, so gilt x > y in K genau dann, wenn x > y in Q gilt.) Beweis Sei K angeordnet bezüglich der Teilmenge P von K × , setze P ′ = P ∩ Q, also ist P ′ Teilmenge von Q× . Ist λ ∈ P ′, so ist genau eines von λ und −λ in P und damit ist genau eines von λ und −λ in P ′ . Sind ferner λ, µ ∈ P ′ , so ist λ + µ ∈ P und λµ ∈ P und damit auch λ + µ ∈ P ′ und λµ ∈ P ′ . Folglich ist Q angeordnet bezüglich der Teilmenge P ′ von Q und daraus ergibt sich nach Lemma 2.2, dass P ′ = PQ = {λ ∈ Q : λ > 0}. Ist also λ ∈ Q, so gilt λ > 0 in K genau dann, wenn λ > 0 in Q gilt. Daher ist die Größer-Relation > auf K eine Erweiterung der Größer-Relation > auf Q. Sei D eine Teilmenge von K; ein Element z ∈ K heißt dann obere Schranke (bzw. untere Schranke) von D, wenn x ≤ z für alle x ∈ D (bzw. x ≥ z für alle x ∈ D) gilt. Die Teilmenge D heißt nach oben (bzw. nach unten) beschränkt, wenn es eine obere Schranke (bzw. eine untere Schranke) für D gibt. Sei D eine Teilmenge von K; ein Element z ∈ K heißt dann Supremum von D, falls z die kleinste obere Schranke von D ist. Genauer bedeutet dies: Einerseits ist z eine obere Schranke von D, und ist andererseits z ′ irgendeine obere Schranke von D, so ist z ≤ z ′ . Es ist klar, dass es höchstens ein Element mit diesen zwei Eigenschaften gibt. Falls es existiert, wird es mit sup(D) bezeichnet. Analog heißt z ∈ K Infimum von D, falls z die größte untere Schranke von D ist. Genauer bedeutet dies: Einerseits ist z eine untere Schranke von D, und ist 19 3 Der Körper der reellen Zahlen 20 andererseits z ′ irgendeine untere Schranke von D, so ist z ′ ≤ z. Wieder ist es klar, dass es höchstens ein Element mit diesen zwei Eigenschaften gibt. Falls es existiert, wird es mit inf(D) bezeichnet. Existiert sup(D) (bzw. inf(D)), so ist D natürlich nach oben beschränkt (bzw. nach unten beschränkt). Sei n ≥ 2 fest und für jedes x ∈ K mit x > 1 sei Wx = {y ∈ K : y n < x}. Dann ist Wx nichtleer, da 1 ∈ Wx , und x ist eine obere Schranke von Wx . (Sei y ∈ K mit y n < x. Ist y ≤ 1, so ist y ≤ 1 < x; ist dagegen y > 1, so ist y < y n < x.) Also ist Wx eine nichtleere, nach oben beschränkte Teilmenge von K. Lemma 3.2 Existiert das Supremum z = sup(Wx ), so ist z n = x. Beweis Da 1 ∈ Wx , ist z ≥ 1. Nehme an, dass z n < x und sei h = min{a, 1/2}, wobei a = (x − z n )(3n z n−1 )−1 . Also ist 0 < h < 1, da a > 0, und damit auch 0 < z −1 h < 1, da z −1 ≤ 1. Nun ist nach Lemma 2.5 (z + h)n = z n (1 + z −1 h)n < z n (1 + 3n z −1 h) = z n + 3n z n−1 h ≤ z n + 3n z n−1 a = z n + (x − z n ) = x , d.h. z + h ∈ Wx . Aber dann wäre z keine obere Schranke von Wx , und dies zeigt, dass z n ≥ x. Nehme nun an, dass z n > x, setze a = (z n − x)(nz n−1 )−1 und sei h = min{a, 1/2}. Wieder ist 0 < h < 1, da a > 0, und damit auch −z −1 h > −1, da z −1 ≤ 1. Daraus ergibt sich nach Lemma 2.4, dass (z − h)n = z n (1 − z −1 h)n ≥ z n (1 − nz −1 h) = z n − nz n−1 h ≥ z n − nz n−1 a = z n − (z n − x) = x > y n für alle y ∈ Wx . Folglich ist z − h > y für alle y ∈ Wx , da z − h ≥ 0. (Sind u, v ∈ K mit u ≥ 0 und un > v n , so ist u > v.) Aber dann wäre z − h eine obere Schranke von Wx , die kleiner als z ist, und dies zeigt, dass z n ≤ x. Also ist z n = x. Lemma 3.3 Äquivalent sind: (1) Jede nichtleere, nach oben beschränkte Teilmenge von K besitzt ein Supremum. (2) Jede nichtleere, nach unten beschränkte Teilmenge von K besitzt ein Infimum. Beweis (1) ⇒ (2): Sei A eine nichtleere, nach unten beschränkte Teilmenge von K. Dann ist A− = {x ∈ K : −x ∈ A} eine nichtleere, nach oben beschränkte Teilmenge von K und damit existiert z = sup(A− ). Aber dann ist −z = inf(A). 3 Der Körper der reellen Zahlen 21 (2) ⇒ (1): Analog. Die Körpererweiterung K heißt ordnungsvollständig, wenn jede nichtleere, nach oben beschränkte Teilmenge von K ein Supremum besitzt. Nach Lemma 3.2 ist Q selbst nicht ordnungsvollständig, da es zum Beispiel keine rationale Zahl z ∈ Q mit z 2 = 2 gibt. Es gibt eine im Wesentlichen eindeutige ordnungsvollständige Körpererweiterung von Q (siehe Satz 3.1 unten): Diese Körpererweiterung ist dann per Definition der Körper der reellen Zahlen. Für die genaue Formulierung der Eindeutigkeit muss hier zunächst erklärt werden, was ein Körperisomorphismus ist. Seien F , F ′ Körper; eine Abbildung ψ : F → F ′ heißt Körperhomomorphismus, wenn ψ(λ + µ) = ψ(λ) + ψ(µ) und ψ(λµ) = ψ(λ)ψ(µ) für alle λ, µ ∈ F . Ist ψ ein Körperhomomorphismus, so sieht man leicht, dass ψ(0) = 0 und ψ(1) = 1. Lemma 3.4 Sei ψ : F → F ′ ein Körperhomomorphismus. Ist ψ bijektiv, so ist die Umkehrabbildung ψ −1 : F ′ → F auch ein Körperhomomorphismus. Beweis Seien λ′ , µ′ ∈ F ′ ; da ψ bijektiv ist, gibt es eindeutige Elemente λ, µ ∈ F mit λ′ = ψ(λ) und µ′ = ψ(µ) und damit auch mit λ = ψ −1 (λ′ ) und µ = ψ −1 (µ′ ). Da ψ(λ + µ) = ψ(λ) + ψ(µ), gilt nun ψ −1 (λ′ + µ′ ) = ψ −1 (ψ(λ) + ψ(µ)) = ψ −1 (ψ(λ + µ)) = λ + µ = ψ −1 (λ′ ) + ψ −1 (µ′ ) und da ψ(λµ) = ψ(λ)ψ(µ), gilt auch ψ −1 (λ′ µ′ ) = ψ −1 (ψ(λ)ψ(µ)) = ψ −1 (ψ(λµ)) = λµ = ψ −1 (λ′ )ψ −1 (µ′ ) . Dies zeigt dann, dass ψ −1 ein Körperhomomorphismus ist. Ein bijektiver Körperhomomorphismus heißt ein Körperisomorphismus. Körper F und F ′ heißen isomorph, wenn es einen Körperisomorphismus ψ : F → F ′ gibt. Satz 3.1 Es gibt eine ordnungsvollständige Körpererweiterung von Q. Sind ferner K und K ′ zwei solche Körpererweiterungen, so gibt es einen eindeutigen Körperisomorphismus ψ : K → K ′ , und ψ(x) = x für jedes x ∈ Q. Beweis Siehe, zum Beispiel, Amman und Escher [1], Seite 99. Nach Satz 3.1 gibt es bis auf Isomorphie genau eine ordnungsvollständige Körpererweiterung von Q. Die heißt der Körper der reellen Zahlen und wird mit R bezeichnet. Nach der Definition besitzt jede nichtleere, nach oben beschränkte Teilmenge von R ein Supremum. Nach Lemma 3.3 besitzt dann auch jede nichtleere, nach unten beschränkte Teilmenge von R ein Infimum. 3 Der Körper der reellen Zahlen 22 Lemma 3.5 Sei D eine nichtleere nach oben beschränkte Teilmenge von R und sei z ∈ R. Dann gilt: (1) z ≥ sup(D) genau dann, wenn z ≥ x für alle x ∈ D. (2) z ≤ sup(D) genau dann, wenn es für jedes ε > 0 ein x ∈ D mit z < x + ε gibt. (3) z = sup(D) genau dann, wenn z ≥ x für alle x ∈ D und es für jedes ε > 0 ein x ∈ D mit z < x + ε gibt. Sei D eine nichtleere nach unten beschränkte Teilmenge von R und z ∈ R. Dann gilt: (4) z ≤ inf(D) genau dann, wenn z ≤ x für alle x ∈ D. (5) z ≥ inf(D) genau dann, wenn es für jedes ε > 0 ein x ∈ D mit z > x − ε gibt. (6) z = inf(D) genau dann, wenn z ≤ x für alle x ∈ D und es für jedes ε > 0 ein x ∈ D mit z > x − ε gibt. Beweis (1) Es gilt z ≥ sup(D) genau dann, wenn z eine obere Schranke von D ist, d.h., genau dann, wenn z ≥ x für alle x ∈ D. (2) Sei z ≤ sup(D); für jedes ε > 0 ist dann z − ε < sup(D) und damit ist z − ε keine obere Schranke von D. Es gibt also ein x ∈ D mit z − ε < x, d.h., mit z < x + ε. Nehme nun umgekehrt an, dass es für jedes ε > 0 ein x ∈ D mit z < x + ε gibt. Dann ist z − ε < sup(D) für jedes ε > 0, da x ≤ sup(D) für alle x ∈ D. Damit ist z ≤ sup(D) (sonst wäre z−ε = sup(D) mit ε = z−sup(D) > 0). (3) Dies folgt unmittelbar aus (1) und (2). (4), (5) und (6): Wie (1), (2) und (3). Lemma 3.6 Seien D, D ′ nichtleere Teilmengen von R mit D ⊂ D ′ . (1) Ist D ′ nach oben beschränkt, dann ist auch D und sup(D) ≤ sup(D ′ ). (1) Ist D ′ nach unten beschränkt, so ist auch D und inf(D ′ ) ≤ inf(D). Beweis Dies ist klar. Eine Teilmenge D von R heißt beschränkt, wenn sie nach oben und nach unten beschränkt ist, d.h., wenn es u, v ∈ R gibt, so dass u ≤ x ≤ v für alle x ∈ D. Man sieht leicht, dass D genau dann beschränkt ist, wenn es ein B ∈ R mit B ≥ 0 gibt, so dass |x| ≤ B für alle x ∈ D. Lemma 3.7 Sei D eine nichtleere beschränkte Teilmenge von R; für jedes x ∈ D gilt dann inf(D) ≤ x ≤ sup(D). Insbesondere ist inf(D) ≤ sup(D). 3 Der Körper der reellen Zahlen 23 Beweis Dies ist ebenso klar. Sei D eine nichtleere Teilmenge von R; eine Zahl c ∈ D heißt Maximum (bzw. Minimum) von D, wenn x ≤ c für alle x ∈ D (bzw. x ≥ c für alle x ∈ D). Es ist klar, dass das Maximum (bzw. das Minimum) im Falle der Existenz eindeutig bestimmt ist. Ferner ist es klar, dass D nach oben beschränkt (bzw. nach unten beschränkt) ist, falls das Maximum (bzw. das Minimum) existiert. Lemma 3.8 (1) Sei D eine nichtleere, nach oben beschränkte Teilmenge von R. Dann besitzt D ein Maximum genau, wenn sup(D) ∈ D, und in diesem Fall ist sup(D) das Maximum. (2) Sei D eine nichtleere, nach unten beschränkte Teilmenge von R. Dann besitzt D ein Minimum genau, wenn inf(D) ∈ D, und in diesem Fall ist inf(D) das Minimum. Beweis Dies folgt unmittelbar aus den Definitionen. Sei D eine nichtleere endliche Teilmenge von R; dann besitzt D ein Maximum und ein Minimum. Ist ferner x1 , . . . , xn irgendeine Aufzählung der Elemente von D, so ist max{x1 , . . . , xn } das Maximum und min{x1 , . . . , xn } das Minimum. Satz 3.2 Sei x ∈ R mit x ≥ 0; für jedes n ≥ 2 gibt es dann eine √ eindeutige reelle Zahl z mit z √≥ 0, so dass z n = x. Diese Zahl z wird mit n x bezeichnet (oder lediglich mit x, falls n = 2). Beweis Es gibt mindestens eine Zahl z ≥ 0 mit z n = x: Dies folgt unmittelbar aus Lemma 3.2, falls x > 1, und die Fälle x = 0 und x = 1 sind trivial richtig, da 0n = 0 und 1n = 1. Es bleibt also nur der Fall mit 0 < x < 1. Aber hier ist x−1 > 1, damit gibt es ein y ≥ 0 mit y n = x−1 ; folglich ist y −1 > 0 und (y −1)n = x. Es gibt höchstens eine Zahl z ≥ 0 mit z n = x: Sei y ≥ 0 mit y 6= z. Ist y < z (bzw. y > z), so ist y n < z n (bzw. y n > z n ) und damit ist y n 6= x. Satz 3.3 (Satz von Archimedes) Zu jeder reellen Zahl x ∈ R gibt es eine näturliche Zahl n ∈ N mit n > x. Mit anderen Worten: Die Teilmenge N von R ist nicht nach oben beschränkt. Beweis Die Aussage ist trivial richtig, wenn x < 0, da in diesem Fall n > x für jedes n ∈ N; sei also x ≥ 0. Dann ist A = {n ∈ N : n ≤ x} eine nichtleere nach oben beschränkte Teilmenge von R, da 0 ∈ A und x eine obere Schranke von A ist. Folglich existiert das Supremum z = sup(A). Nun gibt es ein m ∈ A mit z − 1 < m, sonst wäre z − 1 auch eine obere Schranke von A. Damit ist n = m + 1 ∈ N und n > z. Insbesondere ist n ∈ / A (sonst wäre z keine obere Schranke), d.h. n > x. 3 Der Körper der reellen Zahlen 24 Satz 3.4 Zu jedem ε > 0 gibt es ein n ∈ N \ {0} mit 1/n < ε. Beweis Sei ε > 0; nach Satz 3.3 gibt es dann n ∈ N \ {0} mit n > ε−1 , und daraus folgt nach Satz 2.2 (10), dass 1/n < (ε−1)−1 = ε. Satz 3.5 (1) Sei x ∈ R mit x > 1. Zu jedem c ∈ R gibt es dann ein n ∈ N, so dass xn > c. (2) Sei x ∈ R mit 0 < x < 1. Zu jedem ε > 0 gibt es dann ein n ∈ N, so dass xn < ε. Beweis (1) Setze y = x − 1, also ist y > 0. Sei nun c ∈ R; nach Satz 3.3 gibt es ein n ∈ N, so dass n > cy −1 . Folglich ist ny > c und damit ist nach Lemma 2.4 xn = (y + 1)n ≥ 1 + ny > 1 + c > c . (2) Setze y = x−1 ; dann ist y > 1. Sei nun ε > 0; nach (1) gibt es ein n ∈ N, so dass y n > ε−1 und nach Satz 2.2 (10) ist dann xn = (y n )−1 < (ε−1 )−1 = ε. Satz 3.6 Seien y, z ∈ R mit y < z. Dann gibt es ein x ∈ Q mit y < x < z. Beweis Setze w = max{|y|, |z|}; nach Satz 3.3 gibt es dann ein N ∈ N mit w < N, und damit ist −N < y < x < N. Ferner gibt es nach Satz 3.4 ein n ∈ N \ {0} mit 1/n < z − y. Sei nun m = 2Nn + 1 und für k = 1, . . . , m sei xk = −N + (k − 1)/n. Dann ist x1 = −N < y, z < N = xm und für 1 ≤ k < m ist xk+1 − xk = n−1 < z − y. Folglich gibt es nach Lemma 2.3 ein k mit y < xk < z. Aber xj ∈ Q für jedes j und daher gibt es ein x ∈ Q mit y < x < z. Eine nichtleere Teilmenge I von R heißt Intervall, wenn gilt: Sind a, b ∈ I mit a < b, so ist x ∈ I für jedes x ∈ R mit a < x < b. Offensichtlich ist R selbst ein Intervall sowie die einpunktige Menge {a} für jedes a ∈ R. Weitere Beispiele für Intervalle sind: Für a, b ∈ R mit a < b: [a, b] = {x ∈ R : a ≤ x ≤ b}, (a, b) = {x ∈ R : a < x < b}, (a, b] = {x ∈ R : a < x ≤ b}, [a, b) = {x ∈ R : a ≤ x < b}. Für a, b ∈ R: [a, +∞) = {x ∈ R : a ≤ x}, (a, +∞) = {x ∈ R : a < x}, (−∞, b] = {x ∈ R : x ≤ b}, (−∞, b) = {x ∈ R : x < b}. In der Tat gibt es dann keine weiteren Beispiele: 3 Der Körper der reellen Zahlen 25 Satz 3.7 Sei I ⊂ R ein Intervall, das mehr als einen Punkt enthält. (1) Ist I weder nach unten noch nach oben beschränkt, so ist I = R. (2) Ist I nach unten, aber nicht nach oben beschränkt, dann gibt es a ∈ R, so dass I = [a, +∞) oder I = (a, +∞). (3) Ist I nach oben, aber nicht nach unten beschränkt, dann gibt es b ∈ R, so dass I = (−∞, b] oder I = (−∞, b). (4) Ist I beschränkt, dann gibt es a, b ∈ R mit a < b, so dass I eines der vier Intervalle [a, b], (a, b), (a, b] und [a, b) ist. Beweis Übung. Es ist oft nützlich, R durch das Hinzufügen der zwei Symbolen −∞ und +∞ zu ergänzen. Die Menge R ∪ {−∞, +∞} heißt dann erweiterte Zahlengerade und wird mit R̄ bezeichnet. Die Relation < wird zu einer Relation < auf R̄ erweitert: Per Definition gilt −∞ < x < +∞ für jedes x ∈ R. Die anderen Relationen ≤, > und ≥ werden dann entsprechend erweitert. Genauso wie für Teilmengen von R wird auch das Supremum und das Infimum für Teilmengen von R̄ definiert. Satz 3.8 Sei D eine nichtleere Teilmenge von R̄. (1) Dann besitzt D ein Supremum sup(D) und ein Infimum inf(D). (2) Ist +∞ ∈ D, so gilt sup(D) = +∞. (3) Ist +∞ ∈ / D, so gilt sup(D) = +∞ genau dann, wenn es zu jedem z ∈ R ein x ∈ D mit x > z gibt, d.h., wenn D keine obere Schranke in R besitzt. (4) Es gilt sup(D) = −∞ genau dann, wenn D = {−∞}. (5) Ist −∞ ∈ D, so gilt inf(D) = −∞. (6) Ist −∞ ∈ / D, so gilt inf(D) = −∞ genau dann, wenn es zu jedem z ∈ R ein x ∈ D mit z < x gibt, d.h., wenn D keine untere Schranke in R besitzt. (7) Es gilt inf(D) = +∞ genau dann, wenn D = {+∞}. (8) Für jedes x ∈ D gilt inf(D) ≤ x ≤ sup(D). (9) Ist D ′ eine Teilmenge von R̄ mit D ⊂ D ′ , so ist sup(D) ≤ sup(D ′ ) und auch inf(D ′ ) ≤ inf(D). Beweis Übung. 4 Der Körper der komplexen Zahlen Sind K und F Körper, so heißt F Unterkörper von K, wenn K Körpererweiterung von F ist. Für jedes x ∈ R ist x2 ≥ 0; daher gibt es keine reelle Zahl x mit x2 = −1. Sei K eine Körpererweiterung von R, die ein Element i enthält, für das i2 = −1 gilt; insbesondere ist dann i ∈ / R. Sei L = {z ∈ K : es gibt x, y ∈ R mit z = x + iy} ; da x = x + i0 und i = 0 + i1, ist R ⊂ L und i ∈ L. Jedes Element in L hat eine eindeutige Darstellung der Form x + iy mit x, y ∈ R: Sind x, y, x′ , y ′ ∈ R mit x + iy = x′ + iy ′ , so ist zunächst y = y ′ , sonst wäre i = (x′ − x)/(y − y ′) ein Element von R, und wenn y = y ′, so ist auch x − x′ = i(y ′ − y) = 0, d.h. x = x′ . Lemma 4.1 (1) L ist Unterkörper von K und damit eine Körpererweiterung von R, die i enthält. (2) Ist M ein Unterkörper von K, der eine Körpererweiterung von R ist und i enthält, so ist L ⊂ M. Damit ist L die kleinste Körpererweiterung von R in K, die i enthält. Beweis (1) Seien z, z ′ ∈ L; dann gibt es x, y, x′ , y ′ ∈ R, so dass z = x + iy und z ′ = x′ + iy ′ , und folglich sind z + z ′ = (x + iy) + (x′ + iy ′ ) = (x + x′ ) + i(y + y ′) , zz ′ = (x + iy)(x′ + iy ′) = (xx′ − yy ′) + i(xy ′ + x′ y) und −z = −(x + iy) = −x + i(−y) alle Elemente von L. Ist ferner z 6= 0, so ist σ = x2 + y 2 > 0, und in diesem Fall ist x σ +i x2 y 2 xy yx −y (x + iy) = +i =1, + − σ σ σ σ σ d.h. z −1 = (x/σ) + i(−y/σ) ist ein Element von L. (2) Dies ist klar. Betrachte nun eine weitere Körpererweiterung K ′ von R, die ein Element j enthält, für das j 2 = −1 gilt, und sei L′ = {z ∈ K ′ : es gibt x, y ∈ R mit z = x + jy} ; nach Lemma 4.1 ist L′ die kleinste Körpererweiterung von R in K ′ , die j enthält. 26 4 Der Körper der komplexen Zahlen 27 Lemma 4.2 Es gibt einen eindeutigen Körperisomorphismus ψ : L → L′ , so dass ψ(x) = x für alle x ∈ R und ψ(i) = j. Beweis Ist ψ : L → L′ ein Körperhomomorphismus mit ψ(x) = x für alle x ∈ R und ψ(i) = j, so ist ψ(x+ iy) = x+ jy für alle x, y ∈ R. Da aber jedes Element in L eine eindeutige Darstellung der Form x + iy mit x, y ∈ R hat, kann umgekehrt eine Abbildung ψ : L → L′ definiert werden durch ψ(x + iy) = x + jy für alle x, y ∈ R. Man sieht leicht, dass diese Abbildung ψ ein Körperisomorphismus mit ψ(x) = x für alle x ∈ R und ψ(i) = j ist. Gibt es eine minimale Körpererweiterung von R, die ein Element i enthält, für das i2 = −1 gilt, so ist nach Lemma 4.2 diese Erweiterung im Wesentlichen eindeutig. Und in der Tat gibt es eine solche Erweiterung: Sei C = R2 = {(x, y) : x, y ∈ R}, definiere eine Addition + : C × C → C durch (x, y) + (x′ , y ′) = (x + x′ , y + y ′) und eine Multiplikation · : C × C → C durch (x, y)(x′ , y ′) = (xx′ − yy ′, xy ′ + yx′ ) . Dann ist (C, +, ·, 0, 1) ein Körper, wobei 0 = (0, 0) und 1 = (1, 0): Es wird als Übungsaufgabe überlassen zu zeigen, dass die Addition und Multiplikation assoziativ und kommutativ sind und dass das distributative Gesetz gilt. Das Element (0, 0) (bzw. das Element (1, 0)) ist die Null (bzw. die Eins) in C, da (0, 0) + (x, y) = (0 + x, 0 + y) = (x, y) und (1, 0)(x, y) = (1x − 0y, 1y + 0x) = (x, y) für jedes (x, y) ∈ C. Ferner ist −(x, y) = (−x, −y) für jedes (x, y) ∈ C. Ist (x, y) ∈ C mit (x, y) 6= (0, 0), so ist σ = x2 + y 2 > 0 und x2 y 2 xy yx y = (1, 0) , , − (x, y) = + , − σ σ σ σ σ σ x d.h. (x/σ, −y/σ) = (x, y)−1 . Nun wird R mit der Teilmenge R × {0} = {(x, 0) : x ∈ R} von C identifiziert. Etwas genauer: Für jedes x ∈ R wird das Element x mit dem Element (x, 0) ∈ C identifiziert. Diese Identifizierung von R und R × {0} ⊂ C ist verträglich mit den Additionen und Multiplikationen in R und C, da (x, 0) + (x′ , 0) = (x + x′ , 0) und (x, 0)(x′ , 0) = (xx′ , 0) für alle x, x ∈ R. Auf diese Weise kann R als Unterkörper von C angesehen werden. Mit anderen Worten, C wird als Körpererweiterung von R angesehen. 4 Der Körper der komplexen Zahlen 28 Setze nun i = (0, 1); dann ist (0, 1)(0, 1) = (−1, 0) = −(1, 0), d.h. i2 = −1. Damit ist C eine Körpererweiterung von R, die ein Element i enthält, für das i2 = −1 gilt. Ferner ist C eine minimale solche Erweiterung: Ist z = (x, y) ∈ C, so ist (x, y) = (x, 0) + (0, y) = (x, 0) + (0, 1)(y, 0) und damit hat z = (x, y) ∈ C die (eindeutige) Darstellung x + iy. In der Praxis wird diese Darstellung ständig verwendet: Es wird also meistens x + iy statt (x, y) geschreiben. Das Element i = (0, 1) in C heißt imaginäre Einheit. Sei z = x+iy ∈ C mit x, y ∈ R; dann heißt x (bzw. y) Realteil (bzw. Imaginärteil ) von z und wird mit Re z (bzw. mit Im z) bezeichnet. Ferner heißt x − iy die zu z konjugierte komplexe Zahl und sie wird mit z bezeichnet. Man sieht sofort, dass die folgenden Rechenregeln gelten: (1) Re z = (z + z)/2 und Im z = (z − z)/2i für alle z ∈ C. (2) z = z für alle z ∈ C. (3) z = z genau dann, wenn z ∈ R. (4) z + w = z + w und zw = z w für alle z, w ∈ C. (5) Für z = x + iy (mit x, y ∈ R) ist zz = x2 + y 2. Sei z ∈ C; nach √ (5) ist zz eine nichtnegative reelle Zahl und ihre (nichtnegative) Quadratwurzel zz wird mit |z| bezeichnet und heißt der Betrag von z. Also ist p |z| = (Re z)2 + (Im z)2 . Diese Bezeichnung stimmt mit dem auf R definierten Betrag, da für x ∈ R ist x , falls x ≥ 0, |x| = −x , falls x < 0. Satz 4.1 Folgende Rechenregeln gelten für den Betrag: (1) |zw| = |z||w| für alle z, w ∈ C. (2) | Re z| ≤ |z|, | Im z| ≤ |z| und |z| = |z| für alle z ∈ C. (3) |z| = 0 genau dann, wenn z = 0. (4) |z + w| ≤ |z| + |w| für alle z, w ∈ C (Dreiecksungleichung). (5) ||z| − |w|| ≤ |z − w| für alle z, w ∈ C (Umgekehrte Dreiecksungleichung). 4 Der Körper der komplexen Zahlen √ 29 √ √ zzww = zz ww = |z||w|. p 2 und daraus ergibt (2) Sei z = x + iy ∈√C mitp x, y ∈ R; dann ist |z| = px2 + yp 2 2 2 2 2 2 sich, dass p | Re z| = xp ≤ x + y = |z|, | Im z| = y ≤ x + y = |z| und |z| = x2 + (−y)2 = x2 + y 2 = |z|. Beweis (1) Für alle z, w ∈ C ist |zw| = zwzw = √ (3) Dies ist klar: Für alle x, y ∈ R ist x2 + y 2 = 0 genau dann, wenn x = y = 0. (4) Für jedes ζ ∈ C ist ζ + ζ = 2 Re ζ; folglich gilt nach (1) und (2), dass |z + w|2 = (z + w)(z + w) = (z + w)(z + w) = zz + zw + zw + ww = |z|2 + 2 Re(zw) + |w|2 ≤ |z|2 + 2|zw| + |w|2 = |z|2 + 2|z||w| + |w|2 = (|z| + |w|)2 , und damit ist |z + w| ≤ |z| + |w|. (5) Nach (4) gilt |z| = |z − w + w| ≤ |z − w| + |w| und damit |z| − |w| ≤ |z − w|, und genauso gilt −(|z| − |w|) = |w| − |z| ≤ |w − z| = |z − w|. Daraus ergibt sich, dass ||z| − |w|| ≤ |z − w|. Eine Teilmenge D von C heißt beschränkt, wenn es ein B ∈ R mit B ≥ 0 gibt, so dass |z| ≤ B für alle z ∈ D. Lemma 4.3 Eine Teilmenge D von C ist genau dann beschränkt, wenn Re(D) und Im(D) beschränkte Teilmengen von R sind. Beweis Sei D beschränkt; dann gibt es ein B ∈ R mit B ≥ 0, so dass |z| ≤ B für alle z ∈ D. Nach Satz 4.1 (2) ist also | Re z| ≤ B und | Im z| ≤ B für alle z ∈ D, und damit sind Re(D) und Im(D) beschränkt. Sind umgekehrt Re(D) und Im(D) beschränkte Teilmengen von R, dann gibt es B1 , B2 ∈ R mit B1 ≥ 0 und B2 ≥ 0, so p dass | Re z| ≤ B1 und | Im z| ≤ B2 für alle z ∈ D. Daraus ergibt sich, dass |z| ≤ B12 + B22 für alle z ∈ D, d.h., D ist eine beschränkte Teilmenge von C. 5 Folgen Ab jetzt bezeichnet K entweder den Körper R oder den Körper C. Genauer bedeutet dies: K wird in denjenigen Situationen verwendet, in denen die Ersetzung von K sowohl durch R als auch durch C einen Sinn macht. Unter einer Folge aus einer Menge X versteht man eine Abbildung ̺ : {n ∈ N : n ≥ p} → X für ein p ∈ N. Jedem n ≥ p ist also ein Element xn = ̺(n) ∈ X zugeordnet und man schreibt hierfür meistens {xn }n≥p statt ̺. Sei {xn }n≥p eine Folge aus K. Die Folge heißt konvergent gegen x ∈ K, falls es zu jedem ε > 0 ein N ≥ p gibt, so dass |xn − x| < ε für alle n ≥ N. Bemerkung: Bei einem Ausdruck wie ‘ε > 0’ oder ‘N ≥ p’ muss es aus dem Kontext entnommen werden, dass ‘ε ∈ R mit ε > 0’ bzw. ‘N ∈ N mit N ≥ p’ gemeint ist. Lemma 5.1 Sei {xn }n≥p eine Folge aus K und sei q ≥ p. Dann konvergiert die Folge {xn }n≥p gegen x ∈ K genau, wenn die Folge {xn }n≥q gegen x konvergiert. Beweis Dies ist klar. Lemma 5.2 Sei {xn }n≥p eine Folge aus K und seien x, x′ ∈ K. Konvergiert {xn }n≥p gegen x und gegen x′ , so ist x′ = x. Beweis Sei ε > 0; da {xn }n≥p gegen x und gegen x′ konvergiert, gibt es N, N ′ ≥ p, so dass |xn − x| < ε/2 für alle n ≥ N und |xn − x′ | < ε/2 für alle n ≥ N ′ . Für M = max{N, N ′ } ist dann |x − x′ | = |x − xM + xM − x′ | ≤ |x − xM | + |xM − x′ | < ε/2 + ε/2 = ε , und dies zeigt, dass |x − x′ | < ε für alle ε > 0. Damit ist x′ = x. Konvergiert eine Folge {xn }n≥p aus K gegen x, so nennt man x den Grenzwert oder den Limes der Folge und schreibt limn→∞ xn = x. Nach Lemma 5.2 macht diese Schreibweise einen Sinn. Ferner gibt es nach Lemma 5.1 auch kein Problem mit dieser Schreibweise, wenn die Folgen {xn }n≥p und {xn }n≥q (für ein q ≥ p) gleichzeitig behandelt werden. Wichtige Beispiele: (1) Die Folge {1/n}n≥1 konvergiert gegen 0: limn→∞ 1/n = 0. (Sei ε > 0; nach Satz 3.3 gibt es ein N ≥ 1, so dass N > ε−1 , und für alle n ≥ N ist dann |1/n − 0| = 1/n ≤ 1/N < ε; dies zeigt, dass limn→∞ 1/n = 0.) (2) Für jedes x ∈ K mit |x| < 1 konvergiert die Folge {xn }n≥0 der Potenzen von x gegen 0: limn→∞ xn = 0. (Dies ist wie in (1), aber mit Hilfe von Satz 3.5 (2).) 30 5 Folgen 31 Satz 5.1 Sei {zn }n≥p eine Folge komplexer Zahlen und z ∈ C. (1) Die Folge {zn }n≥p konvergiert gegen z genau dann, wenn die Folge {Re zn }n≥p gegen Re z und die Folge {Im zn }n≥p gegen Im z konvergiert. (2) Die Folge {zn }n≥p konvergiert gegen z genau dann, wenn die Folge {z n }n≥p gegen z konvergiert. Beweis (1) Nehme zunächst an, dass die Folge {zn }n≥p gegen z konvergiert, und sei ε > 0. Dann gibt es N ≥ p, so dass |zn − z| < ε für alle n ≥ N. Daraus folgt nach Satz 4.1 (2), dass sowohl | Re zn − Re z| = | Re(zn − z)| ≤ |zn − z| < ε als auch | Im zn − Im z| = | Im(zn − z)| ≤ |zn − z| < ε für alle n ≥ N, und dies zeigt, dass {Re zn }n≥p gegen Re z und {Im zn }n≥p gegen Im z konvergiert. Nehme umgekehrt an, dass {Re zn }n≥p gegen Re z und {Im zn }n≥p gegen Im z konvergiert, und sei ε > 0. Dann gibt es N1 , N2 ≥ p, so dass | Re zn − Re z| < ε/2 für alle n ≥ N1 und | Im zn −Im z| < ε/2 für alle n ≥ N2 . Setze N = max{N1 , N2 }; für alle n ≥ N ist dann |zn − z| = | Re zn + i Im zn − Re z − i Im z| = | Re zn − Re z + i(Im zn − Im z)| ≤ | Re zn − Re z| + |i(Im zn − Im z)| = | Re zn − Re z| + |i|| Im zn − Im z| = | Re zn − Re z| + | Im zn − Im z| < ε/2 + ε/2 = ε , und dies zeigt, dass {zn }n≥p gegen z konvergiert. (2) Dies folgt unmittelbar aus der Tatsache, dass |z n − z| = |zn − z|. Sei {xn }n≥p eine Folge reeller Zahlen. Da R ⊂ C, kann {xn }n≥p auch als Folge komplexer Zahlen angesehen werden. Es gibt also zwei mögliche Konvergenzbegriffe (Konvergenz in R und Konvergenz in C), die hier angewendet werden können, die aber übereinstimmen: Aus Satz 5.1 (1) folgt, dass die Folge genau dann in C konvergiert, wenn sie in R konvergiert. Ist {xn }n≥p eine Folge aus K, so ist {|xn |}n≥p eine Folge reeller Zahlen. Satz 5.2 Sei {x n }n≥p eine konvergente Folge aus K. Dann konvergiert die Folge {|xn |}n≥p und lim xn = lim |xn |. n→∞ n→∞ Beweis Sei x = limn→∞ xn und ε > 0. Dann gibt es N ≥ p, so dass |xn − x| < ε für alle n ≥ p, und daraus folgt nach Satz 2.3 (4) (bzw. nach Satz 4.1 (5)), dass auch ||xn | − |x|| ≤ |xn − x| < ε für alle n ≥ p, und dies zeigt, dass die Folge {|xn |}n≥p gegen |x| konvergiert. 5 Folgen 32 Satz 5.3 Seien {yn }n≥p und {xn }n≥p zwei konvergente Folgen reeller Zahlen mit yn ≤ xn für alle n ≥ p. Dann gilt lim yn ≤ lim xn . n→∞ n→∞ Beweis Setze x = limn→∞ xn und y = limn→∞ yn . Sei ε > 0; dann gibt es N, N ′ ≥ p, so dass |xn − x| < ε/2 für alle n ≥ N und |yn − y| < ε/2 für alle n ≥ N ′ . Für M = max{N, N ′ } ist dann y − x ≤ y − yM + xM − x ≤ |y − yM + xM − x| ≤ |y − yM | + |xM − x| < ε/2 + ε/2 = ε , und dies zeigt, dass y − x < ε für alle ε > 0. Damit ist y − x ≤ 0, d.h. y ≤ x. Wichtiger Spezialfall von Satz 5.3: Ist {xn }n≥p eine konvergente Folge reeller Zahlen mit xn ≥ 0 für alle n ≥ p, so ist limn→∞ xn ≥ 0 (da die Folge {yn }n≥p mit yn = 0 für alle n ≥ p offensichtlich gegen 0 konvergiert). Sei {xn }n≥p eine Folge aus K. Für m ≥ p wird die Teilmenge von K {x ∈ K : es gibt n ≥ m, so dass x = xn } kurz mit {xn : n ≥ m} bezeichnet. Die Folge {xn }n≥p heißt beschränkt, wenn {xn : n ≥ p} eine beschränkte Teilmenge von K ist. Also ist {xn }n≥p beschränkt genau dann, wenn es ein B ∈ R mit B ≥ 0 gibt, so dass |xn | ≤ B für alle n ≥ p. Satz 5.4 Jede konvergente Folge aus K ist beschränkt. Beweis Sei {xn }n≥p eine konvergente Folge mit Grenzwert x. Dann gibt es N ≥ p, so dass |xn − x| < 1 für alle n ≥ N, und folglich ist |xn | ≤ 1 + |x| für alle n ≥ N. Sei c = 1 + |x| + |xp | + |xp+1 | + · · · + |xN −1 |; dann ist |xn | ≤ c für alle n ≥ p und damit ist die Folge {xn }n≥p beschränkt. Sei {xn }n≥p eine konvergente Folge aus K mit |xn | ≤ c für alle n ≥ p. Dann folgt aus Satz 5.2 und Satz 5.3, dass limn→∞ xn ≤ c. Satz 5.5 Seien {xn }n≥p und {yn }n≥p zwei konvergente Folgen aus K. (1) Dann konvergiert auch die Summenfolge {xn + yn }n≥p , und es gilt lim (xn + yn ) = lim xn + lim yn . n→∞ n→∞ n→∞ (2) Ebenso konvergiert die Produktfolge {xn yn }n≥p , und es gilt lim xn yn = lim xn · lim yn . n→∞ n→∞ n→∞ 5 Folgen 33 Beweis Setze x = limn→∞ xn und y = limn→∞ yn . (1) Sei ε > 0; dann gibt es N, N ′ ≥ p, so dass |xn − x| < ε/2 für alle n ≥ N und |yn − y| < ε/2 für alle n ≥ N ′ . Sei M = max{N, N ′ }; für alle n ≥ M ist dann |(xn + yn ) − (x + y)| = |(xn − x) + (yn − y)| ≤ |xn − x| + |yn − y| < ε/2 + ε/2 = ε und dies zeigt, dass die Summenfolge {xn + yn }n≥p gegen x + y konvergiert. (2) Nach Satz 5.4 ist die Folge {xn }n≥p beschränkt; es gibt also c > 0, so dass |xn | ≤ c für alle n ≥ p. Setze b = c + |y| (und also ist b > 0). Sei ε > 0; dann gibt es N, N ′ ≥ p, so dass |xn − x| < ε/b für alle n ≥ N und |yn − y| < ε/b für alle n ≥ N ′ . Sei M = max{N, N ′ }; für alle n ≥ M ist dann |xn yn − xy| = |xn (yn − y) + (xn − x)y| ≤ |xn (yn − y)| + |(xn − x)y| = |xn ||yn − y| + |y||xn − x| ≤ c|yn − y| + |y||xn − x| < cε/b + |y|ε/b = ε , und dies zeigt, dass die Produktfolge {xn yn }n≥p gegen xy konvergiert. Lemma 5.3 Sei {xn }n≥p eine konvergente Folge aus K mit limn→∞ xn = x 6= 0. Dann gibt es ein q ≥ p, so dass xn 6= 0 für alle n ≥ q. Beweis Sei ε = |x|/2 (und damit ist ε > 0). Es gibt also q ≥ p, so dass |xn −x| < ε für alle n ≥ q, und daraus folgt, dass 2ε = |x| = |x − xn + xn | ≤ |x − xn | + |xn | < ε + |xn | und insbesondere ist |xn | > ε > 0 für alle q ≥ p. Ist {xn }n≥p eine konvergente Folge reeller Zahlen mit limn→∞ xn = x, so zeigt der Beweis für Lemma 5.3 tatsächlich folgendes: Ist x > 0 (bzw. ist x < 0), dann gibt es ein q ≥ p, so dass xn > 0 für alle n ≥ q (bzw. so dass xn < 0 für alle n ≥ q). Satz 5.6 Sei {xn }n≥p eine konvergente Folge aus K mit xn 6= 0 für alle n ≥ p und limn→∞ xn 6= 0. Dann konvergiert die Inversefolge {x−1 n }n≥p , und −1 lim x−1 . n = lim xn n→∞ n→∞ Beweis Sei x = limn→∞ xn . Wie im Beweis für Lemma 5.3 gibt es ein q ≥ p, so dass |xn | ≥ |x|/2 für alle n ≥ q; setze b = 2/|x|2 . Sei nun ε > 0; dann gibt es M ≥ p, so dass |xn − x| < ε/b für alle n ≥ M. Sei N = max{M, q}; für alle n ≥ N ist dann 1 1 xn − x |xn − x| 2 1 ≤ |xn − x| = b|xn − x| < bε/b = ε , − = = xn x xn x |xn ||x| |x| |x| 5 Folgen 34 −1 und dies zeigt, dass die Inversefolge {x−1 konvergiert. n }n≥p gegen x Sei {xn }n≥p eine Folge aus K und sei nq < nq+1 < · · · eine aufsteigende Folge natürlicher Zahlen mit p ≤ nq . Dann heißt die Folge {xnk }k≥q (d.h. die Folge {yk }k≥q mit yk = xnk für alle k ≥ q) Teilfolge der Folge {xn }n≥p . Bemerkung: Ist nq < nq+1 < · · · eine aufsteigende Folge natürlicher Zahlen mit p ≤ nq , so ist nq+m ≥ p + m für alle m ∈ N. Sei {xn }n≥p eine Folge und sei q ≥ p. Dann ist die Folge {xn }n≥q sowie jede ihrer Teilfolgen eine Teilfolge von {xn }n≥p . Satz 5.7 Sei {xn }n≥p eine konvergente Folge aus K mit limn→∞ xn = x. Dann konvergiert jede Teilfolge – auch gegen x. Beweis Sei {xnk }k≥q Teilfolge von {xn }n≥p und sei ε > 0. Da die Folge {xn }n≥p gegen x konvergiert, gibt es dann ein M ≥ p, so dass |xn − x| < ε für alle n ≥ M. Sei N = M − p + q; für jedes k ≥ N ist dann nk ≥ nN = nM −p+q ≥ M und damit ist |xnk − x| < ε. Folglich konvergiert die Teilfolge {xnk }k≥q gegen x. Eine Folge {xn }n≥p reeller Zahlen heißt monoton wachsend, falls xn ≤ xn+1 für alle n ≥ p, streng monoton wachsend, falls xn < xn+1 für alle n ≥ p, monoton fallend, falls xn+1 ≤ xn für alle n ≥ p, streng monoton fallend, falls xn+1 < xn für alle n ≥ p und monoton, falls sie monoton wachsend oder monoton fallend ist. Es ist klar, dass eine monoton wachsende (bzw. ein monoton fallende) Folge {xn }n≥p reeller Zahlen genau dann beschränkt ist, wenn {xn : n ≥ p} nach oben (bzw. nach unten) beschränkt ist. Satz 5.8 Jede beschränkte monotone Folge {xn }n≥p reeller Zahlen konvergiert mit dem Grenzwert sup({xn : n ≥ p}) (bzw. inf({xn : n ≥ p})), falls {xn }n≥p monoton wachsend (bzw. monoton fallend) ist. Beweis Sei {xn }n≥p eine beschränkte monoton wachsende Folge reeller Zahlen und sei A = {xn : n ≥ p}. Dann ist A eine nichtleere nach oben beschränkte Teilmenge von R und damit existiert das Supremum x = sup(A). Sei ε > 0; dann gibt es y ∈ A mit y > x − ε, sonst wäre x − ε eine obere Schranke von A, es gibt also N ≥ p mit xN = y > x − ε. Aber dann ist x − ε < xn ≤ xn ≤ x < x + ε für alle n ≥ N, da die Folge {xn }n≥p monoton wachsend ist und x eine obere Schranke von A ist. Mit anderen Worten: Für alle n ≥ N ist |xn − x| < ε, und dies zeigt, dass die Folge {xn }n≥p gegen x konvergiert. Der Beweis für eine beschränkte monoton fallende Folge geht natürlich analog. 5 Folgen 35 Ist {xn }n≥p eine nicht beschränkte monoton wachsende (bzw. monoton fallende) Folge reeller Zahlen, so ist es nützlich limn→∞ xn = +∞ (bzw. limn→∞ xn = −∞) zu setzen; nach Satz 5.8 gilt also lim xn = sup({xn : n ≥ p}) n→∞ für jede monoton wachsende Folge {xn }n≥p und lim xn = inf({xn : n ≥ p}) n→∞ für jede monoton fallende Folge {xn }n≥p reeller Zahlen. Satz 5.9 Jede Folge reeller Zahlen besitzt eine monotone Teilfolge. Beweis Sei {xn }n≥p eine Folge reeller Zahlen; in diesem Beweis wird ein Index m ≥ p kritisch genannt, wenn xn ≤ xm für alle p ≤ n ≤ m und xn < xm für alle n > m. Es ist ist klar, dass es höchstens einen Index mit diesen Eigenschaften gibt, im allgemeinen aber braucht er nicht zu existieren. Das folgende Lemma wird benötigt: Lemma 5.4 (1) Eine Folge reeller Zahlen, die keinen kritischen Index hat, besitzt eine monoton wachsende Teilfolge. (2) Sei {xn }n≥p ein Folge reeller Zahlen und sei q ≥ p. Besitzt die Folge {xn }n≥q eine monoton wachsende Teilfolge, so besitzt die Folge {xn }n≥p ebenso eine. (3) Sei {xn }n≥p ein Folge reeller Zahlen und sei q ≥ p. Hat die Folge {xn }n≥q keinen kritischen Index, so besitzt die Folge {xn }n≥p eine monoton wachsende Teilfolge. Beweis (1) ist eine Übung, (2) ist klar, und (3) folgt aus (1) und (2). Nun zum Beweis für Satz 5.9: Sei {xn }n≥p ein Folge reeller Zahlen und nehme an, dass diese Folge keine monoton wachsende Teilfolge besitzt. Es wird gezeigt, dass dann {xn }n≥p eine streng monoton fallende Teilfolge besitzt. Nach Lemma 5.3 (3) hat die Folge {xn }n≥q einen kritischen Index für jedes q ≥ p. Folglich gibt es eine aufsteigende Folge n0 < n1 < · · · natürlicher Zahlen mit n0 dem kritischen Index der Folge {xn }n≥p und mit nk+1 dem kritischen Index der Folge {xn }n≥nk +1 für jedes k ∈ N. Aber xnk+1 < xnk für jedes k ∈ N (da nk+1 > nk ), und damit ist {xnk }k≥0 eine streng monoton fallende Teilfolge von {xn }n≥p . Dies zeigt: Entweder besitzt {xn }n≥p eine monoton wachsende oder eine streng monoton fallende Teilfolge; insbesondere besitzt {xn }n≥p eine monotone Teilfolge. 5 Folgen 36 Lemma 5.5 Jede beschränkte Folge reeller Zahlen besitzt eine konvergente Teilfolge. Beweis Jede Folge reeller Zahlen besitzt eine monotone Teilfolge (Satz 5.9). Ist die Folge beschränkt, so ist auch diese Teilfolge beschränkt und damit konvergiert sie nach Satz 5.8. Satz 5.10 (Bolzano-Weierstraß) Jede beschränkte Folge aus K besitzt eine konvergente Teilfolge. Beweis Nach Lemma 5.4 bleibt nur der Fall mit K = C; sei also {zn }n≥p eine beschränkte Folge komplexer Zahlen. Für jedes n ≥ p sei xn = Re zn ; nach Satz 4.1 (2) ist {xn }n≥p eine beschränkte Folge reeller Zahlen, die dann nach Lemma 5.4 eine konvergente Teilfolge {xnk }k≥q besitzt. Setze yk = Im znk für jedes k ≥ q; nach Satz 4.1 (2) ist {yk }k≥q eine beschränkte Folge reeller Zahlen, die dann wieder nach Lemma 5.4 eine konvergente Teilfolge {ykj }j≥r besitzt. Setze mj = nkj für jedes j ≥ r; dann ist {xmj }j≥r eine Teilfolge von {xnk }k≥q und somit konvergent. Nun ist ykj = Im zmj für jedes j ≥ r und folglich konvergieren die Folgen {Re zmj }j≥r und {Im zmj }j≥r . Nach Satz 5.1 (1) konvergiert also die Folge {zmj }j≥r , d.h. die Folge {zn }n≥p besitzt die konvergente Teilfolge {zmj }j≥r . Eine Folge {xn }n≥p aus K heißt Cauchy-Folge, wenn es zu jedem ε > 0 ein N ≥ p gibt, so dass |xm − xn | < ε für alle m, n ≥ N. Lemma 5.6 Jede Cauchy-Folge aus K ist beschränkt. Beweis (Dies ist sehr ähnlich zu dem Beweis für Satz 5.4) Sei {xn }n≥p eine Cauchy-Folge. Dann gibt es N ≥ p, so dass |xm − xn | < 1 für alle m, n ≥ N, und folglich ist |xn | ≤ 1 + |xN | für alle n ≥ N. Sei c = 1 + |xp | + · · · + |xN |; dann ist |xn | ≤ c für alle n ≥ p und damit ist die Folge {xn }n≥p beschränkt. Lemma 5.7 Besitzt eine Cauchy-Folge aus K eine konvergente Teilfolge, so ist sie selbst konvergent. Beweis Sei {xnk }k≥q eine Teilfolge einer Cauchy-Folge {xn }n≥p und nehme an, dass {xnk }k≥q gegen x konvergiert. Sei ε > 0; dann gibt es N ≥ q, so dass |xnk − x| < ε/2 für alle k ≥ N und N ′ ≥ p, so dass |xm − xn | < ε/2 für alle m, n ≥ N ′ . Wähle r ≥ N, so dass nr ≥ N ′ und setze M = nr ; dann ist |xn − x| = |xn − xM + xM − x| ≤ |xn − xM | + |xM − x| = |xn − xM | + |xnr − x| < ε/2 + ε/2 = ε für alle n ≥ M und dies zeigt, dass auch {xn }n≥p gegen x konvergiert. 5 Folgen 37 Satz 5.11 Eine Folge aus K konvergiert genau dann, wenn sie eine Cauchy-Folge ist. Beweis Sei {xn }n≥p eine konvergente Folge mit limn→∞ xn = x. Sei ε > 0; es gibt also N ≥ p, so dass |xn − x| < ε/2 für alle n ≥ N. Für alle n, m ≥ N ist dann |xm − xn | = |xm − x + x − xn | ≤ |xm − x| + |x − xn | < ε/2 + ε/2 = ε und dies zeigt, dass {xn }n≥p eine Cauchy-Folge ist. Die Umkehrung folgt direkt aus Lemma 5.5, Lemma 5.6 und Satz 5.10. Sei nun {xn }n≥p eine nach oben beschränkte Folge reeller Zahlen. Für n ≥ p sei x↑n = sup({xm : m ≥ n}); folglich ist {x↑n }n≥p eine monoton fallende Folge reeller Zahlen, da {xn : n ≥ m + 1} ⊂ {xn : n ≥ m} für jedes m ≥ p. Setze x↑ = lim x↑n , n→∞ somit ist x↑ ∈ R ∪ {−∞}. Diese ‘Zahl’ x↑ heißt Limes superior der Folge {xn }n≥p und wird mit lim supn→∞ xn bezeichnet. Ist die Folge nicht nach oben beschränkt, so setzt man lim supn→∞ xn = +∞. Analog wird der Limes inferior definiert. Zunächst sei {xn }n≥p eine nach unten beschränkte Folge reeller Zahlen. Für jedes n ≥ p sei x↓n = inf({xm : m ≥ n}); also ist {x↓n }n≥p eine monoton wachsende Folge reeller Zahlen, da für jedes m ≥ p gilt {xn : n ≥ m} ⊂ {xn : n ≥ m + 1}. Setze x↓ = lim x↓n , n→∞ somit ist x↓ ∈ R ∪ {+∞}. Diese ‘Zahl’ x↓ heißt Limes inferior der Folge {xn }n≥p und wird mit lim inf n→∞ xn bezeichnet. Ist die Folge nicht nach unten beschränkt, so setzt man lim inf n→∞ xn = −∞. Satz 5.12 Für jede Folge {xn }n≥p reeller Zahlen gilt lim inf xn ≤ lim sup xn . n→∞ n→∞ Beweis Dies ist klar, wenn lim inf n→∞ xn = −∞ oder lim supn→∞ xn = +∞. Es kann also angenommen werden, dass die Folge {xn }n≥p beschränkt ist. Aber nach Lemma 3.7 ist x↓n = inf({xm : m ≥ n}) ≤ sup({xm : m ≥ n}) = x↑n für jedes n ≥ p. Damit ist die monoton wachsende Folge {x↓n }n≥p nach oben und die monoton fallende Folge {x↑n }n≥p nach unten beschränkt, und folglich ist lim inf xn = lim x↓n ≤ lim x↑n = lim sup xn . n→∞ n→∞ n→∞ n→∞ 5 Folgen 38 Lemma 5.8 Sei {xn }n≥p eine Folge reeller Zahlen und sei x ∈ R. (1) Es gilt lim supn→∞ xn ≤ x genau dann, wenn die Menge {n ≥ p : xn > x + ε} endlich ist für jedes ε > 0. (2) Es gilt lim supn→∞ xn ≥ x genau dann, wenn die Menge {n ≥ p : xn > x − ε} unendlich ist für jedes ε > 0. (3) Es gilt lim inf n→∞ xn ≥ x genau dann, wenn die Menge {n ≥ p : xn < x − ε} endlich ist für jedes ε > 0. (4) Es gilt lim inf n→∞ xn ≤ x genau dann, wenn die Menge {n ≥ p : xn < x + ε} unendlich ist für jedes ε > 0. Beweis (1) Dies ist trivial richtig, wenn die Folge {xn }n≥p nicht nach oben beschränkt ist, da in diesem Fall die Menge {n ≥ p : xn > y} unendlich ist für jedes y ∈ R und lim supn→∞ xn = +∞. Es kann also angenommen werden, dass {xn }n≥p nach oben beschränkt ist. In diesem Fall gilt lim supn→∞ xn ≤ x genau dann, wenn es zu jedem ε > 0 ein n ≥ p mit sup({xm : m ≥ n}) ≤ x + ε gibt, (da die Folge {x↑n }n≥p monoton fallend ist). Aber sup({xm : m ≥ n}) ≤ x + ε gilt genau dann, wenn xm ≤ x + ε für alle m ≥ n. Daraus ergibt sich, dass lim supn→∞ xn ≤ x genau dann gilt, wenn es zu jedem ε > 0 ein n ≥ p gibt mit xm ≤ x + ε für alle m ≥ n, d.h. genau dann, wenn für jedes ε > 0 die Menge {n ≥ p : xn > x + ε} endlich ist. (2) Es kann wieder angenommen werden, dass {xn }n≥p nach oben beschränkt ist. In diesem Fall gilt lim supn→∞ xn ≥ x genau dann, wenn sup({xm : m ≥ n}) ≥ x für alle n ≥ p und nach Lemma 3.5 (2) gilt dies genau dann, wenn es zu jedem ε > 0 und jedem n ≥ p ein m ≥ n mit xm > x − ε gibt, d.h. genau dann, wenn für jedes ε > 0 die Menge {n ≥ p : xn > x − ε} unendlich ist. (3) und (4): Wie (1) und (2). Satz 5.13 Sei {xn }n≥p eine Folge reeller Zahlen und sei x ∈ R. (1) Es gilt lim supn→∞ xn = x genau dann, wenn die Menge {n ≥ p : xn > x + ε} endlich und die Menge {n ≥ p : xn > x − ε} unendlich ist für jedes ε > 0. (2) Es gilt lim inf n→∞ xn = x genau dann, wenn die Menge {n ≥ p : xn < x − ε} endlich und die Menge {n ≥ p : xn < x + ε} unendlich ist für jedes ε > 0. Beweis Dies folgt unmittelbar aus Lemma 5.7. Satz 5.14 Eine Folge {xn }n≥p reeller Zahlen konvergiert gegen eine Zahl x ∈ R genau dann, wenn lim inf xn = x = lim sup xn . n→∞ Beweis Übung. n→∞ 6 Unendliche Reihen Sei {xn }n≥p eine Folge aus K und für jedes n ≥ p sei sn = n X xk k=p (= xp + xp+1 + · · · + xn ) . Dann heißt die Folge {sn }n≥p dieser P Partialsummen (unendliche) Reihe mit den bezeichnet. Konvergiert die Reihe Gliedern xn , n ≥ p, und wird mit ∞ n=p xn P P ∞ ∞ x , so wird ihr Grenzwert ebenfalls mit n=p xn bezeichnet und heißt dann n=p n Summe der Reihe. P n Wichtiges Beispiel: Die geometrische Reihe ∞ n=0 x konvergiert mit der Summe ∞ X n=0 xn = (1 − x)−1 P für jedes x ∈ K mit |x| < 1. (Sei x 6= 1 fest und für jedes n ≥ 0 sei sn = nk=0 xk ; dann ist sn = (1 − x)−1 (1 − xn+1 ) und damit |sn − (1 − x)−1 | = |1 − x|−1 |x|n+1 . Daraus folgt, dass {sn }n≥0 gegen (1 − x)−1 konvergiert, falls |x| < 1. P∞die Folge D.h.: die Reihe n=0 xn konvergiert mit der Summe (1 − x)−1 , wenn |x| < 1.) Lemma 6.1 und sei q ≥ p. Dann konvergiert P∞Sei {xn }n≥p eine Folge aus KP ∞ die Reihe Konvergieren n=p xn genau, wenn die Reihe n=q xn konvergiert. P∞ P ∞ x = x̄ + diese Reihen, so gilt für ihre Summen, dass n=q xn , wobei n=p n x̄ = xp + xp+1 + · · · + xq−1 . P P Beweis Für jedes n ≥ p sei sn = nk=p xk und für jedes n ≥ q sei s′n = nk=q xk . Dann gilt sn = x̄+s′n für jedes n ≥ q, und daraus folgt, dass die Folge {sn }n≥q genau dann konvergiert, wenn die Folge {s′n }n≥q konvergiert. Aber nach Lemma 5.1 konvergiert die Folge P∞die Folge {sn }n≥p konvergiert. P∞{sn }n≥q genau dann, wenn Damit konvergiert n=p xn genau dann, wenn n=q xn konvergiert. Konvergieren diese Reihen, so ergibt sich aus Lemma 5.1, dass ∞ X xn = lim sn = x̄ + lim s′n = x̄ + n→∞ n=p n→∞ ∞ X xn . n=q Lemma 6.2 Ist {zn }n≥p eine Folge komplexer Zahlen, P∞ P∞ so konvergiert P∞die Reihe n=p zn genau dann, wenn die (reellen) Reihen n=p (Re zn ) und n=p (Im zn ) konvergieren, und in diesem Fall ist ∞ X n=p zn = ∞ X (Re zn ) + i n=p ∞ X n=p 39 (Im zn ) . 6 Unendliche Reihen Beweis Setze sn = n ≥ p. Dann gilt sn = n X k=p zk = n X 40 Pn k=p zk , tn = Pn k=p (Re zk ) und un = (Re zk ) + i(Im zk ) = k=p n X (Re zk ) + i k=p Pn n X k=p (Im zk ) für jedes (Im zk ) = tn + iun , k=p d.h., tn =P Re sn und un = Im sn . Daraus ergibt sich nach Satz P∞ 5.1 (1), dass ∞ z genau dann konvergiert, wenn die Reihen die Reihe n=p (Re zn ) und n=p n P∞ n=p (Im zn ) konvergieren. Außerdem gilt in diesem Fall, dass ∞ X n=p ∞ ∞ X X zn = lim sn = lim tn + i lim un = (Re zn ) + i (Im zn ) . n→∞ n→∞ n→∞ n=p n=p Satz 6.1 Sei {xn }n≥p eine P Folge reeller Zahlen mit xn ≥ 0 für alle n ≥ p. Dann konvergiert die Reihe ∞ n=p xn genau, wenn die Folge der Partialsummen nach Pn oben beschränkt ist, d.h., genau dann, wenn es ein M ≥ 0 gibt, so dass k=p xk ≤ M für alle n ≥ p. Beweis Für jedes n ≥ p sei sn = sn+1 = n+1 X k=p Pn k=p xk . Dann ist xk = xn+1 + n X k=p xk ≥ n X xk = sn k=p für jedes n ≥ p, die Folge {sn }n≥p ist also monoton wachsend. Daraus ergibt sich nach Satz 5.4 und Satz 5.8, dass die Folge {sn }n≥p genau dann konvergiert, wenn sie nach oben beschränkt ist, (da eine monoton wachsende Folge genau dann beschränkt P∞ ist, wenn sie nach oben beschränkt ist). Mit anderen Worten: Die Reihe n=p xn konvergiert genau dann, wenn es ein M ≥ 0 gibt, so dass P n k=p xk ≤ M für alle n ≥ p. P∞ nicht, da für jedes Nach Satz 6.1 konvergiert die harmonische Reihe n=1 1/n P∞ P2p p ≥ 0 gilt n=1 1/n ≥ p/2. Dagegen konvergiert die Reihe n=1 1/n2 , da n n n X X X 1 1 1 1 1 = 1+ 1− ≤2 ≤1+ =1+ − k2 k(k − 1) k−1 k n k=1 k=2 k=2 für alle n > 1. Im Folgenden sei {xn }n≥p eine Folge aus K. Satz P∞ 6.2 (Das Cauchysche Konvergenz-Kriterium) Die unendliche Reihe xn konvergiert genau dann, wenn es zu jedem ε > 0 ein N ≥ p gibt, so n=p P dass | nk=m xk | < ε für alle n ≥ m ≥ N. 6 Unendliche Reihen 41 Pn Beweis Für jedes n ≥ p sei s = n k=p xk . Nehme zunächst an, dass die Reihe P∞ x konvergiert. Dann konvergiert die Folge {sn }n≥p und nach Satz 5.11 n=p n ist also {sn }n≥p eine Cauchy-Folge. Sei ε > 0; dann gibt es M ≥ p, so dass |sn − sm | < ε für alle n > m ≥ M. Setze N = PM + 1; für alle n ≥ m ≥ N ist n > m − 1 ≥ M und daraus ergibt sich, dass | nk=m xk | = |sn − sm−1 | < ε. Nehme umgekehrt Pnan, dass diese Bedingung erfüllt ist. Sei ε > 0; dann gibt es N ≥ p, so dass P | k=m xk | < ε für alle n ≥ m ≥ N. Für alle n > m ≥ N ist dann |sn − sm | = nk=m+1 xk < ε,P und dies zeigt, dass {sn }n≥p eine Cauchy-Folge ist. Damit konvergiert die Reihe ∞ n=p xn nach Satz 5.11. Satz 6.3 Für jede konvergente Reihe gegen 0. P∞ n=p xn konvergiert die Folge {xn }n≥p P Beweis Sei ε > 0; nach Satz 6.2 gibt es dann N ≥ p, so dass | nk=m xk | < ε für alle n ≥ m ≥ N. Daraus ergibt sich (mit m = n), dass |xn | < ε für alle n ≥ N. Dies zeigt, dass die Folge {xn }n≥p gegen 0 konvergiert. Satz 6.4 Sei {cn }n≥p P eine Folge reeller Zahlen mit |xn | ≤ cn P für alle n ≥ p. ∞ Konvergiert die Reihe n=p cn (in R), so konvergiert die Reihe ∞ n=p xn und es P P ∞ ∞ gilt n=p xn ≤ n=p cn . P P∞ P∞ ∞ Insbesondere konvergiert n=p xn mit n=p xn ≤ n=p |xn |, falls die Reihe P∞ n=p |xn | in R konvergiert. P P BeweisPFür jedes n ≥ p sei sn = nk=p xk und s∗n = nk=p ck . Sei ε > 0; da die ∗ Reihe ∞ n=p cn konvergiert (d.h. die Folge {sn }n≥p konvergiert), ist nach Satz 5.11 ∗ {sn }n≥p eine Cauchy-Folge, und folglich gibt es N ≥ p, so dass |s∗n − s∗m | < ε für alle n > m ≥ N. Für alle n > m ≥ N ist dann n n n X X X ck = |s∗n − s∗m | < ε , |xk | ≤ xk ≤ |sn − sm | = k=m+1 k=m+1 k=m+1 und dies zeigt, dass die Folge {sn }n≥p eine Cauchy-Folge und damit nach Satz 5.11 P x konvergiert. Ferner ist eine konvergente Folge ist, d.h. die Reihe ∞ n=p n n n n X X X |sn | = xk ≤ |xk | ≤ ck = s∗n k=p k=p k=p für alle n ≥ p, und daraus folgt nach Satz 5.2 und Satz 5.3, dass ∞ ∞ X X ∗ cn . xn = | lim sn | = lim |sn | ≤ lim sn = n=p n→∞ n→∞ n→∞ n=p 6 Unendliche Reihen 42 Die letzte Aussage folgt nun mit cn = |xn |. P P∞ Die Reihe ∞ n=p xn heißt absolut konvergent, falls die Reihe n=p |xn | konvergiert (in R). Die letzte Aussage in Satz 6.4 sagt also, dass eine absolut konvergente Reihe auch im gewöhnlichen Sinn konvergiert. P n Insbesondere konvergiert die geometrische Reihe ∞ n=0 x absolut für jedes x ∈ K mit |x| < 1. Lemma q ≥ p. Dann konvergiert die P 6.3 Sei {xn }n≥p eine Folge aus K und Psei ∞ Reihe ∞ x absolut genau, wenn die Reihe n=p n n=q xn absolut konvergiert. Beweis Dies folgt unmittelbar aus Lemma 6.1. Lemma 6.4 Ist {zn }n≥p eine Folge komplexer Zahlen, P∞die Reihe P∞ so konvergiert P∞ (Re z ) und z absolut genau dann, wenn die Reihen n n=p (Im zn ) n=p n=p n absolut konvergieren. Beweis Dies folgt aus Satz 6.4, da | Re zn | ≤ |zn |, | Im zn | ≤ |zn | und |zn | = für alle n ≥ p. p | Re zn |2 + | Im zn |2 ≤ | Re zn | + | Im zn | Nun werden einige Konvergenz-Kriterien für Reihen betrachtet. Im Folgenden sei wieder {xn }n≥p eine Folge aus K. Satz 6.5 (Majoranten-Kriterium) Sei {cn }n≥p eine Folge reeller Zahlen mit |xn | ≤P cn (und insbesondere ist dann cn ≥ 0) P für alle n ≥ p. Konvergiert die ∞ c (in R), so konvergiert die Reihe Reihe ∞ n=p n n=p xn absolut und ∞ ∞ X X xn ≤ cn . n=p n=p Beweis Dies ist lediglich eine Umformulierung von Satz 6.4. Satz 6.6 (Quotienten-Kriterium) Nehme an, dass xn 6= 0 für alle n ≥ p und dass es ein θ ∈ R mit 0 < P θ < 1 gibt, so dass |xn+1 |/|xn | ≤ θ für alle n ≥ p. Dann konvergiert die Reihe ∞ n=p xn absolut. 6 Unendliche Reihen 43 Beweis Für alle n ≥ p ist |xn+1 | ≤ θ|xn |, und daraus ergibt sich mit vollständiger n Induktion, dass |xn | ≤ MθP für alle n ≥ p, wobei M = θ−p |xp |. Nach P Satz 6.5 ∞ n konvergiert also die Reihe P n=p xn absolut, da die geometrische Reihe ∞ n=0 θ ∞ n und damit auch die Reihe n=p Mθ absolut konvergiert. Satz 6.7 (Wurzelkriterium) Sei α = lim sup (1) Ist α < 1, so (2) Ist α > 1, so p n |xn | (also gilt 0 ≤ α ≤ n→∞ P konvergiert die Reihe ∞ n=p xn absolut. P∞ divergiert die Reihe n=p xn (d.h. die Reihe konvergiert +∞). nicht). Beweis (1) Wähle βpmit α < β < 1; da α < β, gibt es nach Lemma 5.7 (1) n ein q ≥ p, so dass P |xn | ≤ β und damit |xn | ≤ β n für alle n ≥ q. Aber die ∞ geometrische Reihe n=qP β n kovergiert, weil β < 1, und daraus ergibt sich nach ∞ Satz 6.5, dass P∞ die Reihe n=q xn absolut konvergiert. Folglich konvergiert auch die Reihe n=p xn absolut. p (2) Da α > 1, ist nach Lemma 5.7 (2) die Menge {n ≥ p : n |xn | ≥ 1} und damit auch die Menge {n ≥ p : |xn | ≥ 1} unendlich, und folglich konvergiert die P∞Folge {xn }n≥p nicht gegen 0. Daraus ergibt sich nach Satz 6.3, dass die Reihe n=p xn divergiert. Satz 6.8 (Leibnizsches Kriterium) Sei {xn }n≥p eine monoton fallende Folge reeller Zahlen, die gegen 0 konvergiert (insbesondere xn ≥ 0 für alle P ist also n (−1) x n ≥ p). Dann konvergiert die alternierende Reihe ∞ n. n=p Beweis Für n ≥ p sei sn = Pn k k=p (−1) xk . Für jedes n ≥ p ist dann s2n+2 = s2n − x2n+1 + x2n+2 ≤ s2n und s2n+3 = s2n+1 − x2n+2 + x2n+3 ≥ s2n+1 . Damit ist die Folge {s2n }n≥p monoton fallend und die Folge {s2n+1 }n≥p monoton wachsend. Ferner ergibt sich daraus, dass s2p+1 ≤ s2n+1 = s2n −x2n+1 ≤ s2n ≤ s2p , und insbesondere ist dann s2n ≥ s2p+1 und s2n+1 ≤ s2p für alle n ≥ p. Die Folgen {s2n }n≥p und {s2n+1 }n≥p sind also monoton und beschränkt und daher nach Satz 5.8 konvergent. Setze s = limn→∞ s2n und s′ = limn→∞ s2n+1 ; nach Satz 5.5 (1) ist s′ − s = lim s2n+1 − lim s2n = lim (s2n+1 − s2n ) = lim x2n+1 = 0 , n→∞ n→∞ n→∞ n→∞ d.h., s′ = s. Sei nun ε > 0; dann gibt es N, N ′ ≥ p, so dass |s − s2m | < ε für alle m ≥ N und |s′ − s2m+1 | < ε für alle m ≥ N ′ ; setze M = max{2N, 2N ′ + 1}. Sei 6 Unendliche Reihen 44 n ≥ M; ist n gerade, so ist m = 2n mit m ≥ N, ist dagegen n ungerade, so ist m = 2n + 1 mit m ≥ N ′ ; in beiden Fällen P∞ist alson |s − sn | < ε. Dies zeigt, dass die Folge {sn }n≥p und damit die Reihe n=p (−1) xn konvergiert. Nun muss das sogenannte Cauchy-Produkt von Reihen behandelt werden. Dies wird zum Beweis der Funktionalgleichung der Exponentialfunktion gebraucht. Im Folgenden seien {xn }n≥0 und {yn }n≥0 Folgen aus K. P P∞ Satz 6.9 Nehme an, dieP Reihen ∞ absolut und n=0 xn und n=0 yn konvergieren P∞ n für jedes n ∈ N sei cn = k=0 xk yn−k . Dann konvergiert n=0 cn absolut und ∞ X cn = n=0 P∞ (Die Reihe n=0 cn ∞ X n=0 xn ∞ X n=0 yn . heißt das Cauchy-Produkt der Reihen Beweis P Für jedes n ∈ NPsetze sn = s∗n = nk=0 |xk | und t∗n = nk=0 |yk |. Pn k=0 xk , tn = P∞ n=0 Pn xn und k=0 yk , P∞ un = n=0 yn .) Pn k=0 ck , Lemma 6.5 Seien m, n ≥ 1 mit n ≥ 2m. Dann gilt |un − sn tn | ≤ |s∗n t∗n − s∗m t∗m |. Beweis Setze Qn = {(p, q) ∈ N2 : p ≤ n, q ≤ n}, Dn = {(p, q) ∈ N2 : p + q ≤ n} für jedes n ∈ N. Dann sieht man leicht, dass X X xp yq . xp yq und sn tn = un = (p,q)∈Qn (p,q)∈Dn Seien m, n ≥ 1 mit n ≥ 2m. Dann gilt Qm ⊂ Dn ⊂ Qn und daraus folgt, dass X X xp yq xp yq − |un − sn tn | = (p,q)∈Qn (p,q)∈Dn = X (p,q)∈Qn \Dn = X (p,q)∈Qn Setze nun s = ∞ P xp yq ≤ |xp ||yq | − (p,q)∈Qn \Dn X (p,q)∈Qm xn und t = n=0 Lemma 6.6 Die Reihe X ∞ P |xp ||yq | ≤ |xp ||yq | = s∗n t∗n X (p,q)∈Qn \Qm |xp ||yq | − s∗m t∗m = |s∗n t∗n − s∗m t∗m | . yn . n=0 ∞ P n=0 cn konvergiert mit der Summe st. 6 Unendliche Reihen 45 P P∞ Beweis Da die Reihen ∞ x und n n=0 n=0 yn absolut konvergieren, konvergieren die Folgen {s∗n }n≥0 und {t∗n }n≥0 . Damit konvergiert nach Satz 5.5 (2) auch die Folge {s∗n t∗n }n≥0 und folglich ist nach Satz 5.11 {s∗n t∗n }n≥0 eine Cauchy-Folge. Sei nun ε > 0; es gibt also ein N ∈ N, so dass |s∗n t∗n − s∗m t∗m | < ε für alle m, n ≥ N. Nach Lemma 6.5 ist |un − sn tn | ≤ |s∗n t∗n − s∗N t∗N | < ε für alle n ≥ 2N, und dies zeigt, dass limn→∞ (un − sn tn ) = 0. Aber s = limn→∞ sn und t = limn→∞ tn und damit nach Satz 5.5 (2) auch st = limn→∞ sn tn , und daraus ergibt sich, dass die Folge {un }n≥0 konvergiert und lim un = lim (un − sn tn ) + lim sn tn = 0 + st = st . n→∞ n→∞ n→∞ P∞ konvergiert mit der Summe st. P Nach Lemma 6.6 nur zu zeigen, dass die Reihe ∞ n=0 cn absolut konvergiert. P Pbleibt ∞ ∞ Da die Reihen n=0 |xn | und n=0 |yn | absolut konvergieren, kann Lemma P∞ 6.6∗ auf diese Reihen angewendet werden, und daraus folgt, dass die Reihe n=0 cn Pn ∗ konvergiert, wobei cn = k=0 |xk ||yn−k |. Aber für jedes n ≥ 0 gilt Mit anderen Worten: Die Reihe n=0 cn n n X X |xk ||yn−k | = c∗ xk yn−k ≤ |cn | = n k=0 und damit konvergiert ∞ P k=0 cn absolut nach Satz 6.5. n=0 Als nächstes wird die Exponentialreihe behandelt. Satz 6.10 Für jedes x ∈ K konvergiert die Reihe ∞ P xn /n! absolut. n=0 Beweis Sei x ∈ K fest und wähle p ∈ N mit p ≥ 2|x|. Für jedes n ≥ p ist dann n+1 n n x = |x| x ≤ 1 x (n + 1)! n + 1 n! 2 n! P n und daraus ergibt sich nach Satz 6.6 (mit θ = 1/2), dass die Reihe P∞ n=p x /n! ∞ n absolut konvergiert. Nach Lemma 6.3 konvergiert dann die Reihe n=0 x /n! absolut. P P∞ n n Die Reihe ∞ n=0 x /n! wird Exponentialreihe genannt und die Summe n=0 x /n! mit exp(x) bezeichnet. Insbesondere ist exp(0) = Die Zahl exp(1) wird meistens P1. ∞ mit e bezeichnet (Eulersche Zahl ); es gilt e = n=0 1/n! = 2, 71828 . . .. Da exp(x) für jedes x ∈ K erklärt ist, gibt es die Exponentialfunktion x 7→ exp(x) als Abbildung von K nach K. 6 Unendliche Reihen 46 Satz 6.11 (Funktionalgleichung der Exponentialfunktion) Es gilt exp(x + y) = exp(x) exp(y) für alle x, y ∈ K. n Beweis Seien yn = y n /n! und n = x /n!, P Pn x, y ∈ K fest und für jedes n ≥ 0 seiPx∞ konvergieren n=0 xn und ∞ sei cn = k=0 xk yn−k . Nach Satz 6.10 P n=0 yn absolut ∞ und daraus folgt nach Satz 6.9, dass n=0 cn absolut konvergiert und ∞ X ∞ X cn = n=0 n=0 xn ∞ X yn = exp(x) exp(y) . n=0 Nach dem binomischen Lehrsatz gilt aber, dass cn = und damit ist n n X 1 k 1 1 X 1 1 n! x y n−k = xk y n−k k! (n − k)! n! k! (n − k)! k=0 k=0 n X 1 1 n k n−k = x y = (x + y)n , n! k=0 k n! ∞ P n=0 cn = ∞ P (x + y)n /n! = exp(x + y). n=0 Mit vollständiger Induktion folgt unmittelbar aus Satz 6.11, dass exp n X k=1 xk = n Y exp(xk ) k=1 für alle x1 , . . . , xn ∈ K, n ≥ 1. Das folgende Ergebnis beschäftigt sich mit der Exponentialfunktion im Komplexen. Satz 6.12 (1) Für alle z ∈ C ist exp(z) 6= 0 und exp(−z) = exp(z)−1 . (2) Es gilt exp(z) = exp(z) für jedes z ∈ C. (3) Für alle z, ξ ∈ C gilt | exp(z + ξ) − exp(z)| ≤ |ξ| exp(|ξ|) exp(|z|). (4) Für alle z, ξ ∈ C mit ξ 6= 0 gilt |ξ| exp(z + ξ) − exp(z) − exp(z) ≤ exp(|ξ|) exp(|z|) . ξ 2 6 Unendliche Reihen 47 Beweis (1) Nach Satz 6.11 ist exp(z) exp(−z) = exp(z − z) = exp(0) = 1; damit ist exp(z) 6= 0 und exp(−z) = exp(z)−1 . P P (2) Für jedes n ≥ 0 sei sn = nk=0 z k /k! und s′n = nk=0 z k /k! und folglich ist exp(z) = limn→∞ sn und exp(z) = limn→∞ s′n . Aber für jedes n ≥ 0 ist s′n = sn und daraus ergibt sich nach Satz 5.1 (2), dass exp(z) = exp(z). (3) und (4): Übungen. Folgende Ergebnisse beschäftigen sich mit der Exponentialfunktion im Reellen. Lemma 6.7 Für alle x ∈ R mit x > 0 gilt exp(x) ≥ 1 + x. Beweis Sei x ∈ R mit x > 0; für jedes m ≥ 2 ist dann m m X X 1 n 1 n x =1+x+ x ≥1+x, n! n! n=0 n=2 Pm n und damit ist nach Satz 5.3 exp(x) = lim n=0 x /n! ≥ 1 + x. m→∞ Satz 6.13 (1) exp(x) > 0 für alle x ∈ R. (2) exp(x) > exp(y), falls x, y ∈ R mit x > y. (3) exp(n) = en für alle n ∈ N. (4) limx→∞ exp(x) = ∞: Zu jedem N > 0 gibt es ein M > 0, so dass exp(x) > N für alle x ∈ R mit x > M. (5) limx→−∞ exp(x) = 0: Zu jedem ε > 0 gibt es ein M > 0, so dass exp(x) < ε für alle x ∈ R mit x < −M. Beweis (1) Falls x ≥ 0, so ist nach Lemma 6.7 exp(x) ≥ 1 + x > 0. Ist dagegen x < 0, so ist −x > 0 und damit exp(−x) ≥ 1; nach Satz 6.12 (1) ist dann auch exp(x) = exp(−x)−1 > 0. (2) Sei x > y; dann ist nach Satz 6.11 exp(x) = exp(y+x−y) = exp(y) exp(x−y). Aber nach (1) ist exp(y) > 0 und nach Lemma 6.7 ist exp(x − y) ≥ 1 + x − y > 1. Damit ist exp(x) > exp(y). P Q Q n (3) Nach Satz 6.11 ist exp(n) = exp 1 = nk=1 exp(1) = nk=1 e = en . k=1 (4) Sei N > 0; nach Lemma 6.7 ist e = exp(1) ≥ 2 > 1 und damit gibt es nach Satz 3.6 (1) ein n ∈ N, so dass en > N. Daraus ergibt sich nach (2) und (3), dass exp(x) > exp(n) = en > N für alle x ∈ R mit x > n. (5) Sei ε > 0; nach (4) gibt es dann M > 0, so dass exp(y) > ε−1 für alle y > M, und daraus folgt nach Satz 6.12 (1), dass exp(−y) = exp(y)−1 < (ε−1 )−1 = ε für alle y > M, d.h., exp(x) < ε für alle x ∈ R mit x < −M. 7 Stetige Funktionen Die Wörter Funktion und Abbildung sind Synonyme, wobei das Letztere hier bevorzugt wird. Sind X und Y Mengen, so wird die Menge aller Abbildungen von X nach Y mit Abb(X, Y ) bezeichnet. (Oft wird diese Menge mit Y X bezeichnet.) Sei nun X eine nichtleere Menge und K ein Körper. Für f, g ∈ Abb(X, K) und λ ∈ K definiere Elemente f + g, f g und λf von Abb(X, K) durch (f + g)(x) = f (x) + g(x), (f g)(x) = f (x) · g(x) und (λf )(x) = λf (x) für jedes x ∈ X. Dies liefert dann die Verknüpfungen + : Abb(X, K) × Abb(X, K) → Abb(X, K) mit (f, g) 7→ f + g , × : Abb(X, K) × Abb(X, K) → Abb(X, K) mit (f, g) 7→ f g , · : K × Abb(X, K) → Abb(X, K) mit (λ, f ) 7→ λf . Lemma 7.1 (1) Mit den Verknüpfungen + und · ist Abb(X, K) ein Vektorraum über K. Die Nullabbildung 0 : X → K (mit 0(x) = 0 für alle x ∈ X) ist die Null in Abb(X, K); zu jedem f ∈ Abb(X, K) ist −f ∈ Abb(X, K) durch (−f )(x) = −f (x) für alle x ∈ X gegeben. (2) Mit den Verknüpfungen + und × ist Abb(X, K) ein kommutativer Ring mit Eins. Die Einsabbildung 1 : X → K (mit 1(x) = 1 für alle x ∈ X) ist die Eins in Abb(X, K). (3) In dem kommutativen Ring Abb(X, K) ist ein Element f invertierbar genau dann, wenn f (x) 6= 0 für alle x ∈ X, und in diesem Fall ist die Inverse f −1 die Abbildung, die durch f −1 (x) = (f (x))−1 für alle x ∈ X gegeben ist. Beweis Dies ist klar. Für den Rest des Kapitels sei K′ entweder R oder C und sei D stets eine nichtleere Teilmenge von K′ . Abbildungen von D nach K werden hier untersucht. Es gibt also eigentlich die vier verschiedenen Fälle: (1) Reelle Abbildungen definiert auf einer Teilmenge von R. (2) Reelle Abbildungen definiert auf einer Teilmenge von C. (3) Komplexe Abbildungen definiert auf einer Teilmenge von R. (4) Komplexe Abbildungen definiert auf einer Teilmenge von C. In einem gewissen Sinne aber ist alles unter dem vierten Fall subsumiert: Jede Abbildung von einer Menge X nach R kann auch als Abbildung von X nach C angesehen werden; ferner ist jede Teilmenge E von R auch Teilmenge von C. 48 7 Stetige Funktionen 49 Sei f : D → K eine Abbildung. Dann heißt f an einer Stelle x ∈ D stetig, wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass |f (y) − f (x)| < ε für alle y ∈ D mit |y − x| < δ. Sei f : D → R eine Abbildung. Da f auch als Abbildung von D nach C angesehen werden kann, gibt es zwei mögliche Stetigkeitsbegriffe (Stetigkeit mit K = R und Stetigkeit mit K = C), die hier angewendet werden können, die aber übereinstimmen: Die Stetigkeit von g an einer Stelle x ∈ D hängt nicht davon ab, ob man K = R oder K = C nimmt (da der Betrag | · | in R die Einschränkung vom Betrag | · | in C ist). Sei nun E eine nichtleere Teilmenge von R und g : E → K eine Abbildung. Da E auch als Teilmenge von C angesehen werden kann, gibt es wieder zwei mögliche Stetigkeitsbegriffe (Stetigkeit mit K′ = R und Stetigkeit mit K′ = C), die hier angewendet werden kann. Wieder stimmen sie aber überein: Die Stetigkeit von g an einer Stelle x ∈ E hängt nicht davon ab, ob man K′ = R oder K′ = C nimmt. Eine Abbildung f : D → K heißt stetig, wenn sie an jeder Stelle x ∈ D stetig ist. Sei idK : K → K die durch idK (x) = x definierte Identitätsabbildung, und für jedes a ∈ K′ sei conaK : K → K′ die durch conaK (x) = a definierte konstante Abbildung. Es ist klar, dass diese Abbildungen alle stetig sind. Die Abbildung | · | : K → R ist stetig: Sei x ∈ K; zu jedem ε > 0 gilt ||y| − |x|| < ε für alle y ∈ K mit |y − x| < ε (da ||y| − |x|| ≤ |y − x|), und dies zeigt, dass | · | an der Stelle x stetig ist. Satz 7.1 Die Exponentialfunktion exp : K → K ist stetig. Beweis Sei z ∈ K und ε > 0; setze η = exp(−1 − |z|)ε und sei δ = min{η, 1}. Für alle w ∈ K mit |w − z| < δ ist dann nach Satz 6.12 (3) | exp(w) − exp(z)| ≤ |w − z| exp(|w − z|) exp(|z|) ≤ |w − z| exp(1 + |z|) < η exp(1 + |z|) = ε , und dies zeigt, dass exp an der Stelle z stetig ist. Ist f : D → C, so gibt es dann die Abbildungen f : D → C, Re f : D → R und Im f : D → R, die gegeben sind durch f (x) = f (x), (Re f )(x) = Re(f (x)) und (Im f )(x) = Im(f (x)) für alle x ∈ D. Satz 7.2 Sei f : D → C eine Abbildung und x ∈ D. Dann sind äquivalent: (1) f ist an der Stelle x stetig. (2) Re f und Im f sind beide an der Stelle x stetig. (3) f ist an der Stelle x stetig. 7 Stetige Funktionen 50 Beweis Übung. Lemma 7.2 Sei f : D → K eine Abbildung und E eine nichtleere Teilmenge von D. Ist f an der Stelle x ∈ E stetig, so ist auch die Einschränkung fE von f auf E. (Die Einschränkung fE : E → K ist die durch fE (x) = f (x) für alle x ∈ E definierte Abbildung.) Beweis Sei ε > 0; da f an der Stelle x stetig ist, gibt es ein δ > 0, so dass |f (y) − f (x)| < ε für alle y ∈ D mit |y − x| < δ. Insbesondere ist dann |fE (y) − fE (x)| = |f (y) − f (x)| < ε für alle y ∈ E mit |y − x| < δ, und dies zeigt, dass fE an der Stelle x stetig ist. Satz 7.3 Sei f : D → K eine Abbildung und x ∈ D. Dann sind äquivalent: (1) f ist an der Stelle x stetig. (2) Die Folge {f (xn )}n≥p konvergiert gegen f (x) für jede Folge {xn }n≥p aus D, die gegen x konvergiert. Beweis Nehme zunächst an, dass f an der Stelle x stetig ist, und sei {xn }n≥p eine Folge aus D, die gegen x konvergiert. Sei ε > 0; dann gibt es ein δ > 0, so dass |f (y) − f (x)| < ε für alle y ∈ D mit |y − x| < δ. Da {xn }n≥p gegen x konvergiert, gibt es also ein N ≥ p, so dass |xn − x| < δ für alle n ≥ N. Daraus folgt, dass |f (xn ) −f (x)| < ε für alle n ≥ N, und dies zeigt, dass die Folge {f (xn )}n≥p gegen f (x) konvergiert. Nehme umgekehrt an, dass f an der Stelle x nicht stetig ist. Dann gibt es ein ε > 0, so dass zu jedem δ > 0 ein y ∈ D existiert mit |y − x| < δ aber mit |f (y) − f (x)| ≥ ε. Insbesondere bedeutet dies, dass es für jedes n ≥ 1 ein xn ∈ D gibt mit |xn − x| < n1 aber |f (xn ) − f (x)| ≥ ε. Dann ist {xn }n≥1 eine Folge aus D, die offensichtlich gegen x konvergiert, aber die Folge {f (xn )}n≥1 kann nicht gegen f (x) konvergieren, da |f (xn ) − f (x)| ≥ ε für alle n ≥ 1. Lemma 7.3 Sei f : D → K eine Abbildung, die an der Stelle x ∈ D stetig ist. Dann gibt es δ > 0 und c ≥ 0, so dass |f (y)| ≤ c für alle y ∈ D mit |y − x| < δ. Beweis Da f an der Stelle x stetig ist, gibt es δ > 0, so dass |f (y) − f (x)| < 1 für alle y ∈ D mit |y − x| < δ. Sei c = 1 + |f (x)|; dann ist |f (y)| = |f (y) − f (x) + f (x)| ≤ |f (y) − f (x)| + |f (x)| ≤ 1 + |f (x)| = c für alle y ∈ D mit |y − x| < δ. 7 Stetige Funktionen 51 Satz 7.4 Seien f, g : D → K Abbildungen, die beide an der Stelle x ∈ D stetig sind. Dann sind die Abbildungen f + g, f g und λf (für jedes λ ∈ K) auch an der Stelle x stetig. Ist ferner f (y) 6= 0 für jedes y ∈ D, so ist die Abbildung f −1 an der Stelle x stetig. Beweis Dies folgt eigentlich unmittelbar aus Satz 7.3, Satz 5.5 und Satz 5.6. Dennoch werden Beweise für diese Behauptungen gegeben, die die Definition von Stetigkeit direkt verwenden. Die Abbildung f + g ist an der Stelle x stetig: Sei ε > 0; dann gibt es δ1 > 0, so dass |f (y) − f (x)| < ε/2 für alle y ∈ D mit |y − x| < δ1 , und genauso gibt es δ2 > 0, so dass |g(y) − g(x)| < ε/2 für alle y ∈ D mit |y − x| < δ2 . Sei δ = min{δ1 , δ2 }; für alle y ∈ D mit |y − x| < δ ist dann |(f (y) + g(y)) − (f (x) + g(x))| = |(f (y) − f (x)) + (g(y) − g(x))| ≤ |f (y) − f (x)| + |g(y) − g(x)| < ε/2 + ε/2 = ε , und dies zeigt, dass f + g an der Stelle x stetig ist. Die Abbildung f g ist an der Stelle x stetig: Nach Lemma 7.3 gibt es δ0 > 0 und c ≥ 0, so dass |f (y)| ≤ c für alle y ∈ D mit |y − x| < δ0 ; wähle b > c + |g(x)|. Sei ε > 0; dann gibt es δ1 > 0, so dass |f (y) − f (x)| < b−1 ε für alle y ∈ D mit |y − x| < δ1 , und genauso gibt es δ2 > 0, so dass |g(y) − g(x)| < b−1 ε für alle y ∈ D mit |y − x| < δ2 . Sei δ = min{δ0 , δ1 , δ2 }; dann ist |f (y)g(y) − f (x)g(x)| = |f (y)g(y) − f (y)g(x) + f (y)g(x) − f (x)g(x)| = f (y) g(y) − g(x) + f (y) − f (x) g(x) ≤ |f (y)||g(y) − g(x)| + |f (y) − f (x)||g(x)| ≤ cb−1 ε + b−1 ε|g(x)| < ε für alle y ∈ D mit |y − x| < δ und dies zeigt, dass f g an der Stelle x stetig ist. Für jedes λ ∈ R ist die Abbildung λf an der Stelle x stetig: Wähle b mit |λ| < b. Sei ε > 0; dann gibt es δ > 0, so dass |f (y) − f (x)| < b−1 ε für alle y ∈ D mit |y − x| < δ. Für alle y ∈ D mit |y − x| < δ ist dann |λf (y) − λf (x)| = |λ||f (y) − f (x)| ≤ |λ|b−1 ε < ε , und dies zeigt, dass λf an der Stelle x stetig ist. Schließlich nehme an, dass f (y) 6= 0 für alle y ∈ D. Dann ist die Abbildung f −1 an der Stelle x stetig: Setze η = |f (x)|/2. Zunächst gibt es ein δ0 > 0, so dass |f (y)−f (x)| < η und damit auch |f (y)| ≥ |f (x)|−|f (y)−f (x)| > η für alle y ∈ D mit |y − x| < δ0 . Sei nun ε > 0; dann gibt es δ1 > 0, so dass |f (y) − f (x)| < 2η 2 ε für alle y ∈ D mit |y − x| < δ1 . Sei δ = min{δ0 , δ1 }; dann ist −1 |f −1(y) − f −1 (x)| = |f (y)||f (x)| |f (y) − f (x)| −1 −1 ≤ 2η 2 |f (y) − f (x)| ≤ 2η 2 2η 2 ε = ε für alle y ∈ D mit |y − x| < δ, und daher ist f −1 an der Stelle x stetig. 7 Stetige Funktionen 52 Satz 7.5 Sei E eine nichtleere Teilmenge von K und seien f : D → K und g : E → K′′ Abbildungen mit f (D) ⊂ E, wobei K′′ auch entweder R oder C ist. Ist f an der Stelle x ∈ D und g an der Stelle f (x) ∈ E stetig, so ist die zusammengesetzte Abbildung g ◦ f : D → K′′ an der Stelle x stetig. Beweis Setze z = f (x). Sei ε > 0; da g an der Stelle z stetig ist, gibt es η > 0, so dass |g(w) − g(z)| < ε für alle w ∈ E mit |w − z| < η. Da nun f an der Stelle x stetig ist, gibt es δ > 0, so dass |f (y) − f (x)| < η für alle y ∈ D mit |y − x| < δ. Für alle y ∈ D mit |y − x| < δ ist dann |f (y) − z| = |f (y) − f (x)| < η, und f (y) ∈ E. Damit ist |g(f (y)) − g(z)| < ε, d.h. |g(f (y)) − g(f (x))| < ε. Daraus ergibt sich, dass g ◦ f an der Stelle x stetig ist. Seien f, g : D → R Abbildungen; dann können Abbildungen max{f, g} : D → R und min{f, g} : D → R definiert werden durch max{f, g}(x) = max{f (x), g(x)} , min{f, g}(x) = min{f (x), g(x)} . Sind f und g beide an der Stelle x ∈ D stetig, so sind auch max{f, g} und min{f, g}. Dies folgt aus Satz 7.4 undSatz 7.5, da max{f, g} = 21 (f +g)+|f −g| und min{f, g} = 12 (f + g) − |f − g| , und die Abbildung | · | : R → R stetig ist. Für jedes x ∈ D, r > 0 sei BD (x, r) = {y ∈ D : |y − x| < r} (offener Ball in D um x mit Radius r). Insbesondere ist BR (x, r) = (x − r, x + r) für alle x ∈ R, r > 0. Bemerkung: Ist D eine Teilmenge von R – und damit auch Teilmenge von C –, dann hängt die Definition von BD (x, r) nicht davon ab, ob man K = R oder K = C nimmt. Eine Teilmenge U von D heißt offen in D (oder offene Teilmenge von D), wenn es zu jedem x ∈ U ein ε > 0 gibt, so dass BD (x, ε) ⊂ U. Man sieht leicht, dass die Intervalle (a, b), (−∞, b) und (a, +∞) offene Teilmengen von R sind. Lemma 7.4 Für jedes x ∈ K, r > 0 ist BK (x, r) eine offene Teilmenge von K. Beweis Sei y ∈ BK (x, r); dann ist |y − x| < r und damit ist ε = r − |y − x| > 0. Für alle z ∈ BK (y, ε) ist dann nach der Dreiecksungleichung |z − x| = |z − y + y − x| ≤ |z − y| + |y − x| < ε + |y − x| = r , d.h. BK (y, ε) ⊂ BK (x, r) und dies zeigt, dass BK (x, r) offen in K ist. Insbesondere ist U eine offene Teilmenge von R, wenn es zu jedem x ∈ U ein ε > 0 gibt, so dass (x − ε, x + ε) ⊂ U. 7 Stetige Funktionen 53 Lemma 7.5 (1) Die leere Menge ∅ und die Menge D selbst sind offen in D. (2) Ist {Uα }α∈A S eine beliebige Familie von offenen Teilmengen von D, so ist ihre Vereinigung α∈A Uα offen in D. T (3) Sind U1 , . . . , Un (mit n ≥ 1) offen in D, so ist ihr Durchschnitt nk=1 Uk eine offene Teilmenge von D. Beweis (1) Dies ist klar. S (2) Setze U = α∈A Uα , und sei x ∈ U. Dann ist x ∈ Uα für ein α ∈ A und folglich gibt es ε > 0, so dass BD (x, ε) ⊂ Uα , da Uα offen in D ist. Damit ist BD (x, ε) ⊂ U, und dies zeigt, dass U offen in D ist. T (3) Setze U = nk=1 Uk , und sei x ∈ U. Für jedes k gibt es dann εk > 0, so dass BD (x, ε) ⊂ Uk da x ∈ Uk und T Sei ε = min{εk : 1 ≤ k ≤ n}; also T Uk offen in D ist. ist ε > 0 und BD (x, ε) = nk=1 BD (x, εk ) ⊂ nk=1 Uk = U, und dies zeigt, dass U offen in D ist. Satz 7.6 Eine Abbildung f : D → K ist genau dann stetig, wenn für jede offene Teilmenge U von K die Menge f −1 (U) offen in D ist. Beweis Nehme zunächst an, dass f stetig ist. Sei U eine offene Teilmenge von K und sei x ∈ f −1 (U). Dann ist f (x) ∈ U und folglich gibt es ε > 0, so dass BK (f (x), ε) ⊂ U. Da aber f an der Stelle x stetig ist, gibt es δ > 0, so dass |f (y) − f (x)| < ε für alle y ∈ D mit |y − x| < δ. Also ist BD (x, δ) ⊂ f −1 (U), und dies zeigt, dass f −1 (U) offen in D ist. Nehme umgekehrt an, dass für jede offene Teilmenge U von K die Menge f −1 (U) offen in D ist. Sei x ∈ D und ε > 0. Nach Lemma 7.4 ist U = BK (f (x), ε) eine offene Teilmenge von K und folglich ist f −1 (U) offen in D. Ferner ist x ∈ f −1 (U) und damit gibt es δ > 0, so dass BD (x, δ) ⊂ f −1 (U). Für jedes y ∈ D mit |y − x| < δ ist also f (y) ∈ U, d.h. |f (y) − f (x)| < ε. Dies zeigt, dass f an der Stelle x stetig ist und daher, da x ∈ D beliebig war, dass f stetig ist. Eine Teilmenge F von D heißt abgeschlossen in D (oder abgeschlossene Teilmenge von D), wenn die Menge D \ F = {x ∈ D : x ∈ / F } offen in D ist. Die Intervalle [a, b], (−∞, b] und [a, +∞) sind abgeschlossene Teilmengen von R. Lemma 7.6 (1) Die leere Menge ∅ und die Menge D selbst sind abgeschlossene Teilmengen von D. (2) Ist {Fα }α∈A eine beliebige Familie von abgeschlossenen Teilmengen von D, T so ist ihr Durchschnitt α∈A Fα abgeschlossen in D. (3) Sind F1 , . . . , Fn (mit n ≥ 1) abgeschlossen in D, so ist ihre Vereinigung S n k=1 Fk eine abgeschlossene Teilmenge von D. 7 Stetige Funktionen 54 Beweis Dies folgt unmittelbar aus Lemma 7.5, da D\ \ Fα = α∈A [ α∈A (D \ Fα ) und D \ n [ k=1 Fk = n \ (D \ Fk ) . k=1 Eine Folge {xn }n≥p aus D heißt konvergent in D, wenn {xn }n≥p konvergiert und x = lim xn ∈ D. n→∞ Satz 7.7 Eine Teilmenge F von D ist genau dann abgeschlossen in D, wenn der Grenzwert von jeder Folge aus F , die in D konvergent ist, auch in F liegt. Beweis Nehme zunächst an, dass F eine abgeschlossene Teilmenge von D ist, und sei {xn }n≥p eine Folge aus F , die in D konvergent ist. Setze x = limn→∞ xn ; also ist x ∈ D. Sei ε > 0; dann gibt es ein N ≥ p, so dass |xn − x| < ε für alle n ≥ N, d.h. xn ∈ BD (x, ε) für alle n ≥ N. Insbesondere ist BD (x, ε) ∩ F 6= ∅ für jedes ε > 0. Wäre nun x ∈ D \ F , so gäbe es ein ε > 0 mit BD (x, ε) ⊂ D \ F und daher mit BD (x, ε) ∩ F = ∅, da D \ F offen ist. Daraus ergibt sich, dass x ∈ F . Nehme umgekehrt an, dass F nicht abgeschlossen in D ist; dann ist D \ F nicht offen in D. Es gibt daher ein x ∈ D\F , so dass für jedes ε > 0 die Menge BD (x, ε) keine Teilmenge von D \ F ist, oder, anders ausgedrückt: so dass für jedes ε > 0 ein y ∈ F mit |y − x| < ε existiert. Für jedes n ≥ 1 gibt es insbesondere also ein xn ∈ F mit |xn − x| < 1/n und damit konvergiert die Folge {xn }n≥p gegen x. Aber dann ist {xn }n≥1 eine Folge aus F , die konvergent in D ist, für die der Grenzwert x nicht in F liegt. Lemma 7.7 Sei F eine nichtleere abgeschlossene Teilmenge von R. (1) Ist F nach oben beschränkt, so besitzt F ein Maximum: Es gibt v ∈ F , so dass x ≤ v für alle x ∈ F . (2) Ist F nach unten beschränkt, so besitzt F ein Minimum: Es gibt u ∈ F , so dass u ≤ x für alle x ∈ F . Beweis (1) Nach Satz 4.1 (1) besitzt F ein Supremum v und nach Lemma 4.1 (1) besitzt F ein Maximum genau dann, wenn v ∈ F (und in diesem Fall ist v das Maximum). Nehme an, dass v ∈ / F . Dann liegt v in der offenen Teilmenge R \ F von R und also gibt es ein ε > 0, so dass (v − ε, v + ε) ⊂ R \ F . Da v eine obere Schranke von F ist, ist x ≤ v für jedes x ∈ F . Aber das Intervall (v − ε, v] enthält kein Element von F und daraus ergibt sich, dass v − ε auch eine obere Schranke von F ist. Damit ist v nicht die kleinste obere Schranke, und dieser Widerspruch zeigt, dass v in F liegen muss. (2) Analog zu (1). 7 Stetige Funktionen 55 Lemma 7.8 Sei f : D → R eine Abbildung, die an der Stelle x ∈ D stetig ist. Ist f (x) > 0 (bzw. ist f (x) < 0), dann gibt es ein η > 0, so dass f (y) > 0 (bzw. so dass f (y) < 0) für alle y ∈ D mit |y − x| < η. Beweis (Dies ist schon im letzten Teil vom Beweis für Satz 7.4 enthalten.) Nehme an, dass f (x) > 0; dann gibt es ein η > 0, so dass |f (y) − f (x)| < f (x)/2 und damit auch f (y) = f (x) + f (y) − f (x) ≥ f (x) − |f (x) − f (y)| > f (x)/2 > 0 für alle y ∈ D mit |y − x| < η. Der andere Fall (mit f (x) < 0) ist ähnlich. Im Folgenden seien a, b ∈ R mit a < b. Lemma 7.9 Sei f : [a, b] → R eine stetige Abbildung mit f (a) < 0 and f (b) > 0. Dann gibt es c ∈ (a, b) mit f (c) = 0. Beweis Sei A = {x ∈ [a, b] : f (x) < 0}. Dann ist a ∈ A und x ≤ b für alle x ∈ A, d.h. A ist eine nichtleere nach oben beschränkte Teilmenge von R. Also existiert das Supremum c = sup(A). Nehme an, dass f (c) < 0; dann ist c 6= b und nach Lemma 7.8 gibt es ein η > 0, so dass f (y) < 0 für alle y ∈ [a, b] mit |y − c| < η. Insbesondere existiert ein x ∈ (c, b) mit f (x) < 0, und dann wäre aber c keine obere Schranke von A. Nehme nun an, dass f (c) > 0; hier ist c 6= a und nach Lemma 7.8 gibt es ein η > 0, so dass f (y) > 0 für alle y ∈ [a, b] mit |y − c| < η. Aber dann ist jedes x ∈ (c − η, c) ∩ [a, b] eine obere Schranke von A, und damit wäre c nicht die kleinste obere Schranke. Daraus ergibt sich, dass f (c) = 0 (und damit auch, dass c ∈ (a, b)). Satz 7.8 (Zwischenwertsatz) Sei f : [a, b] → R eine stetige Abbildung und sei z eine reelle Zahl zwischen f (a) und f (b). Dann gibt es c ∈ [a, b] mit f (c) = z. Beweis Ist z = f (a) (bzw. ist z = f (b)), so kann man c = a (bzw. c = b) nehmen. Es kann also angenommen werden, dass entweder f (a) < z < f (b) oder f (b) < z < f (a). Nehme zunächst an, dass f (a) < z < f (b) und sei g = f − z, d.h. g : [a, b] → R ist definiert durch g(x) = f (x) − z für jedes x ∈ [a, b]. Nach Satz 7.4 ist g stetig und g(a) = f (a) − z < 0, g(b) = f (b) − z > 0. Daraus folgt nach Lemma 7.9, dass g(c) = 0 für ein c ∈ (a, b), und damit ist f (c) = g(c) + z = z. Nehme nun an, dass f (b) < z < f (a) und sei hier g = z − f , d.h. g : [a, b] → R ist definiert durch g(x) = z − f (x) für jedes x ∈ [a, b]. Nach Satz 7.4 ist g stetig und g(a) = z − f (a) < 0, g(b) = z − f (b) > 0. Daraus folgt nach Lemma 7.9, dass g(c) = 0 für ein c ∈ (a, b), und damit ist f (c) = z − g(c) = z. 7 Stetige Funktionen 56 Satz 7.9 Sei f : D → R eine stetige Abbildung. Für jedes Intervall I ⊂ R mit I ⊂ D ist dann f (I) auch ein Intervall. Beweis Seien a, b ∈ f (I) mit a < b. Dann gibt es α, β ∈ I mit a = f (α) und b = f (β). Setze ᾰ = min{α, β} und β̆ = max{α, β}. Dann sind ᾰ, β̆ Elemente von I mit ᾰ < β̆, und also ist J = [ᾰ, β̆] ⊂ I ⊂ D, da I ein Intervall ist. Nach Lemma 7.2 ist die Einschränkung fJ von f auf J stetig. Sei nun c ∈ (a, b); dann ist c eine Zahl zwischen fJ (ᾰ) und fJ (β̆), und daraus ergibt sich nach Satz 7.7, dass es ein γ ∈ J ⊂ I gibt mit f (γ) = fJ (γ) = c. Damit ist c ∈ f (I), und dies zeigt, dass f (I) ein Intervall ist. Im Folgenden sei f : I → R eine stetige Abbildung, wobei I ein Intervall ist, das mehr als einen Punkt enthält. Lemma 7.10 Nehme an, es gibt a, b, c, d ∈ I mit a < b und c < d, so dass f (a) < f (b) und f (c) > f (d). Dann ist f nicht injektiv. Beweis Für jedes t ∈ [0, 1] liegt (1 − t)a + tc zwischen a und c und (1 − t)b + td zwischen b und d; insbesondere liegen (1 − t)a + tc und (1 − t)b + td beide im Intervall I. Folglich kann eine Abbildung h : [0, 1] → R definiert werden durch h(t) = f ((1 − t)a + tc) − f ((1 − t)b + d) für jedes t ∈ [0, 1]. Nach Satz 7.4 und Satz 7.5 ist h stetig, da die Abbildungen t 7→ (1 − t)a + tc und t 7→ (1 − t)b + d (von [0, 1] nach R) stetig sind. Nun ist h(0) = f (a) − f (b) < 0 und h(1) = f (c) − f (d) > 0, und daher gibt es nach dem Zwischenwertsatz ein s ∈ [0, 1] mit h(s) = 0, d.h, mit f ((1 − s)a + sc) = f ((1 − s)b + d). Aber (1 − s)a + sc 6= (1 − s)b + d, da (1 − s)b + d − (1 − s)a + sc = (1 − s)(b − a) + s(d − c) , und dies zeigt, dass f nicht injektiv ist. Satz 7.10 Die Abbildung f ist injektiv genau dann, wenn sie streng monoton ist. Beweis Es ist klar, dass eine streng monotone Abbildung injektiv ist. Nehme nun umgekehrt an, dass f nicht streng monoton ist. Dann gibt es a, b, c, d ∈ I mit a < b und c < d, so dass f (a) ≤ f (b) und f (c) ≥ f (d). Ist f (a) = f (b) oder f (c) = f (d), so ist f offensichtlich nicht injektiv. Ist andererseits f (a) < f (b) und f (c) > f (d), so ergibt sich aus Lemma 7.10, dass f wieder nicht injektiv ist. Nehme nun zusätzlich an, dass f injektiv ist (und damit streng monoton). 7 Stetige Funktionen 57 Lemma 7.11 Sei x ∈ I und ε > 0; dann gibt es ein δ > 0, so dass |y − x| < ε für alle y ∈ I mit |f (y) − f (x)| < δ. Beweis Nehme zunächst an, dass x kein Endpunkt des Intervalls I ist. Dann gibt es ein η > 0 mit η ≤ ε, so dass die Punkte x − η und x + η beide in I liegen. Setze δ = min{|f (x) − f (x − η)|, |f (x) − f (x + η)|}; also ist δ > 0, da f streng monoton ist. Sei y ∈ I mit |f (y)−f (x)| < δ; dann liegt f (y) im Intervall (f (x)−δ, f (x)+δ) und damit zwischen f (x−η) und f (x+ η). Da f streng monoton ist, folgt daraus, dass y ∈ (x − η, x + η) und daher ist |y − x| < ε. Nehme nun an, dass x Endpunkt des Intervalls I ist und ohne Beschränkung der Allgemeinheit sei x der linke Endpunkt von I. Da I mehr als einen Punkt enthält, gibt es ein η > 0 mit η ≤ ε, so dass x + η ∈ I. Setze hier δ = |f (x) − f (x + η)|; also ist δ > 0, da f streng monoton ist. Wie im anderen Fall ist wieder |y − x| < ε für alle y ∈ I mit |f (y) − f (x)| < δ. Setze nun J = f (I); nach Satz 7.9 ist J ein Intervall, und f bildet das Intervall I bijektiv auf J ab. Ist f streng monoton wachsend, dann ist f −1 das auch: Sind x, y ∈ J mit x < y, so sind f (f −1(x)) = x < y = f (f −1(y)) und daraus ergibt sich, dass f −1 (x) < f −1 (y). Genauso ist f −1 streng monoton fallend, wenn f das ist. Satz 7.11 Die Umkehrabbildung f −1 : J → I ist stetig. Beweis Sei x ∈ J und ε > 0; also ist f −1 (x) ∈ I und nach Lemma 7.11 gibt es dann ein δ > 0, so dass |v − f −1 (x)| < ε für alle v ∈ I mit |f (v) − x| = |f (v) − f (f −1 (x))| < δ . Sei nun y ∈ J mit |y − x| < δ; dann gibt es ein eindeutiges v ∈ I mit f (v) = y. Damit ist |f (v) − x| < δ und folglich ist |f −1 (y) − f −1 (x)| = |v − f −1 (x)| < ε. Dies zeigt, dass f −1 an der Stelle x stetig ist. Nach Satz 7.1 und Satz 6.13 (2) ist die Abbildung exp : R → R stetig und streng monoton wachsend, und nach Satz 6.13 (4) und (5) ist exp(R) = (0, +∞). Die Umkehrabbildung exp−1 : (0, +∞) → R heißt natürlicher Logarithmus und wird mit log bezeichnet. Also ist log streng monoton wachsend und bildet das Intervall (0, +∞) bijektiv auf R ab. Ferner ist nach Satz 7.11 die Abbildung log stetig. Satz 7.12 Es gilt log(1) = 0 und für alle x, y ∈ (0, +∞) log(xy) = log(x) + log(y) . Beweis Da exp(0) = 1, ist log(1) = 0. Seien x, y ∈ (0, +∞); dann gibt es u, v ∈ R mit x = exp(u) und y = exp(v), und damit ist nach Satz 6.11 log(xy) = log(exp(u) exp(v)) = log(exp(u + v)) = u + v = log(x) + log(y) . 8 Folgenkompaktheit Eine Teilmenge F von K heißt folgenkompakt, wenn jede Folge aus F eine Teilfolge besitzt, die in F konvergent ist. D.h.: Ist {xn }n≥p eine Folge aus F , so gibt es eine Teilfolge {xnk }k≥q und x ∈ F , so dass x = lim xnk . k→∞ Für eine Teilmenge F von R gibt es anscheinend zwei mögliche Definitionen für die Folgenkompaktheit (mit K = R und mit K = C). Es gibt aber keinen Unterschied: F ist folgenkompakt als Teilmenge von R genau dann, wenn sie folgenkompakt als Teilmenge von C ist. Lemma 8.1 Jede folgenkompakte Teilmenge von K ist beschränkt. Beweis Übung. Satz 8.1 Eine Teilmenge F von K ist folgenkompakt genau dann, wenn sie abgeschlossen und beschränkt ist. Beweis Nehme zunächst an, dass F abgeschlossen und beschränkt ist. Sei {xn }n≥p eine Folge aus F ; dann ist diese Folge auch beschränkt und damit besitzt sie nach Satz 5.10 (Bolzano-Weierstraß) eine konvergente Teilfolge: Es gibt eine Teilfolge {xnk }k≥q und x ∈ K, so dass x = limk→∞ xnk . Also ist {xnk }k≥q eine Folge aus F , die konvergent (d.h. konvergent in K) ist, und daraus folgt nach Satz 7.7, dass x ∈ F , da F abgeschlossen ist. Dies zeigt, dass F folgenkompakt ist. Nehme umgekehrt an, dass F folgenkompakt ist; nach Lemma 8.1 ist also F beschränkt und es bleibt nur zu zeigen, dass F abgeschlossen ist. Sei {xn }n≥p eine Folge aus F , die konvergiert. Da F folgenkompakt ist, gibt es eine Teilfolge {xnk }k≥q und x ∈ F , so dass x = limk→∞ xnk und nach Satz 5.7 ist dann auch x = limn→∞ xn . Daraus ergibt sich nach Satz 7.7, dass F abgeschlossen ist. Sei a, b ∈ R mit a < b. Nach Satz 8.1 ist insbesondere das Intervall [a, b] eine folgenkompakte Teilmenge von R. Im Folgenden sei D wieder eine nichtleere Teilmenge von K′ , wobei K′ entweder R oder C ist. Satz 8.2 Sei f : D → K eine stetige Abbildung und sei F eine folgenkompakte Teilmenge von K′ mit F ⊂ D. Dann ist das Bild f (F ) eine folgenkompakte Teilmenge von K. Beweis Sei {yn }n≥p eine Folge aus f (F ); für jedes n ≥ p gibt es dann ein xn ∈ F mit yn = f (xn ). Damit ist {xn }n≥p eine Folge aus der folgenkompakten Teilmenge F ; es gibt also eine Teilfolge {xnk }k≥q und x ∈ F , so dass {xnk }k≥q gegen x 58 8 Folgenkompaktheit 59 konvergiert, und da f stetig ist, konvergiert nach Satz 7.3 {f (xnk )}k≥q gegen f (x), d.h. {ynk )}k≥q konvergiert gegen das Element y = f (x) ∈ f (F ). Mit anderen Worten: Die Folge {yn }n≥p besitzt eine Teilfolge, die in f (F ) konvergent ist, und dies zeigt, dass f (F ) eine folgenkompakte Teilmenge von K ist. Satz 8.3 (Satz von Minimum und Maximum) Sei f : D → R eine stetige Abbildung und F eine nichtleere folgenkompakte Teilmenge von K′ mit F ⊂ D. Dann gibt es u, v ∈ F , so dass f (u) ≤ f (x) ≤ f (v) für alle x ∈ F . Beweis Nach Satz 8.2 ist f (F ) folgenkompakt und damit nach Satz 8.1 eine nichtleere Teilmenge von R, die beschränkt und abgeschlossen ist. Daraus folgt nach Lemma 7.9, dass f (F ) ein Minimum und ein Maximum besitzt: Es gibt u′ , v ′ ∈ f (F ), so dass u′ ≤ y ≤ v ′ für alle y ∈ f (F ). Wähle u, v ∈ F mit f (u) = u′ und f (v) = v ′ ; dann ist f (u) ≤ f (x) ≤ f (v) für alle x ∈ F . Satz 8.4 Sei {Fn }n≥p eine Folge von nichtleeren abgeschlossenen Teilmengen von K mit Fp beschränkt und T Fn+1 ⊂ Fn für alle n ≥ p. Dann hat die Folge einen nichtleeren Durchschnitt: Fn 6= ∅. n≥p Beweis Für jedes n ≥ p wähle xn ∈ Fn . Dann ist {xn }n≥p eine Folge aus Fp und nach Satz 8.1 ist Fp folgenkompakt. Es gibt also eine Teilfolge {xnk }k≥q und x ∈ Fp , so dass x = limk→∞ xnk . Nun ist x ∈ Fn für jedes n ≥ p: Sei n ≥ p; dann gibt es m ≥ q mit nm ≥ n und daher auch nk ≥ n für alle k ≥ m; folglich ist xnk ∈ Fnk ⊂ Fn für alle k ≥ m, d.h. {xnk }k≥m ist eine Folge aus Fn . Aber nach Lemma 5.1 konvergiert {xnk }k≥m gegen x, und daraus ergibtTsich nach Satz 7.7, T dass x ∈ Fn . Da x ∈ Fn für jedes n ≥ p, ist x ∈ Fn , d.h. Fn 6= ∅. n≥p n≥p Beispiel: Für jedes n ≥ 0 sei En = [n, +∞); En ist eine T nichtleere abgeschlossene Teilmenge von R und En+1 ⊂ En für alle n ≥ 0. Aber n≥0 En = ∅. (Natürlich ist hier E0 nicht beschränkt.) Erinnerung: Eine Abbildung f : D → K ist stetig, wenn es zu jedem x ∈ D und zu jedem ε > 0 ein δ > 0 gibt, so dass |f (y) − f (x)| < ε für alle y ∈ D mit |y − x| < δ. Eine Abbildung f : D → K heißt nun gleichmäßig stetig, wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass |f (y) − f (x)| < ε für alle x, y ∈ D mit |y − x| < δ. Insbesondere ist jede gleichmäßig stetige Abbildung stetig. Beispiel: Sei h : (0, 1) → R die durch h(x) = 1/x gegebene Abbildung. Nach Satz 7.4 ist h stetig, da h = (id(0,1) )−1 , aber h ist nicht gleichmäßig stetig. (Der Beweis dafür ist eine Übung.) 8 Folgenkompaktheit 60 Satz 8.5 Ist die Menge D folgenkompakt, so ist jede stetige Abbildung f : D → K gleichmäßig stetig. Beweis Nehme an, dass f nicht gleichmäßig stetig ist. Dann gibt es ein ε > 0, für das gilt: Zu jedem δ > 0 existieren x, y ∈ D mit |y −x| < δ aber |f (y)−f (x)| ≥ ε. Zu jedem n ≥ 1 gibt es dann insbesondere xn , yn ∈ D mit |yn − xn | < 1/n, aber mit |f (yn ) − f (xn )| ≥ ε. Nun ist {xn }n≥1 eine Folge aus der folgenkompakten Teilmenge D, es gibt also eine Teilfolge {xnk }k≥q , die gegen ein Element x ∈ D konvergiert. Da |yn −xn | < 1/n für alle n ≥ p, sieht man leicht, dass auch die Folge {ynk }k≥q gegen x konvergiert. Aber f ist an der Stelle x stetig und daraus folgt nach Satz 7.3, dass sowohl limk→∞ f (xnk ) = f (x) als auch limk→∞ f (ynk ) = f (x). Dies steht nun im Widerspruch zu der Tatsache, dass |f (ynk ) − f (xnk )| ≥ ε für alle k ≥ q. Daher muss f gleichmäßig stetig sein. 9 Trigonometrische Funktionen Lemma 9.1 Es gilt |exp(ix)| = 1 für jedes x ∈ R. Beweis Sei x ∈ R und setze z = exp(ix). Dann ist nach Satz 6.12 (1) und (2) z = exp(ix) = exp(ix) = exp(−ix) = exp(ix)−1 = z −1 √ und damit ist zz = zz −1 = 1. Daraus folgt, dass |z| = zz = 1. Sei cis : R → C die Abbildung, die definiert ist durch cis(x) = exp(ix) . Dann ist cis(0) = 1, |cis(x)| = 1 für alle x ∈ R und für x, y ∈ R ist nach Satz 6.11 cis(x + y) = cis(x) cis(y) . Die Cosinus-Funktion cos : R → R und die Sinus-Funktion sin : R → R werden nun definiert durch cos = Re cis und sin = Im cis. Diese Definitionen sind in der Eulerschen Formel zusammengefasst: Es gilt exp(ix) = cos(x) + i sin(x) für alle x ∈ R. Satz 9.1 (1) Für alle x ∈ R gilt 1 1 exp(ix) + exp(−ix) und sin(x) = exp(ix) − exp(−ix) . 2 2i 2 (2) Für alle x ∈ R ist cos2 (x) + sin2 (x) = 1 (wobei cos2 (x) für cos(x) und 2 sin2 (x) für sin(x) geschrieben wird). cos(x) = (3) Es gilt cos(−x) = cos(x) und sin(−x) = − sin(x) für alle x ∈ R. (4) cos(0) = 1 und sin(0) = 0. Beweis (1) Für alle z ∈ C ist Re z = (z + z)/2 und Im z = (z − z)/2i. (2) Für alle z ∈ C ist (Re z)2 + (Im z)2 = |z|2 und |exp(ix)| = 1 für jedes x ∈ R nach Lemma 9.1. (3) Für alle x ∈ R ist cos(−x) + i sin(−x) = exp(−ix) = exp(ix) = cos(x) + i sin(x) = cos(x) − i sin(x) , und damit ist cos(−x) = cos(x) und sin(−x) = − sin(x). (4) Es gilt cos(0) + i sin(0) = exp(i0) = exp(0) = 1 = 1 + i0 und daraus folgt, dass cos(0) = 1 und sin(0) = 0. 61 9 Trigonometrische Funktionen 62 Satz 9.2 Die Abbildung cis : R → C ist stetig und damit auch (nach Satz 7.2) die Abbildungen cos : R → R und sin : R → R. Beweis Sei f : C → C die durch f (z) = exp(iz) gegebene Abbildung. Dann ist f die Zusammensetzung der Abbildungen h und exp, wobei h : C → C durch h(z) = iz gegeben ist. Nun ist nach Satz 7.1 exp stetig und nach Satz 7.4 ist h stetig und damit ist nach Satz 7.5 auch f stetig. Aber cis ist die Einschränkung von f auf R und daraus folgt nach Lemma 7.3, dass cis stetig ist. Satz 9.3 (Additionstheoreme) Für alle x, y ∈ R gilt cos(x + y) = cos(x) cos(y) − sin(x) sin(y) , sin(x + y) = sin(x) cos(y) + cos(x) sin(y) . Beweis Für alle x, y ∈ R gilt nach Satz 6.11 cos(x + y) + i sin(x + y) = exp(i(x + y)) = exp(ix + iy) = exp(ix) exp(iy) = cos(x) + i sin(x) cos(y) + i sin(y) = cos(x) cos(y) − sin(x) sin(y) + i sin(x) cos(y) + cos(x) sin(y) . Nach Satz 9.1 (3) und Satz 9.3 gilt auch für alle x, y ∈ R cos(x − y) = cos(x) cos(y) + sin(x) sin(y) , sin(x − y) = sin(x) cos(y) − cos(x) sin(y) . Satz 9.4 Für alle x, y ∈ R gilt x + y x − y sin(x) − sin(y) = 2 cos sin , x2 + y x2 − y sin . cos(x) − cos(y) = −2 sin 2 2 Beweis Setze u = (x + y)/2, v = (x − y)/2; also ist x = u + v und y = u − v, und daraus folgt nach Satz 9.3, dass sin(x) − sin(y) = sin(u + v) − sin(u − v) = sin(u) cos(v) + cos(u) sin(v) + sin(u) cos(v) − cos(u) sin(v) x + y x − y = 2 sin(u) cos(v) = 2 cos sin . 2 2 Die andere Gleichung ist analog zu beweisen. 9 Trigonometrische Funktionen 63 Satz 9.5 Für jedes x ∈ R gilt ∞ X ∞ X 1 1 m 2m cos(x) = (−1) x und sin(x) = (−1)m x2m+1 . (2m)! (2m + 1)! m=0 m=0 In beiden Fällen konvergieren diese Reihen absolut. Beweis Dies folgt unmittelbar aus Lemma 6.2 und Lemma 6.4, da ∞ X 1 cos(x) + i sin(x) = cis(x) = exp(ix) = (ix)n n! n=0 und i4k = 1, i4k+1 = i, i4k+2 = −1 und i4k+3 = −i für alle k ∈ N. Satz 9.5 sagt also, dass für jedes x ∈ R gilt: x2 x4 x6 + − +··· , 2! 4! 6! x3 x5 x7 sin(x) = x − + − +··· . 3! 5! 7! cos(x) = 1 − Lemma 9.2 Es gilt cos(x) ≤ 1 − x2 /2! + x4 /4! und sin(x) ≥ x − x3 /3! für jedes x ∈ [0, 2]. Insbesondere ist cos(2) < 0 und sin(x) > 0 für alle x ∈ (0, 2]. Beweis Übung. Lemma 9.3 Die Abbildung cos ist im Intervall [0, 2] streng monoton fallend. Beweis Seien 0 ≤ y < x ≤ 2; dann folgt aus Lemma 9.2 und Satz 9.4, dass x + y x − y cos(x) − cos(y) = −2 sin sin <0, 2 2 (x + y)/2 und (x − y)/2 beide im Intervall [0, 2] liegen. Satz 9.6 Die Abbildung cos hat im Intervall [0, 2] genau eine Nullstelle: Es gibt genau einen Punkt x ∈ [0, 2] mit cos(x) = 0. Beweis Nach Satz 9.2 und Lemma 7.2 ist die Einschränkung von cos auf [0, 2] stetig. Ferner ist cos(0) = 1 > 0 und nach Lemma 9.2 ist cos(2) < 0. Folglich gibt es nach Satz 7.8 (Zwischenwertsatz) ein x ∈ (0, 2) mit cos(x) = 0. Eine weitere Nullstelle von cos in [0, 2] kann es nicht geben, da nach Lemma 9.3 cos in diesem Intervall streng monoton fallend ist. Nun wird das Zweifache der eindeutigen Nullstelle von cos im Intervall [0, 2] mit π bezeichnet. Also ist 0 < π < 4 und π/2 ist die kleinste positive Nullstelle von cos. 9 Trigonometrische Funktionen 64 Lemma 9.4 Es gilt cis(π/2) = i. Beweis Da cos(π/2) = 0, ist nach Satz 9.1 (3) sin2 (π/2) = 1. Aber π/2 < 2 und nach Lemma 9.4 (2) ist sin > 0 im Intervall (0, 2]; damit ist sin(π/2) = 1. Folglich ist cis(π/2) = cos(π/2) + i sin(π/2) = i. Satz 9.7 (1) 2π ist die kleinste positive Zahl σ mit cis(σ) = 1. (2) Für jedes x ∈ R und jedes n ∈ Z ist cis(x + 2πn) = cis(x) und damit auch cos(x + 2πn) = cos(x) und sin(x + 2πn) = sin(x). Beweis (1) Nach Satz 6.11 ist cis(2x) = cis(x + x) = cis(x) cis(x) = cis2 (x) für jedes x ∈ R. Insbesondere ist nach Lemma 9.4 cis(π) = cis2 (π/2) = i2 = −1 und daher cis(2π) = cis2 (π) = (−1)2 = 1. Sei nun σ > 0 mit cis(σ) = 1; dann ist cis4 (σ/4) = cis(σ/4 + σ/4 + σ/4 + σ/4) = cis(σ) = 1, daraus folgt, dass cis(σ/4) ∈ {1, −1, i, −i}, und damit ist cos(σ/4) = Re cis(σ/4) ∈ {1, −1, 0}. Aber 0 < cos(x) < 1 für alle x ∈ (0, π/2) und also ist σ/4 ≥ π/2, d.h., σ ≥ 2π. Dies zeigt, dass 2π die kleinste positive Zahl σ mit cis(σ) = 1 ist. (2) Da cis(2π) = 1, gilt für jedes n ∈ Z, dass cis(2π(n + 1)) = cis(2πn + 2π) = cis(2πn) cis(2π) = cis(2πn) . Daraus ergibt sich durch Induktion nach n, dass cis(2πn) = 1 für alle n ∈ N und −1 damit für alle n ∈ Z, da cis(−y) = cis(y) für alle y ∈ R. Für jedes x ∈ R, n ∈ Z ist nun cis(x + 2πn) = cis(x) cis(2πn) = cis(x). Nach Satz 9.7 wird insbesondere jede der Abbildungen cos und sin bestimmt durch die periodische Fortsetzung ihrer Einschränkung auf dem Intervall [0, 2π]. Das Verhalten von cos und sin in [0, 2π] ist im folgenden Satz beschrieben. Satz 9.8 (1a) Die Abbildung cos ist streng monoton fallend im Intervall [0, π] und streng monoton wachsend im Intervall [π, 2π]. (1b) Für alle x ∈ [0, π/2] ist cos(π − x) = −cos(x). (1c) Für alle x ∈ [0, π] ist cos(2π − x) = cos(x). (1d) cos(0) = 1, cos(π/2) = 0, cos(π) = −1, cos(3π/2) = 0 und cos(2π) = 1. (2a) Die Abbildung sin ist streng monoton wachsend im Intervall [0, π/2] sowie im Intervall [3π/2, 2π] und streng monoton fallend im Intervall [π/2, 3π/2]. (2b) Für alle x ∈ [0, π/2] ist sin(π − x) = sin(x). (2c) Für alle x ∈ [0, π] ist sin(2π − x) = − sin(x). (2d) sin(0) = 0, sin(π/2) = 1, sin(π) = 0, sin(3π/2) = −1 und sin(2π) = 0. 9 Trigonometrische Funktionen 65 Beweis (1d) Es ist schon gesehen worden, dass cos(0) = cos(2π) = 1, cos(π/2) = 0 und cos(π) = −1, und nach Satz 9.3 ist dann cos(3π/2) = cos(π + π/2) = cos(π) cos(π/2) − sin(π) sin(π/2) = 0 , da cos(π/2) = sin(π) = 0. (1b) Für alle x ∈ [0, π/2] ist nach Satz 9.3 cos(π − x) = cos(π) cos(x) + sin(π) sin(x) = − cos(x) , da cos(π) = −1 und damit auch sin(π) = 0. (1c) Für alle x ∈ [0, π] ist nach Satz 9.3 cos(2π − x) = cos(2π) cos(x) + sin(2π) sin(x) = cos(x) , da cos(π) = 1 und damit wieder sin(π) = 0. (1a) Nach Lemma 9.3 und Satz 9.6 ist cos streng monoton fallend im Intervall [0, π/2] und damit nach (1b) auch streng monoton fallend im Intervall [π/2, π], d.h. cos ist streng monoton fallend im Intervall [0, π]. Daraus folgt nach (1c), dass cos streng monoton wachsend im Intervall [π, 2π] ist. Die Aussagen über sin sind analog zu beweisen. Lemma 9.5 Es gilt cos(R) = cos([0, 2π]) = [−1, 1]. Beweis Setze I = cos([0, 2π]). Nach Satz 7.9 und Satz 9.2 ist I ein Intervall und nach Satz 9.1 (2) ist I ⊂ [−1, 1]. Aber nach Satz 9.8 (1d) liegen −1 und 1 in I und daher ist cos([0, 2π]) = I = [−1, 1]. Da ferner cos([0, 2π]) ⊂ cos(R) ⊂ [−1, 1], ist auch cos(R) = [−1, 1]. Setze S 1 = {z ∈ C : |z| = 1}. Satz 9.9 Es gilt cis(R) = cis([0, 2π)) = S 1 . Beweis Nach Lemma 9.1 ist cis([0, 2π)) ⊂ cis(R) ⊂ S 1 . Sei nun z ∈ S 1 und setze x = Re z, y = Im z. Damit ist x2 + y 2 = |z|2 = 1 und insbesondere ist x ∈ [−1, 1]; nach Lemma 9.5 gibt es also t ∈ [0, 2π] mit cos(t) = x. Dann ist nach Satz 9.1 (2) y 2 = 1 − x2 = 1 − cos2 (t) = sin2 (t) , d.h. y ist entweder sin(t) oder − sin(t). Aber nach Satz 9.1 (3) ist cos(−t) = cos(t) und sin(−t) = − sin(t) und daher ist z entweder cos(t) + i sin(t) = cis(t) oder cos(−t)+i sin(−t) = cis(−t) = cis(2π−t). In beiden Fällen ist z ∈ cis([0, 2π]), und dies zeigt, dass cis([0, 2π]) = S 1 . Folglich ist cis([0, 2π)) = S 1 , da cis(0) = cis(2π), und damit ist auch cis(R) = S 1 . Nach Satz 9.7 wird auch die Abbildung cis bestimmt durch die periodische Fortsetzung ihrer Einschränkung auf dem Intervall [0, 2π]. 9 Trigonometrische Funktionen 66 Satz 9.10 Die Abbildung cis bildet das Intervall [0, 2π) bijektiv auf S 1 ab. Beweis Seien x, y ∈ [0, 2π) mit x ≤ y und cis(x) = cis(y). Da 0 ≤ y − x < 2π und cis(y − x) = cis(x)(cis(y))−1 = 1, folgt dann aus Satz 9.6 (1), dass y − x = 0, d.h., y = x. Damit ist die Einschränkung der Abbildung cis auf dem Intervall [0, 2π) injektiv. Folglich bildet cis das Intervall [0, 2π) bijektiv auf S 1 ab, da nach Satz 9.9 cis([0, 2π)) = S 1 . Satz 9.11 Sei w ∈ C und n ≥ 1; dann gibt es ein z ∈ C mit z n = w. Beweis Da 0n = 0, kann man annehmen, dass w 6= 0. Sei r = |w|; also ist r > 0, und nach Satz 3.2 gibt es ein ̺ > 0 mit ̺n = r. Setze nun u = r −1 w; dann ist |u| = |r −1 w| = r −1 |w| = r −1 r = 1, d.h., u ∈ S 1 . Folglich gibt es nach Satz 9.10 ein x ∈ [0, 2π) mit cis(x) = u. Sei jetzt z = ̺ cis(x/n); dann ist z n = (̺ cis(x/n))n = ̺n (cis(x/n))n = r cis(x) = ru = w . 10 Differentiation Im Folgenden sei D stets eine nichtleere Teilmenge von K. In diesem Kapitel werden Abbildungen f : D → K untersucht. Es gibt also hier zwei Fälle (im Gegensatz zu Kapitel 7, wo es vier Fälle gab): — Reelle Abbildungen definiert auf einer Teilmenge von R, d.h. f : D → R mit D ⊂ R. — Komplexe Abbildungen definiert auf einer Teilmenge von C. d.h. f : D → C mit D ⊂ C. Ein Punkt a ∈ K heißt Häufungspunkt von D, wenn für jedes ε > 0 die Menge BD (a, ε) \ {a} = {x ∈ D : 0 < |x − a| < ε} nichtleer ist. Ist U eine offene Teilmenge von K, so ist jedes a ∈ U ein Häufungspunkt von U (da die Menge BK (a, ε) \ {a} das Element a + η für alle 0 < η < ε enthält). Ist ferner I ein Intervall, das mehr als einen Punkt enthält, so ist jedes a ∈ I ein Häufungspunkt von I (da es für jedes a ∈ I ein ε > 0 gibt, so dass (a − ε, a) oder (a, a + ε) eine Teilmenge von I ist). Lemma 10.1 Sei a ∈ D ein Häufungspunkt von D; dann gibt es mindestens eine Folge aus D \ {a}, die gegen a konvergiert. Beweis Für jedes n ≥ 1 wähle xn ∈ D mit 0 < |xn − a| < 1/n. Dann ist {xn }n≥p eine Folge aus D \ {a}, die offensichtlich gegen a konvergiert. Im Folgenden sei stets a ∈ D ein Häufungspunkt von D. Sei g : D \ {a} → K eine Abbildung und sei y ∈ K. Konvergiert die Folge {g(xn )}n≥p gegen y für jede Folge {xn }n≥p aus D \ {a}, die gegen a konvergiert, so schreibt man y = lim g(x) . x→a Nach Lemma 5.2 und Lemma 10.1 kann es höchstens ein y mit y = limx→a g(x) geben, und folglich macht diese Schreibweise einen Sinn. Lemma 10.2 Sei g : D \ {a} → K eine Abbildung und y ∈ K. Dann sind äquivalent: (1) Es gilt y = limx→a g(x). (2) Zu jedem ε > 0 gibt es ein δ > 0, so dass |g(x) − y| < ε für alle x ∈ D \ {a} mit |x − a| < δ. (3) Die Abbildung ğ : D → K, die definiert ist durch g(x) , falls x ∈ D \ {a}, ğ(x) = y , falls x = a, ist stetig an der Stelle a. 67 10 Differentiation 68 Beweis Übung. Eine Abbildung h : K → K heißt affin, wenn es Elemente b, c ∈ K gibt, so dass h(x) = b + cx für alle x ∈ K. Lemma 10.3 Sei f : D → K eine Abbildung; dann kann es höchstens eine affine Abbildung h : K → K geben mit h(a) = f (a) und f (x) − h(x) =0. x→a x−a lim Beweis Seien h1 , h2 : K → K affine Abbildungen mit h1 (a) = h2 (a) = f (a) und f (x) − h1 (x) f (x) − h2 (x) = lim =0. x→a x→a x−a x−a lim Definiere g : D \ {a} → K durch g(x) = (h1 (x) − h2 (x))/(x − a) und sei {xn }n≥p eine Folge aus D \ {a}, die gegen a konvergiert. Da für alle x ∈ D \ {a} h1 (x) − h2 (x) f (x) − h2 (x) f (x) − h1 (x) − = = g(x) , x−a x−a x−a konvergiert nach Satz 5.5 die Folge {g(xn )}n≥p gegen 0. Seien nun b1 , b2 , c1 , c2 mit h1 (x) = b1 + c1 x und h2 (x) = b2 + c2 x; dann ist h1 (x) − h2 (x) = b1 + c1 x − b2 − c2 x = b1 + c1 a + c1 (x − a) − b2 − c2 a − c2 (x − a) = (c1 − c2 )(x − a) , da b1 + c1 a = h1 (a) = h2 (a) = b2 + c2 a. Damit ist g(x) = c1 − c2 für alle x ∈ D \ {a}, und insbesondere konvergiert die Folge {g(xn )}n≥p gegen c1 − c2 . Folglich ist c1 = c2 und dann ist ebenfalls b1 = b2 , da b1 − b2 = a(c2 − c1 ), d.h. h1 = h2 . Eine Abbildung f : D → K heißt in a linear approximierbar, wenn es eine affine Abbildung h : K → K mit h(a) = f (a) gibt, so dass f (x) − h(x) =0. x→a x−a lim Nach Lemma 10.3 ist diese affine Abbildung h dann eindeutig bestimmt. Eine Abbildung f : D → K heißt in a differenzierbar, wenn es ein y ∈ K gibt, so dass f (x) − f (a) . x→a x−a y = lim Dieser Grenzwert y heißt die Ableitung von f in a und er wird meistens mit f ′ (a) bezeichnet, aber manchmal auch mit f˙(a), ∂f (a) oder Df (a). 10 Differentiation 69 Satz 10.1 Für eine Abbildung f : D → K sind äquivalent: (1) f ist in a differenzierbar. f (x) − f (a) − c(x − a) = 0. x→a x−a (3) Es gibt ein c ∈ K und eine an der Stelle a stetige Abbildung r : D → K mit r(a) = 0, so dass f (x) = f (a) + c(x − a) + r(x)(x − a) für alle x ∈ D. (2) Es gibt ein c ∈ K, so dass lim (4) f ist in a linear approximierbar. In den Fällen (2) und (3) ist c = f ′ (a). Im Fall (4) ist die eindeutig bestimmte affine Abbildung h durch h(x) = f (a) + f ′ (a)(x − a) gegeben. Beweis (1) ⇒ (2): Sei f˘ : D \ {a} → K die Abbildung, die definiert ist durch ˘ = f (x) − f (a) f(x) x−a für alle x ∈ D \ {a}. Nach Voraussetzung konvergiert die Folge {f˘(xn )}n≥p gegen f ′ (a) – und damit die Folge {f˘(xn ) − f ′ (a)}n≥p gegen 0 – für jede Folge {xn }n≥p aus D \ {a}, die gegen a konvergiert. Aber ′ ˘ − f ′ (a) = f (x) − f (a) − f (a)(x − a) f(x) x−a für alle x ∈ D \ {a} und dies zeigt, dass f (x) − f (a) − f ′ (a)(x − a) =0. x→a x−a lim (2) ⇒ (3): Definiere eine Abbildung r : D → K durch (f (x) − f (a) − c(x − a))/(x − a) , falls x ∈ D \ {a}, r(x) = 0, falls x = a. Nach Lemma 10.2 ist r an der Stelle a stetig. Per Definition ist r(a) = 0 und f (x) = f (a) + c(x − a) + r(x)(x − a) für alle x ∈ D \ {a}. Das Letztere gilt aber trivialerweise auch für x = a. (3) ⇒ (4): Es gibt also ein c ∈ K und eine an der Stelle a stetige Abbildung r : D → K mit r(a) = 0, so dass f (x) = f (a) + c(x − a) + r(x)(x − a) für alle x ∈ D. Sei h : K → K die affine Abbildung, die gegeben ist durch h(x) = f (a) − ca + cx = f (a) + c(x − a) für alle x ∈ K. Dann ist f (x) − h(x) −r(x)(x − a) = = −r(x) x−a x−a 10 Differentiation 70 für alle x ∈ D \ {a}, und daraus folgt nach Lemma 10.2, dass f (x) − h(x) =0. x−a Ferner ist h(a) = f (a), und damit ist f in a linear approximierbar. lim x→a (4) ⇒ (1): Es gibt eine eindeutige affine Abbildung h : K → K mit h(a) = f (a) und limx→a (f (x) − h(x))/(x − a) = 0. Seien b, c ∈ K, so dass h(x) = b + cx; da h(a) = f (a), ist h(x) = f (a) + h(x) − h(a) = f (a) + c(x − a) für alle x ∈ K. Sei ˘ = (f (x)−f (a))/(x−a) f˘ : D\{a} → K die Abbildung, die definiert ist durch f(x) für alle x ∈ D \ {a}. Dann ist ˘ − c = f (x) − f (a) − c(x − a) = f (x) − h(x) f(x) x−a x−a ˘ n ) − c}n≥p für alle x ∈ D \ {a}. Nach Voraussetzung konvergiert die Folge {f(x gegen 0 – und damit die Folge {f˘(xn )}n≥p gegen c – für jede Folge {xn }n≥p aus D \ {a}, die gegen a konvergiert. Daraus ergibt sich, dass f (x) − f (a) =c, x−a d.h. f ist in a differenzierbar mit f ′ (a) = c (und daher ist h die affine Abbildung x 7→ f (a) + f ′ (a)(x − a)). lim x→a Satz 10.2 Ist f : D → K in a differenzierbar, so ist f an der Stelle a stetig. Beweis Sei f : D → K in a differenzierbar. Nach Satz 10.2 gibt es dann eine an der Stelle a stetige Abbildung r : D → K mit r(a) = 0, so dass f (x) = f (a) + f ′ (a)(x − a) + r(x)(x − a) für alle x ∈ D. Daraus folgt nach Satz 7.4, dass f an der Stelle a stetig ist, da die Abbildung x 7→ x − a stetig ist. Satz 10.3 Seien f, g : D → K Abbildungen, die beide in a differenzierbar sind. (1) Für alle λ, µ ∈ K ist die Abbildung λf + µg in a differenzierbar, und es gilt (λf + µg)′ (a) = λf ′ (a) + µg ′(a) . (2) Die Abbildung f · g ist in a differenzierbar und es gilt (f · g)′ (a) = f (a)g ′ (a) + f ′ (a)g(a) . (3) Nehme an, dass g(x) 6= 0 für alle x ∈ D. Dann ist die Abbildung f /g in a differenzierbar, und es gilt ′ f f ′ (a)g(a) − f (a)g ′ (a) . (a) = g g(a)2 10 Differentiation 71 Beweis Seien f˘, ğ : D \ {a} → K die Abbildungen, die definiert sind durch f (x) − f (a) f˘(x) = x−a und ğ(x) = g(x) − g(a) x−a für alle x ∈ D \ {a}. Nach Voraussetzung konvergiert die Folge {f˘(xn )}n≥p gegen f ′ (a) und die Folge {ğ(xn )}n≥p gegen g ′(a) für jede Folge {xn }n≥p aus D \ {a}, die gegen a konvergiert. (1) Sei {xn }n≥p eine Folge aus D \ {a}, die gegen a konvergiert. Nach Satz 5.5 (1) ˘ n ) + µğ(xn )}n≥p gegen λf ′ (a) + µg ′(a). Aber konvergiert dann die Folge {λf(x f (x) − f (a) g(x) − g(a) +µ x−a x−a (λf + µg)(x) − (λf + µg)(a) = x−a λf˘(x) + µğ(x) = λ für jedes x ∈ D \ {a}. Daraus ergibt sich, dass (λf + µg)(x) − (λf + µg)(a) ; x→a x−a λf ′ (a) + µg ′(a) = lim d.h. λf + µg ist in a differenzierbar und (λf + µg)′(a) = λf ′ (a) + µg ′(a). (2) Sei {xn }n≥p eine Folge aus D\{a}, die gegen a konvergiert. Damit konvergiert nach Satz 5.5 die Folge {f (xn )ğ(xn ) + f˘(xn )g(a)}n≥p gegen f (a)g ′(a) + f ′ (a)g(a), da nach Satz 10.2 und Satz 7.3 die Folge {f (xn )}n≥p gegen f (a) konvergiert. Aber g(x) − g(a) f (x) − f (a) f (x)ğ(x) + f˘(x)g(a) = f (x) + g(a) x−a x−a f (x)(g(x) − g(a)) + (f (x) − f (a))g(a) f (x)g(x) − f (a)g(a) = = x−a x−a für jedes x ∈ D \ {a}. Daraus ergibt sich, dass f (a)g ′ (a) + f ′ (a)g(a) = lim x→a (f · g)(x) − (f · g)(a) ; x−a d.h. f · g ist in a differenzierbar und (f · g)′ (a) = f (a)g ′(a) + f ′ (a)g(a). (3) Sei {xn }n≥p eine Folge aus D\{a}, die gegen a konvergiert. Damit konvergiert nach Satz 5.5 die Folge {f˘(xn )g(a) − f (a)ğ(xn )}n≥p gegen f ′ (a)g(a) − f (a)g ′ (a). Aber h f (x) − f (a) ˘ 1 g(x) − g(a) i f(x)g(a) − f (a)ğ(x) = g(x) − f (a) g(x)g(a) g(x)g(a) x−a x−a h i (f (x) − f (a))g(a) − f (a)(g(x) − g(a)) 1 = g(x)g(a) x−a h f i 1 f (x)g(a) − f (a)g(x) i 1 h f = = (x) − (a) g(x)g(a) x−a x−a g g 10 Differentiation 72 für jedes x ∈ D \ {a}, und nach Satz 10.2 und Satz 7.3 konvergiert die Folge {g(xn )}n≥p gegen g(a). Daraus folgt, nach Satz 5.5 und Satz 5.6, dass f i 1 h f f ′ (a)g(a) − f (a)g ′ (a) (x) − (a) , = lim x→a x − a g(a)2 g g d.h. die Abbildung f /g ist in a differenzierbar, und es gilt f ′ g (a) = f ′ (a)g(a) − f (a)g ′(a) . g(a)2 Lemma 10.4 Sei E eine Teilmenge von D, die a enthält, und nehme an, dass a ein Häufungspunkt von E ist; sei f : D → K in a differenzierbar. Dann ist die Einschränkung fE von f auf E auch in a differenzierbar und fE′ (a) = f ′ (a). Beweis Dies ist klar. Seien f, g : D → K Abbildungen, die beide in a differenzierbar sind und mit g(a) 6= 0 (obwohl nicht unbedingt mit g(x) 6= 0 für alle x ∈ D). Nach Satz 10.2 ist g an der Stelle a stetig und damit gibt es ein ε > 0, so dass g(x) 6= 0 für alle x ∈ BD (a, ε). Nun ist a Häufungspunkt von E = BD (a, ε) und nach Lemma 10.4 sind fE und gE in a differenzierbar mit fE′ (a) = f ′ (a) und gE′ (a) = g ′ (a). Dies bedeutet, dass, obwohl g die Bedingung in Satz 10.3 (3) nicht unbedingt erfüllt, dieser Satz immer noch auf die Abbildungen fE und gE angewendet werden können. Satz 10.4 (Kettenregel) Sei E eine weitere nichtleere Teilmenge von K und sei b ∈ E ein Häufungspunkt von E. Sei f : D → K differenzierbar in a mit f (D) ⊂ E und f (a) = b und sei g : E → K differenzierbar in b. Dann ist die zusammengesetzte Abbildung g ◦ f : D → K differenzierbar in a und es gilt (g ◦ f )′ (a) = g ′(f (a))f ′ (a) . Beweis Da f in a differenzierbar ist, gibt es nach Satz 10.1 eine an der Stelle a stetige Abbildung r : D → K mit r(a) = 0, so dass f (x) = f (a) + f ′ (a)(x − a) + r(x)(x − a) = f (a) + f ′ (a) + r(x) (x − a) für alle x ∈ D, und da g in b differenzierbar ist, gibt es eine an der Stelle b stetige Abbildung s : E → K mit s(b) = 0, so dass g(y) = g(b) + g ′(b)(y − b) + s(y)(y − b) = g(b) + g ′(b) + s(y) (y − b) 10 Differentiation 73 für alle y ∈ E. Für alle x ∈ D ist dann (g ◦ f )(x) = g(f (x)) = g(f (a)) + g ′ (f (a)) + s(f (x)) f (x) − f (a) = g(f (a)) + g ′ (f (a)) + s(f (x)) f ′ (a) + r(x) (x − a) = (g ◦ f )(a) + g ′ (f (a))f ′ (a)(x − a) + t(x)(x − a) , wobei t : D → K durch t(x) = s(f (x))r(x) + g ′(f (a))r(x) + s(f (x))f ′ (a) für alle x ∈ D gegeben ist. Aber nach Satz 7.4 und Satz 7.5 ist t and der Stelle a stetig und t(a) = s(f (a))r(a) + g ′(f (a))r(a) + s(f (a))f ′ (a) = 0. Daraus ergibt sich nach Satz 10.1, dass g ◦ f in a differenzierbar ist und (g ◦ f )′ (a) = g ′ (f (a))f ′ (a). Lemma 10.5 Sei f : D → K injektiv und stetig an der Stelle a. Dann ist f (b) Häufungspunkt von E = f (D). Beweis Sei ε > 0; da f an der Stelle a stetig ist, gibt es ein δ > 0, so dass |f (x) − f (a)| < ε für alle x ∈ D mit |x − a| < δ. Damit ist f (x) ∈ BE (f (a), ε) für alle x ∈ BD (a, δ), d.h. f (BD (a, δ)) ⊂ BE (f (a), ε). Folglich ist f (BD (a, δ) \ {a} Teilmenge von BE (f (a), ε) \ {f (a)}, da f injektiv ist. Aber BD (a, δ) \ {a} ist nichtleer, da a Häufungspunkt von D ist, und also ist BE (f (a), ε) \ {f (a)} auch nichtleer. Dies zeigt, dass f (a) Häufungspunkt von E ist. Ist f : D → K injektiv und differenzierbar in a, so ist nach Satz 10.2 und Lemma 10.5 f (b) Häufungspunkt von E = f (D). Satz 10.5 Sei f : D → K injektiv und in a differenzierbar. Setze E = f (D) und nehme an, dass die Umkehrabbildung f −1 : E → K an der Stelle b = f (a) stetig ist. Dann ist f −1 in b differenzierbar genau, wenn f ′ (a) 6= 0. In diesem Fall ist (f −1 )′ (b) = 1 f ′ (a) . Beweis Nehme zunächst an, dass f ′ (a) 6= 0, und sei {yn }n≥p eine Folge aus E\{b}, die gegen b konvergiert. Für jedes n ≥ p setze xn = f −1 (yn ); dann ist {xn }n≥p eine Folge aus D \ {a} (da f (xn ) = y 6= f (a)), die gegen a konvergiert, da f −1 an der Stelle b stetig ist. Nach Voraussetzung ist f in a differenzierbar, und daher ist limn→∞ (f (xn ) − f (a))/(xn − a) = f ′ (a) 6= 0. Ferner ist f (xn ) − f (a) 6= 0 für alle n ≥ p, da xn 6= a und f injektiv ist, und daraus folgt nach Satz 5.6, dass f −1 (yn ) − f −1 (b) 1 xn − a lim = lim = ′ . n→∞ n→∞ yn − b f (xn ) − f (a) f (a) Damit ist f −1 in b differenzierbar und es gilt (f −1 )′ (b) = 1/f ′ (a). 10 Differentiation 74 Nehme nun umgekehrt an, dass f −1 in b differenzierbar ist. Nach Satz 10.4 ist f −1 ◦ f in a differenzierbar und (f −1 ◦ f )′(a) = (f −1 )′ (b)f ′ (a). Aber f −1 ◦ f = idD und offensichtlich ist id′D (a) = 1; d.h. (f −1 )′ (b)f ′ (a) = 1. Daher ist f ′ (a) 6= 0 und (f −1 )′ (b) = 1/f ′(a). Lemma 10.6 Sei D Teilmenge von R; eine Abbildung f : D → C ist genau dann in a differenzierbar, wenn Re f und Im f in a differenzierbar sind. In diesem Fall gilt f ′ (a) = (Re f )′ (a) + i(Im f )′ (a). Bemerkung: Die Differenzierbarkeit von f in a ist hier natürlich mit K = C definiert und insbesondere wird D als Teilmenge von C angesehen. Beweis Übung. Die Teilmenge D heißt perfekt, wenn jedes a ∈ D ein Häufungspunkt von D ist. Lemma 10.7 (1) Jede offene Teilmenge von K ist perfekt. (2) Jede perfekte Teilmenge von R ist auch eine perfekte Teilmenge von C. (3) Jedes Intervall, das mehr als einen Punkt enthält, ist perfekt. Beweis Übung. Im Folgenden sei D eine nichtleere perfekte Teilmenge von K. Eine Abbildung f : D → K heißt differenzierbar, wenn f in a differenzierbar ist für jedes a ∈ D. Satz 10.6 Seien c0 , . . . , cn ∈ K (mit n ≥ 0) und sei f : D → K die durch f (x) = c0 + c1 x + c2 x2 + · · · + cn xn für alle x ∈ D gegebene Abbildung. Dann ist f differenzierbar und f ′ (a) = c1 + 2c2 a + · · · + ncn an−1 für alle a ∈ D. Beweis Für jedes n ≥ 0 definiere hn : D → R durch hn (x) = xn für alle x ∈ D; (insbesondere ist dann h0 (x) = 1 für alle x ∈ D). Es ist klar, dass h0 und h1 differenzierbar sind und h′0 (a) = 0 und h′1 (a) = 1 für alle a ∈ D. Sei nun n ≥ 1 und nehme an, dass hn differenzierbar ist und dass h′n (a) = nan−1 für alle a ∈ D. Da hn+1 = h1 · hn , ist dann nach Satz 10.3 (2) auch hn+1 differenzierbar und h′n+1 (a) = (h1 · hn )′ (a) = h1 (x)h′n (a) + h′1 (x)hn (a) = a · nan−1 + 1 · an = (n + 1)an 10 Differentiation 75 für alle a ∈ D. Daraus folgt durch Induktion nach n, dass hn differenzierbar ist für jedes n ≥ 0 und h′n (a) = nan−1 für alle a ∈ D, n ≥ 1. Damit ist nach Satz 10.3 (1) f = c0 h0 + c1 h1 + · · · + cn hn differenzierbar und es gilt f ′ (a) = c0 h′0 (a) + c1 h′1 (a) + · · · + cn h′n (a) = c1 + 2c2 a + · · · + ncn an−1 für alle a ∈ D. Satz 10.7 Nehme an, dass 0 ∈ / D und sei n ≥ 1. Dann ist die durch gn (x) = 1/xn definierte Abbildung gn : D → K differenzierbar und für alle a ∈ D gilt gn′ (a) = − n an+1 . Beweis Es gilt gn = 1/hn , wobei hn : D → K wie im Beweis für Satz 10.6 ist, und daraus folgt nach Satz 10.3 (3), dass gn differenzierbar ist und gn′ (a) = 1 ′ −nan−1 n 0 · hn (a) − 1 · h′n (a) = = − n+1 (a) = 2 2n hn hn (a) a a für alle a ∈ D. Satz 10.8 (1) Die Abbildung exp : K → K ist differenzierbar und exp′ = exp. (2) Die Abbildung cis : R → C ist differenzierbar und cis′ = i cis. (3) Die Abbildungen cos, sin : R → R sind beide differenzierbar mit cos′ = − sin und sin′ = cos. Beweis (1) Sei a ∈ K und ε > 0; setze η = exp −(1 + |a|) ε und δ = min{η, 1}. Für alle x ∈ K \ {a} mit |x − a| < δ ist dann nach Satz 6.10 (4) exp(x) − exp(a) |x − a| − exp(a) ≤ exp(|x − a|) exp(|a|) x−a 2 |x − a| exp(1 + |a|) < η exp(1 + |a|) = ε , ≤ 2 und daraus folgt, dass limx→a (exp(x) − exp(a))/(x − a) = exp(a). Damit ist exp in a differenzierbar und exp′ (a) = exp(a). (2) Definiere f : C → C durch f (z) = exp(iz) für alle z ∈ C. Dann ist f = exp ◦h, wobei h(z) = iz für alle z ∈ C, und daraus ergibt sich nach (1), Satz 10.4 und Satz 10.6, dass f differenzierbar ist und f ′ (a) = (exp ◦h)′ (a) = exp′ (h(a))h′ (a) = i exp(ia) = if (a) . 10 Differentiation 76 Aber cis ist die Einschränkung von f auf R und folglich gilt nach Lemma 10.4, dass cis differenzierbar ist und cis′ (a) = f ′ (a) = if (a) = i cis(a) für alle a ∈ R. (3) Da cos = Re cis und sin = Im cis, sind nach (2) und Lemma 10.6 cos und sin differenzierbar und cos′ (a) = Re(cis′ (a)) = Re(i cis(a)) = − Im cis(a) = − sin(a) und sin′ (a) = Im(cis′ (a)) = Im(i cis(a)) = Re cis(a) = cos(a) für alle a ∈ R. Satz 10.9 Die Abbildung log : (0, +∞) → R ist differenzierbar und es gilt log′ (a) = 1 a für alle a ∈ (0, +∞). Beweis Sei a ∈ (0, +∞) und setze c = log(a). Nun ist exp in c differenzierbar, log ist an der Stelle a = exp(c) stetig und exp′ (c) 6= 0. Daraus folgt nach Satz 10.5, dass die Abbildung log in a differenzierbar ist und log′ (a) = 1 1 1 = = . exp′ (c) exp(c) a Sei f : D → K differenzierbar; es gibt also eine Abbildung f ′ : D → K, d.h. die Abbildung x 7→ f ′ (x). Sie heißt die Ableitung von f . In vielen Anwendungen sind die auftretenden Abbildungen differenzierbar (und nicht nur differenzierbar in einem Punkt). Es ist also nützlich, über Versionen der Sätze 10.3, 10.4 und 10.5 zu verfügen, die auf diesen Fall zugeschnitten sind. Satz 10.10 Seien f, g : D → K differenzierbare Abbildungen (1) Für alle λ, µ ∈ K ist die Abbildung λf + µg differenzierbar mit (λf + µg)′ = λf ′ + µg ′ . (2) Die Abbildung f · g ist differenzierbar mit (f · g)′ = f · g ′ + f ′ · g . (3) Ist g(x) 6= 0 für alle x ∈ D, so ist die Abbildung f /g differenzierbar mit f ′ g = f ′ · g − f · g′ . g2 Beweis Dies folgt unmittelbar aus Satz 10.3. 10 Differentiation 77 Satz 10.11 (Kettenregel) Sei E eine weitere nichtleere perfekte Teilmenge von K. Seien f : D → K und g : E → K differenzierbare Abbildungen mit f (D) ⊂ E. Dann ist die zusammengesetzte Abbildung g ◦ f : D → K differenzierbar mit (g ◦ f )′ = (g ′ ◦ f ) · f ′ . Beweis Dies folgt unmittelbar aus Satz 10.4, da für alle a ∈ D (g ◦ f )′ (a) = g ′(f (a))f ′ (a) = (g ′ ◦ f ) · f ′ (a) . Ist die Abbildung f : D → K injektiv und differenzierbar, so ist nach Satz 10.2 und Lemma 10.5 E = f (D) eine perfekte Teilmenge von K. Satz 10.12 Sei f : D → K injektiv und differenzierbar. Setze E = f (D) und nehme an, dass die Umkehrabbildung f −1 : E → K stetig ist. Dann ist f −1 differenzierbar genau, wenn f ′ (a) 6= 0 für alle a ∈ D. In diesem Fall ist (f −1 )′ = 1 ◦ f −1 . ′ f Beweis Dies folgt unmittelbar aus Satz 10.5, da für alle a ∈ D 1 1 −1 −1 ′ (a) . = ◦f (f ) (a) = ′ −1 f (f (a)) f′ Sei f : D → K differenzierbar; im Folgenden wird die Abbleitung f ′ auch mit ∂f bezeichnet. Sei nun a ∈ D; ist die Abbildung ∂f : D → K in a differenzierbar, so heißt die Ableitung (∂f )′ (a) von ∂f in a die zweite Ableitung von f in a und sie wird mit ∂ 2 f (a) oder f ′′ (a) bezeichnet. Ist ∂f : D → K differenzierbar, so gibt es eine Abbildung ∂ 2 f : D → K. Natürlich kann dieser Prozeß induktiv fortgesetzt werden: Setze ∂ 0 f = f , ∂ 1 f = ∂f und sei n ≥ 1; f : D → K heißt n-mal in a differenzierbar, wenn sie (n − 1)-mal differenzierbar ist und die Abbildung ∂ n−1 f : D → K in a differenzierbar ist. Nun heißt f n-mal differenzierbar, wenn sie (n − 1)-mal differenzierbar ist und die Abbildung ∂ n−1 f : D → K differenzierbar ist. Die Ableitung (∂ n−1 f )′ (a) von ∂ n−1 f in a wird mit ∂ n f (a) bezeichnet. Ist f n-mal differenzierbar, so gibt es eine Abbildung ∂ n f : D → K. Schließlich heißt eine Abbildung f : D → K n-mal stetig differenzierbar, wenn sie n-mal differenzierbar ist und die Abbildung ∂ n f : D → K stetig ist. Im Folgenden sei K = R, also ist D nun eine Teilmenge von R. Eine Abbildung f : D → R heißt in a rechtsseitig differenzierbar, wenn a ein Häufungspunkt von 10 Differentiation 78 D ∩ [a, +∞) ist und die Einschränkung von f auf D ∩ [a, +∞) in a differenzierbar ist. In diesem Fall heißt die Ableitung in a von dieser Einschränkung rechtsseite Abbleitung von f in a und wird mit ∂+ f (a) bezeichnet. Analog wird linksseitige Differenzierbarkeit definiert: Die Abbildung f heißt in a linksseitig differenzierbar, wenn a ein Häufungspunkt von D ∩ (−∞, a] ist und die Einschränkung von f auf D ∩ (−∞, a] in a differenzierbar ist. In diesem Fall heißt die Ableitung in a von dieser Einschränkung linksseite Abbleitung von f in a und wird mit ∂− f (a) bezeichnet. Ist a ein Häufungspunkt von D ∩ [a, +∞), so ist f in a rechtsseitig differenzierbar genau dann, wenn es ein c ∈ R gibt, so dass f (xn ) − f (a) =c n→∞ xn − a lim für jede Folge {xn }n≥p aus D ∩ (a, +∞), die gegen a konvergiert; ferner ist in diesem Fall c = ∂+ f (a). Eine analoge Aussage gilt natürlich für linksseitige Differenzierbarkeit in a. Lemma 10.8 Ein Punkt b ∈ R ist Häufungspunkt von D genau dann, wenn b Häufungspunkt von mindestens einer der Mengen D ∩ [b, +∞) und D ∩ (−∞, b] ist. Beweis Dies ist klar. Im Folgenden sei f : D → R eine Abbildung. Lemma 10.9 (1) Sei a ein Häufungspunkt von D ∩[a, +∞), der kein Häufungspunkt von D ∩ (−∞, a] ist. Dann ist f in a differenzierbar genau, wenn f in a rechtsseitig differenzierbar ist, und in diesen Fall ist ∂f (a) = ∂+ f (a). (2) Sei a ein Häufungspunkt von D ∩ (−∞, a]), der kein Häufungspunkt von D ∩ [a, +∞) ist. Dann ist f in a differenzierbar genau, wenn f in a linksseitig differenzierbar ist, und hier ist ∂f (a) = ∂− f (a). Beweis (1) Dies folgt aus der folgenden Tatsache: Da a kein Häufungspunkt von D ∩ (−∞, a] ist, gibt es ein ε > 0, so dass D ∩ (a − ε, a) = ∅. Ist also {xn }n≥p eine Folge aus D \ {a}, die gegen a konvergiert, dann existiert ein q ≥ p, so dass xn ∈ D ∩ (a, +∞) für alle n ≥ q. (2) Dies ist analog zu beweisen. Nehme nun an, a ist Häufungspunkt von sowohl D∩(−∞, a] als auch D∩[a, +∞). 10 Differentiation 79 Satz 10.13 Die Abbildung f ist in a differenzierbar genau dann, wenn f in a linksseitig und rechtseitig differenzierbar ist und ∂− f (a) = ∂+ f (a). In diesem Fall ist ∂f (a) = ∂− f (a) = ∂+ f (a). Beweis Sei f+ (bzw. f− ) die Einschränkung von f auf D ∩ [a, +∞) (bzw. auf D ∩ (−∞, a]). Ist f in a differenzierbar, so sind nach Lemma 10.4 f+ und f− in a differenzierbar und es gilt f+′ (a) = f ′ (a) = f−′ (a). Mit anderen Worten: Ist f in a differenzierbar, so ist f in a linksseitig und rechtseitig differenzierbar und es gilt ∂− f (a) = f+′ (a) = f−′ (a) = ∂+ f (a). Nehme nun an, f ist in a sowohl linksseitig als auch rechtsseitig differenzierbar und es gilt ∂− f (a) = ∂+ f (a). Dann sind f+ und f− in a differenzierbar und f+′ (a) = f−′ (a). Nach Satz 10.1 gibt es also an der Stelle a stetige Abbildungen r+ : D ∩ [a, +∞) → R und r− : D ∩ (−∞, a] → R mit r+ (a) = r− (a) = 0, so dass f (x) = f+ (x) = f (a) + f+′ (a)(x − a) + r+ (x)(x − a) für alle x ∈ D ∩ [a, +∞) und f (x) = f− (x) = f (a) + f−′ (a)(x − a) + r− (x)(x − a) für alle x ∈ D ∩ (−∞, a]. Sei nun r : D → R die Abbildung, die definiert ist durch r+ (x) , falls x ∈ D ∩ [a, +∞), r(x) = r− (x) , falls x ∈ D ∩ (−∞, a). Dann ist r(a) = 0 und man sieht leicht, dass r an der Stelle a stetig ist. Ferner ist f (x) = f (a) + c(x − a) + r(x)(x − a) für alle x ∈ D, wobei c = f+′ (a) = f−′ (a). Daraus folgt nach Satz 10.1, das f in a differenzierbar ist und es gilt f ′ (a) = c, d.h. ∂f (a) = ∂− f (a) = ∂+ f (a), da ∂− f (a) = f+′ (a) und ∂+ f (a) = f−′ (a). 11 Mittelwertsätze Im Folgenden sei D stets eine nichtleere Teilmenge von R (es wird hier nur der Fall K = R betrachtet). Sei f : D → R eine Abbildung; dann hat f in a ∈ D ein lokales Minimum (bzw. lokales Maximum), wenn es ein ε > 0 gibt, so dass f (a) ≤ f (x) (bzw. f (a) ≥ f (x)) für alle x ∈ D mit |x − a| < ε. Man sagt dann, dass f in a ein lokales Extremum besitze, wenn f in a entweder ein lokales Minimum oder ein lokales Maximum hat. Ein Punkt a ∈ D heißt innerer Punkt von D, wenn es ein ε > 0 gibt, so dass {x ∈ R : |x − a| < ε} ⊂ D. Mit anderen Worten: wenn es ein ε > 0 gibt, so dass BR (a, ε) = (a − ε, a + ε) ⊂ D. Insbesondere ist jeder innere Punkt von D Häufungspunkt von D. Ferner ist D eine offene Teilmenge von R genau dann, wenn jeder Punkt in D ein innerer Punkt ist. Die Menge der inneren Punkte von D heißt das Innere von D und wird mit D ◦ bezeichnet. Lemma 11.1 Sei f : D → R eine Abbildung und a ∈ D ◦ . Besitzt f in a ein lokales Extremum und is f in a differenzierbar, so ist f ′ (a) = 0. Beweis Da a innerer Punkt von D ist, gibt es ein ε > 0, so dass (a−ε, a+ε) ⊂ D. Definiere eine Abbildung g : D \ {a} → R durch g(x) = f (x) − f (a) x−a für alle x ∈ D \ {a}; also ist limx→a g(x) = f ′ (a). Nehme an, f besitzt in a ein lokales Minimum. Dann gibt es ein ε′ > 0, so dass f (a) ≤ f (x) für alle x ∈ D mit |x − a| < ε′ . Setze δ = min{ε, ε′}; dann ist (a − δ, a + δ) ⊂ D und f (a) ≤ f (x) für alle x ∈ (a − δ, a + δ). Für jedes n ≥ 2 sei xn = a − δn−1 und x′n = a + δn−1 ; dann sind {xn }n≥2 und {x′n }n≥2 beide Folgen aus D\{a}, die gegen a konvergieren, und daraus folgt, dass die Folgen {g(xn )}n≥2 und {g(x′n )}n≥2 gegen f ′ (a) konvergieren. Aber für jedes n ≥ 2 ist g(xn ) ≤ 0 und g(x′n ) ≥ 0, da f (xn ) − f (a) ≥ 0, f (x′n ) − f (a) ≥ 0, xn − a < 0 und x′n − a > 0. Damit ist nach Satz 5.3 0 ≤ lim g(x′n ) = f ′ (a) = lim g(xn ) ≤ 0 ; , n→∞ n→∞ d.h. f ′ (a) = 0. Für ein lokales Maximum ist das Lemma analog zu beweisen. Sei E eine nichtleere Teilmenge von D, die perfekt ist. Eine Abbildung f : D → R heißt dann in E differenzierbar, wenn f in c differenzierbar ist für jedes c ∈ E. 80 11 Mittelwertsätze 81 Im Folgenden sei I ein Intervall, das mehr als einen Punkt enthält. Dann ist I ◦ auch ein Intervall, das mehr als einen Punkt enthält, und I \ I ◦ besteht aus höchstens zwei Elementen (den ‘Endpunkten’ von I). Sind a, b ∈ I mit a < b, so ist [a, b] ⊂ I und (a, b) ⊂ I ◦ . Satz 11.1 (Satz von Rolle) Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist, und seien a, b ∈ I mit a < b. Ist f (a) = f (b), dann gibt es ein ξ ∈ (a, b), so dass f ′ (ξ) = 0 (und hier ist f ′ (ξ) definiert, da ξ ∈ (a, b) ⊂ I ◦ ). Beweis Da [a, b] folgenkompakt ist, gibt es nach Satz 8.3 u, v ∈ [a, b], so dass f (u) ≤ f (x) ≤ f (v) für alle x ∈ [a, b]. Ist f (u) = f (v), so ist f (x) = f (u) für alle x ∈ [a, b] und in diesem Fall ist f ′ (ξ) = 0 für jedes ξ ∈ (a, b). Nehme also an, dass f (u) 6= f (v), d.h. f (u) < f (v); dann gibt es ξ ∈ {u, v} mit f (ξ) 6= f (a) = f (b). Insbesondere ist ξ ∈ (a, b) und damit ist ξ ∈ I ◦ . Ferner besitzt f in ξ ein lokales Extremum, da f (ξ) ≤ f (x) (bzw. f (ξ) ≥ f (x)) für alle x ∈ [a, b]. Daraus folgt nach Lemma 11.1, dass f ′ (ξ) = 0. Satz 11.2 (Mittelwertsatz) Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist, seien a, b ∈ I mit a < b. Dann gibt es ein ξ ∈ (a, b), so dass f ′ (ξ) = f (b) − f (a) b−a (und wieder ist f ′ (ξ) definiert, da ξ ∈ (a, b) ⊂ I ◦ ). Beweis Setze c = (f (b) − f (a))/(b − a) und definiere eine Abbildung g : I → R durch g(x) = f (x) − cx für jedes x ∈ I. Nach Satz 7.4 und Satz 10.3 (1) ist g stetig und in I ◦ differenzierbare, und es gilt g(a) = f (a) − ca = bf (a) − af (b) = f (b) − cb = g(b) . b−a Nach Satz 11.1 gibt es also ξ ∈ (a, b) mit g ′ (ξ) = 0. Damit ist nach Satz 10.3 (1) f ′ (ξ) = g ′(ξ) + c = 0 + c = f (b) − f (a) . b−a Satz 11.3 (Zweiter Mittelwertsatz) Seien f, g : I → R stetige Abbildungen, die in I ◦ differenzierbar sind, und seien a, b ∈ I mit a < b. Nehme an, dass g ′ (x) 6= 0 für alle x ∈ (a, b). Dann gibt es ein ξ ∈ (a, b), so dass f (b) − f (a) f ′ (ξ) = ′ g (ξ) g(b) − g(a) (und nach Satz 11.1 ist hier g(b) 6= g(a), da g ′(x) 6= 0 für alle x ∈ (a, b)). 11 Mittelwertsätze 82 Beweis Da g(b) 6= g(a), kann eine Abbildung h : I → R definiert werden durch h(x) = f (x) − f (b) − f (a) g(x) − g(a) g(b) − g(a) für alle x ∈ I. Nach Satz 7.4 und Satz 10.3 (1) ist h eine stetige Abbildung, die in I ◦ differenzierbar ist. Ferner ist h(a) = h(b) = f (a), und daraus folgt nach Satz 11.1, dass es ein ξ ∈ (a, b) mit h′ (ξ) = 0 gibt. Damit ist f ′ (ξ) f (b) − f (a) ′ 1 ′ f (b) − f (a) ′ f (ξ) − = ′ g (ξ) + g (ξ) g ′ (ξ) g (ξ) g(b) − g(a) g(b) − g(a) f (b) − f (a) ′ 1 ′ h (ξ) + g (ξ) = ′ g (ξ) g(b) − g(a) 1 f (b) − f (a) ′ f (b) − f (a) g (ξ) = . = ′ g (ξ) g(b) − g(a) g(b) − g(a) Satz 11.4 Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist. (1) f ist monoton wachsend (bzw. monoton fallend) genau dann, wenn f ′ (x) ≥ 0 (bzw. f ′ (x) ≤ 0) für alle x ∈ I ◦ . (2) Gilt f ′ (x) > 0 (bzw. f ′ (x) < 0) für alle x ∈ I ◦ , so ist f streng monoton wachsend (bzw. streng monoton fallend). Beweis (1) Nehme zunächst an, dass f monoton wachsend ist und sei x ∈ I ◦ . Da x ein innerer Punkt von I ist, gibt es ε > 0, so dass (x − ε, x + ε) ⊂ I. Für jedes n ≥ 2 sei xn = x + εn−1 ; dann ist {xn }n≥2 eine Folge aus I \ {x}, die gegen x konvergiert und da f (xn ) ≥ f (x) und xn > x für alle n ≥ 2, ist dann nach Satz 5.3 f (xn ) − f (x) f ′ (x) = lim ≥0. n→∞ xn − x Nehme umgekehrt an, dass f ′ (x) ≥ 0 für alle x ∈ I ◦ und seien x, y ∈ I mit x < y. Nach Satz 11.2 gibt es dann ein ξ ∈ (x, y), so dass f ′ (ξ) = (f (y) − f (x))/(y − x). Damit ist f (y) − f (x) = (y − x)f ′ (ξ) ≥ 0 d.h. f (y) ≥ f (x), und dies zeigt, dass f monoton wachsend ist. (2) Dies folgt genau wie in dem zweiten Teil von (1). Die restlichen Aussagen (für ein monoton fallende Abbildung f und die entsprechenden Eigenschaften von ihrer Ableitung f ′ ) sind analog zu beweisen. Die Umkehrung von Satz 11.4 (2) ist falsch: Sei f : R → R gegeben durch f (x) = x3 für alle x ∈ R. Dann ist f streng monoton wachsend, aber f ′ (x) = 3x2 für alle x ∈ R und insbesondere ist f ′ (0) = 0. 11 Mittelwertsätze 83 Satz 11.5 Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist. Gilt f ′ (x) 6= 0 für alle x ∈ I ◦ , so ist entweder f ′ (x) > 0 für alle x ∈ I ◦ oder f ′ (x) < 0 für alle x ∈ I ◦ . Insbesondere ist (nach Satz 11.4 (2)) f streng monoton. Beweis Die Abbildung f ist injektiv: Gäbe es x, y ∈ I mit x < y und f (x) = f (y), so wäre nach Satz 11.1 f ′ (ξ) = 0 für ein ξ ∈ (x, y). Damit ist nach Satz 7.10 f streng monoton und insbesondere monoton. Daraus folgt nach Satz 11.4 (1), dass entweder f ′ (x) ≥ 0 für alle x ∈ I ◦ oder f ′ (x) ≤ 0 für alle x ∈ I ◦ . Aber nach Voraussetzung ist f ′ (x) 6= 0 für alle x ∈ I ◦ , und folglich ist entweder f ′ (x) > 0 für alle x ∈ I ◦ oder f ′ (x) < 0 für alle x ∈ I ◦ . Satz 11.6 Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist. Dann ist f ′ (I ◦ ) ein Intervall: Sind a, b ∈ I ◦ und ist c eine Zahl zwischen f ′ (a) und f ′ (b), so gibt es ein u ∈ I ◦ mit f ′ (u) = c. Beweis Seien a, b ∈ I ◦ und sei c zwischen f ′ (a) und f ′ (b). Ist c = f ′ (a) (bzw. ist c = f ′ (b)), so kann man einfach u = a (bzw. u = b) nehmen. Es kann also angenommen werden, dass c verschieden von f ′ (a) und f ′ (b) ist. Definiere eine Abbildung g : I → R durch g(x) = f (x) − cx für alle x ∈ I. Nach Satz 7.4 und Satz 10.3 (1) ist g stetig und in I ◦ differenzierbar. Ferner ist g ′(x) = f ′ (x) − c für alle x ∈ I ◦ , und damit ist entweder g ′(a) > 0 und g ′ (b) < 0 oder g ′ (a) < 0 und g ′ (b) > 0. Daraus folgt nach Satz 11.5, dass g ′(u) = 0 für ein u ∈ I ◦ , und dann ist f ′ (u) = c. Satz 11.6 ist eine Art Zwischenwertsatz für Ableitungen. Man merke aber: Ist f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist, so ist f ′ im allgemeinen keine stetige Abbildung. Satz 11.7 Sei f : I → R eine stetige Abbildung. Dann ist f konstant genau, wenn f in I ◦ differenzierbar ist und f ′ (x) = 0 für alle x ∈ I ◦ . Beweis Nehme zunächst an, dass f in I ◦ differenzierbar ist und f ′ (x) = 0 für alle x ∈ I ◦ . Dann ist nach Satz 11.4 (1) f sowohl monoton wachsend als auch monoton fallend, und damit ist f konstant. Die Umkehrung ist trivial richtig. Satz 11.8 Sei a ∈ I und seien b, c ∈ R. Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist und für die gilt: f (a) = b und f ′ (x) = cf (x) für alle x ∈ I ◦ . Dann gilt f (x) = b exp c(x − a) für alle x ∈ I. 11 Mittelwertsätze 84 Beweis Definiere g : I → R durch g(x) = exp −c(x − a) für alle x ∈ I. Nach Satz 7.1 und Satz 7.5 ist g stetig und nach Satz 10.8 (1), Satz 10.4 und Lemma 10.4 ◦ ′ ist g differenzierbar in I mit g (x) = −c exp −c(x − a) = −cg(x). Nun ist nach Satz 7.4 die Produktabbildung f ·g stetig, nach Satz 10.3 (2) ist f ·g differenzierbar in I ◦ und es gilt (f · g)′(x) = f (x)g ′ (x) + f ′ (x)g(x) = f (x) −cg(x) + cf (x) g(x) = 0 für alle x ∈ I ◦ . Daraus ergibt sich nach Satz 11.7, dass f · g konstant ist, und folglich ist (f · g)(x) = (f · g)(a) für alle x ∈ I. Für alle x ∈ I ist also f (x) = f (a)g(a) 1 1 = b exp c(x − a) . =b g(x) exp −c(x − a) Eine Abbildung f : I → R heißt konvex, wenn für alle x, y ∈ I und alle t ∈ [0, 1] f (1 − t)x + ty ≤ (1 − t)f (x) + tf (y) . Satz 11.9 Für eine Abbildung f : I → R sind äquivalent: (1) f ist konvex. (2) Für alle a, b ∈ I mit a < b und alle x ∈ [a, b] gilt f (x) ≤ f (a) + f (b) − f (a) (x − a) . b−a (3) Für alle a, b ∈ I mit a < b und alle x ∈ (a, b) gilt f (x) − f (a) f (b) − f (a) f (b) − f (x) ≤ ≤ . x−a b−a b−x (4) Für alle a, b, a′ , b′ ∈ I mit a < b, a′ < b′ , a ≤ a′ und b ≤ b′ gilt f (b′ ) − f (a′ ) f (b) − f (a) ≤ . b−a b′ − a′ (5) Für alle a, b, a′ , b′ ∈ I mit a < b ≤ a′ < b′ gilt f (b) − f (a) f (b′ ) − f (a′ ) ≤ . b−a b′ − a′ 11 Mittelwertsätze 85 Beweis (1) ⇒ (2): Seien a, b ∈ I mit a < b und x ∈ [a, b]. Setze t = (x−a)/(b−a); dann ist t ∈ [0, 1] und x = (1 − t)a + tb, und damit ist f (x) = f (1 − t)a + tb (b − x)f (a) + (x − a)f (b) ≤ (1 − t)f (a) + tf (b) = b−a (b − a)f (a) + f (b) − f (a) (x − a) f (b) − f (a) = f (a) + (x − a) . = b−a b−a (2) ⇒ (3): Seien a, b ∈ I mit a < b und x ∈ (a, b). Dann folgt f (x) − f (a) f (b) − f (a) ≤ x−a b−a unmittelbar aus (2). Ferner gilt aber f (b) − f (a) (x − a) f (b) − f (x) ≥ f (b) − f (a) − b−a f (b) − f (a) (b − a) − f (b) − f (a) (x − a) f (b) − f (a) = = (b − x) b−a b−a und daraus ergibt sich, dass auch (f (b) − f (a))/(b − a) ≤ (f (b) − f (x))/(b − x). (3) ⇒ (4): Seien a, b, a′ , b′ ∈ I mit a < b, a′ < b′ , a ≤ a′ und b ≤ b′ . Dann ist b ∈ (a, b′ ] und damit folgt aus der ersten Ungleichung in (3), dass f (b′ ) − f (a) f (b) − f (a) ≤ , b−a b′ − a da diese Ungleichung trivial richtig ist, wenn b = b′ . Andererseits ist a′ ∈ [a, b′ ), und nach der zweiten Ungleichung in (3) ist dann f (b′ ) − f (a) f (b′ ) − f (a′ ) ≤ , b′ − a b′ − a′ da diese Ungleichung trivial richtig ist, wenn a = a′ . Folglich ist f (b′ ) − f (a) f (b′ ) − f (a′ ) f (b) − f (a) ≤ ≤ . b−a b′ − a b′ − a′ (4) ⇒ (5): Dies ist klar. (5) ⇒ (1): Seien x, y ∈ I und t ∈ [0, 1]. Zu zeigen ist, dass f (1 − t)x + ty ≤ (1 − t)f (x) + tf (y) , 11 Mittelwertsätze 86 und dies ist trivial richtig, wenn x = y oder t ∈ {0, 1}. Es kann also im Folgenden angenommen werden, dass x 6= y und t ∈ (0, 1); ohne Beschränkung der Allgemeinheit sei x < y. Setze u = (1 − t)x + ty; dann ist u ∈ (x, y), und daraus folgt nach (5) (mit a = x, b = a′ = u und b′ = y), dass Daraus ergibt sich, dass f (y) − f (u) f (u) − f (x) ≤ . u−x y−u 1 (y − u) + (u − x) f (u) y−x 1 (y − u)f (x) + (u − x)f (y) ≤ y−x y−u u−x = f (x) + f (y) = (1 − t)f (x) + tf (y) . y−x y−x f (u) = Satz 11.10 Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist. Dann ist f konvex genau, wenn die Abbildung f ′ monoton wachsend ist. Beweis Nehme zunächst an, das f konvex ist, und seien x, y ∈ I ◦ mit x < y. Es gibt also ein ε > 0, so dass die beiden Intervalle (x − ε, x + ε) und (y − ε, y + ε) Teilmengen von I sind. Für jedes n ≥ 2 sei xn = x + εn−1 und yn = y + εn−1 . Dann ist {xn }n≥2 eine Folge aus I \ {x}, die gegen x konvergiert, und {yn }n≥2 ist eine Folge aus I \ {y}, die gegen y konvergiert. Daraus ergibt sich, dass f (xn ) − f (x) = f ′ (x) und n→∞ xn − x lim f (yn ) − f (y) = f ′ (y) . n→∞ yn − y lim Aber für jedes n ≥ 2 ist x < xn , y < yn , x ≤ y und xn ≤ yn und folglich ist f (xn ) − f (x) f (yn ) − f (y) ≤ xn − x yn − y nach Lemma 11.2 ((1) ⇒ (4)). Damit ist nach Satz 5.3 f ′ (x) ≤ f ′ (y), und dies zeigt, dass f ′ monoton wachsend ist. Nehme nun umgekehrt an, dass f ′ monoton wachsend ist, und seien a, b, a′ , b′ ∈ I mit a < b ≤ a′ < b′ . Nach Satz 11.2 gibt es ξ ∈ (a, b) und ξ ′ ∈ (a′ , b′ ), so dass f (b) − f (a) = f ′ (ξ) und b−a f (b′ ) − f (a′ ) = f ′ (ξ ′ ) . b′ − a′ Aber ξ < b ≤ a′ < ξ ′, damit ist f ′ (ξ) ≤ f ′ (ξ) und folglich f (b) − f (a) f (b′ ) − f (a′ ) ≤ . b−a b′ − a′ Also ist nach Lemma 11.2 ((5) ⇒ (1)) f konvex. 11 Mittelwertsätze 87 Satz 11.11 Sei f : I → R eine stetige Abbildung, die in I ◦ zweimal differenzierbar ist. Dann ist f konvex genau, wenn f ′′ (x) ≥ 0 für alle x ∈ I ◦ . Beweis Man merke, dass I ◦ auch ein Intervall ist, das mehr als einen Punkt enthält. Nach Satz 10.2 ist die Abbildung f ′ : I ◦ → R stetig und per Definition ist sie in (I ◦ )◦ = I ◦ differenzierbar. Daraus folgt nach Satz 11.4 (1), dass f ′ genau dann monoton wachsend ist, wenn f ′′ (x) ≥ 0 für alle x ∈ I ◦ . Daraus ergibt sich nach Satz 11.9, dass f genau dann konvex ist, wenn f ′′ (x) ≥ 0 für alle x ∈ I ◦ . Satz 11.12 Sei d > 0 und sei h : [0, d] → R eine stetige Abbildung, die in (0, d) differenzierbar ist. Nehme an, h(0) = 0 und limy→0 y ′ (x) = c für ein c ∈ R. Dann gilt limy→0 h(y)/y = c. Beweis Sei {yn }n≥p eine Folge aus (0, d], die gegen 0 konvergiert. Für jedes n ≥ p gibt es dann nach Satz 11.2 ein ξn ∈ (0, yn ), so dass h′ (ξn ) = h(yn ) − h(0) h(yn ) = . yn − 0 yn Da aber 0 < ξn < yn , ist {ξn }n≥p dann eine Folge aus (0, d), die auch gegen 0 konvergiert, und daraus ergibt sich, dass limn→∞ h(yn )/yn = limn→∞ h′ (ξn ) = c. Dies zeigt, dass limy→0 h(y)/y = c. Im Folgenden seien a, b ∈ R mit a < b und sei g : [a, b] → R eine stetige Abbildung, die in (a, b) differenzierbar ist. Es wird ferner angenommen, dass g(0) = 0 und dass g ′ (x) 6= 0 für alle x ∈ (a, b). Nach Satz 11.5 ist dann entweder g ′ (x) > 0 für alle x ∈ (a, b) oder g ′ (x) < 0 für alle x ∈ (a, b). In dem ersteren Fall ist g streng monoton wachsend und g(x) > 0 für alle x ∈ (0, b], und in dem letzteren Fall ist g streng monoton fallend und g(x) < 0 für alle x ∈ (0, b]. In beiden Fällen ist g(x) 6= 0 für alle x ∈ (a, b]. Satz 11.13 (Eine Regel von de l’Hospital) Sei f : [a, b] → R eine weitere stetige Abbildung mit f (a) = 0, die in (a, b) differenzierbar ist. Gibt es ein c ∈ R, so dass limx→a f ′ (x)/g ′(x) = c, so gilt auch limx→a f (x)/g(x) = c. Beweis In Beweis wird angenommen, dass g ′ (x) > 0 für alle x ∈ (a, b); (der andere Fall wird analog bewiesen). Damit ist g streng monoton wachsend und g bildet das Intervall [a, b] bijektiv auf das Intervall [0, d] ab, wobei d = g(b). Nach Satz 7.11 ist die Umkehrabbildung g −1 : [0, d] → [a, b] stetig; ferner ist nach Satz 10.5 g −1 in (0, d) differenzierbar und (g −1 )′ (g(x)) = 1/g ′(x) für jedes x ∈ (a, b). Betrachte nun die Zusammensetzung h = f ◦ g −1 : [0, d] → R von g −1 11 Mittelwertsätze 88 und f . Nach Satz 7.5 ist h stetig mit h(0) = f (g −1(0)) = f (a) = 0, und nach Satz 10.4 ist h in (0, d) differenzierbar und für alle x ∈ (a, b) gilt f ′ (x) h (g(x)) = (f ◦ g ) (g(x)) = f g (g(x)) · (g ) (g(x)) = ′ . g (x) ′ −1 ′ ′ −1 −1 ′ Sei jetzt {yn }n≥p eine Folge aus (0, d), die gegen 0 konvergiert, und für jedes n ≥ p setze xn = g −1(yn ). Dann ist {xn }n≥p eine Folge aus (a, b), die gegen a konvergiert, da g −1 stetig ist und g −1(0) = a. Nach Voraussetzung gilt also f ′ (xn ) =c. n→∞ g ′ (xn ) lim h′ (yn ) = lim h′ (g(xn )) = lim n→∞ n→∞ Daher ist lim h′ (y) = c und daraus folgt nach Lemma 11.3, dass lim h(y)/y = c. y→0 y→0 Sei {xn }n≥p eine Folge aus (a, b), die gegen a konvergiert, und für jedes n ≥ p setze diesmal yn = g(xn ). Dann ist {yn }n≥p eine Folge aus (0, d), die gegen 0 konvergiert, da g stetig ist und g(a) = 0. Damit ist lim n→∞ h(g(xn )) h(yn ) f (xn ) = lim = lim =c, n→∞ n→∞ g(xn ) g(xn ) yn und dies zeigt, dass lim f (x)/g(x) = c. x→a 12 Integration von Regelfunktionen Sei X eine Menge; der K-Vektorraum aller Abbildungen von X nach K wird mit Abb(X, K) bezeichnet. Eine Abbildung f : X → K heißt beschränkt, wenn es ein c ≥ 0 gibt, so dass |f (x)| ≤ c für alle x ∈ X, und die Menge aller beschränkten Abbildungen von X nach K wird dann mit B(X, K) bezeichnet. Es ist klar, dass B(X, K) ein Untervektorraum von Abb(X, K) ist. Für jedes f ∈ B(X, K) sei ||f || = sup{|f (x)| : x ∈ X} . Dann hat die Abbildung || · || : B(X, K) → K folgende Eigenschaften: (1) ||f || ≥ 0 und ||f || = 0 genau dan, wenn f = 0. (2) ||λf || = |λ| ||f || für alle f ∈ B(X, K), λ ∈ K. (3) ||f + g|| ≤ ||f || + ||g|| für alle f, g ∈ B(X, K). Im Folgenden sei I das abgeschlossene Intervall [a, b], wobei a, b ∈ R mit a < b. Seien a0 , . . . , an ∈ R; dann heißt U = (a0 , . . . , an ) eine Unterteilung von I, falls a = a0 < · · · < an = b. Sind U = (a0 , . . . , an ) und V = (b0 , . . . , bm ) Unterteilungen von I, so heißt V Verfeinerung von U, falls die Menge {a0 , . . . , an } Teilmenge der Menge {b0 , . . . , bm } ist. Seien U = (a0 , . . . , an ), V = (b0 , . . . , bm ) Unterteilungen von I; dann bezeichnet U ∨ V die Unterteilung (c0 , . . . , cq ), wobei c0 , . . . , cq die Elemente der Menge {a0 , . . . , an } ∪ {b0 , . . . , bm } in aufsteigender Reihenfolge sind. Es ist klar, dass U ∨ V eine Verfeinerung von U und von V ist. Eine Abbildung f : I → K heißt nun Treppenfunktion, wenn es eine Unterteilung U = (a0 , . . . , an ) von I gibt, so dass f konstant auf jedem der offenen Intervalle (aj−1 , aj ), j = 1, . . . , n, ist; U heißt dann eine Unterteilung für f und f ist eine Treppenfunktion zur Unterteilung U. Lemma 12.1 Ist U eine Unterteilung für eine Treppenfunktion f : I → K, so ist jede Verfeinerung von U auch eine Unterteilung für f . Beweis Dies ist klar. Die Menge aller Treppenfunktionen f : I → K wird mit T(I, K) bezeichnet; da jede Treppenfunktion beschränkt ist, ist T(I, K) ⊂ B(I, K). Satz 12.1 T(I, K) ist ein Untervektorraum von B(I, K). 89 12 Integration von Regelfunktionen 90 Beweis Es ist klar, dass 0 eine Treppenfunktion ist. Seien f, g ∈ T(I, K); wähle eine Unterteilung U für f und eine Unterteilung V für g. Für alle λ, µ ∈ K ist dann λf + µg konstant auf jedem der offenen Intervalle der Unterteilung U ∨ V, und damit ist λf + µg eine Treppenfunktion, d.h. λf + µg ∈ T(I, K). Sei U = (a0 , . . . , an ) eine Unterteilung für die Treppenfunktion f : I → K, und für jedes j = 1, . . . , n sei αj der Wert von f auf dem Intervall (aj−1, aj ). Setze Z n X f= αj (aj − aj−1 ) ; U j=1 dieses Element von K heißt das Integral von f bezüglich der Unterteilung U. Da n n n X X X αj (aj − aj−1 ) ≤ |αj (aj − aj−1 )| ≤ ||f ||(aj − aj−1 ) = (b − a)||f || , j=1 ist | R U j=1 j=1 f | ≤ (b − a)||f ||. Lemma 12.2 Sind U und V Unterteilungen für die Treppenfunktion f , so ist Z Z f= f. U V Beweis Seien U = (a0 , . . . , an ), V = (b0 , . . . , bm ), für 1 ≤ j ≤ n sei αj der Wert von f auf dem Intervall (aj−1, aj ) und für 1 ≤ k ≤ m sei βk der Wert von f auf dem Intervall (ak−1 , ak ). Nehme zunächst an, dass V eine Verfeinerung von U ist. Dann gibt es Indizes 0 = q0 < · · · < qn = m, so dass aj = bqj für jedes 0 ≤ j ≤ n; insbesondere ist βk = αj , falls qj−1 + 1 ≤ k ≤ qj . Daraus ergibt sich, dass Z n n X X f = αj (aj − aj−1 ) = αj (bqj − bqj−1 ) U j=1 = n X j=1 = m X k=1 j=1 qj αj X (bk − bk−1 ) = k=qj−1 +1 βk (bk − bk−1 ) = Z n X qj X j=1 k=qj−1 +1 βk (bk − bk−1 ) f. V Sind nun U und V beliebige Unterteilungen für f , so ist U ∨ V eine Verfeinerung von U und V, die nach Lemma 12.1 eineRUnterteilung fürRf ist, und folglich gilt R nach dem ersten Teil des Beweises, dass U f = U ∨V f = V f . R Da nach Lemma 12.2 das Intergral U f nicht von der Unterteilung U abhängt, Rb Rb Rb wird dieses einfach mit a f (oder etwa a f (x) dx) bezeichnet; das Element a f von K heißt dann das Integral von f . 12 Integration von Regelfunktionen 91 Rb Satz 12.2 Die Abbildung f 7→ a f von T(I, K) nach K ist linear, d.h. Z b Z b Z b (λf + µg) = λ f +µ g a a a für alle f, g ∈ T(I, K) und alle λ, µ ∈ K. Ferner gilt | f ∈ T(I, K). Rb a f | ≤ (b − a)||f || für alle Beweis Seien f, g ∈ T(I, K); wie im Beweis für Satz 12.1 gibt es eine Unterteilung U, die eine Unterteilung von f und von g ist. Für alle λ, µ ∈ K ist dann U auch eine Unterteilung von λf + µg, und es ist klar, dass Z Z Z (λf + µg) = λ f + µ g ; U Rb damit ist a (λf + µg) = λ R | U f | ≤ (b − a)||f ||. U Rb a f +µ Rb a U g. Schließlich gilt | Rb a f | ≤ (b − a)||f ||, da Für jedes n ≥ p sei fn : I → K eine Abbildung. Die Funktionenfolge {fn }n≥p konvergiert dann gleichmäßig gegen eine Abbildung f : I → K, wenn es zu jedem ε > 0 ein N ≥ p gibt, so dass |fn (x) − f (x)| < ε für alle x ∈ I und alle n ≥ N. Lemma 12.3 Sei f ∈ B(I, K). Dann sind äquivalent: (1) Zu jedem ε > 0 gibt es eine Treppenfunktion g ∈ T(I, K) mit ||f − g|| ≤ ε. (2) Es gibt eine Folge {gn }n≥p von Treppenfunktionen mit lim ||f − gn || = 0. n→∞ (3) Es gibt eine Folge {gn }n≥p aus T(I, K), die gleichmäßig gegen f konvergiert. Beweis Dies ist klar. Eine Abbildung f ∈ B(I, K) heißt Regelfunktion, wenn eine (und damit alle) der äquivalenten Bedingungen in Lemma 12.3 für f gilt. Die Menge der Regelfunktionen von I nach K wird mit R(I, K) bezeichnet. Es ist klar, dass jede Treppenfunktion eine Regelfunktion ist, d.h. T(I, K) ⊂ R(I, K). Satz 12.3 R(I, K) ist ein Untervektorraum von B(I, K). Beweis Da 0 ∈ T(I, K), ist 0 eine Regelfunktion. Seien f, g ∈ R(I, K), λ, µ ∈ K und sei ε > 0. Wähle c > 0 mit c ≥ |λ| + |µ|. Da f, g ∈ R(I, K), gibt es Treppenfunktionen u, v mit ||f − u|| ≤ ε/c und ||g − v|| ≤ ε/c. Nach Satz 12.1 ist dann λf + µg eine Treppenfunktion und es gilt ||(λf + µg) − (λu + µv)|| = ||λ(f − u) + µ(g − v)|| ≤ |λ| ||f − u|| + |µ| ||g − v|| ≤ ε . Dies zeigt, dass λf + µg ∈ R(I, K), und damit ist R(I, K) ein Untervektorraum von B(I, K). 12 Integration von Regelfunktionen 92 Satz 12.4 Jede stetige Abbildung f : I → K ist eine Regelfunktion. Beweis Nach Satz 8.5 ist die stetige Abbildung f : I → K gleichmäßig stetig, da das Intervall I = [a, b] folgenkompakt ist. Sei ε > 0; dann gibt es ein δ > 0, so dass |f (x) − f (y)| < ε für alle x, y ∈ I mit |x − y| < δ. Wähle nun eine Unterteilung U = (a0 , . . . , am ) mit aj+1 − aj ≤ δ für jedes 0 ≤ j < m, und sei g : I → K die Abbildung mit g(x) = f (aj ) für alle x ∈ [aj , aj+1), 0 ≤ j < m, und mit g(b) = f (b). Dann ist g ∈ T(I, K) und |g(x) − f (x)| < ε für alle x ∈ I, da für alle x ∈ [aj , aj+1 ) ist |x − aj | < δ und damit |g(x) − f (x)| = |f (aj ) − f (x)| < ε. Zu jedem ε > 0 gibt es also eine Treppenfunktion g mit ||g − f || ≤ ε. Folglich ist f eine Regelfunktion. Satz 12.5 Jede monotone Abbildung f : I → R ist eine Regelfunktion, d.h., ein Element von R(I, R). Beweis Ohne Beschränkung der Allgemeinheit nehme an, dass f monoton wachsend ist. Für jedes x ∈ [a, b) sei f (x+) = inf{f (y) : x < y ≤ b} und für jedes x ∈ (a, b] sei f (x−) = sup{f (y) : a ≤ y < x}. Dann gilt f (x−) ≤ f (x) ≤ f (x+) für alle x ∈ (a, b), f (a) ≤ f (a+) und f (b−) ≤ f (b). Sei nun ε > 0 und sei {ak }k≥0 die Folge aus I mit a0 = a und sup{x ∈ I : f (x) < f (ak +) + ε} , falls ak < b, ak+1 = b falls ak = b für alle k ≥ 0. Ist ak < b, so sieht man leicht, dass ak < ak+1 ; ist ferner ak+1 < b, so ist f (ak+1+) ≥ f (ak +) + ε und damit f (ak+1 +) ≥ f (a0 +) + (k + 1)ε ≥ f (ak+1 +) ≥ f (a0 ) + (k + 1)ε . Daraus ergibt sich dass am = b für ein m ≥ 1 (mit m ≤ 1 + (f (b) − f (a))/ε); sei also n = min{m ≥ 1 : am = b}. Sei nun g : I → R die Abbildung mit g(x) = f (aj +) für alle x ∈ (aj , aj+1 ), 0 ≤ j < n, und mit g(aj ) = f (aj ) für 0 ≤ j ≤ n. Dann ist g ∈ T(I, R) und |g(x) − f (x)| ≤ ε für alle x ∈ I, da |g(x) − f (x)| = |f (aj +) − f (x)| < ε für alle x ∈ (aj , aj+1 ). Zu jedem ε > 0 gibt es also eine Treppenfunktion g mit |g(x) − f (x)| ≤ ε für alle x ∈ I, und damit ist f eine Regelfunktion. Beispiel: Sei f : I → R die Abbildung, die definiert ist durch 1 , falls x ∈ I ∩ Q, f (x) = 0 , falls x ∈ I \ Q. Dann sieht man leicht, dass ||f − g|| ≥ 1/2 für jedes g ∈ T(I, R) und damit ist f keine Regelfunktion. 12 Integration von Regelfunktionen 93 Lemma 12.4 Sei f ∈ R(I, K), sei {gn }n≥p eine Folge von Treppenfunktionen, Rb die gleichmäßig gegen f konvergiert, und für jedes n ≥ p setze xn = a f . Dann konvergiert die Folge {xn }n≥p . Ist ferner {hn }n≥q eine weitere Folge aus T(I, K), Rb Rb die gleichmäßig gegen f konvergiert, so ist lim a hn = lim a gn . n→∞ n→∞ Beweis Sei ε > 0; dann gibt es ein N ≥ p, so dass |f (x) − gn (x)| < ε/4(b − a) für alle x ∈ I, n ≥ N und damit gilt ||f − gn || ≤ ε/4(b − a) für alle n ≥ N. Für alle m, n ≥ N ist also Z b Z b Z b |xn − xm | = gn − gm = (gn − gm ) ≤ (b − a)||gn − gm || a a a = (b − a) ||f − gn || + ||f − gm || ≤ ε/2 < ε , und dies zeigt, dass {xn }n≥p eine Cauchy-Folge ist. Damit konvergiert {xn }n≥p (da jede Cauchy-Folge in K konvergiert). Das gleiche Argument zeigt auch, dass Rb Rb limn→∞ a hn = limn→∞ a gn für jede weitere Folge {hn }n≥q aus T(I, K), die gleichmäßig gegen f konvergiert. Sei f ∈ R(I, K) eine Regelfunktion; nach Lemma 12.4 gibt es dann ein eindeutiges Rb Element α ∈ K, so dass α = limn→∞ a gn für jede Folge {gn }n≥p aus R(I, K), die gleichmäßig gegenR f konvergiert. αR heißt das Cauchy-Riemannsche Integral b b von f und wird mit a f (oder etwa a f (x) dx) bezeichnet. (Es gibt hier kein Problem mit dieser Schreibweise: Für Treppenfunktionen stimmt das CauchyRiemannsche Integral offensichtlich mit dem für Treppenfunktionen definierten elementaren Integral überein.) Rb Satz 12.6 Die Abbildung f 7→ a f von R(I, K) nach K ist linear, d.h. Z b Z b Z b (λf + µg) = λ f +µ g a a a für alle f, g ∈ R(I, K) und alle λ, µ ∈ K. Ferner gilt | f ∈ R(I, K). Rb a f | ≤ (b − a)||f || für alle Beweis Seien f, g ∈ R(I, K) und λ, µ ∈ K. Es gibt also eine Folge {fn }n≥1 (bzw. {gn }n≥1 ) aus T(I, K), die gleichmäßig gegen f (bzw. gegen g) konvergiert. Wie im Beweis für Satz 12.3 konvergiert dann die Folge von Treppenfunktionen {λfn + µgn }n≥1 gleichmäßig gegen λf + µg, und daraus folgt, dass Z b Z b Z b Z b (λf + µg) = lim (λfn + µgn ) = lim λ fn + µ gn n→∞ a n→∞ a a a Z b Z b Z b Z b = λ lim fn + µ lim gn = λ f +µ g. n→∞ a n→∞ a a a 12 Integration von Regelfunktionen 94 Rb Rb Rb Damit ist a (λf + µg) = λ a f + λ a g. Sei nun ε > 0; da die Folge {fn }n≥1 Rb Rb gleichmäßig gegen f konvergiert und a f = limn→∞ a fn , gibt es ein m ≥ 1, so Rb Rb dass |f (x) − fm (x)| < ε/2(b − a) für alle x ∈ I und | a f − a fm | < ε/2. Daraus ergibt sich, dass Z b Z b f < fm + ε/2 ≤ (b − a)||fm || + ε/2 a a ≤ (b − a) ||f || + ε/2(b − a) + ε/2 = (b − a)||f || + ε Rb und daher ist | a f | ≤ (b − a)||f ||. Lemma 12.5 Das Produkt f g von Regelfunktionen f, g ∈ R(I, K) ist wieder eine Regelfunktion. Beweis Setze c = ||f || + ||g|| + 1 und sei ε > 0; dann gibt es Treppenfunktionen u, v ∈ T(I, K) mit ||f − u|| ≤ min{ε/c, 1} und ||g − v|| ≤ ε/c. Nun ist uv eine Treppenfunktion und für alle x ∈ I gilt |f (x)g(x) − u(x)v(x)| = |(f (x) − u(x))g(x) + (g(x) − v(x))u(x)| ≤ |f (x) − u(x)||g(x)| + |g(x) − v(x)|u(x)| ≤ ||f − u|| · ||g|| + ||g − v|| · ||u|| ≤ ||f − u|| · ||g|| + ||g − v|| · (||f || + ||f − u||) ≤ ||f − u|| · ||g|| + ||g − v|| · (||f || + 1) ≤ ε . Damit ist ||f g − uv|| ≤ ε, und dies zeigt, dass f g eine Regelfunktion ist. Lemma 12.6 Sind f, g ∈ R(I, R) reelle Regelfunktionen mit f ≤ g (d.h., mit Rb Rb f (x) ≤ g(x) für alle x ∈ I), so ist a f ≤ a g. Beweis Setze h = g − f und sei ε > 0; dann gibt es eine Treppenfunktion u ∈ T(I, R) mit ||h − u|| ≤ ε/(b − a). Setze nun v = max{u, 0}; dann ist auch v ∈ T(I, R) und ||h − v|| ≤ ε/(b − a), da |h(x) − v(x)| ≤ |h(x) − u(x)| für alle Rb x ∈ I. Aber a v ≥ 0, da v ≥ 0, und damit ist Z b Z b Z b h≥ (h − v) ≥ − (h − v) ≥ −(b − a)||h − v|| ≥ −ε . a Folglich ist a Rb a a h ≥ 0 und daher Rb a f≤ Rb a g. Satz 12.7 (Mittelwertsatz der Integralrechnung) Sei f : I → R stetig und sei g ∈ R(I, R) eine Regelfunktion mit g ≥ 0. Dann gibt es ξ ∈ I, so dass Z b Z b f (x)g(x) dx = f (ξ) g(x) dx . a a 12 Integration von Regelfunktionen 95 Beweis Nach Satz 7.9 und Satz 8.2 ist f (I) ein beschränktes abgeschlossenes Intervall; es gibt also α, β ∈ R mit α ≤ β, so dass f (I) = [α, β]. Für alle x ∈ I ist dann αg(x) ≤ f (x)g(x) ≤ βg(x) und daraus folgt nach Lemma 12.6, dass α Z a b g(x) dx = Z a b αg(x) dx ≤ Z b a f (x)g(x) dx ≤ Z b βg(x) dx = β a Z b g(x) dx . a Rb Rb Rb Da a g(x) dx ≥ 0, gibt es nun γ ∈ [α, β], so dass a f (x)g(x) dx = γ a g(x) dx. Aber f (I) = [α, β] und damit gibt es ein ξ ∈ I mit f (ξ) = γ, d.h. mit Z b f (x)g(x) dx = f (ξ) a Z b g(x) dx . a Satz 12.7 wird oft angewendet mit g = 1; in diesem speziellen Fall besagt der Satz: Sei f : I → R eine stetige Abbildung; dann gibt es ξ ∈ I, so dass Z b f (x) dx = f (ξ)(b − a) . a Sei U = (a0 , . . . , an ) eine Unterteilung von I und sei S = (ξ1 , . . . , ξn ), wobei ξk ∈ R mit ξk ∈ [ak−1 , ak ] für jedes k = 1, . . . , n. Dann heißt das Paar Z = (U, S) eine markierte Unterteilung von I. Die Zahl max{ak − ak−1 : 1 ≤ k ≤ n} wird dann mit µ(Z) bezeichnet und heißt die Feinheit von Z. Sei f : I → K eine Abbildung und Z = (U, S) eine markierte Unterteilung von I mit U = (a0 , . . . , an ) und S = (ξ1 , . . . , ξn ). Dann heißt S(f, Z) = n X k=1 f (ξk )(ak − ak−1 ) die Riemannsche Summe von f bezüglich Z. Satz 12.8 Sei f ∈ R(I, K) eine Regelfunktion. Zu jedem ε > 0 gibt es dann ein Rb δ > 0, so dass a f − S(f, Z) < ε für alle markierten Unterteilungen Z von I mit µ(Z) < δ. Beweis Zunächst wird der Satz für den speziellen Fall einer Treppenfunktion bewiesen: Lemma 12.7 Sei f ∈ T(I, Zu jedem ε > 0 gibt es R b K) eine Treppenfunktion. dann ein δ > 0, so dass a f − S(f, Z) < ε für alle markierten Unterteilungen Z von I mit µ(Z) < δ. 12 Integration von Regelfunktionen 96 Beweis Da f beschränkt ist, gibt es M ≥ 0, so dass |f (x)| ≤ M für alle x ∈ I; sei V = (b0 , . . . , bm ) eine Unterteilung für f . Sei nun Z = (U, S) eine markierte Unterteilung von I mit U = (a0 , . . . , an ) und S = (ξ1 , . . . , ξn ). Definiere eine Abbildung g : I → K durch f (ξk ) , falls x ∈ [ak−1 , ak ) für ein k = 1, . . . , n, g(x) = f (b) , falls x = b. Dann ist g eine Treppenfunktion, U ist eine Unterteilung für g und Z Z b n X f (ξk )(ak − ak−1 ) = g= g. S(f, Z) = U k=1 a Für jedes k = 1, . . . , n definiere hk : I → K durch f (x) − g(x) , falls x ∈ [ak−1 , ak ), hk (x) = 0, sonst; P dann ist hk eine Treppenfunktion und es gilt nk=1 hk = f − g, da g(b) = f (b). Sei G = {1 ≤ k ≤ n : bj ∈ [ak−1 , ak ) für ein j = 1, . . . , m}; dann ist |G| ≤ m und man sieht leicht, dass hk = 0, falls k ∈ / G. Nach Satz 12.2 ist also Z b Z b Z b Z b Z bX n XZ b f − S(f, Z) = f− g= (f − g) = hk = hk a a a a a k=1 k∈G a und daraus ergibt sich, dass Z b XZ b X f − S(f, Z) ≤ 2M(ak − ak−1 ) ≤ 2Mmµ(Z) . hk ≤ a k∈G a k∈G R b Folglich ist a f − S(f, Z) < ε für alle markierten Unterteilungen Z von I mit µ(Z) < ε/(2Mm). Beweis für Satz 12.8: Sei f ∈ R(I, K) eine Regelfunktion und ε > 0. Dann gibt es eine Treppenfunktion g ∈ T(I, K) mit ||f − g|| ≤ ε/3(b − a) und nach Rb Lemma 12.7 gibt es ein δ > 0, so dass a g − S(g, Z) < ε/3 für alle markierten Unterteilungen Z von I mit µ(Z) < δ. Sei nun Z eine markierte Unterteilung von I mit µ(Z) < δ. Dann gilt Z b Z b Z b f − S(f, Z) ≤ (f − g) + g − S(g, Z) + S(g − f, Z) a a a < ||f − g||(b − a) + ε/3 + ||f − g||(b − a) = ε , da |S(h, Z)| ≤ ||h||(b − a) für alle h ∈ B(I, K). 12 Integration von Regelfunktionen 97 Lemma 12.8 Sei f ∈ R(I, K), seien c, d ∈ I mit c < d und setze J = [c, d]. Dann ist die Einschränkung fJ von f auf J eine Regelfunktion. Beweis Sei ε > 0; es gibt also g ∈ T(I, K) mit ||f − g|| < ε. Aber dann is die Einschränkung gJ von g auf J eine Treppenfunktion und ||fJ −gJ || ≤ ||f −g|| < ε. Damit ist fJ eine Regelfunktion. 13 Integration und Differentiation Im Folgenden sei I ein beliebiges Intervall, das mehr als einen Punkt enthält. Eine Abbildung f : I → K heißt nun Regelfunktion, wenn für alle c, d ∈ I mit c < d die Einschränkung f[c,d] von f auf [c, d] ein Element von R([c, d], K) ist. Wenn I = [a, b], so stimmt diese Definition nach Lemma 12.8 mit der Definition in Kapitel 12 überein. Die Menge aller Regelfunktionen f : I → K wird mit R(I, K) bezeichnet. Nach Satz 12.3 ist R(I, K) ein Untervektorraum von Abb(I, K). (Man merke aber, dass Regelfunktionen im Allgemeinen nicht beschränkt sind.) Da die Einschränkung einer stetigen Abbildung wieder stetig ist, ist jede stetige Abbildung f : I → K eine Regelfunktion. Genauso sind monotone Abbildungen von I nach R Regelfunktionen. Rb Sei f ∈ R(I, K) und seien a, b ∈ I mit a < b. Dann schreibt man fast immer a f Rb statt a f[a,b] für das Integral von f[a,b] . Lemma 13.1 Für jedes f ∈ R(I, K) und alle a, c, b ∈ I mit a < c < b ist Z b f= a Z c f+ a Z b f. c Beweis Sei {gn }n≥p eine Folge von Treppenfunktionen aus T([a, b], K), die gleichmäßig gegen f[a,b] konvergiert. Dann ist {(gn )[a,c] }n≥p (bzw. {(gn )[c,b] }n≥p ) eine Folge aus T([a, c], K) (bzw. aus T([c, b], K)), die gleichmäßig gegen f[a,c] (bzw. Rb Rc Rb gegen f[c,b] ) konvergiert. Ferner ist es klar, dass a gn = a gn + c gn für alle n ≥ p, und daraus ergibt sich, dass Z b Z b Z c Z b Z c Z b f = lim gn = lim gn + lim gn = f+ f. a n→∞ a n→∞ n→∞ a Für f ∈ R(I, K) ist es nützlich, das ‘Integral’ Z b a f =− Z a c Rb a a c f durch f b zu definieren, falls a, b ∈ I mit b < a. Für jedes a ∈ I setzt man schließlich Z a f =0. a 98 13 Integration und Differentiation 99 Lemma 13.2 Sei f ∈ R(I, K); für alle a, b, c ∈ I gilt dann Z b Z c Z b f= f+ f. a a c Beweis Übung. Ist K = C, so wird I stets als Teilmenge von C betrachtet. Satz 13.1 Sei f ∈ R(I, K), a ∈ I und definiere eine Abbildung F : I → K durch Z x F (x) = f (t) dt . a Ist f an der Stelle b ∈ I stetig, so ist F im Punkt b differenzierbar, und es gilt F ′ (b) = f (b). Beweis Sei c ∈ I mit c > b; dann gilt Z Z b 1 c F (c) − F (b) − f (b) = f− f − f (b) c−b c−b a a Z c Z Z c 1 1 c = f (t) dt − f (b) = f (t) dt − f (b) dt c−b b c−b b b Z c 1 = (f (t) − f (b)) dt c−b b und daraus ergibt sich, dass F (c) − F (b) ≤ ||(f − f (b))[b,c]|| = sup{|f (x) − f (b)| : b ≤ x ≤ c} . − f (b) c−b Ist dagegen d ∈ I mit d < b, so gilt genauso, dass F (d) − F (b) ≤ sup{|f (x) − f (b)| : d ≤ x ≤ b} . − f (b) d−b Sei nun {xn }n≥p eine Folge aus I \ {b}, die gegen b konvergiert und sei ε > 0. Da f an der Stelle b stetig ist, gibt es ein δ > 0, so dass |f (x) − f (b)| < ε/2 für alle x ∈ I mit |x − b| < δ, und dann gibt es ein N ≥ p, so dass |xn − b| < δ für alle n ≥ N. Für alle n ≥ N ist also F (xn ) − F (x) ≤ sup{|f (x) − f (b)| : |x − b| < δ} ≤ ε/2 < ε − f (x) xn − x und folglich ist limn→∞ (F (xn ) − F (b))/(xn − b) = f (b). Dies zeigt, dass F im Punkt b differenzierbar ist mit F ′ (b) = f (b). 13 Integration und Differentiation 100 Sei f : I → K eine Abbildung. Eine differenzierbare Abbildung F : I → K heißt dann Stammfunktion von f , wenn F ′ = f . Nach Satz 13.1 besitzt jede stetige Abbildung f : I → RK eine Stammfunktion: Wähle einen Punkt a ∈ I; dann ist x die Abbildung x 7→ a f (t) dt eine Stammfunktion von f . Ist F : I → K eine Stammfunktion einer Abbildung f : I → K, so ist F + c auch eine Stammfunktion von f für jedes c ∈ K, da (F + c)′ = F ′ + 0 = F ′ = f . Die Umkehrung ist ebenfalls richtig: Satz 13.2 Sind F und G beide Stammfunktionen einer Abbildung f : I → K, so ist F − G konstant. Beweis Setze h = F − G; dann ist h differenzierbar und h′ = (F − G)′ = F ′ − G′ = f − f = 0 . Ist K = R, so folgt unmittelbar aus Satz 11.7, dass h konstant ist. Ist dagegen K = C, so folgt aus Lemma 10.6 und Satz 11.7, dass Re h und Im h konstant sind, und damit ist h selbt auch konstant. Beispiele: (1) Seien c0 , . . . , cn ∈ K (mit n ≥ 0) und sei f : I → K gegeben durch f (x) = c0 + c1 x + c2 x2 + · · · + cn xn . Dann ist nach Satz 10.6 die Abbildung 1 1 1 x 7→ c0 x + c1 x2 + c2 x3 + · · · + cn xn+1 2 3 n+1 eine Stammfunktion von f . (2) Nehme an, dass 0 ∈ / I und für n ≥ 1 sei gn : I → R gegeben durch gn (x) = 1 . xn Ist n ≥ 2, so ist nach Satz 10.7 die Abbildung x 7→ − 1 (n − 1)xn−1 eine Stammfunktion von gn . Nach Satz 10.9 ist der natürliche Logarithmus log eine Stammfunktion von g1 . (3) Die Exponentialfunktion exp ihre eigene Stammfunktion. (4) Die Funktion sin ist eine Stammfunktion von cos und die Funktion − cos eine Stammfunktion von sin. Das folgende Ergebnis wird Fundamentalsatz der Differential- und Integralrechnung genannt: 13 Integration und Differentiation 101 Satz 13.3 Sei f : I → K eine stetige Abbildung und F : I → K eine Stammfunktion von f . Dann gilt für alle a, b ∈ I Z b f (t) dt = F (b) − F (a) . a Rx Beweis Definiere eine Abbildung G : I → K durch G(x) = a f (t) dt. Nach Satz 13.1 ist G eine Stammfunktion von f , und daraus folgt nach Satz 13.2, dass G − F konstant ist. Insbesondere ist G(b) − F (b) = G(a) − F (a) und damit ist Z b Z a Z b F (b) − F (a) = G(b) − G(a) = f (t) dt − f (t) dt = f (t) dt . a a a Im folgenden Satz seien a, b ∈ R mit a < b und setze J = [a, b]. Satz 13.4 (Substitutionsregel) Sei f : I → K stetig und sei g : J → R eine stetig differenzierbare Abbildung mit g(J) ⊂ I. Dann gilt Z b Z g(b) ′ f (g(t))g (t) dt = f (x) dx . a g(a) Beweis Sei F : I → K eine Stammfunktion von f . Nach der Kettenregel ist dann die zusammengesetzte Abbildung F ◦ g : J → K differenzierbar und (F ◦ g)′(t) = F ′ (g(t))g ′(t) = f (g(t))g ′(t) für alle t ∈ J. Daraus ergibt sich nach Satz 13.3, dass Z b Z b ′ f (g(t))g (t) dt = (F ◦ g)′ (t) dt a a = (F ◦ g)(b) − (F ◦ g)(a) = F (g(b)) − F (g(a)) = Z g(b) f (x) dx , g(a) da F ◦ g (bzw. F ) eine Stammfunktion von (F ◦ g)′ (bzw. von f ) ist. √ Beispiel: Nach Satz 13.4 mit f (x) = 1 − x2 und g(t) = sin t ist Z 1√ Z sin(π/2) √ 2 1 − x dx = 1 − x2 dx −1 sin(−π/2) = = Z π/2 −π/2 1 2 Z Z q 2 1 − sin (t) cos(t) dt = π/2 −π/2 (1 + cos(2t)) dt = 1π 2 2 π/2 cos2 (t) dt −π/2 + π 1 π 1 sin(π) + − sin(−π) = . 2 2 2 2 13 Integration und Differentiation 102 Satz 13.5 (Partielle Integration) Seien f, g : I → K stetig differenzierbare Abbildungen. Dann gilt für alle a, b ∈ I mit a < b Z b Z b ′ f (x)g (x) dx = f (b)g(b) − g(a)g(a) − g(x)f ′(x) dx . a a Beweis Sei h = f g das Produkt der Abbildungen f und g. Nach der Produktregel (Satz 10.3 (2)) ist h differenzierbar und h′ (x) = f (x)g ′ (x) + f ′ (x)g(x) für alle x ∈ I. Damit ist h eine Stammfunktion von f g ′ + f ′ g und daraus folgt nach Satz 13.3, dass Z b Z b Z b ′ ′ f (x)g (x) dx + f (x)g(x) dx = (f (x)g ′(x) + f ′ (x)g(x)) dx a a a = h(b) − h(a) = f (b)g(b) − f (a)g(a) . Satz 13.6 (Trapezregel) Sei f : I → R zweimal stetig differenzierbar und seien a, b ∈ I mit a < b. Dann gibt es ξ ∈ [a, b], so dass Z b b−a (b − a)3 ′′ f (x) dx = (f (a) + f (b)) − f (ξ) . 2 12 a Beweis Definere eine Abbildung g : I → R durch g(x) = (x − a)(b − x). Dann ist g(a) = g(b) = 0, g ′ (x) = a + b − 2x und g ′′ (x) = −2. Durch zweimalige Anwendung von Satz 13.5 erhält man also, dass Z b Z b ′′ ′ ′ g(x)f (x) dx = g(b)f (b) − g(a)f (a) − g ′ (x)f ′ (x) dx a a Z b Z b ′ ′ ′ ′ =− g (x)f (x) dx = −g (b)f (b) + g (a)f (a) + g ′′ (x)f (x) dx a a Z b = (b − a)(f (a) + f (a)) − 2 f (x) dx a und daraus ergibt sich, dass Z Z b 1 b b−a f (a) + f (a) − (x − a)(b − x)f ′′ (x) dx . f (x) dx = 2 2 a a Aber g(x) = (x − a)(b − x) ≥ 0 für alle x ∈ [a, b], und folglich gibt es nach Satz 12.11 ein ξ ∈ [a, b], so dass Z b Z b ′′ ′′ (x − a)(b − x)f (x) dx = f (ξ) (x − a)(b − x) dx a a Z b Z b−a ′′ ′′ = f (ξ) (x − a)(b − x) dx = f (ξ) y(b − a − y) dy a 0 Z b−a ′′ = f (ξ) (b − a)y − y 2 dy 0 = f ′′ (ξ) (b − a) 2 (b − a)3 1 (b − a)2 − (b − a)3 = f ′′ (ξ) . 3 6 13 Integration und Differentiation 103 Satz 13.7 Sei f : I → R zweimal stetig differenzierbar und seien a, b ∈ I mit a < b. Sei n ∈ N mit n ≥ 1 und setze h = (b − a)/n. Dann ist Z ! n−1 b M X 1 1 f (x) dx − h f (a + kh) + f (b) ≤ f (a) + (b − a)h2 , a 12 2 2 k=1 wobei M = sup{|f ′′ (x)| : x ∈ [a, b]}. Beweis Nach Satz 13.6 ist für jedes k = 0, . . . , n − 1 Z M a+(k+1)h h f (a + kh) + f (a + (k + 1)h) h3 , f (x) dx − ≤ 12 a+kh 2 und daraus ergibt sich, dass Z n−1 b 1 X 1 f (a + kh) + f (b) f (x) dx − h f (a) + a 2 2 k=1 n−1 Z a+(k+1)h X h f (x) dx − f (a + kh) + f (a + (k + 1)h) = 2 a+kh k=0 Z n−1 a+(k+1)h X h ≤ f (x) dx − f (a + kh) + f (a + (k + 1)h) a+kh 2 ≤ k=0 n−1 X k=0 M 3 M M h = n h3 = (b − a)h2 . 12 12 12 14 Das Riemannsche Integral Für reellwertige Abbildungen wird manchmal das Riemannsche Integral eingeführt. Dieses ist etwas allgemeiner als das Integral für Regelfunktionen, hat aber den Nachteil, dass es sich nicht richtig verallgemeinern läßt. Dieses Kapitel ist für diejenigen, die das Riemannsche Integral kennenlernen wollen. Sei X eine Menge und f : X → R eine Abbildung. Dann werden Abbildungen f+ , f− und |f | von X nach R definiert durch f (x) , falls f (x) > 0, −f (x) , falls f (x) < 0, f+ (x) = f− (x) = 0 , falls f (x) ≤ 0, 0, falls f (x) ≥ 0, und |f |(x) = |f (x)| für alle x ∈ X. Dann gilt f+ ≥ 0, f− ≥ 0, f = f+ − f− und f+ + f− = |f |. Ferner ist f+ = max{f, 0} und f− = max{−f, 0} = − min{f, 0}. Für jedes A ⊂ X sei χA : X → R die Abbildung, die definiert ist durch 1 , falls x ∈ A, χA (x) = 0 , falls x ∈ / A; χA heißt die charakteristische Funktion von A. Im Folgenden sei I das Intervall [a, b], wobei a, b ∈ R mit a < b. Lemma 14.1 (1) Für jedes f ∈ T(I, R) sind f+ , f− und |f | Treppenfunktionen. (2) Sind f, g ∈ T(I, R), so sind die Abbildungen f g, max{f, g} und min{f, g} auch Treppenfunktionen. Beweis Dies ist klar. Sei R); nach Lemma 14.1 (2) ist |f | ∈ T(I, R), und nach Satz 12.2 ist R b f ∈ T(I, R f ≤ b |f |, da f ≤ |f | und −f ≤ |f |. a a Lemma 14.2 Sei f : I → R eine beschränkte Abbildung. Dann sind äquivalent: Rb Rb (1) Zu jedem ε > 0 gibt es g, h ∈ T(I, R) mit g ≤ f ≤ h, so dass a h − a g < ε. (2) Es gibt monotone Folgen {gn }n≥1 und {hn }n≥1 von Treppenfunktionen mit Rb Rb g1 ≤ g2 ≤ · · · ≤ f ≤ · · · ≤ h2 ≤ h1 , so dass lim a gn = lim a hn . n→∞ (3) Es gilt sup Rb a g : g ∈ T(I, R) mit g ≤ f = inf 104 n→∞ Rb a h : h ∈ T(I, R) mit f ≤ h . 14 Das Riemannsche Integral 105 Beweis (2) ⇒ (3) und (3) ⇒ (1) sind klar. (1) ⇒ (2): Zu jedem n ≥ 1 gibt es nach (1) Treppenfunktionen gn′ , h′n ∈ T(I, R) Rb Rb mit gn′ ≤ f ≤ h′n und a h′n − a gn′ < 1/n. Setze gn = max{gk′ : 1 ≤ k ≤ n} und hn = min{h′k : 1 ≤ k ≤ n}; nach Lemma 14.1 (2) sind gn , hn ∈ T(I, R) und g1 ≤ g2 ≤ · · · ≤ f ≤ · · · ≤ h2 ≤ h1 . Rb Rb Ferner ist a hn − a gn < 1/n, da gn′ ≤ gn ≤ hn ≤ h′n , und daraus ergibt sich, Rb Rb dass lim a gn = lim a hn . n→∞ n→∞ Eine beschränkte Abbildung f : I → R heißt Riemann integrierbar, wenn eine (und damit alle) der äquivalenten Bedingungen in Lemma 14.2 für f gilt. Die Menge der Riemann integrierbaren Abbildungen von I nach R wird mit Ri(I) bezeichnet. Es ist klar, dass T(I, R) ⊂ Ri(I). Lemma 14.3 Für jedes f ∈ Ri(I) ist −f auch Riemann integrierbar. Beweis Sei ε > 0; nach Lemma 14.2 (1) gibt es Treppenfunktionen g, h ∈ T(I, R) Rb Rb mit g ≤ f ≤ h, so dass a h − a g < ε. Nach Satz 12.1 sind dann aber −h und Treppenfunktionen, Ferner gilt nach Satz 12.2, dass R−g Rb R b und R b−h ≤R b−f ≤R −g. b b −g − a −h = − a g + a h = a h − a g < ε, und daraus ergibt sich nach a Lemma 14.2 (1), dass −f Riemann integrierbar ist. Satz 14.1 Ri(I) ist ein Untervektorraum von B(I, R). Beweis Da 0 ∈ T(I, R), ist 0 Riemann integrierbar. Seien f, g ∈ Ri(I) und λ, µ ∈ R mit λ ≥ 0, µ ≥ 0. Nach Lemma 14.2 (2) gibt es dann monotone Folgen {sn }n≥1 , {tn }n≥1 , {un }n≥1 und {vn }n≥1 von Treppenfunktionen mit s1 ≤ s2 ≤ · · · ≤ f ≤ · · · ≤ t2 ≤ t1 und u1 ≤ u2 ≤ · · · ≤ g ≤ · · · ≤ v2 ≤ v1 , Rb Rb Rb Rb so dass limn→∞ a sn = limn→∞ a tn und limn→∞ a un = limn→∞ a vn . Für jedes n ≥ 1 setze ϕn = λsn + µun und ψn = λtn + µvn . Nach Satz 12.1 sind ϕn und ψn Treppenfunktionen und ϕ1 ≤ ϕ2 ≤ · · · ≤ λf + µg ≤ · · · ≤ ψ2 ≤ ψ1 ; ferner gilt nach Satz 12.2 und Satz 5.5, dass Z b Z b Z b Z b lim ϕn = lim (λsn + µun ) = λ lim sn + µ lim un n→∞ a n→∞ a n→∞ a n→∞ a Z b Z b Z b Z b = λ lim tn + µ lim vn = lim (λtn + µvn ) = lim ψn . n→∞ a n→∞ a n→∞ a n→∞ a Daraus folgt nach Lemma 14.2 (2), dass λf + µg Riemann interierbar ist. Dies zeigt, zusammen mit Lemma 14.3, dass λf + µg Riemann integrierbar ist für alle f, g ∈ Ri(I) und alle λ, µ ∈ R. 14 Das Riemannsche Integral 106 Lemma 14.4 (1) Die Abbildungen f+ , f− und |f | sind Riemann integrierbar für jedes f ∈ Ri(I). (2) Sind f und g Riemann integrierbar, so sind max{f, g} und min{f, g} auch Riemann integrierbar. Beweis (1) Sei ε > 0; da f ∈ Ri(I), gibt es g, h ∈ T(I, R) mit g ≤ f ≤ h, so dass Rb Rb h − g < ε. Nach Lemma 14.1 (1) sind dann g+ und h+ Treppenfunktionen a a Rb Rb und es gilt g+ ≤ f+ ≤ h+ . Ferner ist a h+ − a g+ < ε, da h+ − g+ ≤ h − g, und dies zeigt, dass f+ Riemann integrierbar ist. Damit sind f− = f+ − f und |f | = f+ + f− auch Riemann integrierbar. (2) Dies folgt unmittelbar aus (1) und Satz 14.1, da max{f, g} = 12 (f +g +|f −g|) und min{f, g} = 21 (f + g − |f − g|). Lemma 14.5 Das Produkt f g von Riemann integrierbaren Abbildungen f, g ist Riemann integrierbar. Beweis Nach Lemma 14.4 (1) sind die Abbildungen f+ , f− , g+ und g− Riemann integrierbar und f g = (f+ − f− )(g+ − g− ) = f+ g+ + f− g− − f+ g− − f− g+ . Daraus folgt nach Satz 14.1, dass es genügt, den Satz für den Fall zu beweisen, dass f ≥ 0 und g ≥ 0. Da f und g beschränkt sind, gibt es N > 0, so dass f (x) ≤ N und g(x) ≤ N für alle x ∈ I. Sei ε > 0 und setze δ = ε/2N; nach Lemma 14.2 (1) gibt es dann Rb Rb s, t, u, v ∈ T(I, R) mit s ≤ f ≤ t und u ≤ g ≤ v , so dass a t − a s < δ Rb Rb und a v − a u < δ. Da ferner 0 ≤ f ≤ N und 0 ≤ g ≤ N, können nach Lemma 14.1 (2) s, t, u und v so gewählt werden, dass 0 ≤ s, t ≤ N, 0 ≤ u und v ≤ N. Nun sind nach Lemma 14.1 (2) su und tv Treppenfunktionen, es gilt su ≤ f g ≤ tv, da 0 ≤ s ≤ f ≤ t und 0 ≤ u ≤ g ≤ v und nach Satz 12.2 ist Z b Z b Z b Z b tv − su = (tv − su) = (tv − tu + tu − su) a a a a Z b Z b Z b Z b = t(v − u) + (t − s)u ≤ N(v − u) + (t − s)N a a a a Z b Z b Z b Z b =N v− u+ t− s < 2Nδ = ε . a a a a Daraus ergibt sich nach Lemma 14.2 (1), dass f g Riemann integriebar ist. Satz 14.2 Ist {fn }n≥p eine Folge aus Ri(I), die gleichmäßig gegen f : I → R konvergiert, so ist f Riemann integrierbar. Insbesondere ist jede Regelfunktion Riemann integrierbar, d.h., R(I, R) ⊂ Ri(I). 14 Das Riemannsche Integral 107 Beweis Sei ε > 0 und setze η = ε/4(b − a); da {fn }n≥p gleichmäßig gegen f konvergiert, gibt es ein m ≥ p, so dass |fm (x) − f (x)| < η für alle x ∈ I, und da Rb Rb fm ∈ Ri(I), gibt es u, v ∈ T(I, R) mit u ≤ fm ≤ v, so dass a v − a u < ε/2. Sei g = u − η, h = v + η; dann sind g und h Treppenfunktionen mit g ≤ f ≤ h, da g = u − η ≤ fm − η ≤ f ≤ fm + η ≤ v + η = h, und es gilt Z b Z b Z b Z b Z b Z b Z b h− g= (v +η)− (u−η) = v − u+ 2η < ε/2+2η(b−a) = ε . a a a a a a a Damit ist f Riemann integrierbar. Beispiel: Sei f : I → R die Abbildung, die definiert ist durch 1 , falls x ∈ I ∩ Q, f (x) = 0 , falls x ∈ I \ Q. Sind g, h ∈ T(I, R) Treppenfunktionen mit g ≤ f ≤ h, so sieht man leicht, dass Rb Rb Rb Rb g ≤ 0 und a h ≥ b − a; insbesondere ist a h − a g ≥ b − a. Folglich ist f a nicht Riemann integrierbar. Es gibt aber Riemann integrierbare Abbildungen, die keine Regelfunktionen sind. Ein typisches Beispiel ist χC mit C einer Cantor-Menge. (Man siehe: Aufgaben 3 und 4, Blatt 1, Analysis II.) Lemma 14.6 Für jedes f ∈ Ri(I) gibt es eine eindeutige Zahl κ(f ) ∈ R, so Rb Rb dass a g ≤ κ(f ) für jede Treppenfunktion g ≤ f und a h ≥ κ(f ) für jede Treppenfunktion h ≥ f . Beweis Dies folgt unmittelbar aus Lemma 14.2 (3), und es gilt natürlich Z b sup g : g ∈ T(I, R) mit g ≤ f a Z b h : h ∈ T(I, R) mit f ≤ h . = κ(f ) = inf a Lemma 14.7 Sei {fn }n≥p eine Folge aus Ri(I), die gleichmäßig gegen f ∈ Ri(I) konvergiert. Dann konvergiert die Folge {κfn }n≥p gegen κ(f ). Insbesondere ist Rb κ(f ) = a f für jede Regelfunktion f ∈ R(I, R). Beweis Übung. Sei f ∈ Ri(I); die in Lemma 14.6 definierte Zahl κ(f ) heißt das Riemannsche Rb Integral von f und wird mit a f bezeichnet. (Es gibt kein Problem mit dieser Schreibweise, da nach Lemma 14.7 das Riemannsche Integral für Regelfunktionen mit dem für Regelfunktionen definierten Integral übereinstimmt.) 14 Das Riemannsche Integral Lemma 14.8 Für jedes f ∈ Ri(I) ist Beweis Übung. Satz 14.3 Die Abbildung f 7→ Z b Rb a 108 Rb a −f = − Rb f. a f von Ri(I) nach R ist linear, d.h. (λf + µg) = λ a Z b f +µ a Z b g a für alle f, g ∈ Ri(I) und alle λ, µ ∈ R, und monoton, d.h. f, g ∈ Ri(I) mit f ≤ g. Rb a f ≤ Rb a g, falls Beweis Seien f, g ∈ Ri(I) und λ, µ ∈ R mit λ ≥ 0, µ ≥ 0. Sei ε > 0 und setze δ = ε/(λ + µ + 1); nach Lemma 14.2 (1) gibt es dann s, t, u, v ∈ T(I, R) mit Rb Rb Rb Rb s ≤ f ≤ t und u ≤ g ≤ v, so dass a t − a s < δ und a v − a u < δ. Nun ist nach Satz 12.1 λt + µv eine Treppenfunktion und λt + µv ≥ λf + µg. Folglich gilt Z b Z b Z b Z b Z b Z b (λf + µg) − λ f −µ g≤ (λt + µv) − λ s−µ u a a a a a a Z b Z b Z b Z b =λ t− s +µ v− u ≤ λδ + µδ < ε . a a a a Aber λs + µu ist auch eine Treppenfunktion, und λs + µu ≤ λf + µg. Also ist Z b Z b Z b Z b Z b Z b (λf + µg) − λ f −µ g≥ (λs + µu) − λ t−µ v a a a a a a Z b Z b Z b Z b =λ s− t +µ u− v ≥ −λδ − µδ > −ε . a a a a Rb Rb Rb Daraus ergibt sich, dass a (λf + µg) = λ a f + λ a g. Dies zeigt, zusammen mit Rb Rb Rb Lemma 14.8, dass a (λf + µg) = λ a f + λ a g für alle f, g ∈ Ri(I) und alle Rb λ, µ ∈ R. Die Abbildung f 7→ a f von Ri(I) nach R ist also linear. Seien nun f, g ∈ Ri(I) mit f ≤ g. Dann ist g − f ∈ Ri(I) und g − f ≥ 0. Aber 0 Rb Rb Rb Rb ist eine Treppenfunktion und folglich ist 0 = a 0 ≤ a (g − f ) = a g − a f , d.h. Rb Rb f ≤ a g. a Sei f ∈ Ri(I) Riemann integrierbar; nach Lemma 14.4 (1) ist dann |f | auch Riemann integrierbar und nach Satz 14.3 ist (da f ≤ |f | und −f ≤ |f |) Z b Z b f ≤ |f | . a a 14 Das Riemannsche Integral 109 Satz 14.4 (Mittelwertsatz der Integralrechnung) Sei f : I → R stetig und sei g ∈ Ri(I) Riemann integrierbar mit g ≥ 0. Dann gibt es ξ ∈ I, so dass Z b f (x)g(x) dx = f (ξ) a Z b g(x) dx . a Beweis Dieser ist identisch mit dem Beweis für Satz 12.7. Satz 14.5 Sei f ∈ Ri(I) Riemann integrierbar. Zu jedem ε > 0 gibt es dann ein Rb δ > 0, so dass a f − S(f, Z) < ε für alle markierten Unterteilungen Z von I mit µ(Z) < δ. Beweis Sei f ∈ Ri(I) und ε > 0. Nach Lemma 14.2 gibt es dann g, h ∈ T(I, R) Rb Rb mit g ≤ f ≤ h, so dass a h − a g < ε/2, und nach Lemma 12.7 gibt es δ > 0, R b R b so dass a g − S(g, Z) < ε/2 und a h − S(h, Z) < ε/2 für alle markierten Unterteilungen Z von I mit µ(Z) < δ. Sei nun Z eine markierte Unterteilung von I mit µ(Z) < δ. Es ist dann klar, dass S(g, Z) ≤ S(f, Z) ≤ S(h, Z) und daraus ergibt sich, dass Z b Z b f − S(f, Z) ≤ h − S(g, Z) a a Z b Z b Z b = h− g+ g − S(g, Z) < ε/2 + ε/2 = ε , a a a und genauso gilt Z b Z b f − S(f, Z) ≥ g − S(h, Z) a a Z b Z b Z b = g− h+ h − S(h, Z) > −ε/2 − ε/2 = −ε . a R b Damit ist a f − S(f, Z) < ε. a a Literatur [1] Amman, H., Escher, J. (1996): Analysis I. Birkhäuser [2] Carathéodory, C. (1927): Vorlesungen Über reelle Funktionen. Teubner [3] Courant, R. (1929): Vorlesungen über Differential- und Integralrechnung. Springer [4] Dieudonné, J. (1960): Foundations of Modern Analysis. Academic Press [5] Forster, O. (1980): Analysis 1. Differential- und Integralrechnung einer Veränderlichen. vieweg [6] Forster, O., Wessoly, R. (1986): Übungsbuch zu Analysis 1. wieweg [7] Hardy, G.H. (1902): A Course of Pure Mathematics. Cambridge University Press [8] Königsberger, K. (1999): Analysis 1. Springer [9] Landau, E. (1930): Grundlagen der Analysis. Chelsea [10] Lang, S. (1993): Real and Functional Analysis. Springer (früher: Real Analysis. Addison-Wesley 1968) [11] Lang, S. (1983): Undergraduate Analysis. Springer (früher: Analysis I. Addison-Wesley 1968) [12] Walter, W. (1999): Analysis I. Springer 110 Index Abbildung, 48 n-mal differenzierbare, 77 n-mal stetig differenzierbare, 77 affine, 68 beschränkte, 89 differenzierbare, 68, 74, 80 gleichmäßig stetige, 59 konvexe, 84 linksseitig differenzierbare, 78 rechtsseitig differenzierbare, 77 Riemann integrierbare, 105 stetige, 49 abgeleitete Größer-Relation, 14 abgeschlossene Menge, 53 Ableitung, 68, 76 linksseitige, 78 rechtsseitige, 78 zweite, 77 absolut konvergente Reihe, 42 Addition, 12 affine Abbildung, 68 angeordneter Körper, 13 Ball offener, 52 beschränkt, 22, 29 beschränkte Abbildung, 89 beschränkte Folge, 32 Betrag, 16, 28 Cauchy-Folge, 36 Cauchy-Riemannsches Integral, 93 charakteristische Funktion, 104 Cosinus-Funktion, 61 differenzierbare Abbildung, 68, 74, 80 Einheit imaginäre, 28 Eins, 12 Einselement, 12 erweiterte Zahlengerade, 25 Eulersche Formel, 61 Eulersche Zahl, 45 Exponentialfunktion, 45 Exponentialreihe, 45 Extremum lokales, 80 Feinheit einer Unterteilung, 95 Folge, 30 beschränkte, 32 konvergente, 30, 54 monoton fallende, 34 monoton wachsende, 34 monotone, 34 streng monoton fallende, 34 streng monoton wachsende, 34 folgenkompakte Menge, 58 Formel Eulersche, 61 Funktion, 48 charakteristische, 104 Funktionenfolge gleichmäßig konvergente, 91 geometrische Reihe, 39 gleichmäßig stetige Abbildung, 59 Größer-Relation abgeleitete, 14 Grenzwert, 30 Häufungspunkt, 67 harmonische Reihe, 40 imaginäre Einheit, 28 Imaginärteil, 28 Infimum, 19 Innere, 80 innerer Punkt, 80 Integral, 90 Cauchy-Riemannsches, 93 111 112 Index Riemannsches, 107 Intervall, 24 Körper, 12 angeordneter, 13 Körper der reellen Zahlen, 21 Körpererweiterung, 19 ordnungsvollständige, 21 Körperhomomorphismus, 21 Körperisomorphismus, 21 komplexe Zahl konjugierte, 28 konjugierte komplexe Zahl, 28 konvergente Folge, 30, 54 konvexe Abbildung, 84 Limes, 30 Limes inferior, 37 Limes superior, 37 linear approximierbar, 68 linksseitige Ableitung, 78 Logarithmus natürlicher, 57 lokales Extremum, 80 lokales Maximum, 80 lokales Minimum, 80 markierte Unterteilung, 95 Maximum, 23 lokales, 80 Menge abgeschlossene, 53 folgenkompakte, 58 offene, 52 perfekte, 74 Minimum, 23 lokales, 80 monoton fallende Folge, 34 monoton wachsende Folge, 34 monotone Folge, 34 Multiplikation, 12 nach oben beschränkt, 19 nach unten beschränkt, 19 natürlicher Logarithmus, 57 Null, 12 Nullelement, 12 obere Schranke, 19 offene Menge, 52 offener Ball, 52 perfekte Menge, 74 Punkt innerer, 80 Realteil, 28 rechtsseitige Ableitung, 78 Regelfunktion, 91, 98 Reihe absolut konvergente, 42 geometrische, 39 harmonische, 40 unendliche, 39 Riemann integrierbar, 105 Riemannsche Summe, 95 Riemannsches Integral, 107 Schranke obere, 19 untere, 19 Sinus-Funktion, 61 Stammfunktion, 100 stetige Abbildung, 49 Subtraktion, 13 Summe einer Reihe, 39 Riemannsche, 95 Supremum, 19 Teilfolge, 34 Treppenfunktion, 89 unendliche Reihe, 39 untere Schranke, 19 Unterkörper, 26 Unterteilung, 89 markierte, 95 Index Verfeinerung einer Unterteilung, 89 Zahlengerade erweiterte, 25 zweite Ableitung, 77 113