ii 4 Differenzierbarkeit 4.1 Definition und grundlegende Eigenschaften . . . 4.2 Der Mittelwertsatz . . . . . . . . . . . . . . . . 4.3 Anwendungen des Mittelwertsatzes . . . . . . . 4.4 Folgen und Reihen differenzierbarer Funktionen Analysis I Walter Bergweiler WS 2006/07 Fassung vom 6. Februar 2007 Inhaltsverzeichnis 1 Grundlagen 1.1 Einleitung . . . . . . . . . . 1.2 Aussagenlogik . . . . . . . . 1.3 Mengen . . . . . . . . . . . 1.4 Quantoren . . . . . . . . . . 1.5 Relationen und Funktionen . 1.6 Vollständige Induktion . . . 1.7 Körper . . . . . . . . . . . . 1.8 Reelle Zahlen . . . . . . . . 1.9 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Folgen und Reihen 2.1 Folgen . . . . . . . . . . . . . . . . . . . . . . 2.2 Rechenregeln . . . . . . . . . . . . . . . . . . 2.3 Konvergenzkriterien . . . . . . . . . . . . . . . 2.4 Limes superior und inferior sowie uneigentliche 2.5 Die allgemeine Potenz . . . . . . . . . . . . . 2.6 Reihen . . . . . . . . . . . . . . . . . . . . . . 2.7 Absolute und bedingte Konvergenz . . . . . . 2.8 Kriterien für absolute Konvergenz . . . . . . . 2.9 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 1 3 6 9 14 16 21 26 . . . . . . . . . . . . . . . . . . . . . Grenzwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 30 33 36 40 43 43 46 48 50 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 54 56 57 60 65 66 70 . . . . . . . . . 3 Stetigkeit und Grenzwerte von Funktionen 3.1 Stetigkeit . . . . . . . . . . . . . . . . . . . . . 3.2 Der Zwischenwertsatz . . . . . . . . . . . . . . . 3.3 Grenzwerte von Funktionen . . . . . . . . . . . 3.4 Trigonometrische und hyperbolische Funktionen 3.5 Polarkoordinaten . . . . . . . . . . . . . . . . . 3.6 Kompakte Mengen . . . . . . . . . . . . . . . . 3.7 Folgen stetiger Funktionen . . . . . . . . . . . . i INHALTSVERZEICHNIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 72 77 80 86 INHALTSVERZEICHNIS iii 1 1 Grundlagen 1.1 Einleitung “Was ist Mathematik?” Dies ist der Titel eines (lesenswerten) Buches von R. Courant und H. Robbins. Die Antwort ist nicht einfach, und das genannte Buch gibt sie, indem es in mathematische Methoden und Denkweisen einführt. Wir verzichten auf eine “Definition” des Begriffs “Mathematik”, sondern begnügen uns zunächst mit der Feststellung, dass die Mathematik eine Wissenschaft ist, die Aussagen über (abstrakte) Objekte wie Zahlen, Mengen, Funktionen, usw. macht. Die Vorgehensweise ist dabei folgende: Man beginnt mit gewissen Grundaussagen, den sogenannten Axiomen. Neue Aussagen gewinnt man aus diesen Axiomen (und bereits gewonnenen Aussagen) durch logisches Schließen. Eine so gewonnene Aussage nennt man Satz (oder auch Theorem), in manchen Fällen auch Hilfssatz (Lemma), Folgerung (Korollar) oder ähnlich. Die Herleitung einer solchen Aussage durch logisches Schließen nennt man Beweis. Die Festlegung eines neuen Begriffs nennt man Definition. Was ist Analysis? Auch auf eine Definition des Begriffs “Analysis” soll hier verzichtet werden. Wir nennen lediglich einige der Grundbegriffe: reelle und komplexe Zahlen, Funktionen, Stetigkeit, Ableitung, Integral,... Wie die meisten anderen mathematischen Disziplinen hat auch die Analysis vielfältige Anwendungen. So bedient man sich etwa bei der mathematischen Beschreibung von Vorgängen in Naturwissenschaft und Technik oft der Sprache und Methoden der Analysis. Stellt man beispielsweise die Position eines beweglichen Teilchens als Funktion der Zeit dar, so ist seine Geschwindigkeit durch die Ableitung und seine Beschleunigung durch die zweite Ableitung gegeben. 1.2 Aussagenlogik (Mathematische) Aussagen können wahr (w) oder falsch (f) sein: • 2+3=4 (f) • 7 ist eine Primzahl (w) Es muss nicht bekannt sein, ob eine Aussage wahr oder falsch ist: • Es gibt unendlich viele natürliche Zahlen n, so dass n und n + 2 beide Primzahlen sind (?) Die Verneinung (Negation) einer Aussage A wird mit ¬A bezeichnet; gesprochen ”nicht A”. Es ist ¬A genau dann wahr, wenn A falsch ist. Aus Aussagen A und B lassen sich durch die folgenden Operationen neue Aussagen gewinnen: • A ∧ B, gesprochen “A und B”: wahr genau dann, wenn A und B beide wahr sind. • A ∨ B, gesprochen “A oder B”: wahr genau dann, wenn mindestens eine der Aussagen A, B wahr ist. 2 1 GRUNDLAGEN • A ⇒ B, gesprochen “aus A folgt B”, “A impliziert B” oder “wenn A, dann B”: nur dann falsch, wenn A wahr und B falsch; gleichbedeutend mit ¬A∨B. (Mit ¬A ∨ B ist hier (¬A) ∨ B und nicht (¬A ∨ B) gemeint.) Man schreibt auch B ⇐ A statt A ⇒ B. • A ⇔ B, gesprochen “A ist äquivalent zu B”: genau dann wahr, wenn A und B beide wahr oder beide falsch sind; gleichbedeutend mit (A ⇒ B) ∧ (B ⇒ A). Die Wahrheitswerte der Aussagen ¬A, A ∧ B, A ∨ B, A ⇒ B sowie A ⇔ B sind also durch die von A und B festgelegt. Man stellt dies auch in einer sogenannten Wahrheitstafel dar: A B ¬A A ∧ B A ∨ B A ⇒ B ¬A ∨ B A ⇔ B w w f w w w w w f f f w f f f w f w w f w w w f f f w f f w w w Man erkennt hier die Äquivalenz von A ⇒ B und ¬A ∨ B. Anders gesagt, die Aussage (A ⇒ B) ⇔ ¬A ∨ B ist immer wahr, unabhängig vom Wahrheitswert von A und B. Ebenso erkennt man, dass A ⇒ B immer dann wahr ist, wenn A falsch ist. Aus einer falschen Aussage kann also jede Aussage gefolgert werden! Schließlich beachte man, dass A ∨ B auch dann wahr ist, wenn A und B beide gelten. In der Mathematik ist mit “oder” also immer das “einschließende oder” und nicht “entweder-oder, aber nicht beides” gemeint. Mathematische Sätze haben in der Regel die Form A ⇒ B. Dann heißt A die Voraussetzung und B die Behauptung. Man sagt auch, dass A eine hinreichende Bedingung für B ist und B eine notwendige Bedingung für A ist. Gleichbedeutend mit A ⇒ B ist ¬B ⇒ ¬A. Hiervon überzeugt man sich anhand der Wahrheitstafel: A B ¬A ¬B A ⇒ B ¬B ⇒ ¬A w w f f w w w f f w f f w w f w w f f f w w w w Die Aussage ¬B ⇒ ¬A heißt Kontraposition der Aussage A ⇒ B. Die Kontraposition der (wahren) Aussage “Wenn eine natürliche Zahl durch 9 teilbar ist, dann ist sie auch durch 3 teilbar” lautet beispielsweise: “Wenn eine natürliche Zahl nicht durch 3 teilbar ist, so ist sie auch nicht durch 9 teilbar”. Die Gültigkeit der folgenden Aussagen verifiziert man leicht durch Aufstellen der Wahrheitstafel. Dabei sind A, B und C beliebige Aussagen. (i) A ∧ B ⇔ B ∧ A (ii) A ∨ B ⇔ B ∨ A (iii) (A ∧ B) ∧ C ⇔ A ∧ (B ∧ C) (iv) (A ∨ B) ∨ C ⇔ A ∨ (B ∨ C) 3 1.3 Mengen (v) A ∧ (B ∨ C) ⇔ (A ∧ B) ∨ (A ∧ C) (vi) A ∨ (B ∧ C) ⇔ (A ∨ B) ∧ (A ∨ C) (vii) ¬(¬A) ⇔ A (viii) ¬(A ∨ B) ⇔ ¬A ∧ ¬B (ix) ¬(A ∧ B) ⇔ ¬A ∨ ¬B Man nennt (i) und (ii) Kommutativgesetz, (iii) und (iv) Assoziativgesetz sowie (v) und (vi) Distributivgesetz. Aufgrund des Assoziativgesetzes kann man bei den Ausdrücken A ∧ B ∧ C sowie A ∨ B ∨ C also auf Klammern ganz verzichten. Zum Beweis eines Satzes der Form “A⇒ B” gibt es zwei Möglichkeiten. Direkter Beweis. Man findet Aussagen A1 , A2 , ..., , An mit (A ⇒ A1 ) ∧ (A1 ⇒ A2 ) ∧ ... ∧ (An ⇒ B). Man schreibt dies auch kurz als A ⇒ A1 ⇒ A2 ⇒ ... ⇒ An ⇒ B. Man überzeugt sich (durch Aufstellen der Wahrheitstafel), dass (A ⇒ A1 ) ∧ (A1 ⇒ B) tatsächlich A ⇒ B impliziert, d.h., es gilt ((A ⇒ A1 ) ∧ (A1 ⇒ B)) ⇒ (A ⇒ B) für Aussagen A, A1 , B. Dies ist obige Situation falls n = 1. Wir werden später sehen, wie man den Fall beliebiger natürlicher Zahlen n behandeln kann (vollständige Induktion). Indirekter Beweis. Die einfachste Form des indirekten Beweises ist der direkte Beweis der Kontraposition ¬B ⇒ ¬A. Eine andere Form ist der Beweis durch Widerspruch. Man nimmt A ∧ ¬B sowie eventuell weitere bekannte (wahre) Aussagen an, und erzielt ein Widerspruch zu bekannten (wahren) Aussagen. Formal zeigt man also mit wahren Aussagen C und D, dass A ∧ ¬B ∧ C ⇒ ¬D gilt. (Man beachte, dass ¬(A ⇒ B) ⇔ ¬(¬A ∨ B) ⇔ A ∧ ¬B.) 1.3 Mengen Nach G. Cantor (1895) ist eine Menge M eine “Zusammenfassung aus wohlbestimmten und wohlunterschiedenen Objekten unserer Anschauung oder unseres Denkens (welche die Elemente von M genannt werden) zu einer Gesamtheit”. Ist x ein Element der Menge M, so bezeichnen wir dies mit x ∈ M. Ist x kein Element von M, so schreiben wir x ∈ / M. Es gilt also x ∈ / M ⇔ ¬(x ∈ M). Mengen können durch explizite Angabe ihrer Elemente definiert werden. So ist M = {x1 , x2 , ..., xn } die aus den Elementen x1 , ..., xn bestehende Menge M. Mengen können auch durch die Eigenschaften ihrer Elemente definiert werden: M = {x : x hat die Eigenschaft E}. 4 1 GRUNDLAGEN Zum Beispiel ist {x : x ist Primzahl ∧ x ≤ 10} = {2, 3, 5, 7}. Die leere Menge ist die Menge, die kein Element enthält. Sie wird mit ∅ bezeichnet. Wir definieren einige weitere wichtige Mengen. Das Zeichen “:=” bedeutet hier und im folgenden “wird definiert als”. (Bei der Definition von Aussagen benutzt man analog das Zeichen “:⇔”.) 5 1.3 Mengen Vereinigung von M und N. Die Mengen M und N heißen disjunkt falls M ∩ N = ∅. Weiter ist M\N := {x : x ∈ M ∧ x 6∈ N}, gesprochen “M ohne N”. Im Falle N ⊂ M heißt M\N auch Komplement von N (in M). Für M = {1, 2} und N = {2, 3} ist also M ∩ N = {2}, M ∪ N = {1, 2, 3} und M\N = {1}. Die folgenden Regeln für Mengen L, M, N sind analog zu den entsprechenden Regeln der Aussagenlogik: • N := {1, 2, 3, ...} ist die Menge der natürlichen Zahlen, (i) M ∩ N = N ∩ M • N0 := {0, 1, 2, 3, ...}, (ii) M ∪ N = N ∪ M • Z := {0, ±1, ±2, ...} = {..., −2, −1, 0, 1, 2, ...} ist die Menge der ganzen Zahlen, (iii) (L ∩ M) ∩ N = L ∩ (M ∩ N) • Q := { pq : p, q ∈ Z ∧ q 6= 0} ist die Menge der rationalen Zahlen • R ist die Menge der reellen Zahlen. Eine Menge N heißt Teilmenge der Menge M, falls x ∈ N impliziert, dass x ∈ M gilt. Wir bezeichnen dies mit N ⊂ M oder M ⊃ N. Insbesondere bei Benutzung der zweiten Schreibweise sagen wir auch, dass M Obermenge von N ist. Man beachte, dass N = M zugelassen ist. Es gilt N = M ⇔ (N ⊂ M) ∧ (M ⊂ N). Zum Beispiel gilt N ⊂ Z ⊂ Q ⊂ R. (Dies ist eine kurze Schreibweise für (N ⊂ Z) ∧ (Z ⊂ Q) ∧ (Q ⊂ R).) Weiter heißt N echte Teilmenge von M falls N ⊂ M und N 6= M. Dafür benutzen wir die Schreibweise N ( M oder M ) N. Analog spricht man auch von echten Obermengen. Es gilt auch N ( Z ( Q ( R. Hinweis. Die Terminologie ist in der Literatur uneinheitlich. Manche Autoren benutzen das Symbol “⊆” anstelle von “⊂”, und dort entspricht “⊂” dann dem hier verwandten “(”. Die Potenzmenge P (M) einer Menge M ist die Menge aller Teilmengen von M, also P (M) = {N : N ⊂ M}. Zum Beispiel ist P ({1, 2}) = {∅, {1}, {2}, {1, 2}}. Für Mengen M und N heißen M ∩ N := {x : x ∈ M ∧ x ∈ N} Durchschnitt und M ∪ N := {x : x ∈ M ∨ x ∈ N} (iv) (L ∪ M) ∪ N = L ∪ (M ∪ N) (v) L ∩ (M ∪ N) = (L ∩ M) ∪ (L ∩ N) (vi) L ∪ (M ∩ N) = (L ∪ M) ∩ (L ∪ N) (vii) M\(M\N) = M ∩ N (viii) L\(M ∪ N) = L\M ∩ L\N (ix) L\(M ∩ N) = L\M ∪ L\N. Im Falle N ⊂ M gilt mit (vii) also M\(M\N) = N. Man bezeichnet (i)-(vi) wieder als Kommutativ-, Assoziativ- bzw. Distributivgesetz. Die Gleichungen (viii) und (ix) heißen Regeln von de Morgan. Wir führen hier nur den Beweis von (v): ⇔ ⇔ ⇔ ⇔ ⇔ x ∈ L ∩ (M ∪ N) x ∈ L ∧ (x ∈ M ∪ N) x ∈ L ∧ (x ∈ M ∨ x ∈ N) (x ∈ L ∧ x ∈ M) ∨ (x ∈ L ∧ x ∈ N) (x ∈ L ∩ M) ∨ (x ∈ L ∩ N) x ∈ (L ∩ M) ∪ (L ∩ N) Die Behauptung folgt. Die anderen Regeln beweist man analog. Das kartesische Produkt M × N zweier Mengen M und N ist die Menge aller geordneten Paare (x, y) mit x ∈ M und y ∈ N, also M × N = {(x, y) : x ∈ M ∧ y ∈ N}. Man beachte, dass M × N 6= N × M für M 6= N und (x, y) 6= (y, x) für x 6= y. Allgemeiner setzt man für n ∈ N und Mengen M1 , M2 , ..., Mn auch M1 × M2 × ... × Mn := {(x1 , x2 , ..., xn ) : x1 ∈ M1 ∧ ... ∧ xn ∈ Mn }. 6 1 GRUNDLAGEN Im Falle M1 = M2 = ... = Mn = M schreibt man statt M | × M ×{zM... × M} n − mal auch M n . So ist R2 = R × R und R3 = R × R × R. Die Punkte des R3 entsprechen den Punkten des dreidimensionalen Raumes, die des R2 denen der Ebene. Der hier verwandte “naive” Mengenbegriff führt zu Widersprüchen (Antinomien). Klassisches Beispiel ist die Russellsche Antinomie: Sei M die Menge aller Mengen, die sich nicht selbst als Element enthalten, d.h., M = {x : x Menge ∧ x 6∈ x} Aus M ∈ / M folgt dann M ∈ M, und umgekehrt. Es gilt also M ∈ M ⇔ ¬(M ∈ M), was ein Widerspruch ist. Der Widerspruch ist nur behebbar durch eine genauere Definition des Begriffs Menge - wir verzichten aber hier darauf. Das obige Problem tritt nicht auf, falls – wie wir es tun werden – nur Teilmengen gewisser “unproblematischer” Grundmengen betrachtet werden. 1.4 Quantoren In mathematischen Aussagen treten häufig Variable auf, etwa die Variable x in der durch “x ist Primzahl” gegebenen Aussage A(x). Sinnvoll sind solche Aussagen im allgemeinen nur für Variable aus gewissen Mengen, im genannten Beispiel etwa x ∈ M mit M = N. Mit Hilfe der Quantoren ∀ (“für alle”) und ∃ (“es existiert”) lassen sich aus einer für x ∈ M erklärten Aussage A(x) neue Aussagen bilden. Die Aussage ∀x ∈ M : A(x), bedeutet: “Für alle x ∈ M gilt A(x)”. Formal kann man die Aussage “∀x ∈ M : A(x)” definieren, indem man sie als wahr definiert falls M = {x ∈ M : A(x)}, und als falsch sonst. Die Aussage ∃x ∈ M : A(x) bedeutet: “Es gibt ein x ∈ M für welches A(x) gilt”. Dies gilt falls {x ∈ M : A(x)} 6= ∅. Ist etwa M = {a, b}, so gilt (∀x ∈ M : A(x)) ⇔ A(a) ∧ A(b) und (∃x ∈ M : A(x)) ⇔ A(a) ∨ A(b) Analoges gilt für beliebige endliche Mengen M. Quantoren erlauben eine Verallgemeinerung auf unendliche Mengen M. 7 1.4 Quantoren Regeln wie ¬(A ∧ B) ⇔ ¬A ∨ ¬B verallgemeinern sich wie folgt: ¬(∀x ∈ M : A(x)) ⇔ ∃x ∈ M : ¬A(x), ¬(∃x ∈ M : A(x)) ⇔ ∀x ∈ M : ¬A(x). Der Beweis der ersten Äquivalenz folgt aus ⇔ ⇔ ⇔ ⇔ ⇔ ¬(∀x ∈ M : A(x)) ¬(M = {x ∈ M : A(x)}) M 6= {x ∈ M : A(x)} M\{x ∈ M : A(x)} 6= ∅ {x ∈ M : ¬A(x)}) 6= ∅ ∃x ∈ M : ¬A(x). Der Beweis der zweiten Äquivalenz ist analog. Als Beispiel betrachten wir die (falsche) Aussage “Alle Primzahlen sind ungerade”. Ist A(x) die (für ganze Zahlen erklärte) Aussage “x ist ungerade” und M die Menge der Primzahlen, so können wir die Aussage “Alle Primzahlen sind ungerade” in der Form “∀x ∈ M : A(x)” schreiben. Die Negation davon ist die (wahre) Aussage “∃x ∈ M : ¬A(x)”, die wir in Worten als “Es gibt eine Primzahl, die nicht ungerade ist” ausdrücken können. (Die Aussage ist wahr, da 2 eine gerade Primzahl ist.) Ein häufiger Fehler ist, als Negation der Aussage “∀x ∈ M : A(x)” die Aussage “∀x ∈ M : ¬A(x)” anzugeben (“Alle Primzahlen sind gerade.”). Eine Aussage kann mehrere Quantoren enthalten. Bei verschiedenen Quantoren kommt es dabei auf die Reihenfolge an. Sei zum Beispiel S die Menge der deutschen Städte, M die Menge der Menschen und A(x, y) die für x ∈ S und y ∈ M erklärte Aussage: y besitzt ein Haus in x. So ist die Aussage ∀x ∈ S ∃y ∈ M : A(x, y), d.h., “Zu jeder Stadt existiert ein Mensch, der dort ein Haus besitzt”, vermutlich richtig, während ∃y ∈ M ∀x ∈ S : A(x, y), d.h., “Es existiert ein Mensch, der in jeder deutschen Stadt ein Haus besitzt”, vermutlich falsch ist. Auf jeden Fall sind beide Aussagen verschieden. Die Negation der letzten Aussage lässt sich rein formal bilden: ¬(∃y ∈ M ∀x ∈ S : A(x, y)) ⇔ ∀y ∈ M : ¬(∀x ∈ S : A(x, y)) ⇔ ∀y ∈ M ∃x ∈ S : ¬A(x, y) Wir erhalten: “Zu jedem Mensch existiert eine Stadt, in der er kein Haus besitzt”. (Auch wenn sich Verneinungen oder andere Operationen mit Aussagen also auf rein formalem Wege bilden lassen, so ist es definitiv ratsam und in jedem Fall eine gute Übung, das Ergebnis “mit dem gesunden Menschenverstand” zu überprüfen.) 8 1 GRUNDLAGEN Quantoren erlauben auch, Vereinigung und Durchschnitt von unendlich vielen Mengen zu definieren. Für eine Menge S von Mengen setzen wir \ M ∈S M := {x : (∀M ∈ S : x ∈ M)} und [ M ∈S M := {x : (∃M ∈ S : x ∈ M)}. 9 1.5 Relationen und Funktionen 1.5 Relationen und Funktionen Seien M, N Mengen und R ⊂ M ×N. Dann heißt R Relation (zwischen M und N). Im Falle M = N nennen wir R auch Relation auf M. Statt (x, y) ∈ R schreiben wir im allgemeinen xRy. Anstelle von Buchstaben benutzen wir meistens suggestive Symbole wie ∼, ≃, <, ⊂, usw. zur Bezeichnung von Relationen. Beispiel. M = N = R, R = {(x, y) ∈ R2 : x2 ≥ y 2}. Es gilt also xRy ⇔ x2 ≥ y 2, also xRy ⇔ |x| ≥ |y|. Die durch R gegebene Teilmenge von R2 kann auch graphisch dargestellt werden (Abbildung 1). Die Regeln von de Morgan gelten dann entsprechend. Mit einer Menge N ist dann N\ \ M= [ 2 N\M 1 M ∈S M ∈S und N\ [ M= M ∈S \ N\M. –2 –1 2 M ∈S –1 Neben den Quantoren ∀ und ∃ benutzen wir auch noch das Symbol “∃!” für “es gibt genau ein”. Die Aussage “∃!x ∈ M : A(x)” ist also definiert durch “{x ∈ M : A(x)} besteht aus genau einem Element”. Bemerkung zum Gebrauch von Quantoren. Benützt man die (übliche) Bezeichnung “m|n” für “m ist Teiler von n”, so kann man die Aussage (A) Wenn eine natürliche Zahl durch 9 teilbar ist, so ist sie auch durch 3 teilbar auch in der Form –2 Abbildung 1: Graphische Darstellung der durch x2 ≥ y 2 gegebenen Relation. Wir betrachten drei wichtige Spezialfälle. (a) Äquivalenzrelationen. Sei M Menge, ∼ Relation auf M, also ∼⊂ M × M. Dann heißt ∼ (B) ∀n ∈ N : 9|n ⇒ 3|n 1 schreiben. Der geübte Mathematiker erkennt sofort, dass es sich hier um die gleiche Aussage handelt, die lediglich in zwei verschiedenen Formen ausgedrückt ist. In mathematischen Texten (Seminarausarbeitung, Diplom- oder Staatsexamensarbeit, Buch,. . . ) wird man im allgemeinen die Form (A) bevorzugen. Bei Vorträgen und Vorlesungen wird man aus Zeitgründen häufig die Form (B) wählen – die Quantoren werden also als abkürzende Schreibweise benutzt. Um mit der Schreibweise vertraut zu machen und um die Diskrepanz zwischen Tafelbild und Vorlesungsskript gering zu halten, wird in diesem Vorlesungsskript die Quantorenschreibweise häufiger benutzt als dies üblicherweise in einem mathematischen Text der Fall ist. Um einem gerade bei Studienanfängern verbreiteten Irrglauben entgegenzuwirken, sei ausdrücklich darauf hingewiesen, dass die Schreibweise (B) nicht präziser (oder “mathematischer”) as (A) ist. 1 1 x Wer dies auch nach mehreren Monaten Mathematikstudium nicht sofort erkennt, hat nicht genug geübt. • reflexiv, falls ∀x ∈ M : x ∼ x, • symmetrisch, falls ∀x, y ∈ M : x ∼ y ⇒ y ∼ x, • transitiv, falls ∀x, y, z ∈ M : x ∼ y ∧ y ∼ z ⇒ x ∼ z. Eine reflexive, symmetrische und transitive Relation heißt Äquivalenzrelation. Beispiel 1. Die Gleichheitsrelation ist eine Äquivalenzrelation. Beispiel 2. Sei M die Menge der “Landpunkte” der Erdoberfläche (also die Menge der Punkte, die nicht im Meer oder anderen Gewässern liegen). Für x, y ∈ M gelte x ∼ y falls x mit y auf dem Landweg verbunden werden kann. Dann ist ∼ Äquivalenzrelation. Grundlegende Eigenschaft einer Äquivalenzrelation ∼ auf einer Menge M ist, dass sie eine Zerlegung von M in disjunkte Teilmengen - die sogenannten Äquivalenzklassen - liefert, so dass für x, y ∈ M genau dann x ∼ y gilt, wenn x, y in 10 1 GRUNDLAGEN derselben Teilmenge liegen. Formal kann man dies wie folgt ausdrücken: ⇔ ∼ ist Äquivalenzrelation auf M [ ∃A ⊂ P (M) : N =M 11 1.5 Relationen und Funktionen Satz 1.5.1 Sei M Menge, A ⊂ M und ≺ Halbordnung auf M. (i) Ein Maximum von A ist auch Supremum von A. (ii) A besitzt höchstens ein Supremum. N ∈A ∧ [∀L, N ∈ A : L 6= N ⇒ L ∩ N = ∅] ∧ [∀x, y ∈ M : (x ∼ y ⇔ ∃N ∈ A : x ∈ N ∧ y ∈ N)] Wir skizzieren den Beweis nur. Für x ∈ M setzen wir [x] := {y ∈ M : x ∼ y}. Sei nun x, y ∈ M mit x ∼ y. Ist dann z ∈ [y], also y ∼ z, so ist nach Transitivität auch x ∼ z, also z ∈ [x]. Es folgt [y] ⊂ [x]. Aus Symmetriegründen ist auch [x] ⊂ [y], also [x] = [y]. Im Falle x 6∼ y (was nach Definition ¬(x ∼ y) bedeuten soll) zeigt man [x] ∩ [y] = ∅, woraus dann die Behauptung folgt. Wir werden die Bezeichnung [x] für die Äquivalenzklasse {y ∈ M : x ∼ y} auch im folgenden verwenden. Man beachte, dass x ∈ [x], da Äquivalenzrelationen insbesondere symmetrisch sind. Im obigen Beispiel 1 (Gleichheitsrelation) gilt [x] = {x} für alle x ∈ M. Im Beispiel 2 nennt man die Äquivalenzklassen (je nach Größe) Erdteil oder Insel. (b) Ordnungsrelationen. Eine Relation ≺ auf einer Menge M heißt antisymmetrisch (oder identitiv) falls für alle x, y ∈ M aus x ≺ y und y ≺ x folgt, dass x = y gilt, d. h., falls ∀x, y ∈ M : x ≺ y ∧ y ≺ x ⇒ x = y. Eine reflexive, antisymmetrische und transitive Relation heißt Halbordnung. Beispiel 1. M = R, ≺=≤ Beispiel 2. X Menge, M = P (X), ≺=⊂. Eine Relation ≺ auf M heißt total (oder vollständig), falls für alle x, y ∈ M mindestens eine der Aussagen x ≺ y und y ≺ x gilt, d. h., falls ∀x, y ∈ M : x ≺ y ∨ y ≺ x. Eine totale Halbordnung heißt Ordnung. Das Paar (M, ≺) heißt dann geordnete Menge. Im obigem Beispiel 1 ist ≤ Ordnung, während ⊂ in Beispiel 2 keine Ordnung ist, wenn M mindestens zwei Elemente hat. Denn sind a, b ∈ M, a 6= b, so ist {a} ⊂ P (M) und {b} ⊂ P (M), aber weder {a} ⊂ {b} noch {b} ⊂ {a}. Sei ≺ Halbordnung auf M und A ⊂ M. Dann heißt A nach oben beschränkt, falls s ∈ M existiert, so dass a ≺ s für alle a ∈ A gilt. Ein solches s heißt obere Schranke von A. Eine obere Schranke von A, die in A enthalten ist, heißt Maximum von A. Eine obere Schranke s von A heißt Supremum (oder kleinste obere Schranke) von A, wenn für jede obere Schranke t von A gilt, dass s ≺ t. Beispiel 1. X = {a, b, c}, M = P (X), A = {∅, {a}, {b}}, ≺=⊂. Die Menge {a, b} ist Supremum, aber kein Maximum von A. Beispiel 2. M = A = N, ≺=≤. Hier besitzt A kein Supremum. Beweis. (i) Sei s Maximum von A, d.h., s ist obere Schranke von A und es gilt s ∈ A. Zu zeigen ist, dass s Supremum ist. Sei dazu t obere Schranke von A. Zu zeigen ist, dass s ≺ t. Dies gilt aber wegen s ∈ A nach Definition der oberen Schranke. (ii) Seien r und s Suprema. Dann gelten sowohl r ≺ s wie auch s ≺ r, also folgt r = s. Hier und im folgenden wird durch das Symbol das Ende eines Beweises markiert. Aus Satz 1.5.1 folgt, dass eine Menge höchstens ein Maximum haben kann. Wir bezeichnen das Maximum (bzw. Supremum) einer Menge A mit max A (bzw. sup A), falls es existiert. Völlig analog definiert man nach unten beschränkt, untere Schranke, Infimum (größte untere Schranke), inf A, Minimum, min A. Satz 1.5.1 gilt entsprechend. Eine geordnete Menge (M ≺) heißt ordnungsvollständig, wenn jede nichtleere, nach oben beschränkte Teilmenge von M ein Supremum besitzt. Man kann zeigen, dass (M, ≺) genau dann ordnungsvollständig ist, wenn jede nichtleere, nach unten beschränkte Teilmenge von M ein Infimum besitzt. Ist ≺ Ordnung auf M, so heißt die durch ≺ x y :⇔ x ≺ y ∧ x 6= y 6= definierte Relation strikte Ordnung auf M. Für x, y ∈ M gilt dann genau einer der ≺ drei Fälle x ≺ y, x = y oder y 6= x. Ist umgekehrt ≺ eine transitive Relation mit der 6= 6= letzten Eigenschaft, so ist ≺ strikte Ordnung, und die zugehörige Ordnung ≺ ist 6= durch ≺ x≺y ⇔x y∨x=y 6= gegeben. Für M = R, ≺=≤ ist natürlich auch y > x bzw. y ≥ x. ≺ 6 = =<. Statt x < y bzw. x ≤ y schreiben wir (c) Funktionen. Eine Relation f zwischen Mengen M und N heißt Funktion (oder Abbildung) von M nach N (oder in N) falls zu jedem x ∈ M genau ein y ∈ N mit xf y existiert, d.h., falls ∀x ∈ M∃!y ∈ N : (x, y) ∈ f. Wir bezeichnen das zu x ∈ N existierende, eindeutig bestimmte y, welches xf y erfüllt, mit f (x) und nennen es Bild von x (unter f ) oder Wert von f an der Stelle x. Man muss zwischen der Funktion f (Teilmenge von M × N) und dem Wert f (x) (Element von N) unterscheiden. 12 1 GRUNDLAGEN Obwohl eine Funktion f von M nach N also formal nichts anderes als eine Teilmenge von M × N mit gewissen Eigenschaften ist, ist es oft hilfreich, sich f als Vorschrift vorzustellen, die jedem Wert x ∈ M sein Bild y ∈ N zuordnet. Dieser Gedanke kommt auch in den Schreibweisen f : M → N, f (x) = ... und f : M → N, x 7→ ..., die wir für Funktionen benutzen, zum Ausdruck. Man kann den obigen Gedanken, sich f als Vorschrift vorzustellen, auch zur Definition des Funktionsbegriffes verwenden. In diesem Falle würde man {(x, f (x)) : x ∈ M} als Graph der Funktion f bezeichnen. Wir haben hier die Funktion f über ihren Graphen definiert, d.h., es gilt f = {(x, f (x)) : x ∈ M}. Man sollte die Vorstellung, dass eine Funktion f : M → N eine Vorschrift ist, die jedem x ∈ M ein y ∈ N zuordnet, aber nicht so interpretieren, dass dieses y auch immer effektiv berechnet werden kann. Beispielsweise ist bei der Funktion f : N → N, x 7→ größte Primzahl, die x teilt der Wert f (x) für große x (mit mehreren hundert Stellen) kaum zu berechnen. Für eine Funktion f : M → N nennen wir M Definitionsbereich und N Zielbereich. Man beachte, dass M durch f eindeutig festgelegt ist, denn M = {x : ∃y : (x, y) ∈ f )}. Der Zielbereich ist durch die Funktion f (also durch die Menge f ) aber nicht eindeutig festgelegt. Zum Beispiel kann er durch jede Obermenge ersetzt werden, d.h., ist f Funktion von M nach N und ist N ′ ⊃ N, so ist f auch Funktion von M nach N ′ . Sei f Funktion von M nach N, A ⊂ M und B ⊂ N. Dann heißt f (A) := {f (x) : x ∈ A} Bild von A (unter f ) und f −1 (B) := {x ∈ M : f (x) ∈ B} Urbild von B (unter f ). Das Bild von M, also die Menge f (M), heißt Wertebereich (von f ). Man beachte, dass die Bezeichnungen hier uneinheitlich sind: in manchen Büchern wird auch N als Wertebereich bezeichnet. Für y ∈ N schreibt man statt f −1 ({y}) auch f −1 (y). Eine Funktion f : M → N heißt injektiv (oder eineindeutig) falls für alle x, y ∈ M mit x 6= y auch f (x) 6= f (y) gilt, d. h., falls ∀x, y ∈ M : x 6= y ⇒ f (x) 6= f (y). (Äquivalent zu obiger Implikation ist natürlich ihre Kontraposition: f (x) = f (y) ⇒ x = y). Eine Funktion f : M → N heißt surjektiv (oder Funktion von M auf N) falls f (M) = N, d.h., falls gilt: ∀y ∈ N∃x ∈ M : f (x) = y. 1.5 Relationen und Funktionen 13 Eine Funktion heißt bijektiv, wenn sie injektiv und surjektiv ist. Ist f : M → N bijektiv, so gilt ∀y ∈ N∃!x ∈ M : f (x) = y. Man beachte, dass Surjektivität und damit Bijektivität keine Eigenschaft der Funktion (also Menge) selbst ist, sondern die Angabe eines Zielbereiches erfordert. Bei Injektivität ist dies nicht der Fall. Beispiel 1. Die Funktion f : Z → Z, x 7→ x2 , ist weder injektiv noch surjektiv. Denn wegen f (−1) = f (1) ist sie nicht injektiv, und wegen f −1 (2) = ∅ ist sie nicht surjektiv. Beispiel 2. f : Z → Z, x 7→ x3 , ist injektiv aber nicht surjektiv. √ Beispiel 3. Sei f : N → N, x 7→ größte natürliche Zahl, die nicht größer als x ist. 2 Dann ist f surjektiv, da für jedes y ∈ N zum Beispiel f (y ) = y gilt. Die Funktion f ist aber nicht injektiv, da zum Beispiel f (1) = f (2). Man bezeichnet zu einer reellen Zahl x die größte ganze Zahl, die nicht größer als x ist, auch mit [x]. Durch x 7→ [x] wird damit eine Funktion von R nach Z definiert. Man nennt [x] auch Gaußklammer von x. Die Funktion f aus Beispiel 3 √ kann damit als f : N → N, f (x) = [ x], geschrieben werden. Ist f : M → N bijektiv, so existiert zu jedem y ∈ N genau ein x ∈ M mit f (x) = y. Damit existiert eine Funktion von N nach M, die jedem y ∈ N dieses x ∈ M zuordnet. Sie heißt Umkehrfunktion (oder inverse Funktion) von f und wird mit f −1 bezeichnet. Formal gilt einfach f −1 = {(f (x), x) : x ∈ M} ⊂ N × M. Seien f : M → N und g : P → Q Funktionen mit f (M) ⊂ P . Dann ist die Komposition (oder Zusammensetzung) g ◦ f definiert durch g ◦ f : M → Q, x 7→ g(f (x)). Sei idM : M → M, x 7→ x die Identität (oder identische Abbildung) einer Menge M. Ist dann f : M → N bijektiv, so ist f −1 ◦ f = idM und f ◦ f −1 = idN . Satz 1.5.2 Sei f : M → N Funktion. Dann gilt: (i) f ist injektiv ⇔ Es existiert g : N → M mit g ◦ f = idM . (ii) f ist surjektiv ⇔ Es existiert h : N → M mit f ◦ h = idN . Der Beweis sei als Übung überlassen. Funktionen g, h wie in (i),(ii) nennt man auch Links- bzw. Rechtsinverse. Beispiel. Die Funktion f : N → N\{1}, x 7→ x + 1, ist bijektiv und f −1 : N\{1} → N, x 7→ x − 1. Sei f : M → N Funktion, L ⊂ M. Die Funktion g : L → N, x 7→ f (x), heißt Einschränkung (oder Restriktion) von f auf L und wird mit f |L bezeichnet. Ist g Einschränkung von f , so nennt man f auch Fortsetzung von g. Die Fortsetzung einer Funktion ist natürlich nicht eindeutig. Es sei f : M → N Funktion und es sei auf N eine Ordnung gegeben. Dann heißt f nach oben (bzw. unten) beschränkt, falls f (M) nach oben (bzw. unten) 14 1 GRUNDLAGEN beschränkte Teilmenge von N ist. Eine nach oben und unten beschränkte Funktion heißt beschränkt. Sei nun zusätzlich auch auf M eine Ordnung gegeben. Wir bezeichnen die Ordnung auf M mit ≺M und die auf N mit ≺N . Dann heißt f monoton steigend, falls ∀x, y ∈ M : x ≺M y ⇒ f (x) ≺N f (y) 15 1.6 Vollständige Induktion (ii) Es sei n ∈ N und es gelte A(n). Zu zeigen ist, dass A(n + 1) gilt, d.h. 1 + 2 + 3 + ... + n + (n + 1) = Dies gilt aber wegen 1 + 2 + 3 + ... + n + (n + 1) und monoton fallend, falls = A(n) = ∀x, y ∈ M : x ≺M y ⇒ f (y) ≺N f (x). = Eine monoton steigende bzw. fallende Funktion, die injektiv ist, heißt streng monoton steigend bzw. fallend. Im streng monoton steigenden Fall etwa gilt dann ∀x, y ∈ M : x ≺ ≺ f (y) y ⇒ f (x) 6= N 6= M Beispiel. f : R → R, x 7→ x2 ist weder monoton fallend noch monoton steigend. Es ist aber f |{x ∈ R : x ≥ 0} streng monoton steigend und f |{x ∈ R : x ≤ 0} streng monoton fallend. 1.6 Vollständige Induktion Wir setzen die natürlichen Zahlen N = {1, 2, 3, ...} als gegeben voraus. Wichtiges Beweismittel bei Aussagen über natürliche Zahlen ist das Beweisprinzip der vollständigen Induktion. Es sei für alle n ∈ N eine Aussage A(n) gegeben. Gilt dann und (ii) für alle n ∈ N folgt die Wahrheit von A(n + 1) aus der von A(n), so ist A(n) für alle n ∈ N wahr. Man nennt dabei (i) den Induktionsanfang und (ii) den Induktionsschluss (oder Induktionsschritt). Im Induktionsschluss nennt man auch A(n) Induktionsvoraussetzung und A(n+1) Induktionsbehauptung. Formal ausgedrückt lautet das Prinzip der vollständigen Induktion wie folgt: [A(1) ∧ (∀n ∈ N : A(n) ⇒ A(n + 1))] ⇒ ∀n ∈ N : A(n). Beispiel. Man zeige, dass 1 + 2 + 3 + ... + n = n(n+1) für alle n ∈ N gilt. Sei dazu 2 A(n) die (für natürliche Zahlen n) erklärte Aussage 1 + 2 + 3 + ... + n = (i) A(1) ist wahr, denn 1 = 1(1+1) . 2 n(n + 1) . 2 (1 + 2 + 3 + ... + n) + n + 1 n(n + 1) +n+1 2 (n + 1)(n + 2) . 2 Wir haben oben die Stelle, an der die Induktionsvoraussetzung A(n) benutzt wurde, mit einem entsprechenden Vermerk über dem Gleichheitszeichen markiert. Dies ist in mathematischen Texten eher unüblich, wird aber als Kurzschreibweise in Vorlesungen (oder Vorträgen) verwendet. Ausdrücke der Form f (m)+f (m+1)+...+f (n) mit m, n ∈ Z, m ≤ n, schreiben P wir im folgenden kurz als nk=m f (k). Die oben bewiesene Formel lautet dann n X k= k=1 n(n + 1) . 2 Eine analoge Schreibweise gilt für Produkte: n Y k=m (i) A(1) ist wahr (n + 1)(n + 2) 2 f (k) := f (m) · f (m + 1) · ... · f (n). Q Für n ∈ N definieren wir n! := nk=1 k, gesprochen n Fakultät. Wir setzen außerdem 0! := 1. Für k, n ∈ Z, 0 ≤ k ≤ n, setzen wir n! n := , k k!(n − k)! gesprochen n über k. Die Zahlen n k heißen Binomialkoeffizienten. 2n ≥ 2n für alle n ∈ N gilt. n 2! 1·2 2 = = = 2 = 21 gilt die Ungleichung für Induktionsanfang. Wegen 1 1! · 1! 1·1 n = 1. 2n ≥ 2n . Zu zeigen ist, dass Induktionsschritt. Sei n ∈ N und es gelte n Beispiel. Man zeige, dass 2(n + 1) n+1 ≥ 2n+1 . 16 1 GRUNDLAGEN Dies folgt aber wegen 2(n + 1) n+1 = = = = = 2n + 2 n+1 (2n + 2)! (n + 1)!(n + 1)! (2n + 2)(2n + 1)(2n)! (n + 1)2 (n!)2 2(2n + 1) (2n)! · n+1 (n!)2 2(2n + 1) 2n · n n+1 Ind.-Vor. 2(2n + 1) n ·2 ≥ n+1 2n + 1 n+1 = ·2 n+1 n+1 ≥ 2 . Will man für gegebenes N ∈ Z Aussagen über {n ∈ Z : n ≥ N} beweisen, kann man dies durch geeignete Modifikation des obigen Prinzips tun (Induktionsanfang für n = N). Es ist auch möglich, im Induktionsschritt nicht nur die Gültigkeit von A(n), sondern die von A(k) für alle k ≤ n vorauszusetzen. 1.7 Körper 1.7 Körper 17 Beispiele sind (Q, +, ·), (R, +, ·) sowie (Menge der rationalen Funktionen, +, ·). (Eine rationale Funktion ist ein Quotient von Polynomen.) Statt “(K, +, ·) ist Körper” sagt man oft auch “K ist Körper”. Man nennt (A1)-(A4) Axiome der Addition, (M1)-(M4) Axiome der Multiplikation und (D) Distributivgesetz. (A1) und (M1) heißen Kommutativgesetze und (A2) und (M2) heißen Assoziativgesetze. Insgesamt nennt man die obigen Regeln die Körperaxiome. Wir ziehen einige Folgerungen aus den Körperaxiomen. Satz 1.7.1 Die mit 0 und 1 bezeichneten Elemente sind eindeutig bestimmt. Beweis. Seien 0 und 0′ Elemente von K mit der in (A3) geforderten Eigenschaft, d.h., ∀x ∈ K : x + 0 = x und ∀x ∈ K : x + 0′ = x. Zu zeigen ist 0 = 0′ . Wählt man oben x = 0′ bzw. x = 0, so erhält man 0′ + 0 = 0′ bzw. 0 + 0′ = 0. Mit (A1) folgt also 0 = 0 + 0′ = 0′ + 0 = 0′ . Analog zeigt man die Eindeutigkeit der 1. Man beachte, dass zum Beweis der Eindeutigkeit der 0 lediglich (A1) und (A3) verwandt wurden. Genaugenommen sollte man diesen Beweis erst führen, bevor man (A4) formuliert. Entsprechendes gilt für (M4). Satz 1.7.2 Die in (A4) und (M4) genannten Elemente y sind eindeutig. Beweis. Wir beschränken uns auf (A4). Der Beweis für (M4) ist analog. Seien y, y ′ ∈ K mit x + y = 0 und x + y ′ = 0. Es folgt x + y = x + y ′ und damit y + (x + y) = y + (x + y ′). Mit (A2) folgt (y + x) + y = (y + x) + y ′. Wegen (A1) ist aber y + x = x + y, also y + x = 0. Wir erhalten 0 + y = 0 + y ′ und damit y = y ′. (A1) ∀x, y ∈ K : x + y = y + x Wir bezeichnen für x ∈ K das (nach Satz 1.7.2) eindeutig bestimmte y mit x + y = 0 mit −x. Analog wird für x ∈ K\{0} das eindeutig bestimmte y mit x · y = 1 mit x−1 oder x1 bezeichnet. Weiter schreiben wir auch a − b statt a + (−b) und ab oder a/b statt a · 1b . Sind a, b ∈ K, so existiert ein eindeutig bestimmtes x ∈ K mit a + x = b, nämlich x = b − a. Analog existiert zu a, b ∈ K\{0} ein eindeutig bestimmtes x ∈ K mit ax = b, nämlich x = ab . Auf den einfachen Beweis dieser Tatsachen verzichten wir. (A2) ∀x, y, z ∈ K : (x + y) + z = x + (y + z) Satz 1.7.3 Sei K Körper, x, y ∈ K. Dann gilt: xy = 0 ⇔ x = 0 ∨ y = 0. (A3) ∃0 ∈ K∀x ∈ K : x + 0 = x Beweis. “⇐”: Wegen xy = yx kann man ohne Beschränkung der Allgemeinheit (o.B.d.A.) annehmen, dass y = 0 gilt. Zu zeigen ist x · 0 = 0. Nun ist 0+0 = 0 nach (A3), nach (D) also x0+x0 = x(0+0) = x0. Andererseits ist nach (A3) auch x0+0 = x0. Wegen der Eindeutigkeit der Lösungen von a+x = b folgt x0 = 0. “⇒”: Sei x·y = 0 und x 6= 0. Zu zeigen ist, dass y = 0. (Wir haben eine Aussage der Form A ⇒ (B ∨ C) zu zeigen, und wir haben benutzt, dass diese äquivalent zu (A ∧ ¬B) ⇒ C ist.) Nun ist y = y · 1 = y(xx−1 ) = (yx)x−1 = (xy)x−1 = 0 · x−1 = 0. Wir formalisieren jetzt Addition und Multiplikation sowie ihre Eigenschaften. Definition 1.7.1 Sei K Menge und seien + : K × K → K und · : K → K Funktionen (wobei wir aber im folgenden x + y statt +((x, y)) und x · y oder xy statt ·((x, y)) schreiben). Das Tripel (K, +, ·) heißt Körper (englisch: field), falls die folgenden neun Eigenschaften gelten: (A4) ∀x ∈ K∃y ∈ K : x + y = 0 (M1) ∀x, y ∈ K : x · y = y · x (M2) ∀x, y, z ∈ K : (x · y) · z = x · (y · z) (M3) ∃1 ∈ K\{0}∀x ∈ K\{0} : x · 1 = x (M4) ∀x ∈ K\{0}∃y ∈ K\{0} : x · y = 1 (D) ∀x, y, z ∈ K : (x + y) · z = x · z + y · z Wir geben einige weitere Rechenregeln, die leicht aus den Körperaxiomen gefolgert werden können, ohne Beweis an: 18 1 GRUNDLAGEN (i) ∀x ∈ K : −(−x) = x (ii) ∀x ∈ K\{0} : (x−1 )−1 = x (iii) ∀x, y ∈ K : −(x + y) = (−x) + (−y) (iv) ∀x, y ∈ K\{0} : (xy)−1 = x−1 y −1 (v) ∀x, y ∈ K : (−x)y = −(xy) = x(−y) Auch einige Rechenregeln, die hier nicht explizit aufgeführt sind, werden im weiteren benutzt werden. Es sei eine Menge K mit einer “Verknüpfung” + gegeben. Gelten dann (A1)(A4), so heißt das Paar (K, +) kommutative Gruppe (oder abelsche Gruppe). Ist (K, +, ·) Körper, so ist also (K, +) kommutative Gruppe. Aus (M1)-(M4) folgt, dass auch (K\{0}, ·) kommutative Gruppe ist. Ist umgekehrt (K\{0}, ·) kommutative Gruppe, so folgen hieraus nicht unmittelbar (M1) und (M2), da dort ja auch x = 0, y = 0 oder z = 0 zugelassen ist. Setzt man aber voraus, dass (K, +) und (K\{0}, ·) kommutative Gruppen sind und dass (D) gilt, so folgt wie im Beweis von Satz 1.7.3, dass (M1) und (M2) auch dann gelten, wenn ein Faktor 0 ist. Damit erhält man, dass (K, +, ·) genau dann ein Körper ist, wenn (K, +) und (K\{0}, ·) kommutative Gruppen sind und (D) gilt. Dies macht die Körperaxiome einprägsamer. Körper und (kommutative) Gruppen sind Beispiele für algebraische Strukturen. Eine genauere Untersuchung dieser und anderer Strukturen wie Ring, Halbgruppe, Schiefkörper, Vektorraum, usw. findet in der (linearen) Algebra statt. Wir notieren hier noch, dass (K, +, ·) Integritätsbereich heißt, falls alle Körperaxiome bis auf (M4) gelten und außerdem noch ∀x, y ∈ K : xy = 0 ⇒ x = 0 ∨ y = 0 gilt. Die letzte Eigenschaft nennt man Nullteilerfreiheit. Für Körper wurde sie mit Hilfe von (M4) in Satz 1.7.3 gezeigt. Beispiel eines Integritätsbereichs ist (Z, +, ·). Exkurs: Konstruktion der rationalen Zahlen. Wir skizzieren, wie man den Integritätsbereich (Z, +, ·) zu einem Körper erweitern kann. Dazu betrachten wir die auf Z × Z\{0} durch (a, b) ∼ (c, d) :⇔ ad = bc definierte Relation ∼. Die Idee dabei ist, (a, b) mit dem Bruch ab zu identifizieren. Zunächst zeigen wir, dass ∼ Äquivalenzrelation ist. Um etwa die Transitivität zu zeigen, sei (a, b) ∼ (c, d) und (c, d) ∼ (e, f ). Es ist dann ad = bc und cf = de. Zu zeigen ist (a, b) ∼ (e, f ), also af = be. Nun ist aber (af − be)d = af d − bed = (ad)f −(de)b = (bc)f −(cf )b = 0. Wegen d 6= 0 und Nullteilerfreiheit folgt af = be. Als nächstes definiert man auf der Menge der Äquivalenzklassen [(a, b)] eine Addition und eine Multiplikation durch [(a, b)] + [(c, d)] := [(ad + bc, bd)] und [(a, b)] · [(c, d)] := [(a · b, c · d)]. 19 1.7 Körper Zunächst muss man jetzt zeigen, dass diese Addition und Multiplikation von Äquivalenzklassen wohldefiniert ist, d.h., nicht von den Repräsentanten der Äquivalenzklassen abhängt. Sei dazu (a, b) ∼ (a′ , b′ ) und (c, d) ∼ (c′ , d′ ), d. h., ab′ = ba′ und cd′ = dc′ . Dann ist (ad + bc)b′ d′ = = = = adb′ d + bcb′ d′ ab′ dd′ + cd′ bb′ ba′ dd′ + dc′ bb′ bd(a′ d′ + b′ c′ ) also (ad + bc, bd) ∼ (a′ d′ + b′ c′ , b′ d′ ). Analog (aber einfacher) zeigt man die Wohldefiniertheit der Multiplikation von Äquivalenzklassen. Schließlich zeigt man, dass die Menge der Äquivalenzklassen mit der so definierten Addition und Multiplikation einen Körper bildet, d.h., ({[(a, b)] : a ∈ Z ∧ b ∈ Z\{0}}, +, ·) ist Körper. Beispielsweise folgt (A1) da [(a, b)] + [(c, d)] = [(ad + bc, bd)] = [(cb + da, db)] = [(c, d)] + [(a, b)]. Die anderen Körperaxiome sind ebenfalls leicht nachzurechnen. Dabei ist [(0, 1)] das Nullelement und [(1, 1)] das Einselement, −[(a, b)] = [(−a, b)] und [(a, b)]−1 = [(b, a)]. Wie bezeichnen den erhaltenen Körper mit (Q, +, ·) und nennen ihn Körper der rationalen Zahlen. Man kann eine ganze Zahl n mit der Äquivalenzklasse [(n, 1)] identifizieren. Denn es gilt [(n, a)] + [(m, 1)] = [(n + m, 1)] und [(n, 1)] · [(m, 1)] = [(n · m, 1)] für m, n ∈ Z. In diesem Sinne ist Z in Q enthalten. Für eine formale Beschreibung dieses Sachverhalts betrachtet man die Funktion i : Z → Q, n 7→ [(n, 1)]. Dann gilt i(n + m) = i(n) + i(m) und i(n · m) = i(n) · i(m). Außerdem ist i injektiv. Bemerkungen. 1. Mit dem oben angegebenen Verfahren kann man jeden Integritätsbereich zu einem Körper erweitern, dem sogenannten Quotientenkörper. Ein weiteres Beispiel ist etwa durch den Integritätsbereich der Polynome gegeben, der zum Körper der rationalen Funktionen erweitert werden kann. 2. Auf ähnliche Weise kann man Z aus N konstruieren. Später werden wir R aus Q konstruieren. Insgesamt wird so R über Z und Q aus N konstruiert. Zuvor geben wir aber eine axiomatische Beschreibung von R. Definition 1.7.2 Sei (K, +, ·) Körper und sei ≤ Ordnung auf K, d.h., (K, ≤) ist geordnete Menge. Dann heißt (K, +, ·, ≤) angeordneter Körper, falls gilt: (O1) ∀x, y, z ∈ K : x ≤ y ⇒ x + z ≤ y + z, (O2) ∀x, y ∈ K : 0 ≤ x ∧ 0 ≤ y ⇒ 0 ≤ xy. Man nennt (O1) und (O2) die Ordnungsaxiome. Beispiele angeordneter Körper sind Q und R. (Wir schreiben statt (K, +, ·, ≤) oft wieder nur K.) Sei K angeordneter Körper. Wir schreiben wieder x < y oder y > x statt (x ≤ y ∧ x 6= y) und auch y ≥ x statt x ≤ y. Wir nennen x ∈ K positiv falls x > 0 und negativ falls x < 0. 20 1 GRUNDLAGEN Aus den Körper- und Ordnungsaxiomen (und den Eigenschaften der Ordnung) erhält man die folgenden Regeln. Dabei sind x, y, u, v, a ∈ K. (i) x ≤ y ⇔ x − y ≤ 0 ⇔ y − x ≥ 0, (iv) |x · y| = |x| · |y| (v) |x + y| ≤ |x| + |y| (vi) ||x| − |y|| ≤ |x − y| (ii) x ≤ y ∧ u ≤ v ⇒ x + u ≤ y + v, (iii) a ≥ 0 ∧ x ≤ y ⇒ ax ≤ ay, (iv) x ≤ 0 ⇒ −x ≥ 0, (v) xy > 0 ⇔ (x > 0 ∧ y > 0) ∨ (x < 0 ∧ y < 0), (vi) x2 ≥ 0, (vii) x 6= 0 ⇒ x2 > 0, Regel (v) heißt Dreiecksungleichung. Zu ihrem Beweis beachte man, dass x ≤ |x| und y ≤ |y| nach (iii). Es folgt x + y ≤ |x| + |y|. Weiter ist −x ≤ | − x| = |(−1) · x| = | − 1| · |x| = −(−1) · |x| = 1 · |x| = |x| und analog −y ≤ |y|. Wir erhalten −(x + y) = −x + (−y) ≤ |x| + |y|. Insgesamt folgt x + y ≤ |x| + |y| und −(x + y) ≤ |x| + |y|. Hieraus folgt die Behauptung. (Wir haben (iii) im Beweis von (v) benutzt. Natürlich muss man sich noch überzeugen, dass (iii) ohne Zuhilfenahme von (v) bewiesen werden kann, aber dies ist leicht zu sehen.) Definition 1.7.3 Ein angeordneter Körper (K, +, ·, ≤) heißt vollständig, falls die geordnete Menge (K, ≤) ordnungsvollständig ist. (viii) 1 > 0, (ix) x > 0 ⇒ x−1 > 0, (x) x > y > 0 ⇒ (y −1 > x−1 ) ∧ (xy −1 > 1). Dabei ist in (vi) natürlich x2 := x · x. Allgemeiner ist xn := x · ... · x} | · x {z n − mal für n ∈ N. Zum Beweis von (i) braucht man nur (O1) mit z = −y bzw. z = −x verwenden. Regel (ii) folgt durch zweimalige Anwendung von (O1) und (A1): x + u ≤ y + u = u + y ≤ v + y = y + v. Um (iii) zu zeigen, beachten wir zunächst, dass y − x ≥ 0 nach (i). Mit (O2) folgt a(y − x) ≥ 0, also ay − ax ≥ 0 wegen (D). Mit (i) folgt schließlich ax ≤ ay. Wir verzichten auf die (einfachen) Beweise von (iv)-(x). Es gibt auch noch viele weitere Rechenregeln, die wir gelegentlich benutzen werden, aber hier nicht ausdrücklich aufführen. Wir definieren für x ∈ K |x| := x, −x, falls x ≥ 0 falls x < 0 und nennen |x| den Betrag von x. Für x, y ∈ K gelten dann die folgenden Rechenregeln: (i) |x| ≥ 0 21 1.8 Reelle Zahlen In einem vollständigen angeordneten Körper besitzt also jede nach oben beschränkte Menge ein Supremum. Das Supremum lässt sich in Körpern auch wie folgt charakterisieren. Satz 1.7.4 Sei (K, +, ·, ≤) angeordneter Körper und A nach oben beschränkte Teilmenge von K. Sei s eine obere Schranke A. Dann ist s Supremum von A genau dann, wenn zu jedem ε > 0 ein x ∈ A existiert, so dass s − ε < x, d.h. ∀ε > 0∃x ∈ A : s − ε < x. (∗) Beweis: “⇒”: Wir führen den Beweis indirekt (genauer: durch Kontraposition) und nehmen an, dass (∗) nicht gilt. Es folgt ∃ε > 0∀x ∈ A : s − ε ≥ x, d.h. ∃ε > 0 : s − ε ist obere Schranke von A. Da aber s − ε < s falls ε > 0, ist s also kein Supremum von A. “⇐”: Es gelte (∗) und es sei s′ obere Schranke von A. Zu zeigen ist, dass s′ ≥ s. Wir nehmen an, dass dies nicht gilt. Dann ist s′ < s und damit ε := s − s′ > 0. Nach (∗) existiert x ∈ A mit x > s − ε = s′ . Dies ist ein Widerspruch, da s′ obere Schranke von A. 1.8 Reelle Zahlen (ii) |x| = 0 ⇔ x = 0 Grundlegend für die Analysis ist das folgende Resultat. (iii) |x| ≥ x Satz 1.8.1 Es gibt einen vollständigen angeordneten Körper. 22 1 GRUNDLAGEN Wir werden später einen Beweis dieses Satzes skizzieren, indem wir andeuten werden, wie man den angeordneten Körper der rationalen Zahlen “vervollständigen” kann. Den so erhaltenen vollständigen angeordneten Körper nennen wir den Körper der reellen Zahlen und bezeichnen ihn mit (R, +, ·, ≤), kurz auch R. Darüberhinaus kann man sogar zeigen, dass die reellen Zahlen im wesentlichen der einzige vollständige angeordnete Körper sind: ist (K, +K , ·K , ≤K ) ein vollständiger angeordneter Körper, so existiert eine bijektive Funktion f : K → R mit f (x +K y) = f (x) + f (y), f (x ·K y) = f (x) · f (y) und x ≤K y ⇔ f (x) ≤ f (y) für alle x, y ∈ K. Wir verzichten hier auf einen Beweis dieser Tatsache. Stattdessen entwickeln wir die Theorie des vollständige angeordneten Körpers (R, +, ·, ≤) anhand der in §1.7 gegebenen Körper- und Ordnungsaxiome sowie der Vollständigkeit. Dabei betrachten wir N, Z und Q als Teilmengen von R: n = |1 + 1 +{z· · · + 1}, n − mal m = m · n−1 . n Beweisprinzips der vollständigen Induktion also A = N gelten. Formal sieht dieser Schluss wie folgt aus: ⇔ ⇔ ⇔ 1∈A ⇒ ¬(∃k ∈ N : k ∈ A ∧ k + 1 ∈ / A) ∀k ∈ N : ¬(k ∈ A ∧ k + 1 ∈ / A) ∀k ∈ N : k ∈ / A∨k+1∈A ∀k ∈ N : k ∈ A ⇒ k + 1 ∈ A A = N. Sei nun also k ∈ A mit k + 1 ∈ / A. Dann ist k untere Schranke von M wegen k ∈ A. Wegen k + 1 ∈ / A existiert m ∈ M mit m < k + 1. Da aber auch k ≤ M gilt, und zwischen k und k + 1 keine natürliche Zahl liegt, folgt k = m, also k ∈ M. Damit ist k Minimum von M. Wir haben im Beweis die Behauptung auf die folgende Aussage reduziert: jede nichtleere Teilmenge von N besitzt ein Minimum. Hierzu sagt man auch: N ist wohlgeordnet. Den folgenden Satz drückt man auch mit den Worten “Q ist dicht in R” aus. Satz 1.8.2 N ist nicht nach oben beschränkt (in R). Beweis. Wir führen einen Widerspruchsbeweis und nehmen an, dass N nach oben beschränkt ist. Sei s = sup N. Dann gilt n ≤ s für alle n ∈ N. Nach Satz 1.7.4 existiert N ∈ N mit N > s − 1. Es folgt N + 1 > s. Dies ist ein Widerspruch, da N + 1 ∈ N. Folgerung 1.8.1 Seien a, b ∈ R, a > 0. Dann existiert n ∈ N mit na > b. Beweis. Andernfalls gilt na ≤ b und damit n ≤ b/a für alle n ∈ N, im Widerspruch zu Satz 1.8.2. Folgerung 1.8.2 Sei a ∈ R, a > 0. Dann existiert n ∈ N mit 23 1.8 Reelle Zahlen 1 n < a. Beweis. Man wende Folgerung 1.8.1 mit b = 1 an. Satz 1.8.2 und die beiden Folgerungen daraus heißen Satz des Archimedes oder Satz des Eudoxos; die Bezeichnungen sind hier uneinheitlich. Satz 1.8.3 Es sei M ⊂ Z, M 6= ∅. Weiter sei M nach oben (bzw. unten) beschränkt. Dann hat M ein Maximum (bzw. Minimum). Beweis. Wir betrachten nur den Fall, dass M nach unten beschränkt ist. Der andere Fall ist analog. Weiter kann man annehmen, dass M ⊂ N gilt, dass also 1 untere Schranke von M ist. (Denn ist M ⊂ Z und s ∈ Z untere Schranke, so betrachten wir M ′ := {n − s + 1 : n ∈ M}. Dann ist M ′ ⊂ N und ist µ Minimum von M ′ , so ist µ + s − 1 Minimum von M.) Wir betrachten die Menge A aller natürlichen Zahlen, die untere Schranke von M sind, also A = {n ∈ N : (∀m ∈ M : n ≤ m)}. Dann ist 1 ∈ A wegen M ⊂ N. Andererseits ist A nach oben beschränkt, da jedes Element von M obere Schranke von A ist. Nach Satz 1.8.2 gilt damit A 6= N. Damit existiert aber k ∈ N, so dass k ∈ A und k+1 ∈ / A. Denn andernfalls würde für alle k ∈ N die Aussage k ∈ A die Aussage k + 1 ∈ A implizieren, aufgrund des Satz 1.8.4 Seien a, b ∈ R, a < b. Dann existiert r ∈ Q mit a < r < b. Beweis. Es ist b − a > 0 und damit existiert nach Folgerung 1.8.2 ein n ∈ N mit 1 < b − a. Wir betrachten die Menge M := {k ∈ Z : k > na}. Nach Satz 1.8.2 gilt n dann M 6= ∅. Außerdem ist M nach unten (durch na) beschränkt. Nach Satz 1.8.3 . Außerdem ist hat M also ein Minimum m. Es gilt dann m > na und damit a < m n m − 1 ≤ na und damit m ≤ na + 1, also m ≤ a + n1 < a + (b − a) = b. Also leistet n r := m das Verlangte. n Wir führen einige Bezeichnungen ein. Seien dazu a, b ∈ R, a < b. Dann heißen • (a, b) := {x ∈ R : a < x < b} offenes Intervall, • [a, b] := {x ∈ R : a ≤ x ≤ b} abgeschlossenes Intervall, • (a, b] := {x ∈ R : a < x ≤ b} und [a, b) := {x ∈ R : a ≤ x < b} halboffene Intervalle. Bei Mengen der Form {x ∈ R : a < x} setzen wir formal b = ∞ und bezeichnen auch sie als offenes Intervall, also (a, ∞) := {x ∈ R : a < x}. Analog definiert man das offene Intervall (−∞, b) sowie die abgeschlossenen Intervalle [a, ∞) und (−∞, b]. Wir bezeichnen (−∞, ∞) := R sowohl als offenes Intervall wie auch als abgeschlossenes Intervall. Weiter setzen wir noch R+ := (0, ∞). Man beachte, dass wir für offene Intervalle und geordnete Paare die gleiche Notation verwenden! Dies sollte aber nicht zu Missverständnissen führen. Eine andere übliche Notation für das offene Intervall (a, b) ist ]a, b[, mit einer analogen Notation für halboffene Intervalle. In der jetzt eingeführten Terminologie lautet Satz 1.8.4 etwa: Ist I offenes Intervall, so gilt I ∩ Q 6= ∅. Satz 1.8.5 Q ist nicht vollständig. 24 1 GRUNDLAGEN Beweis. Sei M := {x ∈ Q : x2 ≤ 2}. Dann ist M 6= ∅ (etwa 0 ∈ M) und M ist nach oben beschränkt (etwa durch 2). Wir nehmen an, dass Q vollständig ist. Dann besitzt M ein Supremum s ∈ Q. Wegen 0 ∈ M gilt s ≥ 0. Wir zeigen zunächst, dass s2 = 2 gilt. Dazu nehmen wir an, dass s2 < 2. Dann 2 , 1} > 0 und nach Satz 1.8.4 existiert r ∈ (s, s + m) ∩ Q. Es folgt ist m := min{ 2−s 2s+1 2 − s2 2 − s2 + = 2, r 2 < (s + m)2 = s2 + 2sm + m2 ≤ s2 + 2sm + m ≤ s2 + 2s 2s + 1 2s + 1 also r ∈ M und s < r, im Widerspruch zu s = sup M. Ähnlich führt man s2 > 2 zum Widerspruch. Es gilt also s2 = 2. Wegen s ∈ Q existieren p, q ∈ Z, q 6= 0, mit s = pq . Man kann annehmen, dass p und q teilerfremd sind, insbesondere also, dass p und q nicht beide gerade sind. 2 Wegen 2 = s2 = pq2 gilt p2 = 2q 2 . Dies impliziert, dass p2 gerade ist. Damit ist aber auch p gerade, etwa p = 2n mit n ∈ Z. Es folgt, dass 2q 2 = p2 = (2n)2 = 4n2 , also q 2 = 2n2 . Dies impliziert aber, dass q 2 und damit q gerade ist. Dies ist ein Widerspruch. Bemerkung. Die Menge M aus dem obigen Beweis besitzt wegen der Vollständigkeit von R ein Supremum s ∈ R, und das obige √ Argument zeigt, dass s2 = 2 gilt. Wir bezeichnen diese reelle Zahl s natürlich mit 2. Diese Idee benutzt man allgemeiner zur Definition rationaler Potenzen. Definition 1.8.1 Seien m, n ∈ N und a ∈ R+ . Man setzt √ √ m m 1 n a := sup{x ∈ R : xn ≤ a}, a n := n am , a− n := m an √ √ sowie a0 := 1 und a := 2 a. √ n Ähnlich wie im Beweis von Satz 1.8.5 zeigt man ( n a) = a. Darüberhinaus √ sieht man leicht, das n a die einzige√positive reelle Zahl ist, deren n-te Potenz a m ist, d. h., {x ∈ R : xn = a} = { n a}. Desweiteren zeigt man leicht, dass a n wohldefiniert ist, d. h., dass für m n = m′ n′ m m′ auch a n = a n′ gilt. Satz 1.8.6 Seien a, b ∈ R+ und r, s ∈ Q. Dann gilt 25 1.8 Reelle Zahlen Definition 1.8.2 Es sei M Menge, M 6= ∅. • M heißt endlich, falls es ein n ∈ N und eine Bijektion (d. h., eine bijektive Abbildung) φ : {1, . . . , n} → M gibt. • M heißt abzählbar, falls es eine Bijektion φ : N → M gibt. • M heißt höchstens abzählbar, falls M endlich oder abzählbar ist. • M heißt überabzählbar, falls M nicht endlich oder abzählbar ist. Satz 1.8.7 Q ist abzählbar. Beweisskizze. Wir beginnen mit 0, durchlaufen die Zahlen m mit m, n ∈ N wie in n hinter m ein. dem folgenden Schema angedeutet und fügen die Zahl − m n n 1 1 1 2 1 2 3 4 5 ... ↓ 1 3 1 4 ↓ 1 5 → ւ ր ւ ր 2 2 1 2 3 1 2 3 3 ր ւ ր 2 5 3 2 → ւ ր 4 4 2 5 5 ր 5 2 4 3 5 3 3 4 1 5 4 3 5 4 5 1 1 ... ... ... Bereits einmal durchlaufene Zahlen lassen wir weg und kommen so zu folgender Anordnung der rationalen Zahlen: 1 1 1 1 3 3 0, 1, −1, 2, −2, , − , , − , 3, −3, 4, −4, , − , . . . 2 2 3 3 2 2 (i) ar as = ar+s , (ii) (ar )s = ars , Die durch φ(1) = 0, φ(2) = 1, φ(3) = −1, φ(4) = 2, . . . definierte Funktion φ : N → Q ist dann bijektiv. (iii) (ab)r = ar br , r r (iv) ab = abr , Satz 1.8.8 R ist überabzählbar. (v) a < b ∧ r > 0 ⇒ ar < br und a < b ∧ r < 0 ⇒ ar > br , r s (vi) r < s ∧ a > 1 ⇒ a < a r s und r < s ∧ a < 1 ⇒ a > a . Der Beweis sei als Übung überlassen. Man kann die Idee in Definition 1.8.1 auch benutzen, um die Potenz ax für a ∈ R+ und x ∈ R durch ax := sup{ar : r ∈ Q∧r ≤ x} zu definieren. Wir werden dies später (in §2.5) auf etwas anderem Wege tun. Mit Hilfe der folgenden Definition werden wir einen weiteren wichtigen Unterschied zwischen Q und R beschreiben. Bevor wir diesen Satz beweisen, formulieren wir folgendes Resultat. Satz 1.8.9 Für alle n ∈ N sei ein beschränktes, abgeschlossenes Intervall I(n) gegeben, d. h., es sei I eine Abbildung von N in die Menge der beschränkten, abgeschlossenen Intervalle. Für alle n ∈ N sei I(n + 1) ⊂ I(n). Dann gilt ∞ \ n=1 I(n) 6= ∅. 26 1 GRUNDLAGEN T∞ Der Beweis sei als Übung überlassen. T (In der Formulierung des Satzes ist n=1 I(n) eine abkürzende Schreibweise für I∈{I(N)} I. Entsprechende Schreibweisen werden wir im folgenden häufiger benutzen.) Oft wird die in Satz 1.8.9 angegebene Eigenschaft auch als Definition der Vollständigkeit genommen (anstelle der Eigenschaft, dass jede nichtleere, nach oben beschränkte Menge ein Supremum besitzt). Dies führt aber zu einem anderen Vollständigkeitsbegriff, und zur Charakterisierung von R muss dann noch eine der Aussagen von Satz 1.8.2, Folgerung 1.8.1 oder Folgerung 1.8.2 hinzugenommen werden. Die hinzugenommene Aussage wird dann als Archimedisches Axiom bezeichnet. Beweis von Satz 1.8.8. Sei φ : N → R. Dann existiert ein abgeschlossenes Intervall I(1) mit φ(1) ∈ / I(1). Weiter existiert ein abgeschlossenes Intervall I(2) ⊂ I(1) mit φ(2) ∈ / I(2). Induktiv erhält man für jedes n ∈ N, n ≥ 2, ein T abgeschlossenes Intervall I(n) ⊂ I(nT− 1) mit φ(n) ∈ / I(n). Nach Satz 1.8.9 ist ∞ n=1 I(n) 6= ∅ und damit existiert s ∈ ∞ n=1 I(n). Für alle n ∈ N gilt damit s ∈ I(n), wegen φ(n) ∈ / I(n) also s 6= φ(n). Es folgt s∈ / φ(N). Daher ist φ nicht surjektiv. 1.9 Komplexe Zahlen Historisch tauchten komplexen Zahlen zuerst im 16. Jahrhundert bei der Lösung kubischer Gleichungen durch del Ferro, Tartaglia und auf. So hat die p Cardano √ Gleichung x3 = 6x + 2 drei reelle Lösungen. Mit y := 3 1 + −7 ist x := y + 2/y eine Lösung, denn 3 x = 2 y+ y 3 12 8 + 3 y y √ 2 8 √ + = 1 + −7 + 6 y + y 1 + −7 √ √ 8(1 − −7) √ √ = 1 + −7 + 6x + (1 + −7)(1 − −7) √ √ = 1 + −7 + 6x + 1 − −7 = 6x + 2. p √ √ All dies gilt natürlich nur dann, wenn man die Objekte −7 und 3 1 + −7 mit Sinn füllen kann und die üblichen Rechenregeln dafür gelten. Außerdem ist alles andere als klar, dass es sich bei obigem Ausdruck für x um eine reelle Zahl handelt und wie man diese gegebenenfalls berechnet. Die Idee ist also, den Körper R der reellen Zahlen so zu erweitern, dass Gleichungen wie x2 + 1 = 0 eine Lösung haben. Ist etwa i eine Lösung dieser Gleichung, also i2 = −1, so kann man Elemente der Form a + ib mit a, b ∈ R betrachten. Für a, b, c, d ∈ R erhält man, wenn man die üblichen Rechenregeln als gegeben hinnimmt, und zusätzlich die Regel i2 = −1 benutzt, dann (a + ib) · (c + id) = ac + aid + ibc + i2 bd = ac − bd + i(ad + bc). = y 3 + 6y + 27 1.9 Komplexe Zahlen Formal geht man wie folgt vor: auf R2 = R × R definieren wir eine Addition “+” und eine Multiplikation “·” wie folgt: (a, b) + (c, d) := (a + c, b + d), (a, b) · (c, d) := (ac − bd, ad + bc). Es gilt dann, dass (R2 , +, ·) Körper ist. Dabei ist (0, 0) das Nullelement und (1, 0) das Einselement. Wir verzichten darauf, alle Körperaxiome nachzuweisen, sondern beschränken uns exemplarisch auf zwei, nämlich (M4) (Existenz des multiplikativen Inversen) und (D) (Distributivgesetz). Nachweis von (M4). Sei (a, b) ∈ R2 , (a, b) 6= (0, 0). Dann ist a2 + b2 > 0 und es gilt a a −b −b −b a (a, b) · = a , − b , a + b a2 + b2 a2 + b2 a2 + b2 a2 + b2 a2 + b2 a2 + b2 2 2 a + b −ab + ab , = a2 + b2 a2 + b2 = (1, 0). Es gilt also (a, b)−1 = a −b , a2 + b2 a2 + b2 . Nachweis von (D). Seien a, b, c, d, e, f ∈ R. Dann gilt ((a, b) + (c, d)) · (e, f ) = = = = = (a + c, b + d) · (e, f ) ((a + c)e − (b + d)f, (a + c)f + (b + d)e) (ae − bf + ce − df, af + be + cf + de) (ae − bf, af + be) + (ce − df, cf + de) (a, b) · (e, f ) + (c, d) · (e, f ) Wir nennen den erhaltenen Körper den Körper der komplexen Zahlen und bezeichnen ihn mit (C, +, ·) oder kurz auch C. (Es gilt also C = R2 !) Weiter zeigt man leicht, dass ({(a, 0) : a ∈ R}, +, ·) ein Teilkörper von (C, +, ·) ist. Dieser Teilkörper ist “isomorph” zum Körper (R, +, ·), denn die Abbildung φ : R → {(a, 0) : a ∈ R}, a 7→ (a, 0) ist bijektiv und erfüllt φ(a + b) = φ(a) + φ(b) und φ(a · b) = φ(a) · φ(b) für a, b ∈ R. Wir identifizieren daher die reelle Zahl a mit der komplexen Zahl (a, 0) und betrachten in diesem Sinne die reellen Zahlen als Teilmenge von C. Weiter setzen wir i := (0, 1). Es gilt dann i2 = (0, 1) · (0, 1) = (−1, 0) = −1 und i · a = (0, 1) · (a, 0) = (0, a) für a ∈ R. Damit ist (a, b) = (a, 0) + (0, b) = (a, 0) + (0, 1) · (b, 0) = a + ib für a, b ∈ R. Im allgemeinen schreiben wir komplexe Zahlen in der letzten Form. Wir führen einige weitere Bezeichungen ein. Dazu seien x, y ∈ R und damit z := (x, y) = x + iy ∈ C. Wir nennen x den Realteil von z und y den Imaginärteil von z. Dafür benutzen wir die Notation x = Re z und y = Im z. 28 1 GRUNDLAGEN p Weiter heißt z := x − iy die zu z konjugiert komplexe Zahl und |z| := x2 + y 2 der Betrag von z. (Man beachte, dass für z ∈ R der hier definierte Betrag mit dem vorher definierten übereinstimmt.) Wir stellen einige Rechenregeln zusammen, die für alle z, w ∈ C gelten. (i) |z| ≥ 0 (ii) |z| = 0 ⇔ z = 0 (iii) z + w = z + w (iv) z · w = z · w (v) z + z = 2Re z (vi) z − z = 2iIm z (vii) z = z ⇔ z ∈ R (viii) z · z = |z|2 (ix) z 6= 0 ⇒ z −1 = 1 2 z |z| 29 1.9 Komplexe Zahlen und damit |z · w| = |z| · |w|. zu (xiv): Es ist |z + w|2 = = = = = ≤ = = (z + w)(z + w) (z + w)(z + w) zz + zw + wz + ww |z|2 + zw + zw + |w|2 |z|2 + 2Re(zw) + |w|2 |z|2 + 2|zw| + |w|2 |z|2 + 2|z| · |w| + |w|2 (|z| + |w|)2 und damit |z + w| ≤ |z| + |w|. Identifizieren wir die komplexe Zahl z = x + iy = (x, y) ∈ C = R2 mit dem Punkt der Ebene mit Koordinaten x und y, so können wir die Addition komplexer Zahlen geometrisch deuten. Sie entspricht der Addition von Vektoren; siehe Abbildung 2. Der Betrag |z| ist der Abstand von z zum Ursprung des Koordinatensystems. 3 (x) |z| = |z| z+w (xi) |Re z| ≤ |z| 2 w (xii) |Im z| ≤ |z| 1 (xiii) |z · w| = |z| · |w| (xiv) |z + w| ≤ |z| + |w| (Dreiecksungleichung) –2 –1 0 z 1 2 (xv) ||z| − |w|| ≤ |z − w| Wir beweisen hier nur einige der obigen Rechenregeln. Dazu sei z = x + iy und w = u + iv, mit x, y, u, v ∈ R. zu (iv): zw = = = = = = (x + iy)(u + iv) xu − yv + i(xv + yu) xu − yv − i(xv + yu) xu − (−y)(−v) + i(x(−v) + (−y)u) (x − iy)(u − iv) zw zu (viii): zz = (x + iy)(x − iy) = x2 + y 2 = |z|2 zu (xiii): Nach den gerade bewiesenen Rechenregeln ist |z · w|2 = z · w · z · w = z · w · z · w = z · z · w · w = |z|2 · |w|2 –1 Abbildung 2: Geometrische Interpretation der Addition komplexer Zahlen. Auch die Multiplikation komplexer Zahlen kann geometrisch gedeutet werden. Dies wird erst später erfolgen. Satz 1.9.1 Sei w ∈ C. Dann existiert ein z ∈ C mit z 2 = w. √ Beweis. Ist w ∈ R, w ≤ 0, so hat z = i −w die gewünschte Eigenschaft. Andernfalls gilt |w| + Re w > 0 und (zur Übung empfohlenes!) Nachrechnen zeigt, dass |w| + w z=√ p 2 |w| + Re w die geforderte Eigenschaft hat. 30 2 FOLGEN UND REIHEN Allgemeiner zeigt man (durch quadratische Ergänzung), dass für beliebige a, b ∈ C die Gleichung z 2 + az + b = 0 eine Lösung hat. Noch allgemeiner gilt der folgende Satz. Satz 1.9.2 (Fundamentalsatz der Algebra) Sei n ∈ N und sei p ein Polynom vom Grad n, das heißt, es existieren a0 , a1 , . . . , an ∈ C mit an 6= 0, so dass p(z) = an z n + an−1 z n−1 + · · ·+ a1 z + a0 für z ∈ C gilt. Dann existiert z1 ∈ C mit p(z1 ) = 0. 31 2.1 Folgen Beweis. Seien m, n ∈ N mit m ≤ n. Zu zeigen ist, dass an ≤ am . Nun gilt aber m+1 n+1 ≤ n m ⇔ (n + 1)m ≤ (m + 1)n ⇔ nm + m ≤ mn + n ⇔ m ≤ n. an ≤ am ⇔ Einen Beweis dieses Satzes lernt man z. B. in einer Einführung in die Funktionentheorie kennen, wie sie i. a. in der Analysis IV geboten wird. Sind p und z1 wie in Satz 1.9.2, so existiert ein Polynom vom Grad n − 1, so dass p(z) = (z − z1 )p1 (z) für z ∈ C. Ist n ≥ 2, so kann Satz 1.9.2 auf p1 angewendet werden, und induktiv erhält man, dass z1 , z2 , . . . , zn ∈ C existieren, so dass p(z) = an (z − z1 ) · (z − z2 ) · . . . · (z − zn ). Genauso sieht man, dass (an ) sogar streng monoton fallend ist. Behauptung 2. (an ) ist beschränkt. Beweis. (i) Da (an ) monoton fallend ist, gilt an ≤ a1 = 2 für alle n ∈ N. Also ist 2 obere Schranke von (an ) und damit ist (an ) nach oben beschränkt. (ii) Sei n ∈ N. Dann ist n+ 1 > n, also an = n+1 > 1. Also ist 1 untere Schranke n von (an ) und damit ist (an ) nach unten beschränkt. Aus (i) und (ii) folgt, dass (an ) beschränkt ist. Satz 1.9.3 Der Körper (C, +, ·) kann nicht angeordnet werden. Im obigen Beispiel ist an nahe dem Wert 1, wenn n groß ist. Wir präzisieren diesen Gedanken in der folgenden Definition. Beweis. Es sei ≤ Ordnung und < die zugehörige strikte Ordnung. Dann ist 0 < i2 = −1 und 0 < 12 = 1. Es folgt 0 < −1 + 1 = 0. Widerspruch! 2 2.1 Folgen und Reihen Folgen Definition 2.1.1 Eine Funktion mit Definitionsbereich N heißt Folge. Falls außerdem der Zielbereich R oder C ist, heißt sie (reelle bzw. komplexe) Zahlenfolge. Sei M Menge und f : N → M Folge. Für n ∈ N schreiben wir statt f (n) im allgemeinen fn . Wir bezeichnen die Folge f mit (fn )n∈N oder kurz auch einfach mit (fn ). Gelegentlich schreiben wir auch (f1 , f2 , f3 , . . . ). Jede reelle Zahlenfolge kann auch als komplexe Zahlenfolge betrachtet werden. Manchmal werden wir für ein N ∈ Z und eine Menge M auch Funktionen f : {n ∈ Z : n ≥ N} → M betrachten. Wir werden auch diese (Zahlen)folgen nennen und mit (fn )n≥N bezeichnen. Begriffe wie “injektiv” sind, da sie für Funktionen definiert sind, insbesondere auch für Folgen erklärt. Begriffe wie “(nach oben/unten) beschränkt” oder “(streng) monoton fallend/steigend” definiert man für reelle Zahlenfolgen, indem man auf N und R die Ordnung “≤” zugrunde legt. Eine komplexe Zahlenfolge (an ) heißt beschränkt, falls die reelle Zahlenfolge (|an |) beschränkt ist. (Dabei kommt es natürlich nur darauf an, dass (|an |) nach oben beschränkt ist, denn nach unten ist diese Folge immer durch 0 beschränkt). Beispiel. Wir betrachten die reelle Zahlenfolge (an ) wobei an = ist also (an ) = (2, 23 , 34 , 54 , . . . ). Behauptung 1. (an ) ist monoton fallend. n+1 n für n ∈ N. Es Definition 2.1.2 Sei (an ) (komplexe) Zahlenfolge. Dann heißt (an ) konvergent, falls a ∈ C mit folgender Eigenschaft existiert: Zu jedem ε > 0 existiert ein N ∈ N, so dass |an − a| < ε für alle n ∈ N mit n ≥ N. Wir schreiben in diesem Falle a = limn→∞ an oder an → a (für n → ∞) und sagen, dass (an ) gegen a konvergiert. Wir nennen a den Grenzwert der Folge (an ). Eine Zahlenfolge, die nicht konvergent ist, heißt divergent. Es ist nützlich, die Definition der Konvergenz noch einmal mit Quantoren zu schreiben. Es ist (an ) konvergent, falls gilt: ∃a ∈ C ∀ε ∈ R+ ∃N ∈ N ∀n ∈ N : n ≥ N ⇒ |an − a| < ε. Die Idee bei der Definition der Konvergenz ist, |an − a| als Abstand von an zu a zu interpretieren. Dieser Abstand kann dann im Konvergenzfall beliebig klein gemacht werden, indem man n groß wählt. Dieser Gedanke kann wesentlich verallgemeinert werden. So werden wir später in recht allgemeinem Rahmen einen Abstandsbegriff (Metrik) definieren, und Konvergenz von Folgen in mit diesem Abstandsbegriff versehene Mengen (metrische Räume) untersuchen. Beispiel (Fortsetzung). Sei wieder an = n+1 . n Behauptung. (an ) ist konvergent und limn→∞ an = 1. Beweis. Sei ε > 0. Zu zeigen ist, dass ein N ∈ N existiert, so dass |an − 1| < ε für alle n ∈ N mit n ≥ N. Wir behaupten, dass N := [1/ε] + 1 die verlangte Eigenschaft hat. (Es sei daran erinnert, dass für eine reelle Zahl x mit der Gaußklammer [x] die größte ganze Zahl bezeichnet wird, die nicht größer als x ist.) Zunächst ist dann N > 1/ε und damit 1/N < ε. Sei nun n ∈ N, n ≥ N. Dann ist n + 1 − n 1 1 n + 1 = = ≤ 1 < ε. − 1 = |an − 1| = n n n n N 32 2 FOLGEN UND REIHEN Im folgenden werden wir statt “(an ) ist konvergent und limn→∞ an = a” oft nur kurz “limn→∞ an = a” schreiben. Wenn wir also den Grenzwert angeben, wird damit seine Existenz (also die Konvergenz) impliziert. Eine andere Beschreibung des Konvergenzbegriffs erhält man wie folgt. Sei X = R oder X = C, a ∈ X und ε ∈ R+ . Dann heißt {x ∈ X : |x − a| < ε} die εUmgebung von a (in X). Geometrisch ist die ε-Umgebung von a im Falle X = C eine Kreisscheibe vom Radius ε um a und im Falle X = R eine offenes Intervall der Länge 2ε um a. Eine Teilmenge U von X heißt Umgebung von a, wenn ε > 0 existiert, so dass die ε-Umgebung von a in U enthalten ist. Es zeigt sich, dass (an ) genau dann gegen a konvergiert, wenn für jede Umgebung U von a ein N ∈ N existiert, so dass an ∈ U für n ≥ N. Der Begriff der Umgebung lässt sich in noch allgemeineren Zusammenhängen erklären als der der Metrik. Insofern ist die Beschreibung der Konvergenz über Umgebungen stärker verallgemeinerungsfähig als die in Definition 2.1.1 gegebene. Solche Fragen werden in der Topologie behandelt. Wir haben bei einer konvergenten Folge bereits von dem Grenzwert und nicht nur von einem Grenzwert gesprochen. Dies wird durch den folgenden Satz gerechtfertigt. Satz 2.1.1 Eine konvergente Zahlenfolge hat genau einen Grenzwert. Beweis. Die Existenz eines Grenzwertes folgt aus der Definition. Wir haben also nur die Eindeutigkeit des Grenzwertes zu zeigen. Dazu nehmen wir an, dass a und b Grenzwerte der konvergenten Zahlenfolge (an ) seien, mit a 6= b. Dann ist |a − b| > 0 und mit ε := |a−b| auch ε > 0. 2 Nach Definition 2.1.1 existiert nun Na ∈ N mit |an − a| < ε für n ≥ Na und es existiert Nb ∈ N mit |an − b| < ε für n ≥ Nb . Mit N := max{Na , Nb } folgt dann |a − b| = |(a − aN ) + (aN − b)| ≤ |a − aN | + |aN − b| < ε + ε = 2ε = |a − b|. Dies ist ein Widerspruch. Zur Übung führen wir denselben Beweis in der Terminologie der Umgebungen: Seien a, b, ε wie vorher. Dann sind die ε-Umgebungen von a und b disjunkt, denn ist x aus beiden Umgebungen, so gilt |a − b| = |(a − x) + (x − b)| ≤ |a − x| + |x − b| < ε + ε = 2ε = |a − b|. 33 2.2 Rechenregeln Beispiel 1. Es sei q ∈ C und die komplexe Zahlenfolge (an ) sei gegeben durch an = q n . Fall 1. |q| > 1. Wir zeigen, dass (an ) unbeschränkt und damit wegen Satz 2.1.2 divergent ist. Sei dazu M ∈ R+ . Wir haben zu zeigen, dass n ∈ N mit |q n | > M existiert. Dazu setzen wir h := |q| − 1. Dann ist h > 0 und |q| = 1 + h. Es folgt |q n | = |q|n = (1 + h)n = Mit M := max{|a1 |, |a2 |, . . . , |aN −1 |, 1 + |a|} folgt dann |an | ≤ M für alle n ∈ N. k=0 Fall 3. |q| = 1. Hier zeigt sich, dass für q = 1 Konvergenz gegen 1 vorliegt, während die Folge für q 6= 1 divergent ist. Wir verzichten hier auf die Details. Bemerkung. Die in Fall 1 benutzte Ungleichung (1+h)n ≥ 1+nh heißt Bernoullische Ungleichung. Sie gilt nicht nur für h > 0 sondern sogar für h > −1 (und n ∈ N). Der Beweis sei als Übung überlassen. √ Beispiel 2. limn→∞ n n = 1. √ Beweis. Sei ε > 0. Zu zeigen ist, dass ein N ∈ N mit | n n − 1| < ε für n ≥ N existiert. √ Dazu notieren wir zunächst, dass offensichtlich n n ≥ 1 für alle n ∈ N gilt. Wir √ setzen hn := n n − 1 für n ∈ N. Dann gilt also hn ≥ 0. Für n ≥ 2 folgt n X √ n n 2 n(n − 1) 2 n hn . n = n n = (1 + hn )n = hkn ≥ h = k 2 2 n k=0 Es gilt also h2n ≤ max{2, 2 ε2 2 n−1 und damit hn ≤ + 1}, so folgt für n ≥ N, dass √ n | n − 1| = |hn | = hn ≤ Satz 2.1.2 Eine konvergente Zahlenfolge ist beschränkt. |an | = |(an − a) + a| ≤ |an − a| + |a| < 1 + |a|. k=0 Für n > M/h folgt also |an | ≥ nh > M. Fall 2. |q| < 1. Wir zeigen, dass limn→∞ an = 0. Sei dazu ε ∈ R+ . Wir haben zu zeigen, dass N ∈ N mit |q n − 0| < ε für n ≥ N 1 − 1. Es ist existiert. Dies ist klar falls q = 0. Sei also q 6= 0. Wir setzen h := |q| 1 1 1 dann |q| = 1+h . Wegen |q| > 1 ist h > 0. Wählt man N > εh , so folgt für n ≥ N, dass n 1 1 1 1 ≤ ≤ < ε. = |q n − 0| = |q|n = 1+h (1 + h)n nh Nh Damit kann jedes an nur in höchstens einer dieser Umgebungen liegen, womit nur eine der Zahlen a und b Grenzwert von (an ) sein kann. Beweis. Sei (an ) eine konvergente Folge und sei a := limn→∞ an . Dann existiert N ∈ N mit |an − a| < 1 für n ≥ N. (Wir haben in Definition 2.1.2 ε := 1 gewählt.) Damit folgt für n ≥ N, dass n 1 X X n n hk ≥ hk = 1 + nh ≥ nh. k k 2.2 r 2 ≤ n−1 q r 2 n−1 für n ≥ 2. Wählt man also N > 2 < N −1 s Rechenregeln 2 ε2 2 = ε. +1 −1 Satz 2.2.1 Seien (an ), (bn ) konvergente Zahlenfolgen mit an → a, bn → b. Sei c ∈ C. Dann gilt (i) (an + bn ) ist konvergent und an + bn → a + b, (ii) (an · bn ) ist konvergent und an · bn → a · b, 34 2 FOLGEN UND REIHEN (iii) (c · an ) ist konvergent und c · an → c · a, (iv) Ist b 6= 0, so N ∈ N mit der Eigenschaft, dass bn 6= 0 für n ≥ N, existiert und es ist abnn konvergent mit abnn → ab . 35 2.2 Rechenregeln Beweis. “⇐”. Dies folgt aus Satz 2.2.1, (i) und (iii). “⇒”. Sei a = limn→∞ an . Die Behauptung folgt dann aus |Re an − Re a| = |Re(an − a)| ≤ |an − a| und |Im an − Im a| = |Im(an − a)| ≤ |an − a|. n≥N Beweis. (i). Sei ε > 0. Dann existieren Na , Nb ∈ N mit |an − a| < 2ε für n ≥ Na und |bn − b| < 2ε für n ≥ Nb . Mit N := max{Na , Nb } folgt dann für n ≥ N, dass |(an + bn ) − (a + b)| = |(an − a) + (bn − b)| ≤ |an − a| + |bn − b| < ε ε + = ε. 2 2 (ii). Es ist an bn − ab = an bn − abn + abn − ab = (an − a)bn + a(bn − b). Nach Satz 2.1.2 ist (bn ) beschränkt, d. h., es existiert M ∈ R+ mit |bn | ≤ M für alle n ∈ N. ε Sei nun ε > 0. Dann existieren Na , Nb ∈ N mit |an − a| < 2M für n ≥ Na und ε |bn − b| < 2(|a|+1) für n ≥ Nb . Mit N := max{Na , Nb } folgt dann für n ≥ N, dass |an bn − ab| = |(an − a)bn + a(bn − b)| ≤ |(an − a)bn | + |a(bn − b)| = |an − a| · |bn | + |a| · |bn − b| ε ε M + |a| < 2M 2(|a| + 1) ε ε < + 2 2 = ε. (iii). Dies folgt aus (ii) mit bn = c für alle n ∈ N. > 0 und damit existiert N ∈ N, so dass |bn −b| < |b| (iv). Sei b 6= 0. Dann gilt |b| 2 2 |b| für n ≥ N. Es folgt 2 > |b| − |bn | und damit |bn | > |b| für n ≥ N. Insbesondere 2 gilt also bn 6= 0 für n ≥ N. Wir zeigen jetzt, dass b1n gegen 1b konvergiert. Dazu notieren wir zunächst, dass für n ≥ N n≥N 1 − 1 = b − bn = |b − bn | ≤ 2|b − bn | bn b bn b |bn | · |b| |b|2 gilt. Sei nun ε > 0. Dann existiert N ′ ∈ N mit |bn − b| < N ′′ := max{N, N ′ } folgt dann für N ≥ N ′′ , dass 1 − 1 ≤ 2|b − bn | < ε. bn b |b|2 Damit gilt 1 bn → 1b . Aus (ii) folgt jetzt an bn |b|2 ε 2 für n ≥ N ′ . Mit → ab . Satz 2.2.2 Eine komplexe Zahlenfolge (an ) konvergiert genau dann, wenn die reellen Zahlenfolgen (Re an ) und (Im an ) konvergieren. Es gilt dann limn→∞ Re an = Re(limn→∞ an ) und limn→∞ Im an = Im(limn→∞ an ). Satz 2.2.3 Wenn die komplexe Zahlenfolge (an ) gegen a konvergiert, so konvergieren (|an |) gegen |a| und (an ) gegen a. Beweis. Die Behauptung folgt aus ||an | − |a|| ≤ |an − a| und |an − a| = |an − a| = |an − a|. Wir betrachten noch einmal das Beispiel der durch an := q n definierten komplexen Zahlenfolge (an ), wobei q ∈ C, |q| = 1. Gilt dann an → a, so folgt |an | → |a|. Wegen |an | = |q n | = |q|n = 1n = 1 für alle n ∈ N impliziert dies |a| = 1. Weiter gilt auch an+1 → a. Andererseits gilt aber auch an+1 = qan → qa. Es folgt a = qa. Wegen |a| = 1 ist aber a 6= 0. Damit folgt q = 1. Für q ∈ C, |q| = 1, konvergiert also die komplexe Zahlenfolge (q n ) genau dann, wenn q = 1. Satz 2.2.4 Seien (an ), (bn ) konvergente reelle Zahlenfolgen. Es existiere N ∈ N mit an ≤ bn für alle n ≥ N. Dann gilt limn→∞ an ≤ limn→∞ bn . Beweis. Sei a := limn→∞ an und b := limn→∞ bn . Wir nehmen an, dass a > b gilt. > 0. Also existieren Na , Nb ∈ N mit Dann ist a − b > 0 und damit auch ε := a−b 2 |an − a| < ε für n ≥ Na und |bn − b| < ε für n ≥ Nb . Sei N ′ := max{Na , Nb }. Für n ≥ N ′ gilt dann bn − b < ε und a − an < ε. Es folgt (bn − b) + (a − an ) < 2ε und damit bn − an < 2ε + b − a = 0 für n ≥ N ′ . Es folgt bn < an für n ≥ N ′ . Dies ist ein Widerspruch. Man beachte, dass aus an < bn für n ≥ N nicht limn→∞ an < limn→∞ bn gefolgert werden kann. Ein Gegenbeispiel ist etwa durch an = − n1 und bn = n1 gegeben. Hier sind beide Grenzwerte 0. Eine wichtiger Spezialfall von Satz 2.2.4 ist der Fall, dass eine der Folgen (an ), (bn ) konstant ist. So folgt etwa aus an → a und an ≤ b für n ≥ N, dass a ≤ b gilt. Satz 2.2.5 Seien (an ), (bn ), (cn ) reelle Zahlenfolgen. Es existiere N ∈ N mit an ≤ bn ≤ cn für alle n ≥ N. Sind dann (an ) und (cn ) konvergent mit limn→∞ an = limn→∞ cn , so ist auch (bn ) konvergent und hat den gleichen Grenzwert wie (an ) und (cn ). Beweis. Sei a := limn→∞ an = limn→∞ cn und sei ε > 0. Dann existieren Na , Nc ∈ N mit |an −a| < ε für n ≥ Na und |cn −a| < ε für n ≥ Nc . Mit Nb := max{N, Na , Nc } folgt dann für n ≥ Nb , dass a − bn ≤ a − an ≤ |an − a| < ε und bn − a ≤ cn − a ≤ |cn − a| < ε, also |bn − a| < ε. Beispiel. Sei b ∈ R+ . Für n ≥ max{b, 1b } ist dann √ √ √ √ n b ≤ n n. Wegen n n → 1 folgt n b → 1. 1 n ≤ b ≤ n und damit 1 √ nn ≤ 36 2.3 2 FOLGEN UND REIHEN Konvergenzkriterien Satz 2.3.1 Sei (an ) eine monoton steigende (bzw. fallende) und nach oben (bzw. unten) beschränkte reelle Zahlenfolge. Dann ist (an ) konvergent. Ist A := {an : n ∈ N}, so gilt limn→∞ an = sup A (bzw. limn→∞ an = inf A). Beweis. Wir betrachten nur den Fall, dass (an ) monton steigend und nach oben beschränkt ist. (Der andere Fall kann darauf zurückgeführt werden.) Sei a := sup A. Zu zeigen ist, dass an → a. Sei dazu ε > 0. Nach Satz 1.7.4 existiert N ∈ N mit aN > a − ε. Wegen der Monotonie von (an ) folgt an > a − ε für alle n ≥ N. Andererseits gilt an ≤ a für alle n ∈ N wegen a = sup A. Es folgt |an − a| = a − an < ε für alle n ≥ N. Beispiel 1. Wir betrachten die rekursiv definierte Folge (an ) mit a1 = 2 und 1 2 an+1 = an + 2 an für n ∈ N. Offensichtlich gilt an > 0 für alle n ∈ N. √ (Formaler Beweis durch vollständige Induktion.) Genauer gilt sogar, dass an ≥ 2 für alle n ∈ N. Dies ist klar für n = 1 und folgt für n ≥ 2 wegen a2n − 2 = = = = ≥ 2 1 2 −2 an−1 + 4 an−1 1 4 −2 a2n−1 + 4 + 2 4 an−1 4 1 a2n−1 − 4 + 2 4 an−1 2 1 2 an−1 − 4 an−1 0 und an > 0. Desweiteren gilt für alle n ∈ N, dass an+1 ≤ an , denn √ 2 an ≥ 2 1 2 1 an+1 ≥ 1+ 2 1+ = 1. = an 2 an 2 2 Hieraus folgt unmittelbar (durch vollständige Induktion), dass am ≤ an für m ≥ n gilt, d. h., die Folge (an ) ist monoton fallend. Nach Satz 2.3.1 konvergiert (an ) also gegen a = inf{an : n ∈ N}. √ Um den Grenzwert a zu bestimmen, notieren wir zunächst, dass wegen an ≥ 2 √ nach Satz 2.2.4 auch a ≥ 2 gilt. Außerdem gilt auch an+1 → a, und aus der Rekursionsformel und Satz 2.2.1 folgt damit a = 21 a + a2 . Dies ergibt aber a2 = a1 √ √ und damit a2 = 2, wegen a ≥ 2 also a = 2. Allgemeiner kann man wie oben zeigen, dass für c > 0, a1 > 0 und 1 c an+1 = an + 2 an 37 2.3 Konvergenzkriterien √ folgt, dass an → c. Mit diesem Verfahren kann man die Quadratwurzel einer natürlichen Zahl beliebig genau durch rationale Zahlen approximieren. Das Verfahren ist nach Heron von Alexandria (1. Jhdt. n. Chr.) benannt, war aber den Babyloniern bereits 2000 Jahre vorher bekannt. Heute wird es im Schulunterricht i. a. in der 9. Klasse behandelt. n n n+1 Beispiel 2. Für n ∈ N sei an = 1 + n1 = n+1 und bn = 1 + n1 = n n+1 n+1 = 1 + n1 an . Dann ist (an ) monoton steigend, denn für n ≥ 2 ist n an an−1 = = = = Bernoulli ≥ = n n−1 n+1 n−1 n n n (n + 1)(n − 1) n n2 n−1 n 2 n n −1 2 n n−1 n 1 n 1− 2 n n−1 n 1 1−n 2 n n−1 1. Ähnlich zeigt man, dass (bn ) monoton fallend ist. Damit gilt 1 a1 ≤ an < an 1 + = bn ≤ b1 n für alle n ∈ N. Nach Satz 2.3.1 existieren damit a, b ∈ R mit an → a and bn → b. Wegen an 1 + n1 = bn folgt a = b nach Satz 2.2.1, (ii). Der gemeinsame Grenzwert von (an ) und (bn ) heißt Eulersche Zahl und wird mit e bezeichnet. Es gilt e = 2, 718 . . . . Definition 2.3.1 Sei (an ) Zahlenfolge und a ∈ C. Dann heißt a Häufungswert von (an ), falls für jedes ε ∈ R+ unendlich viele n ∈ N mit |an − a| < ε existieren. Die Bedingung, dass unendlich viele n ∈ N mit |an −a| < ε existieren, ist äquivalent dazu, dass zu vorgegebenem N ∈ N ein n ∈ N mit n ≥ N und |an −a| < ε existiert. In Quantorenschreibweise lautet die letzte Bedingung wie folgt: ∀ε ∈ R+ ∀N ∈ N∃n ∈ N : n ≥ N ∧ |an − a| < ε. Als Beispiel betrachten wir die durch an = (−1)n gegebene Folge (an ). Hier sind 1 und −1 Häufungswerte. Definition 2.3.2 Sei X Menge, a : N → X Folge und ν : N → N streng monoton steigende Folge. Dann heißt die Folge a ◦ ν : N → X eine Teilfolge von a. Sie wird mit (aν(k) )k∈N oder (aνk )k∈N bezeichnet. Satz 2.3.2 Sei (an ) Zahlenfolge und a ∈ C. Dann gilt: 38 2 FOLGEN UND REIHEN (i) a ist Häufungswert von (an ) ⇔ Es existiert eine Teilfolge von (an ), die gegen a konvergiert. Beweis. “⇒” Sei a = limn→∞ an and ε > 0. Dann existiert N ∈ N mit |an − a| < für alle n ≥ N. Gilt dann m ≥ N und n ≥ N, so folgt (ii) a ist Grenzwert von (an ) ⇔ Alle Teilfolgen von (an ) konvergieren gegen a. Der Beweis sei als Übung überlassen. Satz 2.3.3 (Satz von Bolzano-Weierstraß) Jede beschränkte Zahlenfolge besitzt eine konvergente Teilfolge. Im Beweis des Satzes von Bolzano-Weierstraß werden wir folgenden Satz benutzen. Satz 2.3.4 Jede reelle Zahlenfolge besitzt eine monotone Teilfolge. Hierbei bedeutet “monoton” natürlich “monoton steigend oder monoton fallend”. Beweis von Satz 2.3.4. Sei (an ) reelle Zahlenfolge. Wir nennen m ∈ N Gipfel von (an ), falls an < am für alle n > m. Fall 1. Es existieren unendlich viele Gipfel. Seien m1 , m2 , m3 , . . . Gipfel mit m1 < m2 < m3 < . . . . Dann ist (amk ) monoton fallende Teilfolge von (an ). Fall 2. Es existieren höchstens endlich viele Gipfel. Dann existiert n1 ∈ N, so dass alle n ∈ N mit n ≥ n1 keine Gipfel sind. Insbesondere ist n1 kein Gipfel und damit existiert n2 > n1 mit an2 ≥ an1 . Auch n2 ist kein Gipfel, also existiert n3 > n2 mit an3 ≥ an2 , und n3 ist kein Gipfel. Induktiv erhält man so eine monoton steigende Teilfolge (ank ) von (an ). Beweis des Satzes von Bolzano-Weierstraß. Sei (an ) beschränkte Zahlenfolge. Wir betrachten zunächst den Fall, dass (an ) reelle Zahlenfolge ist. Dann besitzt (an ) nach Satz 2.3.4 eine monotone Teilfolge besitzt. Diese Teilfolge ist natürlich auch beschränkt, und damit konvergent nach Satz 2.3.1. Wir betrachten jetzt den Fall, dass (an ) (beschränkte) komplexe Zahlenfolge ist. Dann sind die Folgen (Re an ) und (Im an ) reell und beschränkt. Nach dem bereits bewiesenen besitzt (Re an ) eine konvergente Teilfolge (Re ank )k∈N , und die Folge (Im ank )k∈N besitzt eine konvergente Teilfolge Im ankj ankj eine konvergente Teilfolge von (an )n∈N ist. j∈N . Es folgt, dass j∈N Definition 2.3.3 Eine Zahlenfolge (an ) heißt Cauchyfolge, falls für jedes ε ∈ R+ ein N ∈ N existiert, so dass |an − am | < ε für alle m, n ≥ N. |an − am | = |(an − a) + (a − am )| ≤ |an − a| + |a − am | < Satz 2.3.5 (Cauchykriterium für Folgen) Eine Zahlenfolge konvergiert genau dann, wenn sie Cauchyfolge ist. ε 2 ε ε + = ε. 2 2 “⇐”: Sei (an ) Cauchyfolge. Zu zeigen ist, dass (an ) konvergiert. Wir zeigen zunächst (ähnlich wie im Beweis von Satz 2.1.2), dass (an ) beschränkt ist. Dazu notieren wir, dass ein N ∈ N existiert mit |an − am | < 1 für m, n ≥ N. Es folgt |an | = |an − aN + aN | ≤ |an − aN | + |aN | < 1 + |aN | für n ≥ N, und damit |an | ≤ max{|a1 |, |a2 |, . . . , |aN −1 |, 1 + |aN |} für alle n ∈ N. Nach dem Satz von Bolzano-Weierstraß existiert also eine konvergente Teilfolge von (an ), etwa ank → a. Wir zeigen jetzt, dass an → a gilt. Sei dazu ε > 0. Dann existiert K ∈ N mit |ank −a| < 2ε für k ≥ K. Außerdem existiert N ∈ N mit |an −am | < 2ε für m, n ≥ N. Sei nun n ≥ N. Dann existiert ℓ ∈ N mit ℓ ≥ K und nℓ ≥ N. Es folgt |an − a| ≤ |an − anℓ | + |anℓ − a| < ε ε + = ε. 2 2 Wichtig bei obigem Satz sowie den Sätzen 2.3.1 und 2.3.2 ist, dass sie erlauben, die Konvergenz einer Folge nachzuweisen, ohne den Grenzwert zu kennen. Das Entscheidende dabei ist die Vollständigkeit von R. Umgekehrt könnte man auch wieder die Vollständigkeit dadurch definieren, dass man die Konvergenz jeder Cauchyfolge verlangt. Dann müsste man aber, um dem Vollständigkeitsbegriff von Definition 1.7.3 zu erhalten, noch zusätzlich das Archimedische Axiom verlangen; vgl. die Diskussion nach Satz 1.8.9. (Wir werden aber später in metrischen Räumen Vollständigkeit auf diesem Wege definieren.) Exkurs: Konstruktion der reellen Zahlen. Wir wollen den Körper (Q, +, ·) der rationalen Zahlen zum Körper (R, +, ·) der reellen Zahlen “vervollständigen”. Dazu sei C die Menge der Cauchyfolgen rationaler Zahlen. Wir betrachten die auf C durch (xn ) ∼ (yn ) :⇔ lim (xn − yn ) = 0 n→∞ definierte Relation ∼. Man zeigt leicht, dass ∼ Äquivalenzrelation ist. Um etwa die Transivität zu zeigen, seien (xn ), (yn ), (zn ) ∈ C mit (xn ) ∼ (yn ) und (yn ) ∼ (zn ). Dann gilt (xn − yn ) → 0 und (yn − zn ) → 0 und damit (xn − zn ) = (xn − yn ) + (yn − zn ) → 0, also (xn ) ∼ (zn ). Auf der Menge C/∼ der Äquivalenzklassen definieren wir eine Addition und eine Multiplikation durch In Quantorenschreibweise lautet die Definition wie folgt: (an ) ist Cauchyfolge ⇔ ∀ε ∈ R+ ∃N ∈ N∀m, n ∈ N : (m ≥ N ∧ n ≥ N) ⇒ |an − am | < ε. 39 2.3 Konvergenzkriterien [(xn )] + [(yn )] := [(xn + yn )] und [(xn )] · [(yn )] := [(xn · yn )]. Zunächst muss man zeigen, dass diese Addition und Multiplikation von Äquivalenzklassen wohldefiniert sind. Dazu muss man zum einen zeigen, dass mit (xn ), (yn ) ∈ C auch (xn + yn ) ∈ C und (xn · yn ) ∈ C gilt, und zum andern, dass für (xn ) ∼ (x′n ) 40 2 FOLGEN UND REIHEN und (yn ) ∼ (yn′ ) auch (xn + yn ) ∼ (x′n + yn′ ) und (xn · yn ) ∼ (x′n · yn′ ) gilt. Wir verzichten hier auf den Beweis dieser Aussagen. Es gilt dann, dass (C/ ∼, +, ·) Körper ist. Auf einen Nachweis der einzelnen Körperaxiome verzichten wir. Das Nullelement des Körpers ist [(0, 0, 0, . . . )] und das Einselement ist [(1, 1, 1, . . . )]. Wir definieren eine Ordnung ≤ auf C/∼ wie folgt: [(xn )] ≤ [(yn )] :⇔ ∀ε > 0∃N ∈ N : n ≥ N ⇒ xn ≤ yn + ε. (Man beachte hier, dass die “naive” Setzung [(xn )] ≤ [(yn )] :⇔ ∀n ∈ N : xn ≤ yn hier nicht zum Erfolg führt. Diese ist noch nicht einmal wohldefiniert. Beispielsweise ist ja [( n1 )] = [(− n1 )].) Zunächst muss man wieder zeigen, dass ≤ wohldefiniert ist. Sei dazu (xn ) ∼ (x′n ) und (yn ) ∼ (yn′ ) und es gelte ∀ε > 0∃N ∈ N : n ≥ N ⇒ xn ≤ yn + ε. Zu zeigen ist ∀ε > 0∃N ∈ N : n ≥ N ⇒ x′n ≤ yn′ + ε. Sei dazu ε > 0. Dann existiert M mit xn ≤ yn + 3ε für n ≥ M. Weiter existieren Nx , Ny ∈ N mit |xn − x′n | < 3ε für n ≥ Nx und |yn − yn′ | < 3ε für n ≥ Ny . Für n ≥ max{M, Nx , Ny } folgt dann ε ε ε x′n < xn + < yn + 2 < yn′ + 3 = yn′ + ε. 3 3 3 Es ist leicht zu sehen, dass ≤ tatsächlich Ordnung ist. Ebenso kann man nachrechnen, dass die Ordnungsaxiome (O1) und (O2) erfüllt sind. Damit erhält man, dass (C/∼, +, ·) ein angeordneter Körper ist. Man kann r ∈ Q mit der Äquivalenzklasse [(r, r, r, . . . )] identifizieren. In diesem Sinne ist Q Teilkörper von C/∼. Formal betrachtet man wieder die injektive Abbildung i : Q → C/ ∼, r 7→ [(r, r, r, . . . )]. Es gilt für r, s ∈ Q dann, dass i(r + s) = i(r) + i(s), i(r · s) = i(r) · i(s) und r ≤ s ⇔ i(r) ≤ i(s). Schließlich zeigt man dann, dass (C/ ∼, +, ·) vollständig ist. Dies kann man beispielsweise tun, indem man Folgendes zeigt: • Jede Cauchyfolge in (C/∼, +, ·) ist konvergent. • In (C/∼, +, ·) gilt das Archimedische Axiom. • Ein angeordneter Körper, in dem das Archimedische Axiom gilt und in dem jede Cauchyfolge konvergiert, ist vollständig. Wir verzichten hier auf die Einzelheiten. 2.4 Limes superior und inferior sowie uneigentliche Grenzwerte Sei (an ) eine beschränkte reelle Zahlenfolge. Für n ∈ N sei An := {ak : k ≥ n}. Dann ist An beschränkt und damit existiert sup An . Ist m ≤ n, so gilt An ⊂ 2.4 Limes superior und inferior sowie uneigentliche Grenzwerte 41 Am und damit sup An ≤ sup Am . Die Folge (sup An ) ist also monoton fallend. Außerdem ist sie beschränkt. Deshalb ist sie nach Satz 2.3.1 konvergent und es gilt limn→∞ sup An = inf n∈N sup An = inf n∈N supk≥n ak . Definition 2.4.1 Sei (ak ) reelle Zahlenfolge. Dann heißen lim sup an := inf sup ak n→∞ n∈N k≥n Limes superior und lim inf an := sup inf ak n→∞ n∈N k≥n Limes inferior von (an ), falls die Suprema und Infima rechts existieren. Statt lim sup schreibt man auch lim und statt lim inf schreibt man auch lim. Aus den obigen Überlegungen folgt, dass Limes superior und inferior immer existieren, wenn (an ) beschränkt ist. Umgekehrt sieht man sofort, dass aus der Existenz des Limes superior die Beschränktheit von (an ) nach oben und aus der des Limes inferior die Beschränktheit nach unten folgt. Wegen lim supn→∞ an = limn→∞ sup An , lim inf n→∞ an = limn→∞ inf An und inf An ≤ sup An für alle n ∈ N folgt mit Satz 2.2.4, dass lim inf an ≤ lim sup an n→∞ n→∞ gilt. Satz 2.4.1 Eine reelle Zahlenfolge (an ) ist genau dann konvergent, wenn der Limes superior und inferior beide existieren und den gleichen Wert haben. Beweis. “⇒”. Sei a := limn→∞ an und ε > 0. Dann existiert N ∈ N mit |an − a| < ε für n ≥ N. Es folgt a − ε < an < a + ε für n ≥ N und damit a − ε < inf k≥N ak ≤ supk≥N ak < a + ε. Damit gilt a − ε < supn∈N inf k≥n ak = lim inf n→∞ an ≤ lim supn→∞ an = inf n∈N supk≥n ak < a + ε. “⇐”. Sei lim inf n→∞ an = lim supn→∞ an = a und ε > 0. Dann existiert N ∈ N mit a − ε < inf k≥n ak ≤ supk≥n ak < a + ε für n ≥ N. Es folgt a − ε < an < a + ε und damit |an − a| < ε für n ≥ N. Satz 2.4.2 Sei (an ) eine beschränkte reelle Zahlenfolge und sei H die Menge der Häufungswerte von (an ). Dann ist H 6= ∅ und es gilt lim supn→∞ an = max H und lim inf n→∞ an = min H. Beweis. Es genügt, lim supn→∞ an = max H zu zeigen. Sei wieder An := {ak : k ≥ n} und damit a := lim supn→∞ an = limn→∞ sup An . Wir zeigen zunächst, dass a ∈ H. Aufgrund der Bemerkung nach Definition 2.3.1 haben wir Folgendes zu zeigen: ∀ε > 0∀N ∈ N∃k ∈ N : k ≥ N ∧ |ak − a| < ε. Sei also ε > 0 und N ∈ N. Zunächst existiert N ′ ∈ N mit | sup An − a| < 2ε für n ≥ N ′ . Sei nun n ≥ max{N, N ′ }. Nach Satz 1.7.4 existiert x ∈ An mit 42 2 FOLGEN UND REIHEN x > sup An − 2ε , das heißt, es existiert k ≥ n ≥ N mit ak > sup An − 2ε . Wegen ak ≤ sup An ist also | sup An − ak | < 2ε . Es folgt |ak − a| ≤ |ak − sup An | + | sup An − a| < ε ε + = ε. 2 2 Also gilt a ∈ H. Wir zeigen nun, dass a = max H. Sei dazu b ∈ H. Wir haben zu zeigen, dass b ≤ a gilt. Wir nehmen an, dass b > a gilt. Dann ist ε := b−a > 0. Wieder existiert N ′ ∈ N mit | sup An − a| < 2ε für n ≥ N ′ . Außerdem existiert k ∈ N mit k ≥ N ′ und |ak − b| < 2ε . Es folgt ε = b − a = b − ak + ak − a ≤ |b − ak | + | sup Ak − a| < ε ε + = ε, 2 2 was ein Widerspruch ist. Wir erweitern nun R durch hinzufügen zweier Elemente ∞ (gelegentlich auch mit +∞ bezeichnet) und −∞ zu einer Menge R, also R = R ∪ {∞, −∞}. Die Ordnung ≤ auf R erweitern wir zu einer Ordnung auf R, indem wir −∞ < x und x < ∞ für x ∈ R und außerdem −∞ < ∞ setzen. Man rechnet leicht nach, dass (R, ≤) geordnete Menge ist. Es ist dabei jede Teilmenge von R beschränkt, denn ∞ ist immer obere und −∞ ist immer untere Schranke. Außerdem ist die geordnete Menge (R, ≤) ordnungsvollständig. Um dies einzusehen, bezeichnen wir (vorübergehend) das Supremum in (R, ≤) mit supR und das in (R, ≤) mit supR . Sei nun A ⊂ R. Es zeigt sich dann, dass supR A = ∞ falls ∞ ∈ A oder falls A ∩ R nicht nach oben beschränkt ist, und dass supR A = supR (A ∩ R) falls ∞ ∈ / A und A ∩ R nicht leer und nach oben beschränkt ist. Im verbleibenden Fall ist ∞ ∈ / A und A∩R = ∅, also A = {−∞} oder A = ∅, und es folgt sup A = −∞. Analog lässt sich auch das Infimum von Teilmengen von R kennzeichnen. Wir halten also fest, dass jede Teilmenge von R ein Supremum und ein Infimum (bzgl. der geordneten Menge (R, ≤)) besitzt. Nach Definition 2.4.1 und Satz 2.4.1 sind Limes superior, Limes inferior und Grenzwert einer reellen Zahlenfolge Suprema und Infima gewisser Teilmengen von R. Wir nehmen nun diese Suprema und Infima bzgl. der geordneten Menge (R, ≤). Es folgt, dass Limes superior und Limes inferior dann für jede reelle Zahlenfolge (und sogar für jede Folge nach R) existieren, möglicherweise aber den Wert ∞ oder −∞ haben. Gilt für eine reelle Zahlenfolge (an ), dass lim inf n→∞ an = ∞ (und damit auch lim supn→∞ an = ∞), so schreiben wir auch limn→∞ an = ∞ und nennen (an ) bestimmt divergent gegen ∞. Analog definiert man bestimmte Divergenz gegen −∞. Man bezeichnet ∞ und −∞ auch als uneigentliche Grenzwerte. Beispiel 1. Sei an = n. Dann ist limn→∞ an = ∞, denn mit An := {ak : k ≥ n} ist inf R An = inf R An = n und folglich lim inf n→∞ an = supR {inf R An : n ∈ N} = supR N = ∞. Beispiel 2. Sei an = (−1)n . Dann ist An := {−1, 1} für alle n ∈ N. Hieraus folgt, dass lim supn→∞ an = 1 und lim inf n→∞ an = −1. 2.5 Die allgemeine Potenz 2.5 43 Die allgemeine Potenz In Definition 1.8.1 hatten wir die Potenz ar für a ∈ R+ und r ∈ Q erklärt. Wir wollen dies jetzt für r ∈ R tun. Eine Möglichkeit dafür wurde bereits im Anschluss an Satz 1.8.6 angegeben, aber wir beschreiten jetzt einen anderen Weg. Hilfssatz 2.5.1 Sei (rn ) eine Folge rationaler Zahlen mit rn → 0 und sei a ∈ R+ . Dann gilt arn → 1. Beweis. Ohne Einschränkung der Allgemeinheit kann man a > 1 annehmen. Sei ε ∈ R+ .Wegen a1/k → 1 für k → ∞ (vgl. Beispiel nach Satz 2.2.5) existiert K ∈ N 1/k mit |a1/k − 1| < ε und |a−1/k − 1| = | a1 − 1| < ε für k ≥ K. Weiter existiert N ∈ N mit |rn | < K1 für n ≥ N. Es folgt −ε < a−1/K − 1 < arn − 1 < a1/K − 1 < ε, also |arn − 1| < ε, für n ≥ N. Hilfssatz 2.5.2 Sei (rn ) eine Folge rationaler Zahlen und sei a ∈ R+ . Konvergiert (rn ), so konvergiert auch (arn ). Dabei hängt limn→∞ arn nur von r := limn→∞ rn ab und es gilt limn→∞ arn = ar falls r ∈ Q Beweis. Ohne Einschränkung der Allgemeinheit kann man wieder a > 1 annehmen. Sei (sn ) eine monoton fallende Folge mit sn → r. (Die Existenz einer solchen Folge kann man aus Satz 1.8.4 ableiten, welcher besagt, dass Q dicht in R ist.) Sei m ∈ Z mit m ≤ r. Dann gilt sn ≥ r ≥ m für alle n ∈ N und damit asn ≥ am nach Satz 1.8.6. Folglich ist (asn ) nach unten beschränkt. Außerdem ist (asn ) nach Satz 1.8.6 monoton fallend, und damit nach Satz 2.3.1 konvergent. Sei nun (rn ) eine Folge rationaler Zahlen mit rn → r. Dann gilt rn − sn → 0, nach Hilfssatz 2.5.1 also arn −sn → 1. Wegen arn = asn +rn −sn = asn arn −sn ist dann auch (arn ) konvergent und hat den gleichen Grenzwert wie (asn ). Ist r ∈ Q, so kann man sn = r für alle n ∈ N wählen, und damit ist ar der gemeinsame Grenzwert von (arn ) und (asn ). Definition 2.5.1 Sei a ∈ R+ und r ∈ R. Dann setzen wir ar := limn→∞ arn , wobei (rn ) eine rationale Zahlenfolge mit rn → r ist. Hilfssatz 2.5.2 zeigt, dass ar wohldefiniert ist (und im Beweis wurde bemerkt, dass eine Folge (rn ) mit den gewünschten Eigenschaften für jedes r ∈ R existiert). Aus dieser Definition folgt unmittelbar, dass die in Satz 1.8.6 formulierten Potenzgesetze auch für reelle Exponenten richtig bleiben. Ebenso bleiben auch die Behauptungen der obigen Hilfssätze richtig, wenn man rn , r ∈ R zulässt. 2.6 Reihen P Definition 2.6.1 Sei N ∈ N und (an )n≥N Zahlenfolge. Die durch sn := nk=N ak definierte Folge (sn )n≥N P P heißt die zu (an ) gehörige (unendliche) Reihe. Sie wird mit ∞ an bezeichnet. Die Reihe heißt konvergent, wenn die Folge n=N an oder auch (s ) konvergiert. In diesem Fall heißt der Grenzwert von (sn ) die Summe der Reihe n P P an . Gilt limn→∞ sn = s, so schreibt man ∞ n=N an = s. Reihen, die nicht konvergieren, heißen divergent (und bei Existenz des uneigentlichen Grenzwertes ∞ oder −∞ auch bestimmt divergent).P Die Folge (sn ) heißt auch Folge der Partialsummen (oder Teilsummen) der Reihe an . 44 2 FOLGEN UND REIHEN P P an also sowohl die Reihe selbst, wie auch Wir bezeichnen mit ∞ n=N an bzw. – im Konvergenzfall – ihre Summe. Das sollte im allgemeinen aber nicht zu Verwechslungen führen. P n n Beispiel. Sei q ∈ C. Wir betrachten die Reihe ∞ n=0 q . Es ist also an = q . Diese Reihe heißt geometrische Reihe. Pn Fall 1. q = 1. Dann gilt an = 1 und sn = k=0 1 = n + 1. Die Reihe ist (bestimmt) divergent. P n+1 , denn Fall 2. q 6= 1. Es gilt sn = nk=0 q k = 1−q 1−q (1 − q) n X qk = k=0 n X k=0 = n X k=0 (1 − q)q k q k − q k+1 Wegen q n+1 → 0 für |q| < 1 folgt, dass k=0 qk = 1 1−q Beweis. Mit sn = Pn k=1 ak ist s2n+1 −1 = a1 + a2 + a3 + a4 + a5 + a6 + a7 + a8 + a9 + · · · + a2n+1 −1 ≤ a1 + a2 + a2 + a4 + a4 + a4 + a4 + a8 + a8 + · · · + a2n n X = 2k a2k k=0 ≤ a1 + a2 + a2 + a3 + a3 + a4 + a4 + a5 + a5 + · · · + a2n = 2s2n − a1 ≤ 2s2n . Die Behauptung folgt mit Satz 2.6.1. 1 Beispiel. Sei α > 0 und P∞an 1= nα . Dann sind die Voraussetzungen von Satz 2.6.2 erfüllt und damit ist n=1 nα genau dann konvergent, wenn = 1 − q + q − q 2 + q 2 − q 3 + · · · + q n − q n+1 = 1 − q n+1 . ∞ X 45 2.6 Reihen für |q| < 1, d. h., die Reihe konvergiert für |q| < 1 und ihre Summe ist Für |q| ≥ 1 divergiert die Reihe. 1 . 1−q Da Reihen nach Definition also nichts anderes als Folgen sind, haben Sätze über Folgen Analoga Aus Satz P für Reihen. P P 2.2.1, (i), erhält man z. B., dass aus der Konvergenz von bn die von (an +bn ) folgt, und dass für die Summen P P an und P (an + bn ) = an + bn gilt. Analog überträgt sich Satz 2.2.1, (iii). P Satz 2.6.1 Sei an eine Reihe P nichtnegativer reeller Zahlen, d. h., es gelte an ≥ 0 für alle n. Dann konvergiert an genau dann, wenn die Folge der Partialsummen beschränkt ist. Beweis. “⇒” folgt aus Satz 2.1.2 (“Konvergente Folgen sind beschränkt”), und “⇐” folgt aus Satz 2.3.1, da die Folge der Partialsummen wegen an ≥ 0 monoton steigend ist. Satz 2.6.2 (Cauchyscher Verdichtungssatz) Sei (aP k )k∈N eine monoton fallende Folge nichtnegativer reeller Zahlen. Dann konvergiert ∞ k=1 ak genau dann, wenn P ∞ k 2 a k konvergiert. 2 k=0 ∞ X k=0 2k ∞ ∞ k=0 k=0 X X k 1 21−α 2k(1−α) = = (2k )α konvergiert. Dies ist aber die geometrische Reihe, und diese konvergiert genau dann, wenn 21−α < 1, also wenn α > P 1 gilt. 1 für 0 < α ≤ 1. Insgesamt konvergiert also ∞ n=1 nα für α > 1, und divergiert P 1 Insbesondere divergiert die sogenannte harmonische Reihe ∞ n=1 n . Satz 2.6.3 (Leibnizkriterium) Sei (ak )k∈N eine monoton fallende Folge positiver P k+1 ak . Für die Folge reeller Zahlen mit limk→∞ ak = 0. Dann konvergiert ∞ k=1 (−1) (sn ) der Partialsummen gilt dabei s2n ≤ n X k=1 (−1)k+1 ak ≤ s2n−1 für n ∈ N. Beweis. Es ist s2n+1 − s2n−1 = (−1)2n+2 a2n+1 + (−1)2n+1 a2n = a2n+1 − a2n ≤ 0 für n ∈ N, also ist (s2n−1 ) monoton fallend. Analog ist (s2n ) monoton steigend. Außerdem gilt s2n − s2n−1 = (−1)2n+1 a2n = −a2n < 0 und damit s2 ≤ s2n < s2n−1 ≤ s1 . Nach Satz 2.3.1 konvergieren damit die Folgen (s2n−1 ) und (s2n ), und wegen s2n − s2n−1 = −a2n → 0 haben sie den gleichen Grenzwert. Daraus folgt die Behauptung. P (−1)n+1 Beispiel. ∞ = 1 − 12 + 13 − . . . ist konvergent. Für die Summe s gilt n=1 n s2 = 21 ≤ s ≤ 1 = s1 . (Tatsächlich gilt es = 2, und es ist s = 0, 6931471806 . . . .) P∞ Satz 2.6.4 (Cauchykriterium für Reihen) Eine Reihe k=K ak konvergiert genau dann, wenn für alle ε ∈ R+ ein N ∈ NPmit N ≥ K existiert, so dass für alle m, n ∈ N mit n > m ≥ N die Ungleichung nk=m+1 ak < ε gilt, d. h., falls n X ∀ε ∈ R+ ∃N ≥ K∀m, n ∈ N : n > m ≥ N ⇒ ak < ε. k=m+1 46 2 FOLGEN UND REIHEN Beweis. Wegen sn − sm = Satz 2.6.5 Konvergiert Pn k=m+1 P∞ k=K ak folgt die Behauptung aus Satz 2.3.5. ak , so gilt limk→∞ ak = 0. Beweis. Man wähle n = m + 1 im Cauchykriterium. Die harmonische Reihe zeigt, dass in Satz 2.6.5 nicht die Umkehrung gilt. 2.7 Absolute und bedingte Konvergenz Definition 2.7.1 Eine Reihe giert. P an heißt absolut konvergent, wenn P |an | konver- s 2 = 3s 2 = 1 + 31 1 2 − 41 + 51 − 14 + 13 − 21 − 16 + 71 + 16 + 51 + 17 n n X X aν(k) − |tn − sn | = ak k=1 k=1 n X X ak − = ak k∈ν({1,2,...,n}) k=1 n X X = ak − ak k∈ν({1,2,...,n})\{1,2,...,N } k=N +1 ≤ P P Der Beweis folgt wegen nk=m+1 ak ≤ nk=m+1 |ak | unmittelbar aus dem Cauchykriterium. P (−1)n+1 konvergent, aber nicht Die Umkehrung des Satzes gilt nicht. So ist ∞ n=1 n absolut konvergent. Wir betrachten dieses Beispiel genauer: = 1 − 12 Sei ε ∈ R+ .Wegen der P absoluten Konvergenz und aufgrund des Cauchykriteriums existiert N ∈ N mit nm+1 |ak | < ε für n > m ≥ N. Weiter existiert M ∈ N mit M > N und ν({1, 2, . . . , M}) ⊃ {1, 2, . . . , N}. Für n ≥ M folgt dann max ν({1,2,...,n}) Satz 2.7.1 Absolut konvergente Reihen sind konvergent. s 47 2.7 Absolute und bedingte Konvergenz − 81 +... − 81 +... − 41 +... Es zeigt sich, dass in der Reihe für 3s dieselben Folgenglieder auftreten wie in der 2 Reihe für s, aber in anderer Reihenfolge. P DefinitionP2.7.2 Sei ν : N → N bijektiv und sei P ∞ k=1 ak eine Reihe. Dann heißt ∞ die Reihe k=1 aν(k) eine Umordnung der Reihe ∞ k=1 ak . Eine Reihe heißt unbedingt konvergent, wenn jede ihrer Umordnungen konvergiert, und zwar zur selben Summe. Eine konvergente, aber nicht unbedingt konvergente Reihe heißt bedingt konvergent. X |ak | k=N +1 < ε. P P∞ Satz 2.7.3 Seien ∞ k=0 ak und k=0 bk absolut konvergente Reihen mit Summen a und b. Dann ist die aus allen Produkten aj bk , j, k ∈ N0 , gebildete Reihe absolut konvergent und ihre Summe ist ab. Eine etwas formalere Fassung der Behauptung des Satzes ist folgende: ist φP: N0 → ∞ N0 × N0 eine Bijektion und ist pn := aj bk falls φ(n) = (j, k), so ist n=0 pn P∞ konvergent mit n=0 pn = ab. Beweis von Satz 2.7.3. Seien φ und pn wie oben, mit φ(n) = (φ1 (n), φ2 (n)) für n ∈ N. Für i ∈ {1, 2} und n ∈ N sei Mi,n := max φi ({1, 2, . . . , n}). Dann ist n X ℓ=0 |pℓ | = ≤ n X |aφ1 (ℓ) ||bφ2 (ℓ) | ℓ=0 M1,n M2,n XX j=0 k=0 Bemerkung. Es gilt auch die Umkehrung. P P Beweis von Satz 2.7.2. Sei ∞ sei ∞ k=1 ak absolut k=1 aν(k) Pn konvergente Reihe Pund n eine Umordnung der Reihe. Sei sn = k=1 ak und sei tn = k=1 aν(k) . Dann ist (sn ) konvergent, und wir müssen zeigen, dass (tn ) ebenfalls konvergent ist und denselben Grenzwert hat. Dazu reicht es zu zeigen, dass tn − sn → 0. ! M2,n ! ∞ X M1,n = X j=0 Satz 2.7.2 Absolut konvergente Reihen sind unbedingt konvergent. |aj ||bk | ≤ ∞ X j=0 |aj | |aj | X k=0 k=0 |bk | ! ! |bk | . P Also konvergiert ∞ n=0 |pn | nach Satz 2.7.1. P Es reicht nun, ∞ n=0 pn = ab für eine Summationsreihenfolge (d. h., für eine Funktion φ) zu zeigen. Dazu betrachten wir die im folgenden Diagramm angedeutete Summationsreihenfolge: 48 2 FOLGEN UND REIHEN a0 b0 a1 b0 ↓ a2 b0 a3 b0 ↓ a4 b0 → a0 b1 ↓ ← a1 b1 → a2 b1 a0 b2 ↑ a1 b2 ↑ → a2 b2 ← a3 b1 ← a3 b2 → a0 b3 ↓ a1 b3 ↓ a2 b3 ↓ ← a3 b3 → a4 b1 → a4 b2 → a4 b3 für n ∈ N. Dann gilt a0 b4 ↑ a1 b4 ↑ a2 b4 ↑ a3 b4 ↑ a4 b4 → |an | = Da X pk = und damit k=0 aj j=0 k=0 Pn n X ! n X k=0 bk ! → ab pk → ab. Nach Satz 2.7.3 ist das Cauchyprodukt zweier absolut konvergenter Reihen ebenfalls absolut konvergent. Darüberhinaus kann man zeigen, daß das Cauchyprodukt auch dann konvergiert, und zwar zur “richtigen” Summe, wenn nur eine der beiden beteiligten Reihen absolut konvergiert und die andere nur im gewöhnlichen Sinne konvergiert. P∞ 1 n=1 n3/2 P∞ n=N an und (i) Existiert M ≥ N mit |an | ≤ bn für n ≥ M und ist P ist ∞ n=N an absolut konvergent. P∞ n=N n=N bn konvergent, so an := √ n n2 + 1 3 + 4i 5 n n = !n √ √ √ 3 2 + 42 n n 1 ≤ 2 = 3/2 . = 2 5 n +1 n n √ n n2 + 1 konvergiert, ist auch P∞ n=1 an absolut konvergent. P∞ n=N an := für n ∈ N. Dann gilt p n Wegen 1 e |an | = in n+1 P∞ n=N bn divergent, so n(n+1) !1 n+1 in n(n+1) n n = = n + 1 n+1 < 1 folgt, dass P∞ n=N 1 1+ an absolut konvergent ist. Satz 2.8.3 (Quotientenkriterium) Sei In (i) kann an komplex sein, in (ii) muss an reell sein. Sowohl in (i) wie in (ii) ist bn reell. Man nennt (i) Majorantenkriterium und (ii) Minorantenkriterium. Pn Pn Beweis. (i). P∞Mit sn = k=M |an | und tn = k=M bn ist sn ≤ tn für n ≥ M. Konvergiert n=N bn , so ist auch (tn )k≥M konvergent und folglich P beschränkt. Damit ist (sn )k≥M beschränkt, also konvergent, und damit auch ∞ n=N |an | konvergent. Der Beweis von (ii) ist analog. Beispiel. Sei |3 + 4i| 5 Beispiel. Sei bn Reihen. P∞ (ii) Existiert M ≥ N mit 0 ≤ bn ≤ an für n ≥ M und ist P ist ∞ n=N an divergent. p Bemerkung. Die Voraussetzung in (i) ist äquivalent zuplim supn→∞ n |an | < 1, und die Voraussetzung in (ii) ist erfüllt, falls lim supn→∞ n |an | > 1. p Beweis von Satz 2.8.2. (i). Aus n |an | ≤ q folgt |an | ≤ q n , und damit P nfolgt die Behauptung aus dem Vergleichskriterium, da die geometrische Reihe q für 0 ≤ q < 1 konvergiert. p (ii). Aus n |an | ≥ 1 folgt |an | ≥ 1. PGilt dies für unendlich viele n, so ist (an ) keine Nullfolge, und damit die Reihe an divergent nach Satz 2.6.5. Kriterien für absolute Konvergenz Satz 2.8.1 (Vergleichskriterium) Seien n n2 + 1 an Reihe. p P n (i) Existiert q ∈ [0, 1) und M ∈ N mit |an | ≤ q für n ≥ M, so ist ∞ n=N an absolut konvergent. p P (ii) Ist n |an | ≥ 1 für unendlich viele n, so ist ∞ n=N an divergent. Eine andere wichtige Summationsreihenfolge wird durch die folgende Definition gegeben. P P∞ Definition 2.7.3 Seien P ∞ ∈ N0 sei cn := k=0 ak und k=0 bk Reihen. Für Pn Pn P∞ ∞ ∞ k=0 ak bn−k . Dann heißt n=0 cn Cauchyprodukt der Reihen k=0 ak und k=0 bk . 2.8 √ Satz 2.8.2 (Wurzelkriterium) Sei Es gilt dann (n+1)2 −1 49 2.8 Kriterien für absolute Konvergenz 1 n+1 n 1 → . e P∞ an Reihe. ≤ q für n ≥ M, so ist (i) Existiert q ∈ [0, 1) und M ∈ N mit an 6= 0 und an+1 an P∞ a absolut konvergent. n n=N P ≥ 1 für n ≥ M, so ist ∞ (ii) Existiert M ∈ N mit an 6= 0 und an+1 n=N an an divergent. n=N Bemerkung. Es gelte an 6= 0 für n ≥ M. Die Voraussetzung in (i) ist dann äqui valent zu lim supn→∞ an+1 < 1, und die Voraussetzung in (ii) ist erfüllt, falls an an+1 lim inf n→∞ an > 1. Beweis von Satz 2.8.3. (i). Es ist |an | ≤ q|an−1 | ≤ q 2 |an−2 | ≤ · · · ≤ q n−M |aM | = q n q −M |aM | für n ≥ M. Die Behauptung folgt aus dem Vergleichskriterium. 50 2 FOLGEN UND REIHEN (ii) P Analog zu (i) folgt |an | ≥ |aM | für n ≥ M. Damit ist (an ) keine Nullfolge, also an divergent. Beispiel. Sei an := für n ∈ N. Dann gilt an+1 an = 7n (2n)!n! 7n 3n = (3n)! n 7n+1 (2n + 2)!(n + 1)! (3n)! (3n + 3)! 7n (2n)!n! n 7 · 7 (2n + 2)(2n + 1)(2n)!(n + 1)n! (3n)! = (3n + 3)(3n + 2)(3n + 1)(3n)! 7n (2n)!n! 7(2n + 2)(2n + 1)(n + 1) = (3n + 3)(3n + 2)(3n + 1) 7(2n + 2)(2n + 1)(n + 1) = (3n + 3)(3n + 2)(3n + 1) 7 2 + n2 2 + n1 1 + n1 = 3 + n3 3 + n2 3 + n1 7·2·2·1 → 3·3·3 28 = . 27 P > 1 divergiert die Reihe an . Wegen 28 27 2.9 Potenzreihen P∞ Definition 2.9.1 Eine Reihe der Form n=0 an (z − z0 )n , mit z, z0 ∈ C und einer Folge (an ) komplexer Zahlen, heißt Potenzreihe. Ist z0 und (an ) gegeben, so stellt sich die Frage, für welche z ∈ C die Reihe konvergiert. Dies wird weitgehend durch den folgenden Satz geklärt. p P n n |an | und Satz 2.9.1 Sei ∞ n=0 an (z − z0 ) Potenzreihe. Es sei ℓ := lim supn→∞ 1 r := ℓ falls ℓ ∈ R+ , r := 0 falls ℓ = ∞ und r := ∞ falls ℓ = 0. Dann konvergiert die Potenzreihe absolut falls |z − z0 | < r und sie divergiert falls |z − z0 | > r p p n n Beweis. Sei bp |bn | = n |an ||z − z0 |. Hieraus ergibt sich n := an (z − z0 ) . Dann ist n lim supn→∞ |bn | = ℓ|z − z0 |. Die Behauptung folgt jetzt aus dem Wurzelkriterium. Bemerkung 1. Ist 0 < r < ∞, so konvergiert die Potenzreihe innerhalb eines Kreises vom Radius r um z0 , und sie divergiert außerhalb dieses Kreises. Daher nennt man das in Satz 2.9.1 definierte r den Konvergenzradius der Potenzreihe. Bemerkung 2. Satz 2.9.1 macht keine Aussage für den Fall, dass |z − z0 | = r. Hier ist in der Tat “alles möglich”, wie die folgenden Beispiele belegen: 51 2.9 Potenzreihen P∞ also z0 = 0, an = n1 für n ∈ N und a0 = 0. Es gilt ℓ = p 1 lim supn→∞ n |an | = lim supn→∞ √ n n = 1 und damit r = 1. Damit liegt (absolute) Konvergenz für |z| < 1 und Divergenz für |z| > 1 vor. Für z = 1 liegt Divergenz vor, für z = −1 Konvergenz. P∞ 1 n (ii) n=1 n2 z . Wieder gilt r = 1, aber diesmal liegt Konvergenz für alle z ∈ C mit |z| = 1 vor. P∞ n (iii) n=1 z . Wieder gilt r = 1, aber jetzt liegt Divergenz für alle z ∈ C mit |z| = 1 vor. P n r. Existiert Satz 2.9.2 Sei ∞ n=0 an (z−z0 ) Potenzreihe mit Konvergenzradius der an an (möglicherweise uneigentliche) Grenzwert limn→∞ an+1 , so gilt r = limn→∞ an+1 . (i) 1 n n=1 n z , Der Beweis ist analog zum Beweis von Satz 2.9.1, wobei man statt des Wurzelkriteriums aber jetzt das Quotientenkriterium verwendet. an (n+1)! Beispiel. Sei an := n!1 für n ∈ N0 . Dann gilt limn→∞ an+1 = limn→∞ n! = P∞ 1 n limn→∞ n + 1 = ∞. Es folgt, dass die Potenzreihe n=0 n! z für alle z ∈ C konver√ giert. Ein Nebenergebnis ist, dass limn→∞ n n! = ∞. Definition 2.9.2 Die durch exp(z) := heißt Exponentialfunktion. P∞ 1 n n=0 n! z definierte Funktion exp : C → C Gemäß obigem Beispiel konvergiert die Reihe für alle z ∈ C. Statt exp(z) schreibt man auch exp z. Satz 2.9.3 Für z, w ∈ C gilt exp(z + w) = exp(z) · exp(w). Beweis. Es gilt exp(z) · exp(w) = Cauchy−Prod. = = = = ∞ X 1 n z n! n=0 1 , exp z ∞ X 1 (z + w)n n! n=0 exp(z + w). insbesondere also exp z 6= 0. (ii) exp(nz) = (exp z)n . · ∞ X 1 n w n! n=0 ! n ∞ X X 1 k 1 z w n−k k! (n − k)! n=0 k=0 ! ∞ n X 1 X n k n−k z w n! k=0 k n=0 Folgerung 2.9.1 Sei z ∈ C und n ∈ Z. Dann gilt: (i) exp(−z) = ! ! 52 2 FOLGEN UND REIHEN 53 2.9 Potenzreihen 10 Man erhält hier (i) wegen exp(−z) exp z = exp(−z + z) = exp(0) = 1, und auch (ii) folgt leicht. n Satz 2.9.4 Für z ∈ C gilt exp z = limn→∞ 1 + nz . 8 6 Beweis. Es reicht zu zeigen, dass 4 n X 1 k z n z − 1+ →0 k! n k=0 für n → ∞. Nun gilt für n ≥ 2, dass n n n X 1 X 1 X n z n z k k k z − 1+ z − = k k! n k! n k=0 k=0 k=0 n X n! 1 1− zk = k! (n − k)!nk k=2 n X 1 n(n − 1) · · · · · (n − k + 1) 1− |z|k ≤ k! nk k=2 k ! n X 1 n−k+1 ≤ |z|k 1− k! n k=2 k ! n X k−1 1 |z|k 1− 1− = k! n k=2 n Bernoulli X 1 k−1 ≤ 1− 1−k |z|k k! n k=2 = n X 1 k(k − 1) k |z| k! n k=2 n = 2 –8 ≤ Dabei ist e = limn→∞ 1 + Abbildung 3 zeigt den Graphen (der auf Expon Pein Intervall eingeschränkten) nentialfunktion sowie die Graphen von x 7→ nk=0 k!1 xk und x 7→ 1 + nx für n = 3. (Statt exp |R schreiben wir nur exp und nennen auch die eingeschränkte Funktion wieder Exponentialfunktion. Eine entsprechende Konvention wird auch für in späteren Abschnitten eingeführte Funktionen wie Sinus und Cosinus gelten.) Folgerung 2.9.2 exp 1 = e. 1 n n = 2, 718 . . . die in §2.3 definierte Eulersche Zahl. Satz 2.9.5 Für x ∈ R gilt exp x = ex . Aufgrund dieses Satzes setzt man ez := exp z für z ∈ C. q Beweis von Satz 2.9.5. Für p ∈ Z und q ∈ N ist exp 1q = exp q 1q = exp 1 = e, p p also exp 1q = e1/q und damit exp pq = exp 1q = e1/q = ep/q . Daraus folgt die Behauptung für alle r ∈ Q. Ist nun r ∈ R, so wähle man eine Folge (rn ) rationaler Zahlen mit rn → r. Es gilt dann nach Definition von er , dass ern → er . Ähnlich kann man (und werden wir später) zeigen, dass auch exp rn → exp r gilt. Hieraus folgt dann die Behauptung. Wir verzichten jetzt auf die Details. Satz 2.9.6 e ist irrational. Beweis. Wir nehmen an, dass e rational ist, etwa e = (q − 1)!p = q!e = q! also 1 2 |z| exp |z|. n Hieraus folgt die Behauptung. 2 Abbildung 3: Die Exponentialfunktion und approximierende Polynome. 1X 1 |z|k n k=2 (k − 2)! 1 2X 1 j |z| |z| n j! j=0 0 –2 –2 n−2 = –4 –6 S := ∞ X k=0 1 = k! ∞ X k=0 p q mit p, q ∈ N. Dann ist q ∞ X q! X q! q! = + , k! k=0 k! k=q+1 k! q ∞ X X q! q! = (q − 1)!p − ∈ N. k! k! k=q+1 k=0 Dies steht im Widerspruch zu 1 1 1 + + + ... q + 1 (q + 1)(q + 2) (q + 1)(q + 2)(q + 3) 2 3 1 1 1 + + + ... < q+1 q+1 q+1 ∞ j 1 1 X = q + 1 j=0 q + 1 S = 54 3 STETIGKEIT UND GRENZWERTE VON FUNKTIONEN 1 1 1 q + 1 1 − q+1 1 = q ≤ 1. = 3 Stetigkeit und Grenzwerte von Funktionen 3.1 55 3.1 Stetigkeit 3. Sei f : Z → C eine Funktion. Dann ist f stetig. Denn ist ξ ∈ Z und (xn ) Folge in Z mit xn → ξ, so existiert N ∈ N mit |xn − ξ| < 21 für n ≥ N. Es folgt xn = ξ und damit f (xn ) = f (ξ) für n ≥ N, also f (xn ) → ξ. Analog sieht man, dass Zahlenfolgen (also Funktionen von N nach C) stetig sind. 4. Sei f : R+ → R, ( 0 falls x irrational, f (x) = 1 falls x rational, mit x = pq , p, q ∈ N teilerfremd. q Behauptung. Die Funktion f ist stetig in irrationalen und unstetig in rationalen Zahlen. Stetigkeit Definition 3.1.1 Seien M, N ⊂ C und sei f : M → N eine Funktion. Sei ξ ∈ M. Dann heißt f stetig (englisch: continuous) in ξ, falls für jede Folge (xn ) in M mit xn → ξ gilt, dass f (xn ) → f (ξ). Für A ⊂ M heißt f stetig in A, falls f stetig in jedem Punkt von A ist. Schließlich heißt f stetig, wenn f stetig in M ist. Es genügt natürlich im folgenden, den Fall N = C zu betrachten. Aus den Sätzen aus §2.2 erhält man unmittelbar die folgenden Regeln: • Sind f, g : M → C stetig (in ξ ∈ M), so sind auch f + g, f · g und mit c ∈ C auch c · f stetig (in ξ). Falls g(ξ) 6= 0, so ist auch (die in M\g −1 (0) definierte) Funktion fg stetig in ξ. • f ist stetig (in ξ) genau dann, wenn Re f und Im f stetig (in ξ) sind. • Die durch z 7→ |z| und z 7→ z definierten Funktionen sind stetig. In §2.5 wurde gezeigt, dass für a ∈ R+ die durch x → ax definierte Funktion von R nach R+ stetig ist. Offensichtlich ist für M ⊂ C auch die Funktion idM stetig. Satz 3.1.1 Seien M, N, P, Q ⊂ C mit N ⊂ P und seien g : M → N stetig (in ξ ∈ M) und f : P → Q stetig (in g(ξ) ∈ g(M) ⊂ N ⊂ P ). Dann ist f ◦ g stetig (in ξ). Beweis. Sei (xn ) Folge in M mit xn → ξ. Da g stetig, folgt g(xn ) → g(ξ). Nun ist aber (g(xn )) Folge in P und damit folgt aus der Stetigkeit von f in g(ξ), dass f (g(xn )) → f (g(ξ)), also (f ◦ g)(xn ) → (f ◦ g)(ξ). Beispiele. 1. Die Funktion f : C → C, z 7→ |z 2 + z| ist stetig. Denn die Funktionen f1 := idC , f2 : C → C, f2 (z) = z, und f3 : C → C, f3 (z) = |z|, sind alle stetig und damit auch f1 · f1 , f1 · f1 + f2 und f = f3 ◦ (f1 · f1 + f2 ). 2. Die Funktion f : R+ → R, f (x) = x3 |x4 − 7| , (ex − 9x)2 + 11 ist stetig, da sie durch Verknüpfungen wie +, ·, ◦, . . . aus stetigen Funktionen aufgebaut ist. (Man beachte, dass der Nenner keine Nullstellen hat.) √ Beweis. Sei ξ ∈ Q. Dann ist durch xn = ξ + n2 eine Folge (xn ) in R+ \Q mit xn → ξ gegeben. Es gilt dann f (xn ) = 0 für alle n ∈ N, also f (xn ) → 0, wegen f (ξ) 6= 0 also f (xn ) 6→ f (ξ). Sei nun ξ ∈ R+ \Q und sei (xn ) Folge in R+ \Q mit xn → ξ. Zu ist, zeigen dass f (xn ) → f (ξ). Sei dazu ε ∈ R+ . Für q ∈ N sei δq := minp∈N ξ − pq . Dann gilt δq > 0 für alle q ∈ N und damit folgt δ := minq≤ 1 δq > 0. Nach Wahl von ε δ gilt für x ∈ R+ ∩ Q mit |x − ξ| < δ, dass aus x = pq mit p, q ∈ N teilerfremd q > 1ε und damit |f (x)| = 1q < ε folgt. Außerdem gilt natürlich |f (x)| = 0 < ε für x ∈ R+ \Q und damit insgesamt |f (x)| < ε für alle x ∈ R+ mit |x − ξ| < δ. Nun existiert N ∈ N mit |xn − ξ| < δ für n ≥ N. Es folgt |f (xn )| < ε für n ≥ N, also f (xn ) → 0 = f (ξ). Satz 3.1.2 Sei M ⊂ C, f : M → C und ξ ∈ M. Dann ist f stetig in ξ genau dann, wenn zu jedem ε ∈ R+ ein δ ∈ R+ existiert, so dass für jedes x ∈ M mit |x − ξ| < δ gilt, dass |f (x) − f (ξ)| < ε ist. In Quantorenschreibweise lautet die hier angegebene, zur Stetigkeit in ξ äquivalente, Bedingung wie folgt: ∀ε ∈ R+ ∃δ ∈ R+ ∀x ∈ M : |x − ξ| < δ ⇒ |f (x) − f (ξ)| < ε. Man nimmt diese Bedingung oft auch zur Definition der Stetigkeit. Beweis von Satz 3.1.2. “⇐”. Die “ε-δ-Bedingung” sei erfüllt und es sei (xn ) Folge in M mit xn → ξ. Zu zeigen ist, dass f (xn ) → f (ξ). Sei dazu ε > 0. Dann existiert δ > 0, so dass für alle x ∈ M |x − ξ| < δ ⇒ |f (x) − f (ξ)| < ε gilt. Wegen xn → ξ existiert N ∈ N mit |xn − ξ| < δ für n ≥ N. Es folgt |f (xn ) − f (ξ)| < ε für n ≥ N. “⇒”. Wir zeigen die Kontraposition und nehmen an, dass die “ε-δ-Bedingung” nicht erfüllt ist. Dann existiert ε ∈ R+ mit folgender Eigenschaft: ∀δ ∈ R+ ∃x ∈ M : |x − ξ| < δ ∧ |f (x) − f (ξ)| ≥ ε. Insbesondere existiert dann zu n ∈ N ein xn ∈ M mit |xn − ξ| < n1 und |f (xn ) − f (ξ)| ≥ ε. Es folgt xn → ξ und f (xn ) 6→ f (ξ). Damit ist f nicht stetig in ξ. 56 3.2 3 STETIGKEIT UND GRENZWERTE VON FUNKTIONEN Der Zwischenwertsatz Satz 3.2.1 (Zwischenwertsatz) Seien a, b ∈ R mit a < b und sei f : [a, b] → R stetig. Sei η ∈ R ein Wert zwischen f (a) und f (b), d. h., es gilt entweder f (a) < η < f (b) oder f (b) < η < f (a). Dann existiert ξ ∈ (a, b) mit f (ξ) = η. Beweis. Ohne Beschränkung der Allgemeinheit sei f (a) < η < f (b). Es sei M := {t ∈ [a, b] : f (t) ≤ η}. Dann ist M 6= ∅ wegen a ∈ M. Außerdem ist M durch b nach oben beschränkt und damit existiert ξ := sup M. Nun existiert eine Folge (xn ) in M mit xn → ξ. Da f stetig, folgt f (xn ) → f (ξ). Wegen f (xn ) ≤ η ergibt sich f (ξ) ≤ η, also ξ ∈ M. Wegen b ∈ / M existiert auch eine Folge (yn ) in (ξ, b] ⊃ [a, b]\M mit yn → ξ, etwa yn := ξ + b−ξ . Es folgt f (yn ) → f (ξ), wegen f (yn ) > η also f (ξ) ≥ η. n Insgesamt ergibt sich f (ξ) = η. Beispiel. Die Funktion f : R → R, x 7→ ex + x, hat eine Nullstelle in (−1, 0), d. h., es existiert ξ ∈ (−1, 0) mit f (ξ) = 0. Denn f ist stetig in R ⊃ [−1, 0] und f (−1) = e−1 − 1 < 0 und f (0) = e0 + 0 = 1 > 0. [ξ − r, ξ + r] ⊂ I. Sei nun 0 < ε ≤ r. Wir setzen δ := min{f (ξ + ε) − η, η − f (ξ − ε)}. Für y ∈ J mit |y − η| < δ gilt dann f (ξ − ε) ≤ η − δ < y < η + δ ≤ f (ξ + ε) und damit wegen der strengen Monotonie ξ − ε < f −1 (y) < ξ + ε, also |f −1 (y) − f −1 (η)| < ε. Damit ist f −1 stetig in η. Den Fall, dass ξ Randpunkt von I ist, kann man ähnlich behandeln. Ist etwa I = [ξ, b], so wählt man δ := f (ξ + ε) − η für 0 < ε ≤ b − ξ. Wir verzichten auf die Details. Beispiel. Es sei a > 1 und f : R → R+ , x 7→ ax . Dann ist f streng monoton steigend, stetig und bijektiv. Damit existiert die Umkehrfunktion und sie ist ebenfalls stetig und streng monoton steigend. Sie heißt Logarithmus zur Basis a und wird mit loga bezeichnet. Im Falle a = e nennen wir sie natürlicher Logarithmus oder einfach Logarithmus und schreiben log x oder ln x statt loge x. Der Fall 0 < a < 1 ist analog. Hier sind f und f −1 streng monoton fallend. 5 Eine andere Formulierung von Satz 3.2.1 ist die folgende: ist f : [a, b] → R stetig, so gilt [f (a), f (b)] ⊂ f ([a, b]) falls f (a) < f (b) und [f (b), f (a)] ⊂ f ([a, b]) falls f (b) < f (a). 4 3 2 Satz 3.2.2 Sei I Intervall und sei f : I → R stetig und nicht konstant. Dann ist f (I) ein Intervall. 1 Ist f konstant, so besteht f (I) aus einem Punkt. Wir haben konstante Funktionen in Satz 3.2.2 ausgeschlossen, da wir einpunktige Mengen nicht als Intervalle betrachtet haben. Beweis von Satz 3.2.2. Sei α := inf f (I) und β := sup f (I) (wobei die Werte ±∞ zugelassen sind). Dann gilt α < β, da f nicht konstant. Wir zeigen, dass (α, β) ⊂ f (I). Sei dazu η ∈ (α, β), also α < η < β. Dann existieren a, b ∈ I mit α ≤ f (a) < η < f (b) ≤ β. (Es muss nicht a < b gelten.) Nach Zwischenwertsatz existiert ξ ∈ I mit f (ξ) = η. Es folgt η ∈ f (I), also (α, β) ⊂ f (I). Da aber für η > β und η < α sicher η ∈ / f (I) gilt, ergibt sich, dass f (I) eines der vier Intervalle (α, β), [α, β), (α, β] und [α, β] ist. Beispiel. Für f : (−1, 1) → R, f (x) = x2 , gilt f ((−1, 1)) = [0, 1). Satz 3.2.3 Seien I, J Intervalle und sei f : I → J stetig und surjektiv. Ist f streng monoton steigend (bzw. fallend), so ist f bijektiv und die Umkehrfunktion f −1 : J → I ist ebenfalls stetig und streng monoton steigend (bzw. fallend). Beweis. Zunächst folgt aus der strengen Monotonie von f die Injektivität und damit die Bijektivität von f . Desweiteren sieht man unmittelbar, dass f −1 ebenfalls streng monoton ist. Wir zeigen jetzt, dass f −1 stetig ist. Ohne Beschränkung der Allgemeinheit sei f streng monoton steigend. Sei η ∈ J = f (I) und ξ := f −1 (η). Wir betrachten zunächst den Fall, dass ξ kein “Randpunkt” von I ist. Dann existiert r > 0 mit 57 3.3 Grenzwerte von Funktionen –2 –1 0 –1 1 2 3 4 5 –2 Abbildung 4: Die Graphen von exp, ln und idR . Für a, b, c ∈ R+ gilt also aloga b = b und eln c = c. Für u ∈ R+ und v ∈ R ist damit v uv = eln u = ev·ln u = exp(v · ln u). Dies zeigt einerseits, dass für a > 0 die durch x 7→ xa definierte Funktion g : R+ → R+ stetig ist. Zum anderen legt es für a ∈ R+ und z ∈ C die Definition az := exp(z · ln a) nahe. Die durch z → 7 az definierte Funktion von C nach C ist dann ebenfalls stetig. 3.3 Grenzwerte von Funktionen Definition 3.3.1 Sei M ⊂ C und ξ ∈ C. Dann heißt ξ Häufungspunkt von M, falls eine Folge (xn ) in M\{ξ} mit xn → ξ existiert. In obiger Definition ist sowohl ξ ∈ M wie auch ξ ∈ / M zugelassen. Der Begriff des Häufungspunktes (einer Menge) sollte nicht mit dem Begriff des Häufungswerts (einer Folge) verwechselt werden. 58 3 STETIGKEIT UND GRENZWERTE VON FUNKTIONEN 59 3.3 Grenzwerte von Funktionen Definition 3.3.2 Sei M ⊂ C, ξ Häufungspunkt von M und f : M → C Funktion. Wir sagen, dass f (x) für x → ξ konvergiert, falls η ∈ C existiert, so dass für jede Folge (xn ) in M\{ξ} mit xn → ξ auch f (xn ) → η gilt. Dieses η heißt dann Grenzwert von f für x → ξ und wird mit limx→ξ f (x) bezeichnet. existiert, so dass für alle x ∈ M\{ξ} mit |x − ξ| < δ die Ungleichung |f (x) − η| < ε gilt, d. h., wenn Ist in obiger Definition M ⊂ R oder f : M → R, so können wir auch uneigentliche Grenzwerte zulassen, d. h., es kann ξ = ±∞ oder η = ±∞ sein. Beispiel. Es gilt Satz 3.3.1 Sei M ⊂ C und ξ ∈ M. Weiter sei ξ Häufungspunkt von M und f : M → C eine Funktion. Dann ist f stetig in ξ genau dann, wenn limx→ξ f (x) = f (ξ). Beweis. Für z 6= 0 gilt Hierbei bedeutet limx→ξ f (x) = f (ξ) natürlich wieder, dass der Grenzwert existiert und den Wert f (ξ) hat. Falls ξ ∈ M gilt, aber ξ kein Häufungspunkt von M ist, so ist jede Funktion f : M → C stetig in ξ (denn für jede Folge (xn ) in M mit xn → ξ existiert N ∈ N mit xn = ξ falls n ≥ N). Beweis von Satz 3.3.1. “⇐”. Sei (xn ) eine Folge in M mit xn → ξ. Zu zeigen ist, dass f (xn ) → f (ξ). Dies ist trivial, falls ein N ∈ N mit xn = ξ für n ≥ N existiert. Andernfalls sei (xnk ) die Teilfolge aller xn mit xn 6= ξ. Dann ist (xnk ) Folge in M\{ξ}. Nach Voraussetzung gilt also f (xnk ) → f (ξ). Sei nun ε > 0. Dann existiert K ∈ N mit |f (xnk ) − f (ξ)| < ε für k ≥ K. Sei jetzt n ≥ nK . Existiert dann k ∈ N mit n = nk , so gilt k ≥ K und damit |f (xn ) − f (ξ)| < ε. Ist aber n 6= nk für alle k ∈ N, so gilt xn = ξ, also |f (xn ) − f (ξ)| = 0 < ε. Es folgt f (xn ) → f (ξ). “⇒”. Diese Richtung ist trivial. Satz 3.3.2 Sei M ⊂ C, ξ Häufungspunkt von M, f : M → C eine Funktion und η ∈ C. Dann ist die durch f (x) falls x ∈ M\{ξ} , F (x) = η falls x = ξ definierte Funktion F : M ∪{ξ} → C genau dann stetig in ξ, wenn limx→ξ f (x) = η gilt. Der Beweis folgt aus Satz 3.3.1, da limx→ξ F (x) = limx→ξ f (x) gilt. (Die letzte Gleichung ist dabei in dem Sinne zu verstehen, dass aus der Existenz des einen Grenzwertes die des anderen folgt, und dass die Grenzwerte dann den gleichen Wert haben.) Ist ξ ∈ / M und limx→ξ f (x) = η, so heißt die in Satz 3.3.2 definierte Funktion F stetige Ergänzung (oder stetige Fortsetzung) von f (in ξ). Für Grenzwerte von Summen, Produkten, usw. von Funktionen gelten wieder die üblichen Rechenregeln. Auch die ε-δ-Definition der Stetigkeit (angewandt auf die Funktion F von oben) überträgt sich entsprechend. Satz 3.3.3 Sei M ⊂ C, ξ Häufungspunkt von M, f : M → C eine Funktion und η ∈ M. Dann gilt limx→ξ f (x) = η genau dann, wenn für alle ε ∈ R+ ein δ ∈ R+ ∀ε ∈ R+ ∃δ ∈ R+ ∀x ∈ M\{ξ} : |x − ξ| < δ ⇒ |f (x) − η| < ε. lim z→0 1 ez − 1 = z z Es folgt ∞ X zk k=0 k! ez − 1 = 1. z −1 ! = ∞ X z k−1 k=1 k! = ∞ X j=0 zj . (j + 1)! z ∞ ∞ e − 1 X z j X |z|j = − 1 . ≤ z (j + 1)! (j + 1)! j=1 j=1 Für 0 < |z| < 1 gilt damit z ∞ X e − 1 1 ≤ |z| − 1 = |z|(e − 2). z (j + 1)! j=1 z ε Dies ergibt e z−1 − 1 < ε für |z| < min{ e−2 , 1}. Satz 3.3.4 (Cauchykriterium für Funktionengrenzwerte) Sei M ⊂ C, ξ Häufungspunkt von M und f : M → C eine Funktion. Dann existiert der Grenzwert limx→ξ f (x) genau dann, wenn für alle ε ∈ R+ ein δ ∈ R+ existiert, so dass für alle x, y ∈ M\{ξ} mit |x − ξ| < δ und |y − ξ| < δ die Ungleichung |f (x) − f (y)| < ε gilt, d. h., wenn ∀ε ∈ R+ ∃δ ∈ R+ ∀x, y ∈ M\{ξ} : |x − ξ| < δ ∧ |y − ξ| < δ ⇒ |f (x) − f (y)| < ε. Beweis. “⇒”. Sei η := limx→ξ f (x). Sei ε > 0. Nach Satz 3.3.3 existiert δ > 0, so dass |f (x)−η| < 2ε für x ∈ M \{ξ} mit |x−ξ| < δ. Für x, y ∈ M \{ξ} mit |x−ξ| < δ und |y − ξ| < δ folgt dann |f (x) − f (y)| ≤ |f (x) − f (η)| + |f (η) − f (y)| < 2ε + 2ε = ε. “⇐”. Sei (xn ) Folge in M\{ξ} mit xn → ξ. Sei ε > 0 und sei δ > 0 mit der im Satz angegebenen Eigenschaft gewählt. Dann existiert N ∈ N mit |xn − ξ| < δ für n ≥ N. Für m, n ≥ N folgt dann |f (xm ) − f (xn )| < ε. Damit ist (f (xn )) Cauchyfolge, also konvergent. Sei η := limn→∞ f (xn ). Ist nun (x′n ) eine Folge in M\{ξ} mit x′n → ξ, so existiert ebenfalls η ′ := limn→∞ f (x′n ). Da aber auch (x1 , x′1 , x2 , x′2 , x3 , x′3 , . . . ) eine Folge in M\{ξ} mit Grenzwert ξ ist, folgt η ′ = η und damit die Behauptung. Definition 3.3.3 Sei M ⊂ R, ξ Häufungspunkt von Mr := M ∩ [ξ, ∞) und f : M → C eine Funktion. Existiert dann ηr := limx→ξ (f |Mr )(x), so heißt ηr rechtsseitiger Grenzwert von f (x) für x → ξ und wird mit limx→ξ+ f (x) bezeichnet. Analog heißt limx→ξ− f (x) := limx→ξ (f |Ml )(x) linksseitiger Grenzwert von f (x) für x → ξ (falls er existiert), wobei Ml := M ∩ (−∞, ξ]. 60 3 STETIGKEIT UND GRENZWERTE VON FUNKTIONEN Ist ξ Häufungspunkt von Mr , so ist ξ auch Häufungspunkt von M. Existiert dann limx→ξ f (x), so existiert auch limx→ξ+ f (x) und die Werte sind gleich. Analoges gilt falls ξ Häufungspunkt von Ml ist. Ist ξ Häufungspunkt von Mr und Ml , so existiert limx→ξ f (x) genau dann, wenn limx→ξ+ f (x) und limx→ξ− f (x) beide existieren und gleich sind. In diesem Falle gilt limx→ξ f (x) = limx→ξ+ f (x) = limx→ξ− f (x). Definition 3.3.4 Sei M ⊂ R, ξ ∈ M und f : M → C eine Funktion. Seien Mr und Ml wie in Definition 3.3.3. Dann heißt f rechtsseitig stetig in ξ falls f |Mr stetig in ξ ist und linksseitig stetig in ξ falls f |Ml stetig in ξ ist. Ist ξ Häufungspunkt von Mr bzw. Ml , so erhält man aus Satz 3.3.1 unmittelbar, dass f genau dann rechts- bzw. linksseitig stetig in ξ ist, wenn limx→ξ+ f (x) = f (ξ) bzw. limx→ξ− f (x) = f (ξ). Weiter sieht man leicht ein, dass f genau dann stetig in ξ ist, wenn f rechtsund linksseitig stetig in ξ ist. Beispiel. Sei f : R → R, f (x) = ( ex −1 falls x < 0 , e falls x ≥ 0. √x x 3.4 Trigonometrische und hyperbolische Funktionen 61 Die Potenzreihendarstellung des Cosinus erhält man wie folgt. Zunächst ist ! ∞ ∞ ∞ X 1 X 1 n n X 1 11 n cos z = i z + (−i)n z n = ([i + (−i)n ]) z n 2 n=0 n! n! n! 2 n=0 n=0 Für n ungerade folgt 21 (in + (−i)n) = 0. Für n gerade, etwa n = 2k, k ∈ N0 , folgt 1 n (i + (−i)n ) = 12 (−1)k + (−1)k = (−1)k . Es ergibt sich 2 cos z = ∞ X (−1)k k=0 (2k)! 1 1 z 2k = 1 − z 2 + z 4 − . . . . 2 24 Analog folgt sin z = ∞ X 1 1 5 (−1)k 2k+1 z = z − z3 + z − .... (2k + 1)! 6 120 k=0 Insbesondere folgt, dass für x ∈ R auch cos x ∈ R und sin x ∈ R gilt. Weiter ist für x ∈ R auch Re (eix ) = cos x, Im (eix ) = sin x und |eix | = 1. Es ist leicht zu sehen, dass f stetig in R\{0} ist. Außerdem gilt limx→0− f (x) = 1 wegen des Beispiels nach Satz 3.3.3 und limx→0+ f (x) = f (0) = e0 = 1 da f |[0, ∞) stetig ist. Es folgt, dass f stetig in 0 ist. Insgesamt ist f also stetig (in R). 3.4 Trigonometrische und hyperbolische Funktionen Definition 3.4.1 Die durch cos z := 21 (eiz + e−iz ) und sin z := nierten Funktionen von C nach C heißen Cosinus und Sinus. 1 2i (eiz − e−iz ) defi- Da exp stetig ist, sind nach §3.1 auch cos und sin stetig. Wir stellen einige einfache Eigenschaften zusammen (dabei sind im folgenden immer z, w ∈ C): cos 0 = 1, sin 0 = 0, cos(−z) = cos z, sin(−z) = − sin z. z+w Aus e Abbildung 5: Die Graphen des (auf R eingeschränkten) Sinus und Cosinus. z w = e e erhält man mit kurzer Rechung die Additionstheoreme cos(z + w) = cos z cos w − sin z sin w, sin(z + w) = sin z cos w + cos z sin w. Mit w = −z folgt insbesondere cos2 z + sin2 z = 1. (Hierbei steht cos2 z für (cos z)2 .) Weiterhin gilt 1 iz 1 iz e + e−iz + i e − e−iz = eiz . cos z + i sin z = 2 2i Satz 3.4.1 Für x ∈ [0, 2] gilt 1 1 1 1 − x2 ≤ cos x ≤ 1 − x2 + x4 2 2 24 und 1 x − x3 ≤ sin x ≤ x. 6 Insbesondere gilt cos 1 > 0, cos 2 < 0 und sin x > 0 für alle x ∈ (0, 2]. Beweis. Sei x ∈ [0, 2]. Für k ∈ N sei ck := ck+1 = x2k . (2k)! Dann gilt x2k+2 x2k x2k 4 1 x2 = ≤ = ck ≤ ck . (2k + 2)! (2k)! (2k + 1)(2k + 2) (2k)! 3 · 4 3 Die Folge (ck ) ist also monoton fallend. Außerdem konvergiert sie gegen 0. Das P∞ k Leibnizkriterium liefert nun einerseits, dass die Reihe k=1 (−1) ck konvergiert, und andererseits, dass für die Summe s der Reihe und die Partialsummen sn die 62 3 STETIGKEIT UND GRENZWERTE VON FUNKTIONEN 63 3.4 Trigonometrische und hyperbolische Funktionen Ungleichung s1 ≤ s ≤ s2 gilt. Die Konvergenzaussage ist nun nicht neu, denn wir kennen ja sogar schon die Summe s = cos x − 1 der Reihe. Wir benutzen aber jetzt die Ungleichung für die Partialsummen und erhalten Satz 3.4.4 Es ist cos π2 = 0, sin π2 = 1 und für z ∈ C gilt sin z + π2 = cos z, cos z + π2 = − sin z, sin (z + π) = − sin z, cos (z + 2π) = cos z, sin (z + 2π) = sin z und ez+2πi = ez . 1 1 1 1 − x2 = 1 + s1 ≤ 1 + s = cos x ≤ 1 + s2 = 1 − x2 + x4 . 2 2 24 Beweis. Nach Definition von π gilt cos π2 = 0. Wegen cos2 π2 + sin2 π2 = 1 und sin π2 > 0 folgt hieraus sin π2 = 1. Für z ∈ C ist π π π = sin z cos + cos z sin = cos z. sin z + 2 2 2 π Analog beweist man cos z + 2 = − sin z. Hieraus folgen die weiteren Gleichungen leicht. Bei der letzten benutze man ez = cos zi + i sin zi . Die Abschätzung für sin x erhält man analog. Die Behauptungen cos 1 > 0, cos 2 < 0 und sin x > 0 für alle x ∈ (0, 2] folgen unmittelbar aus den Abschätzungen für cos x und sin x. Die Graphen des Cosinus und Sinus sowie der in Satz 3.4.1 auftretenden Teilsummen der Potenzreihen sind in Abbildung 6 dargestellt. 2 2 1 1 0 –1 0.5 1 1.5 2 2.5 3 0 0.5 1 1.5 2 2.5 3 –1 Da der Cosinus im Intervall [0, π2 ] streng monoton fallend ist und cos2 x + sin2 x und sin x ≥ 0 für 0 ≤ x ≤ π2 gilt, folgt, dass der Sinus in diesem Intervall streng monoton steigend ist. Wegen sin 0 = 0 und sin(−x) = − sin x folgt, dass der Sinus sogar im Intervall [− π2 , π2 ] streng monoton steigend ist. Wegen sin −π2 = −1 und sin π2 = 1 ist damit durch x 7→ sin x eine bijektive Funktion von − π2 , π2 nach [−1, 1] definiert; vgl. Satz 3.2.3. Ihre Umkehrfunktion heißt Arcus Sinus und wird mit arcsin bezeichnet, also arcsin : [−1, 1] → − π2 , π2 , mit sin(arcsin(x)) = x für x ∈ [−1, 1] –2 und –2 Abbildung 6: Cosinus (links), Sinus (rechts) und Teilsummen der Potenzreihen. Satz 3.4.2 Der Cosinus ist im Intervall [0, 2] streng monoton fallend, d. h., die Funktion cos |[0, 2] ist streng monoton fallend. Beweis. Sei 0 ≤ x < y ≤ 2. Mit s := (y + x)/2 und t := (y − x)/2 gilt x = s − t und y = s + t sowie 0 < s < 2 und 0 < t < 2. Wegen cos(−x) = cos x und sin(−x) = − sin x folgt aus dem Additionstheorem h π πi arcsin(sin(x)) = x für x ∈ − , . 2 2 π π Man beachte, dass die letzte Gleichung nicht für x ∈ R\ − 2 , 2 gilt. Aus Satz 3.2.3 folgt, dass arcsin stetig ist. Ähnlich sieht man, dass der Cosinus sogar auf dem Intervall [0, π] streng monoton fallend ist. Durch x 7→ cos x wird also eine bijektive Funktion von [0, π] nach [−1, 1] definiert. Ihre Umkehrfunktion heißt Arcus Cosinus und wird mit arccos bezeichnet. 3 cos y − cos x = cos(s + t) − cos(s − t) = cos s cos t − sin s sin t − (cos s cos(−t) − sin s sin(−t)) = −2 sin s sin t. Nach Satz 3.4.1 gilt sin s > 0 und sin t > 0 und damit cos y < cos x. Satz 3.4.3 Der Cosinus hat im Intervall [0, 2] genau eine Nullstelle ξ. Es gilt 1 < ξ < 2. Beweis. Da cos 1 > 0 und cos 2 < 0 folgt die Existenz einer Nullstelle ξ aus dem Zwischenwertsatz. Die Eindeutigkeit folgt aus der strengen Monotonie. arccos 2 1 –1 0 1 arcsin –1 Abbildung 7: Die Graphen des Arcus Sinus und Arcus Cosinus. Wir benutzen jetzt obigen Satz zur Definition der “Kreiszahl” π. Definition 3.4.2 Die Zahl π ist definiert durch π := 2ξ, wobei ξ die Nullstelle des Cosinus aus Satz 3.4.3 ist. Zur Definition von zwei weiteren Funktionen Tangens und Cotangens benötigen wir noch folgenden Satz. 64 3 STETIGKEIT UND GRENZWERTE VON FUNKTIONEN 8 Satz 3.4.5 Sei z ∈ C. Es gilt cos z = 0 genau dann, wenn k ∈ Z mit z = π2 + kπ existiert, und es gilt sin z = 0 genau dann, wenn k ∈ Z mit z = kπ existiert. cosh Die Funktionen tan und cot sind stetig. Für z aus dem entsprechenden Definitionsbereich gilt − sin z sin(z + π) = = tan z tan(z + π) = cos(z + π) − cos z und analog cot(z + π) = cot z. Viele weitere Eigenschaften von Tangens und Cotangens lassen sich leicht aus denen von Cosinus und Sinus ableiten. Insbesondere sieht man leicht, dass der Tangens streng monoton steigend im Intervall (− π2 , π2 ) ist und dieses Intervall auf R abbildet. Die Umkehrfunktion heißt Arcus Tangens und wird mit arctan bezeichnet. Es gilt also arctan : R → (− π2 , π2 ). Schließlich ist der Cotangens streng monoton fallend im Intervall (0, π) und er bildet dieses Intervall auf R ab. Die Umkehrfunktion heißt Arcus Cotangens und wird mit arccot bezeichnet. 3 2 arctan cot –1 0 2 –3 –2 –1 0 tanh 1 2 3 –2 –4 sinh –6 –8 Abbildung 9: Die Graphen der hyperbolischen Funktionen. Die in Definition 3.4.1 und 3.4.3 definierten Funktionen heißen trigonometrische Funktionen. Die in Definition 3.4.4 definierten Funktionen heißen hyperbolische Funktionen. Auch die hyperbolischen Funktionen sind wieder stetig. Es gilt cosh z = cos iz, sinh z = −i sin iz, tanh z = −i tan iz und coth z = i cot iz. Wir verzichten hier auf eine Diskussion der Umkehrfunktionen der (auf geeignete Intervalle eingeschränkten) hyperbolischen Funktionen. Diese werden Area sinus hyperbolicus, Area cosinus hyperbolicus, usw., genannt und mit arsinh, arcosh, artanh, arcoth bezeichnet. 3.5 Polarkoordinaten Mit Hilfe der Umkehrfunktionen der trigonometrischen Funktionen kann man folgenden Satz beweisen. Satz 3.5.1 Sei z ∈ C \ {0}. Dann existiert genau ein ϕ ∈ (−π, π] mit z = |z|eiϕ . tan 1 –2 coth 3 2 –3 6 4 Beweis. “⇐”. Dies ist klar nach Satz 3.4.4 “⇒”. Sei cos z = 0, z = x + iy, x, y ∈ R. Nach Definition des Cosinus folgt dann 2 eiz = −e−iz = − e1iz , also (eiz ) = 1, insbesondere |eiz | = 1. Wegen |eiz | = |eix−y | = ix −y ix −y −y |e e | = |e | e = e folgt e−y = 1, also y = 0. Damit ist z = x ∈ R. Sei nun k := max{j ∈ Z : jπ ≤ x} und t := x − kπ. Dann gilt 0 ≤ t < π und cos t = − cos(t + π) = cos(t + 2π) = · · · = (−1)k cos(t + kπ) = (−1)k cos x = 0. Nach Definition von π folgt t ≥ π2 . Wegen cos(π − t) = − cos(−t) = − cos t = 0 folgt aber auch π − t ≥ π2 , insgesamt also t = π2 und damit x = π2 + kπ. Die entsprechende Aussage für den Sinus folgt wegen sin z = − cos z + π2 . sin z cos z Definition π 3.4.3 Die durch tan z := cos z und cot z := sin z definierten Funktionen tan : C\ 2 + kπ : k ∈ Z → C und cot : C\ {kπ : k ∈ Z} → C heißen Tangens und Cotangens. 65 3.5 Polarkoordinaten 1 1 2 3 arccot 2 –1 –4 –2 4 –2 –1 –3 Abbildung 8: Der Tangens, Cotangens und ihre Umkehrfunktionen. Definition 3.4.4 Die durch cosh z := 21 (ez + e−z ), sinh z := 12 (ez − e−z ), sowie sinh z cosh z tanh z := cosh und z := Funktionen cosh : C → C, sinh : z sinh z definierten coth π C → C, tanh : C\ i 2 + kπ : k ∈ Z → C und coth : C\ {ikπ : k ∈ Z} → C heißen Cosinus hyperbolicus, Sinus hyperbolicus, Tangens hyperbolicus und Cotangens hyperbolicus. Beweis. Sei z/|z| = u + iv mit u, v ∈ R. Dann gilt u2 + v 2 = 1 und daher |u| ≤ 1 und |v| ≤ 1. Wir setzen ψ := arccos u und ϕ := ψ falls v ≥ 0 und ϕ := −ψ falls v < 0. Nun gilt cos ϕ = cos ψ = u. Außerdem gilt sin2 ψ = 1 − cos2 ψ = 1 − u2 = v 2 und daher sin ψ = | sin ψ| = |v|. (Man beachte, dass sin ψ ≥ 0 wegen 0 ≤ ψ ≤ π.) Dies liefert sin ϕ = v. Es folgt z = |z|(u + iv) = |z|(cos ϕ + i sin ϕ) = |z|eiϕ . Umgekehrt folgt aus eiϕ = u + iv mit u, v ∈ R sofort dass cos ϕ = u, und hieraus folgt leicht, dass ϕ = arccos u falls ϕ ∈ [0, π] und ϕ = − arccos u sonst. Damit ist also ϕ eindeutig bestimmt. Man nennt dies die Darstellung z = |z|eiϕ = |z|(cos ϕ + i sin ϕ) aus Satz 3.5.1 die Polarkoordinatendarstellung von z und nennt ϕ das Argument von z. 66 3 STETIGKEIT UND GRENZWERTE VON FUNKTIONEN Die Polarkoordinaten liefern eine geometrische Interpretation der Multiplikation i(t1 +t2 ) komplexer Zahlen: mit z1 = r1 eit1 und z2 √ = r2 eit2 ist z1 z2 = r√ . Im 1 r2 e Abbildung 10 etwa ist z1 = 2eiπ/3 = 1 + i 3, z2 = 23 eiπ/4 = 43 2(1 + i) und z1 z2 = 3ei7π/12 . 3.6 Kompakte Mengen 67 Beweis. Sei (xn ) Folge in [a, b]. Nach dem Satz von Bolzano-Weierstraß hat (xn ) eine konvergente Teilfolge, etwa xnk → x. Nach Satz 2.2.4 (man vgl. den im Anschluss an Satz 2.2.4 betrachteten Spezialfall) folgt a ≤ x ≤ b, das heißt, x ∈ [a, b]. Beispiel 2. Für R > 0 ist {z ∈ C : |z| ≤ R} kompakt. Der Beweis ist analog zu Beispiel 1, wenn man noch Satz 2.2.3 beachtet. Beispiel 3. A := n1 : n ∈ N ist nicht kompakt, da n1 Folge in A, n1 → 0, aber 0∈ / A. Es ist aber A ∪ {0} kompakt. Beispiel 4. Endliche Teilmengen von C sind kompakt. Satz 3.6.1 Kompakte Mengen sind beschränkt. Beweis. Sei K ⊂ C kompakt. Wir nehmen an, dass K nicht beschränkt ist. Dann existiert zu jedem n ∈ N ein xn ∈ K mit |xn | > n. Es ist dann jede Teilfolge von (xn ) unbeschränkt und damit divergent. Also hat (xn ) keine konvergente Teilfolge, ein Widerspruch. Satz 3.6.2 Kompakte Teilmengen von R haben ein Minimum und ein Maximum. Abbildung 10: Geometrische Interpretation der Multiplikation komplexer Zahlen. Satz 3.5.2 Für n ∈ N hat die Gleichung z n = 1 genau n Lösungen, nämlich z = ωk := exp(2πik/n), wobei k ∈ {0, 1, 2, . . . , n − 1}. Beweis. Wegen ωkn = (exp(2πik/n))n = exp(2πi) = 1 leisten die ωk das Verlangte. Da ein Polynom vom Grad n nicht mehr als n Nullstellen haben kann, folgt die Behauptung. Bemerkung. Die ωk heißen n-te Einheitswurzeln. Wir können jetzt Satz 1.9.1 über die Existenz von Quadratwurzeln wie folgt verallgemeinern. Satz 3.5.3 Sei w ∈ C \ {0} und n ∈ N. Dann hat die Gleichung z n = w eine Lösung. Ist ζ eine Lösung, so ist {ζω0, ζω1, . . . , ζωn−1} die Lösungsmenge der Gleichung. Beweis. Sei K ⊂ R kompakt. Nach Satz 3.6.1 ist K beschränkt und damit existiert sup K ∈ R. Desweiteren existiert eine Folge (xn ) in K mit xn → sup K. Da K kompakt ist, folgt sup K ∈ K, das heißt, K hat ein Maximum. Analog sieht man, dass K ein Minimum hat. Satz 3.6.3 Sei K ⊂ C kompakt und sei f : K → C stetig. Dann ist f (K) kompakt. Beweis. Sei (yn ) Folge in f (K). Dann existiert eine Folge (xn ) ∈ K mit f (xn ) = yn für alle n ∈ N. Da K kompakt, existiert eine Teilfolge (xnk ) und ξ ∈ K mit xnk → ξ. Da f stetig in ξ, folgt ynk = f (xnk ) → f (ξ) ∈ f (K). Ist K ⊂ M ⊂ C und f : M → C stetig in K, so ist auch f |K stetig; vgl. Übung. Für kompaktes K kann dann Satz 3.6.3 auf f |K angewandt werden, und man erhält, dass f (K) kompakt ist. Eine analoge Bemerkung gilt für den folgenden Satz. Satz 3.6.4 Sei K ⊂ C kompakt und sei f : K → R stetig. Dann nimmt f auf K sein Minimum und Maximum an, d. h., es existieren α, β ∈ K mit f (α) = min f (K) und f (β) = max f (K). Beweis. Nach Satz p 3.5.1 existiert ϕ ∈ [−π, π) mit w = |w|eiϕ . Damit erhalten wir eine Lösung ζ := n |w|eiϕ/n . Dass die Lösungsmenge die angegebene Form hat, folgt leicht aus Satz 3.5.1. Beweis. Es ist f (K) kompakt nach Satz 3.6.3 und damit folgt die Behauptung aus Satz 3.6.2. 3.6 Mit Hilfe von Satz 3.5.3 und Satz 3.6.4 können wir einen Beweis des Fundamentalsatzes der Algebra (Satz 1.9.2) geben. Kompakte Mengen Definition 3.6.1 Sei K ⊂ C. Dann heißt K kompakt, falls jede Folge in K eine konvergente Teilfolge besitzt, deren Grenzwert in K liegt. Beispiel 1. Abgeschlossene Intervalle sind kompakt, d. h., sind a, b ∈ R mit a < b, so ist das Intervall [a, b] kompakt. Beweis des Fundamentalsatzes der Algebra. Sei n ∈ N und sei p ein Polynom vom P Grad n, etwa p(z) = nj=0 aj z j mit a0 , a1 , . . . , an ∈ C, an 6= 0. Wir können ohne Beschränkung der Allgemeinheit an = 1 annehmen. Wir werden zuerst zeigen, die Funktion |p| ihr Minimum in einem Punkt z1 annimmt, und wir zeigen dann, dass p(z1 ) = 0 gilt. 68 3 STETIGKEIT UND GRENZWERTE VON FUNKTIONEN Dazu wählen wir ( n−1 X R > max 2 |aj |, 1 j=0 Für t ∈ (0, δ) gilt dann ) |h(t)| ≤ tℓ+1 und betrachten K := {z ∈ C : |z| ≤ R}. Dann ist K kompakt. Nach Satz 3.6.4 nimmt |p| sein Minimum in K in einem Punkt z1 ∈ K an. Für |z| ≥ R gilt nun n−1 X |p(z)| ≥ |z n | − ≥ Rn − j=0 n−1 X j=0 = Rn−1 > Rn−1 R− n−1 X j=0 j=0 j=0 |aj | ! |aj | ≥ |a0 | = |p(0)| ≥ |p(z1 )| j=ℓ Nach Satz 3.5.3 existiert nun ζ ∈ C \ {0} mit ζ ℓ = −1/aℓ . Wir erhalten p(ζt) = b0 1 − tℓ + h(t) h(t) := Sei δ := Definition 3.6.2 Sei M ⊂ C und f : M → C. Dann heißt f gleichmäßig stetig falls zu jedem ε ∈ R+ ein δ ∈ R+ existiert, so dass für alle x, y ∈ M mit |x − y| < δ gilt, dass |f (x) − f (y)| < ε ist. Für K ⊂ M heißt f gleichmäßig stetig in K (oder auf K), falls f |K gleichmäßig stetig ist. In Quantorenschreibweise lautet die in der Definition angegebene Eigenschaft wie folgt: ∀ε ∈ R+ ∃δ ∈ R+ ∀x, y ∈ M : |x − y| < δ ⇒ |f (x) − f (y)| < ε. Zum Vergleich betrachten wir noch einmal die ε-δ-Definition der Stetigkeit im Punkte x (Satz 3.1.2): Es folgt |z1 | < R und |p(z1 )| = minz∈C |p(z)|. Wir zeigen nun, dass p(z1 ) = 0 gilt. Dazu können wir ohne Beschränkung der Allgemeinheit annehmen, dass z1 = 0 gilt, da wir andernfalls das durch q(z) := p(z + z1 ) definierte Polynom q statt p betrachten können. (Man überzeugt sich leicht, dass q tatsächlich ein Polynom ist.) Sei ℓ := min{j ∈ {1, 2, . . . , n} : aj 6= 0}. Mit aj := aj /a0 erhalten wir ! n X p(z) = a0 1 + cj z j . mit |p(ζt)| = |a0 1 − tℓ + h(t) | < |a0 | = |p(0)|. Da |p| sein Minimum in z1 = 0 annimmt, ist dies ein Widerspruch. |aj | n−1 X 1 − tℓ + h(t) ≤ Re 1 − tℓ + h(t) + Im 1 − tℓ + h(t) Wir erhalten |aj |Rj n−1 X und damit n n X X cj cj 1 ℓ ≤ tℓ δ < t ζj ζj 2 j=ℓ+1 j=ℓ+1 = 1 − tℓ + Re h(t) + Im h(t) ≤ 1 − tℓ + 2|h(t)| < 1. |aj z j | ≥ Rn − Rn−1 69 3.6 Kompakte Mengen n X cj j t. j ζ j=ℓ+1 1 . n X cj +1 2 ζj j=ℓ+1 ∀ε ∈ R+ ∃δ ∈ R+ ∀y ∈ M : |x − y| < δ ⇒ |f (x) − f (y)| < ε. Im Unterschied zur gleichmäßigen Stetigkeit darf δ hier also nicht nur von ε, sondern auch noch von x abhängen. Insbesondere erkennt man, dass aus der gleichmäßigen Stetigkeit die Stetigkeit folgt. (Aus der gleichmäßigen Stetigkeit von f in K folgt aber nicht die Stetigkeit von f in K, sondern nur die von f |K.) Beispiel. Sei f : R → R, x 7→ x2 . Dann ist f stetig, aber nicht gleichmäßig stetig in R. Denn ist ε = 1 und δ > 0, so gilt für y := 1δ und x := y + δ2 , dass |x − y| = 2δ < δ, aber 1 δ 2 1 2 δ2 − + > 1 = ε. |f (x) − f (y)| = =1+ δ 2 δ 4 Satz 3.6.5 Sei K ⊂ C kompakt und f : K → C stetig. Dann ist f gleichmäßig stetig. Beweis. Wir nehmen an, dass f nicht gleichmäßig stetig ist. Dann existiert ε ∈ R+ mit folgender Eigenschaft: ∀δ ∈ R+ ∃x, y ∈ K : |x − y| < δ ∧ |f (x) − f (y)| ≥ ε. Insbesondere existieren zu jedem n ∈ N damit xn , yn ∈ K mit |xn − yn | < n1 und |f (xn ) − f (yn )| ≥ ε. Da K kompakt, existiert eine Teilfolge (xnk ) von (xn ) und ξ ∈ K mit xnk → ξ. Wegen |xn − yn | < n1 folgt auch ynk → ξ. Wegen der Stetigkeit von f folgt f (xnk ) → f (ξ) und f (ynk ) → f (ξ), also f (xnk ) − f (ynk ) → 0, im Widerspruch zu |f (xnk ) − f (ynk )| ≥ ε. 70 3 STETIGKEIT UND GRENZWERTE VON FUNKTIONEN 3.7 Folgen stetiger Funktionen n Wir betrachten für n ∈ N die Funktionen fn : [0, 1] → R, x 7→ x . Dann gilt fn (x) → f (x) für alle x ∈ [0, 1], wobei f : [0, 1] → R, 0 falls 0 ≤ x < 1, f (x) = 1 falls x = 1. Es ist hier f unstetig, aber alle fn sind stetig. Definition 3.7.1 Sei M ⊂ C, f : M → C und sei (fn ) eine Folge von Funktionen von M nach C. Dann heißt (fn ) punktweise konvergent gegen f , falls fn (x) → f (x) für alle x ∈ M gilt, d. h., falls ∀x ∈ M∀ε ∈ R+ ∃N ∈ N∀n ≥ N : |fn (x) − f (x)| < ε. Die Folge (fn ) heißt gleichmäßig konvergent gegen f , falls für alle ε ∈ R+ ein N ∈ N existiert, so dass für alle x ∈ M und für alle n ∈ N mit n ≥ N die Abschätzung |fn (x) − f (x)| < ε gilt, d. h. falls ∀ε ∈ R+ ∃N ∈ N∀x ∈ M∀n ≥ N : |fn (x) − f (x)| < ε. Wir schreiben auch fn → f gleichmäßig (bzw. punktweise). Für K ⊂ M heißt f gleichmäßig (bzw. punktweise) konvergent in K, falls f |K gleichmäßig (bzw. punktweise) konvergiert. Der Unterschied zwischen den beiden Konvergenzbegriffen ist, dass bei punktweiser Konvergenz die Zahl N nicht nur von ε, sondern auch von x abhängen darf, während sie bei gleichmäßiger unabhängig von x gewählt werden kann. Seien fn , f, gn , g : M → C und c ∈ C. Aus den Rechenregeln für Grenzwerte folgt unmittelbar, dass aus der punktweisen Konvergenz von (fn ) gegen f und der der punktweisen Konvergenz von (gn ) gegen g auch die punktweise Konvergenz von (fn + gn ) gegen f + g, die von (cfn ) gegen cf und die von (fn · gn ) gegen f · g folgt. Die dortigen Beweise zeigen, dass aus der der gleichmäßigen Konvergenz von (fn ) gegen f und (gn ) gegen g auch die gleichmäßige Konvergenz von (fn + gn ) gegen f + g und die von (cfn ) gegen cf folgt. Das entsprechende Resultat für (fn · gn ) gilt nicht, wie das Gegenbeispiel fn , gn : R → R, fn (x) = x, gn (x) = x + n1 zeigt. Die entsprechende Aussage gilt aber, falls f und g beschränkt sind. Den folgenden Satz beweist man genauso wie bei Zahlenfolgen (vgl. Satz 2.3.5). Satz 3.7.1 (Cauchykriterium für Funktionenfolgen) Sei M ⊂ C und sei (fn ) eine Folge von Funktionen von M nach C. Dann konvergiert (fn ) genau dann gleichmäßig, wenn für alle ε ∈ R+ ein N ∈ N existiert, so dass für alle x ∈ M und für alle m, n ∈ N mit n ≥ N und m ≥ N die Abschätzung |fm (x) − fn (x)| < ε gilt, d. h. falls ∀ε ∈ R+ ∃N ∈ N∀x ∈ M∀m, n ∈ N : m ≥ N ∧ n ≥ N ⇒ |fm (x) − fn (x)| < ε. Satz 3.7.2 Sei M ⊂ C, f : M → C und sei (fn ) eine Folge von Funktionen von M nach C. Es gelte fn → f gleichmäßig. Sind dann alle fn stetig (in ξ ∈ M), so ist f stetig (in ξ ∈ M). 71 3.7 Folgen stetiger Funktionen Beweis. Sei ξ ∈ M und seien alle fn stetig in ξ. Zu zeigen ist, dass f stetig in ξ ist. Sei dazu ε > 0. Da fn → f gleichmäßig, existiert N ∈ N mit |fn (x) − f (x)| < 3ε für alle n ≥ N. Da fN stetig in ξ, existiert δ > 0 mit |fN (x) − fN (ξ)| < 3ε für alle x ∈ M mit |x − ξ| < δ. Es folgt für x ∈ M mit |x − ξ| < δ, dass |f (x) − f (ξ)| = |f (x) − fN (x) + fN (x) − fN (ξ) + fN (ξ) − f (ξ)| = |f (x) − fN (x)| + |fN (x) − fN (ξ)| + |fN (ξ) − f (ξ)| ε ε ε + + < 3 3 3 = ε. Definition 3.7.1, Satz 3.7.2 sowie obige Bemerkungen gelten analog für Reihen (denn diese sind ja nichts anderes als Folgen). ∈ N und ist die Reihe P∞Sind also etwa die Funktionen fk : M → C stetig für alle k P ∞ k=1 fk gleichmäßig konvergent, so ist auch die durch x 7→ k=1 fk (x) definierte Funktion von M nach C stetig. Insbesondere erhält man auch den folgenden Satz (vgl. Satz 2.6.4). Satz 3.7.3 (Cauchykriterium für Funktionenreihen) Sei MP⊂ C und sei (fk ) eine Folge von Funktionen von M nach C. Dann konvergiert ∞ k=1 fk genau dann gleichmäßig, wenn m X fk (x) < ε. ∀ε ∈ R+ ∃N ∈ N∀x ∈ M∀m, n ∈ N : m > n ≥ N ⇒ k=n+1 Satz 3.7.4 (Majorantenkriterium) P∞ Sei M ⊂ C und sei (fk ) eine Folge von Funktionen von M nach C. Sei k=1 ck eine konvergente Reihe nichtnegativer reeller Zahlen. Existiert dann L ∈ N mit |fk (x)| ≤ ck für alle k ≥ L und alle P x ∈ M, so konvergiert ∞ k=1 fk gleichmäßig. Pm P Beweis. Sei ε > 0. Da ∞ k=n+1 ck < ε k=1 ck konvergiert, existiert N ∈ N mit für m > n ≥ N. Es folgt m m m X X X fk (x) ≤ |fk (x)| ≤ ck < ε k=n+1 k=n+1 k=n+1 für m > n ≥ max{N, L} und x ∈ M. Die Behauptung folgt aus dem Cauchykriterium für Funktionenreihen. Wir bezeichnen die ε-Umgebung eines Punktes a mit U(a, ε), d. h., U(a, ε) := {z ∈ C : |z − a| < ε}. Es ist also U(a, ∞) := C. P k Satz 3.7.5 Sei ∞ k=0 ak (z − z0 )PPotenzreihe mit Konvergenzradius r. Es sei 0 < k r ≤ ∞. Dann ist die durch z 7→ ∞ k=0 ak (z −z0 ) definierte Funktion f : U(z0 , r) → C stetig. Ist 0 < ρ < r, so konvergiert die Potenzreihe gleichmäßig in U(z0 , ρ). Beweis. Es genügt die zweite Aussage zu beweisen, da hieraus die erste leicht mit Satz 3.7.2 folgt. 72 4 DIFFERENZIERBARKEIT p Sei dazu 0 < ρ < s < r. Dann gilt lim supk→∞ k |ak | < 1s . Damit existiert p K ∈ N mit k |ak | ≤ 1s für k ≥ K. Für z ∈ U(z0 , ρ) und k ≥ K folgt damit k ρ k 1 k k ρk = . ak (z − z0 ) = |ak | · |z − z0 | ≤ s s Die Behauptung folgt nun mit ck := ρ k s aus Satz 3.7.4. Zum Beispiel folgt aus obigem Satz, dass die Funktion exp : C → C stetig ist. (Dies wurde bereits im Beweis von Satz 2.9.5 benutzt.) Allgemeiner sieht man, dass für a ∈ R+ die durch z 7→ az := exp(z · ln a) definierte Funktion von C nach C stetig ist. 4 4.1 Differenzierbarkeit Definition 4.1.1 Sei M ⊂ R, f : M → C und ξ ∈ M Häufungspunkt von M. Dann heißt f differenzierbar in ξ, wenn lim 73 schreiben. Beispiel 1. Sei n ∈ N0 , f : R → R, f (x) = xn . Behauptung. Die Funktion f ist differenzierbar und f ′ (x) = nxn−1 für x ∈ R. Beweis. Für x, h ∈ R, h 6= 0, ist n f (x + h) − f (x) (x + h)n − xn X n n−k k−1 n n−2 x h+ . . . , x h = nxn−1 + = = 2 h h k k=1 und daraus folgt für h → 0 die Behauptung. Beispiel 2. Sei a ∈ C, f : R → C, f (x) = eax (= exp ax). Behauptung. Die Funktion f ist differenzierbar und f ′ (x) = aeax für x ∈ R. Beweis. Für x, h ∈ R, h 6= 0, ist eax+ah − eax eax eah − eax eah − 1 f (x + h) − f (x) = = = aeax . h h h ah Definition und grundlegende Eigenschaften x→ξ 4.1 Definition und grundlegende Eigenschaften f (x) − f (ξ) x−ξ existiert. Dieser Grenzwert heißt dann Ableitung von f in ξ (oder an der Stelle ξ). df Er wird mit f ′ (ξ) oder dx (ξ) bezeichnet. Ist M ′ die Menge der Häufungspunkte von M, in denen f differenzierbar ist, so wird durch x 7→ f ′ (x) eine Funktion f ′ : M ′ → C definiert, die Ableitung von f . df bezeichnet. Diese wird auch mit dx Ist A ⊂ M, so heißt f differenzierbar in A falls A ⊂ M ′ . Ist M ′ = M, so heißt f differenzierbar. Bemerkungen. 1. Für f ′ bzw. f ′ (x) wird auch die (etwas problematische) Bezeich(x) nung dfdx verwandt. 2. Die Idee ist (für reellwertiges f ) natürlich folgende: durch f (x) − f (ξ) x−ξ ist die Steigung der Sekante durch die Punkte (x, f (x)) und (ξ, f (ξ)) gegeben, und im Grenzwert x → ξ sollte man die Steigung der Tangente an den Graph von f im Punkte (ξ, f (ξ)) erhalten. Durch x 7→ f (ξ) + f ′ (ξ)(x − ξ) ist dann die Tangente an den Graphen von f im Punkte (ξ, f (ξ)) gegeben. 3. Auch bei Funktionen f : M → R sind in Definition 4.1.1 uneigentliche Grenzwerte (also f ′ (ξ) = ±∞) nicht zugelassen. 4. Man kann den Grenzwert in Definition 4.1.1 auch in der Form f (ξ + h) − f (ξ) lim h→0 h z Wegen limz→0 e z−1 = 1 (vgl. §3.3) folgt die Behauptung. Satz 4.1.1 Sei M ⊂ R, f : M → C und ξ ∈ M Häufungspunkt von M. Dann ist f genau dann differenzierbar in M, wenn eine in ξ stetige Funktion q : M → C mit f (x) = f (ξ) + q(x)(x − ξ) für x ∈ M existiert. Ist dies der Fall, so gilt q(ξ) = f ′ (ξ). Beweis. Sei η ∈ C. Nach Satz 3.3.2 gilt lim x→ξ genau dann, wenn die durch ( q(x) = f (x) − f (ξ) =η x−ξ f (x) − f (ξ) falls x ∈ M\{ξ} , x−ξ η falls x = ξ definierte Funktion q : M → C stetig in ξ ist. Daraus folgt die Behauptung. Satz 4.1.2 Sei M ⊂ R, f : M → C und ξ ∈ M Häufungspunkt von M. Ist f differenzierbar in ξ, so ist f stetig in ξ. Der Satz besagt also, dass differenzierbare Funktionen stetig sind. Sein Beweis folgt unmittelbar aus Satz 4.1.1. Satz 4.1.3 Sei M ⊂ R, ξ ∈ M Häufungspunkt von M, f, g : M → C differenzierbar in ξ und c ∈ C. Dann sind f + g, c · f , f · g und im Falle g(ξ) 6= 0 auch die (in M\g −1 (0) definierte) Funktion fg differenzierbar in ξ und es gilt (i) (f + g)′(ξ) = f ′ (ξ) + g ′ (ξ), (ii) (c · f )′ (ξ) = c · f ′ (ξ), (iii) (f · g)′(ξ) = f ′ (ξ) · g(ξ) + f (ξ) · g ′(ξ), 74 (iv) 4 DIFFERENZIERBARKEIT ′ f ′ (ξ) · g(ξ) − f (ξ) · g ′ (ξ) f (ξ) = . g g(ξ)2 Man nennt (iii) Produktregel und (iv) Quotientenregel. Der Beweis von (i) und (ii) ist sehr einfach und hier ausgelassen. Zum Beweise von (iii) beachte man, dass für x 6= ξ f (x)g(x) − f (ξ)g(ξ) (f · g)(x) − (f · g)(ξ) = x−ξ x−ξ f (x)g(x) − f (ξ)g(x) + f (ξ)g(x) − f (ξ)g(ξ) = x−ξ f (x) − f (ξ) g(x) − g(ξ) = g(x) + f (ξ) x−ξ x−ξ gilt. Da limx→ξ g(x) = g(ξ) wegen Satz 4.1.2, folgt hieraus die Behauptung. Die Quotientenregel (iv) folgt auf ähnliche Weise. Wir verzichten auf die Details. Beispiele. 1. Sinus und Cosinus (auf R eingeschränkt) sind differenzierbar mit sin′ = cos und cos′ = − sin. Denn wegen sin x = 2i1 (eix − e−ix ), Beispiel 2 zu Definition 4.1.1 und Satz 4.1.3, (i) und (ii), ist der Sinus differenzierbar und sin′ x = 1 ix 1 ieix − (−i)e−ix = e + e−ix = cos x 2i 2 ′ für x ∈ R. Analog zeigt man cos = − sin. 2. Tangens und Cotangens sind differenzierbar mit tan′ = 1 + tan2 = cos1 2 und cot′ = −1 − cot2 = − sin1 2 . Dies folgt aus der Quotientenregel. Zum Beispiel ist tan′ = sin cos ′ = sin′ cos − sin cos′ cos2 + sin2 1 = = = 1 + tan2 . cos2 cos2 cos2 Satz 4.1.4 (Kettenregel) Seien M, N, L ⊂ R, N ⊂ L, g : M → N, f : L → C. Sei ξ ∈ M Häufungspunkt von M und g(ξ) Häufungspunkt von L. Sei g differenzierbar in ξ und sei f differenzierbar in g(ξ). Dann ist f ◦ g differenzierbar in ξ und es gilt (f ◦ g)′ (ξ) = f ′ (g(ξ))g ′(ξ). Beweis. Nach Satz 4.1.1 existieren in ξ bzw. η := g(ξ) stetige Funktionen p : M → C und q : L → C mit g(x) = g(ξ)+(x−ξ)p(x) für x ∈ M und f (y) = f (η)+(y−η)q(y) für y ∈ L, und es gilt g ′ (ξ) = p(ξ) und f ′ (η) = q(η). Mit y = g(x) folgt (f ◦ g)(x) = (f ◦ g)(ξ) + (g(x) − g(ξ))q(g(x)) = (f ◦ g)(ξ) + (x − ξ)p(x)q(g(x)). Da die durch x 7→ p(x)q(g(x)) definierte Funktion stetig in ξ ist und dort den Wert p(ξ)q(g(ξ)) = g ′ (ξ)f ′(g(ξ)) hat, folgt mit Satz 4.1.1 die Behauptung. Beispiele. 1. Die Funktion exp ◦ cos ist differenzierbar und (exp ◦ cos)′ (x) = exp′ (cos x) cos′ x = −ecos x sin x. 75 4.1 Definition und grundlegende Eigenschaften 2. Ist f : M → R differenzierbar in ξ ∈ M, so ist für n ∈ N auch f n : M → R differenzierbar in ξ mit (f n )′ (ξ) = nf n−1 (ξ)f ′ (ξ). Dies folgt aus der Kettenregel und Beispiel 1 zu Definition 4.1.1. Ist etwa f : R → R, f (x) = sin3 x, so gilt f ′ (x) = 3 sin2 x cos x. Wir haben Differenzierbarkeit hier nur für Funktionen mit Definitionsbereich in R (und Zielbereich in C) betrachtet. Lässt man in Definition 4.1.1 den Definitionsbereich in C zu, so erhält man den Begriff der komplexen Differenzierbarkeit. Es sei angemerkt, dass die bisherigen Resultate über Differenzierbarkeit – mit denselben Beweisen – auch für komplexe Differenzierbarkeit gelten. (Auch die im folgenden Satz auftauchende Formel für die Ableitung der Umkehrfunktion gilt noch für komplexe Differenzierbarkeit.) Ansonsten treten bei der Untersuchung der komplexen Differenzierbarkeit aber ganz andere Phänomene auf wie bei der Differenzierbarkeit von Funktionen mit Definitionsbereich in R. Komplexe Differenzierbarkeit wird später (voraussichtlich in Analysis IV) ausführlich behandelt. Zuvor wird in Analysis II Differenzierbarkeit von Funktionen mit Definitionsbereich in Rn (und Zielbereich in Rm ) untersucht. (Für Funktionen von Teilmengen von C = R2 nach C erhalten wir also zwei Differenzierbarkeitsbegriffe!) Im folgenden untersuchen wir Differenzierbarkeit nur für auf Intervallen definierte Funktionen. Ist I das Intervall [a, b], [a, b), (a, b] oder (a, b), so nennen wir das Intervall (a, b) das Innere von I und bezeichnen es mit int(I). Die Punkte a, b nennen wir auch Randpunkte von I. Satz 4.1.5 Seien I, J ⊂ R Intervalle, f : I → J stetig, streng monoton und surjektiv (und damit bijektiv nach Satz 3.2.3). Sei ξ ∈ I und sei f differenzierbar in ξ mit f ′ (ξ) 6= 0. Dann ist f −1 differenzierbar in η := f (ξ) und es gilt (f −1 )′ (η) = 1 1 = ′ −1 . f ′ (ξ) f (f (η)) Beweis. Sei (yn ) Folge in J\{η} mit yn → η. Sei xn := f −1 (yn ). Da f −1 nach Satz 3.2.3 stetig ist, folgt xn → f −1 (η) = ξ. Wegen der Bijektivität von f ist auch xn 6= ξ für alle n ∈ N. Es folgt f −1 (yn ) − f −1 (η) xn − ξ 1 = → ′ , yn − η f (xn ) − f (ξ) f (ξ) und daraus die Behauptung. Beispiele. 1. Der natürliche Logarithmus ln : R+ → R ist die Umkehrfunktion der Exponentialfunktion exp : R → R+ , nach Satz 4.1.5 also differenzierbar mit (ln)′ (x) = 1 1 1 = = exp′ (ln x) exp(ln x) x für x ∈ R+ . Hieraus erhält man, dass für a ∈ C die durch x 7→ xa definierte Funktion f : R+ → C differenzierbar ist und f ′ (x) = axa−1 gilt. Denn dies folgt wegen f (x) = exp(a ln x) aus der Kettenregel: f ′ (x) = a exp(a ln x)(ln)′ (x) = axa 1 = axa−1 . x 76 4 DIFFERENZIERBARKEIT Für a ∈ N ist dies das Beispiel 1 zu Definition 4.1.1. 2. Sei f : R → R, f (x) = x3 . Dann ist f streng monoton steigend, stetig und bijektiv. Außerdem ist f differenzierbar mit f ′ (x) = 3x2 . Die Umkehrfunktion f −1 ist gegeben durch f −1 (y) = y 1/3 (wobei wir dies für y < 0 durch y 1/3 = −(−y)1/3 definiert haben). Für y 6= 0 erhält man mit Satz 4.1.5 (oder durch die Wahl a = 31 ′ im vorigen Beispiel) sofort (f −1 ) (y) = 31 y −2/3 . Für y = 0 ist aber x := f −1 (y) = 0, also f ′ (x) = 0, und damit Satz 4.1.5 nicht anwendbar. Tatsächlich sieht man leicht, dass f −1 (y) − f −1 (0) 1 = 2/3 → ∞ y−0 y 77 4.2 Der Mittelwertsatz und damit f ′ (0) = lim x→0 zu (ii): Sei xk = 1 2πk f (x) − f (0) = 0. x−0 für k ∈ N. Dann gilt xk → 0 und f ′ (xk ) = 2xk sin 2πk − cos 2πk = −1 6→ 0 = f ′ (0). Damit ist f ′ nicht stetig in 0. Der Graph dieser Funktion ist in Abbildung 11 dargestellt. für y → 0, also f −1 nicht differenzierbar in 0 ist. 3. Wegen sin′ x = cos x > 0 für x aus dem Intervall (− π2 , π2 ) ist arcsin differenzierbar im Intervall (−1, 1) und es gilt dort arcsin′ x = 1 1 1 1 . =√ = =p sin′ (arcsin x) cos(arcsin x) 1 − x2 1 − sin2 (arcsin x) In den Punkten ±1 ist arcsin nicht differenzierbar. Analog sieht man, dass die Funktion arccos : [−1, 1] → [0, π] im Intervall (−1, 1) differenzierbar ist und dort arccos′ x = − √ 1 1 − x2 Abbildung 11: Der Graph der für x 6= 0 durch f (x) = x2 sin x1 gegebenen Funktion. gilt. Ebenso zeigt eine kurze Rechnung, dass arctan : R → − π2 , π2 und arccot : R → (0, π) auf ganz R differenzierbar sind und arctan′ x = 1 1 + x2 und arccot′ x = − 1 1 + x2 für alle x ∈ R gilt. Die Ableitung einer differenzierbaren Funktion muss nicht stetig sein. Als Beispiel betrachten wir die Funktion f : R → R, 2 x sin x1 falls x 6= 0, f (x) = 0 falls x = 0 Wir zeigen: (i) f ist differenzierbar, (ii) f ′ ist nicht stetig. zu (i): Mit Produkt- und Kettenregel folgt, dass f differenzierbar in R\{0} ist, mit 1 1 1 1 1 − 2 = 2x sin − cos f ′ (x) = 2x sin + x2 cos x x x x x für x ∈ R\{0}. Um die Differenzierbarkeit in 0 zu untersuchen, notieren wir zunächst, dass | sin t| ≤ 1 für t ∈ R wegen sin2 t + cos2 t = 1. Es folgt f (x) − f (0) = x sin 1 ≤ |x| x−0 x Dieses Beispiel zeigt auch, dass die Interpretation der Ableitung als Tangentensteigung problematisch sein kann. Definition 4.1.2 Sei I Intervall und f : I → C differenzierbar. Dann heißt f stetig differenzierbar, falls f ′ stetig ist. Für n ∈ N heißt f n-mal (stetig) differenzierbar, falls die induktiv durch f (n) := (f (n−1) )′ , f (0) := f , definierte n-te Ableitung f (n) existiert (und stetig ist). Man schreibt f ′′ statt f (2) = (f ′ )′ und f ′′′ statt f (3) . Zum Beispiel ist der Cosinus beliebig oft differenzierbar mit cos′ = − sin, cos′′ = − cos, cos′′′ = sin, cos(4) = cos und damit cos(4k) = cos, cos(4k+1) = − sin, cos(4k+2) = − cos und cos(4k+3) = sin für k ∈ N. 4.2 Der Mittelwertsatz Definition 4.2.1 Sei M ⊂ C, f : M → R, ξ ∈ M. Gilt f (ξ) ≥ f (x) für alle x ∈ M, so sagt man, dass f in ξ ein globales Maximum hat. Existiert ε > 0 mit f (ξ) ≥ f (x) für alle x ∈ M mit |x − ξ| < ε, so sagt man, dass f in ξ ein lokales Maximum hat. Der Wert f (ξ) wird dann als lokales Maximum bezeichnet. Entsprechend spricht man von einem globalen bzw. lokalen Minimum. Ein Extremum ist ein Maximum oder Minimum. 78 4 DIFFERENZIERBARKEIT 79 4.2 Der Mittelwertsatz 3 2 1 1 0.5 1.5 2 –1 Abbildung 12: Der Graph der durch f (x) = x4 − 2x2 gegebenen Funktion f . Abbildung 13: Illustration des Mittelwertsatzes. Offensichtlich sind globale Extrema auch lokale Extrema, aber nicht umgekehrt. Man betrachte etwa f : R → R, f (x) = x4 − 2x2 = (x2 − 1)2 − 1; vgl. Abbildung 12. Wie man durch einen Blick auf den Graphen erkennt, und durch eine kurze Rechnung auch leicht verifiziert, hat diese Funktion in 0 ein lokales Maximum, aber sie besitzt kein globales Maximum. In 1 und −1 hat f ein globales (und lokales) Minimum. Satz 4.2.3 (Satz von Rolle) Sind a, b, f wie in Satz 4.2.2 und ist außerdem noch f (a) = f (b), so existiert ξ ∈ (a, b) mit f ′ (ξ) = 0. Ist M ⊂ C kompakt und f : M → R stetig, so existieren nach Satz 3.6.4 immer Punkte, in denen f sein globales Minimum und Maximum hat. Satz 4.2.1 Sei I ⊂ R Intervall, f : I → R stetig und ξ innerer Punkt von I. Ist f differenzierbar in ξ und hat f in ξ ein lokales Extremum, so ist f ′ (ξ) = 0. Beweis. Ohne Beschränkung der Allgemeinheit habe f ein lokales Minimum in ξ. Dann existiert ε > 0 mit mit f (x) − f (ξ) ≥ 0 für alle x ∈ I mit |x − ξ| < ε. Es folgt f (x) − f (ξ) f (x) − f (ξ) f ′ (ξ) = lim ≥ 0 und f ′ (ξ) = lim ≤ 0, x→ξ+ x→ξ− x−ξ x−ξ also f ′ (ξ) = 0. Satz 4.2.2 (Mittelwertsatz) Seien a, b ∈ R, a < b. Sei f : [a, b] → R stetig und in (a, b) differenzierbar. Dann existiert ξ ∈ (a, b) mit f (b) − f (a) . f (ξ) = b−a ′ Der Mittelwertsatz hat eine einfache anschauliche Interpretation: es existiert ein Punkt, wo die Steigung der Tangente an den Graphen von f gleich der Steigung der Sekante durch (a, f (a)) und (b, f (b)) ist. Im Beispiel f : [0, 2] → R, f (x) = x + sin(πx) haben ξ = 21 und ξ = 23 die verlangte Eigenschaft; siehe Abbildung 13 Ein Spezialfall des Mittelwertsatzes ist der folgende Satz. Wir beweisen zuerst diesen Spezialfall, und führen den allgemeinen Fall dann darauf zurück. Beweis von Satz 4.2.3. Nach Satz 3.6.4 existieren α, β ∈ [a, b] so dass f (α) = min f ([a, b]) und f (β) = max f ([a, b]). Nach Satz 4.2.1 folgt f ′ (α) = 0 falls α ∈ (a, b) und f ′ (β) = 0 falls β ∈ (a, b). Damit folgt die Behauptung, außer wenn {α, β} ⊂ {a, b}. In diesem Fall ist aber wegen f (a) = f (b) auch f (α) = f (β), also f konstant und damit f ′ (x) = 0 für alle x ∈ (a, b). Beweis von Satz 4.2.2. Wir betrachten h : [a, b] → R, h(x) = f (x) − Dann gilt f (b) − f (a) (x − a). b−a f (b) − f (a) (b − a) = h(a). b−a Nach Satz von Rolle existiert also ξ ∈ (a, b) mit h(b) = f (b) − f (b) − f (a) . b−a Ersetzt man in obigem Beweis h(x) durch 0 = h′ (ξ) = f ′ (ξ) − h(x) = f (x) − f (b) − f (a) (g(x) − g(a)) g(b) − g(a) mit einer Funktion g, wobei g(a) 6= g(b), so erhält man folgendes Resultat. Satz 4.2.4 (Verallgemeinerter Mittelwertsatz) Seien a, b ∈ R, a < b, f, g : [a, b] → R stetig und in (a, b) differenzierbar. Sei g ′ (x) 6= 0 für x ∈ (a, b). Dann ist g(a) 6= g(b) und es existiert ξ ∈ (a, b) mit f (b) − f (a) f ′ (ξ) = . g ′(ξ) g(b) − g(a) 80 4 DIFFERENZIERBARKEIT Hierbei folgt g(a) 6= g(b) aus dem Satz von Rolle, angewandt auf g. Der Satz von Rolle – und folglich der (verallgemeinerte) Mittelwertsatz – gelten nicht für komplexwertige Funktionen. Zum Beispiel gilt für f : [0, 2π] → C, x 7→ eix , dass f (0) = f (2π) = 0, aber f ′ (x) = ieix 6= 0 für alle x. Es gilt aber immerhin noch der folgende Satz. Satz 4.2.5 Seien a, b ∈ R, a < b. Sei f : [a, b] → C stetig und in (a, b) differenzierbar. Dann existiert ξ ∈ (a, b) mit |f ′(ξ)| ≥ |f (b) − f (a)| . b−a Beweis. Die Behauptung ist trivial für f (a) = f (b). Andernfalls setzt man q := |f (b) − f (a)| f (b) − f (a) und g : [a, b] → R, g(x) = Re(qf (x)). Der Mittelwertsatz liefert ξ ∈ (a, b) mit g ′(ξ) = |f (b) − f (a)| g(b) − g(a) = b−a b−a 4.3 Anwendungen des Mittelwertsatzes Existiert zusätzlich noch f ′′ (ξ), so gilt: (iii) Ist f ′′ (ξ) < 0, so hat f ein lokales Maximum in ξ. (iv) Ist f ′′ (ξ) > 0, so hat f ein lokales Minimum in ξ. Beweis. (i) und (ii) folgen sofort aus Satz 4.3.2. zu (iii): Wegen f ′ (x) − f ′ (ξ) f ′ (x) = lim x→ξ+ x→ξ+ x − ξ x−ξ 0 > f ′′ (ξ) = lim existiert β ∈ I, β > ξ, mit f ′ (x) < 0 für x ∈ (ξ, β). Analog existiert α ∈ I mit der geforderten Eigenschaft. Die Behauptung folgt jetzt aus (i). Analog folgt (iv) aus (ii). √ √ Beispiel. Sei f : [0, 5] → R, f (x) = x + 2 5 − x. Dann ist f stetig und differenzierbar in (0, 5) mit √ 1 1 2 x 1 . (−1) = √ f ′ (x) = √ + 2 √ 1− √ 2 x 2 x 2 5−x 5−x Es gilt (für 0 < x < 5) √ √ f ′ (x) > 0 ⇔ 2 x ≤ 5 − x ⇔ 4x < 5 − x ⇔ x ∈ (0, 1) und die Behauptung folgt wegen |f ′(ξ)| = |qf ′(ξ)| ≥ Re(qf ′ (ξ)) = g ′ (ξ). 4.3 Anwendungen des Mittelwertsatzes Satz 4.3.1 Sei I Intervall und seien f, g : I → C stetig und in int(I) differenzierbar. Gilt dann f ′ (x) = g ′(x) für alle x ∈ int(I), so existiert c ∈ C mit f (x) = g(x) + c für alle x ∈ I. Beweis. Die Funktion h := f − g ist stetig in I, differenzierbar in int(I) und erfüllt h′ (x) = 0 für x ∈ int(I). Aus Satz 4.2.5 folgt h(x) = h(y) für x, y ∈ I. Damit ist h konstant. 81 und analog f ′ (x) < 0 ⇔ x ∈ (1, 5) und f ′ (x) = 0 ⇔ x = 1. Es folgt, dass f streng monoton steigend in [0, 1] ist (d. h., f |[0, 1] ist streng monoton steigend), dass f streng monoton fallend in [1, 5] ist und dass f in 1 ein lokales Maximum hat. Dieses ist sogar √ Maximum. Es gilt f (1) = 5. Das globale √ globales Minimum wird wegen f (5) = 5 < 2 5 = f (0) in 5 angenommen, in 0 hat f ein lokales Minimum. Der Graph von f ist in Abbildung 14 dargestellt. Satz 4.3.2 Sei I Intervall und f : I → R stetig und in int(I) differenzierbar. Dann ist f monoton wachsend falls f ′ (x) ≥ 0 für alle x ∈ int(I) und monoton fallend falls f ′ (x) ≤ 0 für alle x ∈ int(I). Falls f ′ (x) > 0 bzw. f ′ (x) < 0 für alle x ∈ int(I), so liegt strenge Monotonie vor. Definition 4.3.1 Sei I Intervall. Eine Funktion f : I → R heißt konvex, wenn für x1 , x2 , x ∈ I mit x1 < x < x2 Beweis. Ist x1 , x2 ∈ I, x1 < x2 , so existiert nach Mittelwertsatz ξ ∈ (x1 , x2 ) ⊂ int(I) mit f (x2 ) − f (x1 ) = (x2 − x1 )f ′ (ξ). Daraus folgt die Behauptung. gilt. Gilt hier immer “<”, so heißt f streng konvex. Gilt immer “≥” bzw. “>”, so heißt f (streng) konkav. Satz 4.3.3 Sei I Intervall, f : I → R und ξ ∈ int(I). Sei f differenzierbar in ξ mit f ′ (ξ) = 0. Dann gilt: Die Bedingung in Definition 4.3.1 besagt, dass der Graph von f unterhalb der Sekanten liegt. Äquivalent ist, dass die Sekante durch (x1 , f (x1 )) und (x, f (x)) kleinere Steigung hat als die durch (x, f (x)) und (x2 , f (x2 )), dass also (i) Existieren α, β ∈ I mit α < ξ < β, so dass f differenzierbar in (α, β) ist und f ′ (x) ≥ 0 für x ∈ (α, ξ) und f ′ (x) ≤ 0 für x ∈ (ξ, β) gilt, so hat f ein lokales Maximum in ξ. (ii) Existieren α, β ∈ I mit α < ξ < β, so dass f differenzierbar in (α, β) ist und f ′ (x) ≤ 0 für x ∈ (α, ξ) und f ′ (x) ≥ 0 für x ∈ (ξ, β) gilt, so hat f ein lokales Minimum in ξ. f (x) ≤ x − x1 x2 − x f (x1 ) + f (x2 ) x2 − x1 x2 − x1 f (x2 ) − f (x) f (x) − f (x1 ) ≤ x − x1 x2 − x gilt. In Abbildung 15 ist dies für f (x) = 1 + (x − 4)2 = x2 + 8x + 17, x1 = 1, x = 3 und x2 = 6 dargestellt. 82 4 DIFFERENZIERBARKEIT 83 4.3 Anwendungen des Mittelwertsatzes und existiert lim f ′ (x) , g ′ (x) lim f (x) g(x) x→a so existiert auch x→a und es gilt f ′ (x) f (x) = lim ′ . x→a g (x) x→a g(x) lim Abbildung 14: Der Graph von f : [0, 5] → R, f (x) = √ √ x + 2 5 − x. Entsprechendes gilt für den Grenzübergang x → b. Es sind a = −∞ und b = ∞ zugelassen und die auftretenden Grenzwerte von f /g bzw. f ′ /g ′ können auch uneigentliche Grenzwerte sein. Beweis. Wir beschränken uns auf den Fall, dass limx→a f (x) = limx→a g(x) = 0 und a ∈ R gilt. Wir betrachten die stetigen Ergänzungen F, G : [a, b) → R, die durch f (x) falls x ∈ (a, b) , F (x) = 0 falls x = a und G(x) = g(x) falls x ∈ (a, b) , 0 falls x = a gegeben sind. Nach dem Satz von Rolle und wegen G′ (ξ) = g ′ (ξ) 6= 0 für ξ ∈ (a, b) gilt dann g(x) = G(x) 6= G(a) = 0 für x ∈ (a, b). Nach dem verallgemeinerten Mittelwertsatz folgt für x ∈ (a, b) dann Abbildung 15: Konvexität. Satz 4.3.4 Sei I Intervall und f : I → R differenzierbar und in int(I) zweimal differenzierbar. Gilt f ′′ (x) ≥ 0 für alle x ∈ int(I), so ist f konvex. Gilt f ′′ (x) ≤ 0 für alle x ∈ int(I), so ist f konkav. Gilt immer “>” bzw. “<”, so liegt strenge Konvexität bzw. Konkavität vor. Für den Beweis sei auf die Übung verwiesen. Eine Anwendung des verallgemeinerten Mittelwertsatzes führt auf das folgende Ergebnis. Satz 4.3.5 (Regeln von de l’Hospital) Sei (a, b) offenes Intervall und seien f, g : (a, b) → R differenzierbar. Sei g ′(x) 6= 0 für alle x ∈ (a, b). Gilt dann f (x) F (x) − F (a) F ′ (ξ) f ′ (ξ) = = ′ = ′ g(x) G(x) − G(a) G (ξ) g (ξ) mit einem ξ ∈ (a, x). Hieraus folgt die Behauptung, da mit x → a auch ξ → a. Wir haben Satz 4.3.5 für einseitige Grenzwerte formuliert, aber daraus folgt natürliche eine entsprechende Aussage für allgemeine Grenzwerte unmittelbar. Beispiele. 1. Es gilt lim x→0 √ denn wegen arcsin′ x = 1/ 1 − x2 → 1 und tan′ (x) = 1/ cos2 x → 1 folgt arcsin′ x = 1. x→0 tan′ x lim 2. Wir untersuchen die Existenz des Grenzwertes L := lim 1 1 − . ln(1 + x) arctan x L = lim arctan x − ln(1 + x) , ln(1 + x) arctan x x→0 lim f (x) = lim g(x) = 0 x→a arcsin x = 1, tan x x→a Zunächst gilt, oder lim f (x) = lim g(x) = ∞ x→a x→a x→0 84 4 DIFFERENZIERBARKEIT 85 4.3 Anwendungen des Mittelwertsatzes falls L existiert. Nach Satz 4.3.5 folgt 3 3 L = lim x→0 = lim x→0 1 1+x2 1 1+x − 1 1+x (1 + 2 2 1 arctan x + ln(1 + x) 1+x 2 x − x2 , + (1 + x) ln(1 + x) 1 1 x2 ) arctan x falls der Grenzwert auf der rechten Seite existiert. Auch dort konvergieren für x → 0 wieder Zähler und Nenner gegen 0. Satz 4.3.5 liefert 1 − 2x x→0 2x arctan x + 1 + ln(1 + x) + 1 1 − 2x = lim x→0 2x arctan x + 2 + ln(1 + x) –1 Wir diskutieren einige numerische Verfahren zur Auflösung von Gleichungen. Wir wollen eine Nullstelle ξ einer differenzierbaren Funktion f : I → R bestimmen, wobei I ein Intervall ist. Wir beginnen mit einem Näherungswert x1 und berechnen den Schnittpunkt x2 der Tangente an f im Punkte (x1 , f (x1 ) mit der x-Achse. (Dieser Schnittpunkt existiert falls f ′ (x1 ) 6= 0.) Dies führt auf die Gleichung f (x1 )+ f ′ (x1 )(x2 − x1 ) = 0, also f (x1 ) . x2 = x1 − ′ f (x1 ) In vielen Fällen ist x2 ein besserer Näherungswert für ξ als x1 . Man definiert nun rekursiv eine Folge (xn ) durch xn+1 := xn − f (xn ) . f ′ (xn ) Wir werden sehen, dass unter geeigneten Voraussetzungen and f und x1 tatsächlich limn→∞ xn = ξ gilt. Das hier beschriebene Verfahren zur näherungsweisen Bestimmung einer Nullstelle heißt Newton-Verfahren. Man nennt x1 den Startwert. Man sagt, dass das Verfahren (gegen ξ) konvergiert, falls die Folge (xn ) definiert werden kann, also xn ∈ I und f ′ (xn ) 6= 0 für n ∈ N gilt, und falls limn→∞ xn = ξ. Im Beispiel nach dem Zwischenwertsatz 3.2.1 hatten wir gesehen, dass die Funktion f : R → R, f (x) = ex + x, eine Nullstelle im Intervall (0, 1) hat. Als Rekursionsformel erhalten wir exp(xn ) + xn xn+1 := xn − . exp(xn ) + 1 Wir wählen als Startwert x1 := 0 und erhalten x2 = − 12 , √ 3 e x3 = − √ = −0, 56631 . . . 2( e + 1) 1 0.5 –1 –1 –0.5 0 0.5 1 –1 Abbildung 16: Das Newton-Verfahren für f (x) = ex + x. L = lim falls der letzte Grenzwert existiert. Dies ist aber offensichtlich der Fall und der Grenzwert ist 12 . Wir erhalten L = 21 . –0.5 x4 = −0, 5671431650 . . ., x5 = −0, 5671432902 . . ., usw. Der Graph von f sowie der Tangenten an die Punkte (x1 , f (x1 )) und (x2 , f (x2 )) ist in Abbildung 16 dargestellt. Man kann (mit Hilfe der folgenden Sätze) zeigen, dass tatsächlich limn→∞ xn = ξ = −0, 56714 . . . gilt. Zunächst beweisen wir folgenden Satz. Satz 4.3.6 Sei I Intervall und g : I → R stetig differenzierbar. Sei ξ ∈ int(I) mit g(ξ) = ξ und |g ′(ξ)| < 1. Dann existiert ε > 0 mit folgender Eigenschaft: Es ist J := (ξ − ε, ξ + ε) ⊂ I und ist x1 ∈ J und die Folge (xn ) rekursiv definiert durch xn+1 := g(xn ), so gilt xn ∈ J für alle n ∈ N und limn→∞ xn = ξ. Beweis. Wegen der Stetigkeit von g ′ existiert ε > 0 und α ∈ (0, 1) mit J := (ξ − ε, ξ + ε) ⊂ I und |g ′(x)| ≤ α für alle x ∈ J. Für x ∈ J existiert nach dem Mittelwertsatz y ∈ J mit (g(x) − g(ξ)) = g ′ (y)(x − ξ). Es folgt |g(x) − ξ| = |g(x) − g(ξ)| ≤ α|x − ξ|. Insbesondere folgt |xn+1 − ξ| = |g(xn ) − ξ| ≤ α|xn − ξ|. Induktion liefert |xn − ξ| ≤ αn−1 |x1 − ξ| und dies impliziert wegen α < 1, dass limn→∞ xn = ξ gilt. Bemerkung. Der Beweis zeigt, dass die Behauptung für alle ε mit sup |g ′(x)| < 1 |x−ξ|<ε gilt. Beispiel. Sei g : R → R, g(x) = cos x. Wegen cos 21 > cos π3 = 21 und cos 1 < 1 folgt mit Hilfe des Zwischenwertsatzes leicht, dass ξ ∈ (0, 1) mit g(ξ) = ξ existiert. Für ε := 21 gilt 12 , 1 ⊂ (ξ−ε, ξ+ε) ⊂ 0, 23 und damit |g ′ (x)| = sin x ≤ sin 23 < 1 für |x − ξ| < ε. Mit Satz 4.3.6 und der dem Satz folgenden Bemerkung folgt, dass die rekursiv durch xn+1 := g(xn ) definierte Folge (xn ) für jeden Startwert x1 ∈ 12 , 1 konvergiert. Zum Beispiel für x1 = 1 erhält man x2 = 0.5403023059 . . ., x3 = 0.8575532158 . . ., x19 = 0.7393038924 . . ., x20 = 0.7389377567 . . ., usw. Es gilt ξ = 0.7390851332 . . .. Satz 4.3.7 Sei I Intervall und sei f : I → R zweimal stetig differenzierbar. Sei ξ ∈ int(I) mit f (ξ) = 0 und f ′ (ξ) 6= 0. Dann existiert ε > 0 mit J := (ξ −ε, ξ +ε) ⊂ I, so dass das Newton-Verfahren für alle Startwerte aus J gegen ξ konvergiert. 86 4 DIFFERENZIERBARKEIT f (x) f ′ (x) an. Die Funktion g kann in einem Intervall definiert werden, welches ξ im Innern enthält. Es gilt g(ξ) = ξ. Wegen g ′ (x) = f (x)f ′′ (x) f ′ (x)2 ′ folgt g (ξ) = 0, und damit die Behauptung aus Satz 4.3.6. Bemerkungen. 1. Die Behauptung von Satz 4.3.7 gilt auch dann, wenn f nur einmal stetig differenzierbar ist. Der Beweis sei als Übung überlassen. 2. Wendet man das Newton-Verfahren auf f (x) = x2 −√ c an, so erhält man das in §2.3 besprochene Heron-Verfahren zur Berechnung von c. 4.4 Folgen und Reihen differenzierbarer Funktionen Satz 3.7.2 besagt, dass der Grenzwert einer gleichmäßig konvergenten Folge stetiger Funktionen ebenfalls stetig ist. Wir beweisen ein analoges Resultat für Differenzierbarkeit. Satz 4.4.1 Sei I beschränktes Intervall und (fn ) eine Folge von differenzierbaren Funktionen von I nach C. Die Folge (fn′ ) konvergiere gleichmäßig. Existiert dann α ∈ I, so dass (fn (α)) konvergiert, so konvergiert (fn ) gleichmäßig gegen eine differenzierbare Funktion f : I → C und es gilt f ′ (x) = limn→∞ fn′ (x) für alle x ∈ I. Der Satz besagt also, dass man unter den gemachten Voraussetzungen den Grenzübergang n → ∞ mit der Differentiation (die ja auch eine Grenzwertbildung ist) vertauschen kann, dass also (limn→∞ fn )′ = limn→∞ fn′ gilt. Man beachte, dass die letzte Gleichung nicht gelten muss, wenn fn → f gleichmäßig und f und alle fn differenzierbar sind. Dies zeigt das Beispiel fn : R → R, fn (x) = n1 sin(nx). Hier gilt fn → 0 gleichmäßig, aber fn′ (0) = cos(n0) = 1 6→ 0. Beweis von Satz 4.4.1. Sei a := inf I und b := sup I. Wir zeigen zunächst mit dem Cauchykriterium, dass (fn ) gleichmäßig konvergiert. Sei dazu ε > 0. Nach Cauchykriterium für (fn′ ) existiert N1 ∈ N mit ′ |fm (x) − fn′ (x)| < ε 2(b − a) für m, n ≥ N1 und x ∈ I. Nach Cauchykriterium für (fn (α) existiert N2 ∈ N mit |fm (α) − fn (α)| < 87 für m, n ≥ N2 . Nach Satz 4.2.5 gilt dann für m, n ≥ N := max{N1 , N2 } und x ∈ I mit einem ξ ∈ I: Beweis. Wir wenden Satz 4.3.6 auf g(x) := x − 4.4 Folgen und Reihen differenzierbarer Funktionen ε 2 |fm (x) − fn (x)| ≤ |(fm (x) − fn (x)) − (fm (α) − fn (α))| + |fm (α) − fn (α)| ε ′ (ξ) − fn′ (ξ)| · |x − α| + ≤ |fm 2 ε ε < (b − a) + 2(b − a) 2 = ε. Damit ist (fn ) gleichmäßig konvergent. Sei f : I → C, f (x) = limn→∞ fn (x). Wir zeigen jetzt, dass f differenzierbar ist und f ′ (x) = limn→∞ fn′ (x) gilt. Sei dazu x ∈ I. Für n ∈ N definieren wir Fn : I → C durch ( fn (y) − fn (x) falls y 6= x, y−x Fn (y) = fn′ (x) falls y = x. Dann ist Fn stetig nach Satz 3.3.2. Nach Satz 4.2.5 existiert zu y ∈ I wieder ξ ∈ I mit ′ |Fm (y) − Fn (y)| ≤ |fm (ξ) − fn′ (ξ)| . Hierbei wählt man ξ = x falls y = x. Aus der gleichmäßigen Konvergenz von (fn′ ) folgt nun die gleichmäßige Konvergenz von (Fn ). Damit ist nach Satz 3.7.2 die durch y 7→ limn→∞ Fn (y) definierte Funktion F : I → C stetig. Offensichtlich gilt ( f (y) − f (x) falls y 6= x, y−x F (y) = ′ limn→∞ fn (x) falls y = x. Aus Satz 3.3.2. folgt jetzt die Differenzierbarkeit von f in x ist und f ′ (x) = limn→∞ fn′ (x). Ist in obigem Satz I unbeschränkt, so gelten noch alle gemachten Behauptungen, außer dass (fn ) nicht mehr gleichmäßig konvergieren muss. Dies sieht man durch Einschränkung auf beschränkte Teilintervalle ein. Wie bei Satz 3.7.2 gilt wieder ein Analogon für Reihen. P n Satz 4.4.2 Sei ∞ n=0 an (x − x0 ) Potenzreihe mit x0 ∈ R und an ∈ C für n ∈ N. Für den Konvergenzradius r gelte 0 < r ≤ ∞. Sei I :=P(x0 − r, x0 + r) falls r < ∞ ∞ n und I = R falls r = ∞. Dann ist die durch x 7→ n=0 P an (x − x0 ) definierte Funktion f : I → C differenzierbar und es gilt f ′ (x) = ∞ na (x − x0 )n−1 für n n=1 x ∈ I. P √ n−1 Beweis. Wegen n n → 1 hat die Potenzreihe ∞ ebenfalls Konn=1 nan (x − x0 ) vergenzradius r. Für n ∈ N0 sei gn : I → C, gn (x) = an (x − x0 )n . Dann gilt n−1 gn′ (x) = nan (x − xP . Sei 0 < ρ < r und J := (x0 − ρ, x0 + ρ). Nach 3.7.5 0) PSatz ∞ ∞ ′ konvergiert dann n=0 gn gleichmäßig in J. Außerdem konvergiert n=0 gn (x0 ) (zur Summe a0 .) Mit Satz 4.4.1 Version dass f differenP (in der P∞für Reihen) folgt, ′ n−1 zierbar in J ist mit f ′ (x) = ∞ für x ∈ J. Die n=0 gn (x) = n=1 nan (x − x0 ) Behauptung folgt für ρ → r; vgl. Satz 3.7.5. 88 4 DIFFERENZIERBARKEIT Beispiel. Wir betrachten die Potenzreihe ∞ X n=0 Umgekehrt kann man nun für beliebig oft in x0 differenzierbares f die PotenzP∞ k (k) (x0 )/k! bilden und sich fragen, ob sie zur reihe k=0 ak (x − x0 ) mit ak = f Summe f (x) konvergiert. Man nennt diese Reihe, also die Reihe (−1)n 2n+1 x . 2n + 1 √ k Der Konvergenzradius ist 1 (wegen k → 1). Aus dem Leibnizkriterium erhält man, dass die Reihe sogar für x ∈ [−1, 1] gleichmäßig konvergiert. Durch x 7→ ∞ X (−1)n 2n+1 x 2n +1 n=0 f ′ (x) = (−1)n x2n = n=0 ∞ X (−x2 )n = n=0 0 die Taylorreihe von f in x0 und für n ∈ N ihre n-te Teilsumme n X f (k) (x0 ) k! k=0 (x − x0 )k das n-te Taylorpolynom (von f in x0 ). Weiter heißt das n-te Restglied der Taylorentwicklung (von f in x0 ). Man beachte, dass aus der Konvergenz der Taylorreihe von f noch nicht folgen muss, dass ihre Summe f (x) ist. Man betrachte etwa das Beispiel f : R → R, exp − x12 falls x 6= 0, f (x) = 0 falls x = 0, mit x0 = 0. Man kann zeigen, dass f beliebig oft differenzierbar ist und f (k) (0) = 0 für alle k ∈ N gilt. Damit konvergiert die Taylorreihe für alle x ∈ R zur Summe 0. 1 –1 (x − x0 )k , Rn (x) := Rn (x, f, x0 ) := f (x) − Tn (x) 2 –2 k! k=0 1 = arctan′ x. 1 + x2 Mit Satz 4.3.1 und wegen f (0) = 0 = arctan 0 folgt f (x) = arctan x für x ∈ [−1, 1]. Man beachte, dass die Reihe für f ′ nur in (−1, 1) konvergiert, und auch dort nicht gleichmäßig. –3 ∞ X f (k) (x0 ) Tn (x) := Tn (x, f, x0 ) := wird also eine stetige Funktion f : [−1, 1] → R definiert. Diese ist nach Satz 4.4.2 differenzierbar in (−1, 1) mit ∞ X 89 4.4 Folgen und Reihen differenzierbarer Funktionen 1 2 3 –1 Satz 4.4.3 Sei I Intervall, x0 , x ∈ I, x0 6= x und n ∈ N0 . Die Funktion f : I → R sei n-mal differenzierbar in I und (n + 1)-mal differenzierbar in int(I). Dann existiert ξ zwischen x0 und x mit –2 Rn (x) = Abbildung 17: Teilsummen (vom Grad 5 und 10) der Reihe des Arcus Tangens. f (n+1) (ξ) (x − x0 )n+1 . (n + 1)! Der Spezialfall n = 0 ist der Mittelwertsatz. Die Beweisidee hier ist ähnlich. Wegen tan π4 = 1 folgt insbesondere ∞ X (−1)n 1 1 1 π = arctan 1 = = 1 − + − + .... 4 2n + 1 3 5 7 n=0 Diese Reihe wird auch nach Leibniz benannt. Aus Satz 4.4.2 folgt, dass mit f, I wie dort die Funktion f unendlich oft differenzierbar ist und dass f (k) (x) = ∞ X n=k n(n − 1) · · · · · (n − k + 1)an (x − x0 )n−k für k ∈ N und x ∈ I gilt. Insbesondere gilt f (k) (x0 ) = k!ak für alle k ∈ N. Beweis von Satz 4.4.3. Zunächst existiert ρ ∈ R mit f (x) = n X f (k) (x0 ) k=0 k! (x − x0 )k + ρ (x − x0 )n+1 . (n + 1)! Zu zeigen ist, dass ρ von der Form ρ = f (n+1) (ξ) ist. Sei dazu F : I → R, F (t) = f (x) − n X f (k) (t) k=0 k! (x − t)k − ρ (x − t)n+1 . (n + 1)! Dann ist F stetig in I und differenzierbar in int(I) und eine kurze Rechnung zeigt, dass (x − t)n (n+1) F ′ (t) = f (t) − ρ . n! 90 4 DIFFERENZIERBARKEIT Weiter gilt F (x0 ) = F (x) = 0 und nach dem Satz von Rolle existiert ξ zwischen x0 und x mit F ′ (ξ) = 0. Beispiel 1. Sei f : R+ → R, f (x) = ln x, x0 = 1. Dann ist f beliebig oft differenzierbar mit f ′ (x) = 1/x, f ′′ (x) = −1/x2 und f ′′′ (x) = 2/x3 . Durch vollständige Induktion zeigt man leicht, dass f (k) (x) = (−1)k+1 (n+1) f (−1)n x − 1 n+1 (ξ) 1 n+1 |Rn (x)| = (x − x0 ) = . ≤ n+1 n+1 (n + 1)! ξ Es folgt Rn (x) → 0 für n → ∞ und damit ln x = k=1 k (x − 1) g ′(x) = ∞ X (−1)k (x − 1)k = Beispiel 2. Sei α ∈ R und f : R+ → R, f (x) = xα . Wir betrachten wieder die Taylorentwicklung um x0 = 1. Durch vollständige Induktion sieht man leicht, dass f (k) (x) = α(α − 1)(α − 2) · . . . · (α − k + 1)xα−k gilt. Mit α α(α − 1)(α − 2) · . . . · (α − k + 1) := k! k k folgt für x ∈ (1, 2]. f (k) (x) = k! 4 2 1 –0.5 α α−k x . k (Man überzeugt sich leicht, dass obige Definition von αk für α ∈ N mit der Definition der Binomialkoeffizienten aus §1.6 übereinstimmt.) Wir erhalten die Taylorreihe 3 0 1 1 = 1 − (1 − x) x definiert, und damit folgt g ′(x) = ln′ x und wegen g(1) = 0 = ln 1 auch g(x) = ln x für x ∈ (0, 2). Für x ∈ (1, 2] existiert dann ξ ∈ (1, x) mit ∞ X (−1)k+1 für alle x ∈ (0, 2] gilt, kann man ähnlich wie bei der Reihe des Arcus Tangens vorgehen. Durch die Reihe auf der rechten Seite wird eine differenzierbare Funktion g : (0, 2) → R mit k=0 (k − 1)! . xk 91 4.4 Folgen und Reihen differenzierbarer Funktionen 1 0.5 1.5 2 2.5 ∞ X α (x − 1)k . k k=0 3 –1 –2 Wegen lim k→∞ –3 –4 Abbildung 18: Der Logarithmus und die Taylorpolynome vom Grad 5 und 10. α k α k+1 k + 1 = lim =1 k→∞ α − k und Satz 2.9.2 ist der Konvergenzradius dieser Reihe 1. 3 3 2 2 1 1 Insbesondere gilt ln 2 = ∞ X (−1)k+1 k=1 k =1− 1 1 1 + − + .... 2 3 4 Für x ∈ [ 21 , 1) gilt 12 ≤ x < ξ < 1 und obiges Argument liefert wieder Rn (x) → 0. Tatsächlich gilt dies (und damit obige Potenzreihenentwicklung des Logarithmus) für x ∈ (0, 2], aber für x ∈ (0, 12 ) können wir dies mit obiger Darstellung des Restglieds Rn (x) nicht zeigen. Um zu zeigen, dass ∞ X (−1)k+1 (x − 1)k ln x = k k=1 0 –1 1 2 3 0 1 2 3 –1 Abbildung 19: Taylorpolynome vom Grad 5 und 10 für √ √ x und 1/ x. 92 4 DIFFERENZIERBARKEIT Um zu zeigen, dass die Taylorreihe für x ∈ (1, 2) gegen f (x) = xα konvergiert, betrachten wir das Restglied Rn . Es existiert wieder ξ ∈ (1, x) mit (n+1) f α (ξ) (x − 1)n+1 = ξ α−n−1 (x − 1)n+1 . |Rn (x)| = (n + 1)! n+1 Da ξ > 1 folgt α |Rn (x)| ≤ (x − 1)k k falls n ≥ α−1. Da die Taylorreihe den Konvergenzradius 1 hat, folgt Rn (x) → 0 für n → ∞. Das gleiche Argument funktioniert auch wieder für x ∈ ( 21 , 2). Tatsächlich gilt ∞ X α (x − 1)k xα = k k=0 aber sogar für alle x ∈ (0, 2).