Skript zur Vorlesung Analysis I Wintersemester 2013/2014 Prof. Dr. B. Wilking Mathematisches Institut Fachbereich Mathematik und Informatik WWU Münster 2 Kurzer Überblick Folgende Themen sollen in der Vorlesung behandelt werden: • Die reellen Zahlen R – Eigenschaften sowie eine axiomatische Charakterisierung • Folgen, Reihen und Konvergenz • Spezielle Funktionen – exp(x) = ex , log(x) – sin(x), cos(x), tan(x) – arcsin(x), arccos(x) – Γ− Funktion • Die komplexen Zahlen C • Sätze über stetige Funktionen • Folgen von stetigen Funktionen • Sätze über differenzierbare Funktionen • Das Riemannsche Integral • Taylor-Reihen Inhaltsverzeichnis 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 Vollständige Induktion . . . . . . . . . . . . . . . . . . . . . . . . Körperaxiome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Angeordnete Körper . . . . . . . . . . . . . . . . . . . . . . . . . Grenzwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Vollständigkeitsaxiom und Folgerungen . . . . . . . . . . . . Konstruktion der reellen Zahlen . . . . . . . . . . . . . . . . . . . b-adische Brüche und Überabzählbarkeit von R . . . . . . . . . . Die komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . Konvergenzkriterien für Reihen . . . . . . . . . . . . . . . . . . . Die Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Logarithmen und allgemeine Potenzen . . . . . . . . . . . . . . . Trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . Der Mittelwertsatz der Differentialrechnung und seine Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Riemannsche Integral . . . . . . . . . . . . . . . . . . . . . . Der Hauptsatz der Differential- und Integralrechnung . . . . . . . Gleichmäßige Konvergenz und Vertauschung von Grenzwertprozessen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Potenzreihen und Taylorentwicklung . . . . . . . . . . . . . . . . Partialbruchzerlegung . . . . . . . . . . . . . . . . . . . . . . . . Konvexität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Uneigentliche Integrale und die Gamma-Funktion . . . . . . . . . 3 4 9 13 20 26 35 43 49 57 65 71 81 82 90 98 106 112 119 124 130 135 142 4 1 1. Vollständige Induktion Vollständige Induktion Im Folgenden bezeichnen wir mit N = {0, 1, 2, ...} die natürlichen Zahlen und mit N+ = {1, 2, ...} die positiven natürlichen Zahlen. Beweisprinzip der vollständigen Induktion. Für jedes n ∈ N sei eine Aussage A(n) gegeben. Dann sind alle Aussagen A(n) wahr, wenn man die beiden folgenden Eigenschaften verifizieren kann. I) A(0) ist wahr. II) Ist A(n) wahr, so auch A(n + 1). Schreibweise. Seien am , . . . , an ∈ R. Wir schreiben n X ai := am + . . . + an , i=m n Y i=m ai := am · . . . · an . Konventionen: • (leere Summen) • (leeres Produkt) Satz 1.1. Pn i=m ai = 0, falls n < m. Qn i=m ai = 1, falls n < m. P a) Für alle n ∈ N gilt ni=0 i = 12 n(n + 1). b) Für n ∈ N mit n > 3 gilt n2 ≤ 2n . P c) Für alle n ∈ N gilt nk=1 (2k − 1) = n2 . Beweis. a) Wir beweisen die Behauptung durch vollständige Induktion nach n ∈ N. Induktionsbeginn (IB): Für n = 0 ist 0 X i=0= 1 2 0 (0 + 1). i=0 Induktionsvoraussetzung (IV): Für ein beliebiges, aber festes n ∈ N gelte n X i=0 i = 12 n(n + 1). 5 1. Vollständige Induktion Induktionsschritt P (IS): (n 17→ n + 1): Gegeben sei die Induktionsvoraussetzung, dann ist n+1 i=0 i = 2 (n + 1)(n + 2) zu zeigen. Dies folgt aus n+1 X i = (n + 1) + i=0 n X i i=0 IV = (n + 1) + 12 n(n + 1) = = = 1 2 1 2 1 2 (2(n + 1) + n(n + 1)) ((n + 2)(n + 1)) (n + 1)(n + 2). b) (IB) Für n = 4 ist 42 = 16 = 24 . (IV) Für beliebiges festes n ≥ 4 gelte n2 ≤ 2n . (IS) (n 7→ n + 1): Es ist (n + 1)2 ≤ 2n+1 zu zeigen. Dies folgt direkt aus (n + 1)2 = n2 + 2n + 1 ≤ 2n + 3n ≤ 2n + n2 ≤ 2n+1 . c) Übung. Definition 1.2. Für alle n ∈ N definiert man n! := n Y i i=1 Beachte: Nach Konvention zum leeren Produkt gilt 0! = 1. k Y n := k n+1−i i (Binominialkoeffizient) i=1 und es gilt ( n! , falls k ≤ n, n = k!(n−k)! k 0, falls k > n. Bemerkung. Sind M1 , . . . , Mk Mengen, so bezeichnen wir mit M1 × . . . × Mk 6 1. Vollständige Induktion die Menge {(x1 , . . . , xk ) | xi ∈ Mi für 1 ≤ i ≤ k}. Dabei ist (x1 , . . . , xk ) = (y1 , . . . , yk ) genau dann, wenn xi = yi für alle 1 ≤ i ≤ k. Beispielsweise gilt {1, 3, 7, 3} = {1, 3, 7} = {7, 3, 1}, aber (1, 3, 7) 6= (7, 3, 1) 6= (1, 3, 7, 3). Ist M eine endliche Menge, so bezeichnet #M ∈ N die Ordnung von M , also die Anzahl der Elemente in M . Etwa ist #∅ = 0. Beachte: Es ist #{A1 , . . . , An } = n genau dann, wenn Ai 6= Aj für alle i 6= j ist. Satz 1.3. Für alle n ∈ N mit n ≥ 1 gilt, dass eine n-elementige Menge n! Anordnungen hat. Beweis. Wir beweisen den Satz durch vollständige Induktion nach n. (IB) n = 1: Eine einelementige Menge hat nur 1 = 1! Anordnung. (IV) Für ein beliebiges, aber festes n ∈ N gelte: Für jede n-elementige Menge {A1 , ..., An } ist #{(B1 , ..., Bn ) | {A1 , ..., An } = {B1 , ..., Bn }} = n! (IS) (n 7→ n+1): Gegeben sei nun eine (n+1)−elementige Menge {A1 , ..., An+1 }. Es ist zu zeigen, dass die Menge M = {(B1 , ..., Bn+1 ) | {A1 , ..., An+1 } = {B1 , ..., Bn+1 }} (n + 1)! Elemente hat. Es gilt M= n+1 [ Mi , i=1 wobei Mi = {(B1 , . . . , Bn+1 ) ∈ M | B1 = Ai } ist. Nach der Induktionsvoraussetzung gilt #Mi = n! für 1 ≤ i ≤ n + 1. Da die Mengen M1 , . . . , Mn+1 paarweise disjunkt sind, folgt #M = (n + 1) · #M1 = (n + 1) · n! = (n + 1)! Satz 1.4. Seien k, n ∈ N. Für eine n-elementigen Menge M ist die Anzahl der n k-elementigen Teilmengen k . 7 1. Vollständige Induktion Lemma 1.5. Für 1 ≤ k ≤ n gilt n−1 k + n−1 k−1 = n k . Beweis. Für k = n sind beide Seiten der Gleichung gleich 1. Für 1 ≤ k < n ist n (n−1)! (n−1)! (n−1)!·(n−k) (n−1)!·k + k!(n−k)! = . k!(n−1−k)! + (k−1)!(n−k)! = k!(n−k)! k Beweis von Satz 1.4. Seien k, n ∈ N. Es bezeichne Ckn die Anzahl der k-elementigen Teilmengen einer n-elementigen Menge. Es gilt C0n = 1 = n0 und Ckn = 0 = nk für k > n. Zu zeigen ist nun Ckn = nk für 0 < k ≤ n. (IB) n = 0: Es ist nichts zu zeigen. (IV) Sei n ∈ N beliebig, aber fest. Für alle k ≥ 0 gelte Ckn = nk . (IS) (n 7→ n + 1): Es ist Ckn+1 = n+1 für alle 0 < k ≤ n + 1 zu zeigen. Sei dazu k M := {A ⊆ {1, . . . , n + 1} | #A = k}. Dann ist M = M1 ∪ M2 für M1 = {A ∈ M | n + 1 ∈ A} und M2 = {A ∈ M | n + 1 ∈ / A} und es gilt #M = #M1 + #M2 . Wegen M2 = {A ⊆ {1, . . . , n} | #A = k} folgt n #M2 = . k 0 Setze M1 := {A ⊆ {1, . . . , n} | #A = k − 1}. Dann ist n 0 #M1 = k−1 und 0 M1 = {A ∪ {n + 1} | A ∈ M1 }. Es folgt 0 #M1 = #M1 = n k−1 8 1. Vollständige Induktion und daraus mit Lemma 1.5 n n n+1 #M = + = . k k−1 k Satz 1.6 (Binomischer Lehrsatz). Für alle x, y ∈ R und n ∈ N gilt n X n n−k k n (x + y) = x y . k k=0 Beweis. Für n = 0 sind beide Seiten der Gleichung definitionsgemäß 1. Für n ≥ 1 beweisen wir die Aussage durch nach n. Induktion (IB) n = 1: Die Aussage folgt aus 10 = 11 = 1. P (IV) Sei n ∈ N, n ≥ 1 beliebig, aber fest. Es gelte (x + y)n = nk=0 nk xn−k y k . (IS) (n 7→ n + 1): Es ist n+1 X n + 1 n+1 (x + y) = xn+1−k y k k k=0 zu zeigen. Es gilt (x + y) n+1 n X n n−k k = (x + y)(x + y) = (x + y) x y k k=0 n n X X n n−k k+1 n n+1−k k x y x y + = k k k=0 k=0 n+1 n+1 X n X n n+1−k k xn+1−k y k x y + = k−1 k k=1 k=0 n+1 X n n n+1 =x + + xn+1−k y k k k−1 n IV k=1 und zuletzt mit Lemma 1.5 = n + 1 n+1−k k x y . k n+1 X k=0 Satz 1.7 (Summenformel für geometrische Reihen). Für x ∈ R, x 6= 1 und n ∈ N gilt n X n+1 xk = 1−x 1−x . k=0 9 2. Körperaxiome Beweis. Die Formel folgt direkt aus (1 − x) n X xk = k=0 = n X k=0 n X k=0 2 xk − xk − n X k=0 n+1 X k=1 xk+1 xk = 1 − xn+1 . Körperaxiome Im letzten Abschnitt haben wir zum Herleiten einiger Formeln für reelle Zahlen wie selbstverständlich einige aus der Schule bekannte Regeln verwendet. In den nächsten Abschnitten gehen wir einen Schritt zurück und fragen uns, welche Regeln wirklich essentiell sind und welche aus den anderen folgen. Das Ziel ist, die reellen Zahlen axiomatisch zu charakterisieren, d.h. einen möglichst kleinen Regelsatz (in Form von sogenannten Axiomen) zu finden, der bereits die Eindeutigkeit der reellen Zahlen sicherstellt. Wir setzen im Weiteren keinerlei Vorkenntnisse über R voraus. Die rationalen Zahlen Q werden weiterhin als bekannt vorausgesetzt. Definition 2.1. Ein Körper ist ein Tripel (K, +, ·) bestehend aus einer Menge K und zwei Verknüpfungen + :K × K → K · :K × K → K (a, b) 7→ a + b, (a, b) 7→ a · b, das den folgenden Axiomen (Regeln) genügt: a) Für alle x, y ∈ K gelten die Kommutativgesetze x + y = y + x, (AK) x · y = y · x. (MK) b) Für alle x, y, z ∈ K gelten die Assoziativgesetze x + (y + z) = (x + y) + z, (AA) x · (y · z) = (x · y) · z. (MA) c) Es gibt Elemente 0, 1 ∈ K mit 0 6= 1, so dass für alle x ∈ K gilt: x + 0 = x, (AN) x · 1 = x. (MN) 10 2. Körperaxiome (i) Zu jedem Element x ∈ K gibt es ein Element −x ∈ K derart, dass x + (−x) = 0 (AI) ein neutrales Element der Addition ist. (ii) Ist x ∈ K nicht ein neutrales Element der Addition, so gibt es ein x−1 ∈ K mit x · x−1 = 1. (MI) d) Es gilt für alle x, y, z ∈ K das Distributivgesetz x · (y + z) = x · y + x · z. (D) Beispiel. a) Die rationalen Zahlen Q bilden zusammen mit + und · einen Körper. b) Es ist nicht schwer einzusehen, dass es einen Körper gibt, der aus genau 2 Elementen besteht. Allgemeiner werden Sie in der Linearen Algebra einsehen, dass es für jede Primzahl p einen Körper Fp gibt, der aus genau p Elementen besteht. c) Die nichtnegativen rationalen Zahlen bilden keinen Körper, denn es fehlt die Existenz des additiv Inversen. Die ganzen Zahlen Z bilden auch keinen Körper – hier liegt es am Fehlen des multiplikativ Inversen. Körperaxiome der reellen Zahlen. Auf den reellen Zahlen R sind zwei Verknüpfungen +, · definiert derart, dass (R, +, ·) ein Körper ist. Bemerkung 2.2. Es sei (K, +, ·) ein Körper. a) Das neutrale Element der Addition 0 ist eindeutig. b) Das neutrale Element der Multiplikation 1 ist eindeutig. c) Das additiv Inverse ist eindeutig. Etwas allgemeiner gilt x + y1 = x + y2 ⇒ y1 = y2 . d) Das multiplikativ Inverse ist eindeutig. Genauer gilt für x ∈ K \ {0}, y1 , y2 ∈ K x · y1 = x · y2 ⇒ y1 = y2 . 11 2. Körperaxiome e) Für alle x ∈ K ist 0 · x = 0. f ) Für alle x ∈ K ist −(−x) = x. g) Für alle x ∈ K \ {0} ist (x−1 )−1 = x. h) Ist −1 das additiv Inverse zu 1 und x ∈ K, so gilt (−1) · x = −x, d.h. (−1) · x ist additiv invers zu x. i) Für alle x, y ∈ K ist (−x) · (−y) = x · y. Beweis. a) Seien 01 , 02 neutrale Elemente der Addition. Dann ist (AN) (AK) (AN) 01 = 01 + 02 = 02 + 01 = 02 . b) Analog. c) Es gelte x + y1 = x + y2 und es bezeichne −x ein additiv inverses Element zu x. Dann ist − x + (x + y1 ) = −x + (x + y2 ), mit (AA) folgt (−x + x) + y1 = (−x + x) + y2 und wir erhalten y1 = 0 + y1 = 0 + y2 = y2 . d) Analog. e) Es gilt 0 · x = (0 + 0) · x = 0 · x + 0 · x, also auch 0·x+0=0·x+0·x und aus c) folgt 0 · x = 0. 12 2. Körperaxiome f) Aus 0 = x + (−x) = (−x) + x und 0 = (−x) + (−(−x)) folgt mittels c) x = −(−x). g) Analog. h) Es ist (D) x + (−1) · x = (1 + (−1)) · x (AI) e) = 0 · x = 0. Also ist (−1)x das eindeutig bestimmte additive Inverse −x von x. i) Zuletzt ist (−x) · (−y) = (MA)+(MK) = h) = f = = ((−1) · x) · ((−1)y) ((−1) · (−1)) · xy (−(−1)) · xy 1 · xy xy und dies beendet den Beweis. Konvention. In Körpern gilt Punkt- vor Strichrechnung. Definition 2.3. Für y ∈ K \ {0} und x ∈ K ist x y := x · (y −1 ), x − y := x + (−y). 13 3. Angeordnete Körper Seien x1 , . . . , xn , y1 , . . . , yn ∈ K. Allgemeines Assoziativgesetz : x1 + . . . + xn := ((. . . ((x1 + x2 ) + x3 ) . . .) + xn ). Die Wahl der Klammern ist dabei unerheblich. Allgemeines Kommutativgesetz : Für {i1 , . . . , in } = {1, . . . , n} ist x1 + . . . + xn = xi1 + . . . + xin . Folgerung: Sind aij ∈ K für 1 ≤ i ≤ n, 1 ≤ j ≤ m, so gilt n X m X aij = i=1 j=1 m X n X aij . j=1 i=1 Allgemeines Distributivgesetz : n X i=1 ! m n X m X X xi · yj = x i yj . j=1 i=1 j=1 In einem Körper K setzt man x0 := 1K , xn := |x · .{z . . · x} für alle n ∈ N, n > 0, n-mal 0 · x := 0K , n · x := x . . + x} für alle n ∈ N, n > 0. | + .{z n-mal Im Allgemeinen gilt in einem Körper K nicht n · 1K 6= 0 für n ∈ N, n > 0. 3 Angeordnete Körper Definition 3.1. Ein angeordneter Körper ist ein 4-Tupel (K, +, ·, K+ ) bestehend aus einem Körper (K, +, ·) und einer Teilmenge K+ ⊂ K von so genannten positiven Zahlen derart, dass bei Einführung der Schreibweise x > 0 :⇔ x ∈ K+ folgende Bedingungen gelten: 14 3. Angeordnete Körper (A1) Für jedes x ∈ K gilt genau eine der folgenden Aussagen: (i) x > 0, (ii) x = 0 oder (iii) −x > 0. (A2) Für x, y ∈ K mit x > 0 und y > 0 folgt x + y > 0. (A3) Für x, y ∈ K mit x > 0 und y > 0 folgt x · y > 0. Für einen angeordneten Körper definiert man für x, y ∈ K x > y :⇔ x − y > 0, x < y :⇔ y > x, x ≥ y :⇔ x > y ∨ x = y, x ≤ y :⇔ x < y ∨ x = y. Anordnungsaxiom der reellen Zahlen. Im Körper der reellen Zahlen gibt es eine Teilmenge R+ derart, dass (R, +, ·, R+ ) ein angeordneter Körper ist. Bemerkung 3.2. In einem angeordneten Körper gilt für alle x, y, z, a, b ∈ K: a) Falls x 6= 0, ist x2 > 0. b) 1 > 0. c) x > 0 ⇔ 1 x > 0. d) x > y ⇔ x + a > y + a. e) Falls a > 0 ist, gilt x > y genau dann, wenn ax > ay ist. e’) Falls a < 0 ist, gilt x > y genau dann, wenn ax < ay ist. f ) [x > y ∧ y > z] ⇒ x > z. g) [x > y > 0 ∧ a > b > 0] ⇒ ax > by. Beweis. a) Wegen x 6= 0 ist mit (A1) x > 0 oder −x > 0. 1. Fall: Falls x > 0, folgt aus (A3) x2 = x · x > 0. 2. Fall: Falls −x > 0, so folgt mit (A3) x2 = (−x) · (−x) > 0. b) Mit a) folgt 1 = 12 > 0. 15 3. Angeordnete Körper c) Aus x > 0 folgt mit (A3) und a) 1 x =x· 1 2 x > 0. Die Rückrichtung folgt, wenn man die Rollen von x und 1 x vertauscht. d) Dies ist offensichtlich. e) Aus x > y folgt x − y > 0 und mit (A3) a · (x − y) > 0, also ax > ay. Ist umgekehrt ax > ay, so folgt zunächst a · (x − y) > 0 sowie mit c) und (A3) (x − y) = a1 · a · (x − y) > 0. e’) Sei −a > 0. Dann gilt wegen d) x > y genau dann, wenn (−a) · x > (−a) · y ist. Nach c) (addieren von a(x + y)) ist dies äquivalent zu ay > ax und dies ist definitionsgemäß äquivalent zu ax < ay. f) Gilt x > y und y > z, so folgt x − y > 0 und y − z > 0 und daraus (x − y) + (y − z) > 0, was wiederum x > z liefert. g) Aus e) folgt in zwei Schritten x · a > x · b > y · b. Die Behauptung folgt nun aus f). Bemerkung. In einem angeordneten Körper gilt nach Teil a) und b) der letzten Bemerkung x2 + 1 > 0 für alle x ∈ K. Insbesondere hat in einem angeordneten Körper die Gleichung x2 = −1 keine Lösungen. Definition. Es seien M1 und M2 Mengen. a) Eine Abbildung f : M1 → M2 ist eine Vorschrift, die jedem m ∈ M1 genau ein f (m) ∈ M2 zuordnet. Die Menge M1 heißt dann Definitionsbereich und M2 Wertebereich von f . b) Eine Abbildung heißt injektiv, wenn für alle a, b ∈ M1 mit a 6= b auch f (a) 6= f (b) folgt. c) Eine Abbildung heißt surjektiv, wenn für alle y ∈ M2 ein x ∈ M1 existiert mit f (x) = y. d) Eine Abbildung heißt bijektiv, wenn sie sowohl injektiv als auch surjektiv ist. 16 3. Angeordnete Körper Lemma 3.3. Es seien (K, +, ·, K+ ) ein angeordneter Körper und 0K und 1K die neutralen Elemente der Addition bzw. Multiplikation in K. Die Abbildung i : N → K, n 7→ nK := i(n), die induktiv definiert wird durch i(0) := 0K , i(n + 1) := 1K + i(n), ist injektiv und hat folgende Eigenschaften: a) n > m in N ⇔ nK > mK in K. b) (n + m)K = nK + mK . c) (n · m)K = nK · mK . Beweis. b) Es gilt für n ∈ N, dass nK = n · 1K = 1K + . . . + 1K . Damit ergibt | {z } n-mal sich aber (n + m)K = 1K + . . . + 1K + 1K + . . . + 1K = nK + mK . {z } | {z } | n-mal a) Es ist m-mal (n + 1)K = nK + 1K > nK . Induktiv folgt nK > 0 für alle n > 0. Ist nun n > m, so folgt zusammen mit b) nK = mK + (n − m)K > mK . Ist umgekehrt nK > mK , so folgt n > m, denn n ≤ m würde völlig analog nK ≤ mK nach sich ziehen. Dies impliziert insbesondere die Injektivität von i. c) Man beweist die Aussage für festes m durch Induktion über n, Übung. Satz 3.4. Es sei (K, +, ·, K+ ) ein angeordneter Körper. Dann gibt es genau eine injektive Abbildung ι : Q → K mit ι(a · b) = ι(a) · ι(b) und ι(a + b) = ι(a) + ι(b) für alle a, b ∈ Q. Es gilt für diese Abbildung darüber hinaus für alle a, b ∈ Q: a > b in Q ⇔ ι(a) > ι(b) in K. Außerdem sind ι(0) = 0 und ι(1) = 1. 17 3. Angeordnete Körper Beweis. Wir zeigen zunächst die Existenz: Für n ∈ N \ {0} und m ∈ N setze K ι m := m n nK K := − m ι −m n nK , wobei nK wie in Lemma 3.3 definiert ist. Behauptung. ι ist wohldefiniert. Es ist zu zeigen: Sind m1 , m2 , n1 , n2 ∈ N mit n1 , n2 > 0 und m1K m2K n1K = n2K . Setze dazu m1 n1 = m2 n2 , so folgt m := m1 · n2 = m2 · n1 , n := n1 · n2 . Dann gilt nach Lemma 3.3 mK nK = = n2K ·m1K n2K ·n1K n1K ·m2K n2K ·n1K = = m1K n1K m2K n2K und die Behauptung folgt. Man verifiziert nun leicht für alle a, b ∈ Q: ι(a · b) = ι(a) · ι(b), ι(a + b) = ι(a) + ι(b). Ist a > 0, so folgt ι(a) > 0 aus obiger Definition, und ist a ≤ 0, so folgt ι(a) ≤ 0, d.h. ι(a) > 0 ⇔ a > 0 und ι(a) > ι(b) ⇔ ι(a − b) > 0 ⇔ a − b > 0 ⇔ a > b. Dies impliziert die Injektivität von ι. Eindeutigkeit von ι. Sei ι̃ eine weitere Abbildung wie im Satz. Es gilt ι̃(1) 6= 0, denn andernfalls wäre ι̃(a) = ι̃(a) · ι̃(1) = 0 für alle a ∈ Q. Weiterhin gilt ι̃(1) = ι̃(1) · ι̃(1) und mit ι̃(1) 6= 0 folgt ι̃(1) = 1K = ι(1). Für alle n ∈ Z ist dann ι̃(n) = ι(n), also ι̃ = ι. 18 3. Angeordnete Körper Wegen Satz 3.4 können und werden wir Q als Teilmenge eines beliebigen angeordneten Körpers (K, +, ·, K+ ) auffassen. Definition 3.5. Es sei (K, +, ·, K+ ) ein angeordneter Körper. Für x ∈ K setzt man ( x, falls x ≥ 0, |x| := −x, falls x < 0. Bemerkung. Für alle x, y ∈ K ist |x · y| = |x| · |y| und für y 6= 0 außerdem |x| |y| = xy . Satz 3.6. Sei (K, +, ·, K+ ) ein angeordneter Körper. Für alle x, y ∈ K gilt die Dreiecksungleichung |x + y| ≤ |x| + |y|. Beweis. Ohne Einschränkung gilt x ≥ y. Wir machen eine Fallunterscheidung: 1. Sei x, y ≥ 0. Dann folgt |x + y| = x + y = |x| + |y|. 2. Sei x, y ≤ 0. Dann ist x + y ≤ 0 und somit |x + y| = −x − y = |x| + |y|. 3. Sei zuletzt x ≥ 0 und y ≤ 0. Dann ist einerseits x + y ≤ (x + y) − 2y = x − y = |x| + |y|, andererseits −x − y ≤ (−x − y) + 2x = x − y = |x| + |y|. Archimedisches Axiom. Im angeordneten Körper der reellen Zahlen R gibt es zu x, y ∈ R mit x > 0 ein n ∈ N mit nx > y. 19 3. Angeordnete Körper Satz 3.7. Es sei (K, +, ·, K+ ) ein angeordneter Körper. Dann sind die folgenden Aussagen äquivalent. a) Es gilt das Archimedische Axiom. b) Für alle x, ε ∈ K mit ε > 0 gibt es ein a ∈ Q ⊂ K mit |x − a| < ε. c) Für alle x ∈ K gibt es ein z ∈ Z ⊂ Q ⊂ K mit |x − z| < 1. Definition 3.8. In einem archimedisch angeordneten Körper (K, +, ·, K+ ) setzen wir für alle x ∈ K [x] = max {n ∈ Z ⊂ K | n ≤ x}. Es gilt 0 ≤ x − [x] < 1. Beweis von Satz 3.7. Wir zeigen die Aussage durch Ringschluss: a) ⇒ b)“: Seien x, ε ∈ K mit ε > 0 gegeben. Es ist zu zeigen, dass es ein a ∈ Q ” mit |x − a| < ε gibt. Nach dem archimedischen Axiom existiert ein n ∈ N mit n · ε > 1, also ε > n1 . Setze m := [nx]. Wegen 0 ≤ nx − m < 1 ist dann 0≤ nx n − m n < 1 n und dies liefert 0≤x− m n < 1 n < ε. b) ⇒ c)“: Sei x ∈ K gegeben. Wähle zu ε = 12 ein a ∈ Q mit |x − a| < 12 . Wähle ” zu a ∈ Q ein z ∈ Z mit |a − z| ≤ 12 . Es gilt dann wegen der Dreiecksungleichung |a − z| ≤ |x − a| + |a − z| < 1 2 + 1 2 = 1. c) ⇒ a)“: Es seien x, y ∈ K mit x > 0 gegeben. Es ist zu zeigen, dass es ein ” n ∈ yN mit nx > y gibt. Ohne Einschränkung gilt y > 0. Wähle z ∈ Z mit z − < 1. Dann ist x z+1− y x >0 und es folgt x(z + 1) > y. 20 4 4. Grenzwerte Grenzwerte In diesem Abschnitt bezeichnet (R̃, +, ·, R̃+ ) einen archimedisch angeordneten Körper. Definition 4.1. Eine Folge in R̃ ist eine Abbildung N → R̃, n 7→ an . Man schreibt (an )n∈N oder (an ) oder (a0 , a1 , a2 , . . .). Beispiel. Sei a ∈ R̃. (i) an = a, n ∈ N (konstante Folge). (ii) an = n1 . (iii) an = 2n . (iv) an = (−1)n . Ist n0 ∈ Z, so heißt (an0 , an0 +1 , . . .) = (an )n≥n0 ebenfalls eine Folge. Definition 4.2. Eine Folge (an )n∈N in R̃ heißt konvergent gegen a ∈ R̃ genau dann, wenn Folgendes gilt: Für alle ε ∈ R̃ mit ε > 0 gibt es ein N ∈ N, so dass für alle n ∈ N gilt: |an − a| < ε; oder äquivalent dazu: a − ε < an < a + ε. Letzteres gilt wegen an − a < ε an < a + ε ⇐⇒ ∧ |an − a| < ε ⇐⇒ ∧ a − an < ε an > a − ε Notation. Eine ε−Umgebung von a ∈ R̃ ist die Menge {x ∈ R̃ | |x − a| < ε} = {x ∈ R̃ | a − ε < x < a + ε} =]a − ε, a + ε[. Dabei ist implizit klar, dass ε > 0 ist. Umformulierung: (an ) ist konvergent gegen a genau dann, wenn jede ε−Umgebung von a alle bis auf endlich viele an enthält. Schreibweise. (an )n∈N konvergent gegen a ∈ R̃ ⇔: limn→∞ an = a. Korollar 4.3. Zu x ∈ R̃ gibt es eine Folge (an )n∈N von Zahlen in Q, d.h. an ∈ Q ⊂ R̃, mit limn→∞ an = x. 21 4. Grenzwerte Beweis. Nach Satz 3.7 gibt es zu ε = n1 ein an ∈ Q mit |x − an | < n1 . Man zeigt nun limn→∞ an = x. Sei dazu ε > 0 gegeben. Wähle N ∈ N mit N · ε > 1. Das ist nach dem archimedischen Axiom möglich. Dann ist ε > N1 und es folgt |x − an | < n1 ≤ N1 < ε für alle n ≥ N . Satz 4.4. Es gilt: a) an = 1 n konvergiert gegen 0. b) Für x ∈ R̃ mit |x| < 1 ist an = xn konvergent gegen 0. Beweis von a). Sei ε > 0 gegeben. Wähle ein N ∈ N mit N · ε > 1 (archimedisches Axiom). Es gilt für alle n ≥ N 1 n und somit ≤ 1 N 1 − 0 = n <ε 1 n < ε. Lemma 4.5 (Bernoullische Ungleichung). Es sei h ∈ R̃ mit h ≥ −1, n ∈ N. Dann gilt (1 + h)n ≥ 1 + n · h. Beweis. (IB) n = 0: Klar. (IS) n 7→ n + 1: Mit (1 + h) ≥ 0 gilt (1 + h)n+1 = (1 + h) · (1 + h)n IV ≥ (1 + h) · (1 + nh) = 1 + h + nh + nh2 ≥ 1 + (n + 1)h. Jakob Bernoulli 1655-1705 Beweis von Satz 4.4 b). Ohne Einschränkung gilt |x| = 6 0. 1 Definiere h > 0 durch |x| = 1 + h. Sei ε > 0 gegeben. Es ist zu zeigen, dass es ein N ∈ N gibt mit |x|n = |xn − 0| < ε für alle n ≥ N . Nach dem archimedischen Axiom gibt es ein N ∈ N mit n 1 = (1 + h)n ≥ 1 + n · h > 1ε |x| für alle n ≥ N . Dann ist ε > |x|n für alle n ≥ N . 22 4. Grenzwerte Satz 4.6. Sind (an )n∈N eine Folge in R̃ und a, a0 ∈ R̃ mit limn→∞ an = a und limn→∞ an = a0 , so gilt a = a0 . Beweis. Wir zeigen die Aussage durch Widerspruch. 0| Angenommen, es ist a 6= a0 . Wähle zu ε = |a−a > 0 ein N1 , N2 ∈ N mit 2 |a − an | < ε für alle n ≥ N1 , |a0 − an | < ε für alle n ≥ N2 . Es folgt 2ε = |a − a0 | = |(a − an ) − (a0 − an )| ≤ |a − an | + |a0 − an | < ε + ε für alle n ≥ max{N1 , N2 }. Die Aussage ist falsch. Also ist a = a0 . Definition 4.7. Eine Folge (an )n∈N heißt nach oben (unten) beschränkt, wenn es ein c ∈ R̃ gibt mit an ≤ c für alle n ∈ N (an ≥ c für alle n ∈ N). Eine Folge heißt beschränkt, wenn sie nach oben und unten beschränkt ist. Eine Folge heißt monoton wachsend (fallend), wenn an+1 ≥ an (an+1 ≤ an ) für alle n ∈ N gilt. Satz 4.8. Eine konvergente Folge ist beschränkt. Beispiel. Die Folge ( 1 an = (−1) = −1 n für gerade n für ungerade n ist beschränkt, aber nicht konvergent. Beweis von Satz 4.8. Sei (an )n∈N konvergent. Setze a := lim an . Wähle zu ε = 1 ein N ∈ N mit |a − an | < 1 für alle n ≥ N. Setze h := max{|a − a0 |, . . . , |a − aN −1 |, 1}. Dann ist für alle n ∈ N |a − an | ≤ h und somit a − h ≤ an ≤ a + h. Satz 4.9 (Grenzwertsätze). Es seien (an ), (bn ) Folgen in R̃ mit limn→∞ an = a und limn→∞ bn = b. Dann gilt: 23 4. Grenzwerte a) limn→∞ (an + bn ) = a + b. b) limn→∞ (an · bn ) = a · b. c) limn→∞ (an − bn ) = a − b. d) Gilt b 6= 0, so gibt es ein n0 ∈ N mit bn 6= 0 für alle n ≥ n0 und limn→∞ abnn = ab . e) Gilt an ≤ bn für alle n ∈ N, so folgt a ≤ b. Beweis. a) Sei ε > 0 gegeben. Es ist zu zeigen, dass es ein N ∈ N gibt mit |(an + bn ) − (a + b)| < ε für alle n ≥ N . Nach Voraussetzung gibt es zu ε1 := mit |an − a| < ε1 = |bn − b| < ε1 = ε 2 ε 2 ε 2 Zahlen N1 , N2 ∈ N für alle n ≥ N1 , für alle n ≥ N2 . Dann ist |(an + bn ) − (a + b)| ≤ |an − a| + |bn − b| < ε 2 + ε 2 =ε für alle n ≥ max{N1 , N2 } = N . b) Nach Satz 4.8 gibt es B1 , B2 ∈ R̃ mit |an | ≤ B1 für alle n ∈ N, |bn | ≤ B2 für alle n ∈ N. Setze B := max{B1 , B2 , |a|, |b|}. Sei ε > 0 gegeben. Es ist zu zeigen, dass ε es ein N ∈ N gibt mit |an bn − ab| < ε für alle n ≥ N . Zu ε1 := 2B gibt es ein N1 ∈ N und ein N2 ∈ N mit |a − an | < ε1 = |b − bn | < ε1 = ε 2B ε 2B für alle n ≥ N1 , für alle n ≥ N2 . Es folgt |ab − an bn | = |ab − abn + abn − an bn | ≤ |ab − abn | + |abn − an bn | = |a| · |b − bn | + |a − an | · |bn | ≤B· =ε für alle n ≥ max{N1 , N2 } = N . ε 2B + ε 2B ·B 24 4. Grenzwerte c) Nach a) reicht es zu zeigen, dass limn→∞ −bn = −b ist. (Übung) d) Es reicht limn→∞ b1n = 1b zu zeigen. Wähle zunächst zu ε0 = mit |b − bn | ≤ 2b für alle n ≥ n0 . Dann ist für alle n ≥ n0 2|b| > |bn | > 2b . |b| 2 ein n0 ∈ N Es sei nun ε> 0 gegeben. Es ist zu zeigen, dass es ein N ∈ N mit N ≥ n0 2 und b1n − 1b < ε für alle n ≥ N gibt. Wähle dafür zu ε0 := b 2·ε > 0 ein N ∈ N mit N ≥ n0 und |bn − b| < ε0 für alle n ≥ N . Dann ist für alle n ≥ N ≥ n0 1 |b−b | 1 bn − b = |b·bnn| < ε. e) Wir beweisen die Aussage durch Widerspruch. Angenommen, es ist a > b. Wähle zu ε = a−b 2 ein N ∈ N mit |a − an | < ε und |b − bn | < ε für alle n ≥ N . Dann gilt für jedes n ≥ N |(a − b) − (an − bn )| < 2ε = a − b, also (a − b) − (an − bn ) < a − b und es folgt an > bn . Dies ist ein Widerspruch. Einschub: Quantoren, Verneinung von Aussagen. Oft ist es hilfreich, mathematische Aussagen mithilfe von logischen Operatoren auszudrücken. Von besonderer Bedeutung sind dabei der Existenzquantor, der Allquantor und die Negation: ∃ = ˆ existiert; es existiert ein; existieren, ∃! = ˆ es existiert genau ein, ∀ = ˆ für alle, ¬ = ˆ nicht, ∧ = ˆ und, ∨ = ˆ oder, gilt, falls er einem ∀ folgt, : = ˆ mit; derart, dass, falls er einem ∃ folgt. 25 4. Grenzwerte Dabei gelten folgende Zusammenhänge: Es sei M eine Menge und für jedes m ∈ M sei A(m) eine Aussage. Wir setzen A := [∀ m ∈ M : A(m) ist wahr ] = [∀ m ∈ M : A(m) ], B := [∃ m ∈ M : A(m) ist wahr ] = [∃ m ∈ M : A(m) ], Dann gilt: Die Aussage A ist falsch. ⇔ [∃ m ∈ M : ¬A(m)], Die Aussage B ist falsch. ⇔ [∀ m ∈ M : ¬A(m)]. Etwas verkürzt kann man sich den Zusammenhang merken als ¬∀m ∈ M : . . . = ˆ ∃m ∈ M : ¬ . . . ¬∃m ∈ M : . . . = ˆ ∀m ∈ M : ¬ . . . Bei Aussagen, die mehr als einen Quantor involvieren, kann man nach diesem Muster Aussagen verneinen. Oft wird die Menge M implizit beschrieben: ∀ε > 0 :“ kann man natürlich ” komplizierter schreiben als ∀ε ∈ {x ∈ R | x > 0} :“. ” Beispiel. In Quantorenschreibweise ist (vgl. Definition 5.1) [an ist eine Cauchyfolge] ⇔ [Für alle ε > 0 gibt es ein N ∈ N mit |an − am | < ε für alle n, m ≥ N.] ⇔ [∀ε > 0 ∃N ∈ N : (∀n, m ≥ N : |an − am | < ε)]. Wir erhalten nun [an ist keine Cauchyfolge] ⇔ [¬(∀ε > 0 ∃N ∈ N : (∀n, m ≥ N : |an − am | < ε))] ⇔ [∃ε > 0 ∀N ∈ N : ∃n, m ≥ N : |an − am | ≥ ε)]. Entsprechend drehen sich beim Verneinen von Aussagen die Rollen von ∧ und ∨ um. Sind A und B zwei Aussagen, so ist die Verneinung von A ∧ B gegeben durch (¬A) ∨ (¬B). Analog ist ¬(A ∨ B) = (¬A) ∧ (¬B). Notation. Sei A(m) eine Aussage für m ∈ M . Man schreibt A(m) gilt für fast alle m ∈ M :⇔ {m ∈ M | A(m) ist falsch } ist endlich. 26 5 5. Das Vollständigkeitsaxiom und Folgerungen Das Vollständigkeitsaxiom und Folgerungen Definition 5.1. Sei (an )n∈N eine Folge in einem archimedisch angeordnetem Körper. Die Folge (an )n∈N heißt eine Cauchyfolge, wenn es für alle ε > 0 ein N ∈ N gibt, so dass |an − am | < ε für alle n, m ≥ N gilt. Satz 5.2. Jede konvergente Folge ist eine Cauchyfolge. Beweis. Es gelte limn→∞ an = a. Zu zeigen ist, dass (an ) eine Cauchyfolge ist. Für ein gegebenes ε > 0 müssen wir also ein N ∈ N finden, so dass für alle n, m ≥ N |an − am | < ε gilt. Nach Voraussetzung gibt es zu ε1 = 2ε > 0 ein N ∈ N mit |an − a| < alle n ≥ N . Die Behauptung folgt nun aus der Dreiecksungleichung. ε 2 für Vollständigkeitsaxiom. Jede reelle Cauchyfolge konvergiert. Satz 5.3. Es sei (an )n∈N eine monotone beschränkte Folge in R. Dann ist (an )n∈N konvergent. Beweis. Wir nehmen ohne Einschränkung an, dass die beschränkte Folge (an ) monoton wachsend ist. Andernfalls können wir an durch −an ersetzen. Wegen des Vollständigkeitsaxioms reicht es nachzuweisen, dass an eine Cauchyfolge ist. Wir argumentieren mittels Widerspruch und nehmen an, dass (an ) keine Cauchyfolge ist. Wie im Einschub erläutert bedeutet dies: Es gibt ein ε > 0 derart, dass ∀N ∈ N : (∃n, m ≥ N : |an − am | ≥ ε) (5.1) Wir wollen nun mit Hilfe dieser Aussage Folgendes verifizieren. Behauptung. Es gibt natürliche Zahlen n0 < n1 < . . . mit anj − anj−1 ≥ ε für alle j ≥ 1. Wir wollen nj induktiv definieren. (IB) Wähle n0 = 0. (IV) Es seien bereits n0 < . . . < nj definiert mit anh − anh−1 ≥ ε für alle h mit 1 ≤ h ≤ j. (IS) Gesucht ist nun ein nj+1 mit anj+1 − anj ≥ ε. Wir benutzen die Aussage (5.1) für N = nj . Mithin gibt es l ≥ m ≥ nj mit |al − am | ≥ ε. Da (an ) monoton wachsend ist, impliziert dies al − anj ≥ ε. Also können wir nj+1 = l definieren. Damit ist die Behauptung bewiesen. Um nun einen Widerspruch zu bekommen zeigen wir, dass (an ) unbeschränkt ist. In der Tat folgt anj ≥ a0 + jε und 5. Das Vollständigkeitsaxiom und Folgerungen 27 nach dem archimedischen Axiom gibt es zu jeder Zahl S ∈ R ein j ∈ N derart, dass die rechte Seite der Ungleichung größer als S ist. Folglich ist an nicht nach oben beschränkt und wir erhalten einen Widerspruch. Damit ist der Satz bewiesen. Satz 5.4. Es sei M ⊂ R eine nicht leere Teilmenge, die nach oben beschränkt ist. Dann besitzt M genau eine kleinste obere Schranke. Beweis. Die Eindeutigkeit ist offensichtlich. Wir zeigen also die Existenz. Dazu setze als die Menge der oberen Schranken S := {c | c ist obere Schranke von M } = {c | ∀x ∈ M : x ≤ c}. Es ist nun zu zeigen, dass S ein kleinstes Element besitzt. Wähle dazu N ∈ N mit N ∈ S und setze für alle n ∈ N n o S(n) = 2kn k ∈ Z, ∀x ∈ M : x ≤ 2kn ≤ N . Offenbar gilt S(n) ⊂ S und N ∈ S(n). Sei x0 ∈ M und z0 ∈ Z mit z0 ≤ x0 . Ist nun 2kn ≥ x für alle x ∈ M , so ist insbesondere auch 2kn ≥ x0 ≥ z0 , also gilt n o S(n) ⊂ 2kn k ∈ Z, z0 ≤ 2kn ≤ N . Damit ist S(n) endlich und nicht leer. Setze an := min S(n). Wir zeigen nun zunächst, dass (an )n∈N eine konvergente Folge ist, deren Grenzwert eine obere und von M ist. ksogar die kleinste kobere Schranke Da an ∈ S(n) ⊂ 2n | k ∈ Z, z0 ≤ 2n ≤ N ist, sind z0 und N untere und obere Schranken von (an )n∈N . Offenbar gilt S(n) ⊂ S(n + 1), was an+1 ≤ an impliziert. Also ist (an )n∈N eine monotone beschränkte Folge und somit nach Satz 5.3 konvergent. Setze a := limn→∞ an . Sei x ∈ M beliebig. Da x ≤ an für jedes n ∈ N gilt, ist auch x ≤ a. Da dies für alle x ∈ M gilt, ist a eine obere Schranke von M . Um zu zeigen, dass a schon die kleinste obere Schranke ist, zeigen wir zunächst, dass es eine Folge (bn )n∈N in M gibt mit an − 21n ≤ bn : Wäre an − 21n eine obere Schranke von M , so wäre an − 21n ∈ S(n), was ein Widerspruch zu an = min S(n) ist. Also gibt es ein bn ∈ M mit an − 21n ≤ bn . Ist a0 < a, so folgt a0 < an − 21n für ein genügend großes n. Also ist a0 < bn und darum a0 ist keine obere Schranke. Mithin ist a die kleinste obere Schranke. Definition 5.5. Sei M ⊂ R. 28 5. Das Vollständigkeitsaxiom und Folgerungen a) Ist M nicht leer und nach oben beschränkt, so definiert man sup M als die kleinste obere Schranke von M . b) Ist M nach oben unbeschränkt, dann ist sup M = ∞. c) Schließlich ist sup ∅ = −∞. d) Die größte untere Schranke wird definiert durch inf M = − sup{−x | x ∈ M }. Satz 5.6. Ist c > 0 und n ∈ N, n ≥ 1, so hat die Gleichung xn = c genau eine √ √ positive Lösung n c und es gilt n c = sup{x | xn ≤ c}. Bemerkung. Für x, y ≥ 0 gilt xn > y n ⇔ x > y. Beweis von Satz 5.6. Die Eindeutigkeit folgt direkt aus der Bemerkung. Es genügt also, die Existenz zu zeigen. Sei M = {x | xn ≤ c}. Wegen c > 0 ist (c + 1)n > c und zusammen mit xn ≤ c folgt x ≤ c + 1. Also ist c + 1 eine obere Schranke für M . Außerdem ist 0 ∈ M , also ist M nicht leer. Nach Satz 5.4 besitzt M eine kleinste obere Schranke a = sup M . Es bleibt an = c zu zeigen, da daraus das Gewünschte folgt. Angenommen, es ist an > c. Aus den Grenzwertsätzen folgt limk→∞ (a− k1 )n > c. Für ein genügend großes k gilt (a − k1 )n > c ≥ xn für alle x ∈ M . Dann ist auch a − k1 ≥ x für alle x ∈ M . Also ist a − k1 eine obere Schranke von M . Dies ist ein Widerspruch. Angenommen, es ist an < c. Für ein genügend großes k gilt dann (a + k1 )n < c, also a + k1 ∈ M . Dies ist ein Widerspruch, da a eine obere Schranke von M ist. √ n Man definiert 0 := 0, n ≥ 1. Ist n ≥ 1 ungerade und c < 0, dann setzt man √ √ n c := − n −c. Satz 5.7 (Schachtelungssatz). Seien (an ), (bn ) und (cn ) Folgen in einem archimedisch angeordneten Körper mit an ≤ bn ≤ cn für alle n. Gilt weiter lim an = lim cn = a, so ist auch lim bn = a. Beweis. Zu ε > 0 gibt es ein n0 ∈ N mit |an − a| ≤ ε und |cn − a| ≤ ε für alle n ≥ n0 . Es folgt a − ε ≤ an ≤ bn ≤ cn ≤ a + ε. Daher gilt |bn − a| ≤ ε für alle n ≥ n0 . Beispiel. Es ist √ a) n n → 1, 29 5. Das Vollständigkeitsaxiom und Folgerungen b) limn→∞ q k 1 n = 0. Es gilt nämlich: q b) Die Folge k n1 ist monoton fallend und beschränkt, also konvergent. q k Die Grenzwertsätze liefern, dass limn→∞ k n1 = limn→∞ n1 = 0 ist. n∈N a) Für n ≥ 2 ist 1 ≤ √ n n. Weiterhin gilt n X k n q q n n 2 2 1 + n−1 = ≥ · n−1 k 2 2 n−1 = n, k=0 zusammen also 1 ≤ die Behauptung. q √ 2 n . Mit dem Schachtelungssatz 5.7 folgt n ≤ 1 + n−1 Satz 5.8. Es sei c > 0, a0 > 0 und an+1 := 12 (an + c an ). a) Dann ist an konvergent mit Grenzwert limn→∞ an = b) Setze (1 + fn ) := an √ . c Dann gilt fn+1 = √ c. fn2 2(1+fn ) . Beweis. a) Wir zeigen zunächst in zwei Schritten, dass die nichtnegative Folge (an )n∈N monoton fallend ist. Dann ist die Folge nach Satz 5.3 konvergent. Genauer zeigen wir: (i) Für alle n ≥ 1 ist (an )2 ≥ c. (ii) Für alle n ≥ 1 ist an+1 ≤ an . Für alle n ≥ 1 ist (an )2 = = 1 4 1 4 ≥ c. Daraus folgt weiter an ≥ c an an−1 + an−1 − c an−1 c an−1 2 2 +c 30 5. Das Vollständigkeitsaxiom und Folgerungen und somit an ≥ 1 2 an + c an = an+1 . Also ist (an )n≥1 eine monoton fallende, nichtnegative Folge und somit konvergent, d.h. a = limn→∞ an existiert. Wegen a2 = lim (an )2 ≥ c > 0 n→∞ ist a > 0. Die Grenzwertsätze liefern nun a = lim an+1 = lim an + n→∞ und somit a = √ n→∞ c an = 1 2 a+ c a c. b) Nach Definition von an und fn ist an 1 + fn+1 = 21 √ + c √ c an Es folgt 1 2 fn+1 = = −1 + fn + 1 2 1 1+fn Das Verfahren konvergiert also sehr schnell. 1 + fn + = 1 1+fn . 1 fn2 2 1+fn . Der folgende Satz zeigt, dass die Köperaxiome und Anordnungsaxiome zusammen mit dem archimedischen Axiom und dem Vollständigkeitsaxiom die reellen Zahlen in der Tat eindeutig charakterisieren. Satz 5.9 (Eindeutigkeit der reellen Zahlen). Es sei R̃ ein archimedisch angeordneter vollständiger Körper. Dann gibt es eine bijektive Abbildung ῑ : R → R̃ derart, dass für alle x, y ∈ R gilt ῑ(x ± y) = ῑ(xy) = ῑ( x1 ) = ῑ(x) ± ῑ(y), ῑ(x)ῑ(y), 1 ῑ(x) , x > 0 ⇔ ῑ(x) > 0, ῑ(0) = 0 ῑ(1) = 1. falls x 6= 0, und 5. Das Vollständigkeitsaxiom und Folgerungen 31 Lemma 5.10. Sei R̃ ein archimedisch angeordneter Körper und sei ι : Q → R̃ die nach Satz 3.4 eindeutig bestimmte Einbettung von Q in R̃. Weiter sei qn ∈ Q für n ∈ N. Dann ist (ι(qn )) genau dann eine Cauchyfolge in R̃, wenn (qn ) eine Cauchyfolge in Q ist. Weiterhin ist (ι(qn )) genau dann eine Nullfolge in R̃, wenn (qn ) eine Nullfolge in Q ist. Beweis. Nach Definition 5.1 ist (ι(qn )) eine Cauchyfolge in R̃ genau dann, wenn ∀ε ∈ {x ∈ R̃ | x > 0} ∃N ∈ N : ∀n, m ≥ N : |ι(qn ) − ι(qm )| < ε. Dies impliziert offensichtlich ∀ε ∈ {x ∈ Q | x > 0} ∃N ∈ N : ∀n, m ≥ N : |ι(qn ) − ι(qm )| < ι(ε), was wiederum äquivalent dazu ist, dass (qn ) eine Cauchyfolge in Q ist, da die letzte Ungleichung gemäß Satz 3.4 äquivalent zu |qn − qm | < ε ist. Sei nun umgekehrt (qn ) eine Cauchyfolge in Q. Dann gibt es zu einem beliebigem ε ∈ {x ∈ R̃ | x > 0} ein positives k ∈ N mit ι k1 < ε, da nach Satz 4.4 ι( k1 ) k≥1 eine Nullfolge in R̃ ist. Zur rationalen Zahl ε2 = k1 > 0 gibt es dann aber ein N ∈ N mit |qn − qm | < 1 k für alle n, m ≥ N . Mit Satz 3.4 folgt |ι(qn ) − ι(qm )| < ι 1 k < ε für alle n, m ≥ N . und also ist ι(qn ) eine Cauchyfolge in R̃. Der Beweis des zweiten Teils des Lemmas ist ähnlich. Beweis von Satz 5.9. Wie zuvor gehen wir davon aus, dass Q nicht nur bis auf Isomorphie ein Unterkörper von R ist, sondern dass tatsächlich Q ⊂ R gilt. Nach Satz 3.4 gibt es eine kanonische injektive Abbildung ι : Q → R̃, die mit Addition, Subtraktion und Multplikation verträglich ist. Wir wollen nun zeigen, dass wir ι zu einer Abbildung ῑ : R → R̃ wie im Satz fortsetzen können. Der Begriff des Grenzwertes ist sowohl in R als auch in R̃ erklärt. Wir reservieren das Symbol f lim für eine Grenzwertbildung in R und schreiben in R̃ abweichend lim. Sei nun x ∈ R beliebig. Nach Korollar 4.3 gibt es eine Folge rationaler Zahlen qn ∈ Q mit limn→∞ qn = x. Nach Lemma 5.10 ist dann (ι(qn )) eine Cauchyfolge in R̃ und da auch R̃ vollständig ist, ist sie konvergent. Wir setzen ῑ(x) := ] lim ι(qn ). n→∞ 32 5. Das Vollständigkeitsaxiom und Folgerungen Wir müssen zunächst überlegen, dass dies wohldefiniert ist. Ist pn ∈ Q eine weitere Folge rationaler Zahlen mit limn→∞ pn = x, so ist (qn −pn ) eine rationale Nullfolge in R. Wegen Lemma 5.10 ist (qn − pn ) eine Nullfolge in Q, und weiter f n→∞ ι(qn ) = ist (ι(qn − pn )) = (ι(qn ) − ι(pn )) eine Nullfolge in R̃. Also folgt lim f limn→∞ ι(pn ). Es seien x, y ∈ R beliebig. Wir wählen rationale Folgen (pn ) und (qn ) mit x = limn→∞ pn und y = limn→∞ qn . Aus den Grenzwertsätzen in R̃ und R folgt dann ῑ(x ± y) = ῑ lim (pn ± qn ) = ] lim ι(pn ) ± ι(qn ) = ῑ(x) ± ῑ(y). n→∞ n→∞ Analog sieht man ῑ(x · y) = ῑ(x) · ῑ(y). Für x 6= 0 ist 1 = ῑ(x−1 x) = ῑ(x−1 )ῑ(x). Dies impliziert ῑ(x) 6= 0 und −1 ῑ(x ) = ῑ(x)−1 . Weiterhin folgt die Injektivität von ῑ, da aus ῑ(a) = ῑ(b) auch ῑ(a − b) = 0 folgt, was a − b = 0 impliziert, denn x = a − b 6= 0 würde, wie eben gesehen, ῑ(a − b) 6= 0 nach sich ziehen. Um zu sehen, dass ῑ surjektiv ist, wählen wir gemäß Korollar 4.3 zu y ∈ R f n→∞ ι(qn ) = y. Da die Cauchyfolge eine Folge rationaler Zahlen qn ∈ Q mit lim f n→∞ qn = x und aus der (qn ) konvergent in R ist, gibt es also x ∈ R mit lim Definition von ῑ folgt ῑ(x) = y. Schließlich ist noch zu zeigen, dass x > 0 in R äquivalent ist zu ῑ(x) > 0 in R̃. Ist x > 0, so gibt es ein a ∈ R \ {0} mit a2 = x (Satz 5.6) und es folgt ῑ(x) = ῑ(a)2 > 0. Ist x ≤ 0, so gibt es ein a ∈ R mit a2 = −x und es folgt −ῑ(x) = ῑ(a)2 ≥ 0 und somit ῑ(x) ≤ 0. Damit ist die Äquivalenz aber bewiesen. Satz 5.11. Es sei M eine nach oben beschränkte nicht leere Teilmenge von R. Dann gibt es zu jedem ε > 0 ein x ∈ M mit (sup M − ε) < x ≤ sup M . Beweis. Setze a = sup M und sei ε > 0. Da a die kleinste obere Schranke ist, ist a − ε keine obere Schranke von M . Mithin gibt es x ∈ M mit a − ε < x. Außerdem ist natürlich x ≤ a, da a eine obere Schranke ist. Definition 5.12. Sei (an )n∈N eine Folge in R. a) Sind n0 < n1 < . . . natürliche Zahlen, so heißt (ank )k∈N eine Teilfolge von (an )n∈N . b) Ein a ∈ R heißt ein Häufungspunkt von (an )n∈N , falls für alle ε > 0 die Menge {n ∈ N | |an − a| < ε} unendliche Ordnung hat. 33 5. Das Vollständigkeitsaxiom und Folgerungen Bemerkung 5.13. Für eine Folge (an )n∈N und a ∈ R sind äquivalent: a) a ist ein Häufungspunkt von (an )n∈N . b) Es gibt eine Teilfolge (ank )k∈N mit limk→∞ ank = a. Beweis. Wir zeigen zunächst a) ⇒ b)“. Da a ein Häufungspunkt ist, ist für ” jedes k ∈ N die Menge 1 Mk = n | |a − an | < k+1 . unendlich groß. Wir können nun natürliche Zahlen n0 < n1 < . . . finden mit ank ∈ Mk . Dies kann zum Beispiel mittels Induktion zeigen. (IB) k = 0. Wähle n0 ∈ M0 beliebig. (IV) Es seien bereits n0 < . . . < nk definiert mit ah ∈ Mh , h = 0, . . . , k. (IS) k 7→ k + 1: Da Mk+1 ⊂ N unendlich ist, gibt es nk+1 > nk mit nk+1 ∈ Mk+1 , zum Beispiel können wir das eindeutig bestimmte minimale Element nk+1 ∈ N mit diesen Eigenschaften auswählen. 1 Die so definierte Teilfolge (ank )k∈N erfüllt nun |a − ank | < k+1 . Mit dem Schachtelungssatz folgt limk→∞ |a − ank | = 0 und also limk→∞ ank = a. b) ⇒ a)“: Sei ank eine Teilfolge mit limk→∞ ank = a. Für ε > 0 gibt es dann ” ein k0 , so dass |ank − a| < ε für alle k ≥ k0 ist. Also ist {nk | k ≥ k0 } ⊂ {n ∈ N | |an − a| < ε} und mithin sind beide Mengen unendlich groß. Satz 5.14 (Bolzano Weierstraß). Jede beschränkte Folge besitzt eine konvergente Teilfolge. Bernhard Bolzano (1781-1848) Karl Weierstraß (1815-1897) Beweis. Es sei (an )n∈N eine beschränkte Folge. Wähle C ∈ R mit an ≥ C für alle n ∈ N. Setze bk := sup{an | n ≥ k}. 34 5. Das Vollständigkeitsaxiom und Folgerungen Es gilt bk ≥ C sowie bk+1 ≤ bk für alle k ∈ N. Wegen Satz 5.3 ist bk konvergent. Wir setzen b := limk→∞ bk und nach Bemerkung 5.13 reicht es zu zeigen, dass b ein Häufungspunkt von (an )n∈N ist. Sei dazu ein ε > 0 gegeben. Es ist zu zeigen, dass {n | |an − b| < ε} nicht endlich ist. Wir wählen ein k0 ∈ N mit |bk − b| < 2ε für alle k ≥ k0 . Außerdem wählen wir gemäß Satz 5.11 zu jedem bk := sup{an | n ≥ k} ein nk ≥ k mit |bk − ank | < 2ε . Zusammen ergibt sich |b − ank | < |bk − ank | + |bk − b| < ε für alle k ≥ k0 . Folglich ist {nk | k ≥ k0 } ⊂ {n | |an − b| < ε}. Da nk ≥ k für alle k ∈ N gilt, ist klar, dass die erste Menge und mithin die zweite Menge nicht endlich ist. Definition 5.15. Es sei (an )n∈N eine reelle Folge. Dann definiert man: a) lim supn→∞ an = ∞, falls an nach oben unbeschränkt ist. b) lim supn→∞ an = limn→∞ sup{ak | k ≥ n} , falls an nach oben beschränkt ist und die rechte Seite existiert. c) lim supn→∞ an = −∞, falls an nach oben beschränkt ist und die rechte Seite der Gleichung in b) nicht existiert. d) lim inf n→∞ an = − lim supn→∞ −an . e) Gilt lim supn→∞ an = −∞ bzw. lim inf n→∞ an = ∞, so sagen wir die ” Folge ist bestimmt divergent gegen −∞ bzw. ∞“. Wir schreiben dann kürzer limn→∞ an = −∞ bzw. limn→∞ an = ∞. Dabei ist zu beachten, dass für eine nach oben beschränkte Folge die Folge auf der rechte Seite der Gleichung in b) monoton fallend ist und ihr Grenzwert genau dann existiert, wenn sie nach unten beschränkt ist. Beispiel 5.16. a) Die Folge an = (−1)n hat genau die beiden Häufungspunkte 1 = lim sup an und −1 = lim inf an . b) Ist k eine positive ganze Zahl, so hat die Folge an = k · nk − nk die Häufungspunkte 0, 1, . . . , k − 1. 6. Konstruktion der reellen Zahlen 35 c) Ist x > 0 eine irrationale Zahl und an = nx − [nx], dann ist das Einheitsintervall [0, 1] = {y | 0 ≤ y ≤ 1} die Menge der Häufungspunkte von (an ). (Übung) d) Die Folge an = n · (−1 + (−1)n ) ist nach unten unbeschränkt. Es gilt lim supn→∞ an = 0 und lim inf n→∞ an = −∞. e) Es gilt limn→∞ 2n = ∞. Bemerkung. a) Für den Fall einer beschränkten Folge (an ) haben wir im Beweis von Satz 5.14 gezeigt, dass lim sup an ein Häufungspunkt von (an ) ist, und der Beweis überträgt sich wortgleich auf den allgemeineren Fall lim sup an 6= ±∞. Es ist dann leicht einzusehen, dass lim sup an der größte Häufungspunkt ist. b) Es gilt lim sup an = inf{x ∈ R | an ≤ x für fast alle n}. Insbesondere impliziert lim sup an < x, dass sich fast alle Folgenglieder an links von x befinden“. Wegen der Konvention inf ∅ = ∞ stimmt die ” Gleichung selbst im Falle einer nach oben unbeschränkten Folge. 6 Konstruktion der reellen Zahlen In den Abschnitten 2–5 haben wir gesehen, dass es bis auf Isomorphie höchstens einen archimedisch angeordneten vollständigen Körper gibt, vgl. Satz 5.9. Weiterhin haben wir diverse Eigenschaften eines solchen Körpers bewiesen. Offen bleibt jedoch die Existenz eines archimedisch angeordneten vollständigen Körpers. Man kann den Standpunkt vertreten, dass es gleichsam unvernünftig wäre, nicht an die Existenz der reellen Zahlen zu glauben, und es daher eine lässliche Sünde ist, dieses Problem zu ignorieren. Tatsächlich wird der Existenzbeweis auch im Weiteren keine Rolle spielen, da wir die Eigenschaften der reellen Zahlen aus den Axiomen ableiten werden und niemals die in diesem Abschnitt verwendete Definition benutzen werden. Nichtsdestotrotz ist es natürlich wichtig zu wissen, dass man die reellen Zahlen auch konstruieren kann. Deswegen werden wir in diesem Abschnitt ausgehend von der Existenz der rationalen Zahlen einen archimedisch angeordneten vollständigen Körper konstruieren. Dass der naheliegendste Weg nicht unbedingt der einfachste und sauberste ist, illustriert vielleicht die folgende 36 6. Konstruktion der reellen Zahlen Bemerkung. Wenn wir uns die Menge der reellen Zahlen wie in der Schule durch die Menge aller Dezimalbruchentwicklungen gegeben denken, dann gibt es keine endliche Formel, die die Addition definiert, denn zu jedem n kann man Zahlen in x, y ∈ [0, 1] finden derart, dass die n-te Nachkommastelle von y darüber mitentscheidet“, was die erste Nachkommastelle von x + y ist. Seien ” x = 0, 244 . . . 46, y1 = 0, 355 . . . 51 und y2 = 0, 355 . . . 57. Dabei seien die Zahlen 6, 1 und 7 an der n-ten Nachkommastelle. Es gilt dann x + y1 = 0, 59 . . . 97, aber x + y2 = 0, 60 . . . 03. Die rationalen Zahlen bilden einen archimedisch angeordneten Körper und insbesondere können wir über konvergente Folgen und Cauchyfolgen in Q reden. Satz 6.1. Sei (xn ) eine Cauchyfolge in Q. Dann gilt genau eine der drei folgenden Aussagen. a) (xn ) ist eine Nullfolge. b) (xn ) ist asymptotisch positiv, d.h. es gibt positive ganze Zahlen k und n0 mit xn ≥ k1 für alle n ≥ n0 . c) (xn ) ist asymptotisch negativ, d.h. es gibt positive ganze Zahlen k und n0 mit xn ≤ − k1 für alle n ≥ n0 . Ist (yn ) eine rationale Nullfolge, so ist (xn +yn ) genau dann asymptotisch positiv, wenn (xn ) asymptotisch positiv ist. Beweis. Es ist offensichtlich, dass es keine Folge gibt, für die mehr als eine der drei Aussagen gilt. Wir können also annehmen, dass (xn ) keine Nullfolge ist, und müssen zeigen, dass (xn ) einer der anderen beiden Aussagen genügt. Da (xn ) keine Nullfolge ist, gibt es ein positives ε ∈ Q mit |xn | = |xn − 0| ≥ ε für unendlich viele n. Da xn eine Cauchyfolge ist, gibt es n0 ∈ N mit |xn − xm | ≤ ε 2 für alle n, m ≥ n0 . Wir können nun ein n1 ≥ n0 finden mit |xn1 | ≥ ε. Es gilt dann für alle n ≥ n0 |xn − xn1 | ≤ |xn1 | 2 . 6. Konstruktion der reellen Zahlen 37 Ist nun xn1 > 0, so folgt xn ≥ x n1 2 > 0 für alle n ≥ n0 und folglich ist (xn ) ist asymptotisch positiv. Ist xn1 < 0, so folgt xn ≤ x n1 2 < 0 für alle n ≥ n0 und folglich ist (xn ) ist asymptotisch negativ. Der Zusatz ist offensichtlich. Lemma 6.2. Seien (xn ) und (yn ) zwei Cauchyfolgen in Q. Dann gilt: a) (xn ± yn ) sowie (xn · yn ) sind Cauchyfolgen. b) Ist (xn ) eine Nullfolge, so auch (xn · yn ). c) Ist (yn ) keine Nullfolge, dann gibt es ein n0 mit yn 6= 0 für alle n ≥ n0 und die Folge 0 für n < n0 zn = 1 yn für n ≥ n0 ist auch eine Cauchyfolge. Der Beweis des Lemmas ist ganz ähnlich zum Beweis der Grenzwertsätze (Satz 4.9) und sei dem Leser als Übung überlassen. Für die Konstruktion von R stellen wir uns auf den Standpunkt, dass jede rationale Cauchyfolge eine reelle Zahl repräsentiert, nämlich ihren Grenzwert. Das ist etwas paradox, da wir ja, ohne die Existenz von R anzunehmen, gerade nicht wissen, was der Grenzwert ist. Aber wir können sagen, wann zwei Cauchyfolgen (an ) und (bn ) denselben Grenzwert repräsentieren: Das ist genau dann der Fall, wenn (an − bn ) eine Nullfolge ist. Dies motiviert Teil c) der folgenden Definition. Definition 6.3. a) Sei M eine Menge. Eine Relation auf M ist eine Teilmenge R ⊂ M × M . Wir sagen, dass x ∈ M in Relation zu y ∈ M steht, kurz x ∼ y, genau dann, wenn (x, y) ∈ R ist. Eine Relation heißt Äquivalenzrelation, wenn Folgendes gilt: (i) Für alle x ∈ M gilt x ∼ x (Reflexivität). (ii) Für alle x, y ∈ M gilt x ∼ y ⇒ y ∼ x (Symmetrie). (iii) Für alle x, y, z ∈ M gilt x ∼ y ∧ y ∼ z ⇒ x ∼ z (Transitivität). 38 6. Konstruktion der reellen Zahlen b) Ist auf einer Menge M eine Äquivalenzrelation gegeben, so definiert man für x ∈ M die zugehörige Äquivalenzklasse [x] ⊂ M durch [x] = {y ∈ M | y ∼ x}. Dann bezeichnet M/ ∼:= {[x] | x ∈ M } die Menge der Äquivalenzklassen. c) Auf der Menge C = {(an )n∈N | (an ) ist Cauchyfolge in Q} definieren wir eine Relation durch (an ) ∼ (bn ) :⇔ (an − bn ) ist eine Nullfolge. Wir sagen dann, dass (an ) und (bn ) asymptotisch gleich sind. Man sollte Äquivalenzklassen nicht mit der zuvor definierten Gaußklammer verwechseln. Letztere spielt in diesem Abschnitt keine Rolle. Beispiel. a) Auf den ganzen Zahlen Z können wir eine Äquivalenzrelation definieren durch [z ∼ m] :⇔ [z − m ist durch 2 teilbar]. In diesem Fall gibt es genau zwei verschiedene Äquivalenzklassen, die geraden und die ungeraden Zahlen. b) Unter allen Studenten eines Hörsaals kann man eine Relation erklären durch: A ∼ B :⇔ [Die in den Pässen eingetragenen Körpergrößen von A und B sind gleich]. Dies ist eine Äquivalenzrelation, solange jeder über genau einen Pass mit Größenangabe verfügt. Ist A laut Pass 1,83 m groß, so besteht die Äquivalenzklasse [A] aus allen Studenten, die laut Pass 1,83 m groß sind. c) Definiert man eine Relation zwischen den Studenten eines Hörsaals durch A ∼ B :⇔ [Der Altersunterschied von A und B ist höchstens 90 Tage], dann ist das in der Regel keine Äquivalenzrelation, da zwar die Symmetrie und Reflexivität, nicht aber die Transitivität der Relation sicher gestellt ist. d) Definiert man eine Relation zwischen den Studenten eines Hörsaals durch: A ∼ B :⇔ [A und B haben Schuhe an ihren rechten Füßen, deren Schuhgrößen übereinstimmen], so ist es eine Äquivalenzrelation, wenn jeder Schuhe an hat. Hat jedoch jemand Stiefel an, fehlt die Reflexivität. e) Die Relation ≤ auf Q ist keine Äquivalenzrelation, denn es fehlt die Symmetrie. 6. Konstruktion der reellen Zahlen 39 f) Ist f : M1 → M2 eine Abbildung zwischen Mengen , so kann man auf M1 eine Äquivalenzrelation erklären durch x ∼ y :⇔ f (x) = f (y). Ist f surjektiv, dann gehört zu jedem z ∈ M2 genau eine Äquivalenzklasse, nämlich die Menge {x ∈ M1 | f (x) = z}. Im Prinzip kann man jede Äquivalenzrelation ∼ auf einer Menge M so beschreiben. Als Abbildung kann man M → M/ ∼, x 7→ [x] wählen. Lemma 6.4. a) Zwei Äquivalenzklassen einer Äquivalenzrelation auf M sind entweder gleich oder disjunkt: Für x, y ∈ M folgt aus x ∼ y die Gleichung [x] = [y] und x 6∼ y zieht [x] ∩ [y] = ∅ nach sich. b) Die Relation der asymptotischen Gleichheit ∼ auf der Menge C der rationalen Cauchyfolgen ist eine Äquivalenzrelation. Beweis. a) Sei x ∼ y. Dann impliziert x ∼ z wegen der Transitivität und Symmetrie y ∼ z und umgekehrt. Also ist [x] = [y]. Für den zweiten Teil reicht es zu zeigen, dass aus [x] ∩ [y] 6= ∅ schon x ∼ y und mithin [x] = [y] folgt. Sei z ∈ [x] ∩ [y]. Dann ist x ∼ z und z ∼ y, also wegen der Transitivität auch x ∼ y. b) Reflexivität und Symmetrie sind offensichtlich. Zur Transitivität: Es gelte (xn ) ∼ (yn ) und (yn ) ∼ (zn ). Dann sind (xn − yn ) und (yn − zn ) Nullfolgen. Nach den Grenzwertsätzen ist dann aber auch die Summe (xn − zn ) eine Nullfolge und mithin (xn ) ∼ (zn ). Wenn wir schon wüssten, dass es die reellen Zahlen R gäbe, dann wäre jede Cauchyfolge aus C konvergent in R und zwei Cauchyfolgen wären genau dann asymptotisch gleich, wenn sie denselben Grenzwert in R hätten. Wir könnten also eine Bijektion zwischen den Äquivalenzklassen C/ ∼ und R definieren, indem wir eine Äquivalenzklasse [(xn )n∈N ] auf den Grenzwert von (xn ) in R abbilden. Auch wenn wir gerade nicht die Existenz der reellen Zahlen voraussetzen wollen, zeigt diese Überlegung, dass es möglich sein sollte als zugrunde liegende Menge für die reellen Zahlen die Menge der Äquivalenzklassen C/ ∼ zu wählen. Satz 6.5 (Definition von R̄). Auf R̄ := C/ ∼ sind die Verknüpfungen + : R̄ × R̄ → R̄, ([(an )], [(bn )]) 7→ [(an + bn )] · : R̄ × R̄ → R̄, ([(an )], [(bn )]) 7→ [(an · bn )] und wohldefiniert und (R̄, +, ·) ist ein Körper. 40 6. Konstruktion der reellen Zahlen Beweis. Wir überprüfen die Wohldefiniertheit von ·. Zu zeigen ist hier: Für Cauchyfolgen (xn ) und (yn ) mit (xn ) ∼ (an ) und (yn ) ∼ (bn ) ist (xn yn ) ∼ (an bn ). Es gilt (xn · yn ) = (xn · bn ) + (xn · (yn − bn )). Nach Voraussetzung ist (yn − bn ) eine Nullfolge und wegen Lemma 6.2 ist dann auch (xn · (yn − bn )) eine Nullfolge. Damit ergibt sich aber (xn · yn ) ∼ (xn · bn ). Analog folgt (xn · bn ) ∼ (an · bn ) und damit die Behauptung. Es ist nun leicht zu sehen, dass die meisten Körperaxiome sich unmittelbar aus den Körperaxiomen für rationale Zahlen ergeben. Das neutrale Element der Addition ist die Äquivalenzklasse der Nullfolgen, 0R̄ := [(0)n∈N ]. Das neutrale Element der Multiplikation ist die Äquivalenzklasse der gegen 1 ∈ Q konvergenten Folgen, 1R̄ := [(1)n∈N ]. Das additiv Inverse von [(xn )] ist [(−xn )]. Ist [(xn )] 6= 0R̄ , dann ist (xn ) keine Nullfolge und aus Lemma 6.2 folgt, dass es eine rationale Cauchyfolge (zn ) gibt, für die (zn · xn ) konvergent gegen 1 ist. Die Äquivalenzklasse [(zn )] ist somit ein multiplikativ Inverses zu [(xn )]. Kommutativgesetze, Assoziativgesetze und das Distributivgesetz folgen aus den entsprechenden Gesetzen für das Rechnen mit rationalen Zahlen. Satz 6.6. Wir sagen, dass ein Element [(xn )] ∈ R̄ genau dann positiv ist ( zu R̄+ gehört), wenn (xn ) asymptotisch positiv ist, vergleiche Satz 6.1. Diese Begriffsbildung ist wohldefiniert und (R̄, +, ·, R̄+ ) ist ein archimedisch angeordneter Körper. Beweis. Zur Wohldefiniertheit: Ist (xn ) ∼ (yn ) und ist (xn ) asymptotisch positiv, dann ist nach dem Zusatz von Satz 6.1 auch (yn ) asymptotisch positiv. Weiterhin ist nach Satz 6.1 für jedes Element a = [(xn )] genau eine der folgenden Aussagen richtig • a = 0R̄ = ˆ (xn ) ist eine Nullfolge. • a > 0R̄ = ˆ (xn ) ist asymptotisch positiv. • −a > 0R̄ = ˆ (xn ) ist asymptotisch negativ. Es gilt also das Anordnungsaxiom (A1). Sind (xn ) und (yn ) asymptotisch positiv, so offenbar auch (xn + yn ) sowie (xn · yn ). Damit ist klar, dass auch die anderen beiden Anordnungsaxiome (A2) und (A3) erfüllt sind, vergleiche Definition 3.1. Es bleibt, das archimedische Axiom zu überprüfen. Es seien a = [(xn )] und b = [(yn )] in R̄ mit a > 0. Gesucht ist ein h ∈ N mit ha−b > 0. Dazu müssen wir zeigen, dass für ein geeignetes h ∈ N die Folge (hxn − yn ) asymptotisch positiv ist. Nach Voraussetzung gibt es eine positive ganze Zahl k derart, dass xn ≥ k1 für fast alle n gilt. Da die Cauchyfolge (yn ) beschränkt ist, gibt es eine positive 41 6. Konstruktion der reellen Zahlen rationale Zahl L mit yn < L für alle n ∈ N. Da in Q das archimedische Axiom gilt, gibt es ein h ∈ N mit hk > 2L. Damit folgt aber hxn − yn > L > 0 für fast alle n und somit die Behauptung. Satz 6.7. Der in den letzten beiden Sätzen definierte archimedisch angeordnete Körper (R̄, +, ·, R̄+ ) ist vollständig. Beweis. Zunächst eine Vorüberlegung: Da R̄ ein archimedisch angeordneter Körper ist, gibt es gemäß Satz 3.4 genau eine injektive Einbettung ι : Q → R̄ von Q in R̄. Tatsächlich ist es nicht schwer zu sehen, dass ι(q) = [(q)n∈N ] ist. Die Äquivalenzklasse ι(q) wird also durch die konstante Folge (q) repräsentiert und die Äquivalenzklasse selbst besteht aus allen gegen q konvergenten Folgen. Anders als in früheren Situationen werden wir in diesem Beweis q nicht mit ι(q) identifizieren. Wir müssen zeigen, dass in R̄ jede Cauchyfolge (ru )u∈N konvergiert. Das ist zunächst einmal etwas verwirrend, da gemäß unserer Definition ja bereits die (u) Elemente ru = [(xn )n∈N ] durch Folgen repräsentiert werden. Wir überlegen uns zunächst einen Spezialfall. Wir nehmen zusätzlich an, dass jedes ru rational ist, d.h. im Bild von ι ist. Wir können also ru durch eine konstante Folge repräsentieren. Es sei au ∈ Q mit ι(au ) = ru . Aus Lemma 5.10 folgt dann, dass (au )u∈N eine rationale Cauchyfolge ist. Wir behaupten nun, dass (ru )u∈N gegen [(an )n∈N ] konvergiert. Die Differenz von ru = ι(au ) und [(an )n∈N ] wird durch die Folge (au −an )n∈N repräsentiert. Mithin ist zu zeigen, dass [(|au − an |)n∈N ]u∈N eine Nullfolge in R̄ ist. Sei dazu ein ε1 = [(xn )n∈N ] > 0 gegeben. Die Folge (xn )n∈N ist also asymptotisch positiv und wir wählen eine hinreichend kleine positive rationale Zahl ε derart, dass (xn − ε)n∈N asymptotisch positiv bleibt. Mit anderen Worten, es gilt ι(ε) < ε1 in R̄. Da (au ) eine Cauchyfolge ist, gibt es u0 ∈ N mit |au − av | < ε 2 für alle u, v ≥ u0 . Damit folgt aber auch, dass für alle u ≥ u0 die Ungleichung ε − |au − an | > ε 2 für fast alle n ∈ N gilt. 42 6. Konstruktion der reellen Zahlen Folglich ist für u ≥ u0 die Folge (ε − |au − an |)n∈N asymptotisch positiv. Also gilt in R̄ (|au − an |)n∈N < ι(ε) < ε1 für alle u ≥ u0 , was zu zeigen war. Allgemeiner Fall. Wegen Satz 4.4 ist (ι(2−u ))u∈N eine Nullfolge in R̄. Nach Satz 3.7 gibt es zu ru eine rationale Zahl qu ∈ Q mit |(ru − ι(qu ))| ≤ ι(2−u ). Es gilt nun −ι(2−u ) ≤ (ru − ι(qu )) ≤ ι(2−u ). Aus dem Schachtelungssatz folgt somit, dass auch (ru − ι(qu ))u∈N eine Nullfolge in R̄ ist. Insbesondere ist also mit (ru ) auch (ι(qu ))u∈N eine Cauchyfolge in R̄. Der Spezialfall erlaubt uns auf die Konvergenz von (ι(qu ))u∈N in R̄ zu schließen und mit den Grenzwertsätzen folgt weiter, dass (ru ) gegen denselben Grenzwert konvergiert. Bemerkung. a) Es erscheint etwas unnatürlich, dass man beim Rechnen mit reellen Zahlen tatsächlich mit Äquivalenzklassen von rationalen Cauchyfolgen hantiert. Aber natürlich kann man für jede Bijektion σ : R̄ → M auf der Menge M die Struktur eines archimedisch angeordneten vollständigen Körpers definieren, indem man einfach die Verknüpfungen und die Anordnung von R̄ auf M überträgt. So kann man beispielsweise R̄ durch R̄ \ ι(Q) ∪Q ersetzen, um auf diese Weise einen archimedisch angeordneten vollständigen Körper zu bekommen, der Q als echten (nicht nur bis auf Isomorphie) Teilkörper enthält. b) Wir zeigen im nächsten Abschnitt, dass man die reellen Zahlen bijektiv auf die Menge der aus der Schule bekannten Dezimalbruchentwicklungen abbilden kann. Wegen a) könnten wir dann die zugrunde liegende Menge von R auch so wie in der Schule definieren. c) Wir haben gesehen, dass man die reellen Zahlen mit Hilfe von Q konstruieren kann. Weiterhin ist es möglich, die Existenz von Q auf die von N zurückzuführen. Danach gibt es ein paar sehr grundsätzliche Probleme. Man kann zwar N mit den sogenannten Peano Axiomen charakterisieren oder auch die Peano Axiomen aus den Axiomen der Zermelo-FraenkelMengenlehre ableiten und verbleibt dann mit einem System von echten Axiomen, die sich nicht mehr herleiten lassen, aber nach dem Gödelschen Unvollständigkeitssatz ist es nicht möglich zu zeigen, dass dieses Axiomensystem widerspruchsfrei ist. Bis zu einen gewissem Grade muss man also an die widerspruchsfreie Existenz von N glauben (sie voraussetzen). Die von R kann man dann wie gerade gesehen beweisen. 7. b-adische Brüche und Überabzählbarkeit von R 7 43 b-adische Brüche und Überabzählbarkeit von R P Definition 7.1. Eine P Reihe ist eine Folge von Partialsummen sn = ni=0 ai mit ai ∈ R und wird mit ∞ bezeichnet. Ist sn konvergent, so bezeichnen wir i=0 aiP den Grenzwert ebenfalls mit ∞ i=0 ai . P 1 i Satz 7.2. Ist |x| < 1, so gilt ∞ i=0 x = 1−x . P n+1 n+1 ) Beweis. Nach Satz 1.7 ist ni=0 xi = 1−x n∈N eine 1−x . Nach Satz 4.4 ist (x Nullfolge und die Behauptung folgt aus den Grenzwertsätzen. P Satz 7.3. Eine Reihe ∞ i=0 bi ist genau dann konvergent, wenn gilt: ∀ε > 0 ∃N ∈ N mit ∀ n, m ≥ N gilt m X bi < ε . i=n Beweis. Die Reihe ist genau dann konvergent, wenn sie eine Cauchyfolge ist. P i Proposition 7.4. Ist |x| < 1 und (an ) eine beschränkte Folge, so ist ∞ i=0 ai x konvergent. Beweis.PSei ε > 0 gegeben. Wähle B > 0 mit |ai | < B für alle i ∈ N. Da die i Reihe ∞ i=0 B|x| konvergiert, folgt aus Satz 7.3, dass ein N ∈ N existiert mit P m i i=n B|x| < ε für alle n, m ≥ N . Die Dreiecksungleichung liefert dann m m X X i ai x ≤ B|x|i < ε. i=n i=n Wir können Rückrichtung aus Satz 7.3 verwenden, um auf die KonverP∞nun die i genz von i=0 ai x zu schließen. Satz 7.5. Sei b ∈ N mit b ≥ 2. a) Zu einer reellen Zahl x gibt es ein −h ∈ Z und eine )n≥−h von PFolge (an−n natürlichen Zahlen mit 0 ≤ an ≤ b − 1 und x = ± ∞ a b . Umgen=−h n kehrt gehört zuP jeder Folge (an )n≥−h mit 0 ≤ an ≤ b − 1 eine reelle Zahl −n . x ∈ R mit x = ∞ n=−h an b P∞ P∞ −n = −n ∈ R mit 0 ≤ a , c ≤ b − 1 und b) Gilt n n n=−h an b n=−h cn b an , cn ∈ N, so ist eine der folgenden Aussagen wahr: • an = cn für alle n ≥ −h. 7. b-adische Brüche und Überabzählbarkeit von R 44 • Es gibt eine ganze Zahl n0 ≥ −h mit an = cn für n < n0 , an0 = cn0 −1 und an = b − 1 sowie cn = 0 für alle n > n0 . • Die zweite Aussage gilt, sobald man die Rollen von an und cn vertauscht. Für b = 10 ist vielleicht aus der Schule bekannt, dass Zahlen, die mit einer 9-Periode enden, auch eine endliche Dezimalbruch-Entwicklung haben, beispielsweise 1 = 99 = 0, 99999 . . . = 0, 9̄. Allgemeiner gibt es wegen ∞ X −n (b − 1)b n=n0 +1 −n0 −1 = (b − 1)b ∞ X b−n = b−n0 n=0 auch in b-adischen Darstellungen die in b) beschriebene Ambiguität. Etwas verkürzt sagt der Satz, dass es eine natürliche Bijektion zwischen den (nichtnegativen) reellen Zahlen und denjenigen b-adischen Entwicklungen gibt, die nicht mit (b−1)-Periode“ enden. Wie Sie in den Übungen zeigen werden, korrespondieren ” die rationale Zahlen in dieser Darstellung zu den b-adischen Entwicklungen, die ab einer gewissen Nachkommastelle periodisch sind. Beweis. a) Der zweite Teil ergibt aus der Tatsache, dass für P sich unmittelbar −n wegen Proposition 7.4 konvergent 0 ≤ an ≤ b − 1, die Reihe ∞ a b n=−h n ist. Für den ersten Teil gelte ohne Einschränkung x > 0. Wähle h ∈ N mit bh > x. Wir definieren nun induktiv eine Folge (an )n≥−h mit folgenden Eigenschaften: • an ∈ N mit 0 ≤ an ≤ b − 1, P • 0 ≤ x − nk=−h ak b−k < b−n für alle n ≥ −h. (IB) Für n = −h setze a−h = 0. Es gilt 0 ≤ x < bh . (IS) (n 7→ n + 1): Seien a−h , . . . , an bereits definiert. Es gilt nach IV 0≤x− n X ak b−k < b−n . k=−h Wähle nun an+1 ∈ N maximal mit 0≤ x− n X k=−h ak b−k ! − an+1 · b−(n+1) . 7. b-adische Brüche und Überabzählbarkeit von R Wegen x < b−n + Pn −k k=−h ak b 45 ist dann 0 < b−n − an+1 b−(n+1) und damit an+1 < b. Daher gilt an+1 ≤ b − 1. Also ist 0 ≤ an+1 ≤ b − 1. Weiterhin folgt aus der Maximalität von an+1 ! n+1 X −k 0≤ x− ak b < b−(n+1) . k=−h Damit haben wir (an )n∈N definiert. Es gilt nun x≥ n X k=−h ak b−k ≥ x − b−(n+1) . für alle n ≥ −h. Mit dem Schachtelungssatz folgt lim n→∞ n X ak b−k = x. k=−h b) Wir können annehmen, dass die Folgen an und cn nicht übereinstimmen. Es sei n0 ≥ −h minimal mit an0 6= cn0 . Nach eventuellem Vertauschen gilt ohne Einschränkung an0 < cn0 . Dann ist 0= ∞ X k=n0 (ak − ck ) · b−k −n0 = (an0 − cn0 ) · b ≤ −b−n0 + ∞ X + ∞ X (ak − ck ) · b−k k=n0 +1 (b − 1) · b−k k=n0 +1 = −b−n0 + b−n0 = 0. Aus der Gleichheitsdiskussion erhalten wir an0 − cn0 = −1 sowie ak − ck = b − 1 für alle k > n0 und damit die Behauptung. 7. b-adische Brüche und Überabzählbarkeit von R 46 Definition 7.6. Eine Menge M heißt abzählbar, wenn eine der beiden folgenden Aussagen gilt: • M ist endlich. • Es gibt eine Bijektion N → M . Im letzteren Fall sagen wir auch M ist abzählbar unendlich“. ” Definition 7.7. Sei f : M1 → M2 eine Abbildung zwischen zwei Mengen. • Sei P(Mi ) := {A | A ⊂ Mi } die Potenzmenge von Mi (i = 1, 2), dann heißt f −1 : P(M2 ) → P(M1 ) S 7→ f −1 (S) = {x ∈ M1 | f (x) ∈ S} die Urbildfunktion. • Ist f bijektiv, so definieren wir eine Umkehrabbildung f −1 : M2 → M1 durch die Vorschrift, welche jedem y ∈ M2 das eindeutige f −1 (y) ∈ M1 mit f (f −1 (y)) = y zuordnet. Die Urbildfunktion und Umkehrabbildung werden zwar mit demselbem Symbol bezeichnet, aber es wird aus dem Zusammenhang klar, was gemeint ist. Oft wird der Begriff Funktion“ für Abbildungen reserviert, deren Wertebereich R ” (oder C) ist. Die Urbildfunktion ist eine Ausnahme dieser Konvention. Beispiel. f : {Skatkarten} → {♦, ♥, ♠, ♣}, X 7→ Farbe(X) Dann ist f −1 ({♣}) die Menge aller Kreuzkarten und f −1 ({♦, ♥}) die Menge aller rotfarbigen Karten. Satz 7.8. Für eine nicht leere Menge M sind folgende Aussagen äquivalent: a) M ist abzählbar. b) Es gibt eine surjektive Abbildung N → M . c) Es gibt eine injektive Abbildung M → N. 7. b-adische Brüche und Überabzählbarkeit von R 47 Beweis. a) ⇒ b). Falls M endlich ist, dann gibt es offenbar eine Abbildung wie in b). Andernfalls gibt es eine bijektive Abbildung N → M . b) ⇒ c). Es sei σ : N → M surjektiv. Wir definieren folgendermaßen ι : M → N: Für jedes m ∈ M ist das Urbild σ −1 ({m}) eine nicht leere Teilmenge von N und hat also ein minimales Element ι(m). Nach Konstruktion ist σ ◦ ι(m) = m für alle m ∈ M und mithin ist ι injektiv. c) ⇒ a). Sei ι : M → N injektiv. Ist M endlich, so ist nichts zu zeigen. Andernfalls können wir eine Bijektion α : N → M definieren, indem wir 0 auf das eindeutig bestimmte Element α(0) ∈ M abbilden, für das ι(m) minimal in ι(M ) ist. Weiter wird α(1) ∈ M dadurch erklärt, dass ι(α(1)) das zweit-kleinste Element in ι(M ) ist, etc. Satz 7.9 (Cantor). Eine abzählbare Vereinigung von abzählbaren Mengen ist abzählbar, d.h.: Ist M eine Menge und Mi ⊂ M für i ∈ N mit • Mi ist abzählbar und S • M= ∞ i=0 Mi = {m | ∃ i ∈ N mit m ∈ Mi }, Georg Cantor (1845-1918) dann ist auch M abzählbar. Beweis. Wir können ohne Einschränkung annehmen, dass für jedes i ∈ N die (i) Menge Mi nicht leer ist. Sei b(i) : N → Mi , n 7→ bn eine surjektive Abbildung.1 Wir ordnen die Elemente dem folgenden Schema (Abbildung 1) gemäß in einem Quadranten an: Wir können nun eine surjektive Abbildung a : N → M definieren, indem wir die Nebendiagonalen nacheinander abzählen: (0) (0) (1) (0) (1) a(0) = b0 , a(1) = b1 , a(2) = b0 , a(3) = b2 , a(3) = b1 , . . . Allgemeiner bildet a die Menge {i | 21 n(n + 1) ≤ i < 21 (n + 1)(n + 2)} surjektiv auf die Menge {bji | i + j = n} ab. Korollar 7.10. Z, Q und Qk sind abzählbar. 1 Hier benutzen wir implizit, dass wir gemäß dem Auswahlaxiom eine Folge solcher Abbildungen wählen können. Für die Anwendungen (Korollar 7.10) gibt es eine offensichtliche Wahl. 7. b-adische Brüche und Überabzählbarkeit von R 48 (3) b1 (2) b1 (1) b1 (0) b1 b0 b0 b0 b0 (3) b2 (3) b3 (2) b2 (1) b2 (0) b2 (3) (2) b3 (1) b3 (0) b3 (2) (1) (0) Abbildung 1: Anordnung der bin . Beweis. Wir können Z und Q wie folgt als abzählbare Vereinigung von abzählbaren Mengen schreiben: Z= Q= ∞ [ {i, −i}, i=0 ∞ [ { pi | p ∈ Z}. i=1 Sind M1 und M2 zwei abzählbare Mengen, so S ist auch M1 × M2 abzählbar, denn ist ι : N → M2 surjektiv, so ist M1 × M2 = ∞ i=0 M1 × {ι(i)} eine abzählbare Vereinigung von abzählbaren Mengen. Induktiv folgt nun die Abzählbarkeit von Qk . Satz 7.11 (Cantor). R ist überabzählbar. Beweis. Wäre R abzählbar, so würde dies nach Satz 7.8 auch für die Menge ]0, 1[ = {x ∈ R | 0 < x < 1} gelten. Es reicht für jede Folge (xn )n≥1 in ]0, 1[ ein y ∈ ]0, 1[ zu finden mit y 6= xn für alle n ≥ 1. Jedes xn schreiben wir in einer 10-adischen Entwicklung xn = ∞ X (n) ak 10−k , k=1 d.h. xn ist von der Gestalt (n) (n) (n) (n) xn = 0, a1 a2 a3 a4 . . . 49 8. Die komplexen Zahlen Wir wollen nun ein y = 0, b1 b2 . . . definieren, das von allen diesen Elementen verschieden ist. Dazu müssen wir sicher stellen, dass sich für jedes n die Zahlen xn und y an wenigstens einer Nachkommastelle unterscheiden. Sei dazu bn ∈ {2, 3} für n ≥ 1 wie folgt: ( (n) 2, falls an 6= 2, bn = (n) 3, falls an = 2. P −k ∈ ]0, 1[. Angenommen, Betrachte nun die Zahl y = 0, b1 b2 b3 . . . = ∞ k=1 bk 10 es würde y = xn für ein n ≥ 1 gelten. Da nun y weder auf 9-Periode“ noch ” (n) auf 0-Periode“ endet, würde mit Satz 7.5 bk = ak für alle k ≥ 1 folgen. Das ” (n) ist aber unmöglich, da bn 6= an . Somit gilt, wie behauptet, y 6= xn für alle n ≥ 1. 8 Die komplexen Zahlen 1 In diesem Abschnitt sind einige geometrische Beobachtungen eingestreut. Sie dienen dazu eine Intuition für das Rechnen mit komplexen Zahlen zu entwickeln. Wir werden ihnen aber (noch) keine Beweiskraft beimessen. Dies betrifft insbesondere die beiden Feststellungen in diesem Abschnitt. Definition 8.1. Wir definieren die komplexen Zahlen als C = {(x, y) | x, y ∈ R} mit folgender Addition und Multiplikation: (x, y) + (a, b) := (x + a, y + b) (x, y) · (a, b) := (xa − by, xb + ya) Dies nennt man auch die Gaußsche Zahlenebene. Schreibweise. Wir setzen 1C = (1, 0), i = (0, 1). Carl Friedrich Gauß (1777-1855) 50 8. Die komplexen Zahlen Dabei ist 1C offenbar ein neutrales Element bezüglich der Multiplikation und es gilt i2 = −1C . Für ein beliebiges Element (x, y) ∈ C schreiben wir (x, y) = x · (1, 0) + y · (0, 1) = x · 1C + i · y = x + iy. Satz 8.2. (C, +, ·) ist ein Körper. Aus dem Satz folgt insbesondere, dass man sich für die Multiplikation in C nur die Formel i2 = −1 merken muss, denn dann ergibt sich aus dem Distributiv-, Assoziativ- und Kommutativgesetz, wie man zwei beliebige Zahlen zu multiplizieren hat: (x + iy)(a + ib) = x(a + ib) + iy(a + ib) = xa + ixb + iya + i2 yb = (xa − yb) + i(xb + ya) Wir werden x ∈ R mit der komplexen Zahl x + i0 = x1C + i0 = (x, 0) identifizieren. Die Addition und Multiplikation des Körpers R entspricht dann der Einschränkung der Addition und Multiplikation von C auf die Teilmenge R. Man sagt auch, dass R ⊂ C ein Unterkörper ist. Beweis. Das neutrale Element der Addition ist 0C = (0, 0) und das additiv inverse Element von (x, y) ist (−x, −y). Die Regeln der Addition folgen dann durch komponentenweises Anwenden der entsprechenden Regel für R. Für die Multiplikation haben wir bereits erwähnt, dass 1C ein neutrales Element ist. Für z = a + ib ∈ C \ {0} setzen wir z −1 = a2 a b −i 2 . 2 +b a + b2 Man überprüft problemlos z ·z −1 = 1C und somit ist die Existenz des multiplikativ Inversen sicher gestellt. Wenn wir in der rechten Seite der zweiten Gleichung in Definition 8.1 die Rollen von a und x und gleichzeitig die Rollen von b und y vertauschen, ändert sich offenbar nichts, also ist die Multiplikation kommutativ. Schließlich ergibt sich ebenso durch ein problemloses Nachrechnen, dass auch das Assoziativgesetz der Multiplikation sowie das Distributivgesetz gilt. Alternativ gibt es die Möglichkeit, komplexe Zahlen mit reellen 2 × 2 Matrixen zu identifizieren durch a b a + ib = . −b a 51 8. Die komplexen Zahlen Wegen a b −b a x y −y x = ax − by ay + bx −ay − bx ax − by entspricht die Multiplikation in C dann dem Matrizenprodukt. Deswegen folgen Assoziativgesetz und Distributivgesetz aus den entsprechenden Gesetzen für das Rechnen mit Matrizen. Warnung. Für komplexe Zahlen machen Ungleichungen der Form z1 ≤ z2“ ” keinen Sinn, vgl. Bemerkung vor Lemma 3.3. Wenn sie doch erscheinen, wird damit implizit auch behauptet, dass z1 , z2 ∈ R gilt. Definition 8.3. Sei z ∈ C und a, b ∈ R mit z = (a, b) = a + ib. Der Realteil bzw. der Imaginärteil von z ist definiert durch Re(a + ib) = a, Im(a + ib) = b. Das komplex Konjugierte von z ist definiert als a + ib = a − ib und der Betrag von z als |a + ib| = p a2 + b2 . Wir können den Abstand von 0 und z als |z| definieren. Dass dies mit der Schuldefinition übereinstimmt, sieht man aus dem Satz des Pythagoras durch Betrachtung des rechtwinkligen Dreiecks mit Eckpunkten 0 = (0, 0), a = (a, 0) und a + ib = (a, b). Allgemeiner ist der Abstand von zwei komplexen Zahlen z1 und z2 gleich |z1 − z2 |. Die komplexe Konjugation entspricht natürlich einer Spiegelung an der reellen Achse (Geraden). Satz 8.4. Seien z, z1 , z2 ∈ C. Dann gilt: a) |z| ≥ 0 (in R) mit Gleichheit genau dann, wenn z = 0. b) z1 · z2 = z1 · z2 und z1 + z2 = z1 + z2 . c) |z1 · z2 | = |z1 | · |z2 |. d) |z|2 = z · z. 52 8. Die komplexen Zahlen Beweis. a) Dies ist offensichtlich. b) Seien z1 = a + ib, z2 = x + iy. Dann ist z1 · z2 = ax − by + i(ay + bx) = ax − by − i(ay + bx) und somit z1 · z2 = (a − ib)(x − iy) = z1 · z2 . d) Für z = a + ib ist |z|2 = a2 + b2 und darum z · z = (a + ib)(a − ib) = a2 + b2 = |z|2 . c) Es gilt |z1 · z2 | = |z1 | · |z2 | genau dann, wenn |z1 z2 |2 = |z1 |2 · |z2 |2 ist, und dies ist nach d) äquivalent zu z1 · z2 · z1 · z2 = (z1 · z1 ) · (z2 · z2 ). Feststellung 8.5 (Geometrische Interpretation der Multiplikation). Jede komz plexe Zahl z ∈ C \ {0} können wir schreiben als z = |z| · ζ wobei ζ := |z| Betrag 1 hat. Nach dem Assoziativgesetz und Kommutativgesetz, können wir uns das Multiplizieren mit z Mz : C → C, c 7→ zc als die Hintereinderschaltung des Multiplizierens mit |z| ∈ R ⊂ C und des Multiplizierens mit ζ gegeben denken, Mz = Mζ ◦ M|z| . Die Abbildung M|z| ist dabei offenbar eine Streckung um |z|. Wir werden gleich mit geometrischen Methoden aus der Schule einsehen, dass Mζ eine Drehung ist. Da Mζ die Zahl 1 = (1, 0) auf ζ abbildet, ist der Drehwinkel genau der Winkel zwischen der Geraden durch 0 und z mit der reellen Geraden. Wenn man also zwei komplexe Zahlen multipliziert, dann multiplizieren sich die Beträge und es addieren sich die Winkel mit der reellen Achse. (Die Winkel sind zwischen 0 und 2π und sind dabei gegen den Uhrzeigersinn von der positiven reellen Halbachse ausgehend zu messen.) 53 8. Die komplexen Zahlen Die Feststellung liefert auch eine nachträgliche Erklärung für die Assoziativität der Multiplikation in C. $ Begründung für Feststellung 8.5. Ohne Einschränkung gilt ζ 6= 1. Es sei ϕ die Länge des Kreisbogens von 1 nach ζ. Mit der Schuldefinition von sin und cos folgt dann ζ = cos(ϕ) + i sin(ϕ). Die Abbildung Mζ ist abstandserhaltend denn |ζz1 − ζz2 | = |z1 − z2 |. Damit erhält sie auch Winkel (Kosinussatz) und es reicht zu zeigen, dass die Einschränkung von Mζ auf den Einheitskreis ' S1 = {z ∈ C | |z| = 1} ζ · c = cos(3ϕ/2) + i sin(3ϕ/2) • •ζ ϕ/2 c • ϕ/2 ϕ/2 P• 1 PPPPPPPP % & eine Drehung gegen den Uhrzeiger Sinn um den Winkel ϕ ist. Wir betrachten den Einheitsvektor c = cos(ϕ/2)+i sin(ϕ/2) auf der Winkelhalbierenden von ζ und 1. Die Zahl Mζ (c) schließt mit Mζ (1) = ζ einen Winkel ϕ/2 ein. Da Mζ (c) = ζc 6= c, folgt Mζ (c) = cos(3ϕ/2)+i sin(3ϕ/2). Sei nun z2 = cos(ψ)+i sin(ψ) mit ψ ∈]0, π[ beliebig. Dann folgt Mζ (z2 ) = cos(ϕ ± ψ) + i sin(ϕ ± ψ), da Mζ (z2 ) einen Winkel ψ mit ζ hat. Da Mζ (z2 ) zudem einen Winkel ψ − ϕ/2 mit Mζ (c) = cos(3ϕ/2) + i sin(3ϕ/2) hat, kann nur wie behauptet Mζ (z2 ) = cos(ψ + ϕ) + i sin(ψ + ϕ) gelten. Beispiele. Auch wenn wir die obige Feststellung noch nicht im strengen Sinne bewiesen haben, kann man sie benutzen, um Lösungen für gewisse Gleichungen zu finden, und sodann durch Nachrechnen ihre Richtigkeit überprüfen a) Sei z ∈ C \ {0}. Gesucht seien alle p c ∈ C mit c2 = z. Wegen |c2 | = |c|2 ist klar, dass für jede Lösung |c| = |z| gelten muss. Wenn wir der geometrischen Interpretation der Multiplikation vertrauen, sollte eine Lösung auf der Winkelhalbierenden des Winkels sein, der durch die positive reelle Halbachse und R+ z gegeben ist. Ein Punkt auf der Winkelhalbierenden ist z + |z|, denn die Spiegelung an der Winkelhalbierenden bildet z auf |z|, |z| auf z und muss daher z + |z| fest lassen. Damit ergibt sich insgesamt, 54 8. Die komplexen Zahlen dass c1 = p z+|z| |z| |z+|z|| eine Lösung der Gleichung sein sollte. Tatsächlich läßt sich dies leicht durch eine Probe bestätigen: 2 (z+|z|) c21 = |z| (z+|z|)(z̄+|z|) = z|z|+|z|2 (z̄+|z|) = z|z|+z z̄ (z̄+|z|) = z. Natürlich ist −c1 eine weitere Lösung. Wegen (c2 − z) = (c − c1 )(c + c1 ) gibt es keine weiteren Lösungen. b) Bestimme alle c ∈ C mit c3 = 1. Die Lösungen haben nun Betrag 1. Zur Bestimmung des Winkels ist nun der Winkel 0 zu dritteln, was scheinbar nur zur offensichtlichen Lösung c = 1 führt. Man muss aber beachten, dass man Winkel immer so korrigieren muss (durch Subtraktion von Vielfachen von 2π), dass sie zwischen 0 und 2π liegen. In diesem Sinne ist der dreifache Winkel von 2π/3 und 4π/3 auch 0. Mithin sollte die Zahl vom Betrag 1 in C, die mit der positiven reellen Achse einen Winkel 2π/3 bildet, eine Lösung sein. Aus der Schuldefinition von sin und cos folgt, dass diese Zahl durch cos(2π/3)+i sin(2π/3) gegeben ist. Ebenfalls aus der Schule bekannt √ sein sollte cos(2π/3) = −1/2 und sin(2π/3) = 3/2. Insgesamt ergibt sich, √ 3 1 dass ζ = − 2 + i 2 eine Lösung von ζ 3 = 1 sein sollte. Dies wiederum überprüft man durch √ einfache Rechnung. Eine weitere Lösung ist gegeben 1 durch ζ̄ = − 2 − i 23 und wegen (c3 − 1) = (c − ζ)(c − ζ̄)(c − 1) gibt es außer den gefundenen drei Lösungen keine weiteren Lösungen. Feststellung 8.6. Sei ζi = cos(ϕi ) + i sin(ϕi ) (i = 1, 2) (sin und cos wie in der Schule definiert). Da die komplexen Multiplikation mit ζ1 einer Drehung um ϕ1 entspricht, folgt“, dass ζ1 · ζ2 einen Winkel ϕ1 + ϕ2 mit der positiven reellen ” Halbgeraden hat. Mithin ist ζ1 · ζ2 = cos(ϕ1 + ϕ2 ) + i sin(ϕ1 + ϕ2 ). Andererseits ist ζ1 ζ2 = cos(ϕ1 ) cos(ϕ2 )−sin(ϕ1 ) sin(ϕ2 )+i cos(ϕ1 ) sin(ϕ2 )+sin(ϕ1 ) cos(ϕ2 ) . Durch Koeffizientenvergleich folgen die Additionstheoreme, die wir später noch ganz anders beweisen werden. Satz 8.7 (Dreiecksungleichung). Für alle z1 , z2 ∈ C gilt: a) |z1 − z2 | ≤ |z1 | + |z2 |. b) ||z1 | − |z2 || ≤ |z1 − z2 |. Wie oben erwähnt, ist |z1 − z2 | der Abstand von z1 und z2 . Die Zahlen |z1 − z2 |, |z1 | und |z2 | entsprechen also den Seitenlängen des Dreiecks mit den Ecken 0, z1 und z2 in C. 55 8. Die komplexen Zahlen Beweis. a) Es ist |z1 − z2 | ≤ |z1 | + |z2 | äquivalent zu |z1 − z2 |2 ≤ (|z1 | + |z2 |)2 . Nach Satz 8.4 d) ist dies äquivalent zu (z1 − z2 ) · (z1 − z2 ) ≤ |z1 |2 + 2 |z1 | · |z2 | + |z2 |2 , was wiederum äquivalent ist zu −z2 z1 − z1 z2 ≤ 2 |z1 · z2 |. ist. Dies wiederum gilt genau dann, wenn 2Re(−z1 z2 ) ≤ 2| − z1 z2 | ist, und diese Aussage ist wahr. b) Nach eventuellem Vertauschen von z1 und z2 gilt ohne Einschränkung |z1 | − |z2 | = ||z1 | − |z2 ||. Nach a) ist |z1 | = |z2 + z1 − z2 | = |z2 − (−z1 + z2 )| ≤ |z2 | + |z2 − z1 | und damit |z1 | − |z2 | ≤ |z2 − z1 |. Definition 8.8. a) Eine Folge komplexer Zahlen (zn )n∈C heißt konvergent gegen z ∈ C genau dann, wenn |zn − z| eine reelle Nullfolge ist, was definitionsgemäß gleichwertig ist mit ∀ ε > 0 ∃N ∈ N mit ∀ n ≥ N gilt |z − zn | < ε. b) Eine Folge (zn ) in C heißt eine Cauchyfolge genau dann, wenn gilt: ∀ ε > 0 ∃ N ∈ N mit ∀ n, m ≥ N gilt |zn − zm | < ε. 56 8. Die komplexen Zahlen Hinweis: Mit ∀ε > 0 ist ∀ε ∈ {x ∈ R | x > 0} gemeint. Satz 8.9. Sei (cn ) eine Folge in C. a) cn konvergiert genau dann, wenn (Re(cn ))n∈N und (Im(cn ))n∈N in R konvergieren. Es gilt dann lim cn = lim Re(cn ) + i lim Im(cn ). n→∞ n→∞ n→∞ b) cn ist genau dann eine Cauchyfolge, wenn Re(cn ) sowie Im(cn ) reelle Cauchyfolgen sind. c) Eine Cauchyfolge in C ist konvergent und konvergente Folgen sind Cauchyfolgen. Beweis. a) Für jedes c ∈ C gilt |c − cn | ≤ |Re(c − cn )| + | Im(c − cn )| ≤ 2|c − cn |. Konvergiert cn gegen c, dann ist |c − cn | eine reelle Nullfolge und aus dem Schachtelungssatz folgt, dass |Re(c − cn )| und | Im(c − cn )| Nullfolgen sind. Konvergieren umgekehrt limn→∞ Re(cn ) = a und limn→∞ Im(cn ) = b, so setzen wir c := a + ib und folgern limn→∞ | Re(c − cn )| + | Im(c − cn )| = 0. Aus der obigen Ungleichungskette und dem Schachtelungssatz folgt nun limn→∞ |c − cn | = 0 und damit limn→∞ cn = c. b) Dies folgt analog zu a) aus |cn − cm | ≤ |Re(cn − cm )| + | Im(cn − cm )| ≤ 2|cn − cm |. c) Sei cn eine Cauchyfolge. Nach b) sind Re(cn ) und Im(cn ) ebenfalls Cauchyfolgen und nach dem Vollständigkeitsaxiom konvergent in R. Nach a) ist dann auch cn ist konvergent. Ist umgekehr (cn ) konvergent so sind die reellen konvergenten Folgen Re(cn ) und Im(cn ) Cauchyfolgen (Satz 5.2). Wegen b) folgt, dass auch (cn ) eine Cauchyfolge ist. Satz 8.10 (Grenzwertsätze in C). Es seien (cn ) und (zn ) konvergente Folgen in C mit limn→∞ cn = c und limn→∞ zn = z. Dann gilt: a) limn→∞ (cn ± zn ) = c ± z und limn→∞ z̄n = z̄. b) limn→∞ (cn · zn ) = c · z. 57 9. Konvergenzkriterien für Reihen c) limn→∞ |zn | = |z|. d) Gilt z 6= 0, so gibt es ein n0 ∈ N mit zn 6= 0 für alle n ≥ n0 und limn→∞ zcnn = zc . Beweis. Es sei cn = an + ibn , c = a + ib, zn = xn + iyn und z = x + iy. Die reellen Folgen (an ), (bn ), (xn ) und (yn ) sind dann konvergent gegen a, b, x und y. a) Dies ergibt sich durch komponentenweises Anwenden der reellen Grenzwertsätze. b) Nach den reellen Grenzwertsätzen gilt ax = lim an xn und by = lim bn yn . n→∞ n→∞ Abermaliges Anwenden von Satz 4.9 liefert lim Re(cn zn ) = lim (an xn − bn yn ) = ax − by. n→∞ n→∞ Ähnlich folgt limn→∞ Im(cn zn ) = limn→∞ (an yn + bn xn ) = ay + bx. Die Behauptung folgt nun aus Satz 8.9. c) Die Gleichung folgt mittels Dreiecksungleichung: Sei ε > 0 gegeben. Dann gibt es n0 mit |z − zn | < ε für alle n ≥ n0 . Mit Satz 8.7 folgt ||z| − |zn || < ε für alle n ≥ n0 und damit die Behauptung. d) Es reicht limn→∞ z1n = z1 zu zeigen. Aus c) und den reellen Grenzwertsätzen folgt limn→∞ |zn1|2 = |z|12 . Zusammen mit a) und b) folgt lim 1 n→∞ zn 9 z̄n 2 n→∞ |zn | = lim = z̄ |z|2 = z1 . Konvergenzkriterien für Reihen Definition 9.1. a) Eine Reihe in C ist eine Folge von Partialsummen sn = n X ck k=0 P mit ck ∈ C und wird mit ∞ bezeichnet. Ist (sn )n∈N konvergent, so k=0 ckP ∞ wird der Grenzwert ebenfalls mit z ∈ C so ist die k=0 ck bezeichnet. Ist P∞ P∞ Schreibweise z = k=0 ck gleichwertig mit z = limn→∞ k=0 ck . 58 9. Konvergenzkriterien für Reihen P∞ P b) Eine Reihe ∞ k=0 |ck | k=0 ck in C (oder R) heißt absolut konvergent, wenn konvergiert. P 1 k Beispiel 9.2 (Erweiterung von Satz 7.2). Es gilt ∞ k=0 z = 1−z für z ∈ C mit |z| < 1. P n+1 Beweis. Analog zu Satz 1.7 gilt auch für komplexe Zahlen ni=0 z i = 1−z 1−z mit demselben Beweis. Es gilt auch limn→∞ z n+1 = 0, denn |z n+1 − 0| = |z|n+1 ist gemäß Satz 4.4 eine reelle Nullfolge. Die Behauptung folgt aus den Grenzwertsätzen in C (Satz 8.10). Völlig analog zu Satz 7.3 gilt auch für Reihen in C das folgende Konvergenzkriterium. P∞ Satz 9.3 (Cauchysches Konvergenzkriterium). Eine Reihe k=0 ck in C ist genau dann konvergent, wenn gilt: m X ∀ ε > 0 ∃ N ∈ N mit ∀ n, m > N gilt ck < ε. k=n Beweis. Aus Satz 8.9 ergibt sich, dass eine Folge in C genau dann konvergent ist wenn sie eine Cauchyfolge ist. Das Kriterium ist aber offensichtlich äquivalent zu der Forderung, dass die Folge der Partialsummen eine Cauchyfolge ist. Satz 9.4. Eine absolut konvergente Reihe in C ist konvergent. P∞ Beweis. P∞ Sei n=0 cn eine absolut konvergente Reihe in C. Sei ε > 0 gegeben. Da n=0 |cn | konvergent ist, existiert ein N ∈ N, so dass für alle n, m ≥ N gilt: m X k=n |ck | < ε. Also ist für alle n, m ≥ N m m X X ck ≤ |ck | < ε, k=n d.h. P∞ k=0 ck k=n genügt dem Cauchyschen Konvergenzkriterium. P Satz 9.5 (Notwendiges Kriterium). Ist die Reihe ∞ n=0 cn für cn ∈ C konvergent, so gilt limn→∞ cn = 0. 59 9. Konvergenzkriterien für Reihen Beweis. Ist die Reihe konvergent, so ist insbesondere sk = folge und damit lim ck+1 = lim sk+1 − sk = 0. k→∞ Pk n=0 cn eine Cauchy- k→∞ Satz 9.5 liefert kein hinreichendes Kriterium, denn wir werden weiter unten P 1 einsehen das zum Beispiel die sogenannte harmonische Reihe ∞ n=1 n divergiert. Wir werden aber im Folgenden eine Reihe von Sätzen angeben, die hinreichende Kriterien für die Konvergenz (oder auch Divergenz) von Reihen liefern. P Lemma 9.6. Eine Reihe ∞ n=0 an mit an ∈ R, an ≥ 0, konvergiert genau dann, wenn die Folge der Partialsummen beschränkt ist. Da die Folge der Partialsummen monoton ist, folgt das Lemma unmittelbar aus der Konvergenz von monotonen beschränkten Folgen (Satz 5.3). Satz 9.7 (Verdichtungskriterium). Es sei an eine monotonPfallende Folge posi∞ k tiver reeller P∞ Zahlen. Setze bk = 2 · a2k . Dann konvergiert n=0 an genau dann wenn k=0 bk konvergiert. P 1 Beispiel. a) Die harmonische Reihe ∞ denn für an = n1 ist n=0 n divergiert, P∞ k bk = 2 ·a2k = 1, und wegen Satz 9.7 ist mit k=0 bk auch die harmonische Reihe divergent. P 1 1 k −k b) Die Reihe ∞ n=1 n2 konvergiert, denn für an = n2 ist bk = 2 · a2k = 2 und Satz 9.7 folgt aus P der Konvergenz der geometrischen Reihe P∞ wegen ∞ 1 −k die Konvergenz von 2 n=1 n2 . k=0 P Beweis von Satz 9.7. Es sei ∞ k=0 bk konvergent. Aus der Monotonie von (an ) folgt für k ≥ 0 2k+1 X−1 n=2k an ≤ 2k a2k = bk und damit ist 2k+1 X−1 n=0 an ≤ a0 + k X h=0 Folglich ist die Folge der Partialsummen Reihe ist konvergent nach Lemma 9.6. Pl bh ≤ a0 + n=0 an ∞ X bh h=0 nach oben beschränkt und die 60 9. Konvergenzkriterien für Reihen Ist nun umgekehrt die Reihe Monotonie von (an ), dass k+1 2X n=2k +1 P∞ n=0 an konvergent, so folgt wiederum aus der an ≥ 2k a2k+1 = bk+1 2 und zusammen mit b0 = a1 folgt 2 ∞ X n=0 Die Konvergenz der Reihe ma 9.6. k X an ≥ P∞ h=0 bh bh für alle k h=0 folgt durch erneutes Anwenden von Lem- Satz 9.8. a) (Majorantenkriterium) Es seien (an )n∈N eine reelle, (cn )n∈N eiP∞ Es gebe ferner ein n0 ∈ N mit ne komplexe Folge und n=0 an konvergent. P |cn | ≤ an für alle n ≥ n0 . Dann konvergiert ∞ n=0 cn absolut. b) (Minorantenkriterium) Es seien (an )n∈N und (cn )n∈N reelle Folgen. P∞ Es gebe ein n0 ∈ N mitP0 ≤ an ≤ cn für alle n ≥ n0 . Divergiert n=0 an , so c . divergiert auch ∞ n=0 n P Beweis. a) Es ist zu zeigen, dass sk := kn=0 |cn | beschränkt ist. Nach Abändern von endlich vielen Gliedern der Folge Pan gilt |cn | ≤ an für alle n. (Dies ändert nichts an der Konvergenz von ∞ n=0 an .) Dann ist k X n=0 |cn | ≤ k X n=0 an ≤ lim k→∞ k X n=0 an ∈ R und die absolute Konvergenz folgt aus Lemma 9.6. P∞ P∞ c konvergent so wäre b) Dies folgt offenbar aus a), denn wäre n n=0 n=0 cn P∞ eine konvergente Majorante für n=0 an . Beispiel. P∞ n=1 b) P∞ n=1 P∞ 1 a) Sei k ∈ N mit k ≥ 2. Dann ist n=1 nk konvergent, denn 1 ist eine konvergente Majorante. n2 P∞ 1 √1 ist divergent denn n=1 n ist eine divergente Minorante. n 61 9. Konvergenzkriterien für Reihen Korollar 9.9. P Es sei (hn )n∈N eine beschränkte Folge in C (d.h. (|hn |) ist be∞ schränkt) und n=0 cn eine absolut konvergente Reihe in R. Dann ist auch P∞ n=0 hn cn absolut konvergent. P∞ Satz 9.10 (Quotientenkriterium). Sei n=0 cn eine Reihe in C. Es gebe ein q ∈ ]0, 1[ und ein n0 ∈ N, so dass cn 6= 0 und cn+1 cn ≤ q für alle n ≥ n0 ist. P Dann konvergiert ∞ n=0 cn absolut. Beispiel. a) Konvergeriert die Folge cn+1 cn gegen x < 1, so konvergiert die P∞ Reihe n=0 cn absolut, denn für jedes q mit x < q < 1 sind offenbar die Voraussetzungen des Quotientenkriteriums erfüllt. b) P∞ n3 n=0 2n ist konvergent, denn (n+1)3 2n+1 n3 2n = (n+1)3 2n3 → 1 2 < 1. Beweis von Satz 9.10. Wähle L so groß, dass |cn0 | ≤ Lq n0 . Wir können dann mittels Induktion beweisen, dass |cn | ≤ L P · q n für alle nP≥ n0 gilt. Also ist P∞ ∞ ∞ k n=0 cn konvergiert n=0 cn und k=0 Lq eine konvergente Majorante für absolut nach dem Majorantenkriterium. P∞ 1 Bemerkung. Die Konvergenz der Reihe n=1 n2 kann man nicht aus dem Quotientenkriterium folgern: Es gilt zwar 1 (n+1)2 1 n2 = n n+1 2 < 1, n 2 aber es gibt kein q < 1 mit ( n+1 ) < q für alle n. P Satz 9.11 (Wurzelkriterium). Sei ∞ q ∈ ]0, 1[ n=0 cn eine Reihe in C. Es gebe ein P p ∞ n und ein n0 ∈ N mit |cn | ≤ q für alle n ≥ n0 . Dann konvergiert n=0 cn absolut. P n Beweis. Es gilt P |cn | < q n für alle n ≥ n0 . Also ist ∞ n=0 q ist eine konvergente ∞ Majorante von n=0 cn . P 1 Beispiel. Die Reihe ∞ n=0 (3+(−1)n )n genügt den Voraussetzungen des Wurzelkriteriums, aber nicht denen des Quotientenkriteriums. Mit Ausnahmen des Cauchykriteriums haben alle bisherigen Kriterien absolute Konvergenz sicher gestellt. Es ist in der Regel schwierig über Konvergenz oder Divergenz einer Reihe zu entscheiden, wenn man schon weiß, dass die Reihe 62 9. Konvergenzkriterien für Reihen nicht absolut konvergiert aber dem notwendigen Kriterium (Satz 9.5) genügt. Das folgende Kriterium kann hier Abhilfe schaffen. Satz 9.12 (Leibnizsches Konvergenzkriterium). Es sei anP eine reelle monotone Nullfolge. Dann konver∞ n giert n=0 (−1) an . (Die Reihe ist möglicherweise nicht absolut konvergent.) Beispiel. Die alternierende harmonische Reihe P∞ (−1)n+1 1 ist konvergent. (Betrachte an = n+1 ). n=1 n Gottfried Wilhelm von Leibniz (1646-1716) Beweis von Satz 9.12. Nachdem wir gegebenfalls an durch −an ersetzt haben, können wir annehmen, dass an eine monoton P fallende Nullfoge ist. Insbesondere also an ≥ 0. Es ist zu zeigen, dass sn = nk=0 (−1)k ak eine Cauchyfolge ist. Sei ε > 0 gegeben. Wähle n0 so groß, dass |an | < ε für alle n ≥ n0 . Seien nun n, m ≥ n0 . Falls n gerade und m ungerade ist, ist m X (−1)k ak = (an − an+1 ) + (an+2 − an+3 ) + . . . + (am−1 − am ) ≥ 0. | {z } | {z } | {z } k=n ≥0 ≥0 ≥0 Falls n und m gerade sind, gilt entsprechend m X (−1)k ak = (an − an+1 ) + . . . + (am−2 − am−1 ) + am ≥ 0. | {z } | {z } |{z} k=n ≥0 ≥0 ≥0 Analog zeigt man für ungerade n m X (−1)k ak = (−an + an+1 ) + (−an+2 + an+3 ) + . . . ≤ 0. {z } | {z } | k=n Zusammen folgt ≤0 ≤0 m X (−1)k · ak ≤ |an | < ε, k=n denn sonst könnte sich durch Weglassen des Summanden (−1)n an das Vorzeichen der Summe nicht verändern. P Satz 9.13 (Umordnungssatz). Sind ∞ Reihe n=0 cn eine absolute konvergente P∞ in C und i : N → N, k 7→ nk eine Bijektion, P so konvergiert auch c k=0 nk und P∞ ∞ die Grenzwerte stimmen überein, d.h. es ist k=0 cnk = n=0 cn . 63 9. Konvergenzkriterien für Reihen Für eine endliche P h-elementige Menge M = {m1 , . . . , mh } und cm ∈ C für + . . . + cmh . Der Umordnungssatz m ∈ M definiert man m∈M cm := cm1P P recht∞ fertigt für absolut konvergente Reihen n=0 cn auch die Schreibweise n∈N cn . P Bemerkung. Ist (an )n∈N eine reelle Folge und ∞ n=0 an konvergent, aber nicht P (−1)n absolut konvergent, wie z. B. die alternierende harmonische P Reihe ∞ n=0 n+1 , so gibt es zu c ∈ R eine Bijektion i : N → N, k 7→ nk mit c = ∞ k=0 ank . P∞ Beweis von Satz 9.13. Sei c := n=0 cn und ε > 0 beliebig. Es ist zu zeigen, P dass es ein K ∈ N gibt mit c − lk=0 cnk < ε für alle l ≥ K. P P Da die Reihe ∞ gibt es ein N ∈ N mit ln=k |cn | < 3ε n=0 |cn | konvergiert, P∞ für alle k, l ≥ N . Dann ist auch n=k |cn | ≤ 3ε für alle k ≥ N . Setze K := 1 + max i−1 ({0, . . . , N }) 1 + max{k | nk ≤ N }. = Nach Definition ist dann nk > N für alle k ≥ K. Es sei nun l ≥ K. Dann ist l N X X cnk = c − cn − c − n=0 k=0 n∈{nk |0≤k≤l∧nk >N } N X ≤ c − cn + n=0 ∞ X ≤ cn + n=N +1 ∞ X ≤2· n=N +1 X X cn n∈{nk |0≤k≤l∧nk >N } ∞ X n=N +1 |cn | |cn | |cn | < ε. P∞ Satz n=0 an und P∞ 9.14 (Cauchy-Produkt). Es seien b absolut konvergente Reihen in C. Setzt man dann n n=0 P P∞ n cn := k=0 ak bn−k , so konvergiert n=0 cn absolut und es gilt ∞ ∞ ∞ X X X cn = an · bn . n=0 n=0 n=0 Augustin-Louis Cauchy (1789 – 1857) P Beweis. Wir zeigen zunächst die absolute Konvergenz der Reihe (k,l)∈N2 ak bl und dann die Behauptung indem wir N2 auf zwei verschiedene Arten abzählen. 64 9. Konvergenzkriterien für Reihen Es gelten für alle Folgen in C die Grenzwertsätze. Insbesondere ist ! h ! ∞ ∞ h X X X X an · bn = lim an bn . n=0 n=0 h X h X h→∞ n=0 n=0 Weiterhin n=0 an · bn = n=0 h X h X (an bm ) n=0 m=0 = X ak bl . (k,l)∈{(n,m)∈N2 |n≤h,m≤h} Es sei α : N → N2 , i 7→ (ki , li ) eine Bijektion, so dass für alle n ∈ N gilt: • • • • 14 • 9• 5• 2• • • • • • • • • > • • 1 • • • • • 4 9 16 • • • • • • • • • • • • • • • • • > > • > > • > > > • • > > > > > > > > • > > • • > > • • • > • > • > • • > • > • > 0 • > 3• • > 24• 15 • 8• • > > • • • • • • • 0 1 3 6 10 β : N → N2 , i 7→ (pi , qi ) α : N → N2 , i 7→ (ki , li ) α({0, . . . , n2 − 1}) = {(k, l) | k ≤ n − 1, l ≤ n − 1} = {0, . . . , n − 1} × {0, . . . , n − 1}. Damit ist h X n=0 an · h X n=0 bn = (h+1)2 −1 X aki bli , i=0 also ∞ X n=0 an · ∞ X n=0 bn = lim h→∞ (h+1)2 −1 X aki bli i=0 und ∞ X n=0 |an | · ∞ X n=0 |bn | = lim h→∞ (h+1)2 −1 X i=0 |aki bli |. 65 10. Die Exponentialfunktion P Insbesondere ist also ∞ i=0 aki bli absolut konvergent. Wähle nun weiter eine Bijektion β : N → N2 , i 7→ (pi , qi ) mit β 0, . . . , 12 n(n + 1) − 1 = (p, q) ∈ N2 | p + q ≤ n − 1 n−1 [ = i=0 Dann ist ∞ X ci = lim n→∞ i=0 = lim n→∞ (h, i − h) ∈ N2 | 0 ≤ h ≤ i . n−1 X ci i=0 n−1 i XX ah bi−h i=0 h=0 1 n(n+1)−1 2 X = lim n→∞ = ∞ X api bqi i=0 api bqi . i=0 Nach dem Umordnungssatz 9.13 gilt außerdem ∞ X aki bli = ∞ X n=0 10 api bqi . i=0 i=0 Zusammen folgt ∞ X an · ∞ X bn = n=0 ∞ X ci . i=0 Die Exponentialfunktion Definition und Satz 10.1. Für alle z ∈ C konvergiert die Reihe absolut und ihren Grenzwert bezeichnet man mit exp(z). Dabei gilt die Konvention 00 = 1 und 0! = 1 wie in Abschnitt 1. Beweis. Sei z ∈ C \ {0}. Dann ist z n+1 (n+1)! zn = n! |z| n+1 < 1 2 P∞ zn n=0 n! 66 10. Die Exponentialfunktion für n > 2·|z|. Das Quotientenkriterium 9.10 liefert nun absolute Konvergenz. Satz 10.2 (Funktionalgleichung von exp). Für alle z1 , z2 ∈ C gilt exp(z1 + z2 ) = exp(z1 ) · exp(z2 ). P P∞ z2n z1n Beweis. Die Reihen ∞ n=0 n! und n=0 n! sind absolut konvergent. Es gilt n n X z k z n−k 1 X n (z1 + z2 )n n−k k 2 1 cn = · = · · z · z = , 1 2 k! (n−k)! n! n! k k=0 k=0 wobei wir in der letzten Gleichung den binomischen Lehrsatz verwendet haben, Satz 1.6. Dieser bleibt auch für komplexe Zahlen mit demselben Beweis richtig. Mit dem Satz über das Cauchyprodukt (Satz 9.14) ergibt sich daraus exp(z1 ) · exp(z2 ) = = = ∞ ∞ X X z2n z1n · n! n! n=0 ∞ X n=0 ∞ X n=0 cn (z1 +z2 )n n! n=0 = exp(z1 + z2 ). Korollar 10.3. Es gilt: a) Für alle z ∈ C ist exp(z) 6= 0 und exp(−z) = 1 exp(z) . b) Für alle x, y ∈ R ist | exp(x + iy)| = exp(x) > 0. Leonhard Euler (1707-1783) Insbesondere ist | exp(iy)| = 1 und exp(x) > 0. c) Für alle k ∈ Z, n ∈ N+ ist exp k n = √ n k ek =: e n , wobei e := exp(1) die sogenannte Eulersche Zahl ist. Man schreibt auch exp(z) = ez . 67 10. Die Exponentialfunktion Beweis von Korollar 10.3. a) Für z ∈ C ist nach der Funktionalgleichung 10.2 exp(z) · exp(−z) = exp(z + (−z)) = exp(0) = 1. b) Nach a) ist exp( x2 ) 6= 0 und mit der Funktionalgleichung folgt exp(x) = exp x2 · exp x2 > 0. Für z = x + iy gilt nun exp(z) = lim h→∞ h X zn n! n=0 = lim h→∞ h X zn n! = exp(z), n=0 wobei im letzten Schritt Satz 8.10 benutzt wird. Somit | exp(z)|2 = exp(z) · exp(z̄) = exp(z + z̄) = exp(2x) = exp(x)2 . Da exp(x) > 0 folgt damit auch | exp(z)| = exp(x). c) Es ist e = exp(1) > 0. Durch Induktion zeigt man für alle k ∈ N ek = exp(k). (Induktionsschritt: ek+1 = ek · e = exp(k) · exp(1) = exp(k + 1).) Sei nun n ∈ N+ . n = exp nk · . . . · exp nk exp nk | {z } n-mal = exp nk + . . . + nk | {z } n-mal = exp(k) = ek > 0. Somit folgt exp( nk ) = richtig. √ n ek . Wegen a) bleibt die Gleichung auch für k ∈ Z Definition 10.4. Für y ∈ R setzt man cos y := cos(y) := Re(exp(iy)) ∈ R, sin y := sin(y) := Im(exp(iy)) ∈ R. 68 10. Die Exponentialfunktion Mit anderen Worten, es gilt die Eulersche Formel eiy = cos y + i sin y. a) (Reihendarstellung von cos y, sin y). Für alle y ∈ R gilt: Satz 10.5. cos y = sin y = ∞ X (−1)k ·y 2k (2k)! k=0 ∞ X , (−1)k ·y 2k+1 (2k+1)! . k=0 b) (Additionstheoreme). Für alle x, y ∈ R gilt: cos(x + y) = cos x · cos y − sin x · sin y, sin(x + y) = sin x · cos y + cos x · sin y. c) Für alle x ∈ R ist sin(−x) = − sin(x), cos(−x) = cos(x), und sin2 (x) + cos2 (x) = 1. Beweis. a) Sei y ∈ R. Dann ist exp(iy) = ∞ X (iy)n n! = Es gilt = i, i2 = −1, i3 Es folgt, wie behauptet, = n! . n=0 n=0 i1 ∞ X in ·y n −i, i4 = 1, allgemein also 1 falls 4|n i falls 4|n − 1 in = −1 falls 4|n − 2 −i falls 4|n − 3 cos y = Re(exp(iy)) = ∞ X i2n y 2n (2n)! n=0 sin y = Im(exp(iy)) = 1 i · = ∞ X (−1)n y 2n (2n)! ∞ X i2n+1 y 2n+1 (2n+1)! n=0 sowie n=0 = ∞ X (−1)n ·y 2n+1 (2n+1)! n=0 . 69 10. Die Exponentialfunktion b) Es ist cos(x + y) + i · sin(x + y) = ei(x+y) = eix · eiy = (cos x + i sin x) · (cos y + i sin y) = cos x · cos y − sin x · sin y + i · (sin x cos y + cos x sin y). Der Vergleich von Real- und Imaginärteile der beiden Seiten liefert die Behauptung. c) Dies folgt unmittelbar aus den Reihendarstellungen und Korollar 10.3. Satz 10.6 (Restgliedabschätzungen). Seien z ∈ C, x ∈ R und n ∈ N. a) Ist |z| ≤ 1 + n2 , so gilt exp(z) = n X zk k! + rn+1 (z), k=0 wobei rn+1 (z) ∈ C ist mit |rn+1 (z)| ≤ 2 · |z|n+1 (n+1)! . b) Ist |x| ≤ 2n + 2, so gilt cos x = n X (−1)k x2k (2k)! + r̃n+1 (x) k=0 mit r̃n+1 (x) ∈ R, |r̃n+1 (x)| ≤ x2n+2 (2n+2)! und (−1)n+1 r̃n+1 (x) ≥ 0. c) Ist |x| ≤ 2n + 3, so gilt sin x = n X (−1)k x2k+1 (2k+1)! + r̂n+1 (x) k=0 mit r̂n+1 (x) ∈ R, |r̂n+1 (x)| ≤ |x|2n+3 (2n+3)! und (−1)n+1 x · r̂n+1 (x) ≥ 0. 2 Es gilt für die Exponentialreihe |r13 (1)| ≤ 13! ≤ 4 · 10−10 . Aufsummieren der ersten 13 (k = 0, . . . , 12) Summanden der Exponentialreihe liefert für die Eulersche Zahl e = exp(1) somit 2, 7182818282 ≤ e ≤ 2, 7182818287. 70 10. Die Exponentialfunktion Beweis. a) Zunächst ist n ∞ X X k z |rn+1 (z)| = exp(z) − = k! k=0 ∞ X ≤ k! zk k=n+1 |z|k k! . k=n+1 Für z 6= 0 und k ≥ n + 1 gilt nach Voraussetzung |z|k+1 (k+1)! |z|k k! = |z| k+1 ≤ |z| n+2 ≤ 21 . Induktiv folgt für alle l ∈ N |z|n+1+l (n+1+l)! ≤ Daher ∞ X k=n+1 |z|k k! = 1 l 2 ∞ X · |z|n+1 (n+1)! . |z|n+1+l (n+1+l)! l=0 ≤ ∞ X |z|n+1 (n+1)! l=0 · 1 l 2 =2· |z|n+1 (n+1)! . b) Ohne Einschränkung sei x > 0. Dann ist r̃n+1 (x) = cos x − n X (−1)k ·x2k (2k)! = k=0 ∞ X (−1)k ·x2k (2k)! . k=n+1 Für |x| ≤ 2n + 2 und k ≥ n + 1 gilt x2(k+1) (2(k+1))! x2k (2k)! = x2 (2k+1)(2k+2) < 1, x2k die Folge (2k)! ist also für |x| ≤ 2n+2 monoton fallend. Der Rest des k≥n+1 Beweises ist analog zum Beweis des Leibnizschen Konvergenzkriteriums: Es gilt ∞ X k=n+1 (−1)k x2k (2k)! n+1 = (−1) ∞ X h=1 x2(n+2h−1) (2(n+2h−1))! − ( > 0 falls n + 1 gerade < 0 falls n + 1 ungerade. x2(n+2h) (2(n+2h))! 71 11. Stetigkeit n+1 2n+2 x Da die Reihe durch Weglassen des ersten Summanden (−1)(2n+2)! Vorzeichen verändert folgt ∞ X (−1)n+1 x2n+2 |x|2n+2 (−1)k x2k = (2n+2)! . (2k)! ≤ (2n+2)! ihr k=n+1 c) Der Beweis ist analog zu Teil b). 11 Stetigkeit Definition 11.1. Seien D ⊂ R, f : D → R, und a, b ∈ R ∪ {±∞}. a) Es gebe eine Folge xn ∈ D mit limn→∞ xn = a. Dann schreiben wir lim f (x) = b x→a genau dann, wenn für alle Folgen (an )n∈N in D gilt: lim an = a ⇒ lim f (an ) = b. n→∞ n→∞ b) Die Abbildung f : D → R heißt genau dann stetig in a ∈ D, wenn gilt: lim f (x) = f (a). x→a c) Die Abbildung f : D → R heißt genau dann stetig, wenn f stetig in a ist für alle a ∈ D. Beispiel. a) Es ist limx→1 x2 −1 x−1 f (x) = = 2: Für x ∈ R \ {1} ist x2 −1 x−1 = (x−1)(x+1) (x−1) = (x + 1) und es ist limx→1 x + 1 = 2. b) Die Funktionen f (x) = x und f (x) = c sind stetig. c) Die sogenannte Dirichlet-Funktion f : R → R mit 1 falls x ∈ Q f (x) := 0 falls x 6∈ Q ist nirgends stetig. Peter Gustav Lejeune Dirichlet (1805–1859) 72 11. Stetigkeit d) Die sogenannte thomaesche Funktion f : ]0, 1[→ R mit 1 falls x = pq mit teilfremden p, q ∈ N+ q f (x) := 0 falls x 6∈ Q ist stetig in x ∈]0, 1[ genau dann wenn x irrational ist. Lemma 11.2. Seien D ⊂ R, f : D → R und a, b ∈ R und es gebe eine Folge xn ∈ D mit lim xn = a. Dann gilt lim f (x) = b x→a genau dann, wenn h i ∀ ε > 0 ∃ δ > 0 derart, dass ∀ x ∈ D gilt |x − a| < δ ⇒ |f (x) − b| < ε . Beweis. Sei zunächst lim f (x) = b. x→a Sei ε > 0 gegeben. Angenommen, es gibt entgegen unser Behauptung für alle δ > 0 ein x ∈ D mit |x − a| < δ und |f (x) − b| ≥ ε. Insbesondere ist dann für jedes δ = n1 die Menge Dn = x ∈ D | |x − a| < n1 , |f (xn ) − b| ≥ ε Q nicht leer. Gemäß dem Auswahlaxiom ist das abzählbare Produkt ∞ n=1 Dn nicht leer. Mit anderen Worten, es gibt eine Folge (xn ) mit xn ∈ Dn . Wegen |xn − a| < 1 n folgt lim xn = a. Da |f (xn ) − b| ≥ ε konvergiert aber f (xn ) nicht gegen b. Dies ist ein Widerspruch. Es gelte nun umgekehrt h i ∀ ε > 0 ∃ δ > 0 derart, dass ∀ x ∈ D gilt |x − a| < δ ⇒ |f (x) − b| < ε . Sei (xn )n∈N eine Folge in D mit lim xn = a. Es ist limn→∞ f (xn ) = b zu zeigen. Sei ε > 0 gegeben. Nach Voraussetzung existiert ein δ > 0 mit |f (x) − b| < ε für alle x ∈ D mit |x − a| < δ. Wegen lim xn = a gibt es ein N ∈ N mit |xn − a| < δ für alle n ≥ N . Also ist |f (xn ) − b| < ε für alle n ≥ N . Lemma 11.3. a) Die Funktionen exp, sin, cos : R → R sind stetig in 0. b) Sind p(x) und q(x) Polynome mit q 6≡ 0, so ist f : {x ∈ R | q(x) 6= 0} → R, x 7→ stetig. p(x) q(x) 73 11. Stetigkeit Beweis. a) Nach Satz 9.6 gilt für |x| < 1 exp(x) = 1 + r1 (x) mit |r1 (x)| ≤ 2 · |x| 1! = 2 · |x|. Ist nun (xn ) eine Folge in R mit xn → 0, so ist | exp(xn ) − 1| = |r1 (xn )| ≤ 2 · |xn | →n→∞ 0, also lim exp(xn ) = 1 = exp(0). Entsprechend ist für |x| < 2 cos x = 1 + r̃1 (x) mit |r̃1 (x)| < xn → 0 |x|2 2! = x2 2 . Es folgt analog zu oben für eine Folge xn mit lim cos xn = 1 = cos(0). n→∞ Die Aussage für sin zeigt man entsprechend. b) Sei xn eine Folge mit limn→∞ xn = a und a ∈ {x | q(x) 6= 0}. Aus den Grenzwertsätzen folgt für die Polynome p, q lim p(xn ) = p(a), n→∞ lim q(xn ) = q(a) 6= 0 n→∞ und weiter lim p(xn ) n→∞ q(xn ) = p(a) q(a) . Satz 11.4 (Grenzwertsätze). Seien D ⊂ R, a ∈ R und es gebe xn ∈ D mit lim xn = a. Seien weiter f, g : D → R und b1 , b2 ∈ R mit limx→a f (x) = b1 und limx→a g(x) = b2 . Dann folgt: a) limx→a f (x) ± g(x) = b1 ± b2 . b) limx→a f (x) · g(x) = b1 · b2 . c) Falls b2 6= 0 ist, dann gibt es ein δ > 0, so dass g(x) 6= 0 ist für alle (x) x ∈ D0 := D ∩ [a − δ, a + δ], und weiterhin ist limx→a fg(x) = bb12 . 74 11. Stetigkeit d) Gilt f (x) ≤ c für alle x ∈ D, so folgt b2 ≤ c. e) Ist M ⊂ R mit f (D) ⊂ M und h : M → R mit limx→b1 h(x) = b3 , dann folgt limx→a (h ◦ f )(x) = b3 . Beweis. a) - d) sind bereits bekannt. e) Ist xn ∈ D eine Folge mit xn → a, so ist f (xn ) ∈ M mit f (xn ) → b1 und darum h(f (xn )) → b3 . Korollar 11.5. Seien D ⊂ R und f, g : D → R stetig in a ∈ D. a) Dann sind auch f + g, f − g, f · g stetig in a. b) Falls g(a) 6= 0 ist, dann gibt es ein δ > 0, so dass g(x) 6= 0 ist für alle (x) x ∈ D0 := [a − δ, α + δ] ∩ D, und weiterhin ist h : D0 → R, x 7→ fg(x) stetig in a. c) Ist h : M → R, wobei M ⊂ R mit f (D) ⊂ M , und ist h stetig in f (a), dann ist h ◦ f stetig in a mit limx→a h(f (x)) = h(f (a)). Korollar 11.6. exp, sin, cos : R → R sind stetig. Beweis. Sei a ∈ R. Es ist zu zeigen, dass lim exp(x) = exp(a) x→a gilt. Dies ist äquivalent zu lim exp(a + h) = exp(a), h→0 d.h. lim exp(a) · exp(h) = exp(a). h→0 Nach den Grenzwertsätzen und Lemma 11.3 gilt lim (exp(a) · exp(h)) = exp(a) · exp(0) = exp(a). h→0 Dies zeigt die Stetigkeit von exp. Weiter ist limx→a cos(x) = cos(a) äquivalent zu limh→0 cos(a + h) = cos(a). Wiederum mit Lemma 11.3 gilt aber lim cos(a + h) = lim cos(a) · cos(h) − sin(a) · sin(h) = cos(a). | {z } | {z } h→0 h→0 →1 Entsprechend folgt die Stetigkeit von sin. →0 75 11. Stetigkeit Intervalle wurden zum Teil schon benutzt, aber um Mißverständnisen vorzubeugen hier noch einmal die genaue Definition 11.7. Seien a, b ∈ R. Für a < b setze [a, a] = {a} [a, b] = {x ∈ R | a ≤ x ≤ b} ]a, b[ = ]a, b] = [a, b[ = [a, ∞[ = abgeschlossenes Intervall“. ” {x ∈ R | a < x < b} offenes Intervall“ ” {x ∈ R | a < x ≤ b} (links) halboffenes Intervall“, ” {x = R | a ≤ x < b} (rechts) halboffenes Intervall“, ” {x ∈ R | a ≤ x}, ]a, ∞[= {x ∈ R | a < x}, ] − ∞, b] = {x ∈ R | x ≤ b}, ] − ∞, ∞[ = R. ] − ∞, b[= {x ∈ R | x < b}, Diese Mengen heißen Intervalle. Satz 11.8 (Zwischenwertsatz). Sei f : [a, b] → R stetig. Dann wird jeder Wert zwischen f (a) und f (b) angenommen. Ist also u ∈ R ein Wert mit (f (a) − u)(f (b) − u) < 0, so gibt es ein c ∈ ]a, b[ mit f (c) = u. Beweis. Es reicht den Fall f (a) < f (b) zu betrachten. Sei f (a) < u < f (b). Es ist zu zeigen, dass ein c ∈ [a, b] existiert mit f (c) = u. Setze M = {x ∈ [a, b] | u < f (x)}. Es gilt M 6= ∅, da b ∈ M . Da M beschränkt ist, ist c := inf M = inf{x ∈ [a, b] | u < f (x)} eine reelle Zahl. Nach Satz 5.11 gibt es eine Folge (xn )n∈N in M mit limn→∞ xn = c. Mithin folgt aus a ≤ xn ≤ b auch c ∈ [a, b]. Da f stetig ist, gilt limn→∞ f (xn ) = f (c). Wegen f (xn ) > u ist weiter f (c) ≥ u. Insbesondere folgt c > a, da f (a) < u. Wegen x > a ist cn = c − n1 ∈ [a, b] für alle großen n. Wegen cn < c = inf M folgt cn 6∈ M und somit f (cn ) ≤ y. Zusammen mit der Stetigkeit von f in c ergibt sich durch Grenzübergang f (c) = lim f (cn ) ≤ u. Insgesamt also f (c) = u. Korollar 11.9. Sei I Intervall und f : I → R stetig. Dann ist f (I) ein Intervall. 76 11. Stetigkeit Beweis. Setze c = inf{f (x) | x ∈ I} ∈ R ∪ {−∞}, d = sup{f (x) | x ∈ I} ∈ R ∪ {∞}. Offenbar ist f (I) ⊂ ]c, d[ ∪ {c, d}. Also reicht es, Bild f = f (I) = {f (x) | x ∈ I} ⊃ ]c, d[ zu zeigen. Sei nun c < y < d. Dann gibt es x1 , x2 ∈ I mit f (x1 ) < y < f (x2 ). Gilt nun x1 < x2 , so folgt y ∈ f (I) aus dem Zwischenwertsatz angewendet auf f|[x1 ,x2 ] : [x1 , x2 ] → R, x 7→ f (x). Ist x2 < x1 , so folgt die Behauptung aus dem Zwischenwertsatz angewendet auf f|[x2 ,x1 ] : [x2 , x1 ] → R. Satz 11.10. Seien a, b ∈ R, a < b. Ist f : [a, b] → R stetig, so nimmt f Maximum und Minimum an. Insbesondere ist f beschränkt. Beweis. Setze wieder c = inf{f (x) | x ∈ [a, b]} ∈ R ∪ {−∞}, d = sup{f (x) | x ∈ [a, b]} ∈ R ∪ {∞}. Nach Satz 5.11 gibt es eine Folge yn ∈ {f (x) | x ∈ [a, b]} mit limn→∞ yn = c. Wähle dazu xn ∈ [a, b] mit yn = f (xn ). Nach Bolzano Weierstraß gibt es eine konvergente Teilfolge (xnk )k∈N . Setze x = limk→∞ xnk . Wegen a ≤ xnk ≤ b folgt x ∈ [a, b]. Die Stetigkeit von f liefert nun f (x) = lim f (xnk ) = lim ynk = c. k→∞ k→∞ Analog erhält man ein x0 ∈ [a, b] mit f (x0 ) = d. Es ist wichtig, dass die Intervalle im Satz 11.10 abgeschlossen sind: Es gilt beispielsweise exp(R) = ]0, ∞[, wie der folgende Satz zeigt. Definition 11.11. Sei I ein Intervall. Eine Abbildung f : I → R heißt • monoton wachsend, wenn für alle x, y ∈ I gilt: x > y ⇒ f (x) ≥ f (y), • streng monoton wachsend, wenn für alle x, y ∈ I gilt: x > y ⇒ f (x) > f (y), • monoton fallend, wenn für alle x, y ∈ I gilt: x > y ⇒ f (x) ≤ f (y), • streng monoton fallend, wenn für alle x, y ∈ I gilt: x > y ⇒ f (x) < f (y). 77 11. Stetigkeit Satz 11.12. Für exp : R → R gilt: a) exp(R) = ]0, ∞[. b) exp ist streng monoton wachsend. c) limx→∞ exp(x) = ∞ und limx→−∞ exp(x) = 0. Beweis. a) Es ist exp(x) > 0 für alle x ∈ R, also exp(R) ⊂ ]0, ∞[. Weiter ist sup{exp(x) | x ∈ R} = ∞, P nk denn für alle n ∈ N gilt exp(n) = ∞ k=0 k! ≥ 1 + n →n→∞ ∞. Entsprechend ist inf{exp(x) | x ∈ R} = 0, 1 denn für alle n ∈ N gilt exp(−n) = exp(n) ≤ und somit exp(R) ein Intervall ist, folgt 1 1+n →n→∞ 0. Da exp stetig exp(R) = ]0, ∞[. b) Es ist exp(0) = 1. Für x > 0 ist exp(x) = ∞ X xk k! > 1. k=0 Ist x > y, so ist exp(x) = exp(y − (y − x)) = exp(y) · exp(x − y) | {z } | {z } >0 >1 > exp(y). k x Bemerkung 11.13. Für alle k ∈ N ist limx→∞ exp(x) = 0, denn ist x > 0, so P∞ xn k+1 k x x xk ist exp(x) = n=0 n! > (k+1)! und also exp(x) ≤ xk+1 · (k + 1)! →k→∞ 0. 78 11. Stetigkeit Satz 11.14. a) Die Betragsabbildung R → R, x 7→ |x| ist stetig. b) Seien a < b < c. Eine Abbildung f : [a, c] → R ist genau dann stetig, wenn f|[a,b] und f|[b,c] stetig sind. c) Stetigkeit ist eine lokale Bedingung, d.h. für D ⊂ R, f : D → R, a ∈ D und δ > 0 gilt: f ist genau dann stetig in a, wenn f|([a−δ,a+δ]∩D ) stetig in a ist. Beweis. b) Es sei x ∈ [a, c] und ε > 0. Es ist zu zeigen: ∃ δ > 0 mit ∀ x0 ∈ [a, c] gilt (|x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε) ist äquivalent zu ∃ δ > 0 mit ∀ x0 ∈ [a, b] gilt (|x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε) ∧∀ x0 ∈ [b, c] mit (|x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε). Dies ist offenbar richtig. Satz 11.15. Es sei I ein Intervall, f : I → R streng monoton und stetig. Setze J := f (I). Dann existiert f −1 : J → I mit f ◦ f −1 = f −1 ◦ f = id und die Umkehrfunktion f −1 ist stetig. Beispiel 11.16. a) Sei k ∈ N. Die streng monotone Abbildung [0, ∞[→ [0, ∞[ , x 7→ xk ist stetig und besitzt somit eine stetige Umkehrabbildung √ k · : [0; ∞[−→ [0, ∞[⊂ R. √ Es gilt ( k x)k = x. b) Die Umkehrabbildung ln := log := exp−1 : ]0, ∞[→ R, der Exponentialfunktion exp : R →]0, ∞[ heißt Logarithmus und ist stetig. Es gilt exp(log x) = x und log(exp y) = y. 79 11. Stetigkeit Lemma 11.17. Eine beschränkte Folge (xn )n∈N ⊂ R konvergiert genau dann, wenn sie nur einen Häufungspunkt hat. Beweis. Sei x der eindeutige Häufungspunkt von (xn )n∈N . Angenommen, es ist limn→∞ xn 6= x. Dann gibt es ein ε > 0 mit |xn −x| ≥ ε für unendlich viele n ∈ N. Es gibt also eine Teilfolge (xnk )k∈N mit |xnk −x| ≥ ε für alle k ∈ N. Nach Bolzano Weierstraß hat (xnk )k∈N eine konvergente Teilfolge. Der zugehörige Grenzwert ist ein Häufungspunkt von (xn )n∈N , der von x verschieden ist. Dies ist ein Widerspruch. Beweis von Satz 11.15. Wir betrachten den Fall, dass f streng monoton wachsend ist. Für x, y ∈ I gilt also x > y ⇒ f (x) > f (y), x ≤ y ⇒ f (x) ≤ f (y) und zusammen x > y ⇔ f (x) > f (y). Also ist auch f −1 : J → I streng monoton wachsend. Sei y ∈ J und (yn )n∈N eine Folge in J mit limn→∞ yn = y. Für die Stetigkeit von f −1 ist lim f −1 (yn ) = f −1 (y) n→∞ zu zeigen. Da (yn )n∈N in J konvergiert, gibt es Schranken z1 , z2 ∈ J, so dass z1 ≤ yn ≤ z2 für alle n ∈ N ist. Es folgt für alle n ∈ N f −1 (z1 ) ≤ f −1 (yn ) ≤ f −1 (z2 ). Die Folge xn := f −1 (yn ) ∈ I ist also beschränkt. Sei x ein Häufungspunkt von f −1 (yn ) und dazu (xnk )k∈N eine Teilfolge mit limk→∞ xnk = x. Da f stetig ist, folgt f (x) = lim f (xnk ) = lim ynk = y. k→∞ k→∞ Es ist also f (x) = y = f (f −1 (y)) und mit der Injektivität von f folgt x = f −1 (y) für jeden Häufungspunkt x. Insbesondere ist die Folge (xn ) nach Lemma 11.17 konvergent mit Grenzwert f −1 (y). 80 11. Stetigkeit Lemma 11.2 erlaubt eine äquivalente Umformulierung des Begriffes der Stetigkeit zum sogenannten ε–δ–Kriterium der Stetigkeit: Ist D ⊂ R dann ist eine Abbildung f : D → R genau dann stetig in a ∈ D, wenn Für ε = 0, 5 kann man im Beispiel δ = 0, 5 wählen. h i ∀ ε > 0 ∃ δ > 0 : ∀ x ∈ D gilt |x − a| < δ ⇒ |f (x) − f (a)| < ε . Die Abbildung f : D → R ist also genau dann stetig, wenn h i ∀a ∈ D ∀ ε > 0 ∃δ > 0 : ∀ x ∈ D gilt |x − a| < δ ⇒ |f (x) − f (a)| < ε . Definition 11.18. Sei D ⊂ R. Eine Abbildung f : D → R heißt gleichmäßig stetig genau dann, wenn gilt: h i ∀ ε > 0 ∃ δ > 0 : ∀ a ∈ D ∀ x ∈ D gilt |x − a| < δ ⇒ |f (x) − f (a)| < ε . Bei gleichmäßiger Stetigkeit darf die Wahl von δ also nicht von a abhängen. Offenbar sind gleichmäßig stetige Abbildungen stetig. Beispiel. Die Abbildung R → R, x 7→ x2 ist stetig, aber nicht gleichmäßig stetig: Angenommen, zu ε = 1 gäbe es ein δ > 0 mit |x2 −a2 | < 1 für alle x, a ∈ R mit |x−a| < δ. Dann wäre für alle x ∈ R 2 1 > x2 − (x + 2δ )2 = x · δ + δ4 . Dies ist aber falsch für x > 1δ . Satz 11.19. Es sei a < b ∈ R, und sei f : [a, b] → R stetig. Dann ist f gleichmäßig stetig. Beweis. Angenommen, f ist nicht gleichmäßig stetig. Dann gibt es also ε > 0 derart, dass wir für alle δ = n1 mit n ∈ N+ Zahlen xn , yn ∈ [a, b] finden können mit |xn − yn | < δ = n1 und |f (xn ) − f (yn )| ≥ ε. Nach dem Satz von Bolzano Weierstraß (Satz 5.14) hat (xn )n∈N eine konvergente Teilfolge (xnk )k∈N mit Grenzwert x = limk→∞ xnk . Wegen |xnk − ynk | < 1 k→∞ nk −→ 0 81 12. Logarithmen und allgemeine Potenzen ist auch limk→∞ ynk = x. Da f stetig in x ∈ [a, b] ist, folgt somit lim f (xnk ) − f (ynk ) = f (x̄) − f (x̄) = 0. k→∞ Dies ist ein Widerspruch zur Annahme. Beispiel. Die Abbildung f : ]0, 1[→ R, x 7→ x1 ist stetig, aber nicht gleichmäßig stetig: Sei ε = 1, und sei δ > 0 beliebig. Es reicht x, a ∈ ]0, 1[ zu finden mit |x − a| < δ und |f (x) − f (a)| > 1. Sei dazu x = min{0.5, δ} und a = x2 . Dann ist 12 |f (x) − f (a)| = x1 − x2 = 1 x > 1. Logarithmen und allgemeine Potenzen Definition 12.1. a) log : ]0, ∞[ → R ist die Umkehrabbildung der Bijektion exp : R →]0, ∞[. b) Für a > 0 und x ∈ R setzt man expa (x) = exp(x · log a) Satz 12.2. Es gilt: a) log ist streng monoton wachsend und stetig. b) log(x · y) = log x + log y. c) limx→∞ log x = ∞ und limx→0 log x = −∞. d) log(1) = 0. Beweis. Graph von log(x) a) Dies hatten wir bereits in Beispiel 11.16 gesehen. b) Es ist exp(log(x · y)) = x · y = exp(log(x)) · exp(log(y)) = exp log(x) + log(y) . Mit der Injektivität von exp folgt log(x · y) = log(x) + log(y). c) Dies folgt daraus, dass log streng monoton und surjektiv ist. 82 13. Trigonometrische Funktionen Satz 12.3. Seien a > 0 und p, q ∈ N+ . Dann gilt √ p expa pq = q ap = a q , − pq 1 expa − pq = √ . q p = a a Man schreibt daher expa (x) = ax für x ∈ R. Beweis. Es gilt offenbar expa (x + y) = expa (x) expa (y). Die Aussage folgt somit völlig analog zu Korollar 10.3. Für a = 1 gilt offenbar expa ≡ 1. In den anderen Fällen gilt: Satz 12.4. Sei a > 0 mit a 6= 1. a) Die Abbildung R → R, x 7→ ax ist streng monoton und stetig mit Bild ]0, ∞[. Genauer ist die Funktion für a > 1 streng monoton wachsend und für a < 1 streng monoton fallend. b) Für die Umkehrabbildung loga: ]0, ∞[→ R von x 7→ ax gilt loga (x) = log x log a . Beweis. a) Sei a > 1. Dann ist log a > 0, also log a · x streng monoton wachsend in x. Da exp streng monoton wachsend ist, ist ax = exp(log a · x) ebenfalls streng monoton wachsend. Die Aussage für a < 1 zeigt man analog. b) Es ist expa (loga (x)) = x = exp(log x) x = exp log · log(a) log a x = expa log log a . Da expa injektiv ist, folgt loga (x) = 13 log x log a . Trigonometrische Funktionen Wir haben sin und cos mittels der Eulerschen Formel eiy = cos(y) + i sin(y) erklärt und daraus die Reihendarstellungen cos y = ∞ X (−1)k ·y 2k (2k)! k=0 und sin y = ∞ X (−1)k ·y 2k+1 (2k+1)! k=0 83 13. Trigonometrische Funktionen hergeleitet. Wir hatten gesehen, dass die Additionstheoreme gelten: cos(x + y) = cos x · cos y − sin x · sin y, sin(x + y) = sin x · cos y + cos x · sin y. für alle x, y ∈ R. Insbesondere, folgt sin2 (x) + cos2 (x) = cos(x − x) = 1. Weitherhin wissen wir bereits, dass sin und cos stetige Funktionen sind. Auch die Restgliedabschätzungen werden wichtig bleiben (Satz 10.6). In diesem Abschnitt stellen wir weitere wesentlichen Eigenschaften von sin und cos zusammen und zeigen insbesondere die Übereinstimmung mit der Schuldefinition. a) Für alle x ∈ ]0, 2[ gilt sin x > 0. Proposition 13.1. b) Es gibt genau ein x0 ∈ [0, 2] mit cos x0 = 0. 3 Beweis. a) Es gilt sin x = x+r̂1 (x) mit |r̂1 (x)| ≤ |x| 3! für |x| ≤ 3. Für x ∈ ]0, 2] ist dann 2 sin(x) x3 = 1 + r̂1x(x) ≥ 1 − 3!·x = 1 − x6 ≥ 13 x und somit sin(x) > 0. b) Wir beginnen damit, die Existenz von x0 ∈ [0, 2] nachzuweisen. Wegen cos 0 = 1 > 0 reicht es aufgrund des Zwischenwertsatzes zu zeigen, dass cos 2 < 0 ist. Es gilt cos 2 = 1 − mit |r̃2 (2)| ≤ 24 4! 22 2! + r̃2 (2) = −1 + r̃2 (2) = 23 . Also ist cos 2 ≤ −1 + 2 3 = − 31 < 0. Um die Eindeutigkeit von x0 nachzuweisen seien 0 ≤ x1 ≤ x2 ≤ 2 mit cos(x1 ) = cos(x2 ) = 0 gegeben. Wir müssen dann x1 = x2 zeigen. Es ist 0 = cos x2 = cos(x1 + (x2 − x1 )) = cos x1 · cos(x2 − x1 ) − sin x1 · sin(x2 − x1 ). Wegen cos(x1 ) = 0 und sin(x1 ) > 0 ist also sin(x2 − x1 ) = 0. Schließlich folgt aus x2 − x1 ∈ [0, 2] mittels a) x2 − x1 = 0. Definition 13.2. Wir definieren π ∈ R als die eindeutig bestimmte Zahl mit π π 2 ∈ [0, 2] und cos 2 = 0. 84 13. Trigonometrische Funktionen a) cos x + Satz 13.3. π 2 = − sin x, sin x + π 2 b) cos(x + π) = − cos x, sin(x + π) = − sin x. = cos x. c) cos(x + 2π) = cos x, sin(x + 2π) = sin x. d) cos(−x) = cos x, sin(−x) = − sin(x). e) cos ist auf [0, π] streng monoton fallend. f ) sin ist auf − π2 , π2 streng monoton steigend. Beweis. a) Es ist π cos(x + π2 ) + i · sin(x + π2 ) = ei(x+ 2 ) π = ei· 2 · eix = (cos π2 + i · sin π2 )(cos x + i sin x) = i cos x − sin x. Der Vergleich von Real- und Imaginärteil beider Seiten liefert die Behauptung. b) Mit a) ist cos(x + π) = cos(x + π 2 + π2 ) = − sin(x + π2 ) = − cos(x). c) Analog. d) Dies folgt unmittelbar aus den Reihendarstellungen. 13. Trigonometrische Funktionen 85 e) Wir zeigen zunächst, dass cos auf [0, π2 ] streng monoton fallend ist. Seien x0 , x1 ∈ [0, π2 ] mit x0 < x1 . Es ist cos x0 > cos x1 zu zeigen. cos x1 = cos(x0 + (x1 − x0 )) = cos(x0 ) · cos(x1 − x0 ) − sin(x0 ) · sin(x1 − x0 ) ≤ cos(x0 ) · cos(x1 − x0 ) < cos(x0 ) wobei wir in der vorletzten Ungleichung sin(x0 ) ≥ 0 und sin(x1 − x0 ) > 0 genutzt haben. Für die letzte Ungleichung reicht es wegen cos(x1 − x0 ) ≤ p 1 − sin2 (x1 − x0 ) < 1 die Ungleichung cos(x0 ) > 0 zu zeigen. Wäre aber cos(x0 ) ≤ 0, so gäbe es nach dem Zwischenwertsatz eine Nullstelle von cos im Intervall [0, x0 ] ⊂ 0, π2 und dies widerspräche Proposition 13.1 und unserer Definition von π. Es folgt, dass cos auf [0, π2 ] streng monoton fallend ist. π Es verbleibt somit noch zu zeigen, dass cos streng monoton fallend auf 2 , π ist. Wegen cos(x) = cos(−x) = − cos(π − x) folgt dies aber aus dem ersten Teil. f) Da cos streng monoton fallend auf [0, π] ist und cos(x) = cos(−x) gilt, ist cos strengmonoton wachsend auf [−π, 0]. Außerdem ist gemäß sin(x) = a) π π π cos x − 2 , und daher ist sin streng monoton wachsend auf − 2 , 2 . Satz 13.4. a) Die Abbildung [0, 2π[→ C, ϕ 7→ ei·ϕ ist injektiv und hat die Kreislinie S1 = {z ∈ C | |z| = 1} als Bild. b) |eiϕ − eiψ | ≤ |ϕ − ψ| für alle ϕ, ψ ∈ [0, 2π]. c) Für ϕ ≥ 0 ist lim n→∞ n−1 X k=0 (k+1)ϕ kϕ − exp i exp i n n = ϕ. Sei ϕ ∈]0, 2π[. Wir wollen nun zunächst erklären weswegen der Satz es rechtfertigt die Länge des Kreisbogens von 1 (gegen den Uhrzeigersinn) nach und eiϕ als ϕ zu definieren. Teil a) besagt, dass die Kurve c : [0, ϕ] → C, ψ 7→ eiψ eine Bijektion auf diesen Kreisbogen ist. Die Ungleichung in b) besagt, dass die Abbildung c Abstände nicht vergrößert, |c(t) − c(s)| ≤ |t − s|. Deswegen sollte wie 86 13. Trigonometrische Funktionen auch immer man Länge L(c) definiert die Ungleichung L(c) ≤ ϕ gelten. Jedes Folgeglieder auf der linken Seite in b) repräsentiert die Länge eines Polygonzuges. Die Länge dieses Polygonzuges stellt offenbar eine untere Schranke für L(c) dar. Da diese untere Schranken auch gegen ϕ konvergieren, ist es gerechtfertigt L(c) = ϕ zu definieren. Bevor wir den Satz beweisen, halten wir das folgende Korollar fest. Korollar 13.5. Die Schuldefinition des sin und cos stimmt mit der Reihendefinition überein. Insbesondere, ist auch 2π die Länge der Kreislinie, wenn π durch Definition 13.2 definiert ist. Beweis. Es gilt eiϕ = cos(ϕ)+i sin(ϕ) ∈ {z ∈ C | |z| = 1}. Weiterhin ist ϕ die Länge des Kreisbogens von 1 (gegen den Uhrzeiger Sinn) nach eiϕ . Die Projektion dieses Vektors eiϕ ∈ C = R2 auf die x-Achse wird aber in der Schule dann als cos(ϕ) definiert. Entsprechend wird sin(ϕ) als die Projektion dieses Vektors auf die y-Achse erklärt. Beweis von Satz 13.4. a) Es ist eiϕ = cos ϕ + i sin ϕ. Es gilt: • Auf [0, π]: (ϕ 7→ Re(eiϕ )) ist injektiv und Im(eiϕ ) ≥ 0. • Auf ]π, 2π[: (ϕ 7→ Re(eiϕ )) ist injektiv und Im(eiϕ ) < 0. Zusammen folgt die Injektivität. Sei nun z ∈ C mit |z| = 1. 1. Fall: Im z ≥ 0. Wähle ϕ ∈ [0, π] mit cos ϕ = Re(z) ∈ [−1, 1]. Dies ist möglich nach dem Zwischenwertsatz. Dann ist sin ϕ ≥ 0 und es gilt p p sin ϕ = 1 − cos2 ϕ = 1 − Re(z)2 = | Im(z)| = Im(z), wobei die letzte Gleichheit aus Im(z) ≥ |z| = 1 folgt. Also ist z = eiϕ . 2. Fall: Im z < 0. Wähle ϕ ∈ ]π, 2π[ mit cos ϕ = Re(z) ∈ ] − 1, 1[. Dann ist sin ϕ ≤ 0 sowie Im |z| < 0, also p p − sin ϕ = 1 − cos2 ϕ = 1 − Re(z)2 = | Im(z)| = − Im(z) und es ist wieder z = eiϕ . b) Für ϕ, ψ ∈ R gilt |eiϕ − eiψ |2 = |1 − eiϕ−ψ |2 = 2(1 − cos(ϕ − ψ)) = 4 sin2 ϕ−ψ 2 87 13. Trigonometrische Funktionen wobei wir in der letzten Gleichung die Verdoppelungsformel 2 sin2 (α) = (1 − cos(2α)) benutzt haben, welche wiederum direkt aus den Additionstheoremen folgt. Nach Satz 10.6 gilt | sin(x)| ≤ |x| und nun folgt insgesamt wie behauptet |eiϕ − eiψ | ≤ |ψ − ϕ|. c) Es ist n−1 X k=0 k+1 |ei· n ·ϕ k i· n ϕ −e |= n−1 X k=0 1 k |ei· n ·ϕ | · |ei· n ·ϕ − 1| ϕ = n · |ei· n − 1|. ϕ i· n ϕ n ϕ n) Es gilt e = 1 + i · + r2 (i · mit |r2 (i · In diesem Fall ist also einerseits nach b) ϕ |ei· n − 1| ≤ ϕ n )| ≤ 2· ϕ2 n2 2! , falls |i · ϕn | ≤ 2. |ϕ| n und andererseits ϕ |ei· n − 1| = |i · Zusammen also ϕ− ϕ2 n ϕ n + r2 (i · ϕn )| ≥ |ϕ| n − |ϕ|2 n2 ϕ ≤ n · |ei· n − 1| ≤ ϕ ϕ Mit dem Schachtelungssatz folgt limn→∞ n · |ei· n − 1| = ϕ. Korollar 13.6. a) Die Exponentialabbilung exp : C → C hat das Bild C\{0}. b) Es ist exp(z1 ) = exp(z2 ) genau dann, wenn z1 − z2 ∈ 2πi · Z ist. Beweis. a) Es ist exp(z) · exp(−z) = 1, also exp(z) 6= 0. Es bleibt zu zeigen, dass es für alle η ∈ C \ {0} ein z ∈ C gibt mit exp(z) = η. Wähle nach η Satz 13.4 ein y ∈ R mit eiy = |η| und ein x ∈ R mit exp(x) = |η| > 0 (d.h. x := log |η|). Dann gilt ex+iy = ex · eiy = |η| · η |η| = η. 88 13. Trigonometrische Funktionen b) Die Rückrichtung ist klar, wir zeigen also die Hinrichtung. Aus exp(z1 ) = exp(z2 ) folgt mit Korollar 10.3 exp(Re(z1 )) = | exp(z1 )| = | exp(z2 )| = exp(Re(z2 )) und somit Re(z1 ) = Re(z2 ), denn x 7→ ex = exp(x) ist als streng monoton wachsende Abbildung injektiv. Also gibt es ein y ∈ R mit iy = z1 − z2 . Weiterhin exp(z1 ) exp(iy) = exp(z1 − z2 ) = exp(z =1 2) Aus der Eulerschen Formel folgt cos(y) = 1 und somit y ∈ 2πZ. Korollar 13.7. a) Jedes z ∈ C lässt sich in Polarkoordinaten schreiben, d.h. es gibt r ≥ 0 und ϕ ∈ R mit z = r · eiϕ . Genauer ist r = |z|. b) Es gilt r1 eiϕ1 · r2 eiϕ2 = r1 r2 · ei(ϕ1 +ϕ2 ) . (Das bedeutet: Bei Multiplikation in C werden die Beträge multipliziert und die Winkel addiert.) c) Für alle η ∈ C und k ∈ N+ hat die Gleichung z k = η eine Lösung in C. Beweis. c) Ohne Einschränkung sei η 6= 0. Wähle c ∈ C mit η = exp(c). Dann ist z := exp( kc ) eine Lösung. Die anderen k − 1-Lösungen sind dann gegeben durch z · ei 2πj k , j = 1, . . . , k − 1. eiϕ · y Satz 13.8 (Kosinussatz). Es gilt für x, y ∈ R+ , ϕ ∈ R |y · eiϕ − x|2 = y 2 + x2 − 2xy cos ϕ. Beweis. Es ist y e 1 iϕ |eiϕ y − x| ϕ cos ϕ |y · eiϕ − x|2 = (y · eiϕ − x) · (y · e−iϕ − x) = y 2 eiϕ e−iϕ + x2 − xy(eiϕ + e−iϕ ) = x2 + y 2 − 2xy cos(ϕ) x 89 13. Trigonometrische Funktionen a) Der Arkuscosinus Definition 13.9. arccos : [−1, 1] → [0, π] ist die Umkehrfunktion von cos|[0,π] : [0, π] → [−1, 1]. b) Ähnlich ist der Arkussinus arcsin : [−1, 1] → − π2 , π2 Umkehrfunktion von sin|[− π , π ] : − π2 , π2 → [−1, 1]. 2 2 c) Der Tangens ist erklärt durch tan : R \ π2 + kπ | k ∈ Z → R, x 7→ d) Der Arkustangens arctan : R → funktion von tan|]− π2 , π2 [ . π 2 sin x cos x . π , 2 2 ist die Umkehr- π 0 arctan(x) π − 2 -4 arctan(x) -3 -2 -1 0 1 2 3 4 √ √ 5−1 Lemma 13.10. Es gilt cos( π3 ) = 12 , cos( π6 ) = 23 , cos( π4 ) = √12 , cos( 2π 5 )= 4 , q√ √ 5+3 und sin( π3 ) = 23 , sin( π6 ) = 12 , sin(π/4) = √12 , sin( 2π cos( π5 ) = 8 5 ) = √ q √ √ 10+2 5 , sin( π5 ) = 5−8 5 4 Beweis. Kennt man den Wert von cos(ϕ) so kann man den Wert von cos(ϕ/2) mit der Verdoppelungsformel cos2 (ϕ/2) = 12 (cos(ϕ) + 1) ermitteln. Weiterhin p gilt sin(ϕ) = 1 − cos2 (ϕ) für ϕ ∈ [0, π]. Wir sehen also, dass es reicht die Werte cos(2π/3) und cos(2π/5) zu bestimmen. Wir setzen ω = ei Damit ergibt sich 2π 5 . Es gilt dann offensichtlich ω 5 = 1. 0 = 1 + ω + ω2 + ω3 + ω4 , denn wenn wir die rechte Seite der Gleichung mit ω multiplizieren ändert sich 90 14. Differenzierbarkeit nichts. Weiterhin ist ω̄ = ω 4 und ω 3 = ω̄ 2 . Folglich 0 = Re 1 + ω + ω 2 + ω 3 + ω 4 = 1 + 2 cos(2π/5) + 2 cos(4π/5) = 1 + 2 cos(2π/5) + 2 cos2 (2π/5) − 2 sin2 (2π/5) = −1 + 2 cos(2π/5) + 4 cos2 (2π/5) Damit haben wir eine √ quadratische Gleichung für cos(2π/5) gefunden und man überprüft leicht, dass 5−1 die einzige positive Lösung ist. 4 Der Wert von cos(2π/3) wurde ja bereits in einem Beiζ spiel vor Feststellung 8.6 bestimmt. Natürlich kann man 2π aber auch analog wie oben argumentieren: Setze ζ = ei 3 . 1 Dann gilt 0 = 1 + ζ + ζ2 Weiterhin ist ζ 2 = ζ̄. Also 0 = Re 1 + ζ + ζ 2 = 1 + 2 cos(2π/3) ζ2 Bemerkung. a) Man kann q √ √ √ √ √ √ √ √ 17+ 34−2 17+2 17+3 17− 34−2 17−2 34+2 17 −1+ 2π cos 17 = 16 zeigen. Diese Formel steht in engem Zusammenhang mit der Konstruktion eines regelmäßigen 17-Ecks durch Gauß mittels Zirkel und Lineal. b) Eine der wichtigsten Eigenschaften die wir noch nicht gelistet haben ist, dass sin und cos differenzierbar sind und für die Ableitungen sin0 = cos sowie cos0 = − sin gilt. Dies werden wir erst im nächsten Abschnitt sehen. 14 Differenzierbarkeit Definition 14.1. Es sei I ein Intervall, f : I → R und a ∈ I. Dann heißt f differenzierbar in a, wenn es ein c ∈ R gibt mit f (x) − f (a) lim = c. x→a x−a Man schreibt dann c = f 0 (a) und nennt c die Ableitung von f in a. Wir sagen f ist differenzierbar, wenn f in jedem Punkt a ∈ I differenzierbar ist. Isaac Newton (1642-1727) 91 14. Differenzierbarkeit Isaac Newton ist zusammen mit Leibniz (vgl. Satz 9.12) einer der Begründer der Infinitesimalrechnung. (a) Bemerkung 14.2. f (a+h)−f ist die h Steigung der Geraden, die durch (a, f (a)) und (a + h, f (a + h)) verläuft. Die Gerade durch (a, f (a)) mit Steigung f 0 (a) heißt auch Tangente von f an der Stelle a. f (a + h) f (a) Satz 14.3. a) Sei n ∈ N \ {0}. Dann ist f : R → R, x 7→ xn differenzierbar 0 und f (x) = n · xn−1 . b) exp ist differenzierbar mit exp0 = exp. c) cos, sin sind differenzierbar und es gilt cos0 = − sin und sin0 = cos. Beweis. a) Es ist mit x = a + h zu zeigen, dass limh→0 gilt. Dies folgt aus f (a+h)−f (a) h f (x + h) − f (x) (x + h)n − xn = h Pn h n n−k k h − xn k=0 k x = h n X n n−k k−1 = x h k k=1 h→0 n −→ · xn−1 = n · xn−1 . 1 b) Spezialfall: x = 0. Es ist zu zeigen, dass exp(0 + h) − exp(0) = exp(0) = 1 h→0 h lim gilt. Für |h| ≤ 2 ist mit |r2 (h)| ≤ 2 · |h|2 2! exp(h) = 1 + h + r2 (h) h2 = h2 . Also ist r2h(h) ≤ |h| ≤ |h|. Es folgt exp(h) − 1 1 + h + r2 (h) − 1 r2 (h) h→0 = =1+ −→ 1 h h h = n · an−1 92 14. Differenzierbarkeit Allgemeiner Fall: Es ist zu zeigen, dass lim h→0 exp(x + h) − exp(x) = exp(x) h gilt. Wegen des Spezialfalls ist exp(h) − 1 h→0 exp(x + h) − exp(x) −→ exp(x). = exp(x) · h h c) Spezialfall: x = 0. Wir zeigen cos(0+h)−cos(0) = 0, h sin(0+h)−sin(0) limh→0 = 1. h (i) limh→0 (ii) Es gilt wobei |r̃1 (h)| ≤ h2 2 cos(h) = 1 + r̃1 (h), für |h| ≤ 2 ist. Somit ist r̃1h(h) ≤ |h| 2 und r̃1 (h) h→0 cos(h) − 1 =1+ −→ 0 h h Entsprechend ist sin(h) = h + r̂1 (h) mit |r̂1 (h)| ≤ |h|3 3! für |h| ≤ 3 und weiter r̂1 (h) h→0 sin(h) − 0 =1+ −→ 1. h h Allgemeiner Fall: Es ist lim h→0 cos(x + h) − cos(x) = − sin x h zu zeigen. Es gilt cos(x + h) − cos(x) cos(x) · cos(h) − sin(x) · sin(h) − cos(x) = h h sin h − h cos h − 1 = cos x · − sin x · h } h } | {z | {z −→ 0 h→0 −→ 1 h→0 h→0 −→ − sin x. Wegen sin(x) = cos(x − π/2) folgt sin0 (x) = − sin(x − π/2) = cos(x). 93 14. Differenzierbarkeit Heuristisch kann die Aussage über exp auch folgerndermaßen zeigen: P man xn Es gilt exp(x) = ∞ und darum n=0 n! ∞ ∞ X X xn−1 xn exp (x) = = = exp(x). (n − 1)! n! 0 n=1 n=0 Ähnlich könnte man die Ableitungen für sin und cos begründen. Dies ist jedoch kein Beweis, da wir hier ohne jede Rechtfertigung zwei Grenzwertprozesse (Grenzwert der Reihe und Differentiation der Partialsummen) vertauschen. Wir werden später Werkzeug bereit stellen, das es erlaubt in diesen Fällen so zu argumentieren aber für den Moment geht es noch nicht. Lemma 14.4. Eine Abbildung f ist genau dann differenzierbar in a ∈ I, wenn f (a + h) = f (a) + f 0 (a) · h + ra (h) gilt mit limh→0 ra (h) h = 0. Satz 14.5. Sei f : I → R differenzierbar in a. Dann ist f stetig in a. (a) Beweis. Nach Voraussetzung ist limh→0 f (a+h)−f = f 0 (a). Die Grenzwertsätze h liefern f (a + h) − f (a) lim h · =0 h→0 h und damit lim f (a + h) = f (a). h→0 Also ist f stetig in a. Bemerkung 14.6. Die stetige Abbildung x 7→ |x| ist nicht differenzierbar in 0, denn (−1)n n − |0| = (−1)n ist nicht konvergent für n → ∞. (−1)n n Auch √ · : [0, ∞[→ R, x 7→ q 1 n2 − 1 n2 √ 0 =n √ x ist nicht differenzierbar in 0, denn ist nicht konvergent für n → ∞. 94 14. Differenzierbarkeit Satz 14.7. Seien f, g : I → R differenzierbar in a ∈ I. Dann gilt: a) (f ± g) ist differenzierbar in a mit (f ± g)0 (a) = f 0 (a) ± g 0 (a). b) (Produktregel) f · g ist differenzierbar in a mit (f · g)0 (a) = f (a) · g 0 (a) + f 0 (a) · g(a). Beweis. a) Es ist (f ± g)(a + h) − (f ± g)(a) h = f (a + h) − f (a) g(a + h) − g(a) ± h h h→0 −→ f 0 (a) ± g 0 (a). b) Ähnlich ist (f ·g)(a+h)−(f ·g)(a) h f (a+h)·g(a+h)−f (a+h)·g(a)+f (a+h)·g(a)−f (a)·g(a) h (a) + g(a) · f (a+h)−f = f (a + h) · g(a+h)−g(a) h h h→0 0 0 = −→ f (a) · g (a) + g(a) · f (a). Dabei benutzen wir, dass f differenzierbar und mithin stetig in a ist. Beispiel 14.8. a) (xn )0 = n · xn−1 . b) (sin x · ex )0 = cos x · ex + sin x · ex . Satz 14.9 (Kettenregel). Sei f : I → R differenzierbar in b ∈ I, g : J → R differenzierbar in a ∈ J, g(a) = b und g(J) ⊂ I. Dann ist f ◦ g : J → R differenzierbar in a mit (f ◦ g)0 (a) = f 0 (g(a)) · g 0 (a). Um die Kettenregel intuitiv zu verstehen, ist es zweckmäßig sich g = g(t) als eine Bewegung auf der x Achse vorzustellen. Die Geschwindigkeit zur Zeit a ist dann die Ableitung g 0 (a) bis auf das Vorzeichen. Die Ableitung f ◦ g 0 (a) entspricht dem infinitesimalen“ Höhengewinn der Kurve g(t), f (g(t) pro Zeitein” heit. Da die Kurve den Graphen (x, f (x)) von f mit g 0 (a)-facher Geschwindigkeit durchläuft, sollte sich der Höhengewinn um genau diesen Faktor ändern. 95 14. Differenzierbarkeit Beweis. Nach Lemma 14.4 ist rf (h) = 0, h→0 h rg (h) = 0. g(a + h) = g(a) + h · g 0 (a) + rg (h) mit lim h→0 h f (b + h) = f (b) + h · f 0 (b) + rf (h) mit lim Zusammen ist zunächst f (g(a + h)) = f g(a) + h · g 0 (a) + rg (h) = f (b) + h · g 0 (a) + rg (h) · f 0 (b) + rf h · g 0 (a) + rg (h) und damit rg (h) rf (h · g 0 (a) + rg (h)) f (g(a + h)) − f (g(a)) = f 0 (b) · g 0 (a) + f 0 (b) · + . h h h Wir wissen, dass limh→0 rg (h) h = 0 ist. Somit verschwindet der zweite Summand rg (h) im Grenzwert. Weiterhin existiert ein δ > 0, so dass h ≤ 1 für alle h mit |h| < δ ist. In diesem Fall ist weiter |rg (h)| ≤ |h| und damit für c := |g 0 (a)| + 1 |h · g 0 (a) + rg (h)| ≤ (|g 0 (a)| + 1) · |h| = c · |h|. Es folgt ( rf (h · g 0 (a) + rg (h)) 0 ≤ c·r (h·g0 (a)+r (h)) g f h |h·g 0 (a)+rg (h)| falls h · g 0 (a) + rg (h) = 0 sonst. Da limh→0 h·g 0 (a)+rg (h) = 0 ist, folgt aus limη→0 rf (η) η = 0 die Behauptung. Korollar 14.10. Ist a > 0 und f : R → R, x 7→ ax , dann gilt f 0 (x) = log a · ax . Beweis. Es ist f (x) = ax = exp((log a) · x) und darum f 0 (x) = exp((log a) · x) · log(a) = log(a) · ax . 96 14. Differenzierbarkeit Lemma 14.11. Die Abbildung ϕ : R \ {0} → R, x 7→ ϕ0 (x) = − x12 . 1 x ist differenzierbar mit Beweis. Es gilt ϕ(x + h) − ϕ(x) = h 1 x+h − h 1 x = 1 x − (x + h) −1 h→0 −→ − 2 . = hx(x + h) x(x + h) x Satz 14.12 (Quotientenregel). Seien f, g : I → R differenzierbar in a ∈ I und g(a) 6= 0. Dann existiert ein δ > 0, so dass g in I 0 := I ∩ [a − δ, a + δ] keine (x) Nullstellen hat. Weiter ist fg : I 0 → R, x 7→ fg(x) differenzierbar in a mit 0 f f 0 (a) · g(a) − g 0 (a) · f (a) (a) = . g g(a)2 Beweis. Da g stetig ist in a gibt es ein δ > 0, so dass g in I 0 := I ∩ [a − δ, a + δ] keine Nullstelle hat. Somit ist fg : I 0 → R erklärt und es bleibt zu zeigen, dass die Ableitung in a existiert und sich mit der Quotientenregel berechnen läßt. Wir behandeln zunächst den Spezialfall f ≡ 1. Es gilt 1 g(x) = ϕ(g(x)) = ϕ ◦ g(x). wobei ϕ(y) := y1 , wie in Lemma 14.11. Aus dem Lemma und der Kettenregel folgt die Differenzierbarkeit von ϕ ◦ g in a und 0 1 (ϕ ◦ g)0 (a) = ϕ0 (g(a)) · g 0 (a) = − (g(a)) 2 · g (a). Im allgemeinen Fall wenden wir zusätzlich die Produktregel an und erhalten f 0 0 1 1 0 (a) = f (a) · + f (a) · g g (a) g(a) = f 0 (a) g(a) = f 0 (a)·g(a)−f (a)·g 0 (a) . (g(a))2 − f (a)·g 0 (a) (g(a))2 Beispiel. tan0 (x) = 1 + tan2 (x). Satz 14.13 (Umkehrsatz). Sei I Intervall und f : I → R streng monoton und stetig. Dann ist auch J = f (I) ein Intervall und f −1 : J → I ⊂ R stetig. Ist f differenzierbar in a ∈ I und gilt f 0 (a) 6= 0, dann ist f −1 differenzierbar in f (a) mit 1 0 f −1 f (a) = 0 . f (a) 97 14. Differenzierbarkeit In Anwendungen hat man häufig den Fall a = f −1 (x) und die Formel liest 0 1 sich dann als f −1 (x) = f 0 (f −1 . (x)) Bemerkung 14.14. Der Graph von f −1 entsteht aus dem Graphen von f durch Spiegelung an der Geraden y = x. Diese Spiegelung (x, y) 7→ (y, x) überführt offenbar die Tangente von f in (a, f (a)) mit Steigung m 1 in die Tangente von f −1 in (f (a), a) mit Steigung m . Um dies als Beweis anzusehen, muss einem allerdings wirklich klar sein, dass dieses Bild mit Grenzwertbildungen verträglich ist. Korollar 14.15. Nach dem Umkehrsatz gilt a) log0 (x) = log0 (elog x ) = b) arcsin0 x = √ 1 1−x2 1 elog x = x1 . für x ∈] − 1, 1[, denn es ist arcsin0 x = arcsin0 (sin(arcsin x)) 1 = cos(arcsin x) 1 =p 1 − sin2 (arcsin x) 1 =√ . 1 − x2 c) arctan0 x = 1 tan0 (arctan(x)) = 1 1+x2 Beweis von Satz 14.13. Setze b = f (a) und sei yn eine Folge, die gegen b konvergiert, mit (yn 6= b). Es ist zu zeigen, dass f −1 (yn ) − f −1 (b) 1 = 0 n→∞ yn − b f (a) lim gilt. Für xn := f −1 (yn ) ist yn = f (xn ) und lim xn = f −1 (b) = a. Damit ist f −1 (yn ) − f −1 (b) f −1 (f (xn )) − f −1 (f (a)) = lim n→∞ n→∞ yn − b f (xn ) − f (a) xn − a 1 = lim = 0 . n→∞ f (xn ) − f (a) f (a) lim 98 15. Der Mittelwertsatz der Differentialrechnung und seine Anwendungen Da wir nun auch den Logarithmus ableiten können, ergibt sich aus der Kettenregel. Korollar 14.16. Für α ∈ R \ {0} und f : ]0, ∞[ → R, x 7→ xα ist f 0 (x) = αxα−1 . Beweis. Nach Definition der allgemeinen Potenzen ist f (x) = xα = exp(α·log x) und mithin α α f 0 (x) = exp(α · log x) · = xα · = α · xα−1 . x x 15 Der Mittelwertsatz der Differentialrechnung und seine Anwendungen Satz 15.1 (Mittelwertsatz). Seien a, b ∈ R mit a < b. Sei f : [a, b] → R stetig und ferner differenzierbar auf ]a, b[. Dann existiert ein ξ ∈ ]a, b[ mit f 0 (ξ) = f (b) − f (a) . b−a a ξ b (a) Beweis. Setze c = f (b)−f . Die Abbildung g : [a, b] → R mit g(x) := f (x) − c · x b−a ist stetig auf [a, b] und differenzierbar auf ]a, b[. Es gilt g(b) − g(a) = f (b) − f (a) − (c · (b − a)) = 0. Nach dem Satz von Rolle 15.2 gibt es ein ξ ∈ ]a, b[ mit 0 = g 0 (ξ) = f 0 (ξ) − c. Daraus folgt die Behauptung. Satz 15.2 (Satz von Rolle). Seien a, b ∈ R mit a < b, f : [a, b] → R stetig und ferner differenzierbar auf ]a, b[ und gelte f (a) = f (b). Dann existiert ein ξ ∈ ]a, b[ mit f 0 (ξ) = 0. Michel Rolle (1652-1719) Beweis. Ohne Beschränkung der Allgemeinheit ist f nicht konstant. Da f stetig ist, existieren nach Satz 11.10 xm , xM ∈ [a, b] mit f (xm ) = min{f (x) | x ∈ [a, b]}, f (xM ) = max{f (x) | x ∈ [a, b]}. 15. Der Mittelwertsatz der Differentialrechnung und seine Anwendungen 99 Da f nicht konstant ist, gilt f (xm ) < f (xM ), also liegt mindestens einer der Punkte xm und xM im offenen Intervall ]a, b[. Dieser Punkt wird im Folgenden mit ξ bezeichnet. Wir betrachten nur den Fall, dass ξ = xM ist; der Fall ξ = xm wird analog bewiesen. Dann ist für alle n ∈ N f(xM ) f (ξ + n1 ) − f (ξ) ≤ 0. 1 n f (a) = f (b) Für n → ∞ liefert dies f 0 (ξ) ≤ 0. Weiter gilt f (ξ − n1 ) − f (ξ) ≥0 − n1 a ξ = xM b und erneute Grenzwertbildung liefert f 0 (ξ) ≥ 0. Zusammen folgt f 0 (ξ) = 0. Korollar 15.3. Sei f : [a, b] → R stetig und auf ]a, b[ differenzierbar. Wenn f 0 ≡ 0 auf ]a, b[, dann ist f konstant. Beweis. Sei x ∈ ]a, b[ beliebig. Betrachte f|[a,x] . Nach dem Mittelwertsatz gibt es ein ξ ∈ ]a, b[ mit f (a)−f (x) a−x = f 0 (ξ) = 0. Also ist f (x) = f (a). Korollar 15.4. Es sei f : [a, b] → R stetig und auf ]a, b[ differenzierbar. Dann sind folgende Aussagen äquivalent: a) f ist monoton steigend. b) f 0 (x) ≥ 0 für alle x ∈ ]a, b[. Ferner gilt: Ist f 0 (x) > 0, so ist f streng monoton steigend. Beispiel. Für die streng monoton wachsende Abbildung f : R → R, x 7→ x3 , ist f 0 (x) = 3x2 . Also ist f 0 ≥ 0, aber wegen f 0 (0) = 0 gilt nicht f 0 > 0. Beweis von Korollar 15.4. b) ⇒ a)“ Es ist f 0 ≥ 0. Es sei a ≤ x1 < x2 ≤ b. Es ” ist zu zeigen, dass f (x1 ) ≤ f (x2 ) ist. Betrachte f|[x1 ,x2 ] : [x1 , x2 ] → R. Aus dem Mittelwertsatz folgt, dass ein ξ ∈ ]x1 , x2 [ existiert mit f 0 (ξ) = f (x2 ) − f (x1 ) ≥ 0. x2 − x1 a) ⇒ b)“ Nun ist f monoton wachsend. Sei x ∈ ]a, b[. Es ist zu zeigen, dass ”0 f (x) ≥ 0 ist. Es gilt für n ∈ N f (x + n1 ) − f (x) 1 n ≥0 100 15. Der Mittelwertsatz der Differentialrechnung und seine Anwendungen und mit n → ∞ folgt f 0 (x) ≥ 0. Definition 15.5. Sei I ein Intervall und f : I → R eine Abbildung. a) f hat an der Stelle x ∈ I ein lokales Maximum (Minimum) wenn es ein δ > 0 gibt mit f (x) ≥ f (x0 ) für alle x0 ∈ [x−δ; x+δ]∩I (respektive f (x) ≤ f (x0 ) für alle x0 ∈ [x − δ; x + δ] ∩ I). b) Das lokale Maximum (Minimum) heißt isoliert, falls f (x) > f (x0 ) für alle x0 ∈ [x − δ, x + δ] ∩ I mit x0 6= x gilt (respektive f (x) < f (x0 ) für alle x0 ∈ [x − δ, x + δ] ∩ I mit x0 6= x). c) f hat an der Stelle x ein lokales Extremum, wenn f ein lokales Maximum oder ein lokales Minimum an der Stelle x annimmt. d) Nimmt f auf I sein Maximum/Minimum an so nennen wir dies auch globales Maximum/Minimum von f . Satz 15.6 (Notwendige Bedingungen für Extrema). Es sei f : ]a, b[→ R differenzierbar. Nimmt f an der Stelle x ∈]a, b[ ein lokales Extremum an, dann gilt f 0 (x) = 0. Beweis. Der Beweis verläuft völlig analog zum Beweis vom Satz von Rolle 15.2. Definition 15.7. Sei I ein Intervall und f : I → R eine Abbildung. a) f heißt stetig differenzierbar, wenn f differenzierbar ist und f 0 stetig ist. b) f heißt k-mal differenzierbar, wenn gilt: • für k = 1: f ist differenzierbar • für k > 1: f 0 ist (k − 1)-mal differenzierbar. Die k-te Abbildung wird mit f (k) (x) bezeichnet. Speziell schreibt man auch f (2) (x) = f 00 (x). Satz 15.8 (Hinreichende Bedingungen für Extrema). Seien f : ]a, b[→ R differenzierbar, x ∈]a, b[ und f 0 (x) = 0. a) Hat f 0 an der Stelle x einen Vorzeichenwechsel von + nach -, so nimmt f an der Stelle x ein isoliertes lokales Maximum an. 15. Der Mittelwertsatz der Differentialrechnung und seine Anwendungen 101 b) Ist f zweimal differenzierbar und gilt f 00 (x) < 0, so hat f an der Stelle x ein isoliertes lokales Maximum. Das folgende Beispiel illustriert, dass ein Vorzeichenwechsel der Ableitung keine notwendige Bedingung für ein Extremum ist. Beispiel. Die Abbildung f : R → R, definiert durch ( x2 (2 − sin x1 ) f (x) = 0 falls x 6= 0 falls x = 0, hat an der Stelle 0 ein isoliertes Minimum, aber wegen f 0 (0) = 0 sowie f 0 (x) = cos 1 1 + 2x · (2 − sin ) x | x} {z für x 6= 0. −→ 0 x→0 liegt kein Vorzeichenwechsel der Ableitung vor. Es ist nicht schwer zu sehen, dass es für jedes δ > 0 unendlich viele isolierte lokale Minima von f im Intervall [−δ, δ] gibt. Es mag daher sprachlich etwas merkwürdig erscheinen, dass wir das Minimum an der Stelle 0 isoliert nennen. Das Wort isoliert “ bezieht ” sich aber auf den Wert des Minimums – er wird in einer Umgebung nur einmal angenommen. Manche Autoren unterscheiden aber zwischen strengen und isolierten lokalen Extrema. In dieser alternativen Notation wäre das Minimum von f an der Stelle 0 zwar global und streng aber nicht isoliert. Wir bleiben aber bei unserer Definition. Beispiel. Für f : R → R, x 7→ 2x3 − 21x2 + 72x + 3 gilt f 0 (x) = 6(x2 − 7x + 12) = 6(x − 3)(x − 4), f 00 (x) = 6(2x − 7), f 00 (3) = −6 < 0, f 00 (4) = 6 > 0. An der Stelle 3 hat f also ein lokales Maximum, an der Stelle 4 ein lokales Minimum. Beweis von Satz 15.8. a) Nach Voraussetzung gibt es ein δ > 0, so dass 0 0 f|[x−δ,x[ > 0 und f|]x,x+δ] < 0 ist. Also ist f streng monoton wachsend auf [x − δ, x] und streng monoton fallend auf [x, x + δ] und darum hat f ein isoliertes Maximum an der Stelle x. 102 15. Der Mittelwertsatz der Differentialrechnung und seine Anwendungen 0 0 0 (x) b) Nach Voraussetzung ist limh→0 f (x+h) = limh→0 f (x+h)−f = f 00 (x) < h h 0 0. Also gibt es ein δ > 0, so dass f (x+h) < 0 für alle h mit 0 < |h| < δ h ist. Für h ∈ ]0, δ[ ist dann f (x + h) < 0 und für h ∈ [−δ, 0[ entsprechend f (x + h) > 0. Daraus folgt, dass f 0 in x einen Vorzeichenwechsel von + nach − hat. Teil a) liefert nun die Behauptung. Satz 15.9 (Verallgemeinerter Mittelwertsatz). Es seien f, g : [a, b] → R stetig und auf ]a, b[ differenzier f 0 (ξ) bar. Dann gibt es ein ξ ∈]a, b[, so dass g0 (ξ) und f (b)−f (a) linear abhängig sind. g(b)−g(a) < Bemerkung 15.10. Gilt in der Situation von Satz 15.9 g(b) − g(a) 6= 0 und g 0 (ξ) 6= 0, so folgt f 0 (ξ) f (b)−f (a) g 0 (ξ) = g(b)−g(a) . • f (ξ) g(ξ) f (a) g(a) • f (b) g(b) • > Beweis. Wir setzen v = f (b) − f (a) und w = g(b) − g(a). Ohne Einschränkung ist (v, w) 6= 0. Wir betrachten die komplexe Zahlen z = v + iw. Gesucht ist ein ξ, so dass c(ξ) = f 0 (ξ) + ig 0 (ξ) ein reelles Vielfaches von z ist. Aufgrund der geometrischen Interpretation der Multiplikation ist dies gleichbedeutend damit, dass z̄ · c(ξ) eine reelle Zahl ist. Es reicht also ein ξ ∈]a, b[ zu finden mit 0 = Im(z̄ · c(ξ)) = −f 0 (ξ) g(b) − g(a) + g 0 (ξ) f (b) − f (a) . Wir betrachten die Funktion h(t) = (f (b) − f (t))(g(b) − g(a)) − (g(b) − g(t))(f (b) − f (a)), für t ∈ [a, b]. Offenbar ist h stetig und differenzierbar auf ]a, b[. Weiterhin ist h(b) = h(a) = 0. Nach dem Satz von Rolle gibt es ein ξ ∈]a, b[ mit 0 = h0 (ξ) = −f 0 (ξ) g(b) − g(a) + g 0 (ξ) (f (b) − f (a) . Satz 15.11 (Regel von L’Hospital). Es seien a, b, c ∈ R ∪ {−∞, ∞} mit a < b. Seien weiter f, g : ]a, b[→ R differenzierbar mit g 0 (ξ) 6= 0 für alle ξ ∈ ]a, b[. Weiterhin gelte eine der beiden folgenden Voraussetzungen: a) limx&a f (x) = 0 und limx&a g(x) = 0. b) limx&a f (x) = ∞ und limx&a g(x) = ∞. 2 15. Der Mittelwertsatz der Differentialrechnung und seine Anwendungen 103 0 (x) (x) = c, so folgt limx&a fg(x) = c. Außerdem bleibt der Satz Gilt dann limx&a fg0 (x) richtig wenn x&a durchgehend durch x%b ersetzt wird. Der Satz wurde von Johann Bernoulli entdeckt, der mit dem Marquis de l’Hôpital in Korrespondenz stand. Dieser publizierte erstmals den Satz. Bemerkung. Konvergieren Zähler und Nenner von f (x) g(x) für x → a so sind (x) und genau die Fälle bei denen man das Konvergenzverhalten von fg(x) für x → a nicht entscheiden kann. Natürlich kann man in b) auch alternativ erlauben, dass der Zähler bestimmt gegen −∞ und der Nenner bestimmt gegen ∞ divergiert, etc. ∞ “ ”∞ 0 “ ”0 Beispiele. Für α > 0 gilt a) limx&0 xα · log x = 0. b) limx→∞ c) limx→0 Beweis. log x xα = 0. 1 1 1 ex −1 − x = − 2 . a) Es ist xα · log x = Johann Bernoulli Guillaume François Antoine, Marquis de l’Hôpital (1667-1748) (1661-1704) log x . x−α Betrachte 1 x −α · x−α−1 =− xα x→0 −→ 0. α Nach der Regel von L’Hospital folgt limx&0 b) Es gilt tung. c) Es ist 1 x log x x−α = 0. −→ 0 und die Regel von L’Hospital liefert nun die Behaup- α·xα−1 x→∞ 1 ex −1 − 1 x = x−ex +1 x(ex −1) . Betrachte 1−ex (ex −1)+x·ex . Es gilt 1 − ex −→ 0 und (ex − 1) + x · ex −→ 0. Betrachte also x→0 x→0 −ex ex +ex +x·ex = −1 −→ 2+x x→0 − 12 . Wiederholtes Anwenden von L’Hospital gibt die Behauptung. 104 15. Der Mittelwertsatz der Differentialrechnung und seine Anwendungen Bemerkung 15.12. Die Reihenfolge in der Regel von L’Hospital lässt nicht umdrehen: Es ist x2 sin x1 0 = lim , x& 0 x aber − cos x1 + 2x · sin x1 x& 0 1 lim existiert nicht. Beweis von Satz 15.11. Betrachte zunächst den Fall a 6= −∞. Da g 0 keine Nullstellen hat, ist g nach dem Satz von Rolle injektiv und folglich streng monoton. a) Es gelte limx&a f (x) = limx&a g(x) = 0. Wir setzen f (a) := 0 =: g(a). Dann sind f, g : [a, b[→ R stetig und auf ]a, b[ differenzierbar. Wir betrachten zunächst den Teilfall 0 c 6= ±∞. Sei ε > 0 gegeben. (ξ) Wähle δ > 0 mit fg0 (ξ) − c < ε für alle ξ ∈]a, a + δ[. Für x ∈ ]a, a + δ[ ist f (x)−f (a) f (x) = < ε, − c − c g(x) g(x)−g(a) f (x) g(x) | a Illustration für den (einfachen) Spezialfall: f und g sind differenzierbar in a = 2 mit g 0 (a) 6= 0. denn nach dem verallgemeinertem Mittelwertsatz existiert ein ξ ∈ ]a, x[ mit f (x)−f (a) f 0 (ξ) g(x)−g(a) = g 0 (ξ) . Der Fall c = ±∞ ist ähnlich. Ist etwa c = ∞, so gibt es zu einem beliebigen 0 (ξ) L > 0 ein δ > 0 mit fg0 (ξ) > L für alle ξ ∈]a, a + δ[. Wie oben folgt dann f (x) g(x) > L für alle x ∈]a, a + δ[. Da L beliebig ist somit limx&a f (x) g(x) = ∞. b) Wegen limx&a f (x) = limx&a g(x) = ∞ können wir ohne Einschränkung f, g > 0 annehmen. Außerdem ist g streng monoton fallend und sogar g 0 < 0. Da limx&a f (x) = ∞ ist es leicht mit dem Mittelwertsatz eine gegen a konvergente Folge (ξn ) zu finden mit f 0 (ξn ) < 0. Damit folgt c ≥ 0 und insbesondere c 6= −∞. Es reicht den Beweis für den Fall c 6= ∞ 0 zu führen: Ist nämlich c = ∞ so konvergiert fg 0(x) (x) gegen 0 für x&a und durch Anwenden des Satzes von L’Hospital für den Fall c 6= ∞ würde limx&a fg(x) (x) = 0 folgen. Da die Funktionen positiv sind, folgt damit aber auch limx&a f (x) g(x) = ∞. 15. Der Mittelwertsatz der Differentialrechnung und seine Anwendungen 105 Sei also fortan ohne Einschränkung der Allgemeinheit c ∈ R und sei weiter ε > 0 gegeben. Wir müssen ein δ2 > 0 finden mit f (x) g(x) − c < ε für alle x ∈]a, a + δ2 ]. Wir wählen ein δ > 0 derart, dass f 0 (ξ) 0 − c < g (ξ) ε 3 für alle ξ ∈]a, a + δ]. Aus dem verallgemeinerten Mittelwertsatz folgt dann f (x)−f (a+δ) g(x)−g(a+δ) − c < ε 3 Wegen limx&a g(x) = ∞ ist limx&a δ1 ∈]0, δ[ mit f (x) g(x)−g(a+δ) für alle x ∈]a, a + δ[. −f (a+δ) g(x)−g(a+δ) = 0. Es gibt mithin ein − c < 23 ε für alle x ∈]a, a + δ1 [. Wir multiplizieren die Ungleichung mit der positiven Zahl 1− g(a+δ) <1 g(x) und erhalten f (x) g(x) − c + c · Wegen limx&a c · g(a+δ) g(x) g(a+δ) g(x) < 23 ε für alle x ∈]a, a + δ1 ]. = 0 existiert, wie behauptet, ein δ2 ∈]0, δ1 [ mit f (x) g(x) − c < ε für alle x ∈]a, a + δ2 ]. Ist a = −∞ so können wir nach eventuellem Verschieben des Definitionsbereiches b ≥ −1 annehmen. Wir betrachten dann die Funktionen ϕ, ψ : ]0, 1[→ R, ϕ(x) = f (−1/x) und ψ(x) = g(−1/x). Da ϕ0 (x) ψ 0 (x) = f 0 (−1/x)1/x2 g 0 (−1/x)1/x2 = f 0 (−1/x) x&0 g 0 (−1/x) −→ c, können wir den bereits bewiesen Teil des Satzes von L’Hospital auf die Funktioϕ(x) (x) nen ϕ und ψ anwenden und erhalten c = limx&0 ψ(x) = limx&−∞ fg(x) . 106 16 16. Das Riemannsche Integral Das Riemannsche Integral Definition 16.1. Eine Abbildung ϕ : [a, b] → R heißt Treppenfunktion (kurz: ϕ ∈ T [a, b]), falls es eine Unterteilung a = x0 < . . . < xn = b gibt, so dass für alle 0 ≤ i ≤ n − 1 die Einschränkung ϕ|]xi ,xi+1 [ konstant ist. i+1 Insbesondere gilt ϕ|]xi ,xi+1 [ ≡ ϕ( xi +x ). 2 Bemerkung 16.2. a) Seien ϕ, ψ ∈ T [a, b]. Dann gibt es eine Unterteilung a = x0 < x1 < . . . < xn = b, so dass ϕ|]xi ,xi+1 [ und ψ|]xi ,xi+1 [ konstant sind. b) T [a, b] ist ein Untervektorraum des Vektorraums der reellwertigen Funktionen auf [a, b]. Definition 16.3. Für ϕ ∈ T [a, b] setzt man Z b ϕ(x) dx = a n X i=1 ϕ xi +xi−1 (xi 2 − xi−1 ), falls a = x0 < x1 < . . . < xn = b eine zu ϕ gehörige Unterteilung ist. Ist f : [a, b] → R eine beschränkte Funktion und H und TR Treppenfunktionen b mit T ≤ f ≤ H, so nennt man a T (x) dx auch eine Rb Untersumme und a H(x) dx eine Obersumme zu f . Beispiel für eine optimale Oberund Untersumme zu einer Unterteilung von [a,b] in 8 Teile. Diese Definition ist wohldefiniert, d.h. unabhängig von der Wahl der Unterteilung: Sei a = y0 < y1 < . . . < ym = b eine weitere zu ϕ gehörige Unterteilung. Es gibt dann offensichtlich eine Unterteilung mit a = z0 < z1 < . . . < zh = b mit {x0 , . . . , xn } ∪ {y0 , . . . , ym } ⊂ {z0 , . . . , zh }. Es reicht dann n h X X zl +zl−1 i−1 ϕ xi +x (x − x ) = (zl − zl−1 ) ϕ i i−1 2 2 i=1 l=1 zu zeigen. Per Induktion genügt es dafür zu überprüfen, dass sich die Definition des Integrals einer Treppenfunktion nicht ändert wenn wir einen Unterteilungspunkt hinzufügen. Dies ist aber offensichtlich. Ebenso klar sein sollte der folgende Satz. 107 16. Das Riemannsche Integral Rb Satz 16.4. Das Funktional T [a, b] → R, ϕ 7→ a ϕ(x) dx ist R-linear – es gilt Rb Rb Rb Rb Rb also a ϕ(x) + ψ(x) dx = a ϕ(x) + a ψ(x) dx und a λϕ(x) dx = λ · a ϕ(x) dx für λ ∈ R. Definition 16.5. Sei f : [a, b] → R beschränkt. R b∗ Rb a) a f (x) dx := inf{ a ϕ(x) dx | ϕ ∈ T [a, b], f ≤ ϕ} ∈ R heißt Oberintegral von f . Rb Rb b) a ∗ f (x) dx := sup{ a ϕ(x) dx | ϕ ∈ T [a, b], f ≥ ϕ} ∈ R heißt Unterintegral von f . c) Die Funktion f heißt (Riemann-)integrierbar, falls R b∗ Rb a f (x) dx = a ∗ f (x) dx ist. In diesem Fall setzt man Rb R b∗ a f (x) dx := a f (x) dx . Bernhard Riemann (1826-1866) Bemerkung. Seien ϕ, ψ ∈ T [a, b] Riemann-integrierbar. Ist ϕ ≤ ψ, so folgt Rb Rb a ϕ(x) dx ≤ a ψ(x) dx . Beispiel. Definiere Abbildungen fi : [0, 1] → R für 1 ≤ i ≤ 2 durch ( ( 1 für x ∈ /Q 1 für x ∈ Q f1 (x) = und f2 (x) = 0 für x ∈ Q, 0 für x ∈ / Q. Dann ist Z 1∗ fi (x) dx = 1 fi (x) dx = 0 f1 (x) + f2 (x) dx = 1. 0 Z 1∗ Z 1 0 ∗ 0 Satz 16.6. Seien f, g : [a, b] → R beschränkt. Dann gilt: a) Jedes ϕ ∈ T [a, b] ist Riemann integrierbar. R b∗ Rb b) Es ist a f (x) dx ≥ a ∗ f (x) dx . c) Es ist R b∗ a f (x) + g(x) dx ≤ R b∗ a R b∗ f (x) dx + a g(x) dx . 108 16. Das Riemannsche Integral d) Es ist e) f) R b∗ a Rb R b∗ a R b∗ λf (x) dx = λ a f (x) dx für alle λ > 0. Rb − f (x) dx = − a ∗ f (x) dx . a ∗ f (x) + g(x) dx ≥ Rb a ∗ f (x) dx Beweis. Teil a) und d) sind evident. Rb + a ∗ g(x) dx . b) Seien ϕ, ψ ∈ T [a, b] mit ϕ ≥ f ≥ ψ. Dann ist Z b ϕ(x) dx ≥ a Z b ψ(x) dx a und daraus folgt die Behauptung. c) Sei ε > 0. Wähle ϕ, ψ ∈ T [a, b] mit f ≤ ϕ, g ≤ ψ und Z b∗ a Z f (x) dx ≥ b∗ a g(x) dx ≥ Z b ε ϕ(x) dx − , 2 b ε ψ(x) dx − . 2 a Z a Dann ist Z a b∗ Z f (x) dx + b∗ a g(x) dx ≥ ≥ Z a Z a b ϕ(x) + ψ(x) dx −ε b∗ (f + g)(x) dx −ε. Da ε > 0 beliebig war, folgt die Behauptung. e) Es gilt Z a b∗ Z − f (x) dx = inf a = − sup Z =− b a ∗ f) Dies folgt aus c) und e). b ϕ(x) dx | ϕ ∈ T [a, b], −f (x) ≤ ϕ Z a b (−ϕ)(x) dx | −ϕ ∈ T [a, b], f (x) ≥ −ϕ f (x) dx . 109 16. Das Riemannsche Integral Satz 16.7. Sei f : [a, b] → R beschränkt. Dann sind äquivalent: a) f ist Riemann integrierbar. b) Für alle ε > 0 gibt es Treppenfunktionen ϕ und ψ ∈ T [a, b] mit ϕ ≤ f ≤ ψ Rb und a (ψ − ϕ)(x) dx ≤ ε. Beweis. a) ⇒ b)“ Sei ε > 0 gegeben. Es gilt nach Voraussetzung ” Z b∗ Z b Z b f (x) dx = f (x) dx = f (x) dx =: c. a a ∗ a Also existiert ein ψ ∈ T [a, b] mit f ≤ ψ und Z b ε ψ(x) dx ≤ c + 2 a sowie ein ϕ ∈ T [a, b] mit ϕ ≤ f und Z b ε ϕ(x) dx ≥ c − . 2 a Rb Dann ist a (ψ − ϕ)(x) dx ≤ ε. b) ⇒ a)“ Sei ε > 0 beliebig. Wähle ϕ, ψ wie in b). Dann gilt ” Z b Z b f (x) dx ≥ ϕ(x) dx a ∗ a ≥ = Z ϕ(x) dx + a Z a ≥ b Z Z b a b (ψ(x) − ϕ(x)) dx −ε ψ(x) dx −ε b∗ a f (x) dx −ε. Da ε > 0 beliebig war, folgt die Behauptung. Satz 16.8. Jede monotone Funktion f : [a, b] → R ist Riemann-integrierbar. Beweis. Sei f monoton wachsend. (Den Fall, dass f monoton fallend ist, kann man analog behandeln.) Betrachte die Unterteilung xi = a + i (b − a) n für 0 ≤ i ≤ n. 110 16. Das Riemannsche Integral Definiere Treppenfunktionen ϕn , ψn durch ( f (xi ), falls x ∈ [xi , xi+1 [ ϕn (x) := f (b), falls x = b, ( f (xi+1 ), falls x ∈ [xi , xi+1 [ ψn (x) := f (b), falls x = b. Da f monoton ist gilt ϕ ≤ f ≤ ψ. Außerdem ist nach Konstruktion wachsend xi+1 +xi xi +xi−1 ϕn = ψn für 1 ≤ i ≤ n − 1. Damit ist 2 2 Z a b ψn (x) − ϕn (x) dx = = n→∞ −→ n X b−a n i=1 b−a n (f (b) 0. ψn xi +xi−1 2 − f (a)) − ϕn xi +xi−1 2 Gemäß Satz 16.7 folgt nun die Behauptung. Satz 16.9. Jede stetige Funktion f : [a, b] → R ist Riemann-integrierbar. Proposition 16.10. Sei f : [a, b] → R stetig. Dann gibt es zu jedem ε > 0 Treppenfunktionen ϕ, ψ ∈ T [a, b] mit ϕ(x) ≤ f (x) ≤ ψ(x) und ψ(x) − ϕ(x) ≤ ε für alle x ∈ [a, b]. Beweis. Nach Satz 11.19 ist f gleichmäßig stetig, d.h. ∀ε > 0 ∃δ > 0 ∀x, y ∈ [a, b] : |x − y| < δ ⇒ |f (x) − f (y)| < ε. Wähle zu ε > 0 ein δ > 0 wie oben. Wähle n ∈ N so groß, dass setze ( f (xi ) − ε, falls x ∈ [xi−1 , xi [ ϕ(x) = f (b), falls x = b, ( f (xi ) + ε, falls x ∈ [xi−1 , xi [ ψ(x) = f (b), falls x = b. Für x ∈ [xi−1 , xi [ gilt |f (x) − f (xi )| < ε, also ist ψ(x) = f (xi ) + ε ≥ f (x) ≥ f (xi ) − ε = ϕ(x). Schließlich gilt ψ(x) − ϕ(x) ≤ 2ε. b−a n < δ ist, und 111 16. Das Riemannsche Integral Beweis von Satz 16.9. Es sei ε > 0 gegeben. Wähle ϕ, ψ wie in Proposition 16.10. Dann gilt ϕ ≤ f ≤ ψ und Z b Z b ε dx = (b − a) ε. ψ(x) − ϕ(x) dx ≤ a a Mit Satz 16.7 folgt nun die Behauptung. Satz 16.11. Sind f, g : [a, b] → R Riemann-integrierbar, dann ist auch f + g Riemann-integrierbar und es gilt Rb Rb Rb a) a f (x) + g(x) dx = a f (x) dx + a g(x) dx und Rb Rb b) a λf (x) dx = λ a f (x) dx für alle λ ∈ R. Beweis. Nach Satz 16.6 ist Z b∗ Z b∗ Z b∗ f (x) + g(x) dx ≤ f (x) dx + g(x) dx a a a Z b Z b g(x) dx f (x) dx + = a ∗ b ≤ Wegen R∗ ≥ R ∗ Z a ∗ f (x) + g(x) dx . a ∗ folgt weiter, dass Gleichheit in allen Ungleichungen gilt. Definition 16.12. Sei f : [a, b] → R eine Funktion. Wir setzen ( f (x), falls f (x) ≥ 0 + f (x) := 0, sonst, ( −f (x), falls f (x) ≤ 0 f − (x) := 0, sonst. Es gilt f = f+ − f− und |f | = f+ + f− . Satz 16.13. Sei f : [a, b] → R integrierbar. Dann sind auch f+ , f− und |f | integrierbar. Beweis. Sei ε > 0 gegeben. Nach Satz 16.7 gibt es ϕ, ψ ∈ T [a, b] mit ϕ ≤ f ≤ ψ Rb und a ψ(x) − ϕ(x) dx ≤ ε. Dann gilt ϕ+ ≤ f+ ≤ ψ+ , ψ− ≤ f− ≤ ϕ− , ψ+ (x) − ϕ+ (x) ≤ ψ(x) − ϕ(x), ϕ− (x) − ψ− (x) ≤ ψ(x) − ϕ(x). 112 17. Der Hauptsatz der Differential- und Integralrechnung Damit ist Z ψ+ (x) − ϕ+ (x) dx ≤ a Z a Z b b (ψ − ϕ)(x) dx < ε, a Z b ϕ− (x) − ψ− (x) dx ≤ b a (ψ − ϕ)(x) dx < ε. Also sind f± integrierbar nach Satz 16.7. 17 Der Hauptsatz der Differential- und Integralrechnung Falls b < a und f : [b, a] → R integrierbar ist, setzen wir Z b f (x) dx := − a Z a f (x) dx . b Satz 17.1 (Mittelwertsatz der Integralrechnung). Seien f : [a, b] → R stetig und g : [a, b] → R integrierbar mit g ≥ 0. Dann gibt es ein ξ ∈ [a, b] mit Z a b (f · g)(x) dx = f (ξ) · Z b g(x) dx . a Beispiel mit g ≡ 1 Bemerkung. Die Voraussetzung g ≥ 0 kann durch g ≤ 0 ersetzt werden aber sie ist etwa f (x) = g(x) = x, a = −1 und b = 1 so R 1 nicht entbehrlich, dennR ist 1 gilt −1 f (x)g(x) dx = 32 aber −1 g(x) dx = 0. Bemerkung 17.2. Sind f, g : [a, b] → R Riemann-integrierbar und f ≤ g, so folgt aus der Definition des Riemannschen Integrals Z a b f (x) dx ≤ Z b g(x) dx . a Beweis von Satz 17.1. Setze m = min{f (x) | x ∈ [a, b]}, M = max{f (x) | x ∈ [a, b]}. 17. Der Hauptsatz der Differential- und Integralrechnung 113 Dann ist m · g ≤ f · g ≤ M · g, also wegen Bemerkung 17.2 Z b Z b Z b g(x) dx . f (x)g(x) dx ≤ M · g(x) dx ≤ m· a a a Ohne Einschränkung sei bereits Rb g(x) dx > 0. Dann ist Rb f (x)g(x) dx m ≤ y := a R b ≤ M. a g(x) dx a Aus dem Zwischenwertsatz folgt, dass es ein ξ ∈ [a, b] gibt mit f (ξ) = y. Daraus folgt die Behauptung. Definition 17.3. Seien f, F : [a, b] → R Abbildungen. Dann heißt F Stammfunktion zu f , falls F differenzierbar ist mit F 0 = f . Satz 17.4 (Hauptsatz der Differential- und Integralrechnung). Sei f : [a, b] → R stetig. Dann gilt: a) f besitzt eine Stammfunktion. b) Ist F eine Stammfunktion zu f , so folgt Rb a f (x) dx = F (b) − F (a). c) Sind F1 und F2 Stammfunktionen zu f , so ist F1 − F2 konstant. Der Satz nebst Beweis und Anwendungen ist von Friedrich Wille in der Hauptsatzkantate vertont worden, http://www.youtube.com/watch?v=4n6aB4aasyg oder http://www.inf.uos.de/ehemalige/treffen2004/kantate/index.html. R Schreibweise. Für eine Stammfunktion F zu f schreiben wir F (x) = f (x) dx . Bemerkung. Es sei f : [a, b] → R und c ∈ ]a, b[. Dann ist f genau dann integrierbar, wenn f|[a,c] und f|[c,b] integrierbar sind mit Z b Z c Z b f (x) dx = f (x) dx + f (x) dx . a Rx a c Beweis. a) Setze F (x) := a f (t) dt. Sei zunächst h > 0. Nach dem Mittelwertsatz der Integralrechnung 17.1 gibt es ein ξh ∈ [x, x + h] mit Z F (x + h) − F (x) 1 x+h = f (t) dt h h x Z x+h 1 = f (ξh ) 1 dt h x = f (ξh ). 114 17. Der Hauptsatz der Differential- und Integralrechnung Ist h < 0, so gibt es analog ein ξh ∈ [x + h, x] mit Z F (x + h) − F (x) 1 x f (t) dt =− h h x+h Z x 1 = − f (ξh ) 1 dt h x+h = f (ξh ). Da limh→0 ξh = x gilt und f stetig ist, folgt F (x + h) − F (x) = lim f (ξh ) = f (x). h→0 h→0 h lim c) Sind F1 und F2 Stammfunktionen zu f , so folgt F10 − F20 = f 0 − f 0 = 0. Nach dem Mittelwertsatz ist F1 − F2 konstant. b) Aufgrund des Beweises von a) und wegen c) gibt es ein c ∈ R, so dass für alle x ∈ [a, b] Z x F (x) = f (t) dt +c a gilt. Damit ist F (b) − F (a) = Z a b f (t) dt − Z a f (t) dt = a Z b f (t) dt . a Schreibweise. Wir setzen (F |ba := (F (t)|ba := (F (t)|bt=a := F (b) − F (a). Rx Beispiel. a) Es ist 0 sin t dt = (− cos t|x0 = − cos x − (− cos 0)) = 1 − cos x. Rx Rx b) Es ist 0 sin2 t dt = 12 0 (1 − cos 2t) dt = 21 (t − sin22t |x0 = 12 x − sin22x . c) Für a, b > 0 und s 6= −1 ist d) Es ist R 1 cos2 x dx = tan x. Rb a xs dx = b xs+1 s+1 a . Satz 17.5 (Substitutionsregel). Seien f : I → R stetig, ϕ : [a, b] → R stetig differenzierbar und Bild(ϕ) ⊂ I. Dann ist Z a b 0 (f ◦ ϕ)(t) · ϕ (t) dt = Z ϕ(b) ϕ(a) f (x) dx . 115 17. Der Hauptsatz der Differential- und Integralrechnung Beweis. Sei F eine Stammfunktion zu f . Daraus folgt, dass F ◦ ϕ eine Stammfunktion zu (f ◦ ϕ) · ϕ0 ist. Es folgt Z ϕ(b) f (x) dx = F (ϕ(b)) − F (ϕ(a)) ϕ(a) Z = b a Z = b a f (ϕ(t)) · ϕ0 (t) dt . a) Wir integrieren tan(x) = Beispiel. Z (F ◦ ϕ)0 (x) dx y tan x dx = 0 y 0 sin t cos t dt = Z y 0 −ϕ0 (t) ϕ(t) Für ϕ(t) := cos t ist dt = − = (log x|1x=cos y = − log(cos y). Allgemein ist R b) Wir integrieren dx = Z sin(x) cos(x) . √dt . 2 t+1 0 1 1 1 x dx = Z 1 cos y 1 x dx dx = log f . √ e√ t+1 . t+1 2 √ e √ c) Wir integrieren 0 cos y Für x = ϕ(t) := √ t + 1 ist dx dt = √1 , 2 t+1 damit also Es folgt Z Z f 0 (x) f (x) Z t+1 t+1 dt = √ 2 1 1 . x2 −2x+5 1 x2 −2x+5 Z √ 2ex dx = (2ex |1 2 = 2(e √ 2 − e). Zunächst gilt dx = Z 2 0 1 (x−1)2 +4 Mit der Substitution y = ϕ(x) = = 1 4 Z 1 2 − 12 x−1 2 , 1 y 2 +1 dx = 1 4 Z 0 2 1 ( x−1 )2 +1 2 dx . also dx = 2dy, ist weiter 1 · 2dy = 12 (arctan y|−2 1 = π4 . 2 d) Wir berechnen die Fläche des Halbkreises. Mit der Substitution sin(t) = x ergibt sich dx = cos(t) dt und mithin 116 17. Der Hauptsatz der Differential- und Integralrechnung Z 1 −1 p 1 − x2 dx = = Z π/2 −π/2 Z π/2 f (x) = q 1 − sin2 (t) cos t dt cos2 (t) dt = π/2 −π/2 1 2 (1 1 − x2 −1 −π/2 Z p + cos(2t)) dt = t 2 + √ 2 1−x0 0 x0 1 sin(2t) π/2 = π2 4 −π/2 Satz 17.6 (Partielle Integration). Es seien f, g : [a, b] → R stetig differenzierbar. Dann gilt Z b Z b b 0 f (x)g 0 (x) dx . − f (x)g(x) = f (x)g(x) x=a a a Beweis. Setze h := f · g. Dann gilt nach der Produktregel für Differentiation h0 (x) = f 0 (x) · g(x) + f (x) · g 0 (x). Folglich ist h = f · g eine Stammfunktion zu f 0 · g + f · g 0 . Nach dem Hauptsatz gilt dann Z b b f 0 (x)g(x) + f (x)g 0 (x) dx = f (x)g(x) a a und es folgt Z b Z b f (x)g(x) dx = f (x)g(x) − f (x)g 0 (x) dx . b a Beispiel. 0 a a a) Sei f (x) := x und g 0 (x) = sin(x). Dann ist Z 0 t Z t t x · sin x dx = x · (− cos x) 0 − 1 · (− cos x) dx 0 t t = −x cos x0 + sin x0 = −t cos t + sin t. b) Wir untersuchen In := R sinn x dx und wählen dazu g 0 (x) = sin x sowie 17. Der Hauptsatz der Differential- und Integralrechnung 117 f (x) = sinn−1 x. Dann ist In = Z sinn−1 x · sin x dx Z x · (− cos x) − (sinn−1 )0 (x) · (− cos x) dx Z n−1 = − sin x · cos x + (n − 1) sinn−2 x · cos2 x dx Z Z n−1 n−2 = − sin x · cos x + (n − 1) sin x dx −(n − 1) sinn x dx . n−1 = sin = − sinn−1 x cos x + (n − 1)In−2 − (n − 1)In . Dies liefert n · In = − sinn−1 x cos x + (n − 1) · In−2 , also In = − n1 sinn−1 x · cos x + Folglich kann R n−1 n In−2 . sinn x dx rekursiv aus I1 = Z sin x dx = − cos x und I0 = Z 1 dx = x berechnet werden. c) Wir betrachten nun konkret An := wissen wir R π 2 0 sinn x dx . Aus dem vorigen Punkt π An = − n1 · (sinn−1 x · cos x|02 + n−1 n = · An−2 . n−1 n · An−2 Außerdem A0 = Z π 2 0 A1 = Z 0 sin0 x dx = Z 0 π 2 π 2 π 1 dx = x02 = π2 , π sin1 x dx = − cos x02 = −(0 − 1) = 1. 118 17. Der Hauptsatz der Differential- und Integralrechnung Dies liefert nun A2n = = = A2n+1 = = = 2n−1 2n−1 2n−3 2n · A2n−2 = 2n · 2n−2 2n−1 2n−3 1 2n · 2n−2 · . . . · 2 · A0 ! n Y 2k−1 · π2 und 2k k=1 2n 2n−2 2n 2n+1 · A2n−1 = 2n+1 · 2n−1 2n 2n−2 2 2n+1 · 2n−1 · . . . · 3 · A1 n Y 2k 2k+1 . k=1 · A2n−4 · A2n−3 Wegen sin x ∈ [0, 1] für x ∈ [0, π2 ] folgt für alle x ∈ [0, π2 ] sinn+2 x ≤ sinn+1 x ≤ sinn x und aus der Monotonie des Integrals weiter A2n+2 ≤ A2n+1 ≤ A2n . Zusammen mit A2n+2 = A2n ergibt sich Q n+1 2k−1 k=1 2k Qn 2k−1 k=1 2k π 2 π 2 = 2n + 1 n→∞ −→ 1 2n + 2 A2n+1 = 1. n→∞ A2n lim Andererseits ist Qn 2k A2n+1 k=1 2k+1 = Qn 2k−1 A2n · k=1 2k π 2 = n 2 Y (2k)2 · . π (2k + 1)(2k − 1) k=1 Durch Grenzübergang erhalten wir n ∞ Y Y π 4k 2 4k 2 = lim =: . 2 2 n→∞ 4k − 1 4k 2 − 1 k=1 (17.1) k=1 Dieses Produkt wird Wallis’sches Produkt genannt. John Wallis (1616-1703) 18. Gleichmäßige Konvergenz und Vertauschung von Grenzwertprozessen 119 18 Gleichmäßige Konvergenz und Vertauschung von Grenzwertprozessen Definition 18.1. Es sei I eine Intervall und fn : I → R eine Funktion für n ∈ N. a) Wir sagen (fn ) konvergiert (punktweise) gegen f : I → R wenn für alle t ∈ I die Gleichung limn→∞ (fn (t)) = f (t) gilt. b) Wir sagen (fn ) konvergiert gleichmäßig gegen f , wenn es für jedes ε > 0 ein n0 ∈ N gibt derart, dass |f (t) − fn (t)| < ε für alle n ≥ n0 und alle t ∈ I. Kurz f − ε ≤ fn ≤ f + ε für fast alle n. c) Für eine beschränkte Funktion g : I → R definieren wir die sogenannte Supremumsnorm kgk∞ durch kgk∞ = sup{|g(x)| | x ∈ I}. Bemerkung 18.2. Eine Funktionenfolge fn : I → R konvergiert genau dann gleichmäßig gegen f : I → R wenn f − fn für fast alle n beschränkt ist und limn→∞ kf − fn k∞ = 0 gilt. Beispiel 18.3. Die Funktionenfolge fn : [0, π] → R, x 7→ sinn (x) konvergiert punktweise gegen 1 falls x = π2 f (x) := 0 sonst. Die Konvergenz ist aber nicht gleichmäßig. Satz 18.4. Eine Folge von stetigen Funktionen fn : I → R konvergiere gleichmäßig gegen f : I → R. Dann ist f stetig. Für jedes t ∈ I gilt also lim f (x) = lim lim fk (x) = lim lim fk (x) = lim fk (t) = f (t). x→t x→t k→∞ k→∞ x→t k→∞ Die zweite Gleichung ist die einzige Gleichung in der obigen Gleichungskette, die nicht unmittelbar klar ist. Die Aussage des Satzes ist also äquivalent zu der Aussage, dass es in dieser Situation erlaubt ist, die beiden Grenzwertprozesse zu vertauschen. 120 18. Gleichmäßige Konvergenz und Vertauschung von Grenzwertprozessen Beweis. Sei t ∈ I. Wir wollen zeigen, dass f dem ε–δ–Kriterium für Stetigkeit in t genügt. Sei dazu ε > 0. Wir müssen ein δ > 0 finden mit |f (t) − f (x)| < ε für alle t ∈ I mit |t − x| < δ. Da die Folge gleichmäßig konvergiert gibt es ein n0 ∈ N mit |fn (x) − f (x)| < ε 3 für alle n ≥ n0 und x ∈ I. Da fn0 stetig in t ist, gibt es weiter ein δ > 0 mit |fn0 (t) − fn0 (x)| < ε 3 für alle x ∈ I mit |t − x| < δ. Damit ergibt sich aber insgesamt |f (t) − f (x)| ≤ |f (t) − fn0 (t)| + |fn0 (t) − fn0 (x)| + |fn0 (x) − f (x)| < ε | {z } | {z } | {z } < 3ε < 3ε < 3ε für alle x ∈ I mit |t − x| < δ. Satz 18.5. Eine Folge von Riemann-integrierbaren Funktionen fn : [a, b] → R konvergiere gleichmäßig gegen f : [a, b] → R. Dann ist f Riemann-integriebar und es gilt Z b Z b f (t) dt = lim fn (t) dt. n→∞ a a Da die Bildung eines Riemannschen Integrals auch ein Grenzprozess ist, geht es auch hier um die Vertauschung zweier Grenzprozesse. Beispiel 18.6. Die Voraussetzung der gleichmäßigen Konvergenz ist unverzichtbar. Es sei gk (x) = k − k|1 − kx| und fk (x) = max{0, gk (x)}. Dann konvergiert (f R 1k ) punktweise gegen 0. Andererseits ist 0 fk dt = 1. Beweis. Um zu sehen, dass f Riemann-integrierbar ist, wollen wir die in Satz 16.7 beschriebene Äquivalenz ausnutzen. Es reicht also für ein gegebenes ε > 0 zu zeigen, dass es Treppenfunktionen ϕ, ψ ∈ T ([a, b]) gibt mit ϕ ≤ f ≤ ψ und Rb a ψ(t) − ϕ(t) dt < ε. Wegen der gleichmäßigen Konvergenz können wir ein n0 finden mit |fn (x) − f (x)| < ε 3(b−a) für alle n ≥ n0 und x ∈ [a, b]. 18. Gleichmäßige Konvergenz und Vertauschung von Grenzwertprozessen 121 Da fn0 Riemann integierbar ist, gibt es Treppenfunktion ϕ0 , ψ0 ∈ T ([a, b]) mit Rb ε ϕ0 ≤ fn0 ≤ ψ0 und a ψ0 (t) − ϕ0 (t) dt < 3ε . Setze nun ϕ(x) = ϕ0 (x) − 3(b−a) und ε ψ(x) = ψ0 (x) + 3(b−a) . Es gilt dann f (x) ≤ fn0 (x) + |f (x) − fn0 (x)| ≤ ψ0 (x) + Ähnlich folgt f ≥ ϕ. Außerdem Z a b ψ(t) − ϕ(t) dt = Z b ψ0 (t) − ϕ0 (t) dt +2 a ε 3(b−a) Z b a = ψ(x). ε 3(b−a) dt < ε und also ist f Riemann-integrierbar. Rb Rb Es ist noch a f (t) dt = limn→∞ a fn (t) dt zu zeigen. Sei dazu ε > 0 gegeben und n0 wie oben. Es folgt dann Z b Z b Z f (t) − fn (t) dt ≤ |f (t) − fn (t)| dt ≤ a a a b ε 3(b−a) dt = ε 3 für alle n ≥ n0 und damit die Behauptung. Satz 18.7. Es sei fn : I → R eine Folge von stetig differenzierbaren Funktionen, deren Ableitungen (fn0 ) gleichmäßig gegen eine Funktion g : I → R konvergieren. Es gebe außerdem ein t0 ∈ I, so dass limn→∞ fn (t0 ) existiert. Dann gibt es eine stetig differenzierbare Funktion f mit f 0 = g und limn→∞ fn (t) = f (t) für alle t ∈ I. Beweis. Nach Satz 18.4 ist g stetig. Sei f die eindeutig bestimmte Stammfunktion von g mit f (t0 ) = limn→∞ fn (t0 ). Für jedes x ∈ I gilt dann Z x f (x) = f (t0 ) + g(t) dt t0 Z x = f (t0 ) + lim fn0 (t) dt n→∞ t 0 Z x 0 = lim fn (t0 ) + fn (t) dt n→∞ = t0 lim fn (x) n→∞ wobei wir in der ersten und der letzten Gleichung den Hauptsatz der Differentialund Integralrechnung verwandt haben und die zweiten Gleichung Satz 18.5. 122 18. Gleichmäßige Konvergenz und Vertauschung von Grenzwertprozessen Bemerkung. Es ist nicht schwer einzusehen, dass in der Situation von Satz 18.7 für jedes L > 0 die Folge fn|[t0 −L,t0 +L]∩I gleichmäßig konvergiert. Satz 18.8 (Weierstraß-Kriterium). Es sei I ein Intervall und gk P : I → R be∞ schränkt und kgk k∞ die Supremumsnorm. Konvergiert Pn die Reihe k=0 kgk k∞ reeller Zahlen so konvergiert die Funktionenfolge k=0 gk n∈N der Partialsummen gleichmäßig gegen eine Grenzfunktion. P Beweis. Für jedes x P in I gilt |gk (x)| ≤ kgk k∞ . Die Reihe ∞ k=0 gk (x) konver∞ giert also Pabsolut da k=0 kgk k∞ eine konvergente Majorante ist (Satz 9.8). Sei f (x) = ∞ k=0 gk (x) Es gilt nun n X gk f − k=0 ∞ ∞ X = gk k=n+1 ∞ ≤ ∞ X k=n+1 n→∞ kgk k∞ −→ 0 und also folgt die Behauptung aus Bemerkung 18.2. Beispiel 18.9. Die Folge der Partialsummen P 2 k der Reihe ∞ cos(7k · π · x) konvergiert k=1 3 auf ganz R gleichmäßig gegen eine sogenannte Weierstraß–Funktion f (x). Sie ist auf ganz R stetig aber in keinem Punkt differenzierbar. Beweis. Die gleichmäßige Konvergenz folgt unmittelbar aus dem WeierstraßKriterium. Gemäß Satz 18.4 ist f stetig. Sei nun x ∈ R. Es bleibt zu zeigen, dass die Weierstraß Funktion f nicht differenzierbar in x ist. Die Funktion genügt der Gleichung f (x + 1) = −f (x) und es reicht daher den Fall zu betrachten, dass für unendlich viele k die Ungleichung cos(7k · π · x) ≥ 0 gilt. Im folgenden betrachten wir nur solche k für die diese Ungleichung gilt. Wir wählen hk mit |hk | minimal so, dass cos(7k · π · (x + hk )) = −1 gilt. Es gilt dann 0 < |hk | ≤ 7−k . Da die Funktion außerdem f (x) = f (−x) genügt, dürfen wir nach eventuellem Ersetzen von x durch −x zusätzlich annehmen, dass wir eine Folge natürlicher Zahlen ki → ∞ finden können mit hki > 0 und cos(7ki ·π·x) ≥ 0. Sei im folgenden k gleich einem solchen ki . Für den Differenzenquotienten des k-Summanden gilt dann k 2 k k cos(7k · π · (x + hk )) − 23 cos(7k · π · x) 3 ≤ − 14 3 hk 18. Gleichmäßige Konvergenz und Vertauschung von Grenzwertprozessen 123 Weiterhin gilt für alle l ≥ k auch cos(7l · π · (x + hk )) = −1 und mithin 2 l 3 cos(7l · π · (x + hk )) − hk 2 l 3 cos(7l · π · x) 2 l 3 cos(7l · π · x) ≤0 für l ≥ k. Schließlich haben wir 2 l 3 cos(7l · π · (x + hk )) − hk ≤π· 14 3 l für l < k l da die Ableitung der Funktion 23 cos(7l ·π ·x) durch die rechte Seite beschränkt ist. Insgesamt folgt durch aufaddieren f (x + hk ) − f (x) hk ≤ − = − 14 k 3 14 k 3 ≤ − 1− Damit ergibt sich f (x + hki ) − f (x) ≤− 1− hki und also ist f in x nicht differenzierbar. 3π 11 + k−1 X l=0 +π 3π 11 π· 14 l 3 14 k − 3 11 3 14 k . 3 14 ki i→∞ −→ 3 1 −∞ Satz 18.10 (Dini). Es sei fn : [a, b] → R eine Folge von stetigen Funktionen, die punktweise gegen eine stetige Grenzfunktion f : [a, b] → R konvergiere. Weiterhin sei die Konvergenz monoton, d.h. für jedes x ∈ [a, b] sei die Folge (fn (x))n∈N monoton. Dann konvergiert die Folge (fn ) gleichmäßig gegen f . Ulisse Dini (1845-1918) Beweis. Angenommen die Konvergenz ist nicht gleichmäßig. Dann gibt es ein ε > 0 mit kf − fn k∞ ≥ ε für unendlich viele n. Nach Übergang zu einer Teilfolge können wir kf − fn k∞ ≥ ε für alle n annehmen. Es gibt dann für jedes n ein xn ∈ [a, b] mit |f (xn ) − fn (xn )| ≥ ε. Nach dem Satz von Bolzano Weierstraß hat xn eine konvergente Teilfolge. Und indem wir gegebenfalls (fn ) erneut durch eine Teilfolge ersetzen, können wir ohne Einschränkung annehmen, dass xn selbst konvergiert. Sei limn→∞ xn = x ∈ [a, b]. Wir können nun ein n0 finden mit 124 19. Potenzreihen und Taylorentwicklung |f (x) − fn0 (x)| < 3ε . Da f und fn0 stetig in x sind, gibt es weiter ein δ > 0 mit |f (x) − f (y)| < 3ε und |fn0 (x) − fn0 (y)| < 3ε für alle y ∈ [x − δ, x + δ] ∩ [a, b]. Mit der Dreicksungleichung folgt nun |fn0 (y) − f (y)| < |fn0 (y) − fn0 (x)| + |fn0 (x) − f (x)| + |f (x) − f (y)| < ε für alle y ∈ [x − δ, x + δ] ∩ [a, b]. Für jedes y ist die Folge |fn (y) − f (y)| monoton fallend. Folglich ergibt sich |fn (y) − f (y)| < ε für alle y ∈ [x − δ, x + δ] ∩ [a, b] und n ≥ n0 . Damit folgt aber xn 6∈ [x − δ, x + δ] ∩ [a, b] für alle n ≥ n0 . Dies ist aber ein Widerspruch da xn gegen x konvergiert. 19 Potenzreihen und Taylorentwicklung Definition 19.1. a) mit Entwicklungspunkt z0 ∈ C ist eine PEine Potenzreihe k , mit c ∈ C. c (z − z ) Reihe der Form ∞ 0 k k=0 k b) Eine Funktion f : I → R heißt analytisch falls für jedes x0 P ∈ I eine PotenzP∞ k k reihe k=0 ak (x−x0 ) und δ > 0 existiert, so dass f (x) = ∞ k=0 ak (x−x0 ) für alle x ∈ I∩]x0 − δ, x0 + δ[. P k Satz 19.2. Zu jeder komplexen Potenzreihe ∞ k=0 ck (z−z0 ) existiert eine reelle Zahl R ∈ [0, ∞] := [0, ∞[∪{∞} derart, dass folgendes gilt • Für |z − z0 | < R konvergiert die Reihe absolut. • Für |z − z0 | > R ist ck (z − z0 )k keine Nullfolge und insbesondere ist die Reihe nicht konvergent. Die Zahl R heißt der Konvergenzradius der Reihe. Beweis. Ohne Einschränkung sei z0 = 0. Setze R := sup r ∈ [0, ∞[ (|ck |rk )k∈N ist eine Nullfolge ∈ [0, ∞] Ist nun |z| > R soP ist (ck z k ) keine Nullfolge. Sei nun anderseits |z| < R. Wir k wollen zeigen, dass ∞ k=0 ck z absolut konvergiert. Wegen |z| < R gibt es ein r > k |z| derart, dass (|ck |r )k∈N ist eine Nullfolge und insbesondere eine beschränkte Folge ist. Wähle L > 0 mit |ck |rk ≤ L. Es folgt dann k |z| k k |ck z k | = |z| |c |r ≤ L · k k r r P∞ |z| k Da konvergiert folgt die absolute Konvergenz von k=0 L · r P∞die Reihe k k=0 ck z aus dem Majorantenkriterium. 125 19. Potenzreihen und Taylorentwicklung P k Satz 19.3. Sei ∞ k=0 ak (x − x0 ) eine reelle Potenzreihe mit positiven Konvergenzradius R ≤ ∞. Weiter sei r ∈]0, R[ beliebig P∞ − x0 )k gleichmäßig k−1 k=1 kak (x − x0 ) hat ebenfalls Konvergenz- a) Auf [x0 − r, x0 + r] konvergiert die Reihe gegen eine Grenzfunktion. b) Die Reihe der Ableitungen radius R. P∞ k=0 ak (x P k R[. Dann ist f beliebig c) Sei f (x) = ∞ k=0 ak (x − x0 ) für P x ∈]x0 − R, x0 + k−1 . 0 ka (x − x ) oft differenzierbar und f (x) = ∞ 0 k k=1 Beweis. Wir können ohne Einschränkung der Allgemeinheit x0 = 0 annehmen. k a) Es gilt sup{|ak xk | | x ∈ [−r, r]} = |aP k |r . Da die Potenzreihe für x = r ∞ absolut konvergiert, konvergiert also k=0 |ak |rk . Die gleichmäßige Konvergenz ergibt sich aus dem Weierstraß-Kriterium Satz 18.8. b) Es sei r > R. Dann ist die Folge ak rk keine Nullfolge und dies impliziert dass P auch kak rk−1 keine Nullfolge ist. Folglich ist der Konvergenzradius k−1 kleiner gleich R. Sei nun r < R. Wähle r > 0 von ∞ 2 k=1 kak (x − x0 ) k−1 ≤ |a |r k für fast alle k. Folgmit r < r < R. Es ist dann k|a |r k k 2P P 2 ∞ k−1 und die k eine konvergent Majorante von |a |r lich ist ∞ k 2 k=1 kak r k=1 absolute Konvergenz folgt nach dem Majorantenkriterium (Satz 9.8). c) Es sei r ∈]0, R[. Nach a) und b) konvergieren die Ableitungen der Partialsummen gleichmäßig auf [−r, r]. Mit 18.7 folgt daher, dass f auf PSatz ∞ 0 [−r, r] differenzierbar ist und f (x) = k=1 kak xk−1 gilt. Da r ∈]0, R[ beliebig war, bleibt die Gleichung für alle x ∈] − R, R[ richtig. Schließlich ist nach b) R auch der Konvergenzradius der abgeleiteten Reihe und durch Iteration folgt, dass f beliebig oft differenzierbar ist. P (−1)n+1 (x−1)n Beispiele. a) Es gilt ln(x) = log(x) = ∞ für x ∈]0, 2[ (gemäß n=1 n Übung gilt die Gleichung auch für x = 2), denn für y ∈] − 1, 1[ ist 126 19. Potenzreihen und Taylorentwicklung log(1 + y) = Z y 0 = 1 1+t ∞ Z y X dt = ∞ yX (−t)k dt 0 k=0 ∞ X (−t)k dt = 0 k=0 Z (−1)n+1 y n n n=1 wobei wir die gleichmäßige Konvergenz der Reihe auf dem Intervall [0, y] (bzw. [y, 0]) sowie Satz 18.5 in der dritten Gleichung ausgePartialsummen (n = 1, 2, 3, 10) der Ponutzt haben. tenzreihe von log(x) = ln(x) um x = 1. P∞ 2n+1 x b) Es gilt arctan(x) = n=0 (−1)n 2n+1 für |x| < 1, denn Z xX Z x ∞ 1 (−t2 )k dt dt = arctan(x) = 2 1+t 0 = 0 k=0 ∞ XZ x k=0 (−t2 )k dt = 0 ∞ X (−1)k x2k+1 2k+1 k=0 wobei wir wieder analog die gleichmäßige Konvergenz der Reihe sowie Satz 18.5 in der dritten Gleichung ausgenutzt haben. Satz 19.4 (Taylorsche Formel). Es sei f : I → R eine (n+1)-mal stetig differenzierbare Funktion und a, x ∈ I. Dann gilt f (x) = f (a) + f 0 (a) 1! (x +Rn+1 (x) − a) + f 00 (a) 2! (x − a)2 + · · · + mit Z x 1 Rn+1 (x) = n! (x − t)n f (n+1) (t) dt . a f (n) (a) n! (x − a)n Brook Taylor (1685-1731) Beweis. Wir beweisen den Satz durch Induktion nach n. Für n = 0 folgt er unmittelbar aus dem Hauptsatz der Differential- und Integralrechnung (Satz 17.4). Der Induktionsschritt (n − 1) 7→ n folgt aus Z x 1 Rn (x) = (n−1)! (x − t)n−1 f (n) (t) dt a Z x f (n) (a) n 1 = (x − a) + (x − t)n−1 f (n) (t) − f (n) (a) dt n! (n−1)! Z x a f (n) (a) n 1 (x − t)n f (n+1) (t) dt = n! (x − a) + n! a 127 19. Potenzreihen und Taylorentwicklung wobei wir in der letzten Gleichung partiell integriert haben. Satz 19.5 (Lagrangsche Form des Restgliedes). Es sei f : I → R eine (n + 1)-mal differenzierbare Funktion. Zu a, x ∈ I gibt es ein ξ zwischen a und x mit f 0 (a) 1! (x − a) + (n+1) + f (n+1)!(ξ) (x − a)n+1 . f (x) = f (a) + ··· + f (n) (a) n! (x − a)n Joseph-Louis Lagrange (1736-1813) Beweis. Für n = 0 ist der Satz äquivalent zum Mittelwertsatz der Differentialrechnung. Sei nun n ≥ 1. Da f mindestens n-mal stetig differenzierbar ist, können wir Satz 19.4 anwenden solbald wir nur n durch n − 1 ersetzen. Außerdem ist der erste Schritt aus dem Beweis von Satz 19.4 bei der Umformung von Rn nach wie vor gerechtfertigt. Es gilt also f (x) = f (a) + Rn+1 (x) = 1 (n−1)! f 0 (a) (x Z 1!x a − a) + · · · + f (n) (a) n! (x − a)n + Rn+1 (x) mit (x − t)n−1 (f (n) (t) − f (n) (a)) dt . Wir setzen nun h(t) = ( f (n) (t)−f (n) (a) t−a f (n+1) (a) falls t 6= a falls t = a Die Abbildung h ist stetig auf [a, x] und es gilt Z x 1 Rn+1 (x) = (n−1)! (x − t)n−1 (t − a)h(t) dt a Z x h(ξ1 ) = (n−1)! (x − t)n−1 (t − a) dt Z xa h(ξ1 ) = (x − t)n dt n! = a h(ξ1 ) (n+1)! (x − a)n+1 für ein ξ1 ∈ [a, x], wobei wir in der zweiten Gleichung den Mittelwertsatz der Integralrechnung angewandt haben und in der dritten Gleichung partiell integriert haben. Falls ξ1 = a gilt h(ξ1 ) = f (n+1) (a) und der Satz ist bewiesen. Andernfalls 128 19. Potenzreihen und Taylorentwicklung (n) (n) (a) ist h(ξ1 ) = f (ξξ11)−f und nach dem Mittelwertsatz der Differentialrechnung −a gibt es ein ξ ∈]a, ξ1 [ mit f (n+1) (ξ) = h(ξ1 ). Definition 19.6. Ist f : I → R beliebig oft differenziebar und a ∈ I so heißt P∞ f (n) (a) n n=0 n! (x − a) die Taylorreihe von f in a. Beispiel 19.7. Die Potenzreihe P∞ k x2k+1 (−1) ist die Taylorreihe Partialsummen (n = 1, 3, 5, 15) der Taylorreihe k=0 (2k+1)! von sin(x) um x = 0. von sin(x) in x = 0. P k Bemerkung. Es gelte f (x) = ∞ k=0 ak (x − a) für alle x ∈]a − δ, a + δ[. Dann folgt aus Satz 19.3, dass ak = von f in a. f (k) (a) k! gilt. Also ist die Reihe gleich der Taylorreihe Beispiel 19.8. a) Sei L > 0. Ist f : [a, b] → R eine beliebig oft differenzierbare Funktion mit |f (n) (x)| ≤ Ln für alle x ∈ [a, b], dann konvergiert die Taylorreihe von f in a auf ganz [a, b] gegen f . b) Seien y, v, c, d ∈ R. Dann gibt es genau eine 2-mal differenzierbare Lösung f : [a, b] → R der Differentialgleichung f 00 + cf 0 + df = 0 mit f (a) = y und f 0 (a) = v und diese ist in einer Potenreihe entwickelbar: Da f 00 = −cf 0 − df und die rechte Seite nach Voraussetzung differenzierbar ist, folgt dass f 00 noch differenzierbar ist. Damit ist f dreimal differenziebar ist. Durch Iteration sieht man leicht, dass jede Lösung beliebig oft differenzierbar ist. Als nächstes sei M so gross, dass |f 0 (x)| + |f (x)| ≤ M für alle x ∈ [a, b] gilt. Weiter sei L = 1 + |c| + |d|. Man zeigt dann per Induktion ohne Schwierigkeiten |f (n) (x)| ≤ M · Ln für alle x ∈ [a, b]. Also P k |f (k) (a)| k gilt gemäß a) f (x) = ∞ ≤ M Lk! – der k=0 ak (x − a) wobei |ak | = k! Konvergenzradius der Reihe ist also unendlich. Da f eine Lösung der Differentialgleichung ist, folgt durch Differention und Koeffizientenvergleich k(k − 1)ak + c(k − 1)ak−1 + dak−2 = 0. Damit lassen sich aber alle Koeffizienten berechnen sobald man a0 und a1 kennt. Umgekehrt kann man zu gegebenen a0 und a1 eine Folge (ak ) konstruieren, die der obigen Iterationsformel genügt. Es ist dann leicht zu 129 19. Potenzreihen und Taylorentwicklung P k sehen, dass ∞ k=0 ak (x − a) einen unendlichen großen Konvergenzradius hat und mithin auch eine Lösung der Differentialgleichung repräsentiert. Für x ∈ R und k ∈ N setzen wir k Y x x+1−i := i k i=1 mit der üblichen Konvention, dass ein leeres Produkt 1 ist. Im Abschnitt 1 hatten wir dies nur für x ∈ N erklärt. Satz 19.9. (Binomische Reihe) Es sei α ∈ R und x ∈] − 1, 1[. Dann ist (1 + x)α = ∞ X α k x k k=0 Für α ∈ N bricht die Reihe ab und der Satz ist äquivalent zum Binomischen Lehrsatz. Beweis. Die Funktion f (x) = (1+x)α ist C ∞ . Mittels Induktion sieht man leicht α (k) α−k f (x) = k! k (1 + x) . Aus Satz 19.4 folgt (1 + x) α = n X α k k=0 x k ! α Rn+1 (x) = (n + 1) n+1 + Rn+1 (x) Z 0 x mit (x − t)n (1 + t)α−n−1 dt n→∞ Es reicht nun Rn+1 (x) −→ 0 zu zeigen. Wir unterscheiden hier zwei Fälle 1. Fall. x ∈]0, 1[. Es gilt für n > α da |Rn+1 (x)| ≤ (n + 1) α n+1 Z 0 x xn dt ≤ (n + 1) α (n+1)(n+1 )xn+1 = n(α xn n) Somit folgt die Behauptung. n−α n x n+1 n→∞ x −→ 0, α n+1 → x < 1. 130 20. Partialbruchzerlegung 2. Fall. x ∈] − 1, 0[. Sei C := max{(1 + t)α−1 | |t| ≤ |x|}. Es ist dann Z α |x| |Rn+1 (x)| = (n + 1) n+1 (|x| − t)n (1 − t)α−n−1 dt 0 ≤ C · (n + 1) ≤ C · (n + 1) = C · (n + 1) α n+1 α n+1 Z |x| 0 Z 0 |x| |x|−t n dt 1−t |x|n dt n+1 n→∞ |x| −→ 0. α n+1 Beispiel 19.10. Die Funktion −1/x e falls x > 0 f (x) = 0 falls x ≤ 0 ist C ∞ . Die Taylorreihe von f in 0 ist 0. Insbesondere ist f nicht reell analytisch. Beweis. Wir zeigen zunächst per Induktion, dass es Polynomfunktionen pn (x) gibt mit f (n) (x) = pn (1/x)e−1/x für x > 0. Für den Induktionsschritt beachte man das gilt f (n+1) = − x12 p0n (1/x)e−1/x + x12 pn (1/x)e−1/x wir müssen also lediglich pn+1 (x) = −x2 p0n (x) + x2 pn (x) setzen um die Behauptung zu erhalten. Wir wollen weiter als nächstes zeigen, dass f (n) (x) auch für x ≤ 0 existiert und f (n) (x) = 0 gilt. Dies ist offensichtlich ledglich für x = 0 ein Problem. Wir nehmen per Induktion an, dass die Behauptung bereits für f (n−1) bewiesen (n−1) (x) wurde. Zu zeigen ist 0 = limx&0 f x (x) dies folgt aber aus limx→∞ xpn−1 = 0, ex vergleiche Bemerkung 11.13. Beispiel 19.11. Sei f wie in Beispiel 19.10. Dann ist die Funktion f (x) + f (1 − x) überall positiv. Mithin f (x) ist auch g(x) = f (1−x)+f (x) beliebig oft differenzierbar. Es gilt offenbar g(x) = 0 für x ≤ 0 und g(x) = 1 für x ≥ 1. 20 g(x) Partialbruchzerlegung Im folgenden Satz benutzen wir implizit, dass C algebraisch vollständig ist. Jedes Polynom q ∈ C[X] \ {0} zerfällt also in Linearfaktoren, d.h. sind λ1 , . . . , λk die 131 20. Partialbruchzerlegung Nullstellen von q mit Vielfachheiten m1 , . . . , mk so gibt es eine Konstante L ∈ C mit q(X) = L · (X − λ1 )m1 · · · (X − λk )mk . Satz 20.1. Es seien p, q ∈ C[x] komplexe Polynome mit grad p < grad q und λ1 , . . . , λk ∈ C seien die k verschiedenen Nullstellen von q mit zugehörigen Multiplizitäten m1 , . . . , mk ∈ N. (D.h. λi ist mi -fache Nullstelle.) Dann gibt es eindeutig bestimmte Konstanten hij ∈ C für 1 ≤ i ≤ k, 1 ≤ j ≤ mi mit p(x) h11 h12 h1m1 = + + ... + + ... 2 q(x) (x − λ1 ) (x − λ1 ) (x − λ1 )m1 hkmk hk1 + . + ... + (x − λk ) (x − λk )mk (20.1) Diese Summe heißt Partialbruchzerlegung. Beweis. Wir können ohne Einschränkung annehmen, dass p, q teilerfremd sind (ansonsten kürzen). Wir beweisen die Behauptung durch Induktion über grad q. (IB) Für grad q = 1 stimmt die Behauptung: Dann ist nämlich q(x) = x − λ und grad p = 0, also ist p konstant. (IS) Sei q̃(X) das eindeutig bestimmte Polynom mit q(X) = (X − λ1 )m1 q̃(X). Nach Vorausetzung ist λ1 keine Nullstelle von q̃(X). Wir setzen h1m1 := h := p(λ1 ) q̃(λ1 ) . Es gilt dann p(X) q(X) − h (X−λ1 )m1 = p(X)−hq̃(X) q(X) Nach Voraussetzung gilt für den neuen Zähler p̃(X) = p(X) − hq̃(X), dass p̃(λ1 ) = 0. Somit ist p̃(X) durch (X − λ1 ) teilbar. Dasselbe gilt natürlich für den Nenner q(X). Der gekürzte Bruch p(X) h − = q(X) (X − λ1 )m1 p̃(X) X−λ1 q(X) (X−λ1 ) hat aber nach Induktionsvoraussetzung eine eindeutig bestimmte Partialbruchzerlegung. Um einzusehen, dass sich auch die Eindeutigkeit im Induktionsschritt überträgt, beachte man, dass für eine beliebige Partialbruchzerlegung notwendiger1) m1 weise h1m1 := p(λ q̃(λ1 ) = h gilt. Denn man kann die Gleichung (20.1) mit (x−λ1 ) multiplizieren, dann alle Brüche kürzen, so dass kein Nenner mehr λ1 als Nullstelle hat und anschließendend x = λ1 auswerten. Auf der rechte Seite der Gleichung 1) steht dann h1m1 und auf der linken Seite p(λ q̃(λ1 ) . 132 20. Partialbruchzerlegung x x x Beispiel. Zur Integration von eex −1 +1 betrachte y = e , also dy = e dx bzw. dx = 1 1 ex dy = y dy. Dann ist Z Z Z y−1 1 a b ex −1 dx = · dy = ex +1 y+1 y y + y+1 dy für geeignete a, b ∈ R. Um die Koeffizienten der Partialbruchzerlegung y−1 y(y+1) = a y b y+1 + zu bestimmen, geht man wie folgt vor. Um a zu bestimmen, multipliziert man die Gleichung mit y und setzt y = 0, nachdem man die Brüche gekürzt hat. Dies 0−1 ergibt a = 0+1 = −1. Um b zu bestimmen, multipliziert man die Gleichung mit (y + 1) und setzt y = −1, nachdem man die Brüche gekürzt hat. Dies ergibt b = −1−1 −1 = 2. und wir erhalten Z Z −1 2 ex −1 ex +1 dx = y + y+1 dy = − log |y| + 2 log |y + 1| + c = − log ex + 2 log(ex + 1) + c = −x + 2 log(ex + 1) + c für ein c ∈ R. Satz 20.2. Es seien p, q, λi , mi wie in Satz 20.1. Zusätzlich seien p, q ∈ R[x] reelle Polynome. Ist λi ∈ R, so folgt hij ∈ R für alle 1 ≤ j ≤ mi . Ist λi ∈ C \ R und λi = λj , so ist mi = mj und hil = hjl für 1 ≤ l ≤ mi = mj . Insbesondere hjl hil ist die Abbildung R → R, x 7→ (x−λ + (x−λ reellwertig. )l )l i j Beweis. Für alle x ∈ R \ {λ1 , . . . , λk } gilt h11 h12 h1m1 p(x) = + + ... + + ... q(x) (x − λ1 ) (x − λ1 )2 (x − λ1 )m1 hkmk hk1 + + ... + (x − λk ) (x − λk )mk h̄12 h̄1m1 h̄11 = + + ... + + ... (x − λ̄1 ) (x − λ̄1 )2 (x − λ̄1 )m1 h̄kmk h̄k1 + + ... + . (x − λ̄k ) (x − λ̄k )mk Da man die letzte Gleichung als eine polynomiale Gleichung in x schreiben kann, gilt sie nicht nur für alle x ∈ R sondern auch für alle x ∈ C. Wegen der Eindeutigkeit der Partialbruchzerlegung folgt nun die Behauptung. 133 20. Partialbruchzerlegung Bemerkung. Ist l ≥ 2, α, λ ∈ C so ist eine Stammfunktion von gegeben durch 1 α ᾱ − + . l − 1 (x − λ)l−1 (x − λ̄)l−1 α (x−λ)l + (x−ᾱλ̄)l Ist l = 1, so gilt α ᾱ + (x − λ) (x − λ̄) 2Re(α(x − λ̄)) (x − Re(λ))2 + Im(λ)2 2Re(α)(x − Re(λ)) 2 Im(α) Im(λ) − (x − Re(λ))2 + Im(λ)2 (x − Re(λ))2 + Im(λ)2 = = und Re(α) log (x − Re(λ))2 + (Im(λ))2 − 2 Im(α) arctan ist eine Stammfunktion. Beispiel 20.3. Gesucht ist R x5 −2x4 +x3 −2x2 +5x−8 x4 −x2 −2x+2 x−Re(λ) Im(λ) dx . Setze p(x) = x5 − 2x4 + x3 − 2x2 + 5x − 8, q(x) = x4 − x2 − 2x + 2. Schritt 1. (Polynomdivision) Finde r mit p = sq + r und grad r < grad q. Es ist x5 − 2x4 + x3 − 2x2 + 5x − 8 = x4 − x2 − 2x + 2 x − 2 − x5 + x3 + 2x2 − 2x − 2x4 + 2x3 + 3x − 8 2x4 − 2x2 − 4x + 4 2x3 − 2x2 − x − 4 und r(x) := 2x3 − 2x2 − x − 4 ist der gesuchte Restterm. Schritt 2. Bestimme die Nullstellen von q. Es ist q(1) = 0, d.h. 1 ist Nullstelle von q. Mittels Polynomdivision erhält man q(x) = x4 − x2 − 2x + 2 = (x − 1)(x3 + x2 − 2) = (x − 1)2 (x2 + 2x + 2). x2 + 2x + 2 hat keine reelle Nullstelle, sondern nur zwei zueinander konjugierte einfache Nullstellen. Schritt 3. (Partialbruchzerlegung) Suche a, b, c, d ∈ R mit a x−1 + b (x−1)2 + cx+d x2 +2x+2 = 2x3 −2x2 −x−4 . (x−1)2 (x2 +2x+2) 134 20. Partialbruchzerlegung Um b zu finden, multipliziere man die Gleichung mit (x − 1)2 und setze x = 1, nachdem man die Brüche gekürzt hat. Es gilt also b = 2−2−1−4 1+2+2 = −1. Wir b (x−1)2 = −(x2 +2x+2) (x−1)2 (x2 +2x+2) auf die rechte Seite und erhalten cx+d x2 +2x+2 = 2x3 −x2 +x−2 (x−1)2 (x2 +2x+2) = bringen nun den Term a x−1 + 2x2 +x+2 . (x−1)(x2 +2x+2) Um a zu finden, multipliziere man die Gleichung mit (x − 1) und setze x = 1, nachdem man die Brüche gekürzt hat. Dies liefert a = 2+1+2 1+2+2 = 1. Nun bringen wir den Term a x−1 = x2 +2x+2 (x−1)(x2 +2x+2) cx+d x2 +2x+2 = auf die rechte Seite und erhalten x2 −x (x−1)(x2 +2x+2) = x . (x2 +2x+2) Koeffizientenvergleich liefert c = 0 und d = 1. Damit folgt 2x3 −2x2 −x−4 x4 −x2 −2x+2 = 1 x−1 − 1 (x−1)2 + x . x2 +2x+2 Schritt 4. (Integration) Es folgt nun Z Z (x−2)(x4 −x2 −2x+2)+2x3 −2x2 −x−4 x5 −2x4 +x3 −2x2 +5x−8 dx = dx x4 −x2 −2x+2 x4 −2x2 −2x−2 Z 3 −2x2 −x−4 = x − 2 + 2x dx x4 −2x2 −2x−2 Z 1 1 x = x − 2 + x−1 − (x−1) 2 + x2 +2x+2 dx Z 1 x 1 2 = 2 x − 2x + log |x − 1| + x−1 + x2 +2x+2 dx . Wir bestimmen mittels Substitution das Integral. Um den linearen Term im Nenner zu eleminieren, setzen wir dazu y = x + 1. Dann ist Z Z Z Z y−1 y x 1 dx = dy = dy − dy x2 +2x+2 y 2 +1 y 2 +1 y 2 +1 = 1 2 1 2 log(y 2 + 1) − arctan(y) log(x2 + 2x + 2) − arctan(x + 1) R 0 (t) In der vorletzten Gleichung haben wir ff (t) dt = log(f (t)) genutzt und in der letzten Gleichung haben wir zurück substituiert. Insgesamt folgt Z x5 −2x4 +x3 −2x2 +5x−8 dx = 12 x2 − 2x + log |x − 1| + x4 −x2 −2x+2 = + 12 log(x2 + 2x + 2) − arctan(x + 1) + C. mit einer Konstanten C. 21. Konvexität 135 Bemerkung. Trotz der in diesem und im Abschnitt 17 eingeführten Integrationsmethoden sind in vielen Fällen Stammfunktionen nicht geschlossen darstellR −x 2 bar (z.B. e dx ).♠2 21 Konvexität Definition 21.1. Sei I ein Intervall. a) Eine Abbildung f : I → R heißt konvex, falls für alle t ∈ ]0, 1[ und alle x, y ∈ I gilt f tx + (1 − t)y ≤ tf (x) + (1 − t)f (y) und konkav, wenn die umgekehrte Ungleichung für alle diese Zahlen gilt. b) f heißt streng konvex bzw. streng konkav, wenn die strenge Ungleichung gilt für alle x 6= y und t ∈]0, 1[. Satz 21.2. Es sei f : I → R differenzierbar. Dann ist äquivalent: a) f ist konvex. b) f 0 ist monoton wachsend. Korollar 21.3. Ist f zweimal differenzierbar, so ist f genau dann konvex, wenn f 00 ≥ 0 ist. Beispiele. a) Es ist exp00 = exp > 0, also ist exp konvex. b) Es ist log00 x = − x12 < 0, also ist log konkav. c) x 7→ x2 ist konvex. d) x 7→ x3 ist weder konvex noch konkav. Beweis von Satz 21.2. b) ⇒ a)“: Seien x1 , x2 ∈ I und ” h(λ) := f (λx1 + (1 − λ)x2 ) − λf (x1 ) − (1 − λ)f (x2 ). 2 Stand der Vorlesung am 30.01.14 136 21. Konvexität Es ist zu zeigen, dass h(λ) ≤ 0 ist für alle λ ∈ [0, 1]. Es gilt h(0) = 0 = h(1). Da λ 7→ λx1 + (1 − λ)x2 und f 0 monoton wachsend sind und x1 − x2 > 0 gilt, ist wegen h0 (λ) = f 0 (λx1 + (1 − λ)x2 )(x1 − x2 ) − f (x1 ) + f (x2 ) auch h0 monoton wachsend. Annahme: Es gibt ein λ0 ∈ ]0, 1[ mit h(λ0 ) > 0. Nach dem Mittelwertsatz gibt es dann ein ξ1 ∈ ]0, λ0 [ mit h0 (ξ1 ) = h(λλ00)−h(0) > 0 und es ein ξ2 ∈ ]λ0 , 1[ mit −0 0) < 0. Dann ist h0 (ξ1 ) > h0 (ξ2 ) und dies ist ein Widerspruch h0 (ξ2 ) = h(1)−h(λ 1−λ0 zur Monotonie von h0 . a) ⇒ b)“: Sei f konvex und x1 < x2 . Es ist zu zeigen, dass f 0 (x1 ) ≤ f 0 (x2 ) gilt. ” Dazu zeigen wir f (x2 ) − f (x1 ) f 0 (x1 ) ≤ ≤ f 0 (x2 ). x2 − x1 Da f konvex ist, gilt für alle λ ∈ [0, 1] f (x1 + λ(x2 − x1 )) ≤ f (x1 ) + λ(f (x2 ) − f (x1 )), Folglich ist für alle h ∈ [0, x2 − x1 ] (x1 ) f (x1 + h) ≤ f (x1 ) + h f (xx22)−f −x1 f 0 (x1 ) = lim h&0 f (x1 +h)−f (x1 ) h ≤ und somit f (x2 )−f (x1 ) . x2 −x1 Die andere Ungleichung zeigt man analog. Korollar 21.4 (Tangentenbedingung). Sei f : I → R differenzierbar. Dann ist f genau dann konvex, wenn Folgendes gilt: ∀x ∈ I ∀h ∈ R : x + h ∈ I ⇒ f (x + h) ≥ f (x) + h · f 0 (x). Die Ungleichung bedeutet geometrisch, dass der Graph von f oberhalb der Tangente durch (x, f (x)) verläuft. Beweis. Falls f konvex ist, ist f 0 nach Satz 21.2 monoton wachsend. Für h > 0 ist f (x + h) − f (x) = f 0 (ξ) ≥ f 0 (x) mit ξ ∈ ]x, x + h[ h Falls h < 0 ist, gilt f (x + h) − f (x) = f 0 (ξ) ≤ f 0 (x) mit ξ ∈ ]x + h, x[ . h 137 21. Konvexität In jedem Fall also f (x + h) − f (x) ≥ hf 0 (x). Sei nun die Tangentenbindung erfüllt. Es ist zu zeigen, dass f 0 monoton wachsend ist. Dazu zeigen wir, dass für x1 < x2 f (x2 ) − f (x1 ) ≤ f 0 (x2 ) x2 − x1 gilt. Es ist nämlich f x1 + (x2 − x1 ) ≥ f (x1 ) + (x2 − x1 )f 0 (x1 ), also f 0 (x1 ) ≤ f (x2 ) − f (x1 ) ≥ f 0 (x1 ). x2 − x1 Entsprechend ist f (x2 + (x1 − x2 )) ≥ f (x2 ) + (x1 − x2 )f 0 (x2 ) und damit f (x1 ) − f (x2 ) ≤ f 0 (x2 ). x1 − x2 f(1) Satz 21.5 (Trapez-Regel). Sei f : [0, 1] → R zweimal stetig differenzierbar. Dann gibt es ein ξ ∈ [0, 1] mit Z 0 1 f(0) 1 1 f (x) dx = (f (0) + f (1)) − f 00 (ξ). 2 12 0 1 Beweis. Sei M = max{f 00 (x) | x ∈ [0, 1]} und m = min{f 00 (x) | x ∈ [0, 1]}. Betrachte g(x) := (1 − x)f (0) + xf (1) − 12 M (x − x2 ) G(x) := (1 − x)f (0) + xf (1) − und 2 1 2 m(x − x ). Es gilt dann g(0) = f (0) = G(0) sowie G(1) = f (1) = g(1). Außerdem ist d(x) = f (x) − G(x) konvex und D(x) = f (x) − g(x) konkav. Wegen d(0) = d(1) = D(0) = D(1) = 0 folgt d(x) ≤ 0 und D(x) ≥ 0. Mithin g(x) ≤ f (x) ≤ G(x). Damit ist aber 1 2 f (0) + f (1) − 1 12 M = Z 1 g(x) dx ≤ 0 ≤ Z 0 1 G(x) dx = Z 1 f (x) dx 0 1 2 f (0) + f (1) − 1 12 m R1 1 Es gibt also ein u mit m ≤ u ≤ M mit 12 f (0) + f (1) − 12 u = 0 f (x) dx . Da der Zwischenwertsatz für f 00 gilt, können ein ξ ∈ [0, 1] finden mit f 00 (ξ) = u. 138 21. Konvexität Satz 21.6 (Jensensche P Ungleichung). Sei f : I → R konvex und λ1 , . . . , λn > 0 mit ni=1 λi = 1. Dann gilt ! n n X X f λ i xi ≤ λi · f (xi ). Johan Ludwig Jensen i=1 (1859-1925) i=1 Beweis. Wir zeigen die Aussage durch Induktion über n. Für n = 1 ist die Aussage trivial. Pn P (IS) Seien λ1 , . . . , λn+1 > 0 mit n+1 i=1 λi . Dann i=1 λi = 1 und λ = 1 − λn+1 = ist wegen der Konvexität von f ! ! n+1 n X X λ i xi f λi xi = f λ · + (1 − λ)xn+1 λ i=1 i=1 ! n X λ i xi ≤λ·f + (1 − λ)f (xn+1 ) λ i=1 und weiter mit Induktionsvoraussetzung ≤λ· = n X λi i=1 n+1 X λ f (xi ) + λn+1 f (xn+1 ) λi f (xi ). i=1 P Korollar 21.7. Es seien λ1 , . . . , λn > 0 mit ni=1 λi = 1. Dann gilt für alle x1 , . . . , x n > 0 n n Y X xλi i ≤ λi xi . i=1 i=1 Insbesondere ist √ n x1 · . . . · xn ≤ n 1 X · xi n i=1 mit Gleichheit genau dann, wenn x1 = x2 = . . . = xn . Beweis. Da log konkav ist, ist − log konvex. Mit der Jensenschen Ungleichung folgt ! ! n n n Y X X λi log xi = λi · log(xi ) ≤ log λ i xi . i=1 i=1 i=1 139 21. Konvexität Nach Anwenden von exp folgt die Behauptung. x1 Definition 21.8. Für x = ... ∈ Cn und p ∈ R≥1 definieren wir die p-Norm xn durch kxkp := n X i=1 !1 p p |xi | . Satz 21.9 (Höldersche Ungleichung). Für w, z ∈ Cn und p, q > 1 mit p1 + 1q = 1 gilt n X i=1 |zi · wi | ≤ kwkp · kzkq . Otto Hölder (1859-1937) Korollar 21.10 (Cauchy-Schwarz-Ungleichung). Für w, z ∈ Cn gilt n X i=1 |zi · wi | ≤ kwk2 · kzk2 . Beweis von Satz 21.9. Setze ai := |wi |p , kwkp p bi := |zi |q . kzkq q Ohne Einschränkung seien w, z 6= 0. Dann gilt nach Definition n X i=1 sowie ai = n X bi = 1 i=1 1 1 |wi · zi | ai bi = ai p · bi q ≤ + , kwkp · kzkq p q wobei letztere Ungleichung aus Korollar 21.7 folgt. Zusammen ist n X i=1 |wi · zi | 1 1 ≤ + = 1. kwkp · kzkq p q 140 21. Konvexität Satz 21.11 (Minkowski-Ungleichung). Es sei p ∈ [1, ∞[ und x, y ∈ Cn . Dann gilt kx + ykp ≤ kxkp + kykp . Hermann Minkowski (1864-1909) Beweis. Ohne Einschränkung gelte p > 1, denn ansonsten ist die Aussage klar. Setze zi = |xi + yi |p−1 , q > 0 sei definiert durch p1 + 1q = 1. Dann ist q + p = pq, also p = q(p − 1). Mithin ziq = |xi + yi |p und kzkq = n X i=1 !1 n X q ziq = i=1 !1 q |xi + yi |p p = kx + ykpq . Außerdem ist |zi ||xi + yi | = |xi + yi |p und kx + ykpp = ≤ n X i=1 n X i=1 |xi + yi | · |zi | |xi | · |zi | + |yi | · |zi | ≤ (kxkp + kykp ) · kzkq p = (kxkp + kykp ) · kx + ykpq , wobei wir zunächst die Dreicksungleichung und dann die Höldersche Ungleichung ausgenutzt haben. Also ist mit p − pq = 1 p− pq kx + ykp = kx + ykp ≤ kxkp + kykp . Satz 21.12. Es seien f, g Riemann-integrierbar. a) Für p > 0 ist |f |p ist Riemann-integrierbar. b) f · g ist Riemann-integrierbar. Beweis. a) Ohne Einschränkung gilt |f | ≤ 1, da wir gegebenfalls für λ ∈ (0, 1) die Funktion f durch λf ersetzen Rkönnen. Sei ε0 > 0. Zu ε > 0 wähle b ϕ, ψ ∈ T [a, b] mit ϕ ≤ |f | ≤ ψ und a ψ − ϕ dx ≤ ε. Ohne Einschränkung gelte ϕ ≥ 0 und ψ ≤ 1. Dann ist ϕp ≤ |f |p ≤ ψ p . 141 21. Konvexität Rb Wir zeigen nun a ψ p (x) − ϕp (x) dx < ε0 , indem wir eine Fallunterscheidung nach p machen. Dabei definieren wir zunächst ε in Abhängigkeit von ε0 und wählen dazu dann ϕ, ψ wie oben. Fall 1. p ≥ 1. Setze ε := εp0 > 0 und wähle ϕ, ψ wie oben. Die Abbildung [0, 1] → R, x 7→ xp hat die Ableitung pxp−1 ≤ p. Zusammen mit dem Mittelwertsatz ist ψ p (x) − ϕp (x) ≤ p · (ψ(x) − ϕ(x)) und damit Z b ψ p (x) − ϕp (x) dx ≤ pε ≤ ε0 . a p k Fall 2. p ∈ ]0, 1[. Wähle k ∈ N mit q = 2k p > 1. Es gilt |f |p = 2 |f |q . Gemäß Fall 1 ist g = |f |q integrierbar. Per Induktionp reicht es nun zu zeigen, dass für jede integrierbare Funktion h(x) auch |h(x)| Riemann integrierbar ist. Mit anderen Worten, es gilt ohne Einschränkung der Allgemeinheit p = 21 . Setze ψ̃(x) = max{ψ(x), ε}. Es gilt dann Z a b ψ̃(t) − ϕ(t) dt ≤ ε(1 + b − a) q p ψ̃(x) − ϕ(x) = und ψ̃(x) − ϕ(x) q ≤ p ψ̃(x) + ϕ(x) √1 (ψ̃(x) ε − ϕ(x)). Damit ergibt sich Z b √ ψ̃ 1/2 (t) − ϕ1/2 (t) dt ≤ (b − a) ε(1 + b − a) a 2 ε0 (b−a)(1+(b−a)) und dies ist ≤ ε0 wenn wir ε := setzen. b) Da f und g Riemann-integrierbar sind, sind f ± g und damit nach a) auch 1 2 4 · (f ± g) Riemann-integrierbar. Daraus folgt, dass f ·g = 1 4 · (f + g)2 − 1 4 · (f − g)2 Riemann-integrierbar ist. Wir definieren für eine Riemann-integrierbare Funktion f : [a, b] → R und p ≥ 1 die p-Norm von f durch kf kp := Z a b p |f (x)| dx p1 . 142 22. Uneigentliche Integrale und die Gamma-Funktion Satz 21.13. Seien f, g : [a, b] → R integrierbar, p, q > 1 mit gilt: Rb a) a |f · g|(x) dx ≤ kf kp · kgkq . 1 p + 1 q = 1. Dann b) kf + gkp ≤ kf kp + kgkp . Beweis. Ganz ähnlich zum Beweis von Satz 21.11 folgt Teil b) aus a). Es reicht also a) zu zeigen. Sei ε > 0. Ohne Einschränkung gelte |f |, |g| ≤ 1. Wähle Treppenfunktionen ϕ1 , ϕ2 , ψ1 , ψ2 ∈ T [a, b] mit ϕ1 ≤ |f | ≤ ψ1 bzw. ϕ2 ≤ |g| ≤ ψ2 Rb sowie 0 ≤ ϕi ≤ ψi ≤ 1 und a (ψi − ϕi )(x) dx < ε. Dann ist Z b p ψip (x) dx kψi kp = a Z b Z b p p · (ψi − ϕi )(x) dx ϕi (x) dx + ≤ a a ≤ kϕi kpp + pε Es sei a = x0 < . . . < xk = b eine untergeordnete Unterteilung sowohl für ψ1 alsauch für ψ2 . Dann folgt aus der Definition des Integrals für Treppenfunktionen und der Hölderschen Ungleichung Z b Z b |f · g|(x) dx ≤ (ψ1 · ψ2 )(x) dx a = a k X l=1 ≤ 1 (xl − xl−1 ) p ψ1 k X l=1 (xl − xl +xl−1 2 !p1 p x +x xl−1 )ψ1 l 2 l−1 = kψ1 kp · kψ2 kq 1 1 ≤ kϕ1 kpp + pε p · kϕ2 kqq + qε q 1 1 ≤ kf kpp + pε p · kgkqq + qε q . 1 (xl − xl−1 ) q ψ2 xl +xl−1 2 k X (xl − xl−1 )ψ2 l=1 !1q xl +xl−1 q 2 Mit ε → 0 folgt die Behauptung. 22 Uneigentliche Integrale und die Gamma-Funktion Definition 22.1. a) Seien a ∈ R, b ∈ R∪{∞} mit a > b. Sei f : [a, b[ → R auf [a, β] ⊂ [a, b[ für jedes β ∈ [a, b[ integrierbar. Dann heißt f uneigentlich 143 22. Uneigentliche Integrale und die Gamma-Funktion (Riemann-) integrierbar auf [a, b[, falls der Grenzwert limβ→b existiert. Man setzt Z β Z b f (x) dx . f (x) dx := lim Rβ a f (x) dx β→b a a b) Mit einer kritischen unteren Grenze verfährt man analog. c) Seien a, b ∈ R ∪ {−∞, ∞}. Sei f : ]a, b[ → R auf [α, β] ⊂ ]a, b[ für jedes α, β ∈ ]a, b[ integrierbar. Dann heißt f uneigentlich (Riemann-) integrierbar, falls f| ]a,c[ und f|[c,b[ für ein c ∈ ]a, b[ uneigentlich integrierbar sind. Man setzt Z Z Z Z 1 R1 0 log x dx . Es ist ε→0 log x dx = (x · log x − x|1ε = (−1 − ε · log ε + ε) −→ −1. ε b) Berechne c a a a) Berechne f (x) dx . f (x) dx + f (x) dx := Beispiel. b c b R∞ 1 xk dx . Es ist für k ∈ R \ {−1} Z β xk dx = 1 1 k+1 β · xk+1 = 1 β k+1 −1 k+1 . und dies konvergiert Rfür β → ∞ genau dann, wenn k < −1 ist. Das ∞ uneigentliche Integral 1 xk dx konvergiert also für k < −1 und divergiert für k > −1. Für k = −1 ist Z β β x−1 dx = log x1 1 und dies divergiert. c) Ähnlich ist Z 0 konvergent für k > −1. 1 xk dx = lim ε→0 1 k+1 1 · xk+1 d) Die letzten beiden Punkte liefern zusammen, dass vergiert. ε R∞ 0 xk dx für alle k di- 144 22. Uneigentliche Integrale und die Gamma-Funktion Satz 22.2 (Integralvergleichskriterium). Sei f : P [1, ∞[ → R monoton fallend. R∞ Dann konvergiert 1 f (x) dx genau dann, wenn ∞ n=1 f (n) konvergiert. P 1 Bemerkung. Also konvergiert ∞ n=1 nk genau für k > 1. Beweis von Satz 22.2. Ohne Einschränkung gelte limx→∞ f (x) = 0. Für jedes n ∈ N ist Z n f (x) dx ≤ f (n − 1) f (n) ≤ n−1 und somit für beliebiges N ∈ N N X n=2 f (n) ≤ Z 1 N f (x) dx ≤ N −1 X f (n). n=1 R∞ Sei nun zunächst 1 f (x) dx konvergent. Dann ist nach obiger Überlegung für alle N ∈ N mit f ≥ 0 N X n=1 f (n) ≤ f (1) + Z ∞ f (x) dx 1 und dies liefertP absolute Konvergenz. Ist umgekehrt ∞ n=1 f (n) konvergent, dann ist nach obiger Überlegung Z 1 R f (x) dx ≤ ∞ X f (n), n=1 RR also ist 1 f (x) dx nach oben beschränkt und außerdem monoton wachsend in R, also konvergent für R → ∞. Definition 22.3. Für x > 0 ist die Gamma-Funktion definiert durch Z ∞ Γ(x) = tx−1 e−t dt. 0 Wir zeigen, dass dies wohldefiniert R ∞ist und beginnen mit dem uneigentlichen Integral 1 tx−1 e−t dt: Das Integral Z β tx−1 e−t dt 1 145 22. Uneigentliche Integrale und die Gamma-Funktion ist monoton wachsend in β. Wähle n ∈ N mit x − 1 ≤ n. Die Reihendarstellung von exp liefert e−t = e1t ≤ (n+2)! . Dann ist für alle β ≥ 1 tn+2 Z β 1 tx−1 · e−t dt ≤ Z β 1 tn e−t dt ≤ (n + 2)! Z β 1 1 dt ≤ (n + 2)!, t2 also existiert R 1 der Grenzwert für β → ∞. Wir betrachten nun das uneigentliche Integral 0 tx−1 e−t dt: Für ε > 0 ist Z 1 t x−1 −t e ε dt ≤ Z 1 t x−1 dt = ε 1 x 1 1 t ≤ x ε x und also existiert auch der Grenzwert für ε → 0. Dies zeigt die Wohldefiniertheit. Satz 22.4 (Charakterisierung der Gamma-Funktion, Bohr–Mollerup ). Die Gamma-Funktion ist die eindeutig bestimmte Funktion F : ]0, ∞[ → ]0, ∞[ ⊂ R mit folgenden Eigenschaften: a) Es gilt F (1) = 1 und F (x + 1) = x · F (x) für alle x > 0. b) F ist logarithmisch konvex, d.h. log F ist konvex. Harald Bohr (1887-1951) Beweis. Wir wollen zunächst einsehen, dass Γ den genannten Eigenschaften genügt. Offenbar ist Γ(1) = 1. Für x > 0 ist Γ(x + 1) = Z ∞ 0 = lim tx e−t dt Z ε&0 ε = 1 ε tx e−t dt 1 lim −tx e−t εε ε&0 +x· Z 1 ε tx−1 e−t dt ε = x · Γ(x). Dies zeigt, dass Γ die Eigenschaft a) erfüllt. Zum Nachweis von Eigenschaft b) seien x < y und λ ∈ ]0, 1[ . Schreibe λ = p1 , (1 − λ) = 1q . Dann ist mit der 146 22. Uneigentliche Integrale und die Gamma-Funktion Hölderschen Ungleichung Γ(λx + (1 − λ)y) = lim Z 1 ε ε &0 ε ≤ lim ε &0 = lim ε &0 Z t x−1 p 1 ε ε Z 1 ε |t − pt e x−1 p e t y−1 q −t p dt !1 p |p dt tx−1 e−t dt ε − qt e !λ · = Γ(x)λ · Γ(y)1−λ . · Z 1 ε ε Z 1 ε ε |t y−1 q − qt ·e ty−1 · e−t dt !1 q |q dt !1−λ Damit ist log(Γ(λx + (1 − λ)y)) ≤ λ · log(Γ(x)) + (1 − λ) · log(Γ(y)). Es bleibt nun die Eindeutigkeit zu zeigen. Sei dazu F eine Funktion mit den Eigenschaften a) und b). Insbesondere gilt F (n + 1) = n! für alle n ∈ N \ {0}. Seien nun x ∈ ]0, 1] und n ∈ N+ . Da log F konvex ist, gilt dann F (n + x) = F ((1 − x) · n + x · (n + 1)) ≤ F (n)1−x · F (n + 1)x = (n − 1)!1−x · (n − 1)!x · nx = (n − 1)! · nx . Außerdem folgt mithilfe der Konvexkombination n = und der Konvexität von log F 1 x+1 x · (n + x) + x+1 · (n − 1) log F (n + x) ≥ log F (n) + x · (log F (n) − log F (n − 1)), also x F (n) F (n − 1) = (n − 1)! · (n − 1)x . F (n + x) ≥ F (n) · Zusammen ist nun (n − 1)! · (n − 1)x ≤ F (n + x) ≤ (n − 1)! · nx für x ∈]0, 1]. (22.1) 22. Uneigentliche Integrale und die Gamma-Funktion 147 Aufgrund von Eigenschaft a) gilt F (n + x) = n−1 Y ! x+i k=0 · F (x) und damit (n − 1)! · (n − 1)x (n − 1)! · nx ≤ F (x) ≤ Qn−1 . Qn−1 i=0 (x + i) i=0 (x + i) Da dies für alle n gilt und beide Seiten der Abschätzung denselben Grenzwert haben, ist F (x) eindeutig bestimmt für jedes x ∈ ]0, 1]. Da wir jedes x > 1 als x = n + x0 mit n ∈ N und x0 ∈]0, 1] schreiben können, folgt wegen der Funktionalgleichung F (y + 1) = yF (y) auch die mit Eindeutigkeit von F (x) für x > 1. Korollar 22.5. Für alle x > 0 gilt n! · nx . Γ(x) = lim Qn n→∞ i=0 (x + i) Beweis. Der Beweis von Satz 22.4 liefert die Behauptung für x ∈ ]0, 1]. Ist die Behauptung für x bereits bewiesen so folgt sie für x + 1 aus der Gleichungkette Γ(x + 1) = x · Γ(x) zusammen mit limn→∞ für alle x > 0. Korollar 22.6. b) R∞ −∞ e −x2 n! · nx = lim x · Qn n→∞ i=0 (x + i) n! · nx = lim Qn−1 n→∞ i=0 (x + 1 + i) n! · nx+1 n+1+x = lim Qn · n→∞ ((x + 1) + i) n i=0 n+1+x n a) Γ( 12 ) = dx = √ π. = 1. Durch Induktion folgt also die Behauptung √ π. 148 22. Uneigentliche Integrale und die Gamma-Funktion Beweis. a) Nach Korollar 22.5 und den Grenzwertsätzen ist Γ 1 2 2 (n!)2 · n 2n (n!)2 = lim Qn 1 = lim · Q n 1 1 2 n→∞ n→∞ (n + 1 ) i=0 ( 2 + i) i=1 (i + 2 )(i − 2 ) 2 n Y i2 = 2 lim n→∞ i2 − 14 i=1 =2· ∞ Y i=1 4i2 = π. 4i2 − 1 wobei wir zuletzt die Kenntnis des Wallis’schen Produktes genutzt haben. b) Es ist nach Definition und mit der Substitution t = x2 , d.h. dx = Z ∞ Z ∞ Z ∞ 1 −x2 −x2 e dx = 2 · e dx = t− 2 e−t dt = Γ 12 . −∞ 0 1 1√ 2 t dt, 0 Korollar 22.7 (Verdoppelungsformel). Für alle x > 0 gilt 1 2x−1 Γ(x) · Γ x + 2 √ Γ(2x) = 2 · . π Beweis. Definiere x−1 F (x) := 2 · Γ x 2 ·Γ √ π x+1 2 . Es ist F (x) = Γ(x) zu zeigen. Dazu weisen wir nach, dass F den Eigenschaften aus Satz 22.4 genügt. Offenbar ist F (1) = 1. Nach Definition gilt für alle x > 0 x+1 · Γ x2 + 1 Γ x Γ 2 √ F (x + 1) = 2 · = 2x · π x+1 2 · x ·Γ √2 π x 2 = x · F (x). Schließlich ist F (x) > 0 für alle x > 0 und es gilt x x+1 1 log F (x) = (x − 1) · log 2 + log Γ + log Γ − log π. 2 2 2 Da die ersten drei Summanden konvex in x und der letzte konstant ist, ist log F (x) konvex in x. 149 22. Uneigentliche Integrale und die Gamma-Funktion Satz 22.8 (Stirlingsche Formel). √ 2πn · n n e 1 e 12(n+1) ≤ n! ≤ √ 2πn · n n e 1 · e 12(n−1) ; n! ' √ 2πn · Beispiel: 4, 023872 · 102567 ≤ 1000! ≤ 4, 023873 · 102567 n n e . Beweis. Für k ∈ N \ {0} ist nach der Trapezregel Z k+1 1 log k + log(k + 1) + rk 2 log x dx = k 1 mit rk = 12·ξ 2 wobei ξk ∈ [k, k + 1]. Insbesondere rk ≥ 0 und k konvergent. Z n n · log n − n + 1 = log x dx P∞ k=1 rk ist 1 = n X n−1 X log i + i=1 n X log i = i=1 1 n+ 2 k=1 · log n − n + 1 − | rk − ∞ X k=1 {z =:γ log n 2 rk + } ∞ X rk k=n Anwenden von exp auf beiden Seiten der Gleichung liefert n! = √ P∞ n · nn · e−n · eγ · e k=n rk Wegen ∞ X ∞ X k=n 1 ≤ 12k 2 Z ∞ 1 1 dx = und 2 12x 12(n − 1) n−1 k=n k=n Z ∞ ∞ ∞ X X 1 1 1 rk ≥ ≥ dx = 2 12(k + 1)2 12x 12(n + 1) n+1 rk ≤ k=n √ bleibt lediglich zu zeigen, dass eγ = 2π gilt. Ist an eine Folge mit limn→∞ an = 2 n . Wenden wir dies a 6= 0 so folgt aus den Grenzwertwertsätzen a = limn→∞ aa2n 150 22. Uneigentliche Integrale und die Gamma-Funktion auf limn→∞ √ n! n n·( n e) = eγ an so ergibt sich (n!)2 γ e = lim n( n e) 2n n→∞ √ (2n)! 2n 2n·( 2n e ) √ (n!)2 2n · 22n = lim n→∞ (2n)!n 1 = lim Γ(n + 1)2 · 22n+ 2 √1n = lim √ 2nΓ(2n) n→∞ 1 π n2 Γ(n)2 · 22n+ 2 · √1 n 2n · 22n−1 · Γ(n) · Γ n + √ √ n · Γ(n) √ = 2π, = lim 2π n→∞ Γ n + 21 n→∞ 1 2 wobei wir in der vierten Gleichung√die Verdoppelungsformel angewandt haben √ 1 und für die letzte Gleichung Γ(n) · n − 1 ≤ Γ n + 2 ≤ Γ(n) · n (vgl. (22.1)) genutzt haben.