Analysis I Wintersemester 2001/2002 Prof. Dr. E. Kuwert Mathematisches Institut Universität Freiburg Inhaltsverzeichnis 1 Reelle Zahlen, Folgen und Grenzwerte 1 Die natürlichen Zahlen N = {1, 2, 3, . . .} 2 Körperaxiome und Anordnung von R . . 3 Grenzwerte von Folgen . . . . . . . . . . 4 Vollständigkeit der reellen Zahlen . . . . 5 Teilmengen von R und von Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 4 8 14 22 2 Funktionen und Stetigkeit 1 Polynome und komplexe Zahlen . . . . . . 2 Stetige Funktionen . . . . . . . . . . . . . 3 Zwischenwertsatz und Umkehrfunktionen 4 Existenz von Extremwerten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 35 42 48 54 3 Differentialrechnung für Funktionen einer 1 Die Ableitung: Definition und Regeln . . 2 Mittelwertsatz und Anwendungen . . . . . 3 Die Winkelfunktionen . . . . . . . . . . . Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 57 63 69 4 Integralrechnung 1 Das Riemannsche Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Ableitung und Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 77 86 5 Approximation von Funktionen durch Reihen 95 1 Reihen von reellen und komplexen Zahlen . . . . . . . . . . . . . . . . . . . . 96 2 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 i Kapitel 1 Reelle Zahlen, Folgen und Grenzwerte Die reellen Zahlen R bilden das Fundament, aber nicht den eigentlichen Gegenstand der Analysis. Ihre Konstruktion aus den rationalen Zahlen Q={ p : p, q ∈ Z, q 6= 0} q ist zuerst von R. Dedekind (1872) und G. Cantor (1883) durchgeführt worden. Die Differential- und Integralrechnung geht aber natürlich auf I. Newton und G. Leibniz (ca. 1680) zurück. Es ist also 200 Jahre lang mit großem Erfolg Analysis betrieben worden, ohne dass eine Definition der reellen Zahlen vorlag! Tatsächlich kommt es nur auf einige Grundeigenschaften der reellen Zahlen an, die wir hier als Axiome formulieren werden. Sie zerfallen in drei Gruppen: 1. Die Körperaxiome (K) 2. Die Anordnungsaxiome (A) 3. Das Vollständigkeitsaxiom (V) Es ist die Vollständigkeit, die die reellen Zahlen von den rationalen Zahlen unterscheidet. Sie wird es erlauben, Zahlen und später Funktionen durch Bildung von Grenzwerten zu erklären. Der Grenzwertbegriff ist die zentrale Idee der Analysis. Im folgenden nehmen wir an, dass die reellen Zahlen und die Folge der Zahlbereichserweiterungen N⊂Z⊂Q⊂R schon zur Verfügung stehen. Das Konstruktionsverfahren von Cantor werden wir bei Gelegenheit mal besprechen. 1 Die natürlichen Zahlen N = {1, 2, 3, . . .} Diese und nur diese sind nach L. Kronecker von Gott gemacht und sind uns allen seit der frühen Kindheit vertraut. Sie fangen bei 1 ∈ N an und jedes n ∈ N hat eine Nachfolgerin n + 1 1 ∈ N. Tatsächlich sind die natürlichen Zahlen durch diese beiden Tatsachen charakterisiert, und zwar gilt das Induktionsprinzip: Hat eine Menge M ⊂ N die beiden Eigenschaften (i) 1∈M (ii) n ∈ M ⇒ n + 1 ∈ M, und so ist schon M = N. Konsequenz dieses Prinzips ist das sehr wichtige Beweisverfahren der vollständigen Induktion: Gegeben sei eine Folge A1 , A2 , A3 , . . . von Aussagen. Es möge gelten: (i) A1 ist wahr. (ii) An ist wahr ⇒ An+1 ist wahr. Dann sind alle Aussagen An wahr. Beispiel 1.1 1 + 2 + . . . + n = Pn k=1 k = n(n+1) . 2 Beweis: 1(1 + 1) ⇒ A1 ist wahr 2 n+1 n X X k = k + (n + 1) 1 = k=1 k=1 = = n(n + 1) + (n + 1) wegen An 2 (n + 1)((n + 1) + 1) . 2 Also gilt An ⇒ An+1 und die Aussage ist bewiesen. Satz 1.1 Die Anzahl der möglichen Anordnungen von n ≥ 1 verschiedenen Dingen ist 1 · 2 · . . . · (n − 1) · n =: n! (1.1) Beweis: Wegen 1! = 1 ist A1 wahr. Seien nun n + 1 Dinge gegeben. Indem wir durchnumerieren, können wir annehmen, dass dies die Zahlen 1, 2, . . . , n + 1 sind. Für festes k ∈ {1, 2, . . . , n + 1} betrachte die Menge Mk der Anordnungen, bei denen n + 1 an der Stelle k steht. Etwa für n = 3 und k = 2: M2 = {(1, 4, 2, 3), (1, 4, 3, 2), (2, 4, 1, 3), (2, 4, 3, 1), (3, 4, 1, 2), (3, 4, 2, 1)} Nach Induktion hat Mk genau k! Elemente. Aber jede der Anordnungen liegt in einer und nur in einer der Mengen Mk , folglich ergeben sich (n + 1)n! = (n + 1)! Anordnungen. Definition 1.1 (Binomialkoeffizienten) Für α ∈ R und k ∈ N0 setzen wir k α α · (α − 1) · . . . · (α − k + 1) Y α − j + 1 = = , k 1 · 2 · ... · k j j=1 wobei per Definition Q0 j=1 . . . = 1 (leeres Produkt), und folglich 2 α 0 = 1. Die Binomialkoeffizienten treten sehr oft bei Abzählungsfragen auf, besonders beim Binomischen Lehrsatz, siehe unten. Satz 1.2 Die Anzahl der k-elementigen Teilmengen einer Menge mit n Elementen, wobei n ∈ N und k ∈ {1, 2, . . . , n}, ist gleich nk . Beweis: Durch vollständige Induktion über n, wobei die Behauptung jeweils für alle k gezeigt wird. Für n = 1 ist alles klar. Sei nun die Menge {1, 2, . . . , n + 1} gegeben. Für k = 1 und k = n + 1 ist die Sache offensichtlich, also sei 2 ≤ k ≤ n. Die k-elementigen Teilmengen zerfallen in zwei disjunkte Teilmengen: Typ A: enthält die Nummer n + 1 Typ B: enthält die Nummer n + 1 nicht. Bei Typ A können wir noch k − 1 Zahlen aus {1, 2, . . . , n} wählen, während wir für Typ B alle k Elemente aus {1, 2, . . . , n} aussuchen müssen. Damit erhalten wir für die Gesamtzahl n n n(n − 1) · . . . · (n − k + 2) n(n − 1) · . . . · (n − k + 1) + + = 1 · 2 · . . . · (k − 1) 1 · 2 · ... · k k−1 k (k + n − k + 1)n(n − 1) · . . . · (n − k + 2) = 1 · 2 · ... · k n+1 = , k was zu zeigen war. Die im Induktionsschluss auftretende Formel gilt allgemein: α α α+1 + = für α ∈ R, k ∈ N. k−1 k k (1.2) Die Formel erlaubt die rekursive Berechnung der Binomialkoeffizienten ecksschema von B. Pascal (1623-1662)1 : n=0 n=1 n=2 n=3 n=4 n=5 n=6 n k nach dem Drei- 1 1 1 1 1 1 1 2 3 4 5 6 1 1 3 6 10 15 1 4 10 20 1 5 15 1 6 1 Am Diagramm offensichtlich ist die Symmetrieeigenschaft n n = für n ∈ N0 , k ∈ {0, 1, . . . , n}. k n−k 1 Das Schema findet sich schon bei Chu Shih-Chieh: Der Spiegel der vier Elemente, 1303 3 (1.3) Sie ergibt sich aus der kombinatorischen Interpretation nach Beispiel 3: es ist äquivalent, k Elemente auszuwählen oder n − k Elemente (nicht) auszuwählen. Alternativ folgt das auch aus der Darstellung n n! für n ∈ N0 , k ∈ {0, 1, . . . , n}. = k k! (n − k)! (1.4) Eine zum Induktionsprinzip äquivalente Eigenschaft der natürlichen Zahlen lautet Satz 1.3 (Prinzip der kleinsten natürlichen Zahl) Jede nichtleere Menge M ⊂ N besitzt ein kleinstes Element. Beweis: (durch Widerspruch) Angenommen, es gibt kein kleinstes Element in M ⊂ N. Wie zeigen induktiv {1, 2, . . . , n} ∩ M = ∅. Für n = 1 ist das richtig, denn sonst wäre 1 ∈ M das kleinste Element. Ist die Behauptung für n ∈ N gezeigt, so gilt sie auch für n + 1, denn sonst wäre n + 1 kleinstes Element. Also gilt die Behauptung für alle n ∈ N, und M ist die leere Menge. Umgekehrt ergibt sich das Induktionsprinzip aus dem Prinzip der kleinsten natürlichen Zahl: Sei nämlich M ⊂ N mit 1 ∈ M und der Nachfolgereigenschaft n ∈ M ⇒ n + 1 ∈ M . Wir zeigen, dass M̂ := N\M leer ist. Andernfalls gibt es eine kleinste Zahl m ∈ M̂ . Nach Voraussetzung ist nicht m = 1. Dann ist aber m − 1 ∈ M und nach Voraussetzung auch (m − 1) + 1 = m ∈ M , ein Widerspruch. 2 Körperaxiome und Anordnung von R Die Körperaxiome (K) betreffen die algebraische Struktur von R mit den Rechenoperationen Addition “+” und Multiplikation “·”. Sie lauten wie folgt: + • Assoziativgesetz: Kommutativgesetz: Neutrales Element: (a + b) + c = a + (b + c) (a · b) · c = a · (b · c) a+b=b+a a·b=b·a Es gibt Zahlen 0 ∈ R und 1 ∈ R mit 1 6= 0, so dass für alle a ∈ R gilt: a·1=a a+0=a Inverses Element: Zu jedem a ∈ R gibt es Lösungen x, y ∈ R der Gleichungen a · y = 0 falls a 6= 0 a+x=0 Distributivgesetz: a · (b + c) = a · b + a · c. Es gibt tatsächlich viele verschiedene Zahlbereiche, in denen diese Gesetze gelten (Körper), zum Beispiel sind die Regeln auch für die rationalen Zahlen erfüllt. Selbst die Menge {0, 1} ist mit der Regel 1 + 1 = 0 (und sonst den üblichen Verknüpfungen) ein Körper. Die folgenden beiden Sätze benutzen nur die obigen Axiome – sie gelten also in jedem Körper. 4 Satz 2.1 (Binomische Formel) Für a, b ∈ R und n ∈ N gilt (a + b)n = n X n k=0 k an−k bk . (2.1) Beweis: (a + b)n = (a + b) · (a + b) · . . . · (a + b) . | {z } n Faktoren Beim Ausmultiplizieren (Distributivgesetz) erhalten wir Terme vom Typ a · b · b · . . . · a, die jeweils aus n Faktoren bestehen. Mit dem Kommutativgesetz können wir umordnen zu Termen der Form an−k bk mit 0 ≤ k ≤ n; es bleibt zu bestimmen, wie oft ein solcher Term vorkommt. Ich erhalte bk dann und nur dann, wenn ich aus den n Klammern k Stück auswähle, wo ich b als Faktor nehme. In den andern Klammern muss ich dann a nehmen. Nach Satz 1.2 kommt der Term an−k bk also genau nk mal vor, was zu zeigen war. Alternativ folgt der Satz auch durch vollständige Induktion über n, und zwar gilt der Induktionsanfang n = 1 wegen 1 1 0 1 0 1 (a + b) = a b + a b . 0 1 1 n=1: Der Induktionsschluss ergibt sich wie folgt: (a + b)n+1 = (a + b) n X n k k=0 = n X n k=0 k an−k bk (Induktionsannahme) n−k+1 k a b + n X n k=0 an−k bk+1 n X n = a + a b + an−(k−1) bk + bn+1 k k−1 k=1 k=1 n X n n = an+1 + + an+1−k bk + bn+1 k k−1 k=1 n+1 X n + 1 = an+1−k bk nach Gleichung (1.2). k n+1 n X n k n+1−k k k=0 Ebenso wichtig ist die Formel für die Satz 2.2 (Geometrische Summe) Für q ∈ R, q 6= 1 gilt n X 1 − q n+1 . 1−q qk = k=0 5 (2.2) Beweis: . Wir berechnen mit dem ,,Teleskopsummen–Trick” 1−q n+1 = n X k (q − q k+1 )= k=0 n X k (1 − q) q = (1 − q) k=0 n X qk . k=0 Die Behauptung folgt nach Division durch 1 − q. Wir stellen uns die reellen Zahlen als Punkte auf einer Geraden vor, die mit einer Richtung versehen ist. Es ist dann ein Größenvergleich für je zwei Zahlen a, b ∈ R möglich: b ist größer als a, wenn b rechts von a liegt. Der Größenvergleich beruht auf folgenden Gesetzen, den Anordnungsaxiomen (A): A1 Für jedes a ∈ R gilt genau eine der Relationen a > 0, a = 0, −a > 0. A2 Aus a > 0, b > 0 folgt a + b > 0 und a · b > 0. A3 Archimedisches Axiom: zu jeder Zahl ε ∈ R, ε > 0, existiert eine natürliche Zahl n ∈ N mit 1/n < ε. Überlegen Sie, dass alle diese Regeln auch für die rationalen Zahlen Q gelten. Für −a > 0 schreiben wir auch a < 0 und setzen a > b ⇔ a − b > 0. Aus A1 und A2 folgen eine Reihe von Regeln, die in den Anwesenheitsübungen gezeigt werden sollen: 1. Für a, b ∈ R gilt genau eine der Relationen a > b, a = b oder a < b. 2. Aus a > b, b > c folgt a > c (Transitivität). 3. Aus a > b folgt 1/a a+c a·c a·c < > > < 1/b, falls b > 0 b + c immer b · c, wenn c > 0 b · c, wenn c < 0 4. Für a 6= 0 ist a2 > 0. 5. Aus a > b und c > d folgt a + c > b + d, immer a · c > b · d, falls b, d > 0 6. Für b ∈ N gilt n > 0. Definition 2.1 (Betrag einer reellen Zahl) Der Betrag von a ∈ R ist a falls a ≥ 0 |a| = −a falls a < 0. (2.3) Der Betrag von a ist der Abstand von a zu Null. Es gelten folgende Regeln, die durch Fallunterscheideung bewiesen werden: |a + b| ≤ |a| + |b| (Dreiecksungleichung) ||a| − |b|| ≤ |a − b| |a · b| = |a| · |b| a ≤ |a|. In der Analysis spielen Ungleichungen bzw. Abschätzungen eine sehr große Rolle. 6 Satz 2.3 (Bernoullische Ungleichung) Für x ∈ R, x ≥ −1 und n ∈ N gilt (1 + x)n ≥ 1 + nx. (2.4) Beweis: Durch Induktion über n ∈ N. Für n = 1 gilt Gleichheit, und wegen 1 + x ≥ 0 erhalten wir (1 + x)n+1 = (1 + x)(1 + x)n ≥ (1 + x)(1 + nx) nach Induktionsannahme = 1 + (n + 1)x + nx2 ≥ 1 + (n + 1)x. Bis jetzt haben wir vom Archimedischen Axiom, das oft auch nach Eudoxos benannt wird, keinen Gebrauch gemacht. Wenn wir die rationalen Zahlen Q = {m/n : m ∈ Z, n ∈ N} als Wegmarken auf der Zahlengeraden auffassen, so werden wir jetzt als Folge des Axioms A3 sehen, dass es in jedem noch so kleinen Abschnitt rationale Zahlen gibt. Satz 2.4 (Q ist dicht in R) Zu je zwei reellen Zahlen a, b ∈ R mit a < b gibt es eine rationale Zahl q ∈ Q mit a < q < b. Beweis: Wir können b > 0 annehmen, denn sonst gehen wir zu a0 = −b, b0 = −a über. Ausserdem ist o.B.d.A. a ≥ 0, da wir andernfalls einfach q = 0 setzen. Nach A3 existiert ein n ∈ N mit 1/n < b − a. Betrachte nun die Menge M = {k ∈ N : k/n > a} ⊂ N. M ist nichtleer: falls a = 0 so ist zum Beispiel 1 ∈ M , andernfalls gibt es nach A3 ein k ∈ N mit 1/k < 1/na bzw. k/n > a. Sei m ∈ M das kleinste Element nach Satz 1.3. Dann ist einerseits m/n > a und andererseits (m − 1)/n ≤ a, also m m−1 1 = + < a + (b − a) = b. n n n Die Zahl q = m/n leistet somit das Verlangte. Satz 2.5 (Irrationalität von √ 2) Die Gleichung x2 = 2 ist in Q nicht lösbar. Beweis: (durch Widerspruch) Angenommen, es sei x2 = 2 mit x = p/q und p, q ∈ N. Nach Kürzen des Bruchs können wir annehmen, dass p und q keine gemeinsamen Teiler haben, das heißt ihr größter gemeinsamer Teiler ist (p, q) = 1. Nun ist aber p2 = 2q 2 ⇒ p2 gerade ⇒ p gerade ⇒ p = 2p1 mit p1 ∈ N. Daraus folgt weiter 2q 2 = 4p21 ⇒ q 2 gerade ⇒ q gerade . Also ist (p, q) ≥ 2, ein wunderbarer Widerspruch. 7 3 Grenzwerte von Folgen Wir kommen nun zu dem für die Analysis zentralen Begriff des Grenzwerts. Die Möglichkeit der Bildung von Grenzwerten ist eine Idealisierung, die uns die Konstruktion neuer Größen erlauben wird, zum Beipiel: Tangente, Länge einer Kurve, Volumen der Kugel, Momentangeschwindigkeit, Arbeit längs eines Wegs etc. Definition 3.1 Eine Folge reeller Zahlen ist eine Abbildung N −→ R, n 7−→ an . Die Zahl an heißt das n-te Glied der Folge, die Folge insgesamt wird mit (an )n∈N bzw. kurz mit (an ) bezeichnet. Oft wird die Folge durch das Bildungsgesetz angegeben oder durch Aufzählen der ersten Folgenglieder definiert. Zum Beispiel ist die Folge der Quadratzahlen gegeben durch an = n2 , bzw. alternativ aufzählend an = 1, 4, 9, 16, . . .. Definition 3.2 (Konvergenz von Folgen) Die Folge (an )n∈N konvergiert mit n → ∞ gegen a ∈ R, falls gilt: Zu jedem ε > 0 gibt es ein N ∈ R, so dass |an − a| < ε für alle n > N. Die Zahl a heißt dann Grenzwert der Folge (an )n∈N für n → ∞, und wir schreiben kurz limn→∞ an = a oder an → a für n → ∞. Eine Folge (an )n∈N heißt konvergent, wenn es ein a ∈ R gibt, das Grenzwert der Folge ist; andernfalls heißt die Folge divergent. Mit den Symbolen ∀ ( = für alle) und ∃ ( = es gibt) lässt sich die Definition auch wie folgt fassen (Quantorenschreibweise): ∀ε > 0 ∃N ∈ R ∀n > N : |an − a| < ε. Je kleiner die geforderte Maximalabweichung vom Grenzwert ε > 0, desto größer muss im allgemeinen die Zahl N in der Definition des Grenzwerts gewählt werden, sie hängt also von ε ab. Tut es die Zahl N für ein gegebenes ε > 0, so tut es natürlich auch jedes größere N 0 ≥ N , d.h. N darf stets vergrößert werden. Dies ist nützlich, zum Beispiel wenn wir gleichzeitig zwei Folgen betrachten. Beispiel 3.1 (Konstante Folge) Sei an = a für alle n ∈ N. Dann ist limn→∞ an = a. Beweis: Für jedes ε > 0 gilt |an − a| = 0 < ε für alle n > 0, also können wir stets N = 0 wählen. Beispiel 3.2 (Harmonische Folge) Die Folge an = Beweis: Zu ε > 0 wählen wir N = 1 ε 1 n konvergiert gegen a = 0. ∈ R. Es folgt für n > N |an − 0| = 1 1 < = ε. n N 8 Beispiel 3.3 (Geometrische Folge) Es gilt lim q n = 0 für alle q ∈ R mit − 1 < q < 1. n→∞ 1 Beweis: Wir können q 6= 0 annehmen. Nach Voraussetzung ist |q| > 1, also gilt für ein x > 0. Wir erhalten dann 1 |q n − 0| = |q|n = (1 + x)n 1 ≤ (Bernoulli-Ungleichung) 1 + nx 1 ≤ nx < ε, falls n > 1/εx. 1 |q| =1+x Wir können also N = 1/εx wählen. Beispiel 3.4 Die Folge an = (−1)n , also an = −1, 1, −1, . . . ist nicht konvergent. Beweis: (durch Widerspruch) Angenommen, es wäre limn→∞ an = a für ein a ∈ R. Dann gibt es zu ε = 1 ein N ∈ R mit |an − a| < 1 für n > N . Es folgt dann für n > N 2 = |an − an+1 | = |an − a + a − an+1 | ≤ |an − a| + |a − an+1 | (Dreiecksungleichung) < 1 + 1, ein Widerspruch. Definition 3.3 (ε-Umgebung) Die ε-Umgebung von a ∈ R ist die Menge Uε (a) = {b ∈ R : |b − a| < ε} = {b ∈ R : a − ε < b < a + ε} ⊂ R. Eine Folge (an )n∈N konvergiert genau dann gegen a ∈ R, wenn die Folgenglieder ab einer gewissen Nummer in der ε-Umgebung von a liegen, egal wie klein ε > 0 gewählt ist. Satz 3.1 (Eindeutigkeit des Grenzwerts) Falls die Folge (an )n∈N konvergent ist, so ist ihr Grenzwert eindeutig bestimmt. Beweis: Wir beginnen mit einer Vorüberlegung, und zwar behaupten wir 1 0 < ε ≤ |a − a0 | ⇒ Uε (a) ∩ Uε (a0 ) = ∅. 2 0 Denn ist x ∈ Uε (a) ∩ Uε (a ), so folgt mit der Dreiecksungleichung (3.1) |a − a0 | = |a − x + x − a0 | ≤ |x − a| + |x − a0 | < 2ε. Seien nun a, a0 ∈ R Grenzwerte der Folge (an )n∈N . Zu jedem ε > 0 gibt es dann N, N 0 ∈ R mit an ∈ Uε (a) für n > N , sowie an ∈ Uε (a0 ) für n > N 0 . Wäre a 6= a0 , so wählen wir ε = 21 |a − a0 | > 0 und erhalten für n > max(N, N 0 ) an ∈ Uε (a) ∩ Uε (a0 ) = ∅, ein Widerspruch. Unser nächstes Ziel ist es, einige Rechenregeln für Grenzwerte zu erarbeiten. Wir beginnen mit der 9 Definition 3.4 (Beschränktheit von Folgen) Eine Folge (an )n∈N heißt a) nach oben (bzw. nach unten) beschränkt, wenn es ein K ∈ R gibt mit an ≤ K (bzw. an ≥ K) für alle n ∈ N. b) beschränkt, wenn sie nach oben und nach unten beschränkt ist. Beispiel 3.5 Die Folge an = n ist nach unten beschränkt, denn es ist zum Beispiel an ≥ 0 für alle n. Sie ist aber nicht nach oben beschränkt: angenommen, es gibt ein K ∈ R mit an ≤ K für alle n. Dann ist K ≥ a1 = 1 und K1 ≤ a1n = n1 für alle n, also nach Archimedes 1 K = 0, ein Widerspruch. Satz 3.2 (konvergent ⇒ beschränkt) Jede konvergente Folge ist beschänkt. Beweis: Sei limn→∞ an = a. Wähle zu ε = 1 ein N , o.B.d.A. N ∈ N, mit |an − a| < 1 für n > N . Es gilt dann n>N ⇒ |an | = |an − a + a| ≤ |an − a| + |a| < 1 + |a| n≤N ⇒ |an | ≤ max(|a1 |, . . . , |aN |). Wir haben also |an | ≤ K für alle n, wobei K = max(|a1 |, . . . , |aN |, 1 + |a|). Satz 3.3 (Rechenregeln für Grenzwerte) Es gelte an → a, bn → b mit n → ∞. a) Für alle λ, µ ∈ R ist (λan + µbn )n∈N konvergent mit Grenzwert limn→∞ (λan + µbn ) = λa + µb. b) Die Folge (an · bn )n∈N ist konvergent mit Grenzwert limn→∞ (an · bn ) = a · b. c) Falls b 6= 0, so gibt es ein N0 ∈ R mit bn 6= 0 für n > N0 und die Folge (an /bn )n>N0 ist konvergent mit Grenzwert limn→∞ an /bn = a/b. Beweis: Wir beginnen mit dem Beweis von b). Nach Satz 3.2 gibt es ein K > 0 mit |an | ≤ K für alle n ∈ N, und außerdem mit |b| ≤ K. Dann gilt |an bn − ab| = |an bn − an b + an b − ab| ≤ |an | · |bn − b| + |an − a| · |b| ≤ K(|an − a| + |bn − b|). ε Zu ε > 0 gibt es nun ein N ∈ N mit |an − a| < 2K sowie |bn − a| < für n > N ε ε |an bn − ab| < + = ε. 2K 2K ε 2K für n > N . Also folgt Für a) reicht es wegen b), den Fall λ = µ = 1 zu betrachten. Zu ε > 0 gibt es ein N ∈ R mit |an − a| < 2ε und |bn − b| < 2ε für n > N . Es folgt für diese n |(an + bn ) − (a + b)| = |(an − a) + (bn − b)| ≤ |an − a| + |bn − b| ε ε < + = ε. 2 2 10 Für c) können wir uns auf den Fall an = b = 1 beschränken, denn sonst schreiben wir an an 1 bn = · 0 mit b0n = . bn b bn b Es gibt nun ein N0 ∈ R mit |bn − 1| ≤ 1 2 für n > N0 , also |bn | = |1 − (1 − bn )| ≥ 1 − |1 − bn | ≥ 1 > 0. 2 Damit ist die erste Aussage gezeigt. Zu ε > 0 wähle weiter N ≥ N0 mit |1 − bn | < ε/2 für n > N , und somit 1 |1 − bn | ε < 2 · = ε. | − 1| = bn bn 2 Bemerkung: Die Menge der reellen Zahlenfolgen ist ein R-Vektorrraum mit den Verknüpfungen λ(an )n∈N + µ(bn )n∈N = (λan + µbn )n∈N . Wir haben dann die Untervektorräume Nullfolgen: limn→∞ an = 0; ⊂ Konvergente Folgen: limn→∞ an existiert; ⊂ Beschränkte Folgen: es gibt ein K > 0 mit |an | ≤ K für alle n; ⊂ Allgemeine Folgen (an )n∈N Beispiel 3.6 3 − n4 + n73 3n3 − 4n2 + 7 3 = lim = . 5 n→∞ n→∞ 2n3 + 5n 2 2 + n2 lim Beispiel 3.7 (Geometrische Reihe) Für −1 < q < 1 gilt ∞ X k q := lim n→∞ k=0 Beweis: Die betrachtete Folge ist an = trische Summe gilt n X qk = k=0 Pn k=0 q k. 1 . 1−q (3.2) Laut Formel (2.2) für die endliche geome- 1 − q n+1 1 = , n→∞ 1 − q 1−q lim an = lim n→∞ wobei Beispiel 3.3) und Regel a) aus Satz 3.3 benutzt wurden. Beispiel 3.8 (Potenzsummen) Seien n ∈ N, , p ∈ N0 . Für die Summen S(n, p) = gilt: 1 lim n−(p+1) S(n, p) = . n→∞ p+1 11 Pn p i=1 i (3.3) Beweis: Wir berechnen zunächst mit dem Teleskop-Summen-Trick eine Rekursionsformel für die S(n, p): p+1 (n + 1) −1 = n X [(i + 1)p+1 − ip+1 ] i=1 = = = p n X X p+1 ik (Binomische Formel) p+1 k ik (Vertauschung der Summen) i=1 k=0 p X k=0 p X k=0 Wegen p+1 p k X n i=1 p+1 S(n, k). k = p + 1 folgt für p ≥ 1 die Rekursionsformel 1 S(n, p) = p+1 (n + 1)p+1 − 1 − p−1 X p+1 k=0 k ! S(n, k) . (3.4) Jetzt zeigen wir (3.3) durch Induktion über p ∈ N0 . Der Fall p = 0 ist offensichtlich. Sei (3.3) schon für 1, 2, . . . , p − 1 gezeigt, wobei p ≥ 1. Dann folgt für k ≤ p − 1 lim n−(p+1) S(n, k) = lim nk−p n−(k+1) S(n, k) = 0. n→∞ n→∞ Aus (3.4) folgt dann lim n−(p+1) S(n, p) = n→∞ 1 1 1 lim (1 + )p+1 = . p + 1 n→∞ n p+1 Satz 3.4 (Grenzwerte und Ungleichungen) Sei limn→∞ an = a und limn→∞ bn = b. Dann gelten folgende Aussagen: a) an ≤ bn für alle n ⇒ b) c ≤ an ≤ d für alle n a ≤ b. ⇒ c ≤ a ≤ d. c) Falls an ≤ cn ≤ bn und a = b, so konvergiert auch die Folge (cn ) gegen a = b. Beweis: Zu jedem ε > 0 gibt es ein N ∈ R mit a − ε < an und bn < b + ε für n > N. Aus der Voraussetzung in a) folgt dann a − ε < b + ε für jedes ε > 0, also a ≤ b. Die erste Voraussetzung in c) impliziert a − ε < cn < b + ε für n > N . Wegen a = b bedeutet dies limn→∞ cn = a. Achtung: aus an < bn folgt nicht a < b, sondern nur a ≤ b. Die Striktheit von Ungleichungen geht beim Übergang zu Grenzwerten im allgemeinen verloren. Zum Beispiel gilt 0< 1 1 für alle n, aber lim = 0. n→∞ n n 12 Beispiel 3.9 (n-te Wurzel) Sei a > 0 und xn > 0 Lösung der Gleichung xn = a. Dann gilt limn→∞ xn = 1. Beweis: Die Gleichung xn = a besitzt höchstens eine positive Lösung, denn nach den Anordnungsaxiomen gilt für x, y > 0 x>y ↔ xn > y n . (3.5) Wir unterscheiden nun drei Fälle: a = 1 : Dann ist xn = 1 für alle n, und die Behauptung ist richtig. a > 1 : Aus (3.5) folgt dann xn > 1. Wir zeigen limn→∞ an = 0 für an = xn − 1 > 0. Die Bernoulli-Ungleichung liefert 1 + nan ≤ (1 + an )n = a, also 0 < an ≤ (a − 1)/n → 0 mit n → ∞. Die Behauptung folgt nun aus Satz 3.4c). a < 1 : Es ist dann xn = 1/yn , wobei ynn = 1/a mit 1/a > 1. Die Behauptung folgt aus dem vorigen Fall und Satz 3.3c). Bemerkung: Die Existenz der Lösungen der Gleichung xn = a, also der n-ten Wurzeln √ x = n a > 0, haben wir hier einfach vorausgesetzt. Im nächsten Abschnitt werden wir aus dem Vollständigkeitsaxiom schließen, dass die Gleichung xn = a für alle a > 0 lösbar ist. Definition 3.5 (Uneigentliche Konvergenz) Die Folge (an )n∈N konvergiert uneigentlich gegen +∞, falls gilt: Zu jedem K > 0 gibt es ein N ∈ R, so dass an > K für alle n > N. Wir schreiben limn→∞ an = +∞ oder an → +∞ mit n → ∞. Man spricht auch von bestimmter Divergenz gegen +∞. Uneigentliche Konvergenz gegen −∞ ist analog definiert. Beispiel 3.10 Ist q > 1, so gilt limn→∞ q n = +∞. Beweis: Sei K > 0 gegeben. Nach Beispiel 3.3 gibt es ein N ∈ R mit 1 1 ( )n < für n > N, q K also q n > K für n > N . An dieser Stelle führen wir folgende Bezeichnungen ein: (a, b) = {x ∈ R : a < x < b} offenes Intervall [a, b] = {x ∈ R : a ≤ x ≤ b} abgeschlossenes Intervall [a, b) = {x ∈ R : a ≤ x < b} rechtsseitig offen, linksseitig abgeschlossen (a, b] = {x ∈ R : a < x ≤ b} linksseitig offen, rechtsseitig abgeschlossen |I| = b − a für ein Intervall I Intervalllänge Hierbei sind +∞ und −∞ als offene Intervallgrenzen zugelassen, zum Beispiel (−∞, 1] = {x ∈ R : −∞ < x ≤ 1}. Den ε-Umgebungen in der Definition der Konvergenz entsprechen bei uneigentlicher Konvergenz die Intervalle (K, +∞): ab einem gewissen Index müssen alle Folgenglieder in (K, +∞) liegen, egal wie groß K gewählt ist. 13 4 Vollständigkeit der reellen Zahlen Der Nachweis der Konvergenz einer Zahlenfolge anhand der Definition setzt die Kenntnis des Grenzwerts voraus. Das Ziel der Analysis ist es aber, neue Objekte – Zahlen, Funktionen, Operationen – durch Grenzprozesse zu definieren. Wir stehen damit vor dem Problem, Folgen als konvergent zu erkennen, ohne ihren Grenzwert a priori zu kennen. Wir beginnen mit zwei Beispielen dazu. Beispiel 4.1 (Zinseszinsrechnung) Wird ein Kapital K0 für ein Jahr mit einem Zinssatz p% angelegt, so beträgt die Ausszahlung K1 = K (1 + x), wobei x = p/100. Die Idee des Zinseszinses ist es, den Zeitraum in kürzere Abschnitte zu unterteilen und den Zins anteilig pro Abschnitt anzurechenen mit dem Effekt, dass der schon angerechnete Teil des Zinses seinerseits Zinsen produziert. Bei halbjähriger Verzinsung sieht das zum Beispiel so aus: nach 1/2 Jahr: K (1 + x2 ) nach 1 Jahr: K2 = [K (1 + x2 )] (1 + x2 ) = K (1 + x2 )2 . x 12 Entsprechend ergibt sich nach einem Jahr bei monatlicher Verzinsung K12 = K (1+ 12 ) , bei x 365 täglicher Verzinsung K365 = K (1 + 365 ) und allgemein bei Unterteilung in n Zeiteinheiten En := En (x) = (1 + x n ) für x ∈ R, n ∈ N. n (4.1) Es stellt sich ganz natürlich die Frage nach einer kontinuierlichen Verzinsung, also nach dem Grenzwert limn→∞ En (x). Beispiel 4.2 (Dezimalbruchdarstellung) Für jedes x ∈ R existieren k0 ∈ Z und kj ∈ {0, 1, . . . , 9} für j ∈ N, so dass folgende Darstellung von x als Grenzwert gilt (die sogenannte Darstellung als unendlicher Dezimalbruch): x = lim n→∞ n X j=0 kj · 10 −j =: ∞ X kj · 10−j =: k0 , k1 k2 . . . j=0 Um dies zu beweisen, definieren wir k0 , k1 , . . . induktiv mit der Eigenschaft (∗) x ∈ [an , bn ) für alle n ∈ N0 , wobei an = k0 , k1 k2 . . . kn und bn = an + 10−n . Für n = 0 setzen wir k0 = max{k ∈ Z : k ≤ x} und haben wie gewünscht k0 ≤ x < k0 + 1. Seien k0 , k1 , . . . , kn−1 schon gefunden, so dass jeweils (∗) erfüllt ist. Dann setzen wir kn = max{n ∈ N0 : an−1 + k · 10−n ≤ x}. Nach Induktionsannahme ist bn−1 = an−1 + 10 · 10−n > x, also ist kn ∈ {0, 1, . . . , 9}. Es gilt x ∈ [an , bn ) nach Wahl von kn . Insbesondere folgt |x − an | ≤ |an − bn | = 10−n → 0 mit n → ∞. Damit ist die Existenz der Darstellung als unendlicher Dezimalbruch für jedes x ∈ R gezeigt. Umgekehrt stellt sich aber die Frage, ob jede Dezimalbruchfolge an = k0 , k1 k2 . . . gegen eine reelle Zahl konvergiert. 14 In beiden Beispielen brauchen wir eine Charakterisierung konvergenter Folgen, die ohne die Kenntnis des Grenzwerts auskommt. Statt die Glieder der Folge mit dem unbekannten Grenzwert zu vergleichen, besteht die Idee darin, die Glieder der Folge untereinander zu zu vergleichen. Definition 4.1 (Cauchyfolge) Eine Folge (an )n∈N heißt Cauchyfolge, wenn gilt: Zu jedem ε > 0 gibt es ein N ∈ R, so dass |an − am | < ε für alle n, m > N. Bemerkung: Beim Nachweis dieser Eigenschaft reicht es aus, die Zahlen n, m > 0 mit n < m zu betrachten, denn die Definition ist symmetrisch in n und m und für n = m ist nichts zu tun. Vollständigkeitsaxiom: Jede Cauchyfolge ist konvergent. Damit sind die Axiome KAV der reellen Zahlen komplett: R ist ein vollständig angeordneter Körper. Im wesentlichen ist R auch der einzige solche Körper, siehe H.-D. Ebbinghaus (Hrsgb.): Zahlen, Springer-Verlag 3. Auflage (1988). Satz 4.1 Eine Folge ist genau dann konvergent, wenn sie eine Cauchyfolge ist. Beweis: Eine Cauchyfolge ist konvergent nach Axiom. Sei umgekehrt limn→∞ an = a. Zu ε > 0 gibt es dann ein N ∈ N mit |an − a| < ε/2 für n > N , und für n, m > N folgt |an − am | = |an − a + a − am | ≤ |an − a| + |am − a| < ε ε + = ε. 2 2 Als erste Anwendung des Axioms betrachten wir die Dezimaldarstellung und zeigen Satz von Dezimalbrüchen) Jeder unendliche Dezimalbruch an = k0 + Pn 4.2 (Konvergenz −j mit k ∈ Z mit k ∈ {0, 1, . . . , 9} für j ∈ N konvergiert gegen eine reelle Zahl. k 10 j 0 j j=1 Beweis: Für n < m schätzen wir wie folgt ab: |am − an | = | m X kj 10−j | j=n+1 m−(n+1) −(n+1) ≤ 10 X 9 · 10−j j=0 ≤ 10−(n+1) 9 · 1 1 (Geometrische Reihe) 1 − 10 ≤ 10−n ≤ ε für n > N (Geometrische Folge). Das nun folgende Konvergenzkriterium ist überaus nützlich. Mit ihm werden wir das Beispiel der kontinuierlichen Verzinsung leicht behandeln können. Es ist ein hinreichendes Kriterium für Konvergenz, ist aber nicht notwendig für die Konvergenz einer Folge (an )n∈N . 15 Definition 4.2 (Monotone Folge) Eine Folge (an )n∈N heißt monoton wachsend, wenn gilt: an+1 ≥ an für alle n ∈ N. Satz 4.3 (Konvergenzkriterium der Monotonie und Beschränktheit) Jede monoton wachsende, nach oben beschränkte Folge ist eine Cauchyfolge und damit konvergent. Beweis: Sei (an )n∈N monoton wachsend und an ≤ K < ∞ für alle n ∈ N. Sei ε > 0 gegeben. 1 Wähle p ∈ N so dass d := K−a < ε, und setze Ij = [a1 + (j − 1)d, a1 + jd] für j = 1, 2, . . . , p p (Bild). Setze k = max{j : es gibt ein n ∈ N mit an ∈ Ij }. Es gilt 1 ∈ M , denn a1 ∈ I1 . Sei k = max{j : j ∈ M }. Dann gibt es ein N ∈ N mit aN ∈ Ik und es folgt tatsächlich an ∈ Ik für alle n > N. Denn wäre an ∈ / Ik für ein n > N , so folgt x ∈ Ij mit j < k wegen der Maximalität von k. Aber dann is an < aN , Widerspruch zur Monotonie. Für n, m > N gilt somit |an − am | ≤ |Ik | = d < ε. Satz 4.4 (Definition der Exponentialfunktion) Die Folge En (x) = (1+ nx )n ist für jedes x ∈ R konvergent. Wir bezeichnen den Grenzwert mit exp(x) = lim (1 + n→∞ x n ) . n Die Funktion exp : R → R, x 7−→ exp(x) heißt Exponentialfunktion. Der Funktionswert e = exp(1) = lim (1 + n→∞ 1 n ) ≈ 2, 71828 n heißt Eulersche Zahl. Beweis: Aus der Zinseszins-Interpretation ist plausibel, dass die Folge monoton wachsend in n ist (Verstärkung des Zinseszins-Effekts), und andererseits beschränkt bleiben sollte (der Zinseszinseffekt kann nicht beliebig groß sein). Für n > x betrachten wir die Folge Fn = Fn (x) = (1 − nx )−n . Es gilt x x x2 En (x) = (1 + )n (1 − )n = (1 − 2 )n ≤ 1, Fn (x) n n n und folglich n>x ⇒ En (x) ≤ Fn (x). (4.2) n > −x ⇒ En+1 (x) ≥ En (x). (4.3) Zweitens behaupten wir 16 Denn wir berechnen En+1 (x) En (x) = = = = ≥ = x n+1 ) (1 + n+1 x n (1 + n ) x 1 + n+1 x ( )n+1 · (1 + ) 1 + nx n x − x n+1 x (1 − n n+1 ) · (1 + ) 1 + nx n x x (1 − )n+1 · (1 + ) (n + 1)(n + x) n x x (1 − ) · (1 + ) (Bernoulli–Ungleichung) n+x n 1. x Beachte (n+1)(n+x) ≤ 1 für x > −n, so dass die Bernoulli-Ungleichung (Satz 2.3) anwendbar ist. Für n > −x ist En also monoton wachsend. Aber es gilt Fn (x) = 1/En (−x), also ist Fn (x) für n > x monoton fallend. Für n > |x| haben wir nun folgende Situation: En (x) ≤ En+1 (x) ≤ . . . . . . ≤ Fn+1 (x) ≤ Fn (x). Insbesondere ist die Folge En (x) nach oben bechränkt, und zwar durch jedes der Fm (x), und somit nach Satz 4.3 konvergent. Damit ist die Behauptung des Satzes gezeigt. Aus (4.2) und der Bernoulli-Ungleichung ergibt sich außerdem n > |x| ⇒ 1 ≥ En (x) · En (−x) = (1 − x2 n x2 x2 ) ≥ 1 − n · = 1 − . n2 n2 n Mit n → ∞ erhalten wir exp(x) · exp(−x) = 1 für allex ∈ R. (4.4) Bemerkung: Die genannte Näherung für e ergibt sich durch Wahl von n = 106 in der Ungleichung En (1) ≤ e ≤ Fn (1) unter Zuhilfenahme eines Taschenrechners. Insbesondere sieht man, dass die approximierenden Folgen En (x), Fn (x) nur sehr langsam konvergieren und aus numerischer Sicht ungeeignet sind. Definition 4.3 (Intervallschachtelung) Eine Intervallschachtelung ist eine Folge von abgeschlossenen Intervallen In = [an , bn ] ⊂ R mit In+1 ⊂ In für alle n und |In | = bn − an → 0 mit n → ∞. Satz 4.5 (Intervallschachtelungsprinzip) Zu jeder Intervallschachtelung (In )n∈N gibt es T genau ein x ∈ R mit x ∈ n∈N In . Es gilt x = limn→∞ an = limn→∞ bn . Beweis: Nach Voraussetzung haben wir a1 ≤ a2 ≤ . . . ≤ an ≤ . . . . . . ≤ bn ≤ . . . ≤ b2 ≤ b1 . Aus Satz 4.3 folgt die Existenz der Grenzwerte a = limn→∞ an bzw. b = limn→∞ bn . Dann gilt nach den Satz 3.3 und Satz 3.4 0 ≤ b − a = lim bn − lim an = lim (bn − an ) = 0. n→∞ n→∞ 17 n→∞ Setze x := a = b. Dann ist an ≤ a = x = b ≤ bn , also x ∈ In für alle n. Sei y ∈ R mit y ∈ In für alle n, das heißt an ≤ y ≤ bn . Durch Grenzübergang ergibt sich nach Satz 3.4 a ≤ y ≤ b, also y = x. Satz 4.6 (Existenz der n-ten Wurzel) Zu jedem a > 0 und n ∈ N gibt es genau ein √ x > 0 mit xn = a. Bezeichnung: x = n a = a1/n . Beweis: Die Eindeutigkeit wurde schon in Beispiel 3.9 aus den Anordnungsaxiomen gefolgert. Wir konstruieren die Lösung mit dem Verfahren der fortgesetzten Intervallhalbierung: k Bestimme Ik = [ak , bk ] für k = 1, 2, . . ., so dass mit mk = ak +b gilt: 2 I1 = [a1 , b1 ] mit an1 ≤ a ≤ bn1 ; [ak , mk ] falls mnk ≥ a Ik+1 = [mk , bk ] falls mnk < a. Es folgt Ik+1 ⊂ Ik für alle k und |Ik | = 21−k |I1 | → 0 mit k → ∞. Sei x ∈ R wie in Satz 4.5 gegeben. Per Induktion ergibt sich aus der Definition von Ik+1 die Ungleichung ank ≤ a ≤ bnk für alle k ∈ N, und hieraus mit den Sätzen 3.3 und 3.4 xn = lim ank ≤ a ≤ lim bnk = xn . n→∞ n→∞ Beispiel 4.3 (Verfahren von Heron) Hier wollen wir kurz das Verfahren von Heron besprechen, das die Quadratwurzel von a > 0 effizienter berechnet als das Intervallhalbierungsverfahren. √ Zur Motivation der Iterationsformel: die gesuchte Zahl a ist die Nullstelle x∗ der Parabel √ y = x2 −a. Nehmen wir an, es ist schon eine n-te Näherung xn für a berechnet, wobei x0 der Startwert sei. Dann betrachten wir die Tangente an die Parabel im Punkt (xn , x2n − a), und wählen als nächste Näherung deren Nullstelle xn+1 . Wie lautet der zugehörige Algorithmus? Beschreiben wir die gesuchte Tangente mit der Gleichung y = p · x + q, (p ist die Steigung, q der y-Achsenabschnitt), so muss die quadratische Funktion (x2 − a) − (px + q) genau in xn ihre einzige Nullstelle haben (heuristische Begündung am Bild), also (x2 − a) − (px + q) = (x − xn )2 ⇒ p = 2xn und q = −(a + x2n ). Die Iterationsvorschrift, gegeben durch die Nullstelle der Tangente in (xn , x2n − a), lautet demzufolge 1 a xn+1 = f (xn ) := (xn + ), mit Startwert x0 > 0. (4.5) 2 xn Die Frage ist nun, ob dieses Verfahren konvergiert und, wenn ja, wie gut. Zunächst gilt für alle x > 0 √ √ √ a x a √ + f (x) = ≥ a, 2 x a √ √ mit Gleichheit genau für x = a. Also gilt xn ≥ a für n ≥ 1, und es folgt weiter 1 xn+1 − xn = (a/xn − xn ) ≤ 0 für n ≥ 1. 2 | {z } |{z} √ √ ≤ a ≥ a 18 √ Ab n = 1 ist die Folge somit monoton fallend und durch a nach unten beschränkt, also konvergiert sie wegen Satz 4.3 gegen eine Zahl ξ > 0. Um zu sehen, dass ξ die gesuchte Wurzel ist, lassen wir in (4.5) n → ∞ gehen und erhalten ξ 2 = a wie gewünscht. Wie schnell √ verkleinert sich nun der Näherungsfehler εn = |xn − a| ≥ 0? Für n ≥ 1 ist εn+1 = xn+1 − √ √ √ 1 a 1 ε2 ε2 a = (xn + )− a= (x2n − 2 axn + a) = n ≤ √n . 2 xn 2xn 2xn 2 a Sei zum Beispiel a ≥ 41 und die Näherung xn schon auf k ≥ 1 Dezimalstellen hinter dem Komma genau, also εn ≤ 10−k , so ist der Fehler der nächsten Näherung nur mehr 1 εn+1 ≤ √ (10−k )2 ≤ 10−2k . 2 a | {z } ≤1 Die Anzahl der gültigen Stellen hat sich also in einem Schritt verdoppelt. Man spricht hier von quadratischer Konvergenz. Beim Intervallhalbierungsverfahren wird die Zahl der gültigen Stellen jeweils höchstens um Eins verbessert, was als lineare Konvergenz bezeichnet wird. Definition 4.4 (Teilfolge) Sei (an )n∈N eine Folge und (nk )k∈N eine Folge natürlicher Zahlen mit n1 < n2 < n3 . . . Dann heißt die Folge (ank )k∈N Teilfolge von (an )n∈N . Durch Induktion ergibt sich sofort nk ≥ k: es ist n1 ≥ 1 und nk+1 ≥ nk + 1 ≥ k + 1. Die Teilfolge entsteht aus der ursprünglichen Folge durch Auswahl der Nummern nk . Da Folgen Abbildungen von N nach R sind, ist eine Teilfolge formal als Verkettung von zwei Abbildungen definiert: der Ausgangsfolge a : N → R, n 7−→ a(n) und der Folge N → N, k 7−→ n(k), die n die Indizes auswählt. Am Beispiel an = (−1) , nk = 2k − 1 sieht das wie folgt aus: n3 a(n)= n(k)=2k−1 (−1)n n3 N −→ N −→ R k 7−→ n(k) = 2k − 1 7−→ 1 a(n(k)) = − (2k−1) 3 Definition 4.5 (Häufungspunkt von Folgen) a ∈ R heißt Häufungspunkt der Folge (an )n∈N , wenn eine Teilfolge (ank )k∈N gibt, die mit k → ∞ gegen a konvergiert. Beispielsweise hat die Folge an = (−1)n + n12 den Häufungspunkt +1, denn mit nk = 2k gilt ank = a2k = 1 + 4k12 → 1 mit k → ∞. Auch −1 ist ein Häufungspunkt der Folge, denn für 1 nk = 2k − 1 ist ank = a2k−1 = −1 + (2k−1) 2 → −1 mit k → ∞. Lemma 4.1 Die Zahl a ∈ R ist genau dann Häufungspunkt der Folge (an )n∈N , wenn die Menge {n ∈ N : an ∈ Uε (a)} für jedes ε > 0 unendlich viele Elemente hat. Beweis: Wenn a ∈ R Häufungspunkt von (an )n∈N ist, so gilt nach Definition ank → a mit k → ∞ für eine Teilfolge nk . Zu jedem ε > 0 gibt es dann ein K ∈ R mit ank ∈ Uε (a) für alle k > K. Wegen nk → ∞ mit k → ∞ für alle k ist die Menge {nk : k > K} unendlich. Dies beweist die eine Richtung der Äquivalenz. Umgekehrt wählen wir induktiv nk für k = 1, 2, . . . mit ank ∈ U1/k (a). Die Induktion bricht nicht ab, da an ∈ U1/k (a) für unendlich viele n gilt. Es folgt dann |ank − a| < k1 → 0 mit k → ∞. 19 Satz 4.7 (Bolzano-Weierstraß) Jede beschränkte Folge reeller Zahlen hat eine konvergente Teilfolge, also mindestens einen Häufungspunkt. Beweis: Konstruktion durch fortgesetzte Intervallhalbierung: wähle eine obere Schranke b1 und eine untere Schranke a1 für (xn )n∈N , also xn ∈ [a1 , b1 ] für alle n ∈ N. Wir nehmen nun induktiv an, dass Ik = [ak , bk ] schon gefunden ist mit der Eigenschaft (∗) xn ∈ Ik für unendlich viele n. Setze mk = 21 (ak + bk ) und definiere Ik+1 = [ak+1 , bk+1 ] = [mk , bk ] , [ak , mk ] falls xn ∈ [mk , bk ] für unendlich viele n, sonst. Es ist offensichtlich, dass (∗) auch für das Intervall Ik+1 gilt. Nach dem Intervallschachtelungsprinzip (Satz 4.5) gibt es ein x ∈ R mit x ∈ Ik für alle k ∈ N. Zu ε > 0 gibt es nun ein K ∈ R mit |Ik | < ε für k > K, also Ik ⊂ Uε (x) für k > K. Damit gilt auch xn ∈ Uε (x) für unendlich viele n. Aus Lemma 4.1 schließen wir, dass x ein Häufungspunkt der Folge (xn )n∈N ist. Definition 4.6 (Limes superior/inferior) Für eine Folge (xn )n∈N gilt lim supn→∞ xn = x∗ mit x∗ ∈ R ∪ {±∞} (beziehungsweise lim inf n→∞ xn = x∗ mit x∗ ∈ R ∪ {±∞}), falls folgende zwei Bedingungen erfüllt sind: (i) es gibt eine Teilfolge xnk → x∗ mit k → ∞; (ii) für alle x > x∗ ist die Menge {n ∈ N : xn > x} endlich (bzw. für alle x < x∗ ) ist {n ∈ N : xn > x} endlich). Der Limes superior ist nicht notwendig obere Schranke der Folge, zum Beispiel gilt lim supn→∞ n1 = 0. Er kann auch −∞ sein, zum Beispiel für xn = −n. Während wir limn→∞ xn nur dann bilden können, wenn die Folge konvergiert, ist der größte Häufungspunkt x∗ = lim supn→∞ xn und der kleinste Häufungspunkt x∗ = lim inf n→∞ xn = x∗ immer definiert, wenn wir jeweils die Möglichkeit x∗ = ±∞ bzw. x∗ = {±∞} zulassen. Dies soll nun bewiesen werden, wobei wir uns o.B.d.A. auf den Limes superior beschränken. Lemma 4.2 Sei lim supn→∞ xn = x∗ < ∞. Dann gilt y > x∗ ⇒ y ist kein Häufungspunkt von (xn ). Beweis: Für 0 < ε < 21 (y − x∗ ) gilt |x − y| < ε ⇒ x − x∗ = y − x∗ − (y − x) > ε | {z } | {z } >2ε <ε ⇒ Uε (y) ⊂ {x ∈ R : x > x∗ + ε} Mit Lemma 4.1 folgt die Behauptung aus (ii). Satz 4.8 (Existenz des Limes superior) Für jede Folge (xn )n∈R gibt es genau ein x∗ ∈ R ∪ {±∞} mit lim supn→∞ xn = x∗ . 20 Beweis: Fall 1: (xn ) ist nicht nach oben beschränkt. Dann ist {n : xn ≥ b} unendlich für alle b ∈ R. Bestimme induktiv n1 < n2 < . . . mit xnk ≥ k. Es folgt lim supn→∞ xn = +∞. Fall 2: Es gibt ein b1 ∈ R mit xn ≤ b1 für alle n ∈ N. Fall 2.1: {n : xn ≥ a} ist endlich für alle a ∈ R. Dann gilt xn → −∞ und es folgt lim supn→∞ xn = −∞. Fall 2.2: Es gibt ein a1 ∈ R, so dass {n : xn ∈ [a1 , b1 ]} unendlich ist. In diesem Fall wenden wir das Intervallhalbierungsverfahren aus dem Beweis von Satz 4.7 an und behaupten {n : xn > bk } ist endlich für alle k. Für k = 1 ist das richtig, da b1 obere Schranke. Sei die Behauptung schon für k ∈ N gezeigt. bk+1 = bk ⇒ Die Behauptung gilt nach Induktionsannahme. bk+1 = mk ⇒ Die Menge {n : xn > bk+1 } = {n : xn ∈ (mk , bk ]} ∪ {n : xn > bk } ist endlich nach Fallunterscheidung sowie Induktionsannahme. Sei nun x∗ := limk→∞ bk . Für x > x∗ ist (x, +∞) ⊂ (bk , +∞) für k hinreichend groß, also ist {n : xn > x} endlich und es folgt lim supn→∞ = x∗ . Damit ist die Existenz bewiesen. Angenommen es gibt x∗1 < x∗2 mit den Eigenschaften (i) und (ii). Wähle x ∈ (x∗1 , x∗2 ). Wegen (ii) für x∗1 ist dann {n : xn > x} endlich. Dann kann aber (i) für x∗2 nicht gelten, ein Widerspruch. Die Begriffe Häufungspunkt, Limes superior und Limes inferior sind gewöhnungsbedürftig, und wir werden bei Gelegenheit mehr Beispiele betrachten. Die logische Abfolge der zentralen theoretischen Aussagen in diesem Abschnitt war folgende: Vollständigkeitsaxiom: Cauchyfolgen sind konvergent ⇓ Konvergenzkriterium der Monotonie und Beschränktheit ⇓ Intervallschachtelungsprinzip ⇓ Bolzano-Weierstraß: Auswahlsatz ⇓ Cauchyfolgen sind konvergent Die Implikationen sind so zu verstehen, dass jeweils nur die jeweils vorangehende Eigenschaft von R im Beweis des darauf folgenden Resultats benutzt wurde. Die letzte Implikation werden wir dabei gleich noch zeigen. Es folgt, dass jede der vier Eigenschaften als Axiom für R benutzt werden könnte - die anderen Eigenschaften würden als Sätze folgen. Im nächsten 21 Abschnitt werden wir eine weitere, äquivalente Eigenschaft kennenlernen, nämlich den Satz vom Supremum (Satz 5.1). In dieser Vorlesung wird die Konvergenz der Cauchyfolgen als grundlegendes Axiom gewählt. Beweis: Auswahlsatz von Bolzano-Weierstraß ⇒ Cauchyfolgen sind konvergent Wir zeigen zunächst, dass eine Cauchyfolge (an )n∈N beschränkt ist. Sei n0 ∈ N mit |an −am | ≤ 1 für n, m ≥ n0 . Dann folgt n ≥ n0 ⇒ |an | ≤ |an − an0 | +|an0 |. | {z } ≤1 Also gilt |an | ≤ max(|a1 |, |a2 |, . . . , |an0 −1 |, |an0 |+1) = K. Sei nun N ∈ R mit |an −am | < 2ε für n, m > N . Wir wenden den Auswahlsatz von Bolzano-Weierstraß an: es gibt eine Teilfolge (ank )k∈N mit ank → a mit k → ∞. Wähle k0 ∈ N mit |ank0 − a| < 2ε und nk0 > N . Für n > N folgt |an − a| ≤ |an − ank0 | + |ank0 − a| < ε. | {z } | {z } < 2ε < 2ε Somit konvergiert die ganze Folge gegen a. Ebenso wichtig wie die Theorie sind die behandelten Anwendungen: • Konvergenz von unendlichen Dezimalbrüchen; • Definition der Exponentialfunktion exp(x) = limn→∞ (1 + nx )n ; √ • Definition der n-ten Wurzel n a. 5 Teilmengen von R und von Rn Definition 5.1 Die Menge M ⊂ R heißt nach oben beschränkt: ⇔ ∃ K ∈ R mit x ≤ K für alle x ∈ M ; nach unten beschränkt: ⇔ ∃ K ∈ R mit x ≥ K für alle x ∈ M . Die Zahl K heißt dann obere bzw. untere Schranke. M heißt beschränkt, wenn M sowohl nach oben und nach unten beschränkt ist. Dies ist äquivalent zu ∃ K ≥ 0 mit |x| ≤ K für alle x ∈ M. Beispiel. Die Menge I = [0, 1) ist nach oben beschränkt, eine obere Schranke ist zum Beispiel K = 106 . Es gibt aber kein größtes Element, das heißt kein Maximum in I: x∈I⇒x< x+1 ∈ I. 2 Es gibt aber eine kleinste obere Schranke, nämlich die Zahl 1. Definition 5.2 (Supremum/Infimum) Eine Zahl S ∈ R heißt kleinste obere Schranke oder Supremum der Menge M ⊂ R (bzw. größte untere Schranke oder Infimum von M ), wenn gilt: 22 (i) S ist obere Schranke (bzw. untere Schranke): x ≤ S für alle x ∈ M (bzw. x ≥ S für alle x ∈ M ). (ii) Falls S 0 auch obere (bzw. untere) Schranke ist, so folgt S 0 ≥ S (bzw. S 0 ≤ S). Notation: S = sup M (bzw. S = inf M ). Ist M nicht nach oben (bzw. unten) beschränkt, so setzen wir sup M = +∞ (bzw. inf M = −∞). Schließlich ist per Definition sup ∅ = −∞ und inf ∅ = +∞. Satz 5.1 (Existenz des Supremums) Jede nichtleere, nach oben beschränkte Menge M ⊂ R hat eine kleinste obere Schranke sup M ∈ R. Beweis: Sei b1 obere Schranke und a1 ∈ M . Konstruiere dann induktiv In = [an , bn ] für n ≥ 1 mit In ∩ M 6= ∅: ( [an , mn ], falls [mn , bn ] ∩ M = ∅ In+1 = [an+1 , bn+1 ] = [mn , bn ], sonst. T Sei S = n≥1 In = limn→∞ bn nach dem Intervallschachtelungsprinzip (Satz 4.5). S ist obere Schranke: für x ∈ M gilt induktiv x ≤ bn für alle n, also x ≤ limn→∞ bn = S. Sei S 0 eine obere Schranke von M . Nach Konstruktion gibt es xn ∈ M ∩ In für alle n, also gilt S 0 ≥ limn→∞ xn = S. Folgerung 5.1 Sei M ⊂ R nichtleer. Dann gibt es eine Folge xn ∈ M bzw. x0n ∈ M mit xn → sup M bzw. x0n → inf M . Beweis: Wir zeigen die Aussage für das Supremum. Ist M nach oben beschränkt, so wurde eine solche Folge im Beweis des vorangehenden Satzes konstruiert. Ist M nicht nach oben beschränkt, so gibt es zu n ∈ N ein xn ∈ M mit xn ≥ n, also xn → +∞ = sup M . Bemerkung. Es gilt (ggf. Diskussion in Anwesenheitsübungen) lim sup an = lim (sup ak ), n→∞ n→∞ k≥n bzw. lim inf an = lim ( inf ak ). n→∞ n→∞ k≥n Jetzt wollen wir uns einer neuen Frage zuwenden: wie kann man die unendlichen Mengen N ⊂ Z ⊂ Q ⊂ R der Größe nach vergleichen? Gibt es wirklich mehr rationale Zahlen als natürliche? Mehr reelle als rationale? Die Antwort lautet witzigerweise, dass es gleich viele natürliche, ganze und rationale Zahlen gibt, aber mehr reelle Zahlen. Alle genannten Mengen enthalten unendlich viele Elemente. Die Präzisierung der Begriffe gleichviele und mehr geht auf Georg Cantor (1872) zurück. Definition 5.3 Eine Menge A heißt gleichmächtig zur Menge B (Notation: A ∼ B), wenn es eine bijektive Abbildung (Bijektion) ϕ : A → B gibt. Lemma 5.1 Die Relation A ∼ B (A ist gleichmächtig zu B) ist eine Äquivalenzrelation, das heißt für alle Mengen A, B, C gilt: (i) A∼A (ii) A∼B (iii) A ∼ B und B ∼ C ⇒B∼A ⇒ A ∼ C. 23 Beweis: (i) Wähle als Bijektion die Identität idA : A → A, a 7−→ a. (ii) Sei ϕ : A → B Bijektion. Wähle dann ϕ−1 : B → A. (iii) Seien ϕ : A → B und ψ : B → C bijektiv. Wähle dann ψ ◦ ϕ : A → C. Definition 5.4 Eine Menge A heißt - endlich, wenn sie gleichmächtig zu einer Menge {1, 2, . . . , k} mit k ∈ N ist; abzählbar unendlich, wenn sie gleichmächtig zu N ist; abzählbar, wenn sie endlich oder abzählbar unendlich ist; überabzählbar, wenn sie nicht abzählbar ist. Lemma 5.2 Es gelten folgende Aussagen: (i) Die Zahl k ∈ N der Elemente einer endlichen Menge (siehe Definition 5.4) ist wohldefiniert. (ii) Die Menge N der natürlichen Zahlen ist nicht endlich. Beweis: Um (i) zu beweisen, reicht es nach Lemma 5.1 aus, für k, l ∈ N folgendes zu zeigen: (∗) {1, . . . , k} ∼ {1, . . . , l} und k ≤ l ⇒ k = l. Wir führen Induktion über k. Für k = 1 gibt es nach Voraussetzung eine bijektive, also surjektive Abbildung ϕ : {1} → {1, . . . , l} und es folgt sofort l = ϕ(1) = 1. Sei (∗) schon für ein k ∈ N gezeigt, und sei ϕ : {1, . . . , k + 1} → {1, . . . , l} bijektiv sowie l ≥ k + 1. Mit ϕ(k + 1) =: j haben wir dann Bijektionen ϕ : {1, . . . , k} → {1, . . . , l}\{j}, ψ : {1, . . . , l − 1} → {1, . . . , l}\{j}, ψ(i) = i für i < j, i + 1 für i ≥ j. Mit Lemma 5.1 (iii) folgt {1, . . . , k} ∼ {1, . . . , l − 1} und somit k = l − 1 nach Induktionsannahme, das heißt (∗) ist für k + 1 bewiesen. Für eine Abbildung ϕ : {1, . . . , k} → N ist z.B. die Zahl (max1≤j≤k ϕ(j)) + 1 ∈ N nicht im Bild von ϕ, woraus die Aussage (ii) folgt. Lemma 5.3 Falls eine surjektive Abbildung ϕ : N → A existiert, so ist A abzählbar. Beweis: Setze n1 = 1 und definiere n1 < n2 < . . . durch nk = min{n ∈ N : ϕ(n) 6= ϕ(nj ) für alle j < k}. Fall 1. Die Rekursion bricht nach einem nk ab. Dann ist die Abbildung ψ : {1, . . . , k} → A, j 7−→ ϕ(nj ) bijektiv und A ist endlich. Fall 2. Die Rekursion bricht nicht ab. Dann ist ψ : N → A, j 7−→ ϕ(nj ) bijektiv und A ist abzählbar. 24 Satz 5.2 Die Mengen Z und Q sind abzählbar. Beweis: Für Z wähle ϕ : N −→ Z, ϕ(n) = ϕ : Z −→ N, ϕ−1 (k) = ( n 2 n−1 (− 2 n gerade n ungerade 2k 1 − 2k k>0 k≤0 Wie das Argument für Z zeigt, können wir uns bei Q auf die Menge Q+ = { pq : p, q ∈ N} beschränken. Wir zählen die rationalen Zahlen diagonal ab: k= i= 1 2 3 4 5 1 2 3 4 5 6 1/1 2/1 3/1 4/1 5/1 6/1 . . . . . 1/2 2/2 3/2 4/2 · . . . · 1/3 2/3 3/3 · . . · 1/4 2/4 · . · 1/5 Die Diagonale mit der Nummer k enthält k Elemente. Deshalb wird N in Abschnitte { k(k − 1) k(k − 1) k(k + 1) k(k − 1) + 1, + 2, . . . , , +k = } mit k ∈ N 2 2 2 2 zerlegt. Die gesuchte Abbildung ϕ : N → Q lautet dann ϕ(n) = k−i+1 k(k − 1) für n = + i (k ∈ N, 1 ≤ i ≤ k). i 2 Ich empfehle, die Wohldefiniertheit von ϕ zu prüfen und eine Formel herzuleiten. Da ϕ surjektiv ist, folgt mit Lemma 5.3 die Behauptung für Q. Bemerkung: Durch Anordnung in einem quadratischen Schema und analoge Abzählung läßt sich ganz analog zeigen, daß eine abzählbare Vereinigung von jeweils abzählbaren Mengen abermals abzählbar ist. Satz 5.3 (R ist nicht abzählbar) Es gibt keine surjektive Abbildung ϕ : N → R. Beweis: Sei ϕ : N → R eine Abbildung, ϕ(n) = xn . Wir konstruieren eine Intervallschachtelung (In )n∈N mit xn ∈ / In für alle n. Wähle I1 = [x1 + 1, x1 + 2]. Ist In schon bestimmt, so zerlege In in drei abgeschlossene Teilintervalle gleicher Länge. Wähle für In+1 ein Teilintervall, das xn+1 nicht enthält (im Zweifelsfall das rechte). Nach Satz 4.5 gibt es T ein x ∈ n∈N In ∈ R, also x 6= xn für alle n ∈ N. In Zukunft brauchen wir den Begriff der Konvergenz auch für Punkte im Rn , zum Beispiel für Punkte in der Ebene und im drei-dimensionalen Raum. Dazu brauchen wir als erstes einen Abstandsbegriff. 25 Definition 5.5 (Euklidische Norm) Das Euklidische Skalarprodukt von Vektoren x = (x1 , . . . , xn ), y = (y 1 , . . . , y n ) ∈ Rn ist 1 1 n n hx, yi = x y + . . . + x y = n X xi y i . (5.1) i=1 Die Euklidische Norm oder Länge von x = (x1 , . . . , xn ) ∈ Rn ist |x| = p + 1 2 n 2 hx, xi = (x ) + . . . + (x ) 1 2 = n X i 2 (x ) !1/2 . (5.2) i=1 Lemma 5.4 (Eigenschaften des Skalarprodukts) Für α, β ∈ R und x, y, z ∈ Rn gilt: Symmetrie: hx, yi = hy, xi (5.3) Bilinearität: hαx + βy, zi = αhx, zi + βhy, zi (5.4) Positivität: hx, xi ≥ 0, Gleichheit ⇔ x = 0. (5.5) Beweis: Die Eigenschaften ergeben sich aus der Definition. Lemma 5.5 (Eigenschaften der Norm) Für α ∈ R und x, y ∈ Rn gilt: |x| ≥ 0, Gleichheit ⇔ x = 0; |αx| = |α| · |x| (5.6) (5.7) |x + y| ≤ |x| + |y| (Dreiecksungleichung) (5.8) Gleichheit in der Dreiecksungleichung gilt genau dann, wenn x und y dieselbe Richtung haben. Der Euklidische Abstand zwischen zwei Punkten x und y ist |x − y| ≥ 0. Für drei Punkte x, y, z ergibt sich aus (5.8) |x − z| = |x − y + y − z| ≤ |x − y| + |y − z|, das heißt im Dreeick x, y, z ist jede Seite kürzer als die Summe der beiden anderen Seiten (Gleichheitsdiskussion!). Die Eigenschaften (5.6) und (5.7) sind evident, vgl. Lemma 5.4. Für den Beweis der Dreiecksungleichung benötigen wir erst das folgende Resultat. Satz 5.4 (Ungleichung von Cauchy-Schwarz) Für x, y ∈ Rn gilt hx, yi ≤ |x| |y|. (5.9) Gleichheit gilt genau dann, wenn x und y dieselbe Richtung haben. Beweis: Im Fall x = 0 oder y = 0 ist hx, yi = |x| |y| = 0. Andernfalls betrachten wir die y x Vektoren ξ = |x| sowie η = |y| mit Länge |ξ| = |η| = 1 (wegen (5.7)). Es gilt x y 1 − h |x| , |y| i = 1 − hξ, ηi = = 1 2 1 2 (|ξ|2 + |η|2 − 2hξ, ηi) |ξ − η|2 ≥ 0. 26 Hieraus folgt (5.9). Gilt in (5.9) Gleichheit für x, y 6= 0, so folgt aus der Abschätzung ξ = η, das heißt x und y haben dieselbe Richtung. Beweis: der Dreiecksungleichung (5.8): |x + y|2 = |x|2 + 2hx, yi + |y|2 ≤ |x|2 + 2|x| + |y|2 (Satz 5.4) = (|x| + |y|)2 . Die Behauptung folgt aus der Monotonie der Wurzel. Im Gegensatz zu R haben wir im Rn keine Anordnung zur Verfügung. Deshalb verwenden wir die Ungleichungszeichen <, >, ≤, ≥, Formulierungen wie ”nach oben bzw. unten beschränkt” und den Begriff der Monotonie ausschließlich für reelle Zahlen und niemals für Punkte im Rn . Eine Ungleichung a < b ist nur für reelle Zahlen sinnvoll (später auch mal für gewisse Matrizen, aber das tut jetzt nichts zur Sache). Ein Check zeigt jedoch, dass die Begriffe Konvergenz, ε-Umgebung, Beschränktheit, Cauchyfolge und Vollständigkeit mit der Betragsfunktion formuliert werden können. Sie lassen sich dann auf Rn verallgemeinern, indem wir statt der Betragsfunktion die Euklidische Norm einsetzen. Definition 5.6 (Konvergenz in Rn ) Die Folge xk ∈ Rn konvergiert gegen a ∈ Rn , falls gilt: ∀ε > 0 ∃N ∈ R mit |ak − a| < ε ∀k > N. Definition 5.7 (ε-Umgebung in Rn ) Die ε-Umgebung von a ∈ Rn ist die Menge Uε (a) = {x ∈ Rn : |x − a| < ε}. Sie wird auch als offene Kugel (für n ≥ 3) bzw. offene Kreisscheibe (für n = 2) um a mit Radius ε > 0 bezeichnet. Die abgeschlossene Kugel ist Kε (a) = {x ∈ Rn : |x − a| ≤ ε}. Definition 5.8 (Beschränkte Teilmengen von Rn ) Eine Menge M ⊂ Rn heißt beschränkt, wenn gilt: Es gibt ein K ≥ 0 mit |x| ≤ K für alle x ∈ M. Zum Glück müssen wir nun nicht die ganze Theorie von vorne beginnen. Die genannten Eigenschaften für Punkte im Rn lassen sich nämlich in Eigenschaften der Koordinaten dieser Punkte übersetzen, und umgekehrt. Satz 5.5 (Eigenschaften bzgl. Norm ' Eigenschaften bzgl. der Koordinaten) Für eine Folge (ak )k∈N von Punkten ak ∈ Rn mit Koordinaten aik , i ∈ {1, . . . , n}, gelten folgende Aussagen: (ak )k∈N ist beschränkt ⇔ (aik )k∈N ist beschränkt für alle i ∈ {1, . . . , n}; (ak )k∈N konvergiert gegen a ∈ Rn ⇔ (aik )k∈N konvergiert gegen ai für alle i ∈ {1, . . . , n}; (ak )k∈N ist Cauchyfolge ⇔ (aik )k∈N ist Cauchyfolge für alle i ∈ {1, . . . , n}. 27 Beweis: Wir haben für x ∈ Rn die Ungleichungen max |xi | ≤ |x| = (x1 )2 + . . . + (xn )2 1≤i≤n 1 2 ≤ √ n max |xi |. (5.10) 1≤i≤n Geometrisch bedeutet (5.10), dass für die abgeschlossene Kugel Kr (a) mit Radius r um a und für den abgeschlossenen Würfel Wr (a) mit Mittelpunkt a und Kantenlänge 2r > 0, also Wr (a) = {x ∈ Rn : |xi − ai | ≤ r} = [a1 − %, a1 + %] × . . . × [an − %, an + %], folgende Inklusionen gelten: Kr (a) ⊂ Wr (a) ⊂ K√n r (a). Die erste Behauptung ergibt sich nun aus der Implikation |ak | ≤ K für alle k ⇒ |aik | ≤ K für alle i ∈ {1, . . . , n} und alle k ∈ N, und aus dem umgekehrten Schluss |aik | ≤ Ki max |aik | ≤ K := max Ki 1≤i≤n √ ⇒ |ak | ≤ n K ∀ k ∈ N. ∀ i ∈ {1, . . . , n}, k ∈ N ⇒ 1≤i≤n ∀k ∈ N Das Argument für die zweite Behauptung geht wie folgt: lim ak = a ⇔ k→∞ ⇔ ⇔ ⇔ lim |ak − a| = 0 k→∞ max |aik − ai | = 0 1≤i≤n (wegen Ungleichung (5.10)) lim |aik − ai | = 0 für alle i ∈ {1, . . . , n} k→∞ lim aik = ai für alle i ∈ {1, . . . , n}. k→∞ Schließlich gilt (aik )k∈N Cauchyfolge ⇒ Zu ε > 0 gibt es Ni ∈ R mit ∀ i ∈ {1, . . . , n} |aik − ail | < max1≤i≤n |aik − ail | < √εn √ (5.10) ⇒ |ak − al | < n · √εn = ε Die umgekehrte Richtung ist einfacher. ⇒ √ε n ∀k, l > Ni ∀k, l > N := max1≤i≤n Ni ∀ k, l > N. Folgerung 5.2 (Vollständigkeit von Rn ) Sei (xk )k∈N mit xk ∈ Rn eine Cauchyfolge, das heißt ∀ ε > 0 ∃ N ∈ R mit |xk − xl | < ε ∀ k, l > N. Dann existiert ein a ∈ Rn , so dass xk → a mit k → ∞. Beweis: Nach Satz 5.5 sind die Folgen (xik )k∈N Cauchyfolgen in R. Nach dem i i i Vollständigkeitsaxiom gibt es a ∈ R mit limk→∞ xk = a für alle i ∈ {1, . . . , n}. Wieder nach Satz 5.5 folgt limk→∞ xk = a. Folgerung 5.3 (Bolzano-Weierstraß im Rn ) Jede beschränkte Folge (xk )k∈N in Rn besitzt eine konvergente Teilfolge. 28 Beweis: Nach Satz 5.5 sind die reellen Folgen (xik )k∈N beschränkt für jedes i ∈ {1, . . . , n}. Wir konstruieren induktiv sukzessive Teilfolgen, so dass schliesslich alle Koordinatenfolgen konvergieren. Mit Satz 5.5 folgt dann die Behauptung. Im ersten Schritt wählen wir nach Satz 4.7 eine Teilfolge k10 < k20 < . . ., so dass lim x1k0 =: a1 ∈ R j→∞ j existiert. Im zweiten Schritt wählen wir, wieder nach Satz 4.7, aus der ersten Teilfolge eine weitere Teilfolge k100 < k200 < . . ., so dass zusätzlich der Grenzwert lim x2k00 =: a2 ∈ R j→∞ j (n) (n) existiert. So fahren wir fort, bis nach n Schritten eine Teilfolge k1 < k2 ist, für die alle Grenzwerte limj→∞ xi (n) =: ai mit 1 ≤ i ≤ n existieren. < . . . gefunden kj Beispiel Um den Sachverhalt zu verdeutlichen, betrachte die Folge xk = (x1k , x2k ) von Punkten in R2 mit 0 für k = 0 mod 3, 1 für k gerade, 1 für k = 1 mod 3, x1k = x2k = −1 für k ungerade, 2 für k = 2 mod 3. Die Koordinatenfolge (x1k )k∈N hat zum Beispiel die konvergente Teilfolge (x12j )j∈N , denn x12j = 1 für alle j. Ebenso ist (x23j )j∈N konvergente Teilfolge von (x2k )k∈N , denn x23j = 0 für alle j ∈ N. Damit haben wir aber noch keine konvergente Teilfolge für die Punkte xk ∈ R2 gefunden, denn weder x22j noch x13j ist konvergent. Stattdessen wählen wir aus der Folge (x2j )j∈N die weitere Teilfolge (x2·3l )l∈N , also j = 3l, aus. Diese konvergiert in R2 , denn es ist x6l = (1, 0) für alle l ∈ N. Definition 5.9 (Häufungspunkt von Mengen) Ein Punkt a ∈ Rn heißt Häufungspunkt der Menge M ⊂ Rn , falls für jedes ε > 0 die Menge Uε (a) ∩ M unendlich viele Elemente hat. Lemma 5.6 Der Punkt a ∈ M ist genau dann Häufungspunkt von M , wenn es eine Folge von Punkten ak ∈ M \{a} gibt mit limk→∞ ak = a. Beweis: Sei a Häufungspunkt gemäß Definition 5.9. Zu εk = U 1 (a) ∩ M \{a}. Die Folge (ak )k∈N ist wie verlangt. 1 k gibt es dann ein ak ∈ k Sei umgekehrt eine Folge ak ∈ M \{a} gegeben mit limk→∞ ak = a. Angenommen, für ein ε > 0 ist die Menge Uε (a) ∩ M endlich, also Uε (a) ∩ M \{a} = {x1 , . . . , xm } für ein m ∈ N0 . Dann ist % := min1≤i≤m |xi − a| > 0. Wegen limk→∞ |ak − a| = 0 folgt für k hinreichend groß ak ∈ U% (a) ∩ M \{a} = ∅, ein Widerspruch. Beispiele: • M = { n1 : n ∈ N} ⇒ 0 ∈ R ist Häufungspunkt von M . • Jedes a ∈ R ist Häufungspunkt von Q. 29 • Eine endliche Menge M = {x1 , . . . , xm } ⊂ Rn hat keinen Häufungspunkt. Dagegen hat die konstante Folge (ak )k∈N mit ak = 1 für alle k den Häufungspunkt 1 ∈ R. Überlegen Sie, dass für eine beliebige Folge (ak )k∈N im Rn die Häufungspunkte des Wertebereichs M = {ak : k ∈ N} eine Teilmenge der Häufungspunkte der Folge bilden, die aber eine echte Teilmenge sein kann, wie das Beispiel der konstanten Folge zeigt. Definition 5.10 (Offene und abgeschlossene Mengen) (i) Ω ⊂ Rn heißt offen, falls zu jedem x ∈ Ω ein ε > 0 existiert mit Uε (x) ⊂ Ω. (ii) A ⊂ Rn heißt abgeschlossen, wenn folgende Implikation stets gilt: xn ∈ A, lim xn = x ∈ Rn n→∞ ⇒ x ∈ A. Nach Lemma 5.6 ist eine Menge A genau dann abgeschlossen, wenn jeder Häufungspunkt von A schon Element von A ist. Beispiel 5.1 Die Kugel U% (a) = {x ∈ Rn : |x − a| < %} ist offen. Beweis: Sei x ∈ U% (a) und 0 < ε ≤ % − |x − a| > 0. Für y ∈ Uε (x) folgt |y − a| ≤ |y − x| + |x − a| < ε + |x − a| = %. Also gilt Uε (x) ⊂ U% (a). Satz 5.6 Für M ⊂ Rn gilt: M offen ⇔ Rn \M abgeschlossen. Beweis: ⇒“: Sei xk ∈ Rn \M Folge, limk→∞ xk = x ∈ Rn . Wäre x ∈ M , so folgt Uε (x) ⊂ M für ein ” ε > 0, und somit xk ∈ M für k hinreichend groß, Widerspruch. Also ist x ∈ Rn \M . ⇐“: Angenommen, M ist nicht offen. Dann gibt es ein x ∈ M mit Uε (x)\M 6= ∅ ” für alle ε > 0. Finde induktiv xk ∈ U 1 (x) mit xk ∈ Rn \M . Es folgt x = limk→∞ xk ∈ k Rn \M , ein Widerspruch. Eine Menge M ⊂ Rn kann weder offen noch abgeschlossen sein; dies trifft zum Beispiel auf ein halboffenes Intervall [a, b) zu. Die Mengen R und ∅ sind die einzigen Teilmengen von R, die sowohl offen als auch abgeschlossen sind. Dies soll in den Übungen gezeigt werden. Die Vereinigung beliebig vieler offener Mengen ist offen, aber nur endliche Durchschnitte von offenen Mengen sind offen. Auch dies soll in den Übungsaufgaben behandelt werden. Zum Abschluss dieses Abschnitts untersuchen wir als Beispiel eine spezielle Menge, und zwar die sogenannte Cantormenge C ⊂ [0, 1]. Analog zur Dezimaldarstellung gibt es zu jedem x ∈ [0, 1] Ziffern kj ∈ {0, 1, 2}, j ∈ N, mit x = 0, k1 k2 . . . := ∞ X kj 3−j . j=1 Auf diese Weise ist x als triadischer Bruch (b-adischer Bruch zur Basis b = 3) dargestellt. 30 Lemma 5.7 Seien x = 0, k1 k2 . . . und y = 0, m1 m2 . . . mit kj = mj für j = 1, . . . , N − 1, aber |kN − mN | = 2. Dann gilt |x − y| ≥ 3−N > 0. Beweis: |x − y| = | ∞ X (kj − mj )3−j | j=1 ≥ 2 · 3−N − ∞ X j=N +1 |kj − mj | 3−j | {z } ≤2 ≥ 2 · 3−N − 2 · 3−(N +1) · 1 1− 1 3 = 3−N . Definition 5.11 (Cantormenge) Die Cantormenge ist die Menge aller reellen Zahlen in [0, 1], die eine triadische Entwicklung nur mit den Ziffern 0 und 2 erlauben: C = {0, k1 k2 . . . : kj ∈ {0, 2} für alle j}. Um diese Menge zu verstehen, betrachten wir die Mengen Cn = {0, k1 k2 . . . : kj ∈ {0, 2} für 1 ≤ j ≤ n}. Wir haben dann [0, 1] = C0 ⊃ C1 ⊃ . . . ⊃ Cn ⊃ . . . ⊃ C. Lemma 5.8 Es gilt 2 1 1 (1) Cn+1 = { x : x ∈ Cn } ∪ { + x : x ∈ Cn } |3 {z } | 3 3 {z } =: 13 Cn (2) C = (disjunkte Vereinigung), =: 23 + 13 Cn T∞ n=0 Cn . Beweis: Aussage (1) ergibt sich direkt aus Cn+1 = {0, k1 k2 . . . : kj ∈ {0, 2} für j ≤ n + 1}, 1 Cn = {0, 0m1 m2 . . . : mj ∈ {0, 2} für j ≤ n}, 3 2 1 + Cn = {0, 2m1 m2 . . . : mj ∈ {0, 2} für j ≤ n}. 3 3 C0 0 1 C1 0 1/3 2/3 1 C2 31 0 1/9 2/9 1/3 2/3 7/9 8/9 1 C3 0 1 27 2 1 27 9 2 7 9 27 8 1 27 3 2 19 3 27 20 7 27 9 8 25 9 27 26 27 1 T Bei der zweiten Aussage ist C ⊂ ∞ n=1 Cn klar. Sei umgekehrt x ∈ Cn für alle n ∈ N. Die ersten n Ziffern in {0, 2} von x sind eindeutig bestimmt nach Lemma 5.7. Es folgt x ∈ C1 ⇒ x = 0, k1 . . . x ∈ C2 ⇒ x = 0, k1 k2 . . . .. . mit k1 ∈ {0, 2}, mit k2 ∈ {0, 2}und gleichem k1 , x ∈ Cn ⇒ x = 0, k1 k2 . . . kn . . . mit kn ∈ {0, 2}und gleichen k1 , . . . , kn−1 . Auf diese Weise erhalten wir eine Darstellung x = 0, k1 k2 . . . mit kj ∈ {0, 2} für alle j ∈ N. Aus der ersten Aussage des Lemmas folgt mit Induktion, dass Cn disjunkte Vereinigung von 2n abgeschlossenen Intervallen der Länge 3−n ist. Satz 5.7 (Eigenschaften der Cantormenge) Die Cantormenge hat folgende Eigenschaften: (1) C ist abgeschlossen. (2) Jedes x ∈ C ist Häufungspunkt von C. (3) [0, 1]\C ist dicht in (0, 1). (4) C ist überabzählbar. (5) C ist selbstähnlich: C = 31 C ∪ ( 23 + 13 C). (6) C hat die Dimension log3 2. Beweis: Wir werden die Aussagen (1) bis (5) beweisen, und bei (6) ein Indiz für die Richtigkeit der Behauptung angeben, aber keinen Beweis. (1): Da C0 = [0, 1] abgeschlossen ist, ist nach Rekursionsformel (1) in Lemma 5.8 auch Cn abgeschlossen für alle n ∈ N. Als Durchschnitt abgeschlossener Mengen ist dann T∞ C = n=1 Cn ebenfalls abgeschlossen. (2): Falls die Entwicklung x = 0, k1 . . . kn von x abbricht, so wählen wir als approximierende Folge xn = x + 2 · 3−n ∈ C. Andernfalls können wir die Zahlen xn = 0, k1 . . . kn als Approximation wählen. (3): Wir nehmen indirekt an, dass I = (a, b) ⊂ C ist. Dann folgt I ⊂ Cn für alle n, und I muss schon in einem der 2n disjunkten Teilintervalle von Cn enthalten sein. Dies bedeutet |I| ≤ 3−n → 0, ein Widerspruch. 32 (4) Wir benutzen das Diagonalverfahren von Cantor: x1 = 0, k11 k12 k13 . . . x2 = 0, k21 k22 k23 . . . x3 = 0, k31 k32 k33 . . . Setze kn := 0, falls knn = 2, und kn := 2, falls knn = 0. Aufgrund der Vollständigkeit ist durch x := 0, k1 k2 . . . eine reelle Zahl definiert, die in der Aufzählung nicht vorkommt (beachte die Eindeutigkeit der Zifferndarstellung mit 0 und 2). (5) Sei x ∈ C, also x ∈ Cn für alle n ∈ N. Nach Lemma 5.8 (1) folgt 31 x ∈ Cn+1 sowie 1 2 1 2 1 3 + 3 x ∈ Cn+1 für alle n ∈ N. Aus Lemma 5.8 (ii) folgt weiter 3 x ∈ C sowie 3 + 3 x ∈ C. 2 1 1 Damit ist 3 C ∪ ( 3 + 3 C) ⊂ C bewiesen. Umgekehrt ist zu zeigen, dass jedes x ∈ C so dargestellt werden kann: x ∈ C ⇒ x ∈ Cn+1 ( x ≤ 13 : Lemma 5.8 (i) ⇒ x ≥ 23 Lemma 5.8 (ii) ⇒ y ∈ C ∀n ∈ N y := 3x ∈ Cn ∀n ∈ N y := 3(x − 23 ) ∈ Cn ∀n ∈ N und x = 31 y bzw. x = 2 3 + 13 y. (6) Wir können hier nur versuchen, einen Anhaltspunkt für die Behauptung zu geben. Bei Streckungen des R3 mit Faktor α > 0 geht die Länge eine Objekts mit Faktor α1 , der Flächeninhalt mit α2 und der Rauminhalt mit α3 . Bei Verschiebungen bleiben Länge, Fläche und Rauminhalt natürlich gleich. Angenommen, C ist d-dimensional für ein d ∈ [0, ∞), und angenommen, wir könnten den d-dimensionalen Inhalt von C definieren. Dann sollte für diesen d-dimensionalen Inhalt µd (C) unter Streckungen mit Faktor α > 0 sowie unter Verschiebungen um x0 ∈ R gelten: µd (α C) = αd µd (C), µd (x0 + C) = µd (C). Aus (5) würde dann folgen 1 2 1 C ∪ ( + C) 3 3 3 1 2 1 = µd ( C) + µd ( + C) (da Vereinigung disjunkt) 3 3 3 1 d = 2 ( ) µd (C) (Streckung um 13 , Verschiebung um 23 ), 3 µd (C) = µd bzw. nach Kürzen d = log3 2. 33 34 Kapitel 2 Funktionen und Stetigkeit 1 Polynome und komplexe Zahlen Eine reellwertige Funktion auf einer Menge D ist eine Abbildung f : D → R. Die Menge D heißt Definitionsbereich von f , die Menge f (D) Wertebereich oder Bild von f . Der Graph von f ist die Menge Graph (f ) = {(x, f (x)) : x ∈ D} ⊂ D × R. Besonders für D ⊂ R ist der Graph sehr nützlich, um sich die Funktion f qualitativ vorzustellen. Es folgen jetzt einige Beispiele, mehr oder minder mathematischer Natur, von reellwertigen Funktionen (zunächst auch alle mit D ⊂ R): (1) D = [0, ∞), t ∈ [0, ∞) Zeit f (t) = Körpertemperatur einer Leiche zur Zeit t, nach Mord zur Zeit t = 0 f (0) = 37◦ C, f (t) = 10◦ C (Umgebungstemperatur) für t ≥ T. t1 < t2 ≤ T ⇒ f (t1 ) > f (t2 ) (f |[0,T ] streng monoton fallend) ⇒ f |[0,T ] injektiv, also der Todeszeitpunkt eindeutig ermittelbar Bild (f ) = [10, 37] (in Grad ◦ C). (2) DAX: D = [9, 18], t ∈ D Tageszeit 35 (3) Massenformel von Einstein: m(v) = √ (4) (5) (6) (7) (8) m0 1−( vc )2 m0 Ruhemasse, c = 3 · 108 m/s (Lichtgeschwindigkeit) D = [0, c) Definitionsbereich der Relativitätstheorie Gaußklammerfunktion (Größte-Ganze-Funktion): f : R → R, f (x) = [x] = max {n ∈ N : n ≤ x}. Charakteristische Funktion von M ⊂ R: ( 1 x∈M f (x) = 0 sonst Dirichletfunktion (Spezialfall von (6) mit M = Q): ( 1 x∈Q f (x) = 0 sonst Affin-lineare Funktionen: f : R → R, f (x) = ax + b (a, b ∈ R) Spezialfall: a = 0 ⇒ f (x) = b (konstante Funktion). Quadratische Funktionen: f : R → R, f (x) = ax2 + bx + c quadratische Ergänzung (i) b2 − 4ac > 0 ⇒ ⇒ (a 6= 0) f (x) = a x + b 2 2a − b2 −4ac 4a2 b zwei Nullstellen x± = − 2a ± . √ + b2 −4ac 2a f (x) = a(x − x+ )(x − x− ). (ii) b2 − 4ac = 0 ⇒ b . eine Nullstelle x0 = − 2a f (x) = a(x − x0 )2 . (iii) b2 − 4ac < 0 ⇒ keine Nullstelle in R. Allgemeiner sind Polynome eine grundlegende Klasse von Funktionen. Sie werden oft zur Approximation anderer Funktionen eingesetzt, worauf wir später ausführlich eingehen werden. Definition 1.1 Eine Funktion p : R → R heißt Polynom vom Grad n ∈ N0 , wenn es a0 , a1 , . . . , an ∈ R mit an 6= 0 gibt, so dass gilt: p(x) = a0 + a1 x + . . . + an xn für alle x ∈ R. (1.1) Im untenstehenden Satz 1.1 wird gezeigt, dass der Grad n ∈ N0 und die Koeffizienten a0 , a1 , . . . , an mit an 6= 0 durch (1.1) eindeutig bestimmt sind. Lemma 1.1 (Abspaltung von Linearfaktoren) Sei p : R → R ein reelles Polynom vom Grad n ∈ N mit Koeffizienten a0 , a1 , . . . , an , an 6= 0. Falls p(x0 ) = 0 für ein x0 ∈ R, so gibt es ein Polynom q vom Grad n − 1 mit (n − 1)-tem Koeffizient gleich an , so dass gilt: p(x) = (x − x0 ) q(x) 36 für alle x ∈ R. (1.2) Beweis: Mit dem Teleskopsummentrick folgt für x ∈ R xk − xk0 = xk − xk−1 x0 + xk−1 x0 − . . . − xxk−1 + xxk−1 − xk0 0 0 = (x − x0 )(xk−1 + xk−2 x0 + . . . + xk−1 0 ). Daraus folgt weiter p(x) = p(x) − p(x0 ) (da p(x0 ) = 0) n X = ak (xk − xk0 ) k=1 = (x − x0 ) n X ak (xk−1 + xk−2 x0 + . . . + x0k−1 ) . |k=1 {z } =:q(x) Der Koeffizient von xn−1 ist an nach Definition von q. Lemma 1.2 (Nullstellenlemma) Sei p ein Polynom vom Grad n ∈ N0 . Dann hat p höchstens n verschiedene Nullstellen. Beweis: Induktion über n ∈ N0 . n=0 ⇒ p(x) ≡ a0 ist konstant, wobei a0 6= 0. Also hat p keine Nullstelle. Sei nun p Polynom vom Grad n ≥ 1. ⇒ Fall 1: p hat keine Nullstelle Fall 2: p(x0 ) = 0 für ein x0 ∈ R ⇒ Behauptung. p(x) = (x − x0 ) q(x) ∀x ∈ R, grad q = n − 1 (Lemma 1.1) q hat höchstens n − 1 Nullstellen (Induktionsannahme) ⇒ Behauptung. Satz 1.1 (Koeffizientenvergleich) Seien p, q Polynome vom Grad n bzw. m, also p(x) = a0 + a1 x + . . . + an xn , für alle x ∈ R, an 6= 0, q(x) = b0 + b1 x + . . . bm xm für alle x ∈ R, bm 6= 0. Es gelte p(xj ) = q(xj ) für paarweise verschiedene x1 , . . . , xk ∈ R, wobei k > max(n, m). Dann folgt n = m und ai = bi für i = 0, . . . , n. Beweis: Wäre n 6= m oder ai 6= bi für ein i, so wäre p − q Polynom vom Grad höchstens max(n, m), hat aber k Nullstellen. Widerspruch zu Lemma 1.2. Folgerung 1.1 Sei p reelles Polynom vom Grad n. Dann besitzt p eine eindeutig bestimmte Darstellung p(x) = (x − x1 )ν1 · . . . · (x − xr )νr q(x) ∀x ∈ R. (1.3) Dabei sind {x1 , . . . , xr } ⊂ R die Nullstellen von p (evtl. r = 0) und q ist Polynom vom Grad n − (ν1 + . . . + νr ) ∈ {0, . . . , n} mit q(x) 6= 0 für alle x ∈ R. Die Zahlen νi ≥ 1 heißen Vielfachheiten der Nullstellen. 37 Beweis: Die Existenz folgt induktiv aus Lemma 1.1. Sei p(x) = (x−x1 )µ1 ·. . .·(x−xr )µr h(x) eine zweite solche Darstellung, o.B.d.A. ν1 ≥ µ1 . Indem wir durch (x − x1 )µ1 teilen, folgt für x 6= x1 r (x − x1 )ν1 −µ1 · (x − x2 )ν2 · . . . · (x − xr )ν · q(x) = (x − x2 )µ2 · . . . · (x − xr )µr · h(x). Beide Seiten dieser Gleichung sind Polynome, haben nach Satz 1.1 also dieselben Koeffizienten. Deshalb stimmen sie auch in x = x1 überein, und es folgt ν1 = µ1 und analog νi = µi für alle i ∈ {1, . . . , r}. Nach Division haben wir schließlich q(x) = h(x) für x ∈ R\{x1 , . . . , xr }, und Satz 1.1 liefert q = h. Was machen wir mit Polynomen, die keine reellen Nullstellen haben, wie z. B. p(x) = x2 + 1? Wir werden jetzt den Zahlbereich R erweitern, so dass die Gleichung x2 = −1 eine Lösung hat: N ⊂ Z ⊂ Q ⊂ R ⊂ C = komplexe Zahlen. C := (R2 , +, · ) ist ein Körper. Dabei sind die Verknüpfungen wie folgt definiert: (1) Die Addition ist die Vektoraddition in R2 : R2 ist zweidimensionaler R-Vektorraum. Fasse R als Teilmenge von R2 auf: R = b R × {0} ⊂ R2 , Erhalte die Standardbasis {(1, 0) =: 1, (0, 1) =: i}. ⇒ x= b (x, 0). z = (x, y) = (1, 0)x + (0, 1)y = 1 · x + i · y = x + iy (Basisdarstellung von z) Die Addition lautet also wie folgt: (x1 + iy1 ) + (x2 + iy2 ) = (x1 , y1 ) + (x2 , y2 ) = (x1 + x2 , y1 + y2 ) = (x1 + x2 ) + i(y1 + y2 ). (2) Die Multiplikation: Forderung: i ist Lösung der Gleichung x2 = −1. Seien z1 = x1 + iy1 , z2 = x2 + iy2 ∈ C. Aus den Körpergesetzen folgt dann z1 z2 = (x1 + iy1 )(x2 + iy2 ) = x1 x2 + i2 y1 y2 + i(x1 y2 + y1 x2 ) z1 z2 = x1 x2 − y1 y2 + i(x1 y2 + y1 x2 ) z = x + iy ⇒ iz = −y + ix Multiplikation mit i ist Drehung um 90◦ im entgegengesetzten Uhrzeigersinn. Multiplikation mit α ∈ R ist Skalarmultiplikation im Vektorraum R: αz = α(x + iy) = αx + iαy = (αx, αy) = α(x, y). Eine weitere Struktur auf C ist die 38 (3) Konjugation: z 7→ z Für z = x + iy setzen wir z = x − iy. Die Konjugation ist die Spiegelung an der x-Achse. z heißt die zu z konjugierte komplexe Zahl. Lemma 1.3 Für die komplexe Konjugation gilt: (i) z1 + z2 = z1 + z2 , z1 z2 = z1 z2 , (ii) z = z ⇔ z ∈ R, (iii) Für z = x + iy haben wir 1 (Realteil), x = (z + z) =: Re z ∈ R 2 1 y = (z − z) =: Im z ∈ R (Imaginärteil). 2i Beweis: (i) Wir zeigen die zweite Gleichung: z1 z2 = (x1 − iy1 )(x2 − iy2 ) = x1 x2 − y1 y2 − i(x1 y2 + y1 x2 ) = z1 z2 . (ii) x − iy = x + iy ⇔ y = 0. (iii) 1 (z + z) = 2 1 (z − z) = 2i 1 (x + iy + x − iy) = x, 2 1 x + iy − (x − iy) = y. 2i Als vierte Struktur der komplexen Zahlen besprechen wir nun den (4) Zusammenhang mit der Euklidischen Struktur auf R2 : Die Euklidische Norm und das Skalarprodukt auf R2 sind wie folgt definiert: p z = x + iy ⇒ |z| = + x2 + y 2 , z1 = x1 + iy1 , z2 = x2 + iy2 ⇒ hz1 , z2 i = x1 x2 + y1 y2 . Lemma 1.4 Für den Betrag einer komplexen Zahl gelten folgende Regeln: (i) |z|2 = z z, hz1 , z2 i = Re (z1 z2 ). 39 (ii) |z1 z2 | = |z1 ||z2 |. (iii) |Re z| ≤ |z|, |Im (z)| ≤ |z|. Beweis: Aussage (i) ergibt sich aus der Rechnung Re (z1 z2 ) = Re (x1 + iy1 )(x2 − iy2 ) = Re x1 x2 + y1 y2 − i(x1 y2 − y1 x2 ) = x1 x2 + y1 y2 = hz1 , z2 i, bzw. z z = (x + iy)(x − iy) = x2 + y 2 = |z|2 . Die Identität (ii) folgt aus (i) wegen |z1 z2 |2 = (z1 z2 )(z1 z2 ) = z1 z1 z2 z2 = |z1 |2 |z2 |2 . Die Ungleichungen (iii) sind klar. Bemerkung. Aus Lemma 1.4(i) folgt für z = x + iy 6= 0 1 z x − iy = = 2 . z zz x + y2 (1.4) Wir kehren jetzt zu den Polynomen zurück, und zwar betrachten wir jetzt komplexe Polynome. Analog zu Definition 1.1 sind dies Funktionen p : C −→ C, für die es Koeffizienten a0 , a1 , . . . , an ∈ C gibt, so dass gilt: p(z) = a0 + a1 z + . . . + an z n für alle z ∈ C. Die Abspaltung von Linearfaktoren (Lemma 1.1), das Nullstellenlemma (Lemma 1.2) und der Koeffizientenvergleich (Satz 1.1) mitsamt der Folgerung 1.1 gelten für komplexe Polynome ganz analog, denn zu ihrem Beweis wurden ausschließlich die Körperaxiome (und nicht zum Beispiel die Anordnung) benutzt. Der Grad eines komplexen Polynoms, seine Koeffizienten und die Vielfachheit der Nullstellen sind also wohldefiniert. Es ist nicht schwer zu sehen, dass jedes quadratische Polynom in C eine Nullstelle hat (Übungsaufgabe). Tatsächlich ist viel mehr wahr: Satz 1.2 (Fundamentalsatz der Algebra, Gauß 1799) Jedes komplexe Polynom vom Grad n ≥ 1 hat mindestens eine Nullstelle z0 ∈ C. Diesen Satz werden wir in Analysis II beweisen. Als Konsequenz ergibt sich Folgerung 1.2 Sei p ein komplexes Polynom vom Grad n mit Koeffizienten a0 , a1 , . . . , an ∈ C. Dann besitzt p eine eindeutige Darstellung p(z) = an (z − z1 )ν1 · . . . · (z − zk )νk ∀z ∈ C. (1.5) Dabei sind z1 , . . . , zk ∈ C die Nullstellen von p, und die νi ≥ 1 sind die Vielfachheiten dieser Nullstellen mit ν1 + . . . + νk = n. 40 Beweis: Wie oben festgestellt, gilt die Darstellung (1.3) auch über C, und das Restpolynom q in (1.3) hat dann keine Nullstelle in C. Nach Satz 1.2 muss q den Grad Null haben, das heißt q(z) = an für alle z ∈ C. Was bedeuten diese Überlegungen für reelle Polynome? Da R ⊂ C, können wir jedes reelle Polynom p : R → R auch als komplexes Polynom auffassen: wir setzen statt x ∈ R komplexe Zahlen z ∈ C ein. Auf diese Weise wird die reelle Funktion p : R → R zu einer komplexen Funktion p : C → C fortgesetzt. Lemma 1.5 Sei p(x) = a0 + a1 x + . . . + an xn mit a0 , a1 , . . . , an ∈ R ein reelles Polynom vom Grad n. Dann besitzt p, aufgefasst als komplexes Polynom, eine Faktorisierung der Form p(z) = an r k Y Y (z − xi )νi (z − zj )µj (z − zj )µj i=1 für alle z ∈ C. j=1 Dabei sind {x1 , . . . , xr } ⊂ R die reellen Nullstellen von p mit Vielfachheit νi ≥ 1, und {z1 , z1 , . . . , zk , zk } ⊂ C\R die nichtreellen Nullstellen von p. Diese treten also in Paaren von konjugiert komplexen Zahlen zj , zj gleicher Vielfachheit µj auf. Es gilt ν1 + . . . + νr + 2 (µ1 + . . . + µk ) = n. Beweis: Es gilt für z ∈ C, da ai ∈ R, wegen Lemma 1.3 (i) p(z) = a0 + a1 z + . . . + an z n = a0 + a1 z + . . . + an z n = p(z). Insbesondere folgt p(z) = 0 ⇒ p(z) = 0. Ist daher z1 ∈ C\R eine nichtreelle Nullstelle, so erhalten wir nach Lemma 1.1 die Darstellung p(z) = (z − z1 )(z − z1 ) q(z) = (z 2 − 2(Re z1 )z + |z1 |2 ) q(z), (1.6) mit einem Polynom q vom Grad n − 2. Beachten Sie, dass wir Lemma 1.1 hier über C anwenden, das heißt die Koeffizienten des Polynoms q sind zunächst komplexe Zahlen b0 , b1 , . . . , bn−2 ∈ C. Um zu sehen, dass die bi doch reell sind, setzen wir z := x ∈ R in (1.6) ein und bilden die Imaginärteile beider Seiten: 0 = Im p(x) (da p reelle Koeffizienten hat) = Im (x2 − 2(Re z1 )x + |z1 |2 ) q(x) | {z } ∈R = (x2 − 2(Re z1 )x + |z1 |2 ) Im q(x) n−2 X = (x2 − 2(Re z1 )x + |z1 |2 ) (Im bi )xi . i=0 Da der linke Faktor in der letzten Zeile für x ∈ R niemals Null ist, folgt n−2 X (Im bi )xi = 0 für alle x ∈ R. i=0 Nach Satz 1.1 muss Im bi = 0 für alle i = 0, 1, . . . , n−2 gelten, das heißt bi ∈ R. Das Polynom q ist also wieder ein reelles Polynom, und durch Induktion erhalten wir die gewünschte Darstellung. 41 Folgerung 1.3 Jedes Polynom p(x) = a0 + a1 x + . . . + an xn mit a0 , a1 , . . . , an ∈ R zerfällt über R in lineare und quadratische Faktoren. Genauer gilt p(x) = an r k Y Y (x − xi )νi (x2 − 2(Re zj )x + |zj |2 )µj i=1 für alle x ∈ R, (1.7) j=1 wobei die xi ∈ R die reellen und die zj , zj ⊂ C\R die nichtreellen Nullstellen von p sind. 2 Stetige Funktionen Definition 2.1 (Stetigkeit) Sei x0 ∈ D ⊂ R (bzw. x0 ∈ D ⊂ Rm ). Die Funktion f : D → R (bzw. f : D → Rn ) heißt stetig im Punkt x0 , falls es zu jedem ε > 0 ein δ > 0 gibt, so dass für x ∈ D gilt: |x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε. (2.1) Wir wollen einige Beispiele betrachten. Beispiel 2.1 Konstante Funktionen: f (x) = c für alle x ∈ D. Es gilt |f (x) − f (x0 )| = 0 für alle x ∈ D. Zu ε > 0 können wir also jedes δ > 0 wählen. Beispiel 2.2 Identische Funktion: f (x) = x für alle x ∈ D ⊂ Rn . Zu ε > 0 wähle δ := ε > 0 und erhalte |x − x0 | < δ ⇒ |f (x) − f (x0 )| = |x − x0 | < δ = ε. Beispiel 2.3 Betragsfunktion: f (x) = |x| für x ∈ R. Zu ε > 0 wähle δ := ε > 0 und schließe mit der Dreiecksungleichung |x − x0 | < δ ⇒ |f (x) − f (x0 )| = ||x| − |x0 || ≤ |x − x0 | < δ = ε. Analog : Die Euklidische Norm | · | : Rm → R ist eine stetige Funktion auf Rm . Beispiel 2.4 Gaußklammerfunktion: f (x) = [x] = max{k ∈ Z : k ≤ x}. Wir betrachten zwei verschiedene Definitionsbereiche: • D = [1, ∞) ⇒ f ist stetig in x0 = 1. Zu ε > 0 wähle zum Beispiel δ = |x − 1| < δ, x ∈ D • D = [0, 1] ⇒ ⇒ 1 2 und schließe 3 x ∈ [1, ) 2 ⇒ |f (x) − f (1)| = |[x] − [1]| = 0. f ist nicht stetig in x0 = 1. Angenommen es gibt zu ε = 1 ein δ > 0 wie gefordert. Wähle dann x ∈ (1 − δ, 1) mit x ≥ 0, und erhalte den Widerspruch 1 = ε > |f (x) − f (1)| = |[x] − [1]| = 1. 42 Fazit: Bei der Stetigkeit kommt es auch darauf an, welcher Definitionsbereich gewählt wird. Beispiel 2.5 Die n-te Wurzel f : [0, ∞) → R, f (x) = √ n x ≥ 0, ist stetig in allen x0 ∈ [0, ∞). Sei ε > 0 gegeben. Wir unterscheiden zwei Fälle: Fall 1 x0 = 0. Wähle δ = εn > 0. Für |x − x0 | = x < δ folgt |f (x) − f (x0 )| = √ n x < ε. Fall 2 x0 > 0. √ √ Setze n x0 = y0 ≥ 0 und n x = y ≥ 0. Dann gilt x − x0 = y n − y0n = (y n−1 + y n−2 y0 + . . . + y y0n−2 + y0n−1 )(y − y0 ). ⇒ |x − x0 | ≥ y0n−1 |y − y0 |. Wähle nun δ = y0n−1 ε > 0. Für |x − x0 | < δ folgt |f (x) − f (x0 )| = |y − y0 | ≤ y01−n |x − x0 | < y01−n δ = ε. Definition 2.2 Sei D ⊂ Rm . Die Abbildung f : D → Rn heißt Lipschitzstetig mit Konstante L ≥ 0, falls gilt: |f (x) − f (y)| ≤ L|x − y| für alle x, y ∈ D. Beispiel 2.6 Lipschitzstetig ⇒ stetig: Die Lipschitzkonstante von f : D → Rn sei L ≥ 0, o.B.d.A. L > 0. Zu ε > 0 wähle δ = ε/L > 0 und erhalte |f (x) − f (x0 )| ≤ L|x − x0 | < L δ = ε für |x − x0 | < δ. Beispiel 2.7 Lineare Abbildungen A : Rm → Rn . Sei A : Rm → Rn linear. Bezüglich der Standardbasen {e1 , . . . , em } des Rm und {e1 , . . . , en } des Rn besitzt A eine Matrixdarstellung A = (Aij )1≤i≤n,1≤j≤m , das heißt die Bilder A(ej ) der Basisvektoren ej des Rm besitzen bzgl. der Vektoren ei im Rn die Koordinaten Aij : A(ej ) = n X Aij ei für j = 1, . . . , m. i=1 Definition 2.3 Die Euklidische Norm der linearen Abbildung A : Rm → Rn ist |A| = m X j=1 1/2 |Aej |2 = 43 n X m X i=1 j=1 1/2 A2ij . Es gilt nun für jedes x ∈ Rm |A(x)| = |A(x1 e1 + . . . + xm em )| = |x1 A(e1 ) + . . . + xm A(em )| ≤ = ≤ (da A linear) |x1 | |A(e1 )| + . . . + |xm | |A(em )| 1 (|x |, . . . , |xm |), (|A(e1 )|, . . . , |A(em )|) (|A(e1 )|2 + . . . + |A(em )|2 )1/2 (|x1 |2 + . . . (Normeigenschaften) (Definition von h·, ·i auf Rm ) + |xm |2 )1/2 (Cauchy-Schwarz). Damit haben wir gezeigt: |A(x)| ≤ |A| |x| für alle A ∈ Hom(Rm , Rn ), x ∈ Rm . (2.2) Insbesondere folgt für x, y ∈ Rm |A(x) − A(y)| = |A(x − y)| ≤ |A| |x − y|, d. h. A ist Lipschitzstetig mit Konstante |A|. Um nicht den Überblick zu verlieren, konzentrieren wir uns im folgenden auf relle Funktionen einer Variablen, also m = n = 1. Die meisten Aussagen haben aber offensichtliche Verallgemeinerungen für Funktionen mehrerer Variabler (m ≥ 2) und/oder vektorwertige Funktionen (n > 1). Satz 2.1 (Definition der Stetigkeit mittels Folgen) Sei f : D ⊂ R und x0 ∈ D. Dann sind folgende Aussagen äquivalent: (1) f ist stetig in x0 ∈ D. (2) Für jede Folge (xn )n∈N mit xn ∈ D und limn→∞ xn = x0 gilt: limn→∞ f (xn ) = f (x0 ). Beweis: (1)⇒(2): Sei xn ∈ D mit limn→∞ = x0 , sowie ε > 0. f stetig in x0 ⇒ ∃δ > 0 : |x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε limn→∞ xn = x0 ⇒ ∃N ∈ R : n > N ⇒ |xn − x0 | < δ ⇒ n > N ⇒ |f (xn ) − f (x0 )| < ε. (2)⇒(1): Angenommen, f ist nicht stetig in x0 : ∃ ε > 0: für alle n ∈ N gibt es xn ∈ D mit |xn − x0 | < n1 , aber |f (xn ) − f (x0 )| ≥ ε. Daraus folgt limn→∞ xn = x0 , aber f (xn ) konvergiert nicht gegen f (x0 ), ein Widerspruch. Satz 2.2 (Stetigkeitsregeln) Sei x0 ∈ D ⊂ R und f, g : D → R seien stetig in x0 . Dann gelten folgende Aussagen: (1) αf + βg ist stetig in x0 , für beliebige α, β ∈ R. (2) f g ist stetig in x0 . 44 (3) f g : D0 = D\{x : g(x) = 0} → R ist stetig in x0 , falls g(x0 ) 6= 0. Beweis: Die Funktionen sind punktweise definiert, das heißt für alle x ∈ D gilt f f (x) (αf + βg)(x) := αf (x) + βg(x), (f g)(x) = f (x)g(x) und ( )(x) = . g g(x) Wir führen die Aussagen auf die entsprechenden Aussagen für Folgen zurück: Sei (xn )n∈N eine beliebige Folge mit xn ∈ D und limn→∞ xn = x0 . Nach Satz 2.1 folgt f (xn ) → f (x0 ) und g(xn ) → g(x0 ) mit n → ∞. Aus Kapitel I, Satz 3.3 folgt αf (xn ) + βg(xn ) → αf (x0 ) + βg(x0 ), f (xn )g(xn ) → f (x0 )g(x0 ), sowie im Fall g(x0 ) 6= 0 f (xn ) f (x0 ) → . g(xn ) g(x0 ) Aus Satz 2.1 folgt nun die Behauptung. Die Aussage in Satz 2.2 (iii) ist nur dann wirklich sinnvoll, wenn x0 ein Häufungspunkt von D0 = D\{x : g(x) = 0} ist. Dazu tragen wir folgendes nach: Lemma 2.1 Sei g : D → R mit g(x0 ) 6= 0. Ist g stetig in x0 , so gibt es ein ε > 0 und ein δ > 0 mit |g(x)| ≥ ε für alle x ∈ D ∩ Uδ (x0 ). Beweis: Wähle ε := |g(x0 )|/2 > 0. Aufgrund der Stetigkeit gibt es dann ein δ > 0 mit |g(x) − g(x0 )| < ε für alle x ∈ D ∩ Uδ (x0 ). Es folgt für diese x |g(x)| = |g(x0 ) − (g(x0 ) − g(x))| ≥ |g(x0 )| − |g(x) − g(x0 )| ≥ 2ε − ε = ε. Definition 2.4 Die Funktion f : D → R heißt stetig auf D, wenn sie in allen Punkten x0 ∈ D stetig ist. Wir setzen C 0 (D) = {f : D → R : f ist stetig auf D}. (2.3) Nach Satz 2.2 (1) ist C 0 (D) ein R-Vektorraum. Satz 2.3 (Verkettung stetiger Funktionen) Für D, E ⊂ R betrachten wir die Verketf g tung g ◦ f : D −→ E −→ R, wobei f (D) ⊂ E. Ist f stetig in x0 ⊂ D, g stetig in y0 = f (x0 ) ∈ E, so ist g ◦ f : D → R stetig in x0 . Beweis: Sei xn ∈ D eine beliebige Folge mit limn→∞ xn = x0 . Dann schließen wir Satz2.2 ⇒ f (xn ) → f (x0 )mit n → ∞, Satz2.2 ⇒ g f (xn ) → g f (x0 ) mit n → ∞, Satz2.2 ⇒ Behauptung. 45 Beispiel 2.8 Seien f, g : D → R stetig. Dann ist auch |f | : D → R stetig, und ebenso die Funktionen max(f, g) = 21 (f + g + |f − g|) : D → R sowie min(f, g) = 12 (f + g − |f − g|) : D → R. Definition 2.5 (Grenzwert für Funktionen) Sei x0 ∈ D Häufungspunkt von D. Die Funktion f : D → R konvergiert für x → x0 gegen a ∈ R, falls gilt: ∀ε > 0 ∃ δ > 0 : |x − x0 | < δ, x ∈ D\{x0 } ⇒ |f (x) − a| < ε. Notation: limx→x0 f (x) = a oder f (x) → a für x → x0 . Beispiel 2.9 f : R\{1} → R, f (x) = x2 −1 x−1 . Dann gilt limx→1 f (x) = limx→1 (x + 1) = 2. Für die Existenz und den Wert von limx→x0 f (x) ist es egal, ob die Funktion in x0 definiert ist bzw. welchen Funktionswert sie dort hat. Die Beziehung zwischen Grenzwert und Stetigkeit ist wie folgt: Lemma 2.2 (Stetigkeit und Grenzwert) Sei x0 ∈ R ein Häufungspunkt von D. Für die Funktion f : D ∪ {x0 } → R sind folgende Aussagen äquivalent: (1) limx→x0 f (x) = f (x0 ). (2) f ist stetig in x0 . Beweis: Die Voraussetzung (1) bedeutet ∀ ε > 0 ∃ δ > 0 : |x − x0 | < δ, x ∈ D\{x0 } ⇒ |f (x) − f (x0 )| < ε. ⇒ |f (x) − f (x0 )| < ε. Dagegen besagt (2) ∀ ε > 0 ∃ δ > 0 : |x − x0 | < δ, x ∈ D ∪ {x0 } Die Aussagen sind offensichlich äquivalent. Wie bei der Stetigkeit spielt auch beim Grenzwert der zugrundeliegende Definitionsbereich eine Rolle. Wir schreiben limx→x0 ,x∈D f (x), wenn wir den gewählten Definitionsbereich hervorheben möchten. Zum Beispiel werden oft einseitige Grenzwerte gebraucht: lim f (x) = x&x0 So ist etwa limx&0 x |x| = 1, lim x→x0 ,x>x0 aber f (x) und limx%0 x |x| lim f (x) = x%x0 lim x→x0 ,x<x0 f (x). = −1. Definition 2.6 (Grenzwert bei ±∞) Sei f : (r, ∞) → R für ein r ∈ R. Dann setzen wir lim f (x) = a ∈ R x→+∞ ⇔ ∀ε > 0 ∃ R ∈ R mit |f (x) − a| < ε für alle x > R. Analog für f : (−∞, a) → R und limx→−∞ f (x) = a. Definition 2.7 (Uneigentlicher Grenzwert) Sei f : D → R und x0 ∈ R Dann setzen wir lim f (x) = +∞ x→x0 ⇔ ∀K > 0 ∃ δ > 0 mit f (x) > K für alle x ∈ D\{x0 } mit |x − x0 | < δ. Entsprechend wird limx→x0 f (x) = −∞ erklärt. 46 Beispiel 2.10 (Rationale Funktionen) Seien p, q Polynome vom Grad m bzw. n: p(x) = a0 + a1 x + . . . + am xm (ai ∈ R, am 6= 0) q(x) = b0 + b1 x + . . . + bn xn (bj ∈ R, bn 6= 0) Setze N = {x ∈ R : q(x) = 0} und definiere f : R\N −→ R, f (x) = p(x) . q(x) Wann hat f eine stetige Fortsetzung bei x0 ∈ N ? Dazu sei x0 eine µ-fache Nullstelle von p, evtl. µ = 0 falls p(x0 ) 6= 0, und eine ν-fache Nullstelle von q mit ν ≥ 1. Also gilt p(x) = (x − x0 )µ pe(x) mit q(x) = (x − x0 )ν qe(x) mit Es folgt und wir erhalten pe(x0 ) 6= 0, qe(x0 ) 6= 0. p(x) pe(x) = (x − x0 )µ−ν für x ∈ R\N, q(x) qe(x) µ > ν ⇒ limx→x0 f (x) = 0, (x0 ) µ = ν ⇒ limx→x0 f (x) = pqee(x 6= 0 0) sowie Im Fall µ < ν hat f in x0 eine Polstelle. Sei zum Beispiel pe(x0 )/e q (x0 ) > 0. Dann ergibt sich für limx→x0 f (x) ν − µ gerade ν − µ ungerade x & x0 +∞ +∞ x % x0 +∞ −∞ Um das Verhalten des Polynoms für x → +∞ zu untersuchen, ist es günstig, x = 1/y zu substituieren und den Grenzwert für y & 0 zu bestimmen, und zwar gilt lim f (x) = a x→+∞ ⇔ 1 lim f ( ) = a. y y&0 Wir berechnen 1 a0 + a1 y −1 + . . . + am y −m a0 y m + a1 y m−1 + . . . + am f( ) = = y n−m . −n −1 y b0 + b1 y + . . . + bn y b0 y n + b1 y n−1 + . . . + bn Es folgt m < n ⇒ limx→+∞ f (x) = 0, m m = n ⇒ limx→+∞ f (x) = abm 6= 0, = ±1. m > n ⇒ limx→+∞ f (x) = ±∞ falls sign abm n Satz 2.4 (Rechenregeln für Grenzwerte) Für den Grenzwert von Funktionen gelten folgende Regeln (auf einen Beweis wird verzichtet). 47 (1) Es gelte f (x) → a und g(x) → b für x → x0 ∈ R ∪ {±∞}. Dann folgt für λ, µ ∈ R λf (x) + µg(x) → λa + µb für x → x0 , f (x) g(x) → ab für x → x0 , f (x)/g(x) → a/b für x → x0 , falls b 6= 0. f g (2) Betrachte g ◦ f : D −→ E −→ R, wobei f (D) ⊂ E. Gilt f (x) → a mit x → x0 und ist g stetig in a, so folgt (g ◦ f )(x) → g(f (a)) mit x → x0 . (3) Falls f (x) → a, g(x) → b für x → x0 und f ≤ g auf Uδ (x0 )\{x0 }, so folgt a ≤ b. (4) Ist f > 0 auf D, so gilt: limx→x0 f (x) = 0 ⇔ limx→x0 3 1 f (x) = +∞. Zwischenwertsatz und Umkehrfunktionen Satz 3.1 (Zwischenwertsatz) Sei f : [a, b] → R stetig. Dann nimmt f jeden Wert zwischen f (a) und f (b) an. Beweis: Sei oBdA f (a) < f (b). Zu y ∈ f (a), f (b) konstruieren wir die gesuchte Lösung x ∈ [a, b] der Gleichung f (x) = y mittels Intervallhalbierung. Wir setzen dazu I0 = [a, b] und bestimmen induktiv Ik = [ak , bk ] mit |Ik | = 21−k |I0 | und f (ak ) ≤ y ≤ f (bk ) für alle k. Ist Ik schon gefunden für ein k ≥ 0 und mk = 12 (ak + bk ), so setzen wir Es gibt genau ein x ∈ 4.5) folgt, da f stetig, T∞ f (mk ) ≥ y ⇒ Ik+1 := [ak , mk ] f (mk ) < y ⇒ Ik+1 := [mk , bk ]. k=0 Ik , und wegen x = limk→∞ ak = limk→∞ bk (vgl. Kap. I, Satz f (x) = lim f (ak ) ≤ y ≤ lim f (bk ) = f (x). k→∞ k→∞ Folgerung 3.1 Sei I ⊂ R ein Intervall und f : I → R stetig. Dann ist f (I) ein Intervall mit Endpunkten α = inf x∈I f (x) und β = supx∈I f (x). Bemerkung. Unendliche Intervallgrenzen sind hier zulässig. Beweis: Zu y ∈ (α, β) gibt es x1 , x2 ∈ I mit f (x1 ) < y < f (x2 ). Dann gibt es nach Satz 3.1 ein x ∈ [x1 , x2 ] (bzw. x ∈ [x2 , x1 ]) mit f (x) = y. Es folgt (α, β) ⊂ f (I) ⊂ [α, β]. Jede streng monotone Funktion f : I → R ist injektiv und hat damit eine Umkehrfunktion g : f (I) → R. Ein Beispiel ist die Potenzfunktion; wir sehen, dass der Graph von f und der Graph der Umkehrfunktion f −1 = g durch Spiegelung an der Winkelhalbierenden des ersten Quadranten auseinander hervorgehen. 48 Zum nächsten Lemma vgl. das entsprechende Resultat für Folgen, Satz 4.3 in Kapitel 1. Lemma 3.1 (Einseitige Grenzwerte monotoner Funktionen) Sei D ⊂ R und f : D → R sei monoton wachsend. Für x0 ∈ R gebe es eine Folge xn ∈ D mit xn & x0 (bzw. xn % x0 ). Dann existiert der Grenzwert limx&x0 f (x) (bzw. limx% f (x)) im eigentlichen oder uneigentlichen Sinn. Beweis: Es gilt für jede Folge xn & x0 , xn ∈ D, inf{f (x) : x > x0 } ≤ lim inf f (xn ) n→∞ (da xn > x0 ) ≤ lim sup f (xn ) n→∞ ≤ f (x0 ), falls x0 > x0 (da xn < x0 für n hinreichend groß). Wir bilden das Infimum über alle x0 > x0 und erhalten Gleichheit in der obigen Abschätzung, also gilt (siehe Übungsaufgabe 3, Serie 6) lim f (x) = inf{f (x) : x > x0 } und analog lim f (x) = sup{f (x) : x < x0 }. x&x0 x%x0 (3.1) Satz 3.2 (Monotonie und Umkehrfunktion) Sei I ⊂ R ein Intervall mit Endpunkten a < b, und sei f : I → R streng monoton wachsend und stetig. Dann gilt: (1) Die Umkehrfunktion g : f (I) → R ist ebenfalls streng monoton wachsend und stetig. (2) I ∗ := f (I) ist ein Intervall mit Endpunkten α := limx&a f (x) < limx%b f (x) =: β. (3) limy&α g(y) = a und limy%β g(y) = b. Beweis: Seien y1 , y2 ∈ f (I) mit y1 < y2 . Wäre g(y1 ) ≥ g(y2 ), so folgt aus der Monotonie von f y1 = f g(y1 ) ≥ f g(y2 ) = y2 , im Widerspruch zur Annahme. Also ist g streng monoton wachsend. Für y0 = f (x0 ) gilt somit {y : y ∈ f (I), y > y0 } = {f (x) : x ∈ I, x > x0 } und wir erhalten x0 = g(y0 ) ≤ lim g(y) y&y0 (da g monoton wachsend) = inf{g(y) : y ∈ f (I), y > y0 } (nach (3.1)) = inf{g f (x) : x ∈ I, x > x0 } = x0 . | {z } =x Entsprechend wird die linksseitige Stetigkeit und damit die Stetigkeit von g in y0 gezeigt. Nach Folgerung 3.1 ist I ∗ = f (I) ein Intervall mit linkem Randpunkt inf f (x) = x≥a = inf f (x) x>a lim f (x) x&a (da f stetig in a, falls a ∈ I) (nach (3.1)). 49 Genauso ergibt sich, dass β = limx%b f (x) der rechte Endpunkt von I ∗ ist. Die Aussage (3) folgt aus (1) und (2), angewandt auf die Umkehrfunktion g statt f . Ergänzung: In der Situation des Satzes gilt genauer a ∈ I ⇔ α ∈ I∗ b ∈ I ⇔ β ∈ I ∗. und (3.2) Denn aus a ∈ I folgt α = limx&a f (x) = f (a) ∈ f (I), da f stetig in a. Andererseits gilt f (x) > α für x > a, denn wäre f (x) = α für ein x > a, so wäre f (ξ) < α für ξ ∈ (a, x), ein Widerspruch. Aus α ∈ I ∗ = f (I) folgt deshalb schon α = f (a), insbesondere a ∈ I. Wir wollen den Satz nun auf die Exponentialfunktion anwenden. Zur Erinnerung: exp : R → R, exp(x) = lim (1 + n→∞ x n ) . n In Kapitel 1, Satz 4.4 hatten wir die Existenz des Grenzwerts bewiesen. Von dort ist außerdem Folgendes schon bekannt: n > −x ⇒ (1 + x n+1 x ) ≥ (1 + )n n+1 n exp(x) exp(−x) = 1 (Kapitel 1, (4.3)), (Kapitel 1, (4.4)). Lemma 3.2 Es gelten folgende Aussagen: (1) exp(x) > 0, exp(0) = 1. (2) exp(x) ≥ 1 + x für alle x ∈ R, exp(x) ≤ (3) limn→∞ xn = x ⇒ limn→∞ (1 + xn n n ) 1 1−x für x < 1. = exp(x). Beweis: exp(x) ≥ 1 für x ≥ 0 und exp(0) = 1 gelten nach Definition. Mit Kap. 1, (4.4) folgt für x < 0 dann exp(x) = 1/ exp(−x) ∈ (0, 1], und (1) ist gezeigt. Die Bernoulli-Ungleichung (Kap. I, Satz 2.3) liefert (1 + x x n ) ≥1+n =1+x n n (für n > −x), also exp(x) = limn→∞ (1 + nx )n ≥ 1 + x. Wieder mit Kap. 1, (4.4) erhalten wir weiter exp(x) = 1 1 ≤ exp(−x) 1−x für x < 1. Wir zeigen (3) zuerst im Fall limn→∞ xn = 0, und zwar gilt, wobei oBdA −1 < xn < 1, xn n ) (Bernoulli) n xn k ≤ lim (1 + ) (nach Kap. I, (4.3)) k→∞ k = exp(xn ) (Definition von exp) 1 ≤ (nach (2)). 1 − xn 1 + xn ≤ (1 + 50 Mit n → ∞ folgt limn→∞ (1 + xnn )n = 1 = exp(0). Für limn→∞ xn = x ∈ R berechnen wir schließlich, indem wir den schon bewiesenen Fall x = 0 anwenden, (1 + xnn )n = (1 + nx )n 1+ + xnn − 1 + nx x n also lim (1 + n→∞ x n n = xn − x 1+ n(1 + nx ) n −→ 1, xn n x ) = lim (1 + )n = exp(x). n→∞ n n Satz 3.3 (Eigenschaften der Exponentialfunktion) Sei exp die in Kapitel 1, Satz 4.4 definierte Exponentialfunktion. (1) Es gilt die Funktionalgleichung exp(x + y) = exp(x) exp(y) für alle x, y ∈ R. (2) exp : (−∞, ∞) → (0, ∞) ist streng monoton wachsend, stetig und bijektiv. Es gilt exp(x) → +∞ mit x → +∞ und exp(x) → 0 mit x → −∞. Bemerkung. In der Sprache der Algebra bedeutet der Satz insbesondere: exp : (R, +) → (R+ , · ) ist ein Gruppenisomorphismus. Beweis: Die Funktionalgleichung folgt aus Lemma 3.2 (3): y x lim (1 + )n lim (1 + )n n→∞ n→∞ n n x + y + xy/n n = lim 1 + n→∞ n = exp(x + y). exp(y) exp(y) = Fr x1 < x2 ist nach Lemma 3.2 (1) und (2) exp(x2 ) = exp(x2 − x1 ) exp(x1 ) > exp(x1 ). | {z } | {z } ≥1+x2 −x1 >1 >0 Die Stetigkeit von exp in x0 = 0 folgt direkt aus Lemma 3.2 (2), und für beliebiges x0 ∈ R verwenden wir wieder die Funktionalgleichung exp(x) = exp(x − x0 ) exp(x0 ) → exp(x0 ) | {z } mit x → x0 . →1 Der Grenzwert limx→+∞ exp(x) = +∞ folgt direkt aus Lemma 3.2 (2), und limx→−∞ exp(x) = 0 ergibt sich dann aus Kapitel 1, (4.4). Die behauptete Surjektivität folgt somit aus dem Zwischenwertsatz bzw. aus Folgerung 3.1. 51 Folgerung 3.2 (Definition des Logarithmus) Die Funktion exp : (−∞, ∞) → (0, ∞) hat eine streng monoton wachsende, stetige und bijektive Umkehrfunktion log : (0, ∞) → (−∞, ∞), y 7→ log(y), den (natürlichen) Logarithmus. Nach Definition haben wir also log(exp(x)) = x ∀ x ∈ (−∞, ∞), exp(log(y)) = y ∀ y ∈ (0, ∞). Es gilt log(1) = 0, und log erfüllt die Funktionalgleichung log(y1 y2 ) = log(y1 ) + log(y2 ) ∀ y1 , y2 > 0. Außerdem ist limy&0 log(y) = −∞ und limy→∞ log(y) = +∞. Beweis: Die Existenz, Monotonie und Stetigkeit der Umkehrfunktion folgen aus Satz 3.2 und Satz 3.3, ebenso die behaupteten Grenzwerte. Die Funktionalgleichung für log ergibt sich aus der Funktionalgleichung für exp durch Einsetzen von x1 = log(y1 ) und x2 = log(y2 ): log(y1 y2 ) = log (exp(x1 ) exp(x2 )) = log (exp(x1 + x2 )) = log(y1 ) + log(y2 ). Lemma 3.3 Für a > 0 und r ∈ Q gilt ar = exp (r log(a)) . (3.3) Beweis: Wir behaupten zunächst exp(p x) = exp(x)p für p ∈ Z, x ∈ R. Für p = 0 gilt das per Definition. Für p ∈ N folgt aus der Funktionalgleichung per Induktion exp(px) = exp ((p − 1)x) exp(x) = exp(x)p−1 exp(x) = exp(x)p . Schließlich erhalten wir mit Kap. 1, Gleichung (4.4) exp(px) = 1 1 = = exp(x)p . exp(−px) exp(x)−p Sei nun r = p/q mit p ∈ Z, q ∈ N. Wir wählen oben x = log(a) und erhalten exp (r log(a))q = exp (q · r log(a)) = exp (p log(a)) = exp (log(a))p = ap . Nun ist nach Definition ap/q die eindeutig bestimmte Lösung y > 0 der Gleichung y q = ap , vgl. Übungsaufgabe 1, Serie 4. Die Behauptung folgt. Definition 3.1 (Potenz mit rellen Exponenten) Für a > 0, x ∈ R definieren wir ax = exp (x log(a)) . 52 Diese Definition ist nach Lemma 3.3 konsistent mit der auf Q bereits in Übungsaufgabe 1, Serie 4 definierten Funktion r 7→ ar , r ∈ Q. Umgekehrt besitzt nach Übungsaufgabe 1, Serie 9 die auf der dichten Menge Q in Übungsaufgabe 1, Serie 4 erklärte Funktion höchstens eine Fortsetzung, die auf ganz R definiert und stetig ist. Genau dies leistet die Funktion expa : R → R, expa (x) = ax . Die Regeln der Potenzrechnung (mit a, b > 0) ax ay = ax+y (ax )y = ax y x 1 = a−x ax bx = (ab)x a ergeben sich leicht aus den Definitionen und den Funktionalgleichungen von exp bzw. log. Weiter lassen sich nun auch die Potenzfunktionen für beliebige reelle Exponenten erklären: f : (0, ∞) → R, f (x) = xα = exp (α log(x)) . Folgerung 3.3 (Charakterisierung von exp durch die Funktionalgleichung) Die Funktion f : R → R habe folgenden beiden Eigenschaften: (1) f (x + y) = f (x) f (y) (2) limx→0 f (x) = f (0) für alle x, y ∈ R, (Stetigkeit bei x0 = 0). Dann ist entweder a := f (1) > 0 und f (x) = ax für alle x, oder f ist identisch Null. 2 Beweis: Es ist f (1) = f 12 ≥ 0. Falls f (1) = 0, so folgt für alle x ∈ R f (x) = f (x − 1) + 1 = f (x − 1) f (1) = 0. Im Fall a > 0 kann wie oben argumentiert werden (Übungsaufgabe). Zum Abschluss dieses Abschnitts wollen wir die Funktionalgleichung der Exponentialfunktion im Zusammenhang mit der Zinseszinsrechnung interpretieren. Zur Erinnerung: Anlegen des Startkapitals K0 mit jährlichem Zinssatz x ∈ R ergibt im linearen Modell nach einem Jahr (1 + x)K0 , im Zinseszinsmodell dagegen K(1) = K0 lim (1 + n→∞ x n ) = K0 exp(x). n Allgemeiner muss nach t Jahren dann gelten K(t) = K0 lim (1 + n→∞ xt n ) = K0 exp(xt). n Bei gleichem Zinssatz x sollte es nun egal sein, ob das Geld zunächst für einen Zeitraum t1 angelegt wird und dann die ersparte Summe für einen weiteren Zeitraum t2 , oder eben gleich für die Gesamtdauer t1 + t2 . Genau das besagt die Funktionalgleichung: K(t1 + t2 ) = K0 exp(x(t1 + t2 )) = K0 exp(xt1 ) exp(xt2 ). 53 4 Existenz von Extremwerten Extremwertaufgaben spielen sowohl in der Theorie wie in den Anwendungen der Analysis eine zentrale Rolle. In diesem kurzen Abschnitt soll die Existenz von Minimalstellen bzw. Maximalstellen unter geeigneten Voraussetzungen gezeigt werden. Beispiel 4.1 Ein Triathlet muss von einem Punkt a1 = (x1 , y1 ), y1 > 0, im Wasser zu einem Punkt a2 = (x2 , y2 ), y2 < 0 auf dem Land. Für y > 0 schwimmt er geradlinig mit Geschwindigkeit v − 1, für y < 0 rennt er geradlinig mit Geschwindigkeit v2 . An welchem Punkt (x, 0) muss er das Ufer ansteuern, um seine Zeit zu minimieren? Ist s1 bzw. s2 die im Wasser bzw. zu Land zurückgelegte Strecke, so ist hier also folgende Funktion zu minimieren: f (x) = s1 s2 1 + = v1 v2 v1 q (x − x1 )2 + y12 + 1 v2 q (x − x2 )2 + y22 . Beispiel 4.2 Gegeben sind drei Punkte a1 , a2 , a3 ∈ R2 (z.B. die Städte Freiburg, Tübingen und Zürich). Gesucht ist ein Punkt x0 ∈ R2 , dessen Abstandssumme von den drei Punkten minimal ist (optimaler Treffpunkt). Zu minimieren ist hier die Funktion f : R2 → R2 , f (x) = |x − a1 | + |x − a2 | + |x − a3 |. Nicht jede Optimierungsaufgabe hat eine Lösung. Betrachte etwa für x ∈ R2 die Summe der Abstände von zwei gegebenen Punkten a und b: f (x) = |x − a| + |x − b| (a, b ∈ R2 ). In der Menge der Punkte x, die nicht auf der Strecke von a nach b liegen, können wir die Funktion nicht minimieren, weil das Infimum inf{f (x) : x ∈ R2 , x ∈ / [a, b]} = |a − b| durch 2 keinen Punkt aus R \[a, b] realisiert wird. Dieses Beispiel sieht etwas künstlich aus, aber bei komplexen Extremwertaufgaben ist die Frage der Existenz einer Lösung oft schwer zu entscheiden und von großer Wichtigkeit. Definition 4.1 (Kompakte Menge) Eine Menge D ⊂ Rm heißt kompakt (genauer: folgenkompakt), wenn gilt: zu jeder Folge (xn )n∈N von Punkten xn ∈ D gibt es eine Teilfolge (xnk )k∈N , die konvergiert und deren Grenzwert in D liegt: lim xnk = x0 ∈ D. k→∞ Satz 4.1 (Heine-Borel) Für D ⊂ Rm sind äquivalent: (1) D ist kompakt. (2) D ist abgeschlossen und beschränkt. 54 Beweis: Wir zeigen zuerst die Implikation (1) ⇒ (2). Für die Abgeschlossenheit von D ist eine beliebige Folge xn ∈ D mit limn→∞ xn = x0 ∈ Rm zu betrachten. Zu zeigen ist: x0 ∈ D (vgl. Definition 5.10). Da nach Voraussetzung d kompakt, gibt es eine Teilfolge xnk , die gegen ein x00 ∈ D konvergiert. Da der Grenzwert der Teilfolge eindeutig bestimmt ist, folgt x0 = x00 ∈ D, q.e.d. Wäre D nicht beschränkt, so gibt es zu n ∈ N ein xn ∈ D mit |xn | ≥ n. Da D kompakt, gibt es eine konvergente Teilfolge xnk , und diese ist nach Kapitel 1, Satz 3.2 beschränkt. Aber |xnk | ≥ nk → ∞, ein Widerspruch. Jetzt beweisen wir umgekehrt (2) ⇒ (1). Sei (xn )n∈N eine Folge in D. Da D beschränkt, gibt es nach Bolzano-Weierstraß (Satz 4.7 bzw. Satz 5.3) eine Teilfolge (xnk )k∈N , die gegen ein x0 ∈ Rm konvergiert. Es ist x0 ∈ D, weil D nach Voraussetzung abgeschlossen ist. Definition 4.2 Eine Funktion f : D → Rm heißt beschränkt, wenn es eine K > 0 gibt mit |f (x)| ≤ K für alle x ∈ D ( mit andern Worten: wenn die Menge f (d) ⊂ R beschränkt ist). Satz 4.2 (Existenz von Extremalstellen) Sei D ⊂ Rm kompakt, D 6= ∅, und f : D → R sei stetig. Dann ist f beschränkt und f nimmt sein Infimum und Supremum auf D an: es gibt x0 ∈ D und x1 ∈ D mit f (x0 ) = inf f (x) x∈D bzw. f (x0 ) = sup f (x). x∈D Beweis: Wir zeigen die Aussage für das Infimum. Nach Kapitel 1, Folgerung 5.1 gibt es eine Folge (xn )n∈N mit xn ∈ D und f (xn ) → inf x∈D f (x). Da D kompakt, gibt es eine konvergente Teilfolge xnk → x0 ∈ D. Es folgt, da f stetig, −∞ < f (x0 ) = lim f (xnk ) = inf f (x). k→∞ x∈D Die Bezeichnungen Minimum und Maximum sind nur dann zulässig, wenn die Existenz der Lösung der Extremwertaufgabe bakannt ist. Die folgenden Fälle illustrieren, was im Fall D nicht kompakt schiefgehen kann: Beispiel 4.3 D = (−1, 1), D = (−1, 1), D = (1, ∞), 1 f (x) = 1−x f ist nicht beschränkt, kein Maximum. 2 : f (x) = x : Extremwerte für x → ±1 ∈ / D. 1 f (x) = 1+x : Infimum für x → ∞. 2 Wir zeigen jetzt am Beispiel der Abstandssumme von drei Punkten a1 , a2 , a3 ∈ R2 , wie der Existenzsatz eingesetzt wird. Als erstes zeigen wir, dass die Funktion f : R2 → R2 , f (x) = |x − a1 | + |x − a2 | + |x − a3 | 55 Lipschitzstetig mit Konstante L = 3 ist. 3 3 X X |f (x) − f (y)| = |x − ai | − |y − ai | ≤ ≤ i=1 3 X i=1 ||x − ai | − |y − ai || i=1 3 X |(x − ai ) − (y − ai )| i=1 = 3 |x − y|. Wir wollen die Funktion auf ganz R2 minimieren und haben das Problem, dass R2 unbeschränkt und damit nicht kompakt ist. Aber für große |x| ist f (x) ebenfalls groß, so dass weit entfernte Punkte keine Rolle spielen sollten. Wir behaupten: es gibt ein R > 0, so dass mit D := {x ∈ R2 : |x| ≤ R} gilt: inf f (x) = inf f (x). x∈R2 x∈D (4.1) Denn es gilt einerseits inf f (x) ≤ f (0) = |a1 | + |a2 | + |a3 |, x∈D und andererseits haben wir für |x| ≥ R f (x) = ≥ 3 X i=1 3 X |x − ai | (|x| − |ai |) i=1 ≥ 3 R − (|a1 | + |a2 | + |a3 |). Wählen wir also R := |a1 | + |a2 | + |a3 | > 0, so folgt inf f (x) ≤ R < 2 R ≤ inf f (x), x∈D |x|≥R und Behauptung (4.1) ist gezeigt. Es bleibt nun die Funktion f auf D zu minimieren. Die Menge D ist aber nach Definition beschränkt, nämlich durch R. Ist xn ∈ D und xn → x ∈ R2 , so folgt aus der Stetigkeit der Normfunktion |x| = limn→∞ |xn | ≤ R, also x ∈ D. Damit ist D auch abgeschlossen, und nach Satz 4.2 gibt es ein x0 ∈ D mit f (x0 ) = inf f (x) = inf f (x). x∈R2 x∈D Dieses x0 ist die gesuchte Minimalstelle. 56 Kapitel 3 Differentialrechnung für Funktionen einer Variablen 1 Die Ableitung: Definition und Regeln Definition 1.1 (Ableitung) Sei D ⊂ R offen. Die Funktion f : D → R hat in x0 ∈ D die Ableitung a ∈ R (Notation: f 0 (x0 ) = a), falls gilt: lim x→x0 f (x) − f (x0 ) = a. x − x0 (1.1) Wir nennen f differenzierbar in x0 , falls es ein a ∈ R mit (1.1) gibt, falls also der in (1.1) betrachtete Grenzwert existiert. Bemerkung. f 0 (x0 ) = a ⇔ f (x0 + h) − f (x0 ) = a. h→0 h lim Leibniz interessierte sich für die Definition der Ableitung im Zusammenhang mit dem Problem, die Tangente an eine ebene Kurve in einem gegebenen Punkt zu definieren. Sei die Kurve als Graph von f : D → R gegeben und die Tangente im Punkt (x0 , f (x0 )) gesucht. (x0 ) Der Differenzenquotient f (x)−f ist geometrisch die Steigung der Sekante. Die Tangente x−x0 wird nun definiert als diejenige Gerade y = g(x) = a(x − x0 ) + b, so dass gilt: 1. Die Gerade geht durch (x0 , f (x0 )), das heißt b = f (x0 ). 2. Die Gerade hat die Steigung a = limx→x0 f (x)−f (x0 ) x−x0 = f 0 (x0 ). Aus den Bedingungen ergibt sich die Gleichung g(x) = f (x0 ) + f 0 (x0 )(x − x0 ) (x ∈ R). Die gegebene Definition der Ableitung ist auch für vektorwertige Funktionen f : D → Rn sinnvoll. Die Ableitung ist dann ein Vektor a ∈ Rn und es gilt: lim x→x0 f (x) − f (x0 ) =a x − x0 ⇔ 57 | f (x) − f (x0 ) − a| → 0. x − x0 Hierbei bezeichnet | · | die Euklidische Norm, siehe Kap. I, Definition 5.5. Der dort bewiesene Satz 5.5 über die Äquivalenz von Normkonvergenz und Konvergenz der Koordinaten besagt hier Folgendes: Lemma 1.1 Sei D ⊂ R offen. Die Funktion f : D → Rn ist genau dann in x0 ∈ D differenzierbar, wenn alle Koordinatenfunktionen f i : D → R, i = 1, . . . , n, in x0 differenzierbar sind. Die Ableitung kann dann koordinatenweise berechnet werden, das heißt es gilt: f 0 (x0 ) = ((f 1 )0 (x0 ), . . . , (f n )0 (x0 )) ∈ Rn . Newton entwickelte den Differentialkalkül, um zum Beispiel die Dynamik der Planetenbewegung zu erklären. Kepler hatte vorher aufgrund von Beobachtungen des Astronoms Tycho Brahe drei Gesetze für die Bewegung der Planeten geraten – Newton konnte diese Gesetze nun mithilfe des Differentialkalküls (Englisch: Calculus) allein aus der Formel für die Anziehungskraft (dem Gravitationsgesetz) herleiten. Die Bewegung eines Massenpunkts (Planeten) wird dabei durch eine Abbildung f : D −→ R3 , f (t) = x(t), y(t), z(t) beschrieben, d. h. die Koordinaten des Massenpunkts zur Zeit t ∈ D bzgl. eines Euklidischen Koordinatensystems sind durch f (t) gegeben. Erstes Ziel ist dann die Definition der Momentangeschwindigkeit als Vektor in R3 . Die vektorielle Durchschnittsgeschwindigkeit (t0 ) auf dem Zeitintervall [t0 , t] ist der Quotient f (t)−f , nämlich Weg:Zeit. t−t0 Die Momentangeschwindigkeit v(t0 ) zum Zeitpunkt t = t0 ist deshalb als vektorielle Ableitung zu definieren (wobei Newton einen Punkt statt eines Strichs benutzt hat): v(t0 ) = f 0 (t0 ) = (x0 (t0 ), y 0 (t0 ), z 0 (t0 )) ∈ R3 . Definition 1.2 (Ableitungsfunktion) Sei D ⊂ R offen. Die Funktion f : D → R heißt differenzierbar auf D (oder einfach differenzierbar), falls f in jedem Punkt x0 ∈ D differenzierbar ist. Die hierdurch gegebene Funktion f 0 : D → R, x0 7→ f 0 (x0 ) = lim x→x0 f (x) − f (x0 ) ∈R x − x0 heißt Ableitung von f . Beispiel 1.1 Für eine konstante Funktion, also f (x) = c ∈ R für alle x ∈ D, gilt für x 6= x0 : f (x) − f (x0 ) c−c = =0 x − x0 x − x0 ⇒ f 0 (x0 ) = 0 bzw. f 0 = 0. Beispiel 1.2 Für die Potenzfunktionen f : R → R, (x) = xn mit n ∈ N gilt für x 6= x0 f (x) − f (x0 ) = xn−1 + xn−2 x0 + . . . + xn−2 x + xn−1 , 0 0 x − x0 also folgt mit x → x0 f 0 (x0 ) = nxn−1 0 58 für x0 ∈ R. Beispiel 1.3 Die Exponentialfunktion exp : R −→ R ist an allen Punkten x0 ∈ R differenzierbar und hat die Ableitung exp0 = exp: Fall 1: x0 = 0 Nach Kapitel 2, Lemma 3.2 gelten die Abschätzungen exp(x) − exp(0) 1 ≤ , x 1−x exp(x) − exp(0) 1 x<0 ⇒ 1≥ ≥ . x 1−x 0<x<1 ⇒ 1≤ Also folgt exp0 (0) = 1 = exp(0). Fall 2: x0 ∈ R beliebig Aus der Funktionalgleichung (Satz 3.3 (1)) und Fall 1 folgt für h 6= 0 exp(x0 + h) − exp(x0 ) exp(h) − 1 = exp(x0 ) → exp(x0 ). h h Also gilt insgesamt exp0 = exp. Beispiel 1.4 f (x) = |x| ist nicht differenzierbar in x0 = 0: f (x) − f (0) x = lim = 1 x&0 x&0 x x−0 f (x) − f (0) −x f−0 (0) := lim = lim = −1. x%0 x%0 x x−0 f+0 (0) := lim Die rechts- und linksseitige Ableitung existieren in x0 = 0, sie sind aber verschieden. Lemma 1.2 (differenzierbar = linear approximierbar) Sei f : D → R, D ⊂ R offen, und x0 ∈ D. Genau dann hat f in x0 die Ableitung a ∈ R, wenn gilt: lim h→0 r(h) = 0, h wobei r(h) = f (x0 + h) − (f (x0 ) + a h). (1.2) Beweis: Für h 6= 0 gilt f (x0 + h) − f (x0 ) f (x0 + h) − (f (x0 ) + a h) r(h) −a= = . h h h Hieraus ergibt sich die Behauptung. Satz 1.1 (differenzierbar ⇒ stetig) Ist f : D → R differenzierbar in x0 ∈ D, so ist f auch stetig in x0 . Beweis: Nach Satz 2.2 in Kapitel 2 reicht es zu zeigen, dass limh→0 f (x0 + h) = f (x0 ). Aber für h 6= 0 gilt nach Lemma 1.2 f (x0 + h) = f (x0 ) + a h + h 59 r(h) → f (x0 ) mit h → 0. h Satz 1.2 (Differenzierbarkeitsregeln) Seien f, g : D → R differenzierbar in x0 ∈ D. Dann sind auch die Funktionen αf + βg (α, β ∈ R), f g und f /g (im Fall g(x0 ) 6= 0) in x0 differenzierbar mit folgenden Ableitungen: (1) (2) (3) (αf + βg)0 (x0 ) = αf 0 (x0 ) + βg 0 (x0 ) (f g)0 (x0 ) 0 f g = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ) f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 ) (x0 ) = g(x0 )2 (Ableitung ist linear) (1.3) (Produktregel) (1.4) (Quotientenregel) (1.5) Beweis: Wir müssen jeweils für x 6= x0 die Differenzenquotienten bilden und zeigen, dass diese mit x → x0 gegen das gewünschte konvergieren. Für (1.3) haben wir (αf (x) + βg(x)) − (αf (x0 ) + βg(x0 )) x − x0 f (x) − f (x0 ) g(x) − g(x0 ) +β x − x0 x − x0 0 0 → αf (x0 ) + βg (x0 ). = α Die Produktregel (1.4) folgt durch Mischen der Terme“: ” f (x) − f (x0 ) g(x) − g(x0 ) f (x)g(x) − f (x0 )g(x0 ) = g(x) + f (x0 ) x − x0 x − x0 x − x0 → f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ), wobei die Stetigkeit von g in x0 benutzt wurde (Satz 1.1). Wir zeigen die Quotientenregel (1.5) zunächst für die Funktion 1/g, also f ≡ 1. Es gibt ein δ > 0 mit g(x) 6= 0 für |x−x0 | < δ nach Kapitel 2, Lemma 2.1. Für diese x gilt 1 1 1 1 g(x) − g(x0 ) − = − x − x0 g(x) g(x0 ) g(x)g(x0 ) x − x0 1 g 0 (x0 ) mit x → x0 . → − g(x0 )2 Für beliebiges f schreiben wir f /g = f · 1 und verwenden die Produktregel. g Beispiel 1.5 Für fn (x) = xn mit n ∈ N gilt fn0 (x) = (n − 1) xn−1 . Dies wurde schon in Beispiel 1.2 gezeigt. Hier verwenden f10 (x) = 1 für alle x ∈ R und erhalten per Induktion für n≥2 0 fn0 (x) = (f1 fn−1 )0 (x) = f10 (x)fn−1 (x) + f1 (x)fn−1 (x) = 1 xn−1 + x (n − 1)xn−2 = n xn−1 . Beispiel 1.6 Für f (x) = x−n = 1/xn mit n ∈ N gilt f 0 (x) = −n x−n−1 : f 0 (x) = − n xn−1 = −n x−n−1 . (xn )2 Beispiel 1.7 Die hyperbolischen Funktionen cosh : R → R und sinh : R → R sind definiert durch ex + e−x ex − e−x cosh x = , sinh x = . 2 2 0 (ex )0 −x folgt cosh0 = sinh und sinh0 = cosh. Wegen (e−x )0 = e1x = − (e x )2 = −e 60 Satz 1.3 (Kettenregel) Betrachte die Verkettung f g g ◦ f : D −→ E −→ R, (g ◦ f )(x) = g(f (x)). Es sei f in x0 ∈ D ⊂ R differenzierbar, und g sei in y0 = f (x0 ) ∈ E differenzierbar. Dann ist g ◦ f in x0 differenzierbar und hat die Ableitung (g ◦ f )0 (x0 ) = g 0 f (x0 f 0 (x0 ). Beweis: Wir betrachten wieder für x 6= x0 den Differenzenquotienten: g(f (x)) − g(f (x0 )) f (x) − f (x0 ) falls f (x) 6= f (x0 ) g(f (x)) − g(f (x0 )) f (x) − f (x0 ) x − x0 = x − x0 0 falls f (x) = f (x0 ). Wir definieren g(y) − g(f (x0 )) y − f (x0 ) a : E → R, a(y) = 0 g (f (x0 )) für y 6= f (x0 ) für y = f (x0 ). Die Funktion a ist stetig in y0 nach Satz 2.2. Mit x → x0 folgt, da f (x) → f (x0 ), f (x) − f (x0 g(f (x)) − g(f (x0 )) = a(f (x)) → a(f (x0 )f 0 (x0 ) = g 0 (f (x0 ))f 0 (x0 ). x − x0 x − x0 Satz 1.4 (Differenzierbarkeit der Umkehrfunktion) Sei I = (a, b) offenes Intervall, f : I → f (I) = I ∗ stetig und streng monoton. Ist dann f in x0 ∈ I differenzierbar und f 0 (x0 ) 6= 0, so ist die Umkehrfunktion g : I ∗ → I in y0 = f (x0 ) ∈ I ∗ gleichfalls differenzierbar und es gilt 1 . g 0 (y0 ) = 0 f g(y0 ) Beweis: Nach Satz 3.2 in Kapitel 2 (inklusive der Ergänzung (3.2)) ist I ∗ = (α, β) ein offenes Intervall und g : I ∗ → R ist stetig, insbesondere g(y) → g(y0 ) mit y → y0 . Für y 6= y0 folgt g(y) − g(y0 ) g(y) − g(y0 ) 1 1 = = → 0 . f (g(y)) − f (g(y0 )) y − y0 f (g(y)) − f (g(y0 )) f (x0 ) g(y) − g(y0 ) Bemerkung: Sei f : (a, b) → (α, β) in x0 differenzierbar und bijektiv mit Umkehrabbildung g : (α, β) → (a, b). Wenn die Funktion g in y0 = f (x0 ) differenzierbar ist, so folgt schon aus der Kettenregel g(f (x)) = x ⇒ g 0 (f (x0 ))f 0 (x0 ) = 1, also die Formel für die Ableitung der Umkehrfunktion. Insbesondere muss dann f 0 (x0 ) 6= 0 sein. Die Funktion f : R → R, f (x) = x3 ist streng monoton wachsend; ihre Umkehrfunktion lautet (√ 3 y für y ≥ 0 g : R → R, g(y) = √ − 3 −y für y ≤ 0. 61 Die Umkehrfunktion ist nicht differenzierbar in y = 0, denn g(y) − g(0) = y −2/3 → +∞ mit y & 0. y−0 Die Bedingung des Satzes ist hier verletzt, f 0 (0) = 0. Die beiden vorangegangengen Regeln sind in der von Leibniz eingeführten Notation besonders suggestiv. Leibniz schreibt Funktionen in der Form y = y(x) und bezeichnet die Ableitung dy mit dx ( Differentialquotient “). Dann lauten die Kettenregel und die Regel für die Ableitung ” der Umkehrfunktion wie folgt: y = y(x), z = z(y) ⇒ y = y(x), x = x(y) ⇒ dz dz dy = , dx dy dx dx 1 = dy . dy dx Bei der Anwendung dieser saloppen Notation ist jedoch darauf zu achten, wo die jeweiligen Funktionen definiert sind. Beispiel 1.8 Die Exponentialfunktion exp : R → (0, ∞) hat die Ableitung exp0 (x) = exp(x) 6= 0 für alle x ∈ R. Nach Satz 1.4 ist die Logarithmusfunktion log : (0, ∞) → R differenzierbar und es gilt log0 (y) = 1 1 1 = = . exp0 (log y) exp(log y) y Beispiel 1.9 Die Funktion f : (0, ∞) → R, f (x) = xα mit α ∈ R ist Verkettung der Funktionen exp : R → R und h : R → R, h(x) = α log(x). Mit der Kettenregel berechnen wir f 0 (x) = exp0 (h(x))h0 (x) = exp(α log(x)) α = α xα−1 . x Beispiel 1.10 Die Funktion f (x) = ax ist Verkettung von exp und h(x) = log(a) x. Deshalb gilt f 0 (x) = exp0 (h(x))h0 (x) = exp(log(a) x) log(a) = log(a)ax . Beispiel 1.11 Wir berechnen die Ableitung der Wurzelfunktion g(y) = tion von f (x) = x2 : 1 1 1 = g 0 (y) = 0 = √ . 2 g(y) 2 y f g(y) √ y als Umkehrfunk- Beispiel 1.12 Nach Übungsaufgabe 2, Serie 10 besitzt die Funktion sinh : R → R eine streng monoton wachsende Umkehrfunktion Arsinh : R → R. Da sinh0 x = cosh x > 0 für alle x ∈ R, ist die Funktion Arsinh differenzierbar und hat die Umkehrfunktion Arsinh0 (y) = 1 1 = . cosh(Arsinh(y)) sinh (Arsinh(y)) 0 62 Um dies umzuformen, beachte 2 2 cosh x − sinh x = Also gilt cosh x = p ex + e−x 2 2 − 2 = 1. 1 + sinh2 x und es folgt 1 Arsinh0 (y) = p 1 + y2 2 ex − e−x 2 . Mittelwertsatz und Anwendungen Definition 2.1 Die Funktion f : (a, b) → R hat in x0 ∈ (a, b) ein lokales Minimum, falls es ein δ > 0 gibt, so dass gilt: f (x0 ) ≤ f (x) für alle x ∈ Uδ (x0 ) = (x0 − δ, x0 + δ). Ist sogar f (x0 ) < f (x) für x ∈ Uδ (x0 )\{x0 }, so heißt das lokale Minimum isoliert. Ein (isoliertes) lokales Maximum ist entsprechend definiert. Satz 2.1 (notwendige Bedingung für Extrema) Die Funktion f : (a, b) → R habe in x0 ∈ (a, b) ein lokales Extremum (d. h. Minimum oder Maximum). Ist f in x0 differenzierbar, so gilt f 0 (x0 ) = 0. Beweis: Wir nehmen an, dass f ein lokales Minimum hat. Es gibt also ein δ > 0 mit f (x) ≥ f (x0 ) für x ∈ (x0 − δ, x0 + δ). Daraus folgt x ∈ (x0 , x0 + δ) ⇒ x ∈ (x0 − δ, , x0 ) ⇒ f (x) − f (x0 ) ≥0 x − x0 f (x) − f (x0 ) ≤ 0. x − x0 Mit x & x0 folgt f 0 (x0 ) ≥ 0, mit x % x0 folgt f 0 (x0 ) ≤ 0. Die Funktion f (x) = x3 erfüllt f 0 (0) = 0, aber in x = 0 liegt kein lokales Extremum vor. Die Bedingung f 0 (x0 ) = 0 ist notwendig für eine lokale Extremalstelle einer differenzierbaren Funktion, aber sie ist nicht hinreichend. Das Argument des Beweises von Satz 2.1 liefert auch dann etwas, wenn eine Funktion f : [a, b] → R ein lokales Extremum in einem Randpunkt von [a, b] hat und dort einseitig differenzierbar ist. Ist zum Beispiel a eine Extremalstelle von f , so folgt ( f (x) − f (a) ≥ 0 (Minimum) 0 f+ (a) = lim x&a x−a ≤ 0 (Maximum). Es ist eine zentrales Problem der Analysis, aus Eigenschaften der Ableitung auf Eigenschaften der Funktion selbst zu schließen: 63 Informationen über f 0 −→ Verhalten von f . Der Mittelwertsatz ist ein einfaches und gleichzeitig effektives Hilfsmittel, um solche Schlüsse zu ziehen. Satz 2.2 (Mittelwertsatz der Differentialrechnung) Sei f : [a, b] → R stetig, differenzierbar auf (a, b). Dann gibt es ein ξ ∈ (a, b) mit f 0 (ξ) = f (b) − f (a) . b−a Beweis: Schritt 1 Beweis im Fall f (a) = f (b) = 0 (Satz von Rolle) Wir brauchen ein ξ ∈ (a, b) mit f 0 (ξ) = 0. Es ist deshalb naheliegend, nach Extremalstellen zu suchen. Nach Kapitel 3, Satz 4.2 gibt es ξ1 , ξ2 ∈ [a, b] mit f (ξ1 ) = inf f (x) und x∈[a,b] f (ξ2 ) = sup f (x). x∈[a,b] Ist ξ1 ∈ (a, b), so folgt f 0 (ξ1 ) = 0 nach Satz 2.1 und wir können ξ := ξ1 wählen. Analog, wenn ξ2 ∈ (a, b). Im verbleibenden Fall ξ1 , ξ2 ∈ {a, b} folgt inf f = sup f = 0 bzw. f (x) = 0 für alle x ∈ [a, b], und damit auch f 0 (x) = 0 für alle x. Schritt 2 Beweis für f (a), f (b) ∈ R beliebig Definiere h : [a, b] −→ R durch Abziehen der Sekante “ ” h(x) = f (x) − g(x), g(x) = f (a) + f (b) − f (a) (x − a). b−a Dann erfüllt h die Voraussetzungen von Schritt 1, insbesondere gilt h(a) = h(b) = 0. Also existiert ein ξ ∈ (a, b) mit 0 = h0 (ξ) = f 0 (ξ) − Satz von Rolle: ∃ horizontale Tangente f (b) − f (a) . b−a Mittelwertsatz: ∃ sehnenparallele Tangente 64 Folgerung 2.1 (Monotoniekriterium) Sei f differenzierbar auf (a, b), stetig auf [a, b]. Dann gelten folgende Aussagen: f 0 (x) ≥ 0 für alle x ∈ (a, b) ⇒ f ist wachsend auf [a, b] f 0 (x) ≤ 0 für alle x ∈ (a, b) ⇒ f ist fallend auf [a, b] f 0 (x) = 0 für alle x ∈ (a, b) ⇒ f ist konstant. Bei strikter Ungleichung folgt strenge Monotonie auf [a, b]. Beweis: Sei a ≤ x1 < x2 ≤ b. Nach dem Mittelwertsatz ≥0 > 0 0 f (x2 ) − f (x1 ) = f (ξ) (x2 − x1 ) ≤ 0 | {z } <0 >0 =0 gibt es ein ξ ∈ (x1 , x2 ), so dass gilt: wenn wenn wenn wenn wenn f 0 (ξ) ≥ 0 f 0 (ξ) > 0 f 0 (ξ) ≤ 0 . f 0 (ξ) < 0 f 0 (ξ) = 0 Definition 2.2 Sei f : (a, b) → R. Eine differenzierbare Funktion F : (a, b) → R heißt Stammfunktion von f , wenn gilt: F0 = f ⇔ F 0 (x) = f (x) für alle x ∈ (a, b). Folgerung 2.2 Ist F eine Stammfunktion von f auf (a, b), so ist jede Stammfunktion von f auf (a, b) von der Form F + c für eine Konstante c ∈ R. Beweis: Sei G auch Stammfunktion auf (a, b). Es folgt (G − F )0 = G0 − F 0 = f − f = 0. Nach Folgerung 2.1 gibt es eine Konstante c ∈ R mit G − F = c, also G = F + c. Die Gleichung F 0 = f ist ein elementares Beispiel für eine Differentialgleichung. Folgerung 2.2 sagt aus, dass eine Lösung der Gleichung bis auf eine additive Konstante c ∈ R eindeutig bestimmt ist. Es schließt sich hier unmittelbar die Frage nach der Existenz an: Für welche f ist die Differentialgleichung F 0 = f auf dem Intervall (a, b) lösbar? Wie gesagt, ist dies eine zentrale Frage der Analysis. Wir werden eine Antwort geben, sobald uns die Integralrechnung zur Verfügung steht, und zwar mit dem Hauptsatz der Differentialund Integralrechnung. Folgerung 2.3 (Schrankensatz) Ist f : [a, b] → R stetig und differenzierbar auf (a, b), so gilt für a ≤ x1 < x2 ≤ b: f 0 (x) ≥ m für alle x ∈ (a, b) ⇒ f 0 (x) ≤ M für alle x ∈ (a, b) ⇒ 65 f (x2 ) − f (x1 ) ≥m x2 − x1 f (x2 ) − f (x1 ) ≤ M. x2 − x1 Beweis: Wir zeigen die erste Aussage. Mit g(x) = mx gilt (f − g)0 = f 0 − g 0 ≥ m − m = 0. Nach Folgerung 2.1 ist f − g wachsend, d. h. f (x2 ) − m x2 ≥ f (x1 ) − m x1 . Die Behauptung folgt. Für vektorwertige Funktionen f : [a, b] → Rn , n ≥ 2, gilt der Mittelwertsatz der Differentialrechnung nicht. Es gibt Abbildungen f : [a, b] → R2 mit f (a) = f (b), aber f 0 (ξ) 6= 0 für alle ξ ∈ (a, b); die Gleichung f (b)−f (a) = f 0 (ξ) (b−a) kann dann nicht erfüllt sein. Ein konkretes Beispiel ist die Bewegung auf einer Kreislinie mit konstanter Absolutgeschwindigkeit. Nach einer gewissen Zeit kommt man wieder am Ausgangspunkt an, ohne dass die Geschwindigkeit jemals Null war (im nächsten Abschnitt werden wir die gleichförmige Kreisbewegung noch ausführlich behandeln). Gewisse Konsequenzen des Mittelwertsatzes lassen sich dennoch auf den verktorwertigen Fall übertragen. Dies gilt für Folgerung 2.2 (F 0 = 0 ⇒ F = const.) sowie für die folgende Aussage. Folgerung 2.4 (f 0 beschränkt ⇒ f Lipschitz) Sei f : [a, b] → Rn stetig und auf (a, b) differenzierbar. Falls |f 0 (x)| ≤ L für alle x ∈ (a, b), so folgt |f (x1 ) − f (x2 )| ≤ L|x1 − x2 | für alle x1 , x2 ∈ [a, b]. Beweis: Um die Aussage auf den R-wertigen Fall zu reduzieren, betrachten wir für einen beliebigen Vektor v ∈ Rn mit |v| = 1 die Funktion ϕ : [a, b] → R, ϕ(x) = hv, f (x)i = n X v i f i (x). i=1 Aus der Cauchy-Schwarz-Ungleichung (Kapitel 1, Satz 5.4) folgt 0 ϕ (x) = n X v i (f i )0 (x) = hv, f 0 (x)i ≤ |v| |f 0 (x)| ≤ L. i=1 Für x1 , x2 ∈ [a, b], oBdA x1 > x2 , erhalten wir aus Folgerung 2.3 hv, f (x1 ) − f (x2 )i = ϕ(x1 ) − ϕ(x2 ) ≤ L(x1 − x2 ) = L|x1 − x2 |. Wir können f (x1 ) 6= f (x2 ) annehmen, denn sonst ist nichts zu zeigen. Nun wählen wir v := f (x1 ) − f (x2 ) |f (x1 ) − f (x2 )| ⇒ |v| = 1, und wir erhalten |f (x1 ) − f (x2 )| = hf (x1 ) − f (x2 ), vi ≤ L|x1 − x2 |. Wir wollen als Anwendung des Mittelwertsatzes Aussagen über das Wachstum der Exponentialfunktion machen. Die Exponentialfunktion beschreibt Wachstums- bzw. Zerfallprozesse, bei denen die Geschwindigkeit der Zunahme bzw. Abnahme proprotional zur vorhandenen Menge ist. Zum Beispiel ist bei Anlegen eines Kapitals zum Zinssatz α ∈ R der Kontostand nach t Jahren gegeben durch f (t) = f (0) exp(αt), es gilt also die Gleichung f0 = α f (Differentialgleichung von f (x) = eαx ) Wir benötigen nun folgende multiplikative“ Variante des Schrankensatzes. ” 66 (2.1) Folgerung 2.5 Sei f : [a, b] → R stetig, auf (a, b) differenzierbar, und sei a ≤ x1 < x2 ≤ b sowie α ∈ R. Dann gilt: f 0 ≥ αf auf (a, b) ⇒ e−αx2 f (x2 ) ≥ e−αx1 f (x1 ) f 0 ≤ αf auf (a, b) ⇒ e−αx2 f (x2 ) ≤ e−αx1 f (x1 ). Beweis: Wir berechnen mit der Produktregel, wobei d die Ableitung bezeichnet, dx d −αx (e f (x)) = −αe−αx f (x) + e−αt f 0 (x) = e−αx (f 0 (x) − αf (x)). dx Die Behauptung ergibt sich aus Folgerung 2.1. Satz 2.3 (Wachstum von exp und log) Es gelten folgende Grenzwertaussagen: lim x−s ex = +∞ und lim y −s log y = 0 und x→+∞ y→+∞ lim xs e−x = 0 x→+∞ lim y s log y = 0 y&0 für jedes s > 0, für jedes s > 0. (2.2) (2.3) Beweis: Wir setzen f (x) = x−s ex mit s > 0 und berechnen für x > 0 f 0 (x) = −s x−s−1 ex + x−s ex = (1 − ⇒ f 0 (x) ≥ 1 f (x) 2 s )f (x) x für x ≥ 2s. Aus Folgerung 2.5 mit x1 = 2s, x2 = x > 2s folgt 1 f (x) ≥ e 2 (x−2s) f (2s) → +∞ mit x → +∞. Damit ist (2.2) gezeigt, wobei sich die zweite Aussage durch Bildung des Kehrwerts ergibt. Für (2.3) substituieren wir y = ex/s ⇔ log y = x und schließen, da y → +∞ ⇔ x → +∞ sowie y & 0 ⇔ x → −∞, y −s log y = e−x x/s → 0 s x y log y = e x/s → 0 mit y → +∞, mit y & 0. Definition 2.3 Sei D ⊂ R offen und f : D → R. Wir setzen f (0) = f und definieren induktiv die k-te Ableitung f (k) : D → R für k ≥ 1 durch f (k) := (f (k−1) )0 . Damit f (k) existiert, muss also f (k−1) noch differenzierbar sein. Definition 2.4 Für D ⊂ R offen und k ∈ N0 bezeichnen wir mit C k (D) den R-Vektorraum der k mal stetig differenzierbaren Funktionen f : D → R, das heißt C k (D) = {f : D → R : f (i) : D → R sind definiert und stetig für i = 0, 1, . . . , k}. Weiter definieren wir C ∞ (D) als den R-Vektorraum der unendlich oft differenzierbaren Funktionen, also ist \ C ∞ (D) = C k (D). k≥0 67 Der Umgang mit C ∞ -Funktionen ist besonders angenehm, weil die Klasse im Gegensatz zu den Räumen C k (D) unter der Bildung von Ableitungen abgeschlossen ist. Es ist klar, dass Polynome unendlich oft differenzierbar sind, ebenso die Exponentialfunktion. Das folgende Beispiel einer zusammengestückelten C ∞ -Funktion wird sich später als sehr nützlich erweisen Folgerung 2.6 Die Funktion ( e−1/x f (x) = 0 für x > 0 für x ≤ 0 ist unendlich oft differenzierbar. Beweis: Wir zeigen durch Induktion, dass es Polynome pn gibt, so dass gilt: ( pn ( x1 ) e−1/x für x > 0 (n) f (x) = 0 für x ≤ 0. Für n = 0 ist das richtig mit p0 (s) ≡ 1. Ist die Aussage für ein n ∈ N0 gezeigt, so folgt: 1 0 1 1 1 (n+1) x>0 ⇒ f (x) = − 2 pn ( ) + 2 pn ( ) e−1/x x x x x x < 0 ⇒ f (n+1) (x) = 0. Wir setzen also pn+1 (s) = s2 (pn (s) − p0n (s)). Zu zeigen bleibt f (n+1) (0) = 0. Für den linksseitigen Differenzenquotienten ist das klar, für x > 0 berechnen wir mit (2.2) 1 1 f (n) (x) − f (n) (0) = pn ( ) e−1/x → 0 x x x mit x & 0, Wir kommen jetzt zurück zu der Bestimmung von Extremwerten. Folgerung 2.7 Sei f : (a, b) → R zweimal differenzierbar und f 0 (x0 ) = 0 für x0 ∈ (a, b). Ist dann f 00 (x0 ) > 0, so hat f in x0 ein isoliertes, lokales Minimum. Beweis: Nach Voraussetzung gilt, da f 0 (x0 ) = 0, 0 < f 00 (x0 ) = lim x→x0 f 0 (x) . x − x0 Also gibt es ein δ > 0 mit f 0 (x) > 0 auf (x0 , x0 + δ) und f 0 (x) < 0 auf (x0 − δ, x0 ). Nach Folgerung 2.1 ist f streng monoton fallend auf (x0 − δ, x0 ] und streng monoton wachsend auf [x0 , x0 + δ), woraus die Behauptung folgt. Bei Extremwertaufgaben ist in der Regel nicht die lokale, sondern die globale Minimalität von Interesse. In diesem Zusammenhang ist der Begriff der Konvexität von erheblicher Bedeutung. Definition 2.5 Sei I ⊂ R ein Intervall. f : I → R heißt konvex, falls gilt: f (1 − t)x0 + t x1 ≤ (1 − t) f (x0 ) + tf (x1 ) ∀x0 , x1 ∈ I, t ∈ [0, 1]. Gilt dies mit ≥ statt mit ≤, so heißt f konkav. 68 (2.4) Geometrische Interpretation: Die Sekante durch x0 , f (x0 ) und x1 , f (x1 ) ist Graph der linearen Funktion g(x) = f (x0 ) + f (x1 ) − f (x0 ) (x − x0 ). x1 − x0 An der Stelle x(t) = (1 − t)x0 + t x1 gilt f (x1 ) − f (x0 ) t(x1 − x0 ) = (1 − t)f (x0 ) + tf (x1 ). g x(t) = f (x0 ) + x1 − x0 Die Konvexitätsbedingung besagt also anschaulich, dass der Graph von f unterhalb jeder Sekanten liegt. Satz 2.4 (Konvexitätskriterien) Sei f : (a, b) → R differenzierbar. Dann sind folgende Aussagen äquivalent: (1) f 0 ist monoton wachsend auf (a, b). (2) f ist konvex. (3) f (y) ≥ f (x) + f 0 (x)(y − x) für alle x, y ∈ (a, b). Ist f zweimal differenzierbar auf (a, b), so ist außerdem äquivalent: (4) f 00 ≥ 0. 3 Die Winkelfunktionen In der Schule werden die Funktionen Sinus, Kosinus und Tangens durch die Längenverhältnisse im rechtwinkligen Dreieck eingeführt: Um dies jedoch zu einer exakten Definition auszubauen, wird das Konzept der Winkelmessung, also der Bestimmung der Länge des zugehörigen Einheitskreisbogens, gebraucht. Anstatt die Bogenlänge hier ad hoc zu definieren (dies wird in Analysis II für allgemeine Kurvenstücke als Anwendung der Integralrechnung behandelt), wählen wir einen anderen Zugang. Bei diesem stehen die Differentialgleichung der harmonischen Schwingung bzw. die Differentialgleichung der gleichförmigen Kreisbewegung im Mittelpunkt. Im folgenden betrachten wir Funktionen, die vom Parameter t ( Zeit“) abhängen. ” Die Differentialgleichung der harmonischen Schwingung lautet bei geeigneter Normierung x00 + x = 0. Physikalisch beschreibt x : I → R, I = (t1 , t2 ) ⊂ R, die Auslenkung eines schwingungsfähigen Systems (Oszillators) aus der Ruhelage x = 0; ein Beispiel ist die Schwingung einer elastischen Feder. Die Differentialgleichung kann aus der Annahme hergeleitet werden, dass auf das System eine Rückstellkraft wirkt, die proportional zur Auslenkung, aber entgegengesetzt gerichtet ist. Um die Schwingung zu bestimmen, sollten die Position und Geschwindigkeit zu einer Anfangszeit vorgegeben sein; wir wählen stets die Anfangszeit t = 0. 69 Definition 3.1 (Anfangswertproblem für die harmonische Schwingung) Sei 0 ∈ I = (t1 , t2 ). Eine Funktion x ∈ C 2 (I) heißt Lösung des Anfangswertproblems für die harmonische Schwingung zu den Anfangsdaten a, b ∈ R, falls gilt: x00 + x = 0 auf I, x(0) = a, x0 (0) = b. (3.1) Sei x ∈ C 2 (I) eine Lösung von (3.1). Wir definieren die Funktion y = −x0 und erhalten y 0 = −x00 = x, das heißt es gilt das System von Gleichungen x0 = −y 0 y = x(0) = a, y(0) = −b. x Mit komplexen Zahlen können wir das noch kürzer schreiben: wir definieren die Funktion c : I → C, c(t) = x(t) + iy(t). Wir erhalten c0 = x0 + i y 0 = −y + ix = i(x + iy), beziehungsweise c0 = ic auf I, c(0) = z0 ∈ C, (3.2) wobei hier z0 = a − ib. Im folgenden brauchen wir uns um die Differenzierbarkeit der beteiligten Funktionen keine Gedanken zu machen, denn es gilt Lemma 3.1 (Regularität) Ist c : I → C differenzierbar und c0 = ic, so folgt c ∈ C ∞ (I, C). Insbesondere ist jede Lösung x : I → R der Gleichung x00 + x = 0 in C ∞ (I). Beweis: Aus Satz 1.1 folgt c ∈ C 0 (I, C). Sei nun induktiv c ∈ C k (I, C) schon gezeigt für ein k ∈ N0 . Dann folgt c0 = ic ∈ C k (I, C), also c ∈ C k+1 (I, C). Lemma 3.2 (Reduktion der Ordnung) Für Funktionen x, y : I → R sind folgende Aussagen äquivalent: (1) x ist Lösung von (3.1), und y = −x0 , (2) c = x + iy ist Lösung von (3.2) mit z0 = a − ib. Beweis: (1)⇒(2) wurde oben gezeigt. Umgekehrt folgt aus (2) x0 + iy 0 = c0 = ic = i(x + iy) = −y + ix, also x00 = −y 0 = −x sowie x(0) = a und x0 (0) = −y(0) = −(−b) = b. Das Anfangswertproblem (3.1) zweiter Ordnung für eine gesuchte reellwertige Funktion ist also gleichwertig mit dem Anfangswertproblem (3.2) erster Ordnung für zwei gesuchte reellwertige Funktionen, bzw. eine C-wertige Funktion. Diesem wenden wir uns jetzt zu. Lemma 3.3 (Erhaltungssatz) Für jede Lösung c = x + iy : I → C, I = (t1 , t2 ) der Gleichung c0 = ic ist die Funktion |c(t)|2 = x(t)2 + y(t)2 konstant. 70 Beweis: Es gilt, indem wir z und iz als Punkte in R2 auffassen, hz, izi = h( x −y ), ( )i = 0 y x für alle z ∈ C. Daraus folgt d 2 |c| = 2 hc, c0 i = 2 hc, ici = 0. dt Mit Folgerung 2.1 ergibt sich die Behauptung. Wir bezeichnen die Gleichung c0 = ic als Differentialgleichung der gleichförmigen Kreisbewegung, denn nach Lemma 3.3 verläuft jede Lösung c(t) auf einem Kreis um den Nullpunkt und hat konstante Absolutgeschwindigkeit |c0 (t)| = |c(t)| = const. Satz 3.1 (Eindeutigkeitssatz für die gleichförmige Kreisbewegung) Das wertproblem (3.2) hat höchstens eine Lösung c : I → C. Anfangs- Beweis: Seien c1 , c2 Lösungen von (3.2). Für c := c1 − c2 folgt c0 = c01 − c02 = ic1 − ic2 = ic, c(0) = 0. Nach Lemma 3.3 ist |c(t)| = |c(0)| = 0 für alle t, also c1 = c2 . Satz 3.2 (Existenzsatz für die gleichförmige Kreisbewegung) Das Anfangswertproblem (3.2) besitzt eine (eindeutig bestimmte) Lösung c ∈ C ∞ (R, C). Wir stellen den Beweis dieses Satzes zurück, denn er erfordert Hilfsmittel, die an dieser Stelle noch nicht zur Verfügung stehen. Wir verweisen auf die Diskussion nach Folgerung 3.4 am Ende des Abschnitts. Wir wollen hier zeigen, dass sich Definition und Eigenschaften der trigonometrischen Funktionen unabhängig vom gewählten Lösungsverfahren allein aus der Differentialgleichung herleiten lassen. Aus Lemma 3.2 ergibt sich zunächst direkt Folgerung 3.1 (Eindeutigkeits- und Existenzsatz für die harmonische Schwingung) Das Anfangswertproblem (3.1) besitzt eine eindeutig bestimmte Lösung x ∈ C ∞ (R). Definition 3.2 (Kosinus und Sinus) Die Funktion cos : R → R (bzw. sin : R → R) ist die eindeutig bestimmte Lösung der Gleichung x00 + x = 0 zu den Anfangsdaten x(0) = 1, x0 (0) = 0 (bzw. x(0) = 0, x0 (0) = 1). Lemma 3.4 Die Funktion c : R → C, c(t) = cos t + i sin t ist Lösung des Anfangswertproblems c0 = ic, c(0) = 1 ∈ C. Insbesondere gilt cos0 = − sin, sin0 = cos und cos2 t + sin2 t = 1. Beweis: Die Funktion y = − cos0 erfüllt y 00 + y = −(cos000 + cos0 ) = −(cos00 + cos)0 = 0, y(0) = − cos0 (0) = 0 sowie y 0 (0) = − cos00 (0) = cos(0) = 1. 71 (3.3) Aus der Eindeutigkeitaussage von Folgerung 3.1 folgt − cos0 = sin, und durch Differentiation sin0 = − cos00 = cos. Also gilt (3.2) mit z0 = cos(0) + i sin(0) = 1. Die Identität (3.3) gilt nach Lemma 3.3. Es ist jetzt nicht schwer zu überprüfen, dass die Lösung des allgemeinen Anfangswertproblems (3.1) durch x(t) = a cos t + b sin t gegeben ist. Unser Ziel ist es, im Folgenden anhand der Definition die Eigenschaften der Funktionen Kosinus und Sinus herzuleiten. Wir beginnen mit dem Nachweis, dass cos und sin periodische Funktionen sind. Dazu zeigen wir wiederum, dass die Funktion c(t) den Punkt i ∈ C in endlicher Zeit τ > 0 zum ersten Mal erreicht und dabei den rechten oberen Viertelkreis durchläuft. Lemma 3.5 Sei τ := sup{t > 0 : cos s > 0 für alle s ∈ (0, t)}. Dann gilt: (1) cos t > 0 und sin t > 0 für alle t ∈ (0, τ ). (2) τ ∈ (0, ∞) und c(τ ) = cos τ + i sin τ = i. Beweis: Da cos 0 = 1 und cos stetig, ist cos s > 0 für hinreichend kleine s ≥ 0 und folglich τ > 0. Für t ∈ (0, τ ) folgt sin0 t = cos t > 0, also ist sin streng monoton wachsend auf [0, τ ] nach Folgerung 2.1. Da sin 0 = 0, ist (1) gezeigt. Wähle nun ein beliebiges t0 ∈ (0, τ ). Dann gilt t ∈ (t0 , τ ) ⇒ cos0 t = − sin t ≤ − sin t0 . Aus (1) und dem Schrankensatz (Folgerung 2.3) folgt für jedes t ∈ (t0 , τ ) 0 < cos t ≤ cos t0 − (t − t0 ) sin t0 ⇒ t < t0 + cos t0 . sin t0 Also ist τ < ∞. Nun ist cos τ = limt%τ cos t ≥ 0. Nach Definition von τ gibt es auf der anderen Seite ti & τ√mit cos ti ≤ 0. Es folgt cos τ = 0 sowie, wieder wegen (1), sin τ = limt%τ sin t = limt%τ 1 − cos2 t = 1. Damit ist auch (2) bewiesen. Auf dem Intervall [0, τ ] durchläuft c(t) mit Geschwindigkeit |c0 (t)| = 1 den Viertelkreis von 1 nach i. Dies motiviert die Definition 3.3 (Die Zahl π) Wir setzen π = 2τ mit τ aus Lemma 3.5. Für ω ∈ R ist die Exponentialfunktion f (t) = eωt Lösung des Anfangswertproblems f 0 = ωf, f (0) = 1. Die komplexwertige Funktion c(t) = cos t + i sin t ist Lösung des analogen Anfangswertproblems, nur mit ω = i ∈ C: c0 = ic, c(0) = 1. Diese Analogie und das nachfolgende Lemma rechtfertigen es, die Exponentialfunktion für imaginäre Argumente wie folgt zu erklären: Definition 3.4 (Eulersche Formel) Wir definieren eit := exp(it) := cos t + i sin t 72 für t ∈ R. (3.4) Lemma 3.6 (Funktionalgleichung) Es gilt ei(α+β) = eiα eiβ für alle α, β ∈ R. (3.5) Beweis: Betrachte mit c(t) = eit die Funktionen c1 (t) = c(α + t) und c2 (t) = c(α) c(t). Aus Lemma 3.4 folgt c1 (0) = c(α) = c2 (0) sowie c01 (t) = c0 (α + t) = ic(α + t) = ic1 (t), c02 (t) = c(α)c0 (t) = i c(α) c(t) = i c2 (t). Aus Satz 3.1 (Eindeutigkeitssatz) folgt c1 (t) = c2 (t) für alle t, also mit t = β c(α + β) = c1 (β) = c2 (β) = c(α) c(β). Wegen eit e−it = ei(t−t) = 1 gilt e−it = eit . Dies ist äquivalent zu cos(−t) = cos t und sin(−t) = − sin t, das heißt cos ist eine gerade und sin eine ungerade Funktion. Ferner gelten die Relationen: c(t + π/2) = ic(t) cos(t + π/2) = − sin t sin(t + π/2) = cos t c(t + π) = −c(t) cos(t + π) = − cos t sin(t + π) = − sin t c(t + 2π) = c(t) cos(t + 2π) = cos t sin(t + 2π) = sin t. Insbesondere folgt eit = 1 ⇔ t = k · 2π mit k ∈ Z, (3.6) und die Nullstellen von cos (bzw. sin) sind von der Form π/2 + k · π (bzw. k · π) mit k ∈ Z. Folgerung 3.2 (Additionstheoreme) cos(α + β) = cos α cos β − sin α sin β, sin(α + β) = sin α cos β + cos α sin β. Beweis: Aus (3.5) folgt cos(α + β) + i sin(α + β) = ei(α+β) = eiα eiβ = (cos α + i sin α) (cos β + i sin β). Die Behauptung folgt durch Vergleich der Real- und Imaginärteile. Zur Definition der Umkehrfunktionen müssen cos und sin auf geeignete Intervalle eingeschränkt werden. Die Funktionen π π cos : [0, π] → [−1, 1] und sin : [− , ] → [−1, 1] 2 2 sind streng monoton fallend bzw. wachsend. Ihre Umkehrfunktionen sind die Arcusfunktionen π π arccos : [−1, 1] → [0, π] und arcsin : [−1, 1] → [− , ]. 2 2 73 Für x ∈ [−1, 1] gilt, da cos2 t + sin2 t = 1, arccos0 (x) = arcsin0 (x) = 1 1 , 1 − x2 1 1 =√ . 0 sin (arcsin x) 1 − x2 cos0 (arccos x) = −√ Folgerung 3.3 (Polardarstellung auf C) Zu z = x + iy ∈ C\{0} gibt es eindeutig bestimmte r > 0, ϑ ∈ [0, 2π) mit z = r eiϑ . Beweis: Um die Eindeutigkeit zu zeigen, seien r1 , r2 > 0 und ϑ1 , ϑ2 ∈ [0, 2π) mit z = r1 eiϑ1 = r2 eiϑ2 . Dann folgt |z| = r1 = r2 , und weiter eiϑ1 = eiϑ2 bzw. ei(ϑ1 −ϑ2 ) = 1. Nach (3.6) ist ϑ1 − ϑ2 = 2k · π für ein k ∈ Z. Aber 2 |k|π = |ϑ1 − ϑ2 | < 2π, also gilt k = 0 und ϑ1 = ϑ2 . Für die Existenz der Polardarstellung von z = x + iy ∈ C\{0} definieren wir ( p arccos xr für y ≥ 0 r = x2 + y 2 > 0, ϑ = x 2π − arccos r für y < 0. √ Wir rechnen die geforderte Eigenschaft nach: wegen sin ϑ = 1 − cos2 ϑ für ϑ ∈ [0, π] gilt im Fall y ≥ 0 r x x x x x y iϑ e = cos(arccos ) + i sin(arccos ) = + i 1 − ( )2 = + i , r r r r r | {z r} ∈[0,π] also z = r eiϑ . Für y < 0 haben wir, da cos, sin 2π-periodisch sind und außerdem cos gerade, sin ungerade, r x x y x x x iϑ e = cos(arccos ) − i sin(arccos ) = − i 1 − ( )2 = + i . r r r r r r | {z } ∈[0,π] In der Polardarstellung wird die Multiplikation sowie das Potenzieren von komplexen Zahlen besonders einfach: z1 = r1 eiα , z2 = r2 eiβ ⇒ z1 z2 = r1 r2 ei(α+β) . Zum Beipiel sind die Lösungen der Gleichung z n = 1, die n-ten Einheitswurzeln, gegeben durch ζk = ei 2πk/n für k = 0, 1, . . . , n − 1. Spalten wir die Polardarstellung in Real- und Imaginärteil auf, so erhalten wir die reellen Formeln für Polarkoordinaten auf R2 : x = r cos ϑ, y = r sin ϑ mit r > 0, ϑ ∈ [0, 2π). Zum Schluss wollen wir unsere Definition der Exponentialfunktion nochmals erweitern: 74 Definition 3.5 (Komplexe Exponentialfunktion) Die komplexe Exponentialfunktion ist definiert durch exp : C → C, z = x + iy 7→ exp(z) = ex eiy = ex (cos y + i sin y). Mit dieser Definition gilt die Funktionalgleichung nun auf ganz C, denn für z1 = x1 + iy1 , z2 = x2 + iy2 gilt exp(z1 + z2 ) = exp((x1 + x2 ) + i(y1 + y2 )) = ex1 +x2 ei(y1 +y2 ) = ex1 eiy1 ex2 eiy2 = exp(z1 ) exp(z2 ). Aus diesem Grund können wir auch exp(z) = ez schreiben; die Regeln der Potenzrechnung gelten. Mit der komplexen Exponentialfunktion können wir nun allgemeinere Anfangswertprobleme lösen. Folgerung 3.4 (Differentialgleichung der e-Funktion) Sei ω = α + iβ ∈ C und 0 ∈ I = (t1 , t2 ). Dann ist die Funktion c(t) = eωt die eindeutig bestimmte Lösung f : I → C des Anfangswertproblems f 0 = ωf auf I, f (0) = 1. (3.7) Beweis: Aus der Differentialgleichung der reellen e-Funktion und der Differentialgleichung der gleichförmigen Kreisbewegung, siehe Lemma 3.4, folgt mit der Produktregel und der Kettenregel d αt iβt (e e ) dt d d = ( eαt ) eiβt + eαt ( eiβt ) dt dt αt iβt αt iβt = αe e + e iβe d ωt = e dt = ωeωt . Also gilt c0 = ωc auf ganz R und c(0) = 1. Sei f : I → C eine weitere Lösung von (3.7). Dann berechnen wir d −ωt d d (e f (t)) = ( e−ωt ) f + e−ωt ( f ) dt dt dt = −ωe−ωt f + e−ωt ωf = 0. Es folgt e−ωt f (t) = e−ωt f (t)|t=0 = 1, und die Funktionalgleichung liefert f (t) = eωt für alle t ∈ I. In diesem Abschnitt haben wir gesehen, dass sich die charakteristischen Eigenschaften der trigonometrischen Funktionen, insbesondere ihre Periodizität und ihre Additionstheoreme, sehr einfach aus der Differentialgleichung der harmonischen Schwingung herleiten lassen. Grundlegend war dabei die Umformulierung mittels des Systems der gleichförmigen Kreisbewegung. Während sich die eindeutige Lösbarkeit leicht aus dem Erhaltungssatz Lemma 3.3 ergab, bleibt die Konstruktion einer Lösung zunächst offen. Es gibt hier mehrere Zugänge, von denen zwei in diesem Skript vorgestellt werden: 75 • In Kapitel 4, Satz 2.4 wird das Existenzproblem auf das Auffinden einer Stammfunktion reduziert, deren Existenz durch den Hauptsatz der Differential- und Integralrechnung gesichert ist. • In Kapitel 5.2 wird für die gesuchte Lösung eine Darstellung als Potenzreihe hergeleitet. Es wird dann nachgewiesen, dass die gewonnene Potenzreihe (unendlich oft) differenzierbar ist und in der Tat das Anfangswertproblem 3.2 löst. Im zweiten Semester werden wir als weitere Methode zur Konstruktion einer Lösung ein Iterationsverfahren (Picard-Lindelöf) behandeln. 76 Kapitel 4 Integralrechnung 1 Das Riemannsche Integral Als Motivation für die Definition des Integrals betrachten wir das Problem, den Flächeninhalt auszurechnen, den der Graph einer Funktion f : [a, b] = I → R mit der x-Achse einschließt: Anschaulich soll also gelten Z b f = Flächeninhalt von {(x, y) : x ∈ I, 0 ≤ y ≤ f (x)}. a Allerdings wollen wir Flächen unterhalb der x-Achse negativ zählen. Definition 1.1 (Riemannsche Summe) Sei I = [a, b] ein kompaktes Intervall. Eine Diskretisierung D auf I ist durch folgende Daten gegeben: 1 • eine Unterteilung a = x0 ≤ x1 ≤ . . . ≤ xN = b von I in aufeinanderfolgende Intervalle Ik = [xk−1 , xk ], • zugehörige Stützstellen ξk ∈ Ik für k = 1, . . . , N . Wir setzen ∆xk := xk − xk−1 und nennen ∆(D) = max1≤k≤N ∆xk die Feinheit der Diskretisierung D. Für f : I → R heißt dann die Zahl SD (f ) = N X f (ξk )∆xk ∈ R (1.1) k=1 die Riemannsche Summe von f zur Diskretisierung D. Die Riemannsche Summe ergibt einen Näherungswert für das Integral, der auf endlich vielen Daten, nämlich den Unterteilungspunkten sowie den Werten der Funktion an den Stützstellen, beruht. Im Prinzip könnte diese Näherung von einem Computer berechnet werden. Sinnvoll ist das aber natürlich nur, wenn bei Verfeinerung der Diskretisierung der Approximationsfehler kleiner wird. Dies führt auf den folgenden Begriff von Integrierbarkeit. 1 In der Literatur wird meist von einer Unterteilung mit Stützstellen gesprochen; der Begriff Diskretisierung ist nicht Standard. 77 Definition 1.2 (Riemann-Integral) Die Funktion f : I = [a, b] → R heißt integrierbar mit Integral S ∈ R, falls es für alle ε > 0 ein δ > 0 gibt, so dass gilt: D Diskretisierung von I mit ∆(D) < δ ⇒ |SD (f ) − S| < ε. Bezeichnung. Die Zahl S nennen wir das (bestimmte) Integral von f auf [a, b] und schreiben Rb S = S(f ) = a f ∈ R. Beispiel 1.1 Sei f (x) = c ∈ R für alle x ∈ I. Dann gilt für jede Diskretisierung D SD (f ) = N X N X c ∆xk = c k=1 also ist f integrierbar mit Rb a (xk − xk−1 ) = c (b − a), k=1 f = c(b − a). Es ist praktisch, neben der ε − δ−Formulierung der Integrierbarkeit auch eine Version mit Folgen zur Verfügung zu haben, ganz analog zur Definition der Stetigkeit. Lemma 1.1 Für f : I = [a, b] → R und S ∈ R sind folgende Aussagen äquivalent: (1) f ist Riemann-integrierbar mit Integral S ∈ R. (2) SDj (f ) → S für jede Folge Dj mit ∆(Dj ) → 0. Beweis: Die Implikation (1) ⇒ (2) folgt unmittelbar aus den Definitionen. Sei umgekehrt (2) erfüllt. Wäre (1) falsch, so gibt es ein ε > 0 mit folgender Eigenschaft: zu jedem δ = 1/j, j ∈ N, gibt es eine Diskretisierung Dj mit Feinheit ∆(Dj ) < 1/j, aber dennoch |SDj (f ) − S| ≥ ε. Dies ist ein Widerspruch zu (2). Satz 1.1 (Linearität des Integrals) Die Menge R(I) der Riemann-integrierbaren FunkRb tionen f : I → R ist ein R-Vektorraum und das Integral S : R(I) → R, f 7→ S(f ) = a f ist ein lineares Funktional. Es gilt also Z b Z b Z b (λ f + µ g) = λ f +µ g. a a a Beweis: Für eine beliebige Diskretisierung D gilt SD (λf + µg) = N X λf (ξk ) + µg(ξk ) ∆xk k=1 N X = λ f (ξk ) ∆xk + µ k=1 N X g(ξk )∆xk k=1 = λSD (f ) + µSD (g). Für jede Folge von Diskretisierungen Dj mit ∆(Dj ) → 0 folgt SDj (λf + µg) = λSDj (f ) + µSDj (g) → λS(f ) + µS(g). Natürlich hoffen wir, dass möglichst viele Funktionen Riemann-integrierbar sind. Im Gegensatz zur Differentiation können wir aber hier nicht direkt Regeln zum Beispiel für Produkt, Quotient, Verkettung und Umkehrfunktion herleiten. Stattdessen müssen wir einen konzeptuellen Weg beschreiten, der auf folgenden drei Schritten beruht: 78 a) Stückweise konstante Funktionen (sogenannte Treppenfunktionen) sind integrierbar. b) Läßt sich eine Funktion f gut“ durch integrierbare Funktionen approximieren, so ist ” auch f integrierbar. c) Stetige Funktionen lassen sich gut“ durch Treppenfunktionen approximieren, und sind ” damit integrierbar. Natürlich wird dabei unter anderem noch zu klären sein, was die gute Approximation“ ” eigentlich sein soll. Wir beginnen unser Programm, indem wir zunächst einige Eigenschaften des Integrals zeigen. Lemma 1.2 Sei f ∈ R(I) und fe : I → R. Es gebe endlich viele Punkte A = {a1 , . . . , ar } ⊂ I Rb Rb mit fe(x) = f (x) für alle x ∈ I\A. Dann ist fe ∈ R(I) und es gilt a fe = a f . Beweis: Wir zeigen die Aussage im Fall eines Ausnahmepunkts a1 ∈ I; der allgemeine Fall folgt daraus per Induktion. Es gilt für jede Diskretisierung D SD (fe) − SD (f ) = N X k=1 (fe(ξk ) − f (ξk )) ∆xk = N X k: ξk =a1 (fe(a1 ) − f (a1 )) ∆xk . Es ist ξk = a1 höchstens für zwei k mit ∆xk > 0. Für eine Folge Dj mit ∆(Dj ) → 0 erhalten wir |SDj (fe) − S(f )| ≤ |SDj (fe) − SDj (f )| + |SDj (f ) − S(f )| ≤ 2|fe(a1 ) − f (a1 )|∆(Dj ) + |SD (f ) − S(f )|, j und die rechte Seite geht gegen Null mit ∆(Dj ) → 0. Beispiel 1.2 In Lemma 1.2 lässt sich endlich“ nicht zu abzählbar unendlich“ verbessern. ” ” Betrachte die Funktion ( 1 x∈Q f : [0, 1] → R, f (x) = 0 sonst, und die Unterteilung von [0, 1] in N Intervalle Ik gleicher Länge 1/N . Wählen wir irrationale Stützstellen, so ist SD (f ) = 0; bei rationalen Stützstellen gilt aber SD (f ) = 1. Da wir dabei die Feinheit beliebig klein machen können, ist f nicht Riemann-integrierbar. Satz 1.2 Jede Riemann-integrierbare Funktion ist beschränkt. Beweis: Es gibt ein δ > 0, so dass mit S = S(f ) gilt: ∆(D) < δ ⇒ 1 |SD (f ) − S| < . 2 Wähle N ∈ N so dass ∆ := (b − a)/N < δ und betrachte die äquidistante Unterteilung xk = a + k∆ fürk = 0, 1, . . . , N . Wir behaupten |f (ξ)| ≤ max |f (xk )| + 1≤k≤N 79 1 ∆ für alle ξ ∈ [a, b]. Für die gegebene Unterteilung sei D die Diskretisierung mit den Stützstellen xk für k = 1, . . . , N . Ist ξ ∈ I gegeben und ξ ∈ Ik , so betrachte außerdem die Diskretisierung D0 , bei der die Stützstelle xk durch ξ ersetzt wird (ebenfalls zur äquidistanten Unterteilung). Es folgt f (ξ) − f (xk ) ∆ 1 ⇒ |f (ξ)| ≤ |f (xk )| + |SD0 (f ) − SD (f )| . {z } ∆| SD0 (f ) − SD (f ) = <1 Die behauptete Abschätzung folgt. Definition 1.3 (Supremumsnorm) Für eine beschränkte Funktion f : D → R setzen wir kf kI = sup |f (x)|. x∈I Lemma 1.3 Sei D ⊂ R. Die Menge der beschränkten Funktionen B(D) = {f : D → R : f ist beschränkt } ist ein Vektorraum mit Norm k · kD , d. h. für f, g ∈ B(D) und α ∈ R gilt: (1) kf kD ≥ 0, Gleichheit nur für f = 0. (2) kαf kD = |α| kf kD . (3) kf + gkD ≤ kf kD + kgkD (Dreiecksungleichung). Beweis: Die Regel (2) folgt aus sup |αf (x)| = sup (|α||f (x)|) = |α| sup |f (x)|. x∈D x∈D x∈D Weiter gilt für x ∈ D |f (x) + g(x)| ≤ |f (x)| + |g(x)| ≤ sup |f (y)| + sup |g(y)| = kf kD + kgkD . y∈D y∈D Daraus folgt kf + gkD = sup |f (x) + g(x)| ≤ kf kD + kgkD . x∈D Die Vektorraumeigenschaft von B(D) ergibt sich aus (2) und (3). Sei wieder I = [a, b] ein kompaktes Intervall. Nach Satz 1.1 und Satz 1.2 ist R(I) ⊂ B(I) ein Untervektorraum; die Norm k · kI ist auf R(I) definiert. Lemma 1.4 Sei I = I1 ∪. . .∪In eine Unterteilung von I = [a, b] in Intervalle Ik = [ak−1 , ak ]. Falls f auf jedem der Teilintervalle Ik integrierbar ist, so folgt f ∈ R(I) und Z a b f= n Z X k=1 80 ak ak−1 f. Beweis: Der allgemeine Fall ergibt sich aus dem Fall n = 2 leicht durch Induktion über n mit der Klammerung I = (I1 ∪ . . . ∪ In−1 ) ∪ In . Für n = 2 müssen wir zeigen, dass für jede Folge SDj mit ∆(Dj ) → 0 gilt: Z a1 Z a2 lim SDj (f ) = f+ f =: S1 + S2 . j→∞ a0 a1 Sei D eine beliebige Diskretisierung mit den Unterteilungspunkten bzw. Stützstellen a0 = x0 ≤ x1 ≤ . . . ≤ xr−1 ≤ a1 < xr ≤ . . . ≤ xN = a2 , ξ1 , . . . , ξN . Definiere dann die Diskretisierungen D1 von I1 und D2 von I2 wie folgt: D1 : Unterteilungspunkte a0 = x0 ≤ . . . ≤ xr−1 ≤ a1 , D2 : Unterteilungspunkte a1 < xr ≤ . . . ≤ xN = a2 , Stützstellen ξ1 , . . . , ξr−1 , a1 Stützstellen a1 , ξr+1 , . . . , ξN . Die Bilanz der Riemannschen Summen ergibt |SD (f ) − (SD1 (f ) + SD2 (f ))| = |(f (ξr ) − f (a1 ))∆xr | ≤ 2 kf kI ∆(D). Daraus folgt |SD (f ) − (S1 + S2 )| ≤ |SD (f ) − (SD1 (f ) + SD2 (f ))| +|SD1 (f ) − S1 | + |SD2 (f ) − S2 |, {z } | ≤2 kf kI ∆(D) und die rechte Seite geht mit ∆(D) → 0 gegen Null. Folgerung 1.1 Sei f : I → R eine Treppenfunktion, d. h. es gibt eine Unterteilung a = a0 < a1 < . . . < an = b und ci ∈ R (i = 1, . . . , n) mit f (x) = ci für alle x ∈ (ai−1 , ai ). Dann ist f integrierbar und es gilt Z b n X f= (ai − ai−1 )ci . a i=1 Beweis: Nach Lemma 1.2 ist f : [ai−1 , ai ] → R integrierbar für alle i = 1, . . . , n. Aus Lemma 1.4 folgt die Behauptung. Damit ist Schritt a) unseres Programms erledigt, wobei wir auch einige zusätzliche Informationen gewonnen haben. Jetzt wollen untersuchen, wie sich Integrierbarkeit und Integral unter der Approximation von Funktionen verhalten. Ziel ist es, für einen geeigneten Begriff von Konvergenz fk → f“ folgende Aussage zu zeigen: ” Z b Z b fk → f mit fk integrierbar ⇒ f integrierbar und f = lim fk . a k→∞ a Welcher Konvergenzbegriff ist dabei zu wählen? Betrachte zunächst die punktweise Konvergenz: fk → f punktweise ⇔ fk (x) → f (x) für alle x ∈ I. In der Vorlesung haben wir sehr oft Operationen zwischen Funktionen punktweise definiert, zum Beispiel (f + g)(x) := f (x) + g(x). Aber hier ist die punktweise Definition nicht gut, wie das folgende Beispiel zeigt: 81 Beispiel 1.3 Betrachte die Treppenfunktionen fk : [0, 1] → R, ( k fk (x) = 0 für 0 < x < sonst. 1 k Dann gilt limk→∞ fk (x) = 0 für alle x ∈ [0, 1], denn ( für alle k, falls x = 0 fk (x) = 0 für k ≥ x1 , falls x > 0. Also konvergiert fk punktweise gegen die Nullfunktion f = 0. Aber es ist Z 1 Z 1 1 0= f 6= lim fk = lim · k = 1. k→∞ 0 k→∞ k 0 Fazit: Der Begriff der punktweisen Konvergenz ist ungeeignet, weil das Integral i. a. nicht approximiert wird. Es wird ein stärkerer Konvergenbegriff benötigt. Definition 1.4 (Gleichmäßige Konvergenz) Sei D ⊂ R. Die Folge fk : D → R, k ∈ N, konvergiert gleichmäßig gegen f : I → R, falls gilt: kfk − f kI → 0 mit k → ∞. Bei gleichmäßiger Konvergenz liegt der gesamte Graph der fk in einem ε-Streifen um den Graph von f , wenn k groß genug ist. In Quantorensprache sieht der Unterschied von punktweiser Konvergenz und gleichmäßiger Konvergenz wie folgt aus: ∀ε > 0 ∀ε > 0 ∀x ∈ D ∃N ∃N ∀x ∈ D ∀k > N : ∀k > N : |fk (x) − f (x)| < ε |fk (x) − f (x)| < ε (Punktweise Konvergenz), (Gleichmäßige Konvergenz). Der Unterschied ist, dass die Schranke N bei gleichmäßiger Konvergenz für alle x ∈ D gleich gewählt werden kann, während sie bei nur punktweiser Konvergenz von x abhängen darf, das heißt N = N (ε, x). Im Beispiel 1.3 gilt etwa, falls ε ≤ 1 und x > 0, |fk (x) − f (x)| < ε ⇒ k≥ 1 , x so dass N (x, ε) ≥ 1/x sein muss, also nicht unabhängig von x gewählt werden kann. Es ist klar, dass aus gleichmäßiger Konvergenz die punktweise Konvergenz folgt, denn es gilt ja |fk (x) − f (x)| ≤ sup |fk (y) − f (y)| = kfk − f kD → 0 mit k → ∞. y∈D Wenn Sie deshalb prüfen wollen, ob eine gegebene Folge fk gleichmäßig konvergiert, so können Sie wie folgt vorgehen: • Sie untersuchen zuerst, ob die Folge punktweise konvergiert, das heißt ob für jedes feste x der Grenzwert limk→∞ fk (x) existiert. Wenn nicht, so ist die Folge nicht gleichmäßig konvergent. 82 • Wenn doch, so setzen Sie f (x) := limk→∞ fk (x) und berechnen die Norm kfk − f kD = supx∈D |fk (x) − f (x)|, bzw. schätzen diese Norm ab. Gilt kfk − f kD → 0 mit k → ∞, so ist die Folge gleichmäßig konvergent gegen f . Wenn nicht, so ist fk zwar punktweise, aber nicht gleichmäßig konvergent. Im Beispiel 1.3 gilt fk → f mit f = 0 punktweise auf [0, 1], aber nicht gleichmäßig. Es ist nämlich sup |fk (x) − f (x)| = k → ∞ mit k → ∞. x∈[0,1] Wir wollen nun untersuchen, wie sich das Integral mit diesem Konvergenzbegriff verträgt. Satz 1.3 (Abschätzung des Integrals durch Supremumsnorm) Für f ∈ R(I) gilt die Ungleichung Z b | f | ≤ |b − a| kf kI . a Beweis: Für jede Diskretisierung gilt mit der Dreiecksungleichung | N X k=1 f (ξk )∆xk | ≤ N X |f (ξk )| ∆xk ≤ kf kI k=1 N X ∆xk = kf kI |b − a|, k=1 das heißt |SD (f )| ≤ kf kI |b − a|. (1.2) Rb Wähle eine Folge Dj mit ∆(Dj ) → 0 und erhalte | a f | = limj→∞ |SDj (f )| ≤ kf kI |b − a|. Satz 1.3 besagt, dass die lineare Abbildung S : (R(I), k · kI ) → R, S(f ) = Z b f a Lipschitzstetig bezüglich der Norm k · kI ist, denn es gilt Z b |S(f ) − S(g)| = | (f − g)| ≤ kf − gkI |b − a|. a Die Lipschitzkonstante ist die Intervalllänge |b − a|. Insbesondere erhalten wir die Stetigkeit der Abbildung bzgl. k · kI : Z b Z b fk , f ∈ R(I), kfk − f kI → 0 mit k → ∞ ⇒ fk → f, a a Rb Rb denn | a fk − a f | ≤ kfk − f kI |b − a| → 0. Der nachfolgende Satz macht insofern eine stärkere Aussage, als die Integrierbarkeit der Grenzfunktion nicht vorausgesetzt, sondern bewiesen wird. Satz 1.4 (Integral und gleichmäßige Konvergenz) Die Funktionenfolge fk ∈ R(I) konvergiere gleichmäßig gegen f : I → R, also kfk − f kI → 0. Dann ist f ∈ R(I) und es gilt Z b Z b f = lim fk . a k→∞ a 83 Beweis: Wir setzen Sk = Rb a fk ∈ R. Schritt 1 Der Grenzwert S := limk→∞ Sk existiert. Die Folge Sk ist eine Cauchyfolge, denn wir haben Z b |Sk − Sl | = | (fk − fl )| (Satz 1.1) a ≤ |b − a| kfk − fl kI (Satz 1.3) < |b − a| (kfk − f kI + kf − fl kI ) (Dreiecksungleichung) < ε für k, l hinreichend groß. Rb Schritt 2 f ist integrierbar mit a f = S. Sei ε > 0 gegeben. Wähle ein k ∈ N, so dass folgende beiden Aussagen gelten: (i) |Sk − S| < ε/3 (nach Schritt 1), (ii) |SD (f ) − SD (fk )| ≤ |b − a| kf − fk kI < ε/3 (nach Ungleichung (1.2)). Für festes k mit (i) und (ii) gibt es nun ein δ > 0 mit |SD (fk ) − Sk | < ε/3 für jede Diskretisierung mit Feinheit ∆(D) < δ. Damit folgt |SD (f ) − S| ≤ |SD (f ) − SD (fk )| + |SD (fk ) − Sk | + |Sk − S| < ε. | {z } | {z } | {z } <ε/3 <ε/3 <ε/3 Damit ist auch Schritt b) unseres Programms abgeschlossen. Um zu zeigen, dass stetige Funktionen auf I = [a, b] integrierbar sind, müsses wir jetzt noch nachweisen, dass sie gleichmäßig durch Treppenfunktionen approximiert werden können. Lemma 1.5 Sei I = [a, b] kompaktes Intervall und f : I → R stetig. Dann ist f gleichmäßig stetig, d. h. zu ε > 0 gibt es ein δ > 0, so dass gilt: x, x0 ∈ I, |x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε. (1.3) Beweis. Angenommen, die Behauptung ist falsch. Für ein ε > 0 gibt es dann Punkte 0 xn , xn ∈ I, so dass gilt: |xn − x0n | → 0, aber |f (xn ) − f (x0n )| ≥ ε. Da I kompakt, können wir nach Übergang zu einer Teilfolge und Umnumerierung annehmen, dass die Folge (xn ) gegen ein x0 ∈ I konvergiert. Es folgt limn→∞ x0n = x0 , denn |x0n − x0 | ≤ |x0n − xn | + |xn − x0 | → 0 mit n → ∞. Da f stetig, folgt weiter ε ≤ lim |f (xn ) − f (x0n )| = |f (x0 ) − f (x0 )| = 0, n→∞ ein Widerspruch. 84 Beispiel 1.4 Ist f : D → R stetig, aber D nicht kompakt, so muss f nicht gleichmäßig stetig sein. Betrachte zum Beispiel 1 f : (0, ] → R, π Dann gilt für xn = 1 f (x) = sin . x 1 1 , x0n = mit n ∈ N 2nπ π/2 + 2nπ |xn − x0n | = π/2 1 ≤ 2 → 0, 2nπ(π/2 + 2nπ) 8n π aber |f (xn ) − f (x0n )| = 1 für alle n. Satz 1.5 (C 0 (I) ⊂ R(I)) Sei I = [a, b] ein kompaktes Intervall. Dann ist jede stetige Funktion f : I → R Riemann-integrierbar. Beweis: Zu ε > 0 konstruieren wir eine Treppenfunktion g : I → R mit kf − gkI ≤ ε. Die Behauptung ergibt sich dann aus Folgerung 1.1 und Satz 1.4. Nach Lemma 1.5 gibt es ein δ > 0, so dass gilt: x, x0 ∈ I, |x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε. Sei D eine beliebige Diskretisierung mit Feinheit ∆(D) < δ. Definiere die Treppenfunktion ( f (ξk ) für x ∈ [xk−1 , xk ) g(x) = f (ξN ) für x = xN . Für x ∈ I gilt x ∈ [xk−1 , xk ) für ein k ∈ {1, . . . , N } (bzw. evtl. x = xN ). Dann folgt |x − ξk | ≤ ∆xk < δ, und somit |f (x) − g(x)| = |f (x) − f (ξk )| < ε nach Wahl von δ > 0. Also folgt kf − gkI ≤ ε, ws zu zeigen war. Definition 1.5 (Stückweise Stetigkeit) Eine Funktion f : [a, b] → R heißt stückweise stetig, wenn es eine Unterteilung a = a0 < . . . < aN = b gibt, so dass gilt: • f |(aj−1 ,aj ) ist stetig für alle j = 1, . . . , N ; • in den aj existieren die links- bzw. limx&aj f (x). rechtsseitigen Grenzwerte limx%aj f (x) bzw. Aus Satz 1.5 und Lemma 1.4 ergibt sich die folgende, nützliche Verschärfung von Satz 1.5. Folgerung 1.2 Stückweise stetige Funktionen sind Riemann-integrierbar. Satz 1.6 (Monotonie des Integrals) Sind f, g ∈ R(I), so gilt: Z b Z b f ≤g ⇒ f≤ g. a (1.4) a Insbesondere gilt, falls f , |f | ∈ R(I) Z b f≤ Z a a 85 b |f |. (1.5) Beweis: Für jede Diskretisierung D gilt SD (f ) = N X f (ξk )∆xk ≤ k=1 N X g(ξk )∆xk = SD (g). k=1 Durch Wahl einer Folge Dj mit ∆(Dj ) → 0 folgt die Behauptung durch Grenzübergang. Folgerung 1.3 (Mittelwertsatz der Integralrechnung) Seien f, ϕ : [a, b] → R stetig und ϕ ≥ 0. Dann gibt es ein ξ ∈ [a, b] mit Z b Z b f ϕ = f (ξ) ϕ. a ⇒ Spezialfall: ϕ = 1 Rb a a f = f (ξ)(b − a). Beweis: Setze m = inf x∈I f (x), M = supx∈I f (x). Dann gilt mϕ ≤ f ϕ ≤ M ϕ Z b Z b b ⇒m ϕ ≤ fϕ ≤ M ϕ a a a Z b Z b ⇒ fϕ = µ ϕ für ein µ ∈ [m, M ]. Z a a Nach dem Zwischenwertsatz gibt es ein ξ ∈ [a, b] mit f (ξ) = µ. 2 Ableitung und Integral Wir kommen nun zu dem zentralen, von Newton und Leibniz studierten Zusammenhang zwischen Differentiation und Integration. Vorher erweitern wir noch die Definition des Integrals, indem wir für f ∈ R([a, b]) setzen: Z a Z b Z a f := − f und f = 0. b a a Mit Lemma 1.4 folgt daraus b Z f+ a c Z f= b Z c f, (2.1) a falls f auf allen beteiligten Intervallen Riemann-integrierbar ist. Bemerkung. Im Folgenden verwenden wir die Notation Z b Z b f= f (x) dx. a a Dies ist vor allem dann nützlich, wenn die Funktion f außer von x noch von weiteren Größen (Variablen) y, z, . . . abhängt: durch das Anhängsel dx“ wird definiert, bzgl. welcher Varia” blen integriert werden soll. Zum Beispiel gilt Z b Z b f (x) − y dx = f (x) dx − y(b − a), aber a a Z b Z b y dy. f (x) − y) dy = f (x)(b − a) − a a 86 Der nachfolgende Satz löst das in Kapitel 3, Abschnitt 2 formulierte Problem, eine Stammfunktion zu finden, also ein Lösung der Differentialgleichung F 0 = f . Satz 2.1 (Hauptsatz der Differential- und Integralrechnung) Sei f : I = [a, b] → R stetig. Für jedes x0 ∈ I ist die Funktion Z x F : I → R, F (x) = f (ξ) dξ x0 eine Stammfunktion von f : F 0 (x) = f (x) ∀x ∈ I. Bemerkung. In den Endpunkten des Intervalls ist dies im Sinne der einseitigen Ableitungen F+0 (a) = f (a) bzw. F−0 (b) = f (b) zu verstehen. Beweis: Die Funktion F ist wohldefiniert nach Satz 1.5. Wir berechnen Z Z x F (x + h) − F (x) 1 x+h − f (x) = f (ξ) dξ − f (ξ) dξ − hf (x) h |h| x0 x0 Z 1 x+h = f (ξ) − f (x) dξ |h| x ≤ 1 |h| |h| sup |f (ξ) − f (x)| (Satz 1.3). |ξ−x|≤|h| Da f im Punkt x stetig ist, geht die rechte Seite mit h → 0 gegen Null. Folgerung 2.1 Sei f ∈ C 0 (I) mit I = [a, b], und F : [a, b] → R sei eine Stammfunktion von f auf I, das heißt F 0 (x) = f (x) für alle x ∈ [a, b] 1 . Dann gilt für jedes x0 ∈ I Z x F (x) = F (x0 ) + f (ξ) dξ. (2.2) x0 Beweis: Nach Folgerung 2.2 in Kapitel 3 und Satz 2.1 gibt es ein c ∈ R mit Z x F (x) = c + f (ξ) dξ für alle x ∈ (a, b). x0 Weiter ist jede Stammfunktion F von f auf [a, b] stetig in a und b nach Kapitel 3, Satz 1.1. Durch Grenzübergang x & a bzw. x % b folgt Z a Z b F (a) = c + f (ξ)dξ, F (b) = c + f (ξ) dξ. x0 x0 Setze nun x = x0 und erhalte F (x0 ) = c. Folgerung 2.2 (Berechnung von bestimmten Integralen mit einer Stammfunktion) Die Funktion F : I = [a, b] → R sei Stammfunktion von f ∈ C 0 (I) auf I. Dann gilt Z b x=b f (x) dx = F (b) − F (a) =: F (x) x=a a 1 In den Intervallgrenzen bedeutet das F+0 (a) = f (a) bzw. F−0 (b) = f (b). 87 Beweis: Folgt aus (2.2) mit x0 = a, x = b. Über den Hauptsatz bzw. Folgerung 2.2 lassen sich Differentiationsregeln aus Kapitel 3.1 in Integrationsregeln übersetzen“. Dies wird im Folgenden durchgeführt. ” Satz 2.2 (Partielle Integration) Seien f, g ∈ C 1 (I) mit I = [a, b]. Dann gilt Z b Z b x=b 0 f 0 g. f g = f (x) g(x) x=a − a a Beweis: Es gilt nach der Produktregel (f g)0 = f 0 g + f g 0 auf I = [a, b]. Folgerung 2.2 liefert die Behauptung. Satz 2.3 (Substitutions- oder Transformationsregel) Sei I = [a, b], I ∗ = [α, β] und ϕ ∈ C 1 (I ∗ ) mit ϕ(I ∗ ) ⊂ I. Dann gilt für f ∈ C 0 (I) Z ϕ(β) Z β f (x) dx = f ϕ(s) ϕ0 (s) ds. ϕ(α) α Beweis: Wähle nach Satz 2.1 eine Stammfunktion F ∈ C 1 (I) von f . Dann gilt Z ϕ(β) x=ϕ(β) f (x) dx = F (x) x=ϕ(α) (Folgerung 2.2) ϕ(α) s=β F ϕ(s) s=α Z β = (F ◦ ϕ)0 (s) ds (Folgerung 2.2) α Z β = F 0 ϕ(s) ϕ0 (s) ds (Kettenregel) α Z β = f ϕ(s) ϕ0 (s) ds. = α Für die Anwendung R b der Substitutionsregel ist folgendes Kochrezept nützlich: bei einem gegebenen Integral a f (y) dy möchten wir y = y(x) substituieren. Dazu berechnen wir y = y(x) dy = y 0 (x) dx. ⇒ Zur Umrechnung der Intervallgrenzen bestimmen wir die Umkehrfunktion ( Auflösen nach ” x“) x = x(y) ⇒ α = x(a), β = x(b). Damit gilt Z a b f (x) dx = b Z a f y(x) y 0 (x) dx. Im folgenden zeigen wir an einigen Beispielen, wie die Integrationsregeln angewandt werden. Zunächst erhalten wir direkte Integrationsformeln immer dann, wenn die Stammfunktion bekannt ist: 88 Beispiel 2.1 (Bekannte Ableitungsregeln und zugehörige Integrationsregeln) α+1 x=b Z b x α x dx = (α ∈ R\{−1}, a, b > 0) α + 1 x=a a Z b x=b dx = log x x=a , (a, b > 0) a x Z b x=b dx = arctan x x=a , (a, b ∈ R). 2 a 1+x Ein Beispiel für die Anwendung der partiellen Integration ist Beispiel 2.2 x Z log u du = 1 Z x 1 · log u du 1 = u=x u log u u=1 − x Z 1 u du u 1 = x log x − (x − 1). Eine schöne Anwendung von Satz 2.2 ist Beispiel 2.3 (Wallis-Produkt) Wir berechnen hier An = A0 = π/2 R π/2 0 sinn x dx. Offenbar gilt x=π/2 und A1 = − cos x x=0 = 1. Für n ≥ 1 leiten wir durch partielle Integration eine Rekursionsformel her: Z π/2 An+1 = sin x sinn x dx 0 = n − | cos x {zsin x} = n Z =0 π/2 x=π/2 x=0 +n sinn−1 x dx − n Z π/2 cos2 x sinn−1 x dx 0 Z 0 π/2 sinn+1 x dx, 0 wobei wir cos2 x = 1 − sin2 x benutzt haben. Es folgt An+1 = n An−1 n+1 (n ≥ 1). Durch Induktion erhalten wir A2n = A2n+1 = Es folgt weiter 2n − 1 2n − 3 1 · · . . . · · A0 = 2n 2n − 2 2 2n 2n − 2 2 · · . . . · · A1 = 2n + 1 2n − 1 3 n A2n π Y 4k 2 − 1 = · . A2n+1 2 4k 2 k=1 89 n Y 2k − 1 2k k=1 n Y k=1 2k 2k + 1 ! ! π , 2 1. Nun gilt An+1 = R π/2 0 sinn+1 x dx ≤ 1≤ R π/2 0 sinn x dx = An , und es folgt An An−1 n+1 ≤ = −→ 1. An+1 An+1 n Daraus ergibt sich die Produktdarstellung von Wallis ∞ Y π 4k 2 2·2 4·4 = = · · ... 2 2 4k − 1 1·3 3·5 k=1 Als nächstes behandeln wir Beispiele zur Substitutionsregel. 0 Beispiel 2.4 (Lineare Parameterwechsel) Mit der Substitution y = x−x m haben wir dy = 1 m dx und x = x0 + my, also als neue Grenzen α = x0 + ma und β = x0 + mb. Es folgt die Regel Z x0 +mb Z b 1 x − x0 f (y) dy = f( ) dx. m m a x0 +ma Beispiel 2.5 (Integration von Z b 0 f (x) dx (x) Za b fp u 1 + u2 du Za b F 0 f (x) f 0 (x) dx a Ableitungen) Z b x=b = (log f )0 (x) dx = log f (x) x=a (f > 0), aZ u=b 1 3 0 3 1 b = (1 + u2 ) 2 du = (1 + u2 ) 2 . 3 a 3 u=a x=b = F f (x) x=a . Beispiel 2.6 (Flächeninhalt unter Hyperbel) Zu berechnen ist das Integral A(x) = Rx√ 2 u − 1 du. Wir substituieren u = cosh t und erhalten du = sinh t dt, t = Arcosh u, 1 also Z Arcosh x A(x) = sinh2 t dt 0 Z 1 Arcosh x 2t = (e + e−2t − 2) dt 4 0 t=Arcosh x 1 1 2t −2t − Arcosh x = (e − e ) 8 2 t=0 ( ) t=Arcosh x 1 et + e−t et − e−t = − Arcosh x 2 2 2 t=0 1 p 2 = x x − 1 − Arcosh x . 2 Für rationale Funktionen, also Quotienten von Polynomen, hat man ein spezielles Integrationsverfahren, die Partialbruchzerlegung, die wir hier nur an einem Beispiel vorführen: Beispiel 2.7 (Partialbruchzerlegung) Um das Integral wir den Ansatz R 1/2 dx −1/2 1−x2 zu berechnen, machen 1 1 A B (A − B)x + (A + B) ! = = + = . 2 1−x (1 + x)(1 − x) 1−x 1+x 1 − x2 90 Der Koeffizientenvergleich ergibt A = B = 1/2, also folgt Z 1/2 Z 1/2 1 1/2 1/2 = + dx 2 1+x −1/2 1 − x −1/2 1 − x 1 + x x=1/2 = 1/2 · log 1 − x x=−1/2 = 1/2 · (log 3 − log 1/3) = log 3. Als wichtige Anwendung des Hauptsatzes wollen wir nun den Existenzbeweis für die gleichförmige Kreisbewegung führen. Satz 2.4 (Kapitel 3, Satz 3.2) Für gegebenes z0 ∈ C hat das Anfangswertproblem c0 = ic auf R, c(0) = z0 (2.3) eine Lösung c : R → C. Beweis: In den ersten beiden Schritten wird der Beweis auf das wesentliche Problem reduziert, das dann in Schritt 3 gelöst wird. Schritt 1: Es reicht, den Fall z0 = 1 zu betrachten. Ist nämlich c(t) die Lösung für z0 = 1, so ist c̃(t) = z0 c(t) die Lösung zu gegebenem z0 ∈ C. Schritt 2: Es reicht, eine Lösung c : (−α, α) → C von (2.3) für z0 = 1 zu finden mit limt%α c(t) = i und limt&−α c(t) = −i. Wir setzen diese Lösung dann in drei Schritten (a),(b) und (c) auf ganz R fort: (a) c(α) = i, c(−α) = −i. Nach Voraussetzung ist c dann stetig auf [−α, α]. (b) c(t) = −c(t − 2α) für t ∈ [α, 3α]. Dann ist c stetig in α, da −c(−α) = −(−i) = i. Weiter gilt für t ∈ (α, 3α) die Differentialgleichung, denn c0 (t) = −c0 (t − 2α) = −i c(t − 2α) = i c(t). Ferner haben wir limt→α c0 (t) = limt→α ic(t) = −1 ∈ C. Nach Übungsaufgabe 1, Serie 12, folgt c0 (α) = −1 = i c(α), das heißt die Differentialgleichung gilt auf (−α, 3α). Außerdem ist c stetig auf [α, 3α] mit c(3α) = −c(α) = −i = c(−α). (c) c(t + 4kα) = c(t) für t ∈ [−α, 3α] und k ∈ Z (4α-periodische Fortsetzung). Dann folgt die Lösungseigenschaft auf ganz R analog zu (b). Schritt 3: Konstruktion der Lösung c : (−α, α) → C für z0 = 1. Definiere mit Satz 1.5 die Funktion Z y ds √ ψ : (−1, 1) → R, ψ(y) = . 1 − s2 0 91 Ry Ry Für y ≥ 0 gilt 0 (1 − s2 )−1/2 ds ≤ 0 (1 − s)−1/2 ds = [−2(1 − s)1/2 ]s=y s=0 ≤ 2. Also existiert der Grenzwert α := limy%1 ψ(y) ∈ (0, 2]. Da ψ(−y) = −ψ(y), folgt limy&1 ψ(y) = −α. Betrachte nun mit Satz 3.2 in Kapitel 2 die Umkehrfunktion ϕ : (−α, α) → (−1, 1). Aus dem Hauptsatz der Differential- und Integralrechnung sowie aus dem Satz über die Ableitung der Umkehrfunktion, Satz 1.4 in Kapitel 3, ergibt sich p 1 = 1 − ϕ2 (t). ϕ0 (t) = 0 ψ (ϕ(t)) Weiter gilt, wieder nach Satz 3.2 in Kapitel 2, limt%α ϕ(t) = 1 und limt&−α ϕ(t) = −1. Sei nun c̃ : (−1, 1) → C die Parametrisierung des Halbkreises {x + iy : x2 + y 2 = 1, x > 0} als Graph über der y-Achse, das heißt p c̃(y) = 1 − y 2 + iy, y ∈ (−1, 1). Wir behaupten, dass die Umparametrisierung c = c̃ ◦ ϕ : (−α, α) → C, c(t) = p 1 − ϕ(t)2 + iϕ(t) die gesuchte Lösung von (2.3) ist. Denn es gilt ϕϕ0 c0 = − p 1 − ϕ2 p p + iϕ0 = −ϕ + i 1 − ϕ2 = i( 1 − ϕ2 + iϕ) = ic. Da ϕ(0) = 0, ist außerdem c(0) = 1. Schließlich haben wir limt%α c(t) = limy%1 c̃(y) = i und limt&−α c(t) = limy&−1 c̃(y) = −i. Also ist c die gesuchte Lösung. Als Ansatz für den obigen Beweis sucht man eine Umparametrisierung c = c̃ ◦ ϕ, so dass p 0 = 2 lösen muss. Für c0 = ic gilt. Als Bedingung ergibt sich, dass ϕ die Gleichung ϕ 1 − ϕ p 0 2 die Umkehrfunktion ψ von ϕ ergibt sich daraus ψ (y) = 1/ 1 − y . Nun kann man wie oben mit dem Beweis loslegen. Bei der Definition des Riemannschen Integrals ist das Definitionsintervall I = [a, b] nach Voraussetzung kompakt. Wir wollen nun kurz erläutern, wie auch unendliche Integrationsintervalle −∞ ≤ a < b ≤ ∞ und in den Intervallgrenzen unbeschränkte Funktionen im Rahmen des Riemann-Integrals behandelt werden können. Definition 2.1 Sei I = (a, b) mit −∞ ≤ a < b ≤ ∞. Die Funktion f : I → R sei Riemannintegrierbar R c auf jedem kompakten R b Teilintervall J ⊂ I. Falls für ein cR∈b I die Grenzwerte limα&a α f (ξ) dξ und limβ%b c f (ξ) dξ existieren, so heißt das Integral a f (ξ) dξ konvergent Rb (bzw. a f (ξ) dξ existiert) und wir setzen Z b Z c Z β f (ξ) dξ = lim f (ξ) dξ + lim f (ξ) dξ. α&a α a β%b c Diese Definition ist unabhängig von der Wahl von c ∈ R, denn es gilt Z ec Z c Z ec f (ξ) dξ = f (ξ) dξ + f (ξ) dξ, Z α β e c α β f (ξ) dξ = Z c f (ξ) dξ − c Z c 92 e c f (ξ) dξ. Beispiel 2.8 α+1 x=R 1 x ∞ =− limR→∞ α x dx = α + 1 x=1 α+1 1 divergent Z 1 für divergent α+1 x=1 α x dx = x 1 = für 0 limε→0 α + 1 x=ε α+1 Z ∞ xα dx = divergent für alle α ∈ R. Z für α < −1, für α ≥ −1. α ≤ −1, α > −1. 0 Z ∞ −∞ dx 1 + x2 = lim Z R→∞ 0 R dx + lim 1 + x2 R→∞ Z 0 dx 1 + x2 −R lim (arctan R) − lim arctan(−R) R→∞ R→∞ π π − − = π. = 2 2 = 93 Kapitel 5 Approximation von Funktionen durch Reihen Zur Motivation betrachten wir für eine gesuchte Funktion f : R → C das Anfangswertproblem f 0 = λf, für λ ∈ C. f (0) = 1 Die Lösung ist uns bereits bekannt: nach Folgerung 3.4 in Kapitel 3 ist die eindeutig bestimmte Lösung dieses Anfangswertproblems die Funktion f (x) = eλx . Wir wollen aber hier einen anderen, von Satz 2.4 in Kapitel 4 unabhängigen Lösungszugang entwickeln. Und zwar wollen wir zunächst versuchen, die Gleichung näherungsweise zu lösen, indem wir einen Ansatz der Form n X fn (x) = a0 + a1 x + . . . + an xn = ak xk k=0 mit einem Polynom n-ten Grades fn machen. Wir berechnen fn0 (x) = a1 + 2a2 x + . . . + n an xn−1 = n X k ak xk−1 = k=1 sowie λ fn (x) = n X n−1 X (k + 1) ak+1 xk k=0 λ ak xk . k=0 Es gilt also fn0 − λfn = n−1 X ((k + 1) ak+1 − λak )xk − λan xn , fn (0) = a0 . k=0 Wie vorhergesehen, ist das Anfangswertproblem auf diese Weise nicht exakt lösbar. Aber die ak können so gewählt werden, dass fn die Gleichung bis auf einen Term der Ordnung xn löst. Und zwar setzen wir a0 = 1 (Anfangsbedingung), ak+1 = 95 λ ak k+1 für k = 0, 1, . . . , n − 1. Dies ergibt ak = λk für k = 0, 1, . . . , n. Die Näherungslösung ist also die Summe k! fn (x) = n X (λx)k k=0 k! , und sie erfüllt fn0 − λfn = −λn+1 xn /n!. Es stellt sich die Frage, ob diese Näherungslösungen fn mit n → ∞ gegen die tatsächliche Lösung f des Anfangswertproblems konvergieren. Wenn ja, so folgt die Reihendarstellung ∞ X (λx)k eλx = . k! k=0 Im Folgenden soll die Konvergenz von solchen unendlichen Reihen untersucht werden. 1 Reihen von reellen und komplexen Zahlen Definition 1.1 Eine Folge (Sn )n∈N0 heißt (unendliche) Reihe mit Gliedern an ∈ C, falls gilt: n X Sn = ak für alle n ∈ N0 . k=0 Die Reihe heißt konvergent mit Wert S ∈ R, wenn die Folge (Sn )n∈N0 gegen S konvergiert: ∞ X ak := lim k=0 n→∞ n X an = lim Sn = S. k=0 n→∞ Die Zahl Sn wird auch als n-te Partialsumme der Reihe bezeichnet. Oft wird die Reihe in der Form a0 + a1 + a2 + . . . durch ihre ersten Glieder angegeben. Leider ist es auch üblich, P die Reihe selbst - unabhängig von der Frage der Konvergenz - ebenfalls mit dem Symbol ∞ k=0 ak zu bezeichnen. 1 1 1 Beispiel 1.1 Die Reihe 1·2 + 2·3 + 3·4 + . . . wird auch mit ist jeweils die Folge (Sn )n∈N mit den Gliedern S1 = 1 , 1·2 S2 = 1 1 2 + = , 1·2 2·3 3 S3 = P∞ 1 k=1 k(k+1) bezeichnet. Gemeint 1 1 1 3 + + = ,... 1·2 2·3 3·4 4 Allgemein gilt n X 1 X n n+1 1 1 1 X1 Sn = − = − =1− . k k+1 k k n+1 k=1 k=1 k=2 P∞ 1 Also ist die Reihe konvergent mit Wert k=1 k(k+1) = 1. P Jede beliebige Folge (Sn )n∈N0 läßt sich als Reihe ∞ n=0 an schreiben. Wir müssen nur a0 = S0 und an = Sn − Sn−1 für n ≥ 1 setzen. Die oben benutzte, mit dem Index Null statt mit Eins beginnende Numerierung tritt öfter auf. Es stellen sich nun zwei Fragen: • Wie kann ich den Gliedern an der Reihe ansehen, ob die Reihe konvergiert bzw. divergiert? 96 • Im Fall der Konvergenz: welchen Wert hat die Reihe? √ Bei der zweiten Frage ist zum Beispiel gemeint, ob eine bereits definierte Zahl wie 2, e, π, . . . als Grenzwert einer Reihe dargestellt werden kann. Im Folgenden steht aber die erste Frage im Zentrum des Interesses. Dabei ist das nächste Beispiel fundamental. Beispiel 1.2 (Geometrische Reihe) Für die geometrische Reihe mit z ∈ C gilt: |z| < 1 ⇒ konvergent mit Wert P∞ k=0 z k = 1+z+z 2 +. . . 1 , 1−z |z| ≥ 1 ⇒ divergent. Denn für |z| < 1 folgt aus der Formel für die geometrische Summe (Kapitel 1, Satz 2.2) n X zk = k=0 Dagegen gilt für |z| ≥ 1 mit Sn = Pn 1 − z n+1 1 −→ . 1−z 1−z k=0 z k |Sn+1 − Sn | = |z n+1 | = |z|n+1 ≥ 1, so dass (Sn )n∈N keine Cauchyfolge sein kann. P 1 1 1 Beispiel 1.3 (Harmonische Reihe) Die harmonische Reihe ∞ k=1 k = 1 + 2 + 3 + . . . ist bestimmt divergent gegen +∞. Dies zeigen wir durch Vergleich mit einem Integral: Betrachte die Treppenfunktion f : [1, ∞) → R mit f (x) = Es gilt f (x) ≥ 1 x 1 k für k ≤ x < k + 1 (k ∈ N). für alle x ∈ [1, ∞), also Z n+1 Z n+1 n X dx 1 = f (x) dx ≥ = log(n + 1) → ∞ k x 1 1 k=1 mit n → ∞, was zu zeigen war. Alternativ folgt die Divergenz der harmonischen Reihe, indem wir in den Partialsummen wie folgt Klammern setzen: 1 1 1 1 1 1 1 1 1 1 + + + +... + + + + + + ... + 1 2 3 4 5 6 7 8 9 15 | {z } | {z } | {z } | {z } ≥1/2 ≥1/2 ≥1/2 ≥1/2 In den Klammern werden jeweils die Zahlen k1 für 2m−1 ≤ k < 2m summiert für m ∈ N; damit ist jede Klammer größer als 2m−1 · 2−m = 21 . Beispiel 1.4 (Unendliche Dezimalbr üche) Ist (nk )k∈N eine Folge von Ziffern nk ∈ P∞ {0, 1, . . . , q}, so ist die Reihe k=1 nk 10−k konvergent, vgl. Kapitel 1, Satz 4.2. Wir beginnen die allgemeine Diskussion der Konvergenzfrage damit, dass wir die bekannten Aussagen für Folgen in der Situation von Reihen reformulieren. 97 P∞ Lemma 1.1 (Konvergenzkriterium von Cauchy) Eine Reihe k=0 ak dann und nur dann, wenn es zu jedem ε > 0 ein N ∈ R gibt, so dass gilt: m≥n>N ⇒ | m X konvergiert ak | < ε. k=n Beweis: Kapitel 1, Satz 4.1. Satz 1.1 (Nullfolgentest) Wenn die Glieder ak einer Reihe gegen Null gehen, so ist die Reihe divergent. P∞ k=0 ak mit k → ∞ nicht Beweis: Ist die Reihe konvergent, mit anderen Worten die Folge der Partialsummen Sn = Pn k=0 ak konvergent, so folgt an = Sn − Sn−1 → 0 mit n → ∞. P∞ Lemma 1.2 (Reihen mit Gliedern ak ≥ 0) Eine reelle Reihe k mit ak ≥ 0 für k=0 a P alle k konvergiert genau dann, wenn die Folge der Partialsummen Sn = nk=0 ak nach oben beschränkt ist. Beweis: Da ak ≥ 0, ist die Folge (Sn ) monoton wachsend. Die Behauptung folgt aus Kapitel 1, Satz 4.3 und Satz 3.2. Beispiel 1.5 Für s > 1 ist die Reihe tion f : [1, ∞) → R mit f (x) = Da f (x) ≤ P∞ 1 k=1 ks 1 (k + 1)s konvergent. Betrachte dazu die Treppenfunk- für k ≤ x < k + 1 (k ∈ N). 1 für alle x ∈ [1, ∞), folgt xs n X 1 ks = 1+ Z n f (x) dx 1 k=1 Z n dx xs 1 x=n 1 1−s = 1+ x 1−s x=1 s ≤ . s−1 ≤ 1+ Also ist die Folge der Partialsummen beschränkt. P∞ Definition 1.2 Die Reihe ak mit ak ∈ C heißt absolut konvergent, wenn die Reihe k=0P P∞ ∞ k=0 |ak | konvergiert, das heißt k=0 |ak | < ∞. Lemma 1.3 (absolut konvergent ⇒ konvergent) Wenn die Reihe vergiert, so ist sie konvergent. 98 P∞ k=0 ak absolut kon- Beweis: Sei ε > 0 gegeben. Nach Voraussetzung und dem Cauchykriterium, Lemma 1.1, gibt es ein N ∈ R mit m≥n>N ⇒ m X |ak | < ε k=n ⇒ m X ak < ε. k=n Aus Lemma 1.1 folgt die Behauptung. P (−1)k−1 Beispiel 1.6 Die Reihe ∞ = 1 − 12 + 13 − . . . ist konvergent, aber nicht absolut k=1 k konvergent. Um die Konvergenz zu zeigen, betrachten wir getrennt die Folge der geraden bzw. der ungeraden Partialsummen. Es gilt 1 1 + > 0, 2n 2n − 1 1 1 − < 0. 2n + 1 2n S2n − S2n−2 = − S2n+1 − S2n−1 = Die Folge (S2n )n∈N ist also monoton wachsend, die Folge (S2n−1 )n∈N monoton fallend. Weiter gilt für alle n ∈ N 1 S2n−1 − S2n = > 0, 2n und es folgt S2n ≤ S2n−1 ≤ S1 sowie S2n−1 ≥ S2n ≥ S2 . Nach Satz 4.3 in Kapitel 1 sind somit beide Folgen (S2n ) und (S2n−1 ) konvergent. Wegen S2n−1 − S2n → 0 mit n → ∞ sind die beiden Grenzwerte gleich und die gesamte Reihe (SP k )k∈N konvergiert. Andererseits ist die 1 Reihe der Absolutbeträge aber die harmonische Reihe ∞ k=0 k , und diese ist nicht konvergent nach Beispiel 1.3. Der folgende Satz fasst die wesentlichen Kriterien für die absolute Konvergenz von Reihen zusammen. P Satz 1.2 (Tests für absolute Konvergenz)PSei ∞ k=0 ak eine Reihe mit ak ∈ C. Ist eine der drei folgenden Bedingungen erfüllt, so ist ∞ a k=0 k absolut konvergent: (a) Majorantenkriterium (Weierstraß M-Test) P Es gilt |ak | ≤ ck ∈ [0, ∞) mit ∞ k=0 ck < ∞. (b) Quotientenkriterium Es gibt ein θ ∈ [0, 1) und ein k0 ∈ N mit |ak+1 | |ak | ≤ θ für k ≥ k0 (ak 6= 0 für k ≥ k0 ). (c) Wurzelkriterium Es gibt ein θ ∈ [0, 1) und ein k0 ∈ N mit p k |ak | ≤ θ für alle k ≥ k0 . Umgekehrt ist die Reihe divergent, wenn gilt: p |ak+1 | ≥ 1 oder k |ak | ≥ 1 für k ≥ k0 . |ak | 99 Bemerkung. In (b) oder (c) reicht es nicht, nur die Abschätzung zu haben. Zum Beispiel gilt für |ak+1 | <1 |ak | P∞ 1 bzw. p k |ak | < 1 k=1 k |ak+1 | k < 1, = |ak | k+1 p k 1 |ak | = √ <1 k k für alle k, trotzdem ist die Reihe nicht konvergent (Beispiel 1.3). Beweis des Satzes: Aussage (a) folgt aus Lemma 1.2, angewandt auf Lemma 1.3. Voraussetzung (b) liefert per Induktion |ak | ≤ θk−k0 |ak0 | P∞ k=0 |ak |, und aus für k ≥ k0 . Da die geometrische Reihe auf der rechten Seite konvergiert (Beispiel 1.2), folgt die Behauptung aus (a) und wir erhalten außerdem die Abschätzung ∞ X |ak | ≤ k=k0 |ak0 | . 1−θ (1.1) Unter der Voraussetzung (c) folgt |ak | ≤ θk für k ≥ k0 . Wieder folgt die Behauptung durch M-Test mit der geometrischen Reihe. Die Abschätzung lautet hier ∞ X θ k0 |ak | ≤ . (1.2) 1−θ k=k0 Die Divergenzaussagen folgen unmittelbar aus dem Nullfolgentest Satz 1.1. Beispiel 1.7 Für α ∈ C, z ∈ C betrachten wir die Binomialreihe Bα (z) = ∞ X α k=0 k z k = 1 + αz + α(α − 1) 2 z + ... 2 Für α ∈ N0 bricht die Reihe nach k = α ab, denn es gilt α(α − 1) · . . . · α − (k − 1) α = . k k! Nach Binomischem Lehhrsatz (Kapitel 1, Satz 2.1) gilt dann Bα (z) = (1 + z)α . Im Folgenden sei oBdA α ∈ / N0 . Außerdem setzen wir z 6= 0 voraus, denn für z = 0 ist Bα (z) = α0 = 1. Unter diesen Annahmen folgt α k ak = z 6= 0 für alle k ∈ N0 , k 100 und wir erhalten ak+1 |α − k| ak = k + 1 |z| −→ |z| mit k → ∞. Falls nun |z| < 1, so gilt |ak+1 /ak | ≤ θ < 1 für k ≥ k0 , wenn wir zum Beispiel θ := (1 + |z|)/2 < 1 und k0 ∈ N hinreichend groß wählen. Also ist die Binomialreihe für |z| < 1 absolut konvergent. Umgekehrt gilt im Fall |z| > 1 für hinreichend große k ≥ k0 |ak+1 /ak | ≥ 1 (falls |z| > 1). Für |z| > 1 ist die Reihe also divergent. Für z ∈ C mit |z| = 1 können wir ohne weiteres keine Aussage treffen. Die Rechenregeln für Addition von konvergenten Reihen sowie Multiplikation mit komplexen Zahlen ergeben sich direkt aus der entsprechenden P Regel für konvergente Folgen, siehe Satz P∞ ∞ 3.3 a) in Kapitel 1. So ist für konvergente Reihen a und b und λ, µ ∈ R auch k=0 k k=0 k P∞ die Reihe k=0 (λak + µbk ) konvergent und es gilt ∞ X (λak + µbk ) = λ k=0 ∞ X ∞ X +µ k=0 bk . k=0 Durch P∞ Abänderung, Hinzufügen oder Weglassen von endlich vielen Gliedern in einer Reihe k=0 ak wird die Konvergenz oder Divergenz nicht beeinflusst. Überlegen Sie, wie die Folge der Partialsummen durch diese Operationen beeinflusst wird. Natürlich ändert sich im Fall der Konvergenz in der Regel der Wert der Reihe, zum Beispiel haben wir ∞ X k=n ak = lim m→∞ m X m X ak = lim m→∞ k=n ak − k=0 n−1 X ak ! = k=0 ∞ X ak − k=0 n−1 X ak . k=0 P∞ P Bei der Multiplikation von zwei Reihen ∞ k=0 ak und k=0 bk treten die doppelt indizierten Produkte ak bl (k, l ∈ N0 ) auf. Es ist zunächst nicht klar, in welcher Reihenfolge diese summiert werden sollen. Eine naheliegende Möglichkeit, das sogenannte Cauchyprodukt, ist folgende: erst werden die n + 1 Produkte ak bl in jeder Diagonale k + l = n addiert, dann wird die Konvergenz der resultierenden Reihe untersucht. Der folgende Satz besagt, dass dieses Verfahren bei absolut konvergenten Reihen funktioniert. Satz 1.3 (Cauchyprodukt) Die Reihen Dann ist auch die Reihe ∞ X cn mit P∞ cn = k=0 k=0 ak X und ak bl = k+l=n P∞ k=0 bk n X seien absolut konvergent. ak bn−k k=0 absolut konvergent und es gilt ∞ X k=0 ak · ∞ X k=0 bk = ∞ X cn = n=0 ∞ X n=0 101 X k+l=n ak bl ! . Beweis: Wir setzen für N ∈ N0 AN := N X |ak | → k=0 ∞ X |ak | =: A und BN := k=0 N X |bk | → k=0 ∞ X |bk | =: B. k=0 Dann gilt N X |cn | ≤ n=0 Also ist P∞ n=0 cn N X X |ak | |bl | ≤ n=0 k+l=n X |ak | |bl | = AN BN → A B < ∞. 0≤k,l≤N absolut konvergent. Ferner haben wir |A2N B2N − 2N X cn | = n=0 X | ak bl − 0≤k,l≤2N X X ≤ ak bl | k+l≤2N |ak | |bl | 0≤k,l≤2N, max(k,l)>N = A2N B2N − AN BN → 0 Somit konvergiert die Reihe P∞ n=0 cn Beispiel 1.8 Die Reihe f (z) = ist gegen A B. ∞ X zk k=0 mit N → ∞. k! ist absolut konvergent für alle z ∈ C. Denn für z 6= 0 k+1 z /(k + 1)! = |z| ≤ 1 k+1 k 2 z /k für k ≥ k0 , also ist das Quotientenkriterium anwendbar. Es folgt für z, w ∈ C aus dem Cauchyprodukt und der Binomischen Formel f (z) f (w) = ∞ ∞ X z k X wk k! k k=0 k=0 ∞ X X 1 k l z w k!l! k=0 k+l=n ∞ n X 1 X n k n−k = z w n! k = = n=0 ∞ X n=0 k=0 (z + w)n n! = f (z + w). Die Reihe f (z) erfüllt also die Funktionalgleichung der e-Funktion, siehe Kapitel 2, Satz 3.3. Beim Cauchyprodukt trat das Problem der Summationsreihenfolge auf. Allgemein kann eine Änderung der Summationsreihenfolge, eine sogenannte Umordnung, die Konvergenz bzw. 102 Divergenz einer Reihe beeinflussen. Betrachte z. B. für die Reihe 1 − 21 + nachstehende Umordnung 1 1 1 1 1 1 1 1 1 1− + + − + + + + − + .... 2 3 5 4 7 9 11 13 6 1 3 − + . . . die Während die Ausgangsreihe konvergiert (Beispiel 1.6), ist die so umgeordnete Reihe sogar bestimmt divergent gegen +∞, denn die Summe der positiven Zahlen in jeder der Klammern ist mindestens 1/4. Zum Glück gibt es derart merkwürdige Phänomene bei absolut konvergenten Reihen nicht. P Satz 1.4 (Umordnungsatz) SeiP τ : N0 → N0 bijektiv. Falls ∞ k=0 ak absolut konvergent ∞ ist, so konvergiert auch die Reihe k=0 aτ (k) absolut und hat denselben Grenzwert. P Beweis: Sei S = ∞ n=0 an . Zu ε > 0 existiert ein n0 ∈ N mit ∞ X |an | < ε/2. n=n0 Sei m ≥ max{k ∈ N0 : τ (k) < n0 }. Aus τ (k) < n0 folgt dann k ≤ m, und wir können folgendermaßen abschätzen: m X S − aτ (k) = S − k=0 ≤ S − m X aτ (k) + k=0, τ (k)<n0 m X k=0, τ (k)<n0 aτ (k) + m X k=0, τ (k)≥n0 m X aτ (k) |aτ (k) | k=0, τ (k)≥n0 X nX ∞ 0 −1 ≤ S − an + |an | n=n0 n=0 ≤ 2 ε ε + . 2 2 Potenzreihen P k Eine Reihe des Typs P (z) = ∞ ∈ C heißt Potenzreihe. Die k=0 ak z mit Koeffizienten akP n k Partialsummen der Potenzreihe sind die Polynome Pn (z) = k=0 ak z . Folgende Fragen interessieren uns: • Für welche z ∈ C konvergiert die Potenzreihe P (z)? • Lassen sich Eigenschaften der approximierenden Polynome wie Stetigkeit und Differenzierbarkeit auf die Potenzreihen Übertragen? Wenn ja, wie? Die erste Frage hat eine überraschend klare und einfache Antwort. Wir brauchen dazu folgenden Hilfssatz. 103 P k Lemma 2.1 (Abelsches Lemma) Sei ∞ k=0 ak z eine gegebene Potenzreihe mit Koeffizienten ak ∈ C. Für r ∈ (0, ∞) gebe es ein M ∈ [0, ∞), so dass gilt |ak | rk ≤ M für alle k ∈ N0 . (2.1) Auf jeder kleineren Kreisscheibe K% (0) = {z ∈ C : |z| ≤ %} mit Radius % ∈ [0, r) konvergiert die Reihe dann absolut und gleichmäßig. Beweis: Für z ∈ K% (0) gilt k |ak z | = |ak | r k |z| r k ≤M % k r . Die absolute Konvergenz folgt aus dem Majorantenkriterium, durch Vergleich mit der geoP metrischen Reihe ∞ M (%/r)k ; diese konvergiert wegen %/r < 1. Weiter gilt k=0 z ∈ K% (0) ⇒ |Pn (z) − P (z)| ≤ ∞ X ∞ X % k (%/r)n+1 |ak z | ≤ M ≤M . r 1 − %/r k k=n+1 (2.2) k=n+1 Also gilt für die Supremumsnorm auf der Kreisscheibe K% (0) die Abschätzung kPn − P kK% (0) ≤ M (%/r)n+1 →0 1 − %/r mit n → ∞. Im Bezug auf die beiden Konvergenzaussagen des Lemmas ist Folgendes zu beachten: der Begriff absolute Konvergenz bezieht sich auf eine Reihe von komplexen Zahlen, das heißt P k wird an einer festen Stelle z betrachtet. Dagegen bezieht sich der Begriff P (z) = ∞ a z k=0 k gleichmäßige Konvergenz auf die Folge von Funktionen Pn : K% (0) → C. P k Satz 2.1 (Konvergenzradius) Zu jeder Potenzreihe P (z) = ∞ k=0 ak z gibt es genau ein R ∈ [0, ∞], den Konvergenzradius, mit folgender Eigenschaft: |z| < R ⇒ P (z) absolut konvergent, |z| > R ⇒ P (z) divergent. Beweis: Die Eindeutigkeit von R ist klar. Zur Existenz definieren wir R = sup{|z| : P (z) konvergiert} ∈ [0, ∞]. Ist |z| < R, so gibt es nach Definition ein z0 ∈ C mit |z| < |z0 | ≤ R, so dass P (z0 ) konvergiert. Aus dem Nullfolgentest, Satz 1.1, folgt |ak z0k | → 0 mit k → ∞, also gilt die Voraussetzung (2.1) in Lemma 2.1 mit r = |z0 | und geeignetem M < ∞. Da |z| < r, ist P (z) absolut konvergent nach Lemma 2.1. Ist andererseits |z| > R, so ist P (z) divergent nach Definition von R. BeispielP 2.1 Der Konvergenzradius einer Potenzreihe kann R = 0 sein, wie das Beispiel ∞ k k P (z) = k=0 k z zeigt. Aus dem Nullfolgentest ergibt sich nämlich, dass die Reihe für kein z ∈ C mit |z| > 0 konvergieren kann. Dass auch R = +∞ möglich ist, sieht man am P zk Beispiel der Exponentialreihe P (z) = ∞ k=0 k! , vgl. Beispiel 1.8. Eine Potenzreihe mit endlichem, positiven Konvergenzradius ist schließlich die in Beispiel 1.7 betrachtete Binomialreihe k P α Bα (z) = ∞ z ; für α ∈ / N hat diese Reihe den Konvergenzradius R = 1. 0 k=0 k 104 Wir kommen jetzt zu der zweiten Frage, die am Anfang des Abschnitts formuliert wurde. Unser Ziel ist es,Pdie Stetigkeit – anschließend die Differenzierbarkeit – der PolynomfunkP k zu übertragen. Hierzu tionen Pn (z) = nk=0 ak z k auf die Potenzreihe P (z) = ∞ a z k=0 k ist allgemein zu untersuchen, unter welchen Voraussetzungen an die Konvergenz fn → f einer Funktionenfolge die Eigenschaft der Stetigkeit – sowie im Anschluss die Eigenschaft der Differenzierbarkeit – erhalten bleiben. Satz 2.2 (Gleichmäßige Konvergenz und Stetigkeit) Die Funktionen fn : D → Rp mit D ⊂ Rm seien stetig. Falls die Folge (fn )n∈N gleichmäßig gegen f : D → Rp konvergiert, das heißt kfn − f kD = sup |fn (x) − f (x)| → 0 mit n → ∞, x∈D so ist auch f stetig auf D. Beweis: Sei x0 ∈ D und ε > 0 gegeben. Wähle N ∈ N mit kf − fN kD < 3ε . Dann wähle δ > 0 mit der Eigenschaft |x − x0 | < δ ⇒ ε |fN (x) − fN (x0 )| < . 3 Es folgt für |x − x0 | < δ mit der Dreiecksungleichung |f (x) − f (x0 )| ≤ |f (x) − fN (x)| + |fN (x) − fN (x0 )| + |fN (x0 ) − f (x0 )| . | {z } | {z } | {z } < 3ε < 3ε < 3ε P k Folgerung 2.1 Sei P (z) = ∞ mit Konvergenzradius R > 0. Dann k=0 ak z eine Potenzreihe Pn k konvergiert die Folge der Polynome Pn (z) = k=0 ak z gleichmäßig gegen P (z) auf jeder Kreisscheibe K% (0) = {z ∈ C : |z| ≤ %} mit % < R, und P ist stetig auf der offenen Kreisscheibe UR (0). P k k Beweis: Wähle r ∈ (%, R). Dann ist ∞ k=0 ak r konvergent nach Satz 2.1, und |ak |r ist beschränkt nach dem Nullfolgentest (Satz 1.1). Die gleichmäßige Konvergenz auf K% (0) folgt aus Lemma 2.1. Die Stetigkeit von P auf UR (0) folgt nun aus Satz 2.2. Wie bei Polynomen, siehe Satz 1.1 in Kapitel 2, stellt sich auch bei Potenzreihen die Frage, ob durch eine hinreichend große Menge von Funktionswerten die Koeffizienten ak eindeutig festgelegt sind. Dies können wir nun beantworten. P∞ k und Satz 2.3 P (Koeffizientenvergleich für Potenzreihen) Seien P (z) = k=0 ak z ∞ k Q(z) = Potenzreihen mit positivem Konvergenzradius. Falls es eine Folge k=0 bk z zi → 0, zi 6= 0 gibt mit P (zi ) = Q(zi ) für alle i ∈ N, so folgt ak = bk für alle k ∈ N0 und die Potenzreihen sind gleich. Beweis: Indem wir von P zu P − Q übergehen, können wir bk = 0 für alle k ∈ N0 annehmen. Wäre die Behauptung falsch, so gilt für ein n ∈ N0 a0 = a1 = . . . = an−1 = 0, 105 aber an 6= 0. Ist R > 0 der Konvergenzradius von P , so folgt für 0 < |z| < R und jedes m ∈ N0 , da a0 = . . . = an−1 = 0, m X k=0 an+k z k = z −n m X an+k z n+k = z −n n+m X aj z j → z −n P (z) mit m → ∞. j=0 k=0 P∞ Die Potenzreihe F (z) = k=0 an+k z k konvergiert also für |z| < R, und aus Folgerung 2.1 schließen wir an = F (0) = lim F (zi ) = lim (zi−n P (zi )) = 0, i→∞ i→∞ ein Widerspruch zur Annahme. Wir kommen nun schließlich zur Differenzierbarkeit von Potenzreihen. Auch hierzu brauchen wir erst ein allgemeines Resultat: Satz 2.4 (Vertauschung von Konvergenz und Ableitung) Sei fn ∈ C 1 (I) eine Folge stetig differenzierbarer Funktionen, wobei I = (a, b) ⊂ R. Es möge gelten: (i) Die Folge fn konvergiert punktweise gegen f : I −→ R. (ii) Die Folge fn0 konvergiert gleichmäßig gegen g : I −→ R. Dann ist f ∈ C 1 (I) und es gilt f 0 = g. Beweis: Für x0 ∈ I gilt nach dem Hauptsatz der Differential- und Integralrechnung (Kapitel 4, Satz 2.1) Z x fn (x) = fn (x0 ) + fn0 (ξ) dξ ∀x ∈ I. x0 Mit n → ∞ folgt aus der Vertauschbarkeit von Integral und gleichmäßiger Konvergenz (Kapitel 4, Satz 1.4) Z x f (x) = f (x0 ) + g(ξ) dξ ∀x ∈ I. x0 Die Funktion g ist stetig nach Satz 2.2, also folgt aus dem Hauptsatz f ∈ C 1 (I) und f 0 = g. Für Funktionen f : I → Rp oder f : I → C gilt der Satz entsprechend. Dies ergibt sich sofort durch Anwendung auf die einzelnen Koordinatenfunktionen, vgl. Lemma 1.1 in Kapitel 3. Bei der Anwendung auf Potenzreihen ist zunächst zu beachten, dass wir den Begriff der Ableitung nur für für Funktionen f = f (x) einer reellen Variablen erklärt haben. Deshalb schränken wir die Potenzreihen im Folgenden auf das reelle Intervall I = (−R, R) ⊂ R ein, wobei R > 0 der Konvergenzradius ist. P∞ k Satz 2.5 (Differenzierbarkeit von Potenzreihen) Die Potenzreihe P (z) = k=0 ak z mit ak ∈ C habe den Konvergenzradius R > 0. Dann ist die Funktion P : (−R, R) → C, P (x) = ∞ X ak xk k=0 unendlich oft differenzierbar und die Ableitung kann durch gliedweises Differenzieren der Reihe berechnet werden: ∞ X 0 P (x) = (k + 1)ak+1 xk füf alle x ∈ (−R, R). (2.3) k=0 106 Beweis: Für Pn (x) = Pn k k=0 ak x Pn0 (x) = gilt n X n−1 X kak xk−1 = k=1 (k + 1)ak+1 xk . k=0 Die Folge der Funktionen Pn : (−R, R) → R konvergiert punktweise gegen P nach Satz 2.1. dass die durch gliedweises Differenzieren erhaltene Potenzreihe Q(z) = P∞ Wir zeigen nun, k k=0 (k + 1)ak+1 z ebenfalls den Konvergenzradius R > 0 hat. Das bedeutet nach Folgerung 2.1, dass die Folge Pn0 auf jedem kleineren Teilintervall [−%, %] ⊂ (−R, R) gleichmäßig gegen die Funktion Q : [−%, %] → C konvergiert. Nach Satz 2.4 ist dann P : (R, R) → C stetig differenzierbar und hat die Ableitung Q : (R, R) → C, was zu zeigen war. Für 0 < |z| < R wähle ein r ∈ (|z|, R), zum Beispiel r = (|z| + R)/2. Es gibt dann ein M < ∞ mit |ak | rk ≤ M für alle k ∈ N0 wegen des Nullfolgentests (Satz 1.1), und es folgt |(k + 1)ak+1 z k | = |ak+1 |rk+1 k+1 r |z| r k ≤ M (k + 1) r |z| r k . Die rechte Reihe konvergiert aber absolut nach dem Quotientenkriterium, denn k + 2 |z| |z| → <1 k+1 r r mit k → ∞. Damit ist der Satz gezeigt. Jetzt stehen alle Hilfsmittel zur Verfügung, um die Potenzreihenentwicklungen der klassischen analytischen Funktionen herzuleiten. Satz 2.6 (Potenzreihenentwicklung der Exponentialfunktion) Es gilt ez = ∞ X zk k=0 für alle z ∈ C. k! (2.4) Beweis: Für λ ∈ C betrachten wir die Potenzreihe P (z) = ∞ X λk k=0 k! zk . Nach dem Quotientenkriterium, vgl. Beispiel 1.8, hat P den Konvergenzradius R = +∞. Aus Satz 2.5 folgt für alle x ∈ R P 0 (x) = ∞ X (k + 1) k=0 λk+1 k x = λ P (x). (k + 1)! Also ist P : R → C Lösung des Anfangswertproblems f 0 = λf auf R, f (0) = 1. Aus Folgerung 3.4 ergibt sich P (x) = eλx für alle x ∈ R, und mit x = 1 folgt die Behauptung, indem wir λ durch z ersetzen. 107 Durch die Potenzreihe ergibt sich ein zweiter, von Satz 2.4 in Kapitel 4 unabhängiger Zugang zur Lösung des Anfangswertproblems für die gleichförmige Kreisbewegung. Und zwar ergibt sich wie oben gezeigt, dass die Funktion c(t) = ∞ k X i k=0 k! tk die Differentialgleichung c0 = ic auf ganz R löst und den Anfangswert c(0) = 1 hat. Folgerung 2.2 (Potenzreihenentwicklung von cos und sin) Für alle x ∈ R gilt cos x = sin x = ∞ X k=0 ∞ X (−1)k x2k x2 x4 =1− + − +... (2k)! 2! 4! (2.5) (−1)k x2k+1 x3 x5 =x− + − +... (2k + 1)! 3! 5! (2.6) k=0 Beweis: Nach Satz 2.6 gilt ix e = ∞ X (ix)n n=0 = n! ∞ X k=0 ∞ X x2k x2k+1 (−1) +i (−1)k . (2k)! (2k + 1)! k k=0 Die Behauptung folgt aus der Definition 3.4 von eix , nämlich aus der Eulerschen Formel. Satz 2.7 (Potenzreihenentwicklung von log) Für x ∈ (−1, 1) ⊂ R gilt log(1 + x) = ∞ X (−1)k−1 k=1 k xk = x − x2 x3 + − +.... 2 3 (2.7) Beweis: Wir berechnen für f (x) = log(1 + x) mit x ∈ (−1, 1) ∞ X 1 f (x) = = (−1)k xk , 1+x 0 k=0 wobei im letzten Schnitt die Formel für die geometrische Reihe benutzt wurde. Die Reihe P (−1)k−1 k P (x) = ∞ x konvergiert für x ∈ (−1, 1) nach dem Quotientenkriterium. Aus Satz k=1 k 2.5 folgt nun ∞ X (−1)k 0 P (x) = (k + 1) xk = f 0 (x) (x ∈ (−1, 1). k+1 k=0 Da P (0) = 0 = f (0), folgt f (x) = P (x). 108