Analysis Grundkurs Heinz Junek Vorlesung im WS/SS 2007-8 Institut für Mathematik Universität Potsdam e-mail: [email protected] 10. Juli 2008 2 INHALTSVERZEICHNIS Inhaltsverzeichnis 1 Grundlagen der Analysis 1 1.1 Logik und Mengenlehre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Der Körper der reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.3 Summenzeichen und binomische Formeln . . . . . . . . . . . . . . . . . . . 6 1.4 Suprema und Infima, Vollständigkeitsaxiom . . . . . . . . . . . . . . . . . 7 1.5 Die Approximation reeller Zahlen durch rationale Zahlen . . . . . . . . . . 9 1.6 Existenz- und Eindeutigkeit n-ter Wurzeln . . . . . . . . . . . . . . . . . . 10 2 Elementare Funktionen 13 2.1 Funktionen und deren Eigenschaften . . . . . . . . . . . . . . . . . . . . . 13 2.2 Monotone Funktionen 2.3 Potenzfunktionen mit rationalem Exponenten . . . . . . . . . . . . . . . . 15 2.4 Die Exponentialfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 3 Beträge und komplexe Zahlen 21 3.1 Die Betragsfunktion in R . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3.2 Der Körper C der komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . 21 4 Zahlenfolgen und Reihen 25 4.1 Zahlenfolgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 4.2 Reelle Zahlenfolgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 4.3 Monotone Zahlenfolgen und Intervallschachtelungen . . . . . . . . . . . . . 32 4.4 Häufungspunkte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 4.5 Das Cauchysche Konvergenzkriterium . . . . . . . . . . . . . . . . . . . . . 41 4.6 Topologische Grundbegriffe 4.7 Der Banachsche Fixpunktsatz . . . . . . . . . . . . . . . . . . . . . . . . . 45 5 Zahlenreihen . . . . . . . . . . . . . . . . . . . . . . . . . . 43 48 5.1 Begriffsbildung und Konvergenzkriterien . . . . . . . . . . . . . . . . . . . 48 5.2 Alternierende Reihen in R . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 5.3 Absolut konvergente Reihen in R und C . . . . . . . . . . . . . . . . . . . 53 5.4 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 5.5 Exponential- und trigonometrische Funktionen . . . . . . . . . . . . . . . . 61 INHALTSVERZEICHNIS 6 Stetigkeit 3 66 6.1 Einführung und Begriff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 6.2 Stetigkeit klassischer Funktionen 6.3 Stetige Funktionen auf kompakten Intervallen . . . . . . . . . . . . . . . . 70 6.4 Grenzwerte von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 74 6.5 Ganzrationale und gebrochen rationale Funktionen . . . . . . . . . . . . . 76 6.6 Sinus, Kosinus und Logarithmus in R und C . . . . . . . . . . . . . . . . . 80 7 Differentialrechnung . . . . . . . . . . . . . . . . . . . . . . . 68 87 7.1 Differenzierbarkeit und Differentiationsregeln . . . . . . . . . . . . . . . . . 87 7.2 Differentiation elementarer Funktionen . . . . . . . . . . . . . . . . . . . . 91 7.3 Mittelwertsätze der Differentialrechnung . . . . . . . . . . . . . . . . . . . 95 7.4 Der Satz von Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 7.5 Taylorreihen und analytische Funktionen . . . . . . . . . . . . . . . . . . . 102 7.6 Kurvendiskussionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 7.7 Partielle Ableitungen und Gradient . . . . . . . . . . . . . . . . . . . . . . 111 7.8 Extremwerte für Funktionen mit mehreren Variablen . . . . . . . . . . . . 120 8 Integralrechnung 123 8.1 Das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 8.2 Eigenschaften Riemannscher Integrale . . . . . . . . . . . . . . . . . . . . . 129 8.3 Mittelwertsätze der Integralrechnung . . . . . . . . . . . . . . . . . . . . . 133 8.4 Hauptsatz der Differential– Integralrechnung . . . . . . . . . . . . . . . . . 134 8.5 Integrationsmethoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 8.6 Integration rationaler Funktionen . . . . . . . . . . . . . . . . . . . . . . . 141 8.7 Vertauschung von Limes und Integral . . . . . . . . . . . . . . . . . . . . . 144 8.8 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 8.9 Integration und Inhaltslehre . . . . . . . . . . . . . . . . . . . . . . . . . . 149 8.10 Gebietsintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 8.11 Die Transformationsformel . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 8.12 Das Volumen der n-dimensionalen Kugel . . . . . . . . . . . . . . . . . . . 162 8.13 Kurven und Bogenlängen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 8.14 Oberflächeninhalte und Flächenintegrale . . . . . . . . . . . . . . . . . . . 167 8.15 Fraktale Dimensionen - Wo ist das Gleis 9 3 /4 ? . . . . . . . . . . . . . . . . 170 4 INHALTSVERZEICHNIS 9 Ergänzungen 174 9.1 Der Approximationssatz von Weierstrass . . . . . . . . . . . . . . . . . . . 174 9.2 Metrische Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 9.3 Kompakte Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 9.4 Wege zur Einführung der Exponentialfunktion f (x) = ex . . . . . . . . . . 181 9.5 Die logische Abhängigkeit der zentralen Sätze . . . . . . . . . . . . . . . . 183 9.6 Kontrollfragen zur Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . 184 1 1 1.1 Grundlagen der Analysis Logik und Mengenlehre (1) Die mathematische Logik behandelt logische Aussagen, Wahrheitswertfunktionen und deren Zusammensetzungen. Eine Aussage ist ein sprachliches Gebilde, dem genau einer der Wahrheitswerte W oder F zukommt. Z.B. (3 teilt 6) = W oder (5 teilt 6) = F . Eine Aussageform ist ein Ausdruck mit einer freien Variablen x, aus dem bei Belegung der Variablen x mit Objekten eines Grundbereiches X eine Aussage entsteht. Eine Aussageform ist z.B. x teilt 60“ Ḋies ist weder wahr noch falsch. Belegt man x aber mit ” natürlichen Zahlen, so ergeben sich Aussagen: (Für x = 3 gilt x teilt 60) = W und (Für x = 7 gilt x teilt 60) = F . Über die Gültigkeit einer Aussage (Elementaraussage) entscheidet die jeweilige Wissenschaft. Die Logik untersucht dagegen den Wahrheitsgehalt von Zusammensetzungen von Aussagen. Die Wahrheitswertvariablen p, q, ... stehen für Aussagen. Wichtig ist in der Logik nur, dass sie die Wahrheitswerte W oder F annehmen können. (2) Für die Bildung zusammengesetzter logischer Ausdrücke sind die folgenden klassischen Wahrheitswertfunktionen besonders wichtig: Name Konjunktion Alternative (nicht ausschließendes ”oder”) Negation Implikation (Prämisse ⇒ Conclusio) Äquivalenz Sprachliche Bedeutung Bezeichnung p und q p∧q p oder q p∨q nicht p ¬p wenn p dann q p⇒q p gdw q p⇔q Diese Wahrheitswertfunktionen sind durch ihre Wertetabellen, die man in diesem Fall Wahrheitswerttabellen nennt, definiert (Tabellen verstehen und lernen!): p W W F F q W F W F p∧q W F F F p∨q W W W F p⇒q W F W W p⇔q W F F W ¬p F W - Besonders hingewiesen werden sollte auf die Definition der Wertetafel für die Implikation. Der Ansatz (F ⇒ W ) = W ist von vornherein nicht unbedingt klar. Sicher sollte man aber (F ⇒ W ) 6= F setzen, die Zweiwertigkeit der Logik erfordert dann aber (F ⇒ W ) = W . 2 1 GRUNDLAGEN DER ANALYSIS (3) Zwei Aussageverbindungen heißen logisch äquivalent, wenn ihre Wahrheitswerttabellen wertverlaufsgleich sind. Äquivalente Aussagen können logisch als völlig gleich-wertig betrachtet werden. Der Ersatz einer Aussage durch eine logisch äquivalente Aussage ist eine wesentliche Grundtechnik beim Führen von Beweisen. Besonders wichtig sind die folgenden Äquivalenzen: ¬¬p äquivalent zu p ¬(p ∨ q) äquivalent zu ¬p ∧ ¬q ¬(p ∧ q) äquivalent zu ¬p ∨ ¬q (Doppelte Negation) (Negation der Alternative) (Begründung?) (Negation der Konjunktion) Für den Nachweis der Gültigkeit von Implikationen werden folgende Äquivalenzen sehr oft benutzt: p ⇒ q äquivalent zu ¬p ∨ q ¬(p ⇒ q) äquivalent zu p ∧ ¬q und äquivalent zu ¬q ⇒ ¬p (Kontraposition) (Indirekter Beweis) (Beweis ebenfalls durch Vergleich der Wahrheitswerttabellen). (4) Die Mengenlehre wurde als sprachliches Instrument der Mathematik um 1880 von Georg Cantor bei der Untersuchung komplizierter analytischer Sachverhalte (Konvergenzpunkte von Fourier–Reihen) in naiver Form geschaffen. Nach Georg Cantor entsteht eine Menge durch Anwendung des sogenannten Mengenbildungsaxioms: Ist H(x) eine beliebige Aussageform über einem Grundbereich X, so kann die Menge M aller Elemente x aus X, für die H(x) wahr wird, gebildet werden. In Zeichen schreibt man: M = {x : H(x) = W} oder einfach M = {x : H(x)}. Gehört ein Element x aus X zu M , so schreibt man x ∈ M . Bertrand Russell zeigte mit seiner berühmten Antinomie, dass die naive Mengenlehre bei zu großzügiger Interpretation der Mengenbildung zu Widersprüchen führt. Nach Cantor müsste es nämlich möglich sein, die Menge M = {A : A ist eine Menge und A 6∈ A} zu bilden. Da aber sowohl die Annahme M 6∈ M als auch die Annahme M ∈ M zum Widerspruch führt, kann M nicht existieren. Im Grunde ist diese Antinomie bereits aus der Antike bekannt: Ein Kreter behauptet, dass alle Kreter lügen. Dieser Antinomie kann dadurch ausgewichen werden, dass man der Enthaltenseins– Relation ∈ die Restriktion auferlegt, dass eine Menge sich nicht selbst als Element enthalten kann. Damit wird die Existenz einer Menge aller Mengen ausgeschlossen, und die Russellsche Menge kann nicht mehr gebildet werden. Die exakte Ausführung dieses Ansatzes wurde in der Form eines Stufenaufbaus von Russell und in der Form eines Klassenkalküls von v.Neumann/Bernays/Gödel in den vierziger Jahren des 20. Jh. durchgeführt. Heutzutage benutzt man alternativ das Axiomensystem von 1.1 Logik und Mengenlehre 3 Zermelo/Fraenkel (ZF). Auf Details der axiomatischen Mengenlehre soll hier aber nicht eingegangen werden. (5) Mengenoperationen: Die Wahrheitswertfunktionen erlauben ein Operieren mit Mengen. Die wichtigsten Mengenoperationen sind die folgenden: Es seien A und B irgendwelche Teilmengen eines Grundbereiches X. Man bildet: A∪B = {x : x ∈ A∨x ∈ B} A∩B = {x : x ∈ A∧x ∈ B} A \ B = {x : x ∈ A ∧ x 6∈ B} A = {x ∈ X : x 6∈ A} Vereinigung von A und B Durchschnitt von A und B Differenz von A und B Komplementärmenge von A. Vereinigung und Durchschnitt können auch für Systeme (Aj )j∈J von Mengen statt nur für zwei Mengen definiert werden. (6) Unter den vielen Rechenregeln für Mengen sind die folgenden besonders wichtig: A∩B =A∪B A∪B =A∩B o de Morgansche Formeln A=A (Beweis der Formeln?) (7) Weitere Mengen werden auf folgende Weise konstruiert. Es seien X, Y beliebige Mengen. Potenzmenge: Kreuzmenge: P(X) = {M : M ⊆ X} = Menge aller Teilmengen von X X × Y = {(x, y) : x ∈ X ∧ y ∈ Y } Die Kreuzmenge wird z.B. zur Definition des n–dimensionalen reellen Raumes benötigt: Rn := R × . . . × R = {(x1 , . . . , xn ) : xi ∈ R}. Schließlich führen wir die Menge aller Funktionen von X nach Y ein: Y X = {f : f ist Funktion von X in Y }. (8) Endliche Mengen sind solche Mengen, deren Elemente sich mit einem Abschnitt [1, . . . , n] von natürlichen Zahlen durchnummerieren lassen. Endliche Mengen lassen sich daher durch Aufzählung ihrer Elemente, z.B. in der Form M = {x1 , . . . , xn } angeben. Die eindeutig bestimmte Zahl n heißt dabei die Anzahl der Elemente von M oder auch die Kardinalzahl von M , bezeichnet durch card(M ). Sind X und Y endliche Mengen, so gelten (Beweis?): card(P(X)) = 2card(X) , card(Y X ) = card(Y )card(X) . Die letzte Gleichung zeigt insbesondere, dass die Bezeichnung Y X für die Menge aller Funktionen von X in Y sehr geschickt gewählt ist. Man mache sich klar, dass auch die Bezeichnung Rn oder genauer R{1,...,n} als Spezialfall dieser Symbolik aufgefasst werden kann. 4 1 GRUNDLAGEN DER ANALYSIS 1.2 Der Körper der reellen Zahlen (1) Zur Bezeichnung der uns bekannten Zahlbereiche benutzen wir folgende Symbolik: Natürliche Zahlen: N = {0, 1, 2, . . .}; N∗ = N \ {0} Ganze Zahlen: Z = {0, ±1, ±2, . . .} Rationale Zahlen: Q Reelle Zahlen: R Komplexe Zahlen: C Die Axiome des geordneten Körpers der reellen Zahlen:1 Axiom 1: Addition und Multiplikation in R sind wohldefiniert und es gelten: (a + b) + c = a + (b + c) und (a · b) · c = a · (b · c). (Assoziativgesetze) Axiom 2: Stets gelten a + b = b + a und a · b = b · a. (Kommutativgesetze) Axiom 3: Die Addition ist umkehrbar, die Multiplikation ist bedingt umkehrbar, d.h.: Jede Gleichung der Form a + x = b besitzt genau eine Lösung x, die mit x = b − a bezeichnet wird, und jede Gleichung a · y = b besitzt im Fall a 6= 0 genau eine Lösung y = b : a = b/a. (Umkehrbarkeit der Operationen) Axiom 4: Stets gilt (a + b) · c = a · c + b · c. (Distributivgesetz) Axiom 5: Für alle x ∈ R gilt x ≤ x. (Reflexivität) Axiom 6: Aus x ≤ y und y ≤ x folgt stets x = y. (Antisymmetrie) Axiom 7: Aus x ≤ y und y ≤ z folgt stets x ≤ z. (Transitivität) Axiom 8: Für alle Paare x, y ∈ R gilt einer der Fälle x ≤ y oder x ≥ y. (Linearität) Axiom 9: Aus a < b folgt a + c < b + c für alle c ∈ R. (Monotoniegesetz der Addition) Axiom 10: Aus a < b und c > 0 folgt a · c < b · c. (Monotoniegesetz der Multiplikation) Axiom 11 Jede nach oben beschränkte, nichtleere Menge A ⊆ R hat in R ein Supremum. . (Vollständigkeitsaxiom, Details s. später.) 1 Zahlen haben sich als ein sehr geeignetes Instrument zur quantitativen Analysis von Sachverhalten in Theorie und Praxis erwiesen. Die Mindestanforderung an eine quantitative Methode besteht nämlich darin, dass man die Daten vergleichen und mittels der vier Grundrechenoperationen verarbeiten kann. Die kleinste mathematische Struktur mit diesen Eigenschaften ist der Körper Q der rationalen Zahlen. Für höhere Rechenoperationen, etwa das Wurzelziehen, ist dieser Zahlenbereich jedoch noch zu klein, z.B. hat die Gleichung x2 = 2 keine rationalen Lösungen.Die Basis für die Analysis ist daher der größere Körper R der reellen Zahlen. Die Existenz und die Eigenschaften dieser Struktur postulieren wir in den folgenden Axiomen. Den diffizilen Nachweis, dass es eine solche Struktur überhaupt gibt, holen wir später nach. 1.2 Der Körper der reellen Zahlen 5 Aus diesen wenigen Axiomen lassen sich nun weitere wichtige Formeln ableiten. Von besonderer Bedeutung für den Aufbau der Analysis sind dabei die nachfolgenden Sachverhalte. Wir beginnen mit einer Ergänzung zu Axiom 10: Satz 1.1 Aus a < b und c < 0 folgt a · c > b · c. Beweis: Aus c < 0 folgt durch Addition von −c aus Axiom 9 die Ungleichung 0 < −c. Die Multiplikation der Ungleichung a < b mit der positiven (!) Zahl −c ergibt nach Axiom 10 die Aussage −a · c < −b · c, und durch Umstellen mit Axiom 9 folgt die Behauptung b · c < a · c. Heimlich haben wir bei diesem Beweis noch von der Gleichung a · (−c) = −(a · c) Gebrauch gemacht. Die Gültigkeit dieser Formel folgt mit Axiom 4 aber aus der Gleichung a · c + a · (−c) = a · (c − c) = a · 0 = 0, denn dann muss das Produkt a · (−c) nach Axiom 3 das eindeutig bestimmte Entgegengesetzte zu a · c sein. Satz 1.2 Für alle x ∈ R gilt x2 ≥ 0. Beweis: Ungleichungen beweist man häufig durch Fallunterscheidungen, die auf Axiom 8 beruhen: Aus x = 0 folgt x2 = 0. Ist x > 0, so folgt x · x > x · 0 nach Multiplikation mit x wegen Axiom 10. Ist x < 0, so folgt auch x · x > x · 0 = 0, diesmal wegen Satz 1.1 Satz 1.3 (Bernoullische2 Ungleichung) Für alle h ≥ −1 und alle natürlichen Zahlen n ≥ 0 gilt 1 + nh ≤ (1 + h)n . Beweis: Aussagen mit natürlichzahligen Parametern werden häufig mittels vollständiger Induktion bewiesen. Für den Induktionsanfang n = 0 ist die Ungleichung trivial gültig. Sie gelte nun für festes n ∈ N. Durch Multiplikation von (1 + h)n ≥ 1 + nh mit der nichtnegativen (!) Zahl 1 + h ergibt sich die Abschätzung (1+h)n+1 = (1+h)(1+h)n ≥ (1+h)(1+nh) = 1+h+nh+nh2 ≥ 1+h+nh = 1+(n+1)h. Damit ist die Bernoullische Ungleichung für alle n ∈ N bewiesen. An dieser Stelle eine Bemerkung zur Bedeutung von Ungleichungen. Durch die Vorsilbe ”un” ist dieses Wort im Deutschen negativ belegt und betont die Ungleichheit. Daraus resultiert beim Anfänger häufig eine Unterschätzung des Wertes von Ungleichungen. Man muss sich aber klar machen, dass eine Ungleichung bereits eine ”halbe” Gleichung ist und dass in den Fällen, in denen ein äquivalentes Umformen von Ausdrücken zu schwierig oder gar nicht mehr möglich ist, mit einer Abschätzung wenigstens noch eine Teilaussage erhalten werden kann. Die Bernoullische Ungleichung lässt auch eine geometrische Interpretation zu: Der Graph der linearen Funktion g(h) = 1 + nh liegt unterhalb des Graphen von f (h) = (1 + h)n und wegen g(0) = f (0) = 1 ist g(h) = 1 + nh die Gleichung der Tangente im Punkt (0, 1). 2 Jakob Bernoulli (1654-1705). Zum Bernoullischen Stammbaum gehören ferner die Mathematiker: Johann B. (1667-1748, jüngster Bruder Jakobs); Niklaus B. (1687-1759), Neffe und Schüler von Jakob und Johann); Daniel B. (1700-1782, Sohn von Johann). 6 1 GRUNDLAGEN DER ANALYSIS 1.3 Summenzeichen und binomische Formeln Definition 1.4 (Das Summenzeichen) Zahlen definieren wir: n am + . . . + an X am ai = i=m 0 Für jedes System a0 , a1 , . . . , an von reellen für für für m < n, m = n, m > n. (leere Summe) Satz 1.5 (Rechenregeln) (Beweis?) (a) n P ai + i=0 (b) n P n P i=0 ai = i=0 (c) bi = n P i=m m P (ai + bi ), (Additivität) i=0 n P ai + i=0 ai = n P ai für 0 ≤ m ≤ n, (Zerlegungsformel) i=m+1 n+k P ai−k für alle k ∈ N. (Indexverschiebung) i=m+k Aufgabe: Beweisen Sie die arithmetische Summenformel: n P i=1 i= n(n+1) ! 2 Wir wollen nun die bekannten binomischen Formeln (x ± y)2 = x2 ± 2xy + y 2 und x2 − y 2 = (x − y)(y + x) auf höhere Potenzen als 2 verallgemeinern. Wir beginnen mit der letzten dieser Formeln: Satz 1.6 (Drei Varianten der geometrischen Summenformel) Für alle x, y ∈ R und alle n ∈ N gelten: x n+1 −y n+1 = (x − y) · 1 − y n+1 = (1 − y) n X xn−k y k k=0 n X y k = (1 − y)(1 + y + . . . + y n ) (1) (2) k=0 n X k=0 yk = 1 − y n+1 1−y (3) Der Beweis kann durch Polynomdivision oder durch vollständige Induktion geführt werden. (Ausführen!) Die zweite Formel ist ein Spezialfall der ersten (x = 1). Die Verallgemeinerung der ”ersten” binomischen Formel erfordert eine Vorbereitung: 1.4 Suprema und Infima, Vollständigkeitsaxiom 7 Definition 1.7 (Der Binomialkoeffizient) Für n, p ∈ N setzen wir n n(n − 1) · . . . · (n − p + 1) (gelesen: n über p) = p 1 · 2 · ... · p Für p > n ist np = 0, für n ≥ p gibt np die Anzahl der Auswahlmöglichkeiten von p Objekten aus einem Vorrat von n Objekten an. Durch Nachrechnen (ausführen!) beweist man für n ≥ p die Formel: n n n+1 + = (Additionstheorem für Binomialkoeffizienten) p p+1 p+1 Auf dieser Formel beruht das Pascalsche Dreieck zur Berechnung der Zahlen np . Satz 1.8 (Binomischer Lehrsatz) n X n n−j j n (x + y) = x y für alle x, y ∈ R und n ∈ N. j j=0 Beweis: Induktiv unter Verwendung des Additionstheorems oder alternativ durch kombinatorische Überlegungen, wie oft der Term xn−j y j beim Ausmultiplizieren entsteht. 1.4 Suprema und Infima, Vollständigkeitsaxiom Die Axiome 1 - 10 sind auch im Zahlbereich Q erfüllt, aber die besondere Qualität von R gegenüber Q besteht in dem nun zu erörternden Axiom 11, dem Vollständigkeitsaxiom. Wir schaffen uns zunächst das notwendige Instrumentarium: Definition 1.9 Es sei A eine beliebige Teilmenge von R. 1. A heißt nach oben beschränkt, wenn es eine Zahl x ∈ R mit a ≤ x für alle a ∈ A gibt. Jedes x mit dieser Eigenschaft heißt eine obere Schranke von A. 2. Falls A eine kleinste obere Schranke hat, so heißt diese das Supremum von A. Es gilt also x = sup A ⇔ a) x ist eine obere Schranke von A und b) ist x0 eine weitere obere Schranke von A, so gilt x ≤ x0 . Die Bedingung b) ist äquivalent zu: ∗ b ) keine Zahl z < x ist eine obere Schranke von A, d.h.: Zu jedem z < x existiert ein a ∈ A mit z < a ≤ x. Untere Schranken und Infima (größte untere Schranken) werden analog definiert. Axiom 11 (Vollständigkeitsaxiom in R): Jede nach oben beschränkte, nichtleere Menge A ⊆ R hat in R ein Supremum. Diese Axiom bildet die Grundlage für die gesamte Analysis, wir werden es sehr bald in Aktion erleben! Vorerst leiten wir einige Konsequenzen ab. 8 1 GRUNDLAGEN DER ANALYSIS Satz 1.10 Sind ∅ = 6 A, B ⊆ R nach oben beschränkte Mengen, so gilt sup A + sup B = sup(A + B). Ist zusätzlich ∅ = 6 A, B ⊆ R+ , so ist sup A · sup B = sup(A · B) Hierbei bedeuten A + B = {a + b : a ∈ A, b ∈ B} und A · B = {a · b : a ∈ A, b ∈ B}. Beweis: Wir begnügen uns mit dem Beweis der additiven Formel: Es seien x = sup A und y = sup B. Dann gilt a+b ≤ x+y für alle a ∈ A und alle b ∈ B nach dem Monotoniegesetz. Insbesondere existiert s = sup(A + B), und es gilt s ≤ x + y. Wäre aber s < x + y, so wäre g = x + y − s > 0. Wegen x = sup A und y = sup B existieren nach Definition des Supremums Zahlen a ∈ A und b ∈ B mit x − g2 < a und y − g2 < b, und hieraus würde s = x + y − g < a + b ≤ s folgen. Widerspruch. Satz 1.11 (Archimedisches3 Axiom oder Axiom des Messens): Sind a, b beliebige reelle Zahlen mit a > 0, so existiert eine natürliche Zahl n ∈ N mit b < na. Beweis: Wäre na ≤ b für alle n ∈ N, so wäre die Menge A = {na : n ∈ N} nach oben durch b beschränkt. Wegen Axiom 11 existiert s = sup A, und nach (2) führt das auf den Widerspruch s < s + a = sup{0, a, 2a, . . .} + sup{a} = sup{a, 2a, 3a, · · · } ≤ s. Aufgaben zu Suprema, Infima, Maxima und Minima Die Begriffe Supremum und Infimum bereiten Anfängern immer Schwierigkeiten. Das liegt in der Natur der Sache, denn hiermit wird man erstmals in voller Schärfe mit dem Unendlichen konfrontiert! Bei der Übertragung der Erfahrungen im Umgang mit endlichen Mengen auf unendliche Mengen muss höchste Vorsicht geboten sein. So gibt es in jeder endlichen Menge A von Zahlen natürlich eine kleinste Zahl, die das Minimum von A genannt wird. Unendliche Mengen müssen aber kein Minimum haben, beispielsweise gibt es keine kleinste positive reelle Zahl! Supremum und Infimum dienen in gewisser Weise als Ersatz für Maxima und Minima. (1) Aufgabe: Man berechne: a) sup n n+1 ∗ : n ∈ N , b) sup n+1 : n ∈ N ! n (2) Aufgabe: Es sei A eine nichtleere Teilmenge von R. Man sagt, dass A ein (absolutes oder globales) Maximum hat, wenn es ein Element x ∈ A mit a ≤ x für alle a ∈ A gibt. Analog wird das Minimum definiert. Beantworten Sie: a) Ist das Maximum einer Menge auch ihr Supremum? b) Hat die Menge A = {x : x ∈ R und x < 0} ein Maximum/Supremum? c) Hat die Menge A = {arctan x : x ∈ R} ein Maximum/Supremum? 3 Archimedes (287?-212 v.Chr.), Syrakus, ”Integralrechnung”, Hebelgesetz, Archimedisches Prinzip. 1.5 Die Approximation reeller Zahlen durch rationale Zahlen 9 d) Welchen Wert hat inf{x2 − 4x + 6 : x ∈ R}? (3) Aufgabe: a) Geben Sie die ausführliche Definition des Infimums an! b) Es sei ∅ = 6 A ⊆ R, und es sei B = {−a : a ∈ A} die Menge der entgegengesetzen Elemente. Zeigen Sie inf A = − sup B, falls wenigstens eine der beiden Größen existiert! c) Beweisen Sie die zu Axiom 11 ergänzende Aussage: Jede nach unten beschränkte, nichtleere Teilmenge A ⊆ R hat in R ein Infimum. (4) Aufgabe: Beweisen Sie das Komplement zu Satz 1.10: Sind ∅ 6= A, B ⊆ R nach unten beschränkt, so gilt inf A + inf B = inf(A + B). (5) Aufgabe: Beweisen Sie die multiplikative Formel in Satz 1.10: Sind die Mengen ∅= 6 A, B ⊆ R+ nach oben beschränkt, so gilt sup A · sup B = sup(A · B). (6) Aufgabe: Das Archimedische Axiom ermöglicht das Messen großer Entfernungen. Zeigen Sie, dass damit auch das Teilen im Mikrobereich möglich wird: Zu jeder (kleinen) positiven Zahl a gibt es eine natürliche Zahl n mit 0 < n1 < a! Beweisen Sie dies! (7) Bemerkung: a) Wegen Aufgabe (6) gibt gibt es Grenzen in der Anwendbarkeit der rellen Zahlen zur Beschreibung des Mikrokosmos, denn die Heisenbergsche Unschärferelation verbietet in gewissem Sinn ein Messen beliebig kleiner Abstände. Verzichtet man jedoch auf das Archimedische Axiom, so ist wegen des Beweises zu Satz 1.11 auch das Vollständigkeitsaxiom nicht mehr zu haben! Das Ergebnis wäre eine sehr viel schwierigere nichtarchimedische Analysis, die neuerdings als p-adische Analysis auch entwickelt wurde. b) In Anbetracht der soeben genannten Bedenken und den noch zu erörternden, weitreichenden Konsequenzen aus dem Vollständigkeitsaxiom erhebt sich die grundlegende Frage nach der Existenz des Zahlbereiches R überhaupt! Hier ist keine Zeit für dieses knifflige Problem, lesen Sie in der Literatur nach (z.B. Junek, Analysis, Abschnitte 1.3, 3.4 und 3.7). 1.5 Die Approximation reeller Zahlen durch rationale Zahlen Wir zeigen in diesem Abschnitt, dass reelle Zahlen näherungsweise durch rationale Zahlen beschrieben werden können. Satz 1.12 Zu jeder rellen Zahl b existiert genau eine ganze Zahl m mit m ≤ b < m + 1. Diese heißt der ganze Teil von b, in Zeichen m = Int(b). (integer = ganze Zahl) Beweis: Es genügt, den Beweis für b > 0 zu führen. Mit a = 1 folgt aus dem Archimedischen Axiom, dass eine natürliche Zahl m mit b < (m + 1) · 1 = m + 1 existiert. Es sei m die kleinste natürliche Zahl mit dieser Eigenschaft. Dann ist also m ≤ b < m + 1. Satz 1.13 (Dichtheitsaxiom): Zu jedem Paar x, y reeller Zahlen mit x < y existiert eine rationale Zahl r mit x < r < y. 10 1 GRUNDLAGEN DER ANALYSIS Beweis: Wegen y − x > 0 existiert nach dem Archimedischen Axiom ein n ∈ N mit 1 < n · (y − x). Weiter gibt es zu nx nach (1) ein m ∈ Z mit m ≤ nx < m + 1. Also ist < y. nx < m + 1 ≤ nx + 1 < nx + n(y − x) = ny und folglich x < m+1 n Satz 1.14 (Approximation reeller Zahlen durch rationale Zahlen): Für jede reelle Zahl x gilt x = sup{r ∈ Q : r < x}. Beweis: Es sei A = {r ∈ Q : r < x}. Wegen (1) ist A 6= ∅. Daher existiert s = sup A und sicher ist s ≤ x. Wäre aber s < x, so gäbe es nach dem Dichtheitsaxiom eine rationale Zahl r mit s < r < x im Widerspruch zur Definition von s. 1.15 (Die Dezimalbruchdarstellung reeller Zahlen) Es sei x ∈ R mit x ≥ 0 beliebig gegeben. Die Zahlen xk = 10−k · Int (10k · x) für k ∈ N sind rational, haben eine kstellige Dezimalbruchdarstellung xk = a0 , a1 a2 . . . ak und erfüllen die Ungleichung xk ≤ x. √ (Für x = 2 ist z.B. x0 = 1; x1 = 1, 4; x2 = 1, 41; . . .) Sie heißen daher untere dezimale Näherungen von x. Wir zeigen x = sup{xk : k ∈ N}. Falls x0 = sup{xk : k ∈ N} < x wäre, so existierte nach Archimedes eine Zahl n ∈ N mit 1 < n(x − x0 ) < 10n (x − x0 ) = 10n x − 10n x0 . Dann wäre aber 10n xn = Int (10n x) ≥ Int (10n x0 + 1) > 10n x0 im Widerspruch zu xn ≤ x0 . In diesem Sinn kann jedem x ≥ 0 eine Dezimalbruchentwicklung: x = a0 , a1 a2 a3 . . . zugeordnet werden. Das Rechnen mit den dezimalen Näherungen beruht auf Satz 1.10: Sind {xk : k ∈ N} und {yk : k ∈ N} die unteren dezimalen Näherungen zu x, y ≥ 0, so gelten: x + y = sup{xk : k ∈ N} + sup{yk : k ∈ N} = sup{xk + yk : k ∈ N}, x · y = sup{xk : k ∈ N} · sup{yk : k ∈ N} = sup{xk · yk : k ∈ N}. 1.6 Existenz- und Eindeutigkeit n-ter Wurzeln Die Nichtlösbarkeit der Gleichung x2 = 2 im Zahlbereich Q war ein Hauptmotiv für die Erweiterung von Q zu R . Wir zeigen nun, dass in R diese und ähnliche Aufgaben lösbar sind. Satz 1.16 Zu jeder natürlichen Zahl n ≥ 1 und jeder reellen Zahl a ≥ 0 existiert genau √ eine Zahl w ≥ 0 mit wn = a. Diese Zahl heißt die n-te Wurzel aus a, in Zeichen w = n a. Beweis: Eindeutigkeit: Aus 0 ≤ w1 < w2 folgt w1n < w2n , aus w1 6= w2 also w1n 6= w2n . Existenz: Es sei a > 0. Zunächst gilt xn = a genau dann, wenn x eine Nullstelle der Funktion f (x) = xn − a ist. Zur Ermittlung der Nullstellen von f wenden wir das Newtonsche4 Tangentenverfahren an (s. Fig. 38). Die Idee besteht in folgendem: Wir wählen einen beliebigen Startwert x0 > 0 mit xn0 ≥ a. (Eine solche Zahl existiert wegen des 4 Isaac Newton (1643-1727), Professor in Cambridge, England 1.6 Existenz- und Eindeutigkeit n-ter Wurzeln 11 Abbildung 1: Newtonsches Tangentenverfahren Archimedischen Axioms). Dann legen wir die ”Tangente” g im Punkt (x0 , f (x0 )) an die Kurve y = f (x). Die Nullstelle der linearen Funktion g ist dann eine Verbesserung von x0 , und wir erwarten, dass bei fortgesetzter Wiederholung des Verfahrens näherungsweise eine Nullstelle von f berechnet werden kann. Zur analytischen Durchführung dieser Idee auf der Basis der bisherigen Axiome benötigen wir die Gleichung der ”Tangente”. Aus der Bernoullischen Ungleichung 1 + nh ≤ (1 + h)n folgt mit h = xx0 − 1 für alle x ≥ 0 die Ungleichung xn x ≤ n. 1+n x0 x0 Nach Multiplikation mit xn0 und Subtraktion von a ergibt sich daraus g(x) := (xn0 − a) + nxn−1 (x − x0 ) ≤ xn − a = f (x) für alle x ≥ 0. 0 (∗) Also stellt die soeben eingeführte lineare Funktion g wirklich eine Tangente an f im Punkt (x0 , f (x0 )) mit Nullstelle bei xn − a x1 = x0 − 0 n−1 nx0 dar. Wegen (*) ist g(0) ≤ 0 − a < 0 ≤ xn0 − a = g(x0 ). Somit gelten 0 < x1 ≤ x0 und 0 = g(x1 ) ≤ xn1 − a (nochmals (*)). Wir können daher das Verfahren mit x1 statt x0 wiederholen. Auf diese Weise erhalten wir rekursiv Zahlen xj+1 = xj − xnj − a mit 0 < xj+1 ≤ xj und 0 ≤ xnj+1 −a für alle j ∈ N. nxn−1 j (∗∗) Wegen Axiom 11 existiert das Infimum w = inf{xj : j ∈ N}. Wir zeigen wn = a: Durch Umstellen von (**) folgt xj+1 · n · xjn−1 + xnj − a = nxnj , und der Übergang zum Infimum liefert wegen Satz 1.10 wie gewünscht wn = a. Die im Beweis zu Satz 1.16 verwendete Iterationsformel (**) liefert auch eine effektive und sehr schnell konvergierende Methode zur näherungsweisen Berechnung von Wurzeln. Geometrisch ergeben sich die xn wie in Abbildung 7.1 dargestellt. Das angegebene Verfahren hat weit über die Berechnung reeller Wurzeln Bedeutung, die gleiche Technik kann beispielsweise auch angewandt werden, um sogenannte positiv definite Matrizen als Quadrate von Matrizen zu schreiben. Aufgaben 1. Berechnen Sie w = √ 2 auf 18 Dezimalstellen (Taschenrechner erlaubt). 12 1 GRUNDLAGEN DER ANALYSIS p√ √ √ √ √ 2. Beweisen Sie durch Probe n ab = n a · n b und n m a = n·m a für a, b ≥ 0. √ 3. Zeigen Sie 2 ∈ / Q. Geben Sie eine irrationale Zahl x ∈ [0, 1] an. 4. Zeigen Sie: Zu je zwei rationalen Zahlen p < q existiert eine irrationale Zahl x mit p < x < q. √ 5. Zeigen Sie inf{ n x : n ∈ N∗ } = 1 für alle x > 1. Hinweis: Beweisen Sie unter Verwendung der Bernoullischen Ungleichung zunächst die Ungleichung: √ n x≤1+ x−1 . n 13 2 2.1 Elementare Funktionen Funktionen und deren Eigenschaften Funktionen werden in der modernen Mathematik losgelöst von der Frage ihrer Berechnungsmöglichkeit zunächst als reine Objekte der Mengenlehre definiert. Definition 2.1 Es seien X und Y nichtleere Mengen. Unter einer Funktion verstehen wir ein Tripel (X, g, Y ), wobei g eine Teilmenge von X × Y mit der folgenden Eigenschaft ist : Sind (x, y1 ), (x, y2 ) ∈ g, so ist y1 = y2 . (Nacheindeutigkeit) Die Menge X heißt Vorbereich der Funktion, die Menge Y heißt Nachbereich von g. Statt (X, g, Y ) werden meistens die ausdrucksvollere Symbolik g : X → Y benutzen oder auch einfach g schreiben. Die Mengen D(g) = {x ∈ X : Es existiert ein y ∈ Y mit (x, y) ∈ g}, W (g) = {y ∈ Y : Es existiert ein x ∈ Xmit (x, y) ∈ g} heißen Definitions- bzw. Wertebereich von g. Nach obigem gehört zu jedem x ∈ D(g) genau ein Wert y ∈ Y mit (x, y) ∈ g. Dieser Wert heißt der Funktionswert von x und wird durch y = g(x) bezeichnet. Zwei Funktionen f : X → Y und g : X → Y sind gleich, wenn sie wertverlaufsgleich sind, d.h., wenn D(f ) = D(g) und wenn g(x) = f (x) für alle x ∈ D(f ) gilt. Definition 2.2 Eine Funktion g = (X, g, Y ) heißt eine Funktion von X in Y , wenn D(g) = X gilt. Die Funktion g heißt Funktion von X auf Y oder eine Surjektion, wenn D(g) = X und W (g) = Y gelten. Die Funktion g heißt eine voreindeutige Funktion oder eine Injektion, wenn für alle x1 , x2 ∈ D(f ) aus g(x1 ) = g(x2 ) stets x1 = x2 folgt. Während in der diskreten Mathematik Funktionen oft durch Wertetafeln gegeben sind (es sei an die Wahrheitswertfunktionen erinnert), werden Funktionen in der Analysis häufig durch eine Funktionsgleichung oder eine Berechnungsvorschrift gegeben. So heißen z.B. die durch die Gleichung fn (x) = xn , x ∈ R auf R definierten Funktionen Potenzfunktionen. Definition 2.3 Sind f : X → Y und g : Y → Z zwei Funktionen, so läßt sich durch Aneinanderfügen eine neue Funktion g ◦ f : X → Z durch g ◦ f = {(x, z) ∈ X × Z : Es existiert ein y ∈ Y mit y = f (x) und z = g(y)} definieren. Diese Funktion heißt die Superposition oder Nacheinanderausführung von f und g. Dabei gilt offenbar (g ◦ f )(x) = g(f (x)) für alle x ∈ D(g ◦ f ) und D(g ◦ f ) = {x ∈ D(f ) : f (x) ∈ D(g)}. 14 2 ELEMENTARE FUNKTIONEN Natürlich ist streng auf die Reihenfolge der Anwendung der Funktionen zu achten. Unwesentlich ist bei der Superposition von mehr als zwei Funktionen jedoch die Art der Beklammerung, denn es gilt für f : X → Y , g : Y → Z und h : Z → W stets h ◦ (g ◦ f ) = (h ◦ g) ◦ f , also eine Art Assoziativgesetz. Auf jeder Menge X 6= ∅ existiert die identische Funktion bezeichnet durch idX : X → X, die durch idX (x) = x definiert wird. Definition 2.4 Eine Funktion g : Y → X heißt Umkehrfunktion zur Funktion f : X → Y , wenn g ◦ f = idX und f ◦ g = idY gelten. Die Umkehrfunktion zu f ist im Fall der Existenz durch f eindeutig bestimmt, denn wären g1 und g2 zwei solche Funktionen, so ergäbe sich D(g1 ) = Y = D(g2 ) wegen f ◦ g = idY . Da aber ferner g1 (y) = ((g2 ◦ f ) ◦ g1 )(y) = (g2 ◦ (f ◦ g1 ))(y) = g2 (y) für alle y ∈ Y gilt, folgt g1 = g2 . Die Umkehrfunktion zu f wird im Fall der Existenz durch f −1 bezeichnet. Satz 2.5 Eine Funktion f : X → Y besitzt genau dann eine Umkehrfunktion, wenn D(f ) = X und W (f ) = Y sind und wenn f eineindeutig ist. Beweis. Hat f eine Umkehrfunktion g, so gilt D(f ) = X wegen g ◦ f = idX und W (f ) = Y wegen f ◦ g = idY . Wendet man die Funktion g auf eine Gleichung der Form f (x1 ) = f (x2 ) an, so folgt x1 = x2 . Das zeigt die Eineindeutigkeit von f . Sind umgekehrt die Bedingungen im Satz erfüllt, so definiere man g := {(y, x) : (x, y) ∈ f }. Dann ist g offenbar eine Umkehrfunktion zu f . Aufgaben Prüfen Sie, ob die Mengen A = {(x, y) ∈ R2 : y 2 − x2 = 0} und B = {(x, y) ∈ R2 : y − x2 = 0} Graphen von Funktionen von R in R sind. 2.2 Monotone Funktionen Wir betrachten in diesem Abschnitt ausschließlich reelle Funktionen einer reellen Veränderlichen, d.h. Funktionen aus R in R. Definition 2.6 Eine Funktion f aus R in R heißt (streng) monoton wachsend auf einer Teilmenge M ihres Definitionsbereiches für alle x1 , x2 ∈ M aus x1 < x 2 stets f (x1 ) ≤ f (x2 ) bzw. f (x1 ) < f (x2 )) folgt. Entsprechend werden monoton fallende Funktionen definiert. 2.3 Potenzfunktionen mit rationalem Exponenten 15 Als Beispiele betrachten wir die Potenzfunktionen fn (x) = xn für n ∈ N∗ . Auf der positiven Halbachse R+ = {x : x ≥ 0} sind diese Funktionen streng monoton wachsend, denn aus 0 ≤ x1 < x2 folgt x21 < x1 x2 < x22 , und durch einen induktiven Beweis in analoger Weise xn1 < xn2 . Entsprechend zeigt man, daß fn (x) = xn auf dem Intervall (−∞, 0] für geradzahliges n streng monoton fallend und für ungeradzahliges n streng monoton wachsend sind. Satz 2.7 (1. Hauptsatz über monotone Funktionen) Ist f : I → f (I) auf dem Intervall I streng monoton wachsend, so hat f eine Umkehrfunktion f −1 : f (I) → I, die selbst streng monoton wachsend ist. Beweis. Eine streng monoton wachsende Funktion f ist offenbar voreindeutig. Daher existiert die Umkehrfunktion f −1 . Seien nun z1 , z2 ∈ W (f ) mit z1 < z2 gegeben und seien x1 = f −1 (z1 ), x2 = f −1 (z2 ). Dann gilt x1 < x2 , da die Ungleichung x1 ≥ x2 wegen der Monotonie von f nicht z1 < z2 verträglich ist. Also ist f −1 streng monoton wachsend. Folgerung 2.8 Die Funktionen fn (x) = xn (n 6= 0) haben auf [0, ∞) streng monoton √ wachsende Umkehrfunktionen, dies sind die Wurzelfunktionen gn (y) = n y. 2.3 Potenzfunktionen mit rationalem Exponenten Zur Vorbereitung der Definition von Potenzfunktionen mit rationalem Exponenten beweisen wir: Satz 2.9 Es seien n, p ∈ N∗ und m, p ∈ Z mit √ n xm = m n = pq . Dann gilt p √ q x für alle x ≥ 0. √ √ Beweis. Es seien a = n xm , b = ( q x)p und t = mq = np. Dann folgt unter Verwendung der Potenzgesetze für natürlichzahlige Exponenten √ at = anp = xmp = ( q x)qmp = bqm = bt . Also ist a = b. Definition 2.10 Für jede rationale Zahl r ∈ Q wird durch die Gleichung fr (x) := xr = √ n √ m xm = ( n x)m , r = , n > 0 n im Fall r > 0 eine streng monoton wachsende Funktion und im Fall r < 0 eine streng monoton fallende Funktion auf dem Intervall (0, ∞), die Potenzfunktion mit rationalem Exponenten, definiert. 16 2 ELEMENTARE FUNKTIONEN 2.4 Die Exponentialfunktionen In diesem Absschnitt wird die Exponentialfunktion f (x) = ax auf ordnungstheoretischer Grundlage eingeführt. Im 1. Charakterisierungssatz wird gezeigt, dass die Exponentialfunktion auch abstrakt durch ihre Eigenschaften, insbesondere durch ihr Additionstheorem eindeutig bestimmt ist. Das erklärt auch, warum jede Beschreibung eines Wachstumsund Sterbeprozesses auf Exponentialfunktionen als Modelle führen muss. Im Verlauf des Kurses werden wir weitere Beschreibungsmöglichkeiten der Exponentialfunktionen kennen lernen. Das unterstreicht einmal mehr die fundamentale Bedeutung dieser Funktion und gibt Anlass, Exponentialfunktionen auch in anderen Strukturen als Zahlbereichen (z.B. in Matrizenräumen) einzuführen. Das hat besondere Bedeutung in der Theorie dynamischer Systeme und in der Quantenmechanik. Satz 2.11 Es sei a > 1. Die durch f (r) = ar = hat die folgenden Eigenschaften: a) b) c) d) √ n am für r = m n auf Q definierte Funktion D(f ) = Q , f ist streng monoton wachsend auf Q, f (r + s) = ar+s = ar as = f (r)f (s) für alle r, s ∈ Q, f (r) > 0 für alle r ∈ Q . Beweis. a) folgt aus Definition 2.10. Für den Nachweis von b) seien r und s rationale Zahlen mit r < s. Da beide Brüche gleichnamig gemacht werden können, kann r = nk < nj = s √ √ n n angenommen werden. Dann ist k < j, und hieraus folgen ak < aj und ak < aj . Zu c): Aus r = k n und s = j n ar+s = a k+j n folgt = √ n ak+j = √ n ak · √ n k j aj = a n · a n = ar as . r Schließlich ergibt sich d) aus ar = (a 2 )2 ≥ 0 . Wegen b) ist ar = 0 dabei unmöglich. Der bisher noch mit Lücken behaftete Graph der Funktion f (x) = ax kann nun mit dem folgenden Satz ausgefüllt werden. Auf diese Weise entsteht die auf ganz R definierte Exponentialfunktion. Satz 2.12 (Die monotone Fortsetzung der Exponentialfunktion) Es sei a > 1. Dann heißt die durch die folgende Formel definierte Funktion F (x) = ax := sup{ar : r ≤ x, r ∈ Q} die a) b) c) d) Exponentialfunktion zur Basis a. Sie hat die folgenden Eigenschaften: D(F ) = R, F ist streng monoton wachsend auf R, F (x + y) = ax+y = ax ay = F (x) · F (y) für alle x, y ∈ R, W (F ) = (0, ∞). 2.4 Die Exponentialfunktionen 17 Beweis. Wegen Satz 2.11b) gilt F (r) = ar = f (r) für alle r ∈ Q. Daher ist F eine Fortsetzung von f . Wir zeigen jetzt D(F ) = R. Für x ∈ R sei Ax := {ar : r ≤ x, r ∈ Q}. Dann ist Ax 6= ∅ und nach oben beschränkt wegen Satz 2.11. Folglich existiert sup Ax wegen Axiom 11. Das zeigt D(F ) = R. Für x ∈ R setzen wir nun A0x := {ar : r < x, r ∈ Q} und zeigen zunächst, daß auch sup Ax = sup A0x gilt. Im Fall x ∈ R \ Q bleibt nichts zu beweisen. Sei also jetzt x ∈ Q. Natürlich ist sup A0x ≤ sup Ax = ax . Wäre aber c = sup A0x < ax , so gäbe es wegen inf{a1/n : n ∈ N∗ } = 1 (s. Aufgabe 3 aus Abschnitt 1.6) eine Zahl n ∈ N∗ , so dass auch noch c · a1/n < ax und somit c < ax−1/n gelten. Da aber x − 1/n ∈ A0x gilt, steht das im Widerspruch zu c = sup A0x . Zum Beweis von b) wählen wir zu x < y zwei rationale Zahlen r, s mit x < r < s < y. Dann ist Ax ≤ ar < as ≤ ay , also ax < ay . Das Additionstheorem c) ergibt sich durch folgende Rechnung: ax · ay = sup A0x · sup A0y = sup A0x · A0y = sup{ar+s : r < x, s < y; r, s ∈ Q} = sup{at : t < x + y, t ∈ Q} = ax+y . Zum Beweis von d) ist schließlich zu zeigen, dass jede Gleichung der Form ay = c mit c > 0 eine Lösung hat. Wir bilden dazu die Menge Mc = {r ∈ Q : ar ≤ c} und werden zeigen, dass y = sup Mc obige Gleichung löst. Zunächst ist Mc 6= ∅, denn wegen dem archimedischen Axiom und der Bernoullischen Ungleichung existiert ein n ∈ N∗ mit c−1 ≤ 1 + n(a − 1) ≤ an . Also ist a−n ≤ c und damit −n ∈ Mc . Die Menge Mc ist aber auch nach oben beschränkt, da sie andererseits wegen b) die Menge aller natürlichen Zahlen enthalten müßte. Die Ungleichung an ≤ c kann aber nach nicht für alle natürlichen Zahlen gelten, denn für hinreichend große n ∈ N ist c < 1 + n(a − 1) ≤ an , wiederum nach der Bernoullischen Ungleichung. Also ist Mc nicht leer und nach oben beschränkt, und daher existiert y = sup Mc . Es bleibt ay = c zu zeigen. Zu r < y existiert 0 ein r0 ∈ Mc mit r < r0 . Also gilt ar < ar ≤ c. Das zeigt A0y ≤ c, also ay ≤ c. Wäre aber ay < c , so gäbe es wiederum wegen inf{a1/n : n ∈ N∗ } = 1 eine Zahl n ∈ N∗ mit ay · a1/n < c. Zu diesem n wählen wir eine Zahl r ∈ Mc mit y − n1 < r ≤ y, also y < r + n1 . Dann folgt aber 1 1 1 ar+ n = ar · a n ≤ ay · a n < c, also r + 1 n ∈ Mc im Widerspruch zu y < r + 1 n . Das beweist ay = c. Bisher haben wir Exponentialfunktionen nur mit einer Basis a > 1 eingeführt. Der Fall 0 < a < 1 wird durch die Definition ax := (a−1 )−x hierauf zurückgeführt. Ergänzend definieren wir 1x = 1 für alle x ∈ R. 18 2 ELEMENTARE FUNKTIONEN Bemerkung 2.13 Die für die Exponentialfunktion typische Gleichung F (x + y) = F (x) · F (y) läßt folgende Interpretation zu. Deutet man x als Zeit und setzt man y = 1 Zeiteinheit, so bedeutet F (x + 1) = F (1) · F (x), dass diese Funktion F Wachstumsprozesse mit einem Wachstumsfaktor F (1) modelliert. Insbesondere sind Exponentialfunktionen also zur Modellierung von bakteriellen Wachstumsprozessen, von Verzinsungsprozessen und von radioaktiven Zerfallsprozessen geeignet. Der folgende Satz zeigt, daß umgekehrt nur Exponentialfunktionen zur Beschreibung ungebremsten Wachstums geeignet sind: Satz 2.14 (Erster Charakterisierungssatz für Exponentialfunktionen) Es sei f eine nicht identisch verschwindende Funktion mit folgenden Eigenschaften: a) D(f ) = R , b) f ist monoton wachsend, c) Es gilt f (x + y) = f (x) · f (y) für alle x, y ∈ R. Dann ist f eine Exponentialfunktion, und es gilt f (x) = ax mit a = f (1) für alle x ∈ R. Insbesondere ist W (f ) = (0, ∞), sofern f (1) 6= 1. Beweis. Nach Voraussetzung existiert ein x0 ∈ R mit f (x0 ) 6= 0. Wegen f (x0 ) = f (x0 + 0) = f (x0 ) · f (0) folgt hieraus f (0) = 1. Das ergibt weiterhin a := f (1) ≥ f (0) = 1. Für alle x ∈ R und alle n ∈ N∗ gilt f (nx) = f (x + . . . + x) = f (x)n wegen c). Für m, n ∈ N∗ ergibt sich speziell m m n = f , am = f (1)m = f (m) = f n · n n also f ( m ) = am/n . Das zeigt f (r) = ar für alle rationalen Zahlen r > 0. Wegen n f (−x)f (x) = f (x + (−x)) = f (0) = 1 folgt weiter f (−x) = f (x)−1 für alle x ∈ R . Hieraus ergibt sich insbesondere f (r) = ar alle r ∈ Q. Also gilt auch ax = sup{ar : r ≤ x, r ∈ Q} = sup{f (r) : r ≤ x, r ∈ Q} ≤ f (x) für alle x ∈ R. Ebenso ist a−x ≤ f (−x) und folglich f (x) ≤ ax . Beide Ungleichungen zusammen zeigen nun f (x) = ax für alle x ∈ R. Definition 2.15 (Logarithmusfunktionen) Die Umkehrfunktion g = loga zur Exponentialfunktion F (x) = ax mit a > 0 und a 6= 1 heißt Logarithmusfunktion zur Basis a. Es gilt also x = loga y genau dann, wenn ax = y. 2.4 Die Exponentialfunktionen 19 Satz 2.16 Die Funktion g(y) = loga y hat folgende Eigenschaften: a) D(g) = (0, ∞) und W (g) = R, b) loga a = 1 und loga 1 = 0, c) loga ist für a > 1 streng monoton wachsend, d) loga (x1 x2 ) = log2 x1 + loga x2 , e) loga xb = b loga x für alle b ∈ R. Beweis. Die Aussagen a), b) und c) ergeben sich aus Satz 2.12 und Satz 2.7. Zum Beweis von d) seien ci = loga xi für i = 1, 2. Dann ist aci = xi , und folglich ac1 +c2 = x1 · x2 . Hieraus folgt c1 + c2 = loga (x1 x2 ). Wir übergehen den Beweis zu e). Die Logarithmen zur Basis 2, 10 und e bezeichnet man kurz durch ld, lg bzw. ln (für logarithmus dualis, Briggscher Logarithmus und logarithmus naturalis). Satz 2.17 Für alle reellen Zahlen a, b > 0 mit a, b 6= 1 gilt ax = bx·logb a für alle x ∈ R. Insbesondere lässt sich jede Exponentialfunktion durch Stauchung der x-Achse in jede andere Exponentialfunktion überführen. Beweis. Der Ansatz ax = bx·z führt durch Logarithmieren zur Basis b auf x · logb a = x · z, also z = logb a. Die folgenden Funktionen stehen in engem Zusammenhang mit der Exponentialfunktion. Ihr Nutzen wird später klar werden (z.B. im Abschnitt zur Berechnung von Integralen oder in der hyperbolischen Geometrie). Definition 2.18 Die Funktionen sinh x = ex − e−x 2 und cosh x = ex + e−x 2 heißen der hyperbolische Sinus bzw. der hyperbolische Kosinus,, ihre Umkehrfunktionen (soweit definiert) heißen Areasinus Hyperbolicus bzw. Areacosinus Hyperbolicus, sie werden durch arsinh bzw. arcosh bezeichnet. Aufgaben zu Abschnitt 2.4 1. Beweisen Sie mit der Methode aus dem Beweis zu Satz 2.12 die Gleichung (ax )y = axy für alle x, y ∈ R. 2. Beweisen Sie mittels der Formel aus Aufgabe 1 die Formel e) aus Satz 2.16. 3. Beweisen Sie die Transformationsformel logb x = loga x · logb a. 4. Beweisen sie für alle Zahlen a, b, c > 0 und a, b, c 6= 1 die Gleichung loga b · logb c · logc a = 1. 20 2 ELEMENTARE FUNKTIONEN 5. Lösen Sie die Gleichung log16 x + log4 x + log2 x = 7. 6. Skizzieren Sie den Verlauf der Funktionen sinh und cosh. 7. Beweisen Sie die Additionstheoreme für die hyperbolischen Funktionen: sinh(x + y) = sinh(x) cosh(y) + cosh(x) sinh(y), cosh(x + y) = cosh(x) cosh(y) + sinh(x) sinh(y). 21 3 Beträge und komplexe Zahlen Ziel aller Bemühungen in der Analysis ist die Untersuchung von Funktionen. Im Abschnitt II haben wir als Hauptwerkzeug die Ordnungsrelation im Bereich der reellen Zahlen mit ihren Eigenschaften benutzt. Am Beispiel der Konstruktion der Wurzel- und der Exponentialfunktion konnte die Leistungsfähigkeit dieses Apparates demonstriert werden. Ordnungstheoretische Techniken wie diese finden auch in der modernen Analysis in der Theorie der Vektorverbände ihre Weiterentwicklung. Dennoch erweist sich dieser Apparat als etwas schwerfällig, und die Einbeziehung komplexwertiger Funktionen ist grundsätzlich ausgeschlossen, da der Bereich der komplexen Zahlen keine mit Addition und Multiplikation verträgliche (totale) Ordnung zulässt. Wir benutzen daher von nun ab hauptsächlich den Abstandsbegriff, der durch die Betragsfunktion sowohl in R als auch im Körper C der komplexen Zahlen eingeführt werden kann. Es sei bemerkt, dass dies Konzept später sogar auf endlich- und unendlich dimensionale Vektorräume verallgemeinert werden kann. Damit haben wir für alle diese Fälle eine einheitliche Methode. 3.1 Die Betragsfunktion in R Definition 3.1 Im Körper R der reellen gende Formel eingeführt: x für 0 für |x| = −x für Zahlen wird die Betragsfunktion durch die fol x>0 x=0 = max{x, −x} x<0 Satz 3.2 Die Betragsfunktion | · | : R → R hat die folgenden drei Eigenschaften: (B1) Stets ist |x| ≥ 0, und es gilt |x| = 0 genau dann, wenn x = 0 ist. (B2) Für alle x, y ∈ R gilt |xy| = |x| · |y| . (B3) Für alle x, y ∈ R gilt |x + y| ≤ |x| + |y|. (Dreiecksungleichuung) Beweis. Die Behauptungen ergeben sich durch Fallunterscheidungen. 3.2 Der Körper C der komplexen Zahlen Der Körper der komplexen Zahlen wird als Erweiterung von R mit dem Ziel konstruiert, in diesem Bereich eine Lösung der Gleichung x2 = −1 zu finden. In R ist diese Gleichung wegen 1.2 nämlich nicht lösbar. Um diese Konstruktion vorzubereiten, nehmen wir zunächst an, daß ein Erweiterungsbereich C von R derartig existiert, daß in C eine den Axiomen Ax1 - Ax4 aus Abschnitt 1.2 genügende Addition und Multiplikation erklärt ist und daß in C eine Lösung der Gleichung x2 = −1 existiert. Wir bezeichnen eine solche Lösung (wie L. Euler) mit i. Dann enthält C wegen der Axiome Ax1 - Ax4 zumindestens alle Elemente der Form a + bi mit a, b ∈ R. Wegen Ax1 - Ax4, i 6∈ R und i2 = −1 gelten für diese Zahlen die folgenden Aussagen: 22 3 BETRÄGE UND KOMPLEXE ZAHLEN a) a + bi = a0 + b0 i genau dann, wenn a = a0 und b = b0 . b) (a + bi) + (c + di) = (a + c) + (b + d)i . c) (a + bi) · (c + di) = (ac − bd) + (ad + bc)i . d) Es ist i = 0 + 1 · i und 1 = 1 + 0 · i . Damit ist umgekehrt die Konstruktion von C als kleinste derartige Erweiterung von R vorbereitet. Definition 3.3 (Der Körper C) Wir setzen C = {(a, b) : a ∈ R, b ∈ R} = R × R und definieren eine Addition und Multiplikation in C durch (a, b) + (c, d) = (a + c, b + d), (a, b) · (c, d) = (ac − bc, ac + bd). Es ist reine Schreibarbeit, die Gültigkeit der Rechenregeln Ax1, Ax2 und Ax4 nachzuweisen. Für die Division (Ax3) benötigt man einen kleinen Trick, den wir in (4) besprechen. Führt man in Anlehnung an d) die Abkürzungen 1 = (1, 0) und i = (0, 1) ein, so folgt für die Elemente (a, b) ∈ C die Darstellung (a, b) = a(1, 0) + b(0, 1) = a · 1 + bi. Der Teilbereich {a · 1 : a ∈ R} ⊆ C lässt sich vermöge a · 1 7→ a eineindeutig auf R abbilden, und da a · 1 + a0 · 1 = (a + a0 ) · 1 sowie (a · 1) · (b · 1) = (a · b) · 1 gelten, können wir die Elemente der Form a · 1 mit den reellen Zahlen und das Element 1 speziell mit der Zahl 1 identifizieren. Damit lässt sich C auch wie folgt schreiben: C = {a + b i : a, b ∈ R}. Die so konstruierte Erweiterung C von R heißt der Körper der komplexen Zahlen. Definition 3.4 Unter der Gaußschen Zahlenebene versteht man die durch die Zuordnung z = a + b i 7→ (a, b) ∈ R2 hergestellte eineindeutige Abbildung von C auf R2 (s. Abbildung 2). Abbildung 2: Gaußsche Zahlenebene Wegen Definition 3.3 vollzieht sich die Addition in C dabei genau so, wie die Addition der zugehörigen Vektoren in R2 . 3.2 Der Körper C der komplexen Zahlen 23 Definition 3.5 Die Funktionen Re : C → R vermöge Re(a + bi) = a Im : C → R vermöge Im(a + bi) = b heißen Real- bzw. Imaginärteil, und die durch z = a + bi 7→ z := a − bi definierte Spiegelung an der reellen Achse heißt Konjugieren. Die Zahl z heißt die zu z konjugierte reelle Zahl. (S. Abbildung 2) Satz 3.6 Es seien z, z1 , z2 ∈ C und z = a + bi. Dann gelten: 1) 2) 3) 4) 5) z = z, z1 + z2 = z1 + z2 , z1 · z2 = z1 · z2 , z · z = (a + bi)(a + bi) = a2 + b2 ≥ 0, Rez = z+z , Imz = z−z . 2 2i Beweis. Nachrechnen! Die Division komplexer Zahlen kann nun durch Erweitern mit dem konjugiert komplexen Nenner leicht ausgeführt werden. So ist beispielsweise (3 + 5i)(2 − i) 6 + 5 + (10 − 3)i 11 7 3 + 5i = = = + i. 2+i (2 + i)(2 − i) 4+1 5 5 Bemerkung 3.7 Im Zahlbereich R folgt aus z n = z m für z 6= 0, 1 sofort n = m. Beachten Sie, dass dieser Schluss in C nicht richtig ist! Finden Sie ein Gegenbeispiel! Definition 3.8 (Betrag) Für jede Zahl z = a + bi ∈ C heißt die Zahl √ √ |z| := a2 + b2 = zz der Betrag von z. In der Gaußschen Zahlenebene ist der Betrag der Zahl z = a + bi als Abstand des Punktes P (a, b) zum Nullpunkt realisiert. Satz 3.9 Die Betragsfunktion | · | : C → R hat folgende Eigenschaften: (B1) Stets ist |z| ≥ 0 , und es gilt |z| = 0 genau dann, wenn z = 0 ist. (B2) Für alle z1 , z2 ∈ C gilt |z1 · z2 | = |z1 | · |z2 |. (B3) Für alle z1 , z2 ∈ C ist |z1 + z2 | ≤ |z1 | + |z2 |. (Dreiecksungleichung) Beweis. Die Aussagen (B1) und (B2) ergeben sich aus Satz 3.6. Die Dreiecksungleichung (B3) ergibt sich wie folgt: Wegen Rez ≤ |z| und Satz 3.6 gilt |z1 + z2 |2 = (z1 + z2 )(z1 + z2 ) = |z1 |2 + (z1 z2 + z1 z2 ) + |z2 |2 = |z1 |2 + 2Re(z1 z2 ) + |z2 |2 ≤ |z1 |2 + 2|z1 ||z2 | + |z2 |2 = (|z1 | + |z2 |)2 , und hieraus folgt die Dreiecksungleichung. 24 3 BETRÄGE UND KOMPLEXE ZAHLEN Aufgaben zu Kapitel 3 1+i , 1−i 1 b) z2 = 3−2i , c) z3 = 2. Berechnen Sie: a) Re (2 + i)5 , b) |(2 + i)5 |. 1. Berechnen Sie: a) z1 = 3−i . 5 3. Bestimmen Sie alle Lösungen der Gleichungen a) z 2 = i , b) z 3 = 8 in C. 4. Beweisen Sie die Ungleichung |z| − |w| ≤ |z − w| für alle z, w ∈ C. 5. Skizzieren Sie die Menge M = {z : |z − i| ≤ 2} in der Gaußschen Zahlenebene. 25 4 Zahlenfolgen und Reihen Zahlenfolgen und deren Eigenschaften sind eines der wichtigsten Instrumente für die Untersuchung von Funktionen. Dieses Kapitel hat daher eine grundsätzliche und zentrale Bedeutung für das Verständnis der Analysis und der Leser muss sich unbedingt sichere Kenntnisse zu diesem Gegenstand aneignen. 4.1 Zahlenfolgen Definition 4.1 Unter einer reellen bzw. komplexen Zahlenfolge (an )n∈N versteht man eine Abbildung (an ) : N → R bzw. (an ) : N → C. Die Zahlen an für n ∈ N heißen die Glieder der Folge. Die Menge aller reeller bzw. komplexer Zahlenfolgen wird (in übereinstimmung mit Abschnitt 1.1(7)) durch RN bzw. CN bezeichnet. Für Zahlenfolgen können gemäß nachfolgender Definition Rechenoperationen eingeführt werden: (an )n∈N ± (bn )n∈N = (an ± bn )n∈N , (an )n∈N · (bn )n∈N = (an · bn )n∈N , c · (an )n∈N = (c · an )n∈N für c ∈ C. Insbesondere sind RN und CN mit diesen Rechenoperationen (unendlich dimensionale) Vektorräume. Definition 4.2 Ist (an )n∈N eine Zahlenfolge und ist (nk )k∈N eine streng monoton wachsende Folge natürlicher Zahlen n1 < n2 < . . ., so heißt die Folge (ank )k∈N eine Teilfolge von (an ). So sind z.B. (an )n≥10 , (a2n ) oder (a2n+1) drei Teilfolgen von (an ). Definition 4.3 Eine Folge (an ) heißt a) stationär, falls an = an+1 für alle n ∈ N gilt. b) quasistationär, falls eine Zahl n0 ∈ N so existiert, dass an = an+1 für alle n ≥ n0 gilt. Wir führen nun den grundlegenden Begriff der Konvergenz von Folgen ein, wie er von A. L. Cauchy5 1832 in seinen ,,Vorlesungen zur Infinitesimalrechnungßur strengen Begründung der Analysis entwickelt wurde. 5 Der Name Analysis leitet sich aus dem Titel des Buches ,,Cours d’analyse de l’École Polytechnique” von Augustin Louis Cauchy (1789-1857) aus dem Jahr 1821 ab. Die Mathematiker vor Cauchy wie Leibniz, Newton, die Bernoullis, Euler oder Lagrange hatten oft ohne saubere mathematische Definitionen gearbeitet und viel intuitives Verständnis von Funktionen benutzt. Bei der Vorbereitung zu seinen Vorlesungen fielen Cauchy diese Lücken auf, und so stellte er als erster die Analysis auf eine strenge methodische Basis. Deswegen betrachtet man ihn als einen der ersten modernen Mathematiker. 26 4 ZAHLENFOLGEN UND REIHEN Definition 4.4 (Konvergenz) Eine Zahlenfolge (an ) heißt konvergent gegen a und a heißt Grenzwert von (an ), wenn zu jedem ε > 0 eine Zahl n0 (ε) so existiert, dass für alle n ∈ N mit n ≥ n0 (ε) die Abschätzung |an − a| < ε gilt. In diesem Fall schreibt man lim an = a oder einfach an → a für n → ∞. In Kurzform könnten wir schreiben: n→∞ lim an = a ⇐⇒ ∀ε > 0 ∃n0 ∈ N ∀n ∈ N : n ≥ n0 ⇒ |an − a| < ε. n→∞ Die Kontraposition der in der Definition enthaltenen Implikation ergibt das Kriterium lim an = a ⇐⇒ Für alle ε > 0 gilt |an − a| ≥ ε höchstens für endlich viele n ∈ N. n→∞ Wir werden sagen, dass eine Aussage H(n) über natürliche Zahlen fast immer gilt, wenn H(n) für höchstens endlich viele natürliche Zahlen nicht erfüllt ist. In dieser Formulierung kann man sagen: lim an = a ⇐⇒ Für jedes ε > 0 gilt fast immer |an − a| < ε. n→∞ Definition 4.5 (ε-Umgebungen) Unter der ε-Umgebung einer Zahl a in R bzw. C versteht man die folgenden Mengen: Im Fall R: Uε (a) = {x ∈ R : |x − a| < ε} = (a − ε, a + ε), Intervall mit Mittelpunkt a. Im Fall C: Uε (a) = {x ∈ C : |x − a| < ε}, offene Kreisscheibe mit Zentrum a. Kehren wir nun zu Folgen zurück. Da die Ungleichung |an − a| < ε mit an ∈ Uε (a) äquivalent ist, können wir feststellen: lim an = a ⇐⇒ Für jedes ε > 0 gilt fast immer an ∈ Uε (a). n→∞ Alle der soeben eingeführten Charakterisierungen der Konvergenz werden wir gleichberechtigt benutzen. Schließlich definieren wir noch: Definition 4.6 Eine Folge (an ) heißt konvergent, wenn sie einen Grenzwert hat. Abbildung 3: Konvergente Folgen an → a in C und R 4.1 Zahlenfolgen 27 2n2 = 2, denn es ist n→∞ n2 + 1 Beispiel 4.7 Wir betrachten ein Beispiel: Es gilt lim 2n2 2n2 − 2n2 − 2 2 2 − 2 = ≤ 2 ≤ε 2 = 2 2 n +1 n +1 n +1 n p p für alle n > 2/ε. Also könnte z.B. n0 (ε) = Int( 2/ε) + 1 gewählt werden. Satz 4.8 Jede Folge hat höchstens einen Grenzwert. Beweis. Seien a 6= a0 zwei verschiedene Grenzwerte der Folge (an ). Wir wählen ε = 1 |a − a0 | > 0. Dann ist Uε (a0 ) ∩ Uε (a) = ∅. Daher kann im Widerspruch zur Voraussetzung 2 höchstens eine der beiden Mengen fast alle Folgenglieder an enthalten. Es ist nicht immer leicht zu entscheiden, ob eine Folge konvergiert oder nicht. Wir wollen daher im Folgenden einige Konvergenzkriterien aufstellen. Als erstes Hilfsmittel dient dazu der Begriff der Beschränktheit. Definition 4.9 (Beschränktheit) Eine Zahlenfolge (an ) heißt beschränkt, wenn es eine Konstante K > 0 mit |an | ≤ K für (fast) alle n ∈ N gibt. Satz 4.10 (Ein notwendiges Konvergenzkriterium) Jede konvergente Folge ist beschränkt. Beweis. Es sei (an ) konvergent gegen a. Dann gibt es zu ε = 1 eine Zahl n0 mit |an −a| < 1 für alle n ≥ n0 . Also ist |an | = |an − a + a| ≤ |an − a| + |a| ≤ 1 + |a| für alle n ≥ n0 . Setzen wir nun K = max{1 + |a|, |a0 |, . . . , |an0 |}, so gilt |an | ≤ K für alle n ∈ N. Also ist (an ) beschränkt. Definition 4.11 Folgen mit Grenzwert 0 heißen Nullfolgen. Unmittelbar aus der Definition folgt: Satz 4.12 Es gilt an → a genau dann, wenn (an − a) eine Nullfolge ist. Beispiel 4.13 Wir betrachten einige Beispiele reeller Nullfolgen: a) Die Folge (an ) = ( n1 ) ist eine Nullfolge, denn wegen des archimedischen Axioms gilt für jedes ε > 0 fast immer die Ungleichung 1ε < n und damit n1 < ε. Nach analogem Argument gilt auch lim n1α = 0 für alle α > 0. n→∞ b) Die geometrische Folge (an ) = (q n ) ist im Fall 0 < |q| < 1 eine Nullfolge, für |q| > 1 ist die Folge unbeschränkt. √ √ c) Es gilt lim ( n + 1 − n) = 0, denn es ist n→∞ √ √ √ √ √ √ ( n + 1 − n)( n + 1 + n) 1 1 √ | n + 1 − n| = ≤ √ ≤√ , √ 2 n n n+1+ n und für gegebenes ε > 0 gilt fast immer √1 n < ε, wie in a) gezeigt wurde. 28 4 ZAHLENFOLGEN UND REIHEN Die in Beispiel 4.13c) verwendete Methode zum Nachweis der Nullfolgeneigenschaft lässt sich zu folgendem Kriterium verallgemeinern: Satz 4.14 (Dominanzkriterium) Sind (an ) und (bn ) zwei Zahlenfolgen, ist (bn ) eine Nullfolge und gibt es eine Konstante K > 0 so, dass |an | ≤ K|bn | für (fast) alle n ∈ N gilt, so ist auch (an ) eine Nullfolge. Beweis. Zu gegebenem ε > 0 betrachten wir die Ungleichung |an | ≤ K · |bn | < ε, die wegen bn → 0 fast immer erfüllt ist. Daher ist auch (an ) eine Nullfolge. Als einfaches Beispiel betrachten wir die Folge (an ) = n25+2 . Aus der Abschätzung 5 5 1 ≤ = bn → 0 ≤ 5 · n2 + 2 n2 n folgt sofort, dass die Folge (an ) eine Nullfolge ist. 0< Satz 4.15 a) Summe und Differenz von Nullfolgen sind Nullfolgen. b) Ist (an ) eine Nullfolge und ist (bn ) beschränkt, so ist (an · bn ) eine Nullfolge. Insbesondere bilden die Mengen aller reellen bzw. komplexen Nullfolgen zwei (unendlich dimensionale) Vektorräume, die einfach mit c0 bezeichnet werden. Beweis. Es seien (an ) und (bn ) zwei Nullfolgen. Zu vorgegebenem ε > 0 existiert dann eine Zahl n1 ∈ N mit |an | < 2ε für alle n ≥ n1 . Entsprechend existiert eine Zahl n2 ∈ N mit |bn | < 2ε für alle n ≥ n2 . Setzen wir n0 = max{n1 , n2 }, so folgt ε ε |an + bn | ≤ |an | + |bn | ≤ + = ε für alle n ≥ n0 . 2 2 Also ist (an + bn ) eine Nullfolge. Die Aussage b) folgt aus 4.14. Der folgende Satz erleichtert manchmal die Untersuchung komplexer Zahlenfolgen: Satz 4.16 Für komplexe Zahlenfolgen (zn ) mit zn = an + bn i gilt: zn → 0 ⇐⇒ an → 0 und bn → 0. Beweis. (⇒): Die Behauptung folgt wegen |an |, |bn | ≤ |zn | aus Satz 4.14. (⇐) : Die Behauptung folgt wegen |zn | ≤ |an | + |bn | aus Satz 4.14 und Satz 4.15a). Mit Satz 4.12 lassen sich die für Nullfolgen gefundenen Aussagen auf konvergente Folgen übertragen: Satz 4.17 (Grenzwertsätze) Es seien (an ) und (bn ) konvergente Zahlenfolgen. Dann konvergieren auch die Summen- und Produktfolgen, und es gelten lim an ± bn = lim an ± lim bn und lim an · bn = lim an · lim bn . n→∞ n→∞ n→∞ n→∞ n→∞ n→∞ Ferner ist lim |an | = | lim an |. Gelten überdies an 6= 0 für alle n ∈ N und lim an 6= 0, n→∞ n→∞ n→∞ so gilt auch 1 1 lim = . n→∞ an lim an n→∞ 4.1 Zahlenfolgen 29 Beweis. Es seien an → a und bn → b. Dann folgt |(an + bn ) − (a + b)| = |(an − a) − (bn − b)| ≤ |an − a| + |bn − b| → 0. Das Dominanzkriterium zusammen mit Satz 4.15 zeigt dann an + bn → a + b. Wir betrachten nun Produkte. Da (an ) als konvergente Folge auch beschränkt ist, gibt es eine Konstante K > 0 mit |an | ≤ K für alle n ∈ N. Nun ist |an bn − ab| = |an bn − an b + an b − ab| ≤ |an bn − an b| + |an b − ab| ≤ |an ||bn − b| + |an − a||b| ≤ K|bn − b| + |an − a||b| → 0. Die mögliche Vertauschung von lim mit dem Betrag ergibt sich aus der Abschätzung n→∞ ||an | − |a| ≤ |an − a| → 0. Zum Beweis der Divisionsformel beachten wir zunächst, dass wegen a 6= 0 eine Zahl n0 ∈ N so gefunden werden kann, dass |a − an | ≤ |a| für alle n ≥ n0 gilt. Hieraus folgt 2 |an | = |a − (a − an )| ≥ |a| − |a − an | ≥ |a| − |a| 1 2 |a| = , also ≤ 2 2 |an | |a| für alle n ≥ n0 . Dies zeigt nun 1 1 a − an 1 2 = |a − an | ≤ |a − an | · 2 → 0. − = an a an a |an ||a| |a| Damit ist der Satz vollständig bewiesen. Beispiel 4.18 Als Anwendung der Grenzwertsätze betrachten wir das folgende Beispiel: n2 (2 + n1 − n12 ) 2 + n1 − 2n2 + n − 1 lim = lim = lim n→∞ n→∞ n→∞ 5n2 − n n2 (5 − n1 ) 5 − n1 1 n2 lim (2 + = n→∞ 1 n − lim (5 − n→∞ 1 ) n2 1 ) n 2 = . 5 Man sieht leicht, dass nach diesem Verfahren alle Probleme der Form P (n) mit beliebigen Polynomen P (n) und Q(n) n→∞ Q(n) lim bearbeitet werden können.Wir überlassen dem Leser die Formulierung eines entsprechenden Satzes. Aufgaben zu Abschnitt 4.1 1. Man zeige: Aus an → a und bn → a folgt an − bn → 0. 2. Für jede Folge an → 0 existiert max{|an | : n ∈ N}. 3. Berechnen Sie 2n+n2 2, n→∞ 1−3n a) lim 2k+k2 4 k→∞ 1−3k b) lim j2 . j→∞ j! und c) lim 30 4 ZAHLENFOLGEN UND REIHEN 4. Zeigen Sie lim √ n n→∞ a = 1 für alle a > 0. 1 2 n→∞ 1−3n 5. Berechnen Sie lim + n 2n+1 i. a1 + . . . + an . Die Folge (cn ) heißt n auch Folge der Cesaro-Mittel von (an ). Zeigen Sie: 6. Es sei (an ) eine beliebige Folge und es sei cn = an → a =⇒ cn → a. Diskutieren Sie am Beispiel an = (−1)n die Frage, ob auch die Umkehrung der Implikation gilt. 4.2 Reelle Zahlenfolgen Das in Satz 4.14 formulierte Dominanzkriterium für Nullfolgen kann zu folgendem Vergleichskriterium für beliebige reelle Zahlenfolgen verallgemeinert werden. Wir werden dieses Kriterium im weiteren oft anwenden. Manchmal wird es in der Literatur aus offensichtlichen Gründen auch Sandwich-Kriterium genannt. Satz 4.19 (Vergleichskriterium) Sind (an ), (bn ) und (cn ) drei reelle Zahlenfolgen mit an ≤ cn ≤ bn für fast alle n ∈ N und ist lim an = lim bn = a, so konvergiert auch die n→∞ n→∞ Folge (cn ) gegen a. Beweis. Es sei a = lim an . Dann ist n→∞ |cn − a| = |cn − an + an − a| ≤ |cn − an | + |an − a| ≤ |bn − an | + |an − a| ≤ |bn − a| + |an − a| + |an − a| → 0. Damit ist alles bewiesen. Wir dehnen nun die Grenzwertsätze aus Satz 4.17 auf ”höhere” Rechenoperationen aus. Durch mehrfache Anwendung der Grenzwertsätze folgt aus an → a, dass auch akn → ak für alle k ∈ N konvergiert. Die Ausdehnung dieser Aussage auf beliebige reelle Exponenten ist ein Spezialfall des folgenden viel allgemeineren Satzes: Satz 4.20 Es sei f eine monoton wachsende Funktion von [a, b] auf das Intervall [f (a), f (b)]. Dann gilt: lim f (xn ) = f lim xn für alle konvergenten Folgen (xn ) ⊆ [a, b]. n→∞ n→∞ Für monoton fallende Funktionen gilt eine entsprechende Aussage. 4.2 Reelle Zahlenfolgen 31 Beweis. Wir betrachten zunächst den Fall, dass f auf [a, b] streng monoton wächst. Es sei (xn ) eine Folge in [a, b] mit xn → x und es sei a < x < b. Wir fixieren ein ε > 0. Durch eventuelle Verkleinerung von ε können wir dabei f (a) < f (x) − ε < f (x) < f (x) + ε < f (b) annehmen. Wir setzen nun c1 = f (x) − ε, c2 = f (x) + ε und u1 = f −1 (c1 ), u2 = f −1 (c2 ). Dann gilt u1 < x < u2 , und wegen xn → x existiert eine Zahl n0 ∈ N mit xn ∈ (u1 , u2 ) für alle n ≥ n0 . Hieraus folgt f (xn ) ∈ (f (u1 ), f (u2 )) = (c1 , c2 ) = Uε (f (x)). Also gilt f (xn ) → f (x). Im Fall x = a oder x = b setzen wir die Funktion f linear und streng monoton auf das Intervall [a − 1, b + 1] fort, damit ist dieser Fall auf den ersten zurückgeführt. Im Fall, dass f nur monoton wachsend ist, ”stören” wir die Funktion f durch Addition der linearen Funktion h(t) = t − a, wir setzen also g(t) = f (t) + h(t) für t ∈ [a, b]. Dann ist g eine streng monoton wachsende Funktion von [a, b] auf [f (a), f (b) + (b − a)]. Aus xn → x folgt also nach dem bereits Bewiesenen f (xn ) = g(xn ) − h(xn ) → g(x) − h(x) = f (x). Damit ist alles bewiesen. Folgerung 4.21 Aus xn → x folgen xαn → xα für alle α ∈ R, axn → ax für alle a > 0 und ln xn → ln x, sofern die Elemente xn und x im Definitionsbereich der jeweiligen Funktion liegen. Satz 4.22 Es gelten √ n a → 1 für alle a > 0 und √ n n → 1. Beweis. Die erste Formel ist wegen a1/n → a0 = 1 ein Spezialfall von Folgerung 4.21, sie trat außerdem in anderer Formulierung bereits in Aufgabe 5 aus Abschnitt 1.6 auf. Für den Beweis der zweiten Formel erhalten wir aus der Bernoullischen Ungleichung zunächst √ q q q √ √ n 1 n √ n n n= n≤ 1+ n≤1+ 1≤ =1+ √ →1 . n n Also gilt p√ n n → 1 und daher √ n n → 1. Aufgaben 1. Man zeige √ n 2n → 1. √ n n2 + 2n − 5 → 1. p 1 1 3. Man berechne lim 102+ n und lim e− n2 . 2. Man zeige n→∞ n→∞ 32 4.3 4 ZAHLENFOLGEN UND REIHEN Monotone Zahlenfolgen und Intervallschachtelungen Die Grenzwertsätze waren ein nützliches Instrument, um in günstig gelagerten Fällen die Existenz und die Berechnung von Grenzwerten auf bekannte Grenzwerte zurückzuführen. In zahlreichen anderen Situationen wird diese Methode jedoch nicht greifen. So ist z.B. die später zu beweisende und bereits G.W. Leibniz (1646-1716) bekannte Formel (−1)n π 1 1 1 = lim 1 − + − + − . . . + n→∞ 3 5 7 2n + 1 4 mit den bisherigen Methoden nicht zu verifizieren. Das betrifft sowohl die Existenz des Grenzwertes als auch die noch schwierigere Frage der Ermittlung seines Wertes. Wir werden diese beide Fragen gesondert behandeln. Für das Existenzproblem werden in diesem Abschnitt erste grundsätzliche und leistungsfähige Konvergenzkriterien entwickelt, die letztendlich auf dem Vollständigkeitsaxiom (Ax 11) beruhen. Definition 4.23 Eine reelle Zahlenfolge (an ) heißt monoton wachsend, wenn an ≤ an+1 für alle n ∈ N gilt. Wir bezeichnen diesen Sachverhalt häufig durch an %. Gilt an ≥ an+1 für alle n ∈ N, so heißt die Folge (an ) monoton fallend, und wir schreiben an &. Es ist sofort zu sehen, dass eine Zahlenfolge (an ) monoton ist, wenn sie im Sinn der Definition 2.6 eine monotone Funktion als Abbildung von N nach R ist. Satz 4.24 (Bolzano-Kriterium für monotone Folgen) Eine monotone Zahlenfolge ist genau dann konvergent, wenn sie beschränkt ist. Dabei gilt sup{an : n ∈ N}, falls (an ) monoton wächst. lim an = inf {an : n ∈ N}, falls (an ) monoton fällt. n→∞ Für monotone Folgen schreiben wir statt an → a auch an % a bzw. an & a. Beweis. Es genügt zu zeigen, dass beschränkte, monoton wachsende Folgen (an ) auch konvergent sind. Wegen des Vollständigkeitsaxioms existiert a = sup{an : n ∈ N}. Sei nun ε > 0 gegeben. Da a − ε keine obere Schranke für {an : n ∈ N} sein kann, existiert ein n0 ∈ N mit a − ε < an0 ≤ a. Für alle n ∈ N mit n ≥ n0 folgt wegen an % dann a − ε ≤ an0 ≤ an ≤ a, also gilt |an − a| < ε für alle n ≥ n0 . Das zeigt a = lim an . Wir verwenden dieses Kriterium nun zur weiteren Untersuchung von Exponentialfunktionen und konstruieren zunächst die Zahl Eulersche Zahl e. Satz 4.25 Die Folge (1 + n1 )n n≥1 ist monoton wachsend und konvergent, ihr Grenzwert e = lim n→∞ heißt Eulersche Zahl, und es gilt 2 < e < 3. 1 1+ n n 4.3 Monotone Zahlenfolgen und Intervallschachtelungen Beweis. Wir setzen an = (1 + n1 )n = an = an−1 n+1 n n+1 n . n 33 Dann ist n n−1 2 n n n−1 n −1 n 1 n · = · = 1 − · , n n2 n−1 n2 n−1 und die Bernoullische Ungleichung mit h = −1/n2 ergibt an 1 n 1 n ≥ 1−n· 2 · = 1− =1. an−1 n n−1 n n−1 Also ist (an ) monoton wachsend. Wir zeigen nun die Beschränktheit der Folge. Wegen der binomischen Formel und der leicht einzusehenden Ungleichung n 1 1 1 · k ≤ ≤ k−1 k n k! 2 gilt n n n n X X X 1 1 1 n X n 1 2−k < 1 + 2 = 3. ≤ ≤ 1 + ≤ 1 + 2 1+ = k n k n k! k! k=0 k=1 k=1 k=0 Dabei haben wir noch von der geometrischen Summenformel (Satz 1.6(3)) Gebrauch gemacht. Aus Satz 4.24 ergibt sich somit die Konvergenz der Folge, und es ist 2 = a1 < lim an < 3. Bemerkung 4.26 Obige Grenzwertdarstellung lässt die folgende Interpretation zu. Eine Größe y = y(t) unterliege auf dem Zeitintervall [0, 1] einem Wachstum mit Wachstumsgeschwindigkeit 1. Wir wollen y(1) = e · y(0) zeigen. Dazu zerlegen wir das Zeitintervall in die Abschnitte 0 < n1 < n2 < . . . < nn und setzen yk = y( nk ). Rechnen wir innerhalb eines Zeitintervalls mit einem anteiligen Wachstumsfaktor von 1 + n1 , so ergibt sich 1 yk = yk−1 · 1 + n 1 = y(0) · 1 + n k . Also ist yn = y0 (1 + n1 )n eine Näherung für y(1). Der Grenzübergang n → ∞ ergibt dann y(1) = e · y(0). Eleganter und präziser kann dieser Prozess mit Hilfe der Differentialrechnung beschrieben werden. Satz 4.27 (Approximation von ex durch Polynome) Für jedes x ∈ R konvergiert die Folge der Zahlen (1 + nx )n , n > −x, monoton gegen ex . Es gilt also x n lim 1 + = ex . n→∞ n Beweis. Es sei x ∈ R fixiert. Wir zeigen zuerst, dass n+1 x n x 1+ ≤ 1+ für alle n > −x n n+1 34 4 ZAHLENFOLGEN UND REIHEN gilt. Wegen n > −x ist 1 + nx > 0. Wir wählen eine Zahl h > −1 als Lösung der Gleichung (1 + h)n+1 = n 1 = n+x 1+ x n . Die Bernoullische Ungleichung ergibt n = (1 + h)n+1 ≥ 1 + (n + 1)h . n+x Addition von n und Multiplikation mit n+x n(n+1) ergibt der Reihe nach n ≥ (n + 1)(1 + h) , n+x n+x x x ≥ (1 + h) = 1 + (1 + h). 1+ n+1 n n n+ Potenzbildung mit n + 1 liefert schließlich die Behauptung. Zum Nachweis der Beschränktheit der Folge wählen wir eine Zahl 0 6= k ∈ N mit | xk | ≤ 1. Dann folgt aus der bereits bewiesenen Monotonie und aus Satz 4.25 die Ungleichung n k x n x nk 1 1+ ≤ 3k . ≤ 1+ ≤ 1+ n kn n Wegen Satz 4.24 konvergiert daher die in Rede stehende Folge, und wir können durch x n f (x) = lim 1 + , x∈R, n→∞ n eine Funktion f auf R definieren. Für x = −1 gilt n+1 n 1 n n 1 1 n · 1 = . = = lim · lim f (−1) = lim 1 − n+1 n→∞ n→∞ n + 1 n→∞ n+1 n+1 e lim n n→∞ Nun sei x eine positive rationale Zahl der Form x = n = kp gilt nx = m1 und n = mp . Daraus folgt q f (±x) = lim n→∞ p q mit p, q > 0. Mit m = kq und mp/q 1 x n 1± = lim 1 ± = e±p/q = e±x , m→∞ n m womit f (x) = ex für alle x ∈ Q bewiesen ist. Wir zeigen als nächstes, dass die Funktion f monoton wachsend ist. Es seien x, y ∈ R mit x < y gegeben. Wir wählen n ∈ N so groß, dass 1 + nx , 1 + ny > 0 sind. Aus x y x n y n 1 + < 1 + folgt nun 1 + < 1+ . n n n n Mithin gilt f (x) ≤ f (y), da Limites als Suprema gebildet werden können. Es sei schließlich x eine beliebige reelle Zahl. Wir wählen eine Folge rationaler Zahlen rn mit rn % x. Dann gilt ex = sup{ern : n ∈ N} = sup{f (rn ) : n ∈ N} ≤ f (x). Also ist ex ≤ f (x). Wäre aber ex < f (x), so wäre x < ln f (x). Wählt man eine rationale Zahl r mit x < r < ln f (x), so folgte f (r) = er < f (x). Das steht im Widerspruch zur Monotonie von f . 4.3 Monotone Zahlenfolgen und Intervallschachtelungen 35 Folgerung 4.28 Für alle n ∈ N und alle x ∈ (−n, ∞) gilt (1 + nx )n ≤ ex . Insbesondere ist 1 + x ≤ ex für alle x ∈ R. Der in der Folgerung beschriebene Sachverhalt ist in Abbildung 4 dargestellt. Abbildung 4: Approximation der e-Funktion durch Polynome Folgerung 4.29 Für alle k ∈ N gilt lim nk e−n = 0. Die Exponentialfunktion wächst also n→∞ schneller als alle Potenzfunktionen. Beweis. Wegen Folgerung 4.28 ist k+1 1 x ≤ ex und folglich xk e−x ≤ (k + 1)k+1 · k+1 x für alle x > 0. Mit x = n folgt hieraus die Behauptung. Durch Übergang zu den Umkehrfunktionen können wir nun auch die entsprechende Darstellung für die Logarithmusfunktion ln x gewinnen. Setzen wir x n y = fn (x) = 1 + , x > −n , n so ergibt die Auflösung nach x die Funktionenschar √ x = gn (y) = n( n y − 1) , y≥0. Für alle n ∈ N gilt nun gn (y) ≥ gn+1 (y) = v, denn die entgegengesetzte Annahme u = gn (y) < gn+1 (y) führt wegen y = fn (u) ≤ fn+1 (u) < fn+1 (v) = y zum Widerspruch. Also ist die Folge (gn (y))n∈N monoton fallend. Dies ist die Grundlage für den folgenden Satz: Satz 4.30 (Approximation der Logarithmusfunktion) Für alle y > 0 konvergiert √ die monoton fallende Folge der Zahlen n( n y − 1) und es gilt √ ln y = loge y = lim n( n y − 1) . n→∞ 36 4 ZAHLENFOLGEN UND REIHEN Beweis. Wir zeigen die Existenz des Grenzwertes √ L(y) = lim n( n y − 1) für alle y > 0. n→∞ Für y ≥ 1 ist die fragliche Folge nach unten durch 0 beschränkt. Zusammen mit der bereits gezeigten Monotonie zeigt das die Existenz des Grenzwertes wegen des BolzanoKriteriums für monotone Folgen. Nun sei 0 < y < 1. Dann ist p p √ √ √ n( n y − 1) = n(1 − n y −1 ) · n y = −n( n y −1 − 1) · n y. Die rechte Seite der Gleichung konvergiert wegen y −1 ≥ 1 nach dem bereits gezeigten gegen −L(y −1 ). Also konvergiert auch die linke Seite, und es gilt L(y) = −L(y −1 ). Wir zeigen nun x = L(ex ) für alle x. Aus (1 + nx )n ≤ ex folgt durch Umstellen x ≤ √ n( n ex − 1), und der Übergang zum Limes ergibt x ≤ L(ex ) für alle x ∈ R. Insbesondere ist auch −x ≤ L(e−x ) = −L(ex ), woraus x ≥ L(ex ) und damit die Gleichheit x = L(ex ) folgen. Also ist L die Umkehrfunktion von f (x) = ex , und daher gilt L(y) = ln y für alle y ∈ R. Wir wenden uns wieder der allgemeinen Theorie zu und leiten das folgende wichtige Konvergenzprinzip her. Definition 4.31 (Intervallschachtelung) Eine Intervallschachtelung (an |bn ) ist ein Paar reeller Folgen (an ), (bn ) mit folgenden Eigenschaften: a) an %, b) bn &, c) an ≤ bn für alle n ∈ N, d) bn − an → 0 für n → ∞. Satz 4.32 Ist (an |bn ) eine Intervallschachtelung, so existiert genau eine Zahl a ∈ R mit an ≤ a ≤ bn für alle n ∈ N. Insbesondere gilt \ [an , bn ] = {a} . n∈N Die Folgen (an ) und (bn ) konvergieren gegen a und man hat die ,,a priori Fehlerabschätzung” |a − an | ≤ |bn − an | . Beweis. Wegen am ≤ am+n ≤ bm+n ≤ bn gilt am ≤ bn für alle m, n ∈ N. Insbesondere ist an ≤ a := sup{am : m ∈ N} ≤ bn für alle n ∈ N . Ist a0 eine weitere Zahl mit an ≤ a0 ≤ bn für alle n ∈ N, so folgt 0 ≤ |a − a0 | ≤ |bn − an | → 0 , also ist a = a0 . Speziell ist lim bn = inf{bn : n ∈ N} = a . n→∞ Die Fehlerabschätzung folgt aus bn ≥ a. 4.3 Monotone Zahlenfolgen und Intervallschachtelungen 37 Satz 4.33 (Intervallschachtelung für e) Durch (1 + n1 )n (1 + n1 )n+1 ist eine Intervallschachtelung in R gegeben, die sich auf die Zahl e zusammenzieht. Insbesondere gilt |e − (1 + n1 )n | ≤ n3 . Beweis. Es seien an = 1 + b−1 n = n n+1 1 n n und bn = 1 + n+1 = n+1−1 n+1 1 n+1 . n n+1 Dann ist an % bereits bekannt. Aus = 1 1− n+1 n+1 = cn+1 und cn+1 % e−1 nach (5) folgt bn & e . Also ist an < e < bn und lim(bn −an ) = lim n1 ·an = 0. Hieraus folgt wegen an ≤ e ≤ 3 auch die Fehlerabschätzung. Beispiel 4.34 (Leibnizreihe) Abschließend betrachten wir die zu Beginn des Paragraphen gestellte Frage nach der Konvergenz der Folge (sn ) mit sn = 1 − 1 1 1 + − . . . + (−1)n . 3 5 2n + 1 Wir setzen 1 1 1 + − +... − und 3 5 4n − 1 1 1 1 1 = 1 − + − +... − + 3 5 4n − 1 4n + 1 an = 1 − bn für n ≥ 1. Dann ist (an |bn ) offenbar eine Intervallschachtelung. Also konvergieren (an ) und (bn ) gegen den gleichen Wert. Dann konvergiert aber auch die gemischte Folge (sn ) = (a1 , b1 , a2 , b2 , . . .). Der Nachweis, daß dieser Grenzwert gerade π/4 ist, kann aber noch nicht erbracht werden. Das Prinzip der Intervallschachtelung lässt auf C verallgemeinern: Satz 4.35 (Kreisscheibensatz) Ist K1 ⊇ K2 ⊇ . . . eine Folge von abgeschlossenen Kreisscheiben in C mit T gegen Null strebenden Durchmessern. Dann gibt es genau eine Zahl z ∈ C mit z ∈ Kn . n∈N Beweis. Wir betrachten das Problem in der Gaußschen Zahleneben. Die Projektionen der Kreisscheiben auf die reelle bzw. imaginäre Achse erzeugen dort Intervallschachtelungen. Bezeichnen α bzw. β die dadurch eingefangenen Zahlen, so ist z = α + β · i die einzige, in allen Kreisscheiben Kn enthaltene Zahl. Aufgaben 1. Zeigen Sie, dass die rekursiv definierte Folge √ p a0 = 2 , an = 2 + an−1 monoton wächst und beschränkt ist. Berechnen Sie den Grenzwert. 38 4 ZAHLENFOLGEN UND REIHEN ln n & 0. n n − 7 n + 3 3. Zeigen Sie, dass eine Intervallschachtelung ist. Bestimmen Sie n + 2 n + 2 n∈N den eingefangenen Punkt. 2. Zeigen Sie 4. Es sei c > 1 und die Folgen (an ) und (bn ) seien rekursiv wie folgt definiert: a0 = 1, b0 = c, an+1 = c bn+1 , an = an + b n . 2 Zeigen Sie, dass (an |bn√ ) eine Intervallschachtelung ist √ und zeigen Sie, dass der eingefangene Punkt gerade c ist. Berechnen Sie damit 2 auf vier Dezimalen (Benutzen Sie die a priori Fehlerabschätzung.) Hinweis: Zeigen Sie zuerst durch vollständige Induktion die Ungleichung b2n ≥ c. √ √ √ 5. Zeigen Sie, dass die Folge (an ) mit an = n( n + 1 − n) monoton wachsend und beschränkt ist. Bestimmen Sie den Grenzwert. Hinweis: Zeigen Sie an+1 /an ≥ 1. 6. Zeigen Sie lim n→∞ 1 1+ α n n 1 e = ∞ für für für α > 1, α=1 0 < α < 1. Hinweis: Benutzen Sie die Bernoullische Ungleichung und die aus Folgerung 4.28 bekannte Ungleichung (1 + nx )n ≤ ex für x ≥ 0. 4.4 Häufungspunkte Bevor wir weiteren Konvergenzkriterien nachgehen, schwächen wir den Begriff des Grenzwertes etwas ab: Definition 4.36 Es sei (an ) eine Zahlenfolge. Eine Zahl a heißt ein Häufungspunkt von (an ), wenn für jedes ε > 0 unendlich viele Folgenglieder an in Uε (a) = {x : |x − a| < ε} liegen, wenn also zu jedem n ∈ N ein Index k ≥ n so existiert, dass |a − ak | ≤ ε ist. n−1 die beiden Zahlen So hat beispielsweise die Zahlenfolge mit den Gliedern an = (−1)n n a = ±1 als Häufungspunkte. Die Beziehung zum Grenzwertbegriff ist durch die folgenden beiden Sätze gegeben: Satz 4.37 Konvergiert die Folge (an ) gegen a, so ist a der einzige Häufungswert von (an ). Beweis. Offenbar ist a als Grenzwert auch ein Häufungspunkt. Ist aber b 6= a ein weiterer Punkt, so gilt Uε (a) ∩ Uε (b) = ∅ für ε = |a − b|/2. Daher kann Uε (b) höchstens endlich viele Folgenglieder an enthalten. 4.4 Häufungspunkte 39 Satz 4.38 Eine Zahl a ist genau dann ein Häufungspunkt der Folge (an ), wenn (an ) eine gegen a konvergente Teilfolge (ank ) besitzt. Beweis. Offensichtlich ist jeder Grenzwert einer Teilfolge von (an ) auch ein Häufungspunkt von (an ). Sei umgekehrt a ein Häufungspunkt von (an ). Wir konstruieren eine gewünschte Teilfolge dann so: Zu ε = 1 existiert mindestens ein Index n1 mit an1 ∈ U1 (a). Seien nun bereits k Indizes n1 < n2 < . . . < nk mit ank ∈ U 1 (a) konstruiert. Dann gibt es aber auch k 1 mindestens einen Index nk+1 > nk mit ank+1 ∈ U 1 (a). Die auf diese Weise zu ε = k+1 k+1 konstruierte Folge (ank ) konvergiert nun gegen a, denn es gilt |ank − a| < k1 → 0. Dem folgenden Satz kommt in der Analysis eine zentrale Bedeutung zu: Satz 4.39 (Satz von Bolzano-Weierstraß) Jede beschränkte Zahlenfolge besitzt einen Häufungspunkt. Beweis. Wir betrachten zuerst den Fall reeller Zahlenfolgen und bedienen uns des sogenannten Halbierungsverfahrens: Zu der beschränkten Folge (an ) wählen wir Zahlen A0 und B0 mit A0 ≤ an ≤ B0 für alle 0 . Falls das linke Teilintervall [A0 , C0 ] unendlich n ∈ N. Wir setzen n0 = 0 und C0 = A0 +B 2 viele Folgenglieder an enthält, so wählen wir ein n1 > n0 mit an1 ∈ [A0 , C0 ] und setzen A1 = A0 und B1 = C0 . In anderen Fall enthält aber [C0 , B0 ] unendlich viele Folgenglieder, und wir wählen ein n1 > n0 mit an1 ∈ [C0 , B0 ] und setzen A1 = C0 und B1 = B0 . In jedem Fall enthält [A1 , B1 ] dann unendlich viele Folgenglieder, und das Verfahren kann wiederholt werden. Auf diese Weise entsteht eine Intervallschachtelung B0 − A0 und Ak ≤ ank ≤ Bk für alle k ∈ N. (Ak |Bk ) mit |Bk − Ak | = 2k Nach Satz 4.32 existiert daher ein Grenzwert a der Folgen (Ak ) und (Bk ), der wegen Satz 4.19 auch ein Grenzwert von (ank ) und damit ein Häufungspunkt von (an ) ist. Nach Konstruktion ist dies sogar der kleinste Häufungspunkt von (an ). Ist (zn ) nun eine komplexe, beschränkte Zahlenfolge, so setzen wir an = Re(zn ) und bn = Im(zn ). Nach Obigem hat (an ) eine konvergente Teilfolge (ank ). Die Folge (bnk ) hat wiederum eine konvergente Teilfolge (bnkj ). Somit ist (znkj ) konvergent. Wir bemerken, dass das obige Verfahren im eigentlichen Sinn nicht konstruktiv, genauer nicht algorithmisierbar ist, da die Entscheidung, ob ein Intervall unendlich viele Folgenglieder enthält, nicht algorithmisch entscheidbar ist. Trotz dieses grundsätzlichen Makels ist das obige Kriterium jedoch von herausragender Bedeutung, da es keinen besseren Satz gibt. Eine genauere Analyse des Halbierungsverfahrens führt zu folgender Verschärfung des Satzes von Bolzano-Weierstraß, die wir im Beweis zu diesem Satz bereits erwähnt hatten: Satz 4.40 Jede beschränkte reelle Zahlenfolge (an ) besitzt einen größten und einen kleinsten Häufungswert. Diese heißen der Limes inferior bzw. der Limes superior von (an ) und sie werden durch lim inf an bzw. durch lim sup an n→∞ bezeichnet. n→∞ 40 4 ZAHLENFOLGEN UND REIHEN Folgerung 4.41 Eine reelle Zahlenfolge ist genau dann konvergent, wenn sie beschränkt ist und höchstens einen Häufungspunkt hat. Beweis. Konvergente Folgen haben die genannten Eigenschaften. Sei umgekehrt (an ) beschränkt mit höchstens einem Häufungspunkt und sei a = lim inf an . Wäre a kein Grenzwert, so gäbe es ein ε > 0 derart, daß die Menge {n : |an − a| > ε} unendlich ist. Die Teilfolge dieser an hat aber nach Bolzano-Weierstraß wiederum ein Häufungspunkt, der natürlich von a verschieden ist. Dieser Widerspruch beweist den Satz. Definition 4.42 Es sei E die Menge R oder C, es sei M eine Teilmenge von E. Eine Zahl a heißt ein Häufungspunkt von M in E, wenn jede punktierte ε-Umgebung Uε0 (a) = {x ∈ E : |x − a| < ε, x 6= a} von a mindestens einen Punkt von M enthält. Die Beziehung zwischen Häufungspunkten von Mengen und konvergenten Folgen ist durch folgenden Satz gegeben: Satz 4.43 Wie oben seien E = R, C und M ⊆ E. Ein Punkt a ∈ E ist genau dann ein Häufungspunkt von M in E, wenn eine Folge von Elementen xn ∈ M mit xn 6= a und xn → a existiert. Beweis. Ist a ein Häufungspunkt, so können wir zu jedem ε = n1 ein Element xn ∈ 0 (a) wählen. Wegen |xn − a| < n1 gilt xn → a. Ist umgekehrt eine Folge (xn ) mit M ∩ U1/n den im Satz genannten Eigenschaften gegeben, so gilt ist offenbar Uε (a)0 ∩ M 6= 0 für alle ε > 0. Satz 4.44 (Satz von Bolzano-Weierstraß für Mengen) Jede beschränkte unendliche Menge M in R oder C hat einen Häufungspunkt. Beweis. Da M als unendlich vorausgesetzt wurde, kann eine Folge paarweise verschiedener Punkte xn in M ausgewählt werden. Der Häufungspunkt dieser Folge ist nach aber ein Häufungspunkt von M . Für unbeschränkte reelle Zahlenfolgen führen wir schließlich die Werte +∞ und −∞ als uneigentliche Grenzwerte bzw. Häufungspunkte ein: Definition 4.45 Eine reelle Zahlenfolge (an ) heißt uneigentlich konvergent oder bestimmt divergent gegen +∞, wenn zu jeder (großen) Zahl K > 0 ein Index N ∈ N so existiert, dass |an | > K für alle n ≥ N gilt. In diesem Fall schreiben wir auch an → +∞ oder lim an = +∞. n→∞ Der Wert +∞ heißt ein Häufungspunkt von (an ), wenn eine Teilfolge (ank ) existiert, die uneigentlich konvergent gegen ∞ ist. Analog sind die Definitionen mit −∞ zu bilden. 4.5 Das Cauchysche Konvergenzkriterium 41 Aufgaben zu Abschnitt 4.4 1. Führen Sie den Beweis des Satzes von Bolzano-Weierstraß (4.39) für komplexe Zahlenfolgen aus. 2. Bestimmen Sie die Häufungspunkte der Folge ((−1)n e1/n ). 3. Man zeige, dass die nach folgender Vorschrift konstruierte Folge jede positive reelle Zahl als Häufungspunkt hat: Man trage die Brüche m/n in einer unendlichen zweidimensionalen Tabelle ein und bilde hieraus wie in Figur 8 eine Folge. 4. Man zeige: Für jede beschränkte Zahlenfolge (an ) gelten lim inf an = n→∞ lim sup an = n→∞ lim (inf ak ) n→∞ k≥n und lim (sup ak ) . n→∞ k≥n 5. Man zeige, dass jeder Punkt des Intervalls [−1, 1] ein Häufungspunkt der Folge an = sin(n) ist. 4.5 Das Cauchysche Konvergenzkriterium Kern dieses Abschnitts ist die Bereitstellung des fundamentalen Cauchyschen Konvergenzkriteriums. Der hierfür entscheidende Begriff wurde 1832 von A. Cauchy gefunden: Definition 4.46 Eine Zahlenfolge (an ) heißt eine Cauchy- oder Fundamentalfolge, wenn es zu jedem ε > 0 eine natürliche Zahl n0 = n0 (ε) derart gibt, dass für alle m, n ≥ n0 die Ungleichung |an − am | < ε besteht. Satz 4.47 Jede Cauchy-Folge ist beschränkt. Beweis. Zu ε = 1 sei n0 so gewählt, dass |an − am | ≤ 1 für alle m, n ≥ n0 gilt. Dann gilt für alle n ≥ n0 die Abschätzung |an | ≤ |an − an0 + an0 | ≤ |an − an0 | + |an0 | ≤ 1 + |an0 |. Setzt man K = max{|a1 |, . . . , |an0 |, 1 + |an0 |}, so folgt |an | ≤ K für alle n ∈ N. Satz 4.48 Jede konvergente Zahlenfolge ist eine Cauchy-Folge. Beweis. Es sei (an ) konvergent gegen a. Zu gegebenem ε > 0 existiert dann eine Zahl n0 so, dass |an − a| < ε/2 für alle n ≥ n0 gilt. Für beliebiges n, m ≥ n0 folgt dann |an − am | ≤ |an − a| + |a − am | < ε ε + =ε. 2 2 42 4 ZAHLENFOLGEN UND REIHEN Satz 4.49 (Cauchysches Konvergenzkriterium) Eine Zahlenfolge ist genau dann konvergent, wenn sie eine Cauchy-Folge ist. Beweis. Es bleibt zu zeigen, dass jede Cauchy-Folge konvergent ist. Es sei (xn ) eine Cauchy-Folge. Da Cauchy-Folgen beschränkt sind, hat (xn ) wegen des Satzes von BolzanoWeierstraß einen Häufungspunkt x∗ . Wir zeigen, dass x∗ sogar der Grenzwert von (xn ) ist. Dazu sei ε > 0 beliebig gegeben. Wir wählen ein n0 = n0 (ε) derart, dass |xn − xm | ≤ ε/2 für alle n, m ≥ n0 gilt. Da x∗ ein Häufungspunkt von (xn ) ist, existiert ein Folgenglied xn1 mit n1 ≥ n0 und |x∗ − xn1 | < ε/2. Hieraus folgt |xn − x∗ | ≤ |xn − xn1 | + |xn1 − x∗ | < ε ε + =ε 2 2 für alle n ≥ n0 (ε). Wir demonstrieren die Leistungsfähigkeit des Kriteriums an folgender Aussage. Satz 4.50 Es sei (ak ) eine beschränkte Zahlenfolge und es sei 0 < x < 1. Dann konvergiert die Folge (sn ) mit den Gliedern sn = n X ak x k . k=0 Beweis. Es sei K eine Schranke für (ak ) und es seien m > n ≥ 0 beliebig gegeben. Dann ist |sm − sn | ≤ m X k |ak | |x| ≤ K · k=n+1 m X k n+1 |x| = K · |x| m−n−1 X k=n+1 |x|k ≤ K · |x|n+1 · k=0 1 →0 1 − |x| für n → ∞. Also ist (sn ) eine Cauchy-Folge und daher konvergent in R. 1 Setzt man x = 10 und ist (ak ) eine Folge natürlicher Zahlen aus der Menge {0, 1, . . . , 9}, so bedeutet obiger Satz, dass eine formale Dezimalbruchentwicklung u = 0.a1 a2 a3 . . . auch als unendliche Reihe“ ” u = lim n→∞ n X k=1 −k ak 10 = ∞ X ak 10−k k=1 aufgefasst werden kann. Beispiel 4.51 Wir können erneut die Konvergenz der zu Beginn von Abschnitt 4.3 erwähnten Folge nachweisen. In der Tat gilt für m > n 0 < s m − sn = 1 1 1 2 − + −... ± ≤ → 0 für n → ∞ . n+1 n+2 m n+1 Also ist (sn ) eine Cauchy-Folge und daher konvergent. 4.6 Topologische Grundbegriffe 43 Aufgaben zu Abschnitt 4.5 1. Weisen Sie die Konvergenz der schon in Abschnitt 4.3 und Beispiel 4.34 erwähnten Folge (sn ) mit n X (−1)k sn = 2k + 1 k=0 (Leibnizreihe) erneut nach, indem Sie zeigen, dass (sn ) eine Cauchyfolge ist. 2. Wandeln Sie den periodischen Dezimalbruch a = 0, 123456789 in einen Bruch der Form a = m um. n 4.6 Topologische Grundbegriffe Die bisherigen Begriffsbildungen erlauben es, Punkte und Teilmengen von R bzw. C in ihren ,,Lagebeziehungenßueinander zu beschreiben. Das Hilfsmittel ist dabei der bereits mehrfach verwendete Umgebungsbegriff Uε (a). In diesem Abschnitt bezeiche E = R oder E = C. Definition 4.52 Es sei M ⊆ E eine beliebige Teilmenge von E. Eine Zahl a ∈ E heißt dann: a) ein innerer Punkt von M , wenn es eine Umgebung Uε (a) mit Uε (a) ⊆ M gibt. b) ein äußerer Punkt von M , wenn es eine Umgebung Uε (a) mit Uε (a) ∩ M = ∅ gibt. c) ein Randpunkt von M , wenn jede Umgebung Uε (a) sowohl Punkte aus M als auch Punkte aus dem Komplement M enthält. d) ein Häufungspunkt von M , wenn jede punktierte ε-Umgebung Uε0 (a) = Uε (a) \ {a} einen Punkt aus M enthält. Ein Punkt x ist genau dann ein innerer Punkt einer Menge M , wenn x ein äußerer Punkt des Komplements M = E \ M ist (Beweis?). Jeder innere Punkt einer Menge ist auch ein Häufungspunkt dieser Menge. Abbildung 5: Randpunkte, innere und äußere Punkte Definition 4.53 Eine Teilmenge M ⊆ E heißt a) offen, wenn jeder ihrer Punkte ein innerer Punkt ist. b) abgeschlossen, wenn das Komplement M = E \ M offen ist. 44 4 ZAHLENFOLGEN UND REIHEN Satz 4.54 Jede ε-Kugel Uε (x0 ) = {x ∈ E : |x − a| < ε} ist offen. Beweis. Übungsaufgabe. Abgeschlossene Mengen lassen sich wie folgt charakterisieren: Satz 4.55 Eine Menge M ⊂ E ist genau dann abgeschlossen, wenn sie alle ihre Häufungspunkte in E enthält. Beweis. Ein Häufungspunkt x von M kann kein innerer Punkt von M = E \ M sein. Wird daher M als abgeschlossen vorausgesetzt, so folgt x 6∈ M , also ist x ∈ M . Enthält umgekehrt die Menge M alle ihre Häufungspunkte, so gibt es zu jedem Punkt y 6∈ M eine ε-Umgebung mit Uε (y) ∩ M = ∅. Also ist y ein innerer Punkt von M = E \ M . Diese Menge M besteht daher nur aus inneren Punkten, sie ist also offen. Folglich ist M abgeschlossen. Definition 4.56 Für eine beliebige Menge M ⊆ E heißt die Vereinigung von M mit der Menge aller ihrer Häufungspunkte der Abschluss M a von M . Satz 4.57 Der Abschluss einer Menge M ist die kleinste abgeschlossene Menge, die M enthält. Insbesondere gilt M a = M aa . Beweis. Wir haben vor allem zu zeigen, dass M a abgeschlossen ist. Dazu sei x 6∈ M ein Häufungspunkt von M a . Dann existiert zu jedem ε > 0 ein Punkt y ∈ Uε0 (x) ∩ M a . Ist dabei bereits y ∈ M , so ergibt das y ∈ Uε0 (x)∩M . Im anderen Fall ist y aber zumindestens ein Häufungspunkt von M . Zu δ = ε − |x − y| > 0 existiert daher ein m ∈ M ∩ Uδ0 (y). Also ist |x − m| ≤ |x − y| + |y − m| < |x − y| + δ = ε. Das heißt m ∈ Uε0 (x). Also ist x ein Häufungspunkt von M , woraus x ∈ M a folgt. Ist schließlich A eine beliebige abgeschlossene Menge, die M enthält, so folgt aus Satz 4.55 die Inklusion M a ⊆ A. Häufig werden Vereinigungen oder Durchschnitte offener oder abgeschlossener Mengen zu bilden sein. Hierfür gilt der folgende Satz. Satz 4.58 a) Die Vereinigung beliebig vieler offener Mengen ist offen. b) Der Durchschnitt endlich vieler offener Mengen ist offen. c) Die Vereinigung endlich vieler abgeschlossener Mengen ist abgeschlossen. d) Der Durchschnitt beliebig vieler abgeschlossener Mengen ist abgeschlossen. Beweis. Es ist sehr leicht zu sehen, dass die Vereinigung offener Mengen nur aus inneren Punkten besteht. Ebenso leicht erkennt man, dass der Durchschnitt von zwei (und damit von endlich vielen) offenen Mengen wieder offen ist. Die Behauptungen c) und d) folgen dann aus a) und b) durch Betrachtung der Komplementärmengen und Verwendung der de Morganschen Formeln. Abzählbare Durchschnitte offener Mengen müssen nicht mehr offen sein. So ist beispielsweise die Menge \ 1 0, 1 + = (0, 1] n n∈N weder offen noch abgeschlossen. 4.7 Der Banachsche Fixpunktsatz 45 Definition 4.59 Eine Teilmenge M ⊆ E heißt (topologisch) dicht in E, wenn ihr Abschluss gleich E ist. Nach Satz 1.13 ist zum Beispiel die Menge Q der rationalen Zahlen (auch topologisch) dicht in R. Aufgaben zu Abschnitt 4.6 1. Beweisen Sie den Satz 4.54. 2. Für Teilmengen M1 , M2 von R oder C beweise man folgende Aussagen: a) M1aa = M1a , b) Aus M1 ⊆ M2 f olgt M1a ⊆ M2a , c) (M1 ∪ M2 )a = M1a ∪ M2a . 3. Es sei α > 0 eine reelle Zahl und es sei H = {m + nα : m, n ∈ Z} . Man zeige der Reihe nach: a) Ist α irrational, so hat H kein minimales positives Element (und umgekehrt).(Hinweis: Verwenden Sie, dass aus h1 , h2 ∈ H stets h1 ± h2 ∈ H folgt.) b) Ist α irrational, so ist H dicht in R. (Benutzen Sie a)). 4. Beweisen Sie: Sind ∅ = 6 A, B abgeschlossene, beschränkte und nichtleere Teilmengen von R oder C, so gibt es Punkte a0 ∈ A und b0 ∈ B mit der Eigenschaft |a0 − b0 | = dist(A, B) = inf{|a − b| : a ∈ A, b ∈ B}. 4.7 Der Banachsche Fixpunktsatz In R oder und C existiert ein sehr leistungsfähiges Verfahren zur näherungsweisen Lösung von Gleichungen. Konkrete Aufgabenstellungen sind beispielsweise die reellen Gleichungen ex = x3 oder auch cos(x) = x. Beide Gleichungen sind mit elementaren Umformungen nicht aufzulösen. Es sei also E = R oder E = C. Es seien f und g zwei Abbildungen von E in sich. Die Gleichung f (x) = 0 heißt dann eine Gleichung 1. Art, die Gleichung g(x) = x heißt Gleichung 2. Art oder auch Fixpunktgleichung. Beide Aufgabenstellungen sind äquivalent, da zum Beispiel durch Addition bzw. Subtraktion von x die eine Gleichung in die andere Gleichung überführt werden kann. Die Gleichung g(x) = x erweist sich dabei für die näherungsweise Lösung als zugänglicher. Rückt man nämlich den Abbildungscharakter von g ins Blickfeld, so kann eine Lösung der Gleichung g(x) = x als Fixpunkt der Funktion g gedeutet werden. Lösen der Gleichung bedeutet daher das Auffinden von Fixpunkten. In den im folgenden zu präzisierenden günstigen Fällen erweist sich dieser Fixpunkt als anziehend, d.h., er kann als Limes der iterativ gebildeten Folge xn+1 = g(xn ) gewonnen werden. Wir präzisieren diesen Umstand durch die folgende Definition. Definition 4.60 Es sei X eine Teilmenge von E. Eine Abbildung g : X → X heißt eine Kontraktion in X, wenn es eine Zahl 0 < q < 1 mit |g(x) − g(x0 )| ≤ q|x − x0 | gibt. für alle x, x0 ∈ X , 46 4 ZAHLENFOLGEN UND REIHEN Satz 4.61 (Banachscher Fixpunktsatz) Es sei X eine abgeschlossene Teilmenge von E und es sei g eine Kontraktion in X mit einer Zahl 0 < q < 1. Dann existiert in X genau eine Lösung x∗ der Gleichung g(x∗ ) = x∗ . Man erhält sie als Grenzwert der durch die Vorschrift xn+1 = g(xn ) gebildeten Folge mit beliebigem Startwert x0 ∈ X. Überdies gilt die Fehlerabschätzung |x∗ − xn | ≤ qn · |x1 − x0 |. 1−q Beweis. Zum Beweis der Einzigkeit nehmen wir an, dass zwei Lösungen g(x∗ ) = x∗ und g(x∗∗ ) = x∗∗ existieren. Die Kontraktionsbedingung ergibt |x∗ − x∗∗ | = |g(x∗ ) − g(x∗∗ )| ≤ q|x∗ − x∗∗ | , woraus wegen q < 1 die Gleichung |x∗ − x∗∗ | = 0 , also x∗ = x∗∗ folgt. Für den Existenzbeweis bilden wir eine Folge (xn ) nach der im Satz angegebenen Vorschrift. Dann ist |xn+1 − xn | = |g(xn ) − g(xn−1 )| ≤ q|xn − xn−1 | ≤ q 2 |xn−1 − xn−2 | ≤ . . . ≤ q n |x1 − x0 |. Hieraus folgt |xn+m+1 − xn | ≤ m X |xn+j+1 − xn+j | ≤ j=0 m X q n+j |x1 − x0 | ≤ q n j=0 1 |x1 − x0 | → 0 (∗). 1−q Also ist (xn ) eine Cauchy-Folge. Es sei x∗ = lim xn . Da X abgeschlossen ist, gilt x∗ ∈ X. n→∞ Wir zeigen g(x∗ ) = x∗ . Dazu sei ε > 0 beliebig vorgegeben. Dann existiert ein Index n0 mit |x∗ − xn | < 2ε für alle n ≥ n0 . Hieraus folgt |g(x∗ ) − x∗ | = |g(x∗ ) − g(xn0 ) + g(xn0 ) − x∗ | ≤ |g(x∗ ) − g(xn0 )| + |g(xn0 ) − x∗ | ε ε ≤ q|x∗ − xn0 | + |xn0 +1 − x∗ | < + = ε . 2 2 Da ε beliebig war, folgt g(x∗ ) = x∗ . Die Fehlerabschätzung ergibt sich aus der Ungleichung (∗) durch Grenzübergang m → ∞. Beispiel 4.62 Betrachten wir als erstes Beispiel die Gleichung cos(x) = x. Die Funktion g(x) = cos(x) bildet das Intervall X = [0, 1] in sich ab. Die Kontraktionseigenschaft von g auf X ergibt sich aus der folgenden Abschätzung, in der die Ungleichung | sin(t)| ≤ |t| und ein Additionstheorem für den Kosinus verwendet werden: | cos(x) − cos(x0 )| = |2 sin x + x0 x − x0 1 · sin | ≤ 2 · · sin 1 · |x − x0 | = sin 1 · |x − x0 |. 2 2 2 Wegen 0 < sin 1 < 1 liegt eine Kontraktion vor. Die Konstruktion der Iterationsfolge ist in Abbildung 6 veranschaulicht, numerisch ergibt sich x∗ = 0.74... als Lösung der Gleichung cos(x) = x. 4.7 Der Banachsche Fixpunktsatz 47 Abbildung 6: Iterationsfolge zur Lösung der Gleichung cos x = x. Beispiel 4.63 Als zweites Beispiel betrachten wir eine zur Berechnung von k-ten Wurzeln geeignete Kontraktion x=x+ a − xk , k 0<a≤1. Man kann zeigen, dass die Funktion k g(x) = x + a−x eine Abbildung des Ink a tervalls X = [ k , 1] in sich ist. Weiter ist 1 k k |g(x) − g(y)| = x − y − (x − y ) = |x − y| k a k−1 . < |x − y| · 1 − k 1 k−1 k−1 1 − (x + . . . + y ) k Also ist g eine Kontraktion mit q = 1 − (a/k)k−1 , und der Banachsche Fixpunktsatz liefert eine Lösung von a − xk = 0. Das hier benutzte Verfahren wird auch als vereinfachtes Newton-Verfahren bezeichnet. Für a = 1/2 und k = 2 und x0 = 0.6 ergibt sich p ∗ eine Näherungsfolge für x = 1/2 = 0, 707... gemäß der Werte in obiger Tabelle. Die Näherungsfolge hat die in Satz 4.61 vorausgesagte lineare Konvergenzgeschwindigkeit. Wir erinnern, dass die Iterationsfolge aus Kapitel 1 quadratisch konvergierte. Aufgaben zu Abschnitt 4.7 1. Man berechne den nach Folgerung 4.29 zu vermutenden dritten Schnittpunkt von y = x20 mit y = ex . (Hinweis. Transformieren Sie die Schnittpunktgleichung durch Logarithmieren in eine Fixpunktgleichung und zeigen Sie, dass die Funktion g(x) = 20 ln x eine Kontraktion auf dem Intervall [20 · ln 20, 202 ] ist. Iterieren Sie dann.) 48 5 5.1 5 ZAHLENREIHEN Zahlenreihen Begriffsbildung und Konvergenzkriterien Definition 5.1 Es sei (ak )k∈N eine Zahlenfolge. a) Unter der n-ten Partialsumme dieser Folge versteht man die Zahl s n = a0 + . . . + an = n X ak . k=0 b) Unter der unendlichen Reihe der Folge (an ) versteht man die Folge (sn )n∈N der Partialsummen, in Zeichen ! ∞ n X X ak = ak . k=0 k=0 n∈N Mit dieser Begriffsbildung wird die Reihenlehre auf die Theorie der Folgen zurückgeführt. Definition 5.2 Eine Reihe ∞ P ak heißt konvergent (mit Grenzwert s), wenn die zu- k=0 gehörige Folge der Partialsummen (sn )n∈N (gegen s) konvergiert. In diesem Fall benutzt man das Reihensymbol auch zur Bezeichnung des Grenzwertes, man schreibt also s= ∞ X ak = lim k=0 n→∞ n X ak . k=0 Diese Doppelbedeutung der Symbolik wird zu Verwechselungen keinen Anlass geben. Nach dem bisherigen ist die Reihenlehre ein Teilgebiet der Theorie der Folgen. Der nächste Satz zeigt aber, dass auch umgekehrt jede Folge als eine Reihe (die sogenannte Teleskopsumme) aufgefasst werden kann. Diese Dualität ist ein wichtiges beweistechnisches Hilfsmittel. Wir haben dies z.B. schon im Beweis zu Satz 4.61 ausgenutzt. Satz 5.3 Es sei (an )n∈N eine beliebige Folge und es sei bn = n P (ak+1 − ak ). Dann gilt: k=0 lim an = a genau dann, wenn n→∞ ∞ X (ak+1 − ak ) = a − a0 . k=0 Beweis. Für jedes a ∈ E gilt a − an+1 = a − (an+1 − an + an − + . . . − a0 + a0 ) = (a − a0 ) − bn , also |a − an+1 | = |(a − a0 ) − bn |. Hieraus folgt für n → ∞ die Behauptung. 5.1 Begriffsbildung und Konvergenzkriterien Beispiel 5.4 Es gilt ∞ X k=1 denn es ist n X k=1 n X 1 = k(k + 1) k=1 49 1 = 1, k(k + 1) 1 1 − k+1 k =1− 1 → 1. n+1 Definition 5.5 Unter einer geometrischen Reihe versteht man eine Reihe der Form ∞ X xk mit x ∈ C. k=0 Die Partialsummen der geometrischen Reihe wurden bereits in Satz 1.6 berechnet, es galt sn = n X k=0 xk = 1 − xn+1 . 1−x Dieser Ausdruck konvergiert genau dann, wenn |x| < 1 ist, und der Grenzwert ist dann 1 . Das ergibt die wichtige Formel 1−x ∞ P k=0 xk = 1 für |x| < 1. 1−x Beispiel 5.6 Beispiel einer divergenten Reihe ist die harmonische Reihe: ∞ 1 P = ∞. k=1 k Die Divergenz erkennt man aus der Abschätzung 1 1 1 1 1 1 1 s 2n = 1 + + + + + ... + + ... + + ... + n 2 3 4 5 8 2n−1 − 1 2 n−1 1 2 4 2 n ≥ 1 + + + + ... + n ≥ . 2 4 8 2 2 Daher ist die Teilfolge (s2n ) unbeschränkt, also nicht konvergent. Aus den Konvergenzkriterien für Folgen gewinnt man entsprechende Konvergenzkriterien für Reihen: Satz 5.7 (Ein notwendiges Konvergenzkriterium) Wenn ∞ P ak konvergent ist, k=1 dann ist (ak ) eine Nullfolge. (Das Beispiel der harmonischen Reihe zeigt, dass die Umkehrung obiger Aussage nicht richtig ist.) 50 5 ZAHLENREIHEN Beweis. Falls (sn ) konvergent ist, so ist (sn ) auch eine Cauchy-Folge. Hieraus folgt |an | = |sn − sn−1 | → 0 für n → ∞. Also ist (an ) eine Nullfolge. Satz 5.8 (Cauchysches Konvergenzkriterium) ∞ X k=1 n+p X ak ist konvergent ⇐⇒ ∀ε > 0 ∃n0 = n0 (ε) ∀p ≥ 1 ∀n ≥ n0 : ak < ε. k=n+1 Beweis. Es ist n+p n+p n X X X ak . ak − ak = |sn+p − sn | = k=1 k=n+1 k=1 Die im Satz angegebene Bedingung bedeutet daher, dass (sn ) eine Cauchy-Folge ist. Dies ist in R oder C aber mit der Konvergenz der Folge äquivalent. Das Cauchy-Kriterium für Reihen findet z.B. seine Anwendung beim Majorantenkriterium, das wir in Abschnitt 5.3 herleiten werden. Daher betrachten wir an dieser Stelle keine weiteren Beispiele. P P Satz 5.9 (Grenzwertsätze) Sind dieP Reihen ak und P bk konvergent und ist λ eine Zahl, so konvergieren auch die Reihen (ak ± bk ) und λak und es gelten ∞ X (ak ± bk ) = k=0 ∞ X ak ± k=0 ∞ X bk und k=0 ∞ X λak = λ k=0 ∞ X ak . k=0 Beweis. Für die zugehörigen Partialsummen gilt n X (ak ± bk ) = k=0 n X k=0 ak ± n X bk . k=0 Daher folgt die Behauptung aus den entsprechenden Grenzwertsätzen für Folgen. Produkte von Reihen verhalten sich wesentlich komplizierter, wir kommen in Satz 5.25 hierauf zurück. Abschließend betrachten wir Reihen mit reellen Gliedern. Satz 5.10 (Bolzano-Kriterium für Reihen mit nichtnegativen Gliedern) Es ∞ P gelte an ≥ 0 für alle n ∈ N. Dann an genau dann wenn die zugehörige Folge (sn ) der n=1 Partialsummen beschränkt ist. Beweis. Wegen sn+1 = sn + an+1 ≥ sn ist die Partialsummenfolge (sn ) monoton wachsend. Die Beschränktheit von (sn ) ist somit nach Bolzanos Kriterium 4.24 mit der Konvergenz von (sn ) äquivalent. 5.1 Begriffsbildung und Konvergenzkriterien 51 Beispiel 5.11 Als Anwendung untersuchen wir die sogenannten Dirichlet-Reihen und beweisen ∞ X 1 konvergent für 1 < α < ∞ ζ(α) = ist . α divergent für 0 < α ≤ 1 k k=1 Die Funktion ζ = ζ(α) heißt auch Riemannsche Zeta-Funktion. Wir beginnen nun mit dem Nachweis der Divergenzbehauptung. Für α = 1 erhalten wir die harmonische Reihe, deren Divergenz wir bereits nkennen. Für 0 < α < 1 gilt aber P 1 1 ≤ k1α gilt, also muß auch die Partialsummenfolge unbeschränkt und daher k kα k=1 divergent sein. n∈N Für α = 2 folgt n n n X X X 1 1 1 =1+ ≤1+ ≤1+1=2 2 2 k k k(k + 1) k=1 k=2 k=1 nach Beispiel 5.4. Daher ist die zugehörige Partialsummenfolge beschränkt, und die Dirichlet-Reihe ist für α = 2 konvergent. Für α ≥ 2 ist die Dirichlet-Reihe wegen k1α ≤ k12 dann ebenfalls konvergent. Es bleibt die Lücke 1 < α < 2 zu untersuchen. Das gelingt mit einem Vorgriff auf die Integralrechnung (siehe Satz 8.41). Es ist nämlich (Figur 7): n Zn n X 1 1 x1−α 1 1 = ≤ dx = (n1−α − 1) ≤ α α k x 1−α 1 1−α α−1 k=2 1 für alle α > 1. Also ist n X 1 α 1 ≤ 1 + = . α k α − 1 α − 1 k=1 Die Partialsummenfolge ist daher beschränkt, also konvergent. Abbildung 7: Cauchys Integraltest Die soeben angewandte Methode eines Konvergenznachweises wird auch Cauchyscher Integraltest genannt. Satz 5.12 (Verdichtungskriterium) Es sei an & 0. Dann gilt: ∞ P n=0 an konvergiert genau dann, wenn ∞ P k=0 a2k 2k konvergiert. 52 5 ZAHLENREIHEN Beweis. Wegen an & 0 gilt 1 a2k · 2k = a2k · 2k−1 ≤ a2k−1 + . . . + a2k −1 ≤ a2k−1 · 2k−1 2 für alle k ∈ N. Hieraus folgt N N 2X −1 N X 1X k a2 k · 2 ≤ an ≤ a2k−1 · 2k−1 . 2 k=1 k=1 k=1 Somit sind die Partialsummenfolgen der beiden Reihen entweder beide beschränkt oder beide unbeschränkt. Die Behauptung des Satzs folgt nun aus dem Bolzano-Kriterium für Reihen mit nichtnegativen Gliedern. Beispiel 5.13 Mit Hilfe dieses Kriteriums lässt sich erneut die Konvergenz der DirichletReihen untersuchen. Wegen 1 · 2k = 2k(1−α) (2k )α ist X 1 X k 2k(1−α) , · 2 = k )α (2 k k und diese geometrische Reihe konvergiert genau dann, wenn 1 − α < 0 also α > 1 ist. Dies besätigt das bereits erhaltene Ergebnis. Aufgaben zu Abschnitt 5.1 1. Man zeige ∞ P n=1 1 qn = q q−1 für |q| < 1. 2. Rechtfertigung der Dezimalbruchentwicklung (s.a. Satz 4.50) Es sei (an ) eine Folge von Zahlen aus der Menge {0, 1, 2, . . . , 9} (die Ziffern in der Dezimalentwick∞ P lung). Man beweise die Konvergenz der Reihe ak · 10−k mittels: k=1 a) dem Cauchykriterium (s.o.) b) Satz 5.10. 3. Man zeige unter Verwendung des Cauchy-Kriteriums: Ist (an ) eine beschränkte Zah∞ P an z n . lenfolge und ist z ∈ C mit |z| < 1 eine beliebige Zahl, so konvergiert n=0 4. Für welche s ∈ R konvergiert die Reihe ∞ X k=2 1 ? n · (ln k)s Hinweis: Verwenden Sie das Verdichtungskriterium. 5. Finden Sie eine geschlossene Formel für die Partialsummen der folgenden Reihe und berechnen Sie deren Grenzwert: ∞ X 1 . k · (k + 1) · (k + 2) k=1 Hinweis: Verwenden Sie eine Partialbruchzerlegung. 5.2 Alternierende Reihen in R 5.2 53 Alternierende Reihen in R ∞ P Definition 5.14 Eine Reihe an heißt alternierend, wenn an · an+1 < 0 für alle n ∈ N n=0 gilt. Die bereits wiederholt untersuchte Leibnizreihe ∞ P (−1)n n=0 1 ist ein Beispiel für eine 2n + 1 alternierende Reihe. Für solche Reihen gilt das: Satz 5.15 (Leibnizsches Konvergenzkriterium) Jede alternierende Reihe ∞ P an mit n=0 |an | & 0 ist konvergent, und es gilt |s − sn | ≤ |an+1 | für alle n ∈ N. Dabei bezeichnet (sn ) die Folge der Partialsummen. Beweis. Ohne Beschränkung der Allgemeinheit sei a0 > 0. Für alle n ∈ N gilt dann a2n > 0 > a2n+1 . Aus den nachfolgenden Überlegungen folgt, dass (s2n+1 |sn ) eine Intervallschachtelung ist: s2n+1 s2n+1 s2n+2 s2n − s2n+1 = ≤ = = s2n + a2n+1 < s2n , s2n+1 + a2n+2 + a2n+3 = s2n+3 , s2n + a2n+1 + a2n+2 ≤ s2n und −a2n+1 → 0 . Nach dem Prinzip der Intervallschachtelung konvergieren daher die Folgen (s2n+1 ) und (s2n ) gegen den gleichen Wert s. Also konvergiert auch (sn ) gegen s. Schließlich ist 0 ≤ s2k − s 0 ≤ s − s2k+1 ≤ s2k − s2k+1 ≤ s2k+2 − s2k+1 = |a2k+1 |, = a2k+2 . Hieraus folgt 0 ≤ |s − sn | ≤ |an+1 | für alle n ∈ N. Das Leibniz-Kriterium ergibt sofort die Konvergenz der nachfolgenden Beispiele, die angegebenen Grenzwerte sind mit diesen Mitteln aber noch nicht zu berechnen. Zu bemerken ist auch, dass die angegebenen Reihen sehr langsam konvergieren: ∞ X (−1)n n=0 ∞ X n=0 5.3 1 n+1 (−1)n 1 2n + 1 (= ln 2) , (= π ). 4 Absolut konvergente Reihen in R und C In diesem Abschnitt werden wir einige sehr einfach zu handhabende hinreichende Konvergenzkriterien kennen lernen. 54 5 ZAHLENREIHEN Definition 5.16 Eine Reihe vergiert. P ak heißt absolut konvergent, wenn die Reihe P |ak | kon- Satz 5.17 Jede absolut konvergente Reihe ist auch konvergent. Beweis. Jede absolut konvergente Reihe erfüllt das Cauchy-Kriterium n+m n+m X X ak ≤ |ak | → 0 für n → ∞ k=n k=n und ist daher konvergent. Es sei bemerkt, dass es konvergente Reihen gibt, die nicht absolut konvergent sind. Die ∞ P 1 Reihe (−1)k+1 ist ein Beispiel dafür. k k=1 P Satz 5.18 (Majorantenkriterium) P Eine Reihe ak ist genau dann absolut konvergent, wenn es eine konvergente Reihe ck nichtnegativer reeller Zahlen ck so gibt, dass P |a ck heißt eine konvergente Majorante für Pk | ≤ ck für (fast) alle k ∈ N gilt. (Die Reihe ak .) P P Beweis. Ist ak absolut konvergent, so ist die Reihe |ak | selbst als konvergente MaP jorante geeignet. Gilt umgekehrt ck , so ist P P P |ak | ≤ ck mit einer konvergenten Reihe |ak | ≤ ck < ∞, also ist |ak | konvergent nach dem Bolzanokriterium Satz 5.10. Zur Anwendung dieses Majorantenkriteriums benötigt man einen Vorrat an reellen konvergenten Reihen mit positiven Gliedern. Häufig sind dafür geometrische Reihen geeignet. Das führt auf die folgenden beiden Spezialisierungen des Majorantenkriteriums: Satz 5.19 (Das Wurzelkriterium) Falls es eine Konstante q mit p 0 ≤ q < 1 und k |ak | ≤ q für fast alle k ∈ N P gibt, sopist ak absolut konvergent. Die Bedingung ist sicher dann erfüllt, wenn k lim sup |ak | < 1 ist. k→∞ Beweis. Unter den Voraussetzungen des Satzes ist die Reihe P ak geeignet. P q k als Majorantenreihe für Satz 5.20 (Das Quotientenkriterium) Falls es eine Konstante q mit 0 ≤ q < 1 und gibt, so ist P ak absolut konvergent. |ak+1 | ≤ q für fast alle k ∈ N |ak | 5.3 Absolut konvergente Reihen in R und C 55 Beweis. Ohne Beschränkung der Allgemeinheit gelte obige Ungleichung für alle k ∈ N. Durch wiederholte Anwendung folgt |ak | |ak−1 | |a1 | |ak | = · · ... · ≤ qk . |a0 | |ak−1 | |ak−2 | |a0 | P P Daher ist |ak | ≤ |a0 | · q k , und |a0 |q k ist eine konvergente Majorante für an . Beispiel 5.21 Die Reihe ∞ 1 P ist konvergent, denn es gilt k=0 k! |ak+1 | k! 1 = = →0. |ak | (k + 1)! k+1 Wir wenden uns jetzt der Frage zu, ob der Wert einer Reihe von Umordnungen der Reihenglieder unbeeinflußt bleibt. Für endliche Summen ist das wegen des Kommutativund Assoziativgesetzes selbstverständlich, und wir werden sehen, dass auch absolut konvergente Reihen diese Eigenschaft haben. Es gibt aber auch andere Situationen: Beispiel 5.22 Das Beispiel der konvergenten Reihe s= ∞ X (−1)k k=0 k+1 =1− 1 1 1 + − + −... 2 3 4 zeigt, dass Umordnungen die Konvergenz zerstören und Grenzwerte verändern können. Dazu ordnen wir die Reihenglieder {1, − 21 , 13 , − 14 , . . .} neu an. Wir setzen also 1 1 1 + − + − . . . und 2 3 4 1 1 1 1 1 1 = 1 − − + − − + − − + − − +... 2 4 3 6 8 5 1 1 1 1 1 = 1− − + − − + ... 2 4 3 6 8 1 1 1 1 1 1 1 1 1 = − + − + −... = 1 − + − + − . . . = s 6= s. 2 4 6 8 2 2 3 4 2 s = 1− s0 Man kann überdies zeigen, dass zu jeder(!) reellen Zahl x eine Umordnung obiger Reihe mit Grenzwert x existiert (Riemannscher Umordnungssatz). Derartig gewarnt suchen wir nun nach positiven Aussagen. Definition 5.23 Unter einer UmordnungPoder Permutation der Menge N verstehen wir eine Bijektion p : N → N. Eine Reihe P ak heißt unbedingt konvergent, wenn Pfür jede Permutation p von N auch die Reihe ap(k) gegen den gleichen Grenzwert wie ak konvergiert. 56 5 ZAHLENREIHEN Satz 5.24 (Satz von Riemann) Für Zahlenreihen äquivalent: 1. Die Reihe P P ak sind folgende Bedingungen ak ist absolut konvergent. 2. Für jede Folge (σk ) von Zahlen σk ∈ {0, 1} ist die Reihe reihenkonvergenz) P 3. Die Reihe ak ist unbedingt konvergent. P σk ak konvergent. (Teil- Beweis. Wir betrachten zunächst nur reelle Reihen. P (1 ⇒ 3) Es sei ak eine absolut konvergent. Zum Beweis von 3) genügt es, die Bedingung n n X X ak − ap(k) = 0 (∗) lim n→∞ k=0 k=0 für jede Permutation p von N zu zeigen. Es sei ε > 0 gegeben. Nach der vorausgesetzten absoluten Konvergenz existiert eine Zahl N = N (ε) derart, dass m X |ak | < ε für alle m ≥ N k=N gilt. Da p eine Permutation ist, existiert eine Zahl N1 ≥ N derart, dass {0, 1, . . . , N } ⊆ {p(0), . . . , p(N1 )} gilt. Für festes n ≥ N1 sei nun n∗ = max{n, p(0), . . . , p(n)}. Dann folgt n n X X ak − ap(k) ≤ |aN +1 | + . . . + |an∗ | < ε . k=0 k=0 Damit ist (∗) bewiesen. (3 ⇒ 2) Wir führen diesen Beweis indirekt und nehmen P das Gegenteil an. Dann existiert eine Folge (σk ) von Zahlen σk ∈ {0, 1} derart, dass σk xk nicht konvergiert. Nach dem Cauchy-Kriterium für Reihen bedeutet das R X ∃ε > 0 ∀n ∃r > n ∃R > r : σk ak ≥ ε. k=r Daher kann man induktiv zwei Folgen (rn ) und (Rn ) mit X Rj r1 < R1 < r2 < R2 < r3 < R3 < . . . und σk ak ≥ ε für alle j ∈ N k=rj bilden. Nun konstruieren wir eine Permutation p von N auf folgende Weise. Wir zerlegen die Intervalle Ij = [rj , Rj ] in die Mengen in die Mengen Ij0 = {k ∈ Ij : σk = 1} und Ij00 = {k ∈ Ij : σk = 0}. Wir wählen eine Bijektion pj : Ij → Ij derart, dass die Elemente 5.3 Absolut konvergente Reihen in R und C 57 von Ij0 vor die Elemente von Ij00 gesetzt werden. Hieraus konstruieren wir p : N → N auf folgende Weise: ∞ S n für n ∈ / Ij , p(n) = j=1 pj (n) für n ∈ Ij . Es seien mj die Anzahl der Elemente von Ij0 . Nach Konstruktion von p gilt dann rj +m rj +mj −1 Rj j −1 X X X = = >ε a σ a σ a k k k k p(k) k=rj k=rj k=rj P für alle k ∈ N. Daher erfüllt die Reihe ap(k) kein Cauchy-Kriterium und kann folglich nicht konvergieren. P (2 ⇒ 1) Die Reihe ak sei teilreihenkonvergent. Wir setzen 0 für ak < 0, 1 für ak < 0, σk = bzw. τk = 1 sonst 0 sonst. Nach Voraussetzung konvergieren die Reihen X |ak | = X P σk ak und σk ak − X P τk ak , und wegen τ k ak P konvergiert auch |ak |. P Nun sei zk eine komplexe Reihe P und es seien ak = Re(zk ) und bk = Im(zk ). Wegen P |ak |, |b | ≤ |z | ≤ |a | + |b | ist z genau dann absolut konvergent, wenn dies auf ak k k k k k P und bk zutrifft. Damit ist der komplexe Fall auf den reellen zurückgeführt. Abschließend untersuchen wir Produkte von Reihen. Für endliche Summen gilt nach den einschlägigen Gesetzen (Distributiv- und Assoziativgesetz) bekanntlich die Formel ! m ! n n m X X X X ai bj = ai b j , i=0 j=0 i=0 j=0 das Produkt zweier P P Summen ist also die Summe aller möglichen Produkte ai bj der Glieder. Sind an und bn unendliche Reihen, so hat man daher zunächst alle Produkte der Form ai bj zu bilden. Sie lassen sich zweckmäßig in einer unendlichen Tabelle (Matrix) notieren: a0 a1 a2 a3 .. . b0 a0 b 0 a1 b 0 a2 b 0 a3 b 0 b1 a0 b 1 a1 b 1 a2 b 1 a3 b 1 b2 a0 b 2 a1 b 2 a2 b 2 a3 b 2 b3 a0 b 3 a1 b 3 a2 b 3 a3 b 3 ... ... ... ... ... ... ... ... ... ... 58 5 ZAHLENREIHEN Abbildung 8: Anordnung nach Dreiecken bzw. Quadraten Diese Produkte ai bj kann man auf verschiedenste Weisen zu einer Folge anordnen. Jedesmal wird man eine andere Partialsummenfolge erhalten, und die Konvergenz dieser Reihen ist zunächst offen (s. Aufgabe 2 als Gegenbeispiel). Häufig finden die folgenden beiden Summationsvorschriften Anwendung (z.B. in Satz 5.25): Summation nach Dreiecken: (Cauchysche Produktreihe) Hierunter versteht man die Partialsummenfolge l n X X ak bl−k ). ( Sn = (s. Figur 8) l=0 k=0 Summation nach Quadraten: Darunter versteht man die Partialsummenfolge sn = n X n X ai · b j = i=0 j=0 n X ai · i=0 n X bj . (s. Figur 8) j=0 Für absolut konvergente Reihen gilt nun der wichtige: P P Satz 5.25 (Multiplikationssatz) Sind an und bn absolut konvergente Zahlenreihen, so ist die Reihe aller Produkte ai bj in beliebiger Reihenfolge absolut konvergent und P P ihr Reihenwert ist das Produkt der Werte von an und bn . Insbesondere gilt ∞ X ai · i=0 ∞ X bj = ∞ n X X n=0 j=0 ak bn−k . k=0 Beweis. Die Aussage des Satzes bedeutet präzisiert, dass für jede Bijektion h : N → N × N vermöge k 7→ h(k) = (i(k), j(k)) von N auf die Menge N × N aller Indexpaare die Reihe ∞ X ai(k) bj(k) k=0 absolut konvergiert und dass ihr Wert gleich dem Produkt der gegebenen Reihen ist. Nach Voraussetzung konvergieren α= ∞ X i=0 |ai | und β = ∞ X |bj | . j=0 Zu jeder Zahl n ∈ N lässt sich nun eine Zahl N ∈ N so finden, dass {h(0), . . . , h(n)} ⊆ {0, . . . , N } × {0, . . . , N } 5.4 Potenzreihen 59 gilt. Dann ist aber n X |ai(k) bj(k) | ≤ N X N X |ar · bs | = r=0 s=0 k=0 N X |ar | · N X r=0 |bs | ≤ αβ < ∞. s=0 Das zeigt die absolute Konvergenz der Reihe. Daher ist die Reihe auch unbedingt konvergent, und wir können den Grenzwert durch Summation nach Rechtecken ausrechnen. Hierfür gilt aber ! n n n n X X X X lim sn = lim ai · bj = lim ai · lim bj . n→∞ n→∞ i=0 j=0 n→∞ n→∞ i=0 j=0 Aufgaben zu Abschnitt 5.3 1. Zeigen Sie die Konvergenz der folgenden Reihen: ∞ ∞ √ ∞ ∞ X X X X k s! j 10j a) , b) , c) , d) , j s 2 k! s (2j + 1)! s=0 j=0 j=0 k=0 e) ∞ X k2 . (2k)! k=0 ∞ X (−1)k √ 2. Man zeige, dass die Reihe konvergiert, dass aber das Cauchy-Produkt k+1 k=0 dieser Reihe mit sich selbst divergent ist. ∞ ∞ ∞ X X 1 X 1 2r 3. Beweisen Sie die Formel · = . j! k=0 k! r! r=0 j=0 4. Beweisen Sie in Ergänzung zum Wurzelkriterium (Satz 5.19) das folgende p P ak . Divergenzkriterium: Aus lim inf n |an | > 1 folgt die Divergenz der Reihe n→∞ 5. Geben Sie eine konvergente und eine divergente Reihe 5.4 P ak mit lim k→∞ p k |ak | = 1 an. Potenzreihen Definition 5.26 Eine reelle bzw. komplexe Potenzreihe ist eine Reihe der Form f (x) = ∞ X cn (x − x0 )n mit cn , x0 ∈ R bzw. cn , x0 ∈ C. n=0 Dabei heißen x0 der Mittelpunkt und die cn die Koeffizienten der Potenzreihe. In vielen Anwendungen wird x0 = 0 sein. Die reelle bzw. komplexe Variable x kann als freier Parameter betrachtet werden. Potenzreihen sind also Verallgemeinerungen von Polynomen in x. Unter dem Konvergenzbereich der Reihe versteht man die Menge n o X B = x ∈ R bzw. C : cn (x − x0 )n konvergiert . Diese Menge ist durch ein Wechselspiel der cn mit den Werten |x − x0 | bestimmt. Der folgende Satz charakterisiert diesen Konvergenzbereich genauer: 60 5 ZAHLENREIHEN P Satz 5.27 (Satz von Cauchy-Hadamard) Es sei cn (x − x0 )n eine Potenzreihe in C und es seien −1 für 0 < L < ∞ L p ∞ für L = 0 L = lim sup n |cn | und R = n→∞ 0 für L = ∞. Dann ist die Potenzreihe im Innern der Kreisscheibe mit Mittelpunkt R absolut konvergent und außerhalb dieses Kreises divergent. Es gilt also {x ∈ C : |x − x0 | < R} ⊆ B ⊆ {x ∈ C : |x − x0 | ≤ R}. Reihen mit R = ∞ heißen beständig konvergent, Reihen mit R = 0 heißen nirgends konvergent. Die Zahl R heißt der Konvergenzkreisradius. Im reellen Fall gilt entsprechend {x ∈ R : |x − x0 | < R} ⊆ B ⊆ {x ∈ R : |x − x0 | ≤ R}, der Konvergenzbereich ist also ein Intervall. Beweis. Wir wenden das Wurzelkriterium an und setzen p p q = lim sup n |cn (x − x0 )n | = |x − x0 | · lim sup n |cn | = |x − x0 | · L. n→∞ n→∞ Sei zunächst 0 < L < ∞. Für |x − x0 | < R = L−1 ist q < 1, die Reihe ist also absolut konvergent. Im Fall |x − x0 | > R = L−1 folgt q > 1 und somit die Divergenz der Reihe. Die Randfälle L = 0 und L = ∞ sind ebenso leicht einzusehen. Für die Punkte auf dem Kreisrand können mittels dieses Kriteriums keine Konvergenzaussagen gemacht werden. Beispielsweise ist für die drei Reihen X 1 X X1 xn , xn , xn , n n2 der Konvergenzradius R = 1, das Verhalten auf dem Rande ist aber bei den drei Reihen sehr unterschiedlich. (Wie nämlich ?) ∞ xn √ P n Beispiel 5.28 Für die Reihe ist L = lim 2−n = 12 , also R = 2. Die Reihe n n=0 2 konvergiert daher zumindestens im Innern des Kreises {x : |x| < 2}. Für |x| ≥ 2 ist die xn Reihe divergent, denn n ist dann keine Nullfolge. 2 Gelegentlich ist die Berechnung des Konvergenzradius mittels des Quotientenkriteriums einfacher. Satz 5.29 Ist P cn (x − x0 )n eine Potenzreihe und existiert |cn+1 | , n→∞ |cn | l = lim so gilt R = l−1 . 5.5 Exponential- und trigonometrische Funktionen 61 Beweis. Für |x − x0 | < l−1 gilt |cn+1 (x − x0 )n+1 | = |x − x0 | · l < 1, lim n→∞ |cn (x − x0 )n | also ist die Reihe für dieses x absolut konvergent. Das zeigt l−1 ≤ R. Entsprechend folgt aus |x − x0 | > l−1 die Divergenz der Reihe, daher ist l−1 ≥ R . Das zeigt l−1 = R. Aufgaben zu Abschnitt 5.4 1. Man bestimme die Konvergenzbereiche für die folgenden Potenzreihen: ∞ X ∞ X n (x − 2) , n=0 5.5 n!x , n=0 ∞ X (−1)n+1 xn , n n=n 1 n ∞ X xn n=0 ∞ X (x + 3)n , n2 n=n 1 nn , ∞ X in xn . n=0 Exponential- und trigonometrische Funktionen Wir nutzen nun Potenzreihen zur Definition bzw. Fortsetzung klassischer reeller Funktionen in das Komplexe und beginnen dabei mit der Exponentialfunktion. Satz 5.30 Durch die Gleichung exp(x) = ∞ X xk k=0 k! wird auf C eine Funktion definiert, die die folgende Funktionalgleichung erfüllt: exp(x + y) = exp(x) · exp(y) Beweis. Es ist für alle x, y ∈ C cn+1 n! 1 = lim = lim =0. L = lim n→∞ cn n→∞ (n + 1)! n→∞ n + 1 Daher ist die obige Potenzreihe auf ganz C absolut konvergent. Wir rechnen nun unter Verwendung der Cauchyschen Produktreihe und der binomischen Formel die Gültigkeit der Funktionalgleichung nach: ! ! ! ∞ ∞ ∞ n X X X X xj yk xn−k y k exp(x) · exp(y) = · = j! k! (n − k)! k! n=0 j=0 k=0 k=0 ∞ n ∞ X 1 X n n−k k X 1 = x y = (x + y)n = exp(x + y). n! k n! n=0 n=0 k=0 62 5 ZAHLENREIHEN 5.31 (Hilfssatz:) Für x ∈ R gelten exp(x) ≥ 0 und exp x n = p n exp(x). Beweis. Nach Satz 5.30 gilt für alle x ∈ R die Gleichung x n x x x x exp = exp · . . . · exp = exp + ... + = exp(x). n n n n n x 2 Speziell ist ferner exp(x) = exp ≥0 2 Satz 5.32 (Die Reihendarstellung der Exponentialfunktion) Für alle x ∈ R gilt ex = exp(x) = X xn n! . Beweis. Wegen Satz 4.30 und Hilfssatz 5.31 ist x p ln(exp(x)) = lim n( n exp(x) − 1) = lim n exp −1 n→∞ n→∞ n ∞ ∞ X 1 X 1 xk 1 xk = x + lim = x + 0 = x. = lim n n→∞ n→∞ n k! nk k! nk−2 k=1 k=2 Dabei haben wir noch folgende Abschätzung benutzt: ∞ ∞ X k 1 x X 1 |x|k ≤ exp(|x|) < ∞. ≤ k! nk−2 k! k=2 k=2 Definition 5.33 (Die komplexe Exponentialfunktion) Durch die Formel ez = exp(z) = ∞ X zk k=0 k! , z ∈ C, wird die reelle Exponentialfunktion in das Komplexe fortgesetzt. 5.34 (Die Berechnung der Zahl e) Für x = 1 ergibt sich aus Satz 5.32 die Formel ∞ X 1 e= , k! k=0 die zur Berechnung von e wegen der schnellen Konvergenz sehr gut geeignet ist. Für die n−te Partialsumme sn ergibt sich nämlich der kleine Fehler ∞ X 1 1 1 1 |e − sn | = = 1+ + + ... k! (n + 1)! (n + 2) (n + 2)(n + 3) k=n+1 1 1 1 e 3 ≤ 1 + + + ... ≤ ≤ . (n + 1)! 2! 3! (n + 1)! (n + 1)! 5.5 Exponential- und trigonometrische Funktionen Also ist z.B. |e − s9 | ≤ 63 3 ≤ 10−6 . 10! Das zeigt e = s9 ± 10−6 = 2, 718281 ± 10−6 . Folgerung 5.35 Die Zahl e ist irrational. Beweis. Angenommen, es gäbe zwei natürliche Zahlen p, q > 1 mit e = p/q. Dann ist q ∞ X p X 1 1 1 1 1 q −1 1 1 1 0< − = ≤ · + 2 + ... = · . = · −1 q k=0 k! k=q+1 k! q! q q q! 1 − q q! q − 1 Die Multiplikation mit q! ergibt q X q! 1 0 < p (q − 1)! − ≤ , k! q−1 k=0 aber diese Ungleichung steht im Widerspruch dazu, dass die linksstehende Differenz ganzzahlig und positiv ist. Folgerung 5.36 (Schwache Stirling-Formel) Für alle natürlichen Zahlen n gilt: n n e ≤ n! ≤ nn . Beweis. Die rechte Ungleichung folgt aus n! = 1 · 2 · . . . · n ≤ nn , die linke aus en = ∞ X nk nn n n n n ≥ , also n! ≥ n = . k! n! e e k=0 Unter Verwendung der Formel nn = en ln n lässt sich obige Ungleichung auch in der Form en(ln n−1) ≤ n! ≤ en·ln n schreiben. Die Fakultät wächst also hyperexponentiell. Die Ungleichung ist zur Abschätzung des Wachstums der Fakultätsfunktion nützlich. Für n = 1000 ergibt sich z.B. aus 1000 1000 2000 1000 10 = 100 ≤ ≤ 1000! ≤ 10001000 = 103000 e die Abschätzung 102000 ≤ 1000! ≤ 103000 . Die Formel lässt sich noch verfeinern und führt dann zur sogenannten Stirlingschen Formel. 64 5 ZAHLENREIHEN Definition 5.37 Unabhängig von geometrischen Zusammenhängen definieren wir die beiden trigonometrischen Funktionen ∞ X (−1)k 2k+1 sin z = z (2k + 1)! k=0 und cos z = ∞ X (−1)k k=0 (2k)! z 2k für z ∈ C. Man sieht wie im Beweis zu Satz 5.30, dass beide Reihen beständig konvergent sind. eiz = cos z + i sin z. Satz 5.38 (Die Eulersche Formel) Für alle z ∈ C gilt: Beweis. Es ist e iz = ∞ X (iz)k k=0 k! = ∞ X (iz)2k k=0 ∞ ∞ ∞ X X X (iz)2k+1 (−1)k 2k (−1)k 2k+1 + = z +i z (2k)! (2k + 1)! k=0 (2k)! (2k + 1)! k=0 k=0 = cos z + i sin z. Die Eulersche Formel zeigt den engen Zusammenhang zwischen der Exponentialfunktion und den trigonometrischen Funktionen, der sich allerdings erst durch die Betrachtung im Komplexen offenbart. Als erste Anwendung der Eulerschen Formel beweisen wir die folgenden Eigenschaften der Sinus- und Kosinusfunktion: Satz 5.39 Für alle x, y ∈ C gelten: a) sin 0 = 0, cos 0 = 1. b) sin(−x) = − sin x und cos(−x) = cos x, c) sin(x ± y) = sin x cos y ± cos x sin y, d) cos(x ± y) = cos x cos y ∓ sin x sin y. e) cos2 x + sin2 x = 1, f ) Für reelles x ∈ R gelten | sin x|, | cos x| ≤ 1. (Anfangswerte) (ungerade/gerade Funktion) (Additionstheorem) (Additionstheorem) (Satz des Pythagoras) (Beschränktheit im Reellen) Beweis. Die Formeln a) und b) ergeben sich direkt aus der Reihendarstellung der beiden Funktionen. Zum Beweis von c) und d) betrachten wir e±i(x+y) = e±ix e±iy = (cos x ± i sin x)(cos y ± i sin y) = (cos x cos y − sin x sin y) ± i(sin x cos y + cos x sin y) . Andererseits ist aber wiederum nach 5.38 e±i(x+y) = cos(x + y) ± i sin(x + y) . Also ist cos(x + y) ± i sin(x + y) = (cos x cos y − sin x sin y) ± i(sin x cos y + cos x sin y). Die Addition bzw. Subtraktion dieser beiden Formeln voneinander ergibt c) bzw. d). Aus d) folgt mit y = −x die Formel e). Da für reelles x auf Grund der Reihendarstellung auch die Werte cos x und sin x reell sind, gelten in diesem Fall sin2 x, cos2 x ≥ 0. Daher folgt f) aus e). 5.5 Exponential- und trigonometrische Funktionen 65 5.40 Wir stellen nun Beziehungen zur Trigonometrie her. Aus eix = cos x + i sin x erhalten wir für reelle Zahlen x die Gleichung |eix |2 = (cos x + i sin x)(cos x − i sin x) = cos2 x + sin2 x = 1 . Die Zahlen der Form eix liegen also auf der Peripherie des Einheitskreises, und cos x bzw. sin x sind Real- bzw. Imaginärteil von eix (s. Figur 9) Abbildung 9: Komplexe Zahlen vom Betrag 1 Es bleibt die später zu beantwortende Frage, ob jede Zahl auf dem Einheitskreis eine Darstellung der Form eix zulässt, um x endgültig als Bogenmaß auf dem Einheitskreis zu deuten. Aus der Eulerschen Formel folgt weiter die Formel ex+iy = ex eiy = ex (cos y + i sin y) , x, y ∈ R, die man die trigonometrische Darstellung der komplexen Zahlen nennt. Es bleibt wiederum die Frage, ob sich jede komplexe Zahl z 6= 0 in dieser Form schreiben lässt. Das ist mit der Frage äquivalent, ob der Wertebereich der komplexen Exponentialfunktion gleich C \ {0} ist. Der Leser schlage schon einmal bei Satz 6.42 nach! Aufgaben zu Abschnitt 5.5 1. Man beweise: a) |ez | ≤ eRe z ≤ e|z| und ez = ez für alle z ∈ C, b) eix = e−ix für x ∈ R. 2. Man beweise cos x − cos y = −2 sin 3. Man beweise sin z = x+y x−y sin für alle x, y ∈ C. 2 2 eiz − e−iz , 2i cos z = eiz + e−iz . 2 4. Zeigen Sie, dass die Exponentialfunktion f (z) = ez in C keine Nullstellen hat. 66 6 6.1 6 STETIGKEIT Stetigkeit Einführung und Begriff Die Analyse von Funktionen ist die zentrale Aufgabenstellung der Analysis. Konvergenzuntersuchungen sind hierfür ein wichtiges Hilfsmittel. Von A. Cauchy wurde die grundlegende Bedeutung des Stetigkeitsbegriffes bei der Untersuchung von Funktionen erkannt. Die weitreichenden Folgerungen aus dieser Eigenschaft sollen in diesem Kapitel dargelegt werden. In Satz 4.20 haben wir bewiesen, dass jede streng monoton wachsende reelle Funktion f in R mit lückenlosem Wertebereich die folgende Eigenschaft besitzt: Aus xn → x in D(f ) folgt f (xn ) → f (x) in W (f ). Wir nehmen diese Eigenschaft zum Anlass für die folgende Definition. Wie bisher sei dabei E = R oder = C. Definition 6.1 (Die Folgendefinition der Stetigkeit) Eine Funktion f aus E in E heißt stetig in a ∈ D(f ), wenn für alle Folgen von Elementen xn ∈ D(f ) aus xn → a stets f (xn ) → f (a) folgt. Als Kurzformel gilt also lim f (xn ) = f ( lim xn ). n→∞ n→∞ Die Funktion f heißt stetig auf D(f ), wenn f in allen Punkten a ∈ D(f ) stetig ist. Beispiel 6.2 Beispiele stetiger reeller Funktionen ergaben sich bereits in Folgerung 4.21. Insbesondere sind die Funktionen f (x) = xα , f (x) = ax , f (x) = ln x, α∈R a>0 auf ihren Definitionsbereichen stetig. Aber auch die Funktionen f (z) = Re z , f (z) = Im z und f (z) = |z| sind stetig auf C. Das ergibt sich aus den Ungleichungen |Re zn − Re a| = |Re (zn − a)| ≤ |zn − a| und |zn | − |a| ≤ |zn − a|. In vielen theoretischen Untersuchungen ist die folgende Fassung des Stetigkeitsbegriffs zweckmäßiger. Satz 6.3 (ε-δ-Definition der Stetigkeit) Eine Funktion f aus E in E ist genau dann bei a ∈ D(f ) stetig, wenn gilt: ∀ε > 0 ∃δ = δ(ε) > 0 ∀x ∈ D(f ) : |x − a| < δ ⇒ |f (x) − f (a)| < ε. (s. Abb. 10). 6.1 Einführung und Begriff 67 Abbildung 10: ε-δ-Definition der Stetigkeit In dieser Fassung bedeutet die Stetigkeit einer Abbildung oder eines Prozesses, dass kleine Ursachen kleine Wirkungen haben. Daher können alle evolutionären Prozesse durch stetige Abbildungen modelliert werden. Das zeigt die überaus große Anwendungsbreite des Stetigkeitsbegriffes. Beweis zu Satz 3. Es sei f bei a ∈ D(f ) stetig. Wäre die im Satz angegebene Bedingung nicht erfüllt, so gäbe es ein ε0 > 0 derart, dass zu jedem δ > 0 ein x ∈ D(f ) mit |x − a| < δ und |f (x) − f (a)| ≥ ε0 existieren würde. Wählt man für δ der Reihe nach die Zahlen δ = 1/n, so erhält man eine Folge zugehöriger xn ∈ D(f ) mit |xn − a| < n1 und |f (xn ) − f (a)| ≥ ε0 . Die erste Bedingung sichert xn → a, die zweite Bedingung widerspricht dann aber der vorausgesetzten Stetigkeit. Umgekehrt sei die angegebene ε − δ−Bedingung erfüllt, und es sei (xn ) eine Folge mit xn ∈ D(f ) und xn → a . Wir haben f (xn ) → f (a) zu zeigen. Zu ε > 0 wählen wir ein δ = δ(ε) > 0 gemäß obiger Bedingung. Wegen xn → a existiert ein n0 derart, dass für alle n ≥ n0 die Ungleichung |xn − a| < δ besteht. Nach Voraussetzung folgt für diese n dann aber auch |f (xn ) − f (a)| < ε, was zu beweisen war. Viele Zusammensetzungen von Funktionen erhalten die Stetigkeit: Satz 6.4 Es seien f, g Funktionen aus E in E, es sei a ∈ E. a) Sind f und g bei a stetig, so auch f ± g und f · g. b) Sind f bei a und g bei f (a) stetig, so ist (g ◦ f )(x) = g(f (x)) bei a stetig. Beweis. Die Behauptungen ergeben sich sofort aus der Folgendefinition der Stetigkeit unter Verwendung der Grenzwertsätze. Aufgaben zu 6.1 1. Man zeige die Stetigkeit der Funktion f (x) = x2 unter Verwendung des ε-δKriteriums. 2. Ist f stetig auf E, so ist die Menge {x ∈ E : f (x) = 0} abgeschlossen. 68 6 STETIGKEIT 3. Die Dirichlet-Funktion D(x) ist wie folgt definiert: D(x) = 1, falls x rational, und D(x) = 0, falls x irrational ist. Zeigen Sie, dass die Funktion D in keinem Punkt x ∈ R stetig ist. 4. Es sei f eine Abbildung von E in E. Man beweise: f ist stetig auf E genau dann, wenn das volle Urbild f −1 (U ) jeder offenen Teilmenge U ⊆ E offen in E ist. 5. Eine Funktion f : R → R heißt periodisch, wenn es eine Zahl p > 0 mit f (x) = f (x + p) für alle x ∈ R gibt. Man zeige: a) Ist f : R → R periodisch, stetig und nicht konstant, so existiert eine kleinste positive Zahl p mit f (x) = f (x + p) für alle x ∈ R. Diese Zahl p heißt primitive Periode. b) Man finde ein Beispiel einer periodischen (nicht stetigen) Funktion, die keine kleinste positive Periode besitzt. 6.2 Stetigkeit klassischer Funktionen Satz 6.5 Jede ganzrationale Funktion P (x) = n X ak x k , x∈R, x∈C k=0 ist auf R bzw. auf C stetig. Beweis. Die konstanten Funktionen P0 (x) = a und die lineare Funktion P1 (x) = x sind offensichtlich überall stetig. Eine beliebige ganzrationale Funktion lässt sich aber durch endlich viele Produkt– und Summenbildungen aus diesen Funktionen gewinnen und ist daher nach Satz 6.4 selbst stetig. Satz 6.6 Die Funktion f (x) = Punkt a 6= 0 stetig. 1 x von R \ {0} in sich bzw. von C \ {0} in sich ist in jedem Beweis. Die Aussage ergibt sich aus dem Grenzwertsatz für Quotienten. Folgerung 6.7 Jede gebrochen rationale Funktion n P R(x) = k=0 m P ak x k bj x j j=0 ist auf ihrem Definitionsbereich in R bzw. C stetig. 6.2 Stetigkeit klassischer Funktionen 69 Beweis. Zähler– und Nennerfunktionen sind für sich nach Satz 6.5 auf C stetig, und der Quotient ist nach Satz 6.6 außerhalb der Nullstellen des Nenners stetig. Die Stetigkeit vieler klassischer Funktionen kann aus dem Satz 4.20 in Abschnitt 4.2 hergeleitet werden. Wir wiederholen diesen Satz hier in leicht veränderter Formulierung: Satz 6.8 (Zweiter Hauptsatz über streng monoton wachsende Funktion) Ist f eine reellwertige, streng monoton wachsende Funktion von dem Intervall [a, b] auf das Intervall [f (a), f (b)], so ist f auf [a, b] stetig. Folgerung 6.9 Die reellen Funktionen chen stetig. √ n x, ex und ln x sind auf ihren Definitionsberei- Satz 6.10 Jede Potenzreihe der Form f (z) = ∞ X ak z k k=0 ist im Innern ihres Konvergenzbereiches stetig. Beweis. Die Reihen ∞ X ak z k und ∞ X kak z k k=0 k=0 haben den gleichen Konvergenzradius R, denn es gilt p p p √ k lim sup k |kak | = lim k · lim sup k |ak | = lim sup k |ak |. Sei nun a ∈ C mit |a| < R gegeben. Wir wählen eine Zahl ρ > 0 mit |a| < ρ < R . Dann ist nach obigem ∞ X k|ak |ρk = M < ∞ . k=0 Für alle z ∈ C mit |z| < ρ gilt nun ∞ ∞ X X |f (z) − f (a)| = ak (z k − ak ) = ak (z − a)(z k−1 + az k−2 + . . . + ak−1 ) k=0 ≤ |z − a| k=1 ∞ X k=1 |ak |kρk−1 = |z − a| M . ρ Hieraus folgt die Behauptung, denn aus zn → a folgt nun f (zn ) → f (a). Da eine beliebige Potenzreihe mit Mittelpunkt z0 immer als Zusammensetzung aus einer Verschiebung h(z) = z − z0 und einer Potenzreihe mit Mittelpunkt 0 aufgefasst werden kann, folgt aus Satz 6.10, dass jede Potenzreihe im Innern ihres Konvergenzbereiches stetig ist. Folgerung 6.11 Die Funktionen ez , sin z und cos z sind auf R und auf C stetig. 70 6.3 6 STETIGKEIT Stetige Funktionen auf kompakten Intervallen In diesem Abschnitt sollen weitreichende Folgerungen aus der Stetigkeit abgeleitet werden. Dabei wird es sich zeigen, dass die Stetigkeit eine hinreichende Bedingung für viele naiv zu erwartenden Eigenschaften von Funktionen ist. Wir beginnen mit der Betrachtung reellwertiger Funktionen auf abgeschlossenen und beschränkten (= kompakten) Intervallen. Einige der Sätze (z. B. Satz vom Maximum und Minimuum, Satz über die gleichmäßige Stetigkeit) gelten aber sogar für reellwertige Funktionen auf beliebigen kompakten Mengen. Satz 6.12 (Der Nullstellensatz von Bolzano) Ist f eine stetige reellwertige Funktion auf [a, b] mit f (a) · f (b) < 0 , so hat f in [a, b] mindestens eine Nullstelle. Abbildung 11: Nullstellensatz von Bolzano Beweis. Der Beweis wird mit dem Halbierungsverfahren geführt: Ohne Beschränkung der Allgemeinheit können wir f (a) < 0 < f (b) annehmen, andernfalls würden wir die Funktion −f betrachten. Wir setzen a0 = a und b0 = b und konstruieren induktiv eine Intervallschachtelung (an | bn ) mit f (an ) < 0 ≤ f (bn ) und |an − bn | ≤ b−a . 2n Sei also bereits eine Folge von Intervallen [ak , bk ] mit obiger Eigenschaft für 1 ≤ k ≤ n konstruiert. Wir bilden den Mittelpunkt cn = an + b n 2 des n−ten Intervalls. Ist f (cn ) < 0, so setzen wir an+1 = cn und bn+1 = bn , ist aber f (cn ) ≥ 0, so setzen wir an+1 = an und bn+1 = cn . Für die so konstruierte Intervallschachtelung (an | bn ) sei nun x0 = lim an = lim bn . Dann folgt aus der Stetigkeit f (x0 ) = lim f (an ) ≤ 0 ≤ lim f (bn ) = f (x0 ). Also ist f (x0 ) = 0. Zusätzlich gilt die a–priori–Fehlerabschätzung |x0 − an | ≤ |bn − an | = |b − a| · 2−n . 6.3 Stetige Funktionen auf kompakten Intervallen 71 Satz 6.13 (Zwischenwertsatz) Ist f eine stetige, reellwertige Funktion auf [a, b], so existiert zu jeder Zahl c mit f (a) < c < f (b) eine Zahl x0 ∈ (a, b) mit f (x0 ) = c. Jeder Wert zwischen f (a) und f (b) wird also als Funktionswert angenommen. Beweis. Die Funktion g(x) = f (x) − c ist ebenfalls stetig auf [a, b], und es ist g(a) = f (a) − c < 0 < f (b) − c = g(b) . Daher hat g eine Nullstelle x0 ∈ (a, b) und es folgt f (x0 ) = g(x0 ) + c = c. Satz 6.14 (Der Satz vom Maximum und Minimum) Es sei I = [a, b] ein kompaktes Intervall und es sei f : I → R stetig. Dann existieren Zahlen x∗ , x∗∗ ∈ I mit f (x∗∗ ) ≤ f (x) ≤ f (x∗ ) für alle x ∈ [a, b]. Es gelten also f (x∗∗ ) = min f (x) und f (x∗ ) = max f (x). x∈I x∈I Beweis. Es sei M = sup f (x), wobei der Wert M = ∞ zunächst nicht ausgeschlossen sei. x∈I Wir wählen eine Folge (xn ) von Elementen aus [a, b] mit f (xn ) → M . Nach dem Satz von Bolzano–Weierstrass existiert eine konvergente Teilfolge (xkn ) von (xn ), deren Grenzwert x∗ = lim xkn zu [a, b] gehört. Da f stetig ist, folgt f (x∗ ) = lim f (xkn ) = M . n→∞ Also nimmt die Funktion bei x∗ den Wert M an. Insbesondere ist M endlich. Zur Konstruktion von x∗∗ betrachte man die Funktion g(x) = −f (x). Nach dem bereits Bewiesenen hat g ein Maximum, etwa bei x∗∗ . Für diese Zahl gilt dann f (x∗∗ ) = −g(x∗∗ ) ≤ −g(x) = f (x) für alle x ∈ I. Die Zusammenfassung des Satzes vom Maximum und des Zwischenwertsatzes ergibt: Satz 6.15 Ist f eine stetige reelle Funktion in R, so ist das Bild jedes kompakten Intervalls I ⊆ D(f ) ein kompaktes Intervall. Beweis. Es sei I = [a, b] ⊆ D(f ). Wegen des Satzes vom Maximum und Minimum existieren die Zahlen y1 = min f (x) und y2 = max f (x). Also ist f (I) ⊆ [y1 , y2 ]. Wegen des x∈I x∈I Zwischenwertsatzes existiert aber zu jedem c ∈ [y1 , y2 ] ein x ∈ [a, b] mit f (x) = c. Also gilt f (I) = [y1 , y2 ] . Definition 6.16 (Gleichmäßige Stetigkeit) Eine Funktion f heißt gleichmäßig stetig auf einer Menge M ⊆ D(f ), wenn gilt: ∀ε > 0 ∃δ > 0 ∀x, x0 ∈ M : |x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε. 72 6 STETIGKEIT Gleichmäßige Stetigkeit zieht Stetigkeit nach sich, die Umkehrung ist aber im allgemeinen nicht richtig: Beispielsweise ist die Funktion f (x) = x1 auf dem Intervall (0, 1] zwar stetig, aber nicht gleichmäßig stetig (s. Aufgabe 1). Satz 6.17 (Satz über die gleichmäßige Stetigkeit) Ist f auf dem kompakten Intervall I stetig, so ist f auf I sogar gleichmäßig stetig. Beweis. Wir führen den Beweis indirekt und nehmen an, dass ein ε > 0 derart existiert, dass zu jedem δn = n1 Elemente xn , x0n ∈ I mit |xn − x0n | < 1 und |f (xn ) − f (x0n )| ≥ ε n existieren. Da I kompakt ist, existiert eine konvergente Teilfolge (xkn ) von (xn ). Es sei x∗ = lim xkn . Wegen |x0kn − x∗ | ≤ |x0kn − xkn | + |xkn − x∗ | → 0 gilt auch x∗ = lim x0kn . Das ergibt den Widerspruch ε ≤ lim |f (xkn )−f (x0kn )| = | lim f (xkn )−lim f (x0kn )| = |f (x∗ )−f (x∗ )| = 0. Definition 6.18 (Konvergenzarten) Mit C[a, b] bezeichnet man die Menge aller stetigen, reellwertigen Funktionen f : [a, b] → R. Es sei (fn ) eine Folge in C[a, b]. Wir definieren: pktw 1. (fn ) heißt punktweise konvergent gegen f auf [a, b] (in Zeichen fn −→ f ), wenn lim fn (x) = f (x) für alle x ∈ [a, b] gilt. n→∞ Diese Bedingung ist äquivalent zu: ∀ε > 0 ∀x ∈ [a, b] ∃n0 ∀n : n ≥ n0 ⇒ |fn (x) − f (x)| < ε. glm 2. (fn ) heißt gleichmäßig konvergent gegen f auf [a, b] (in Zeichen fn −→ f ), wenn lim max |fn (x) − f (x)| = 0. n→∞ x∈[a,b] Diese Bedingung ist äquivalent zu: ∀ε > 0 ∃n0 ∀x ∈ [a, b] ∀n : n ≥ n0 ⇒ |fn (x) − f (x)| < ε. Satz 6.19 Ist (fn ) eine Folge stetiger Funktionen fn ∈ C[a, b], die auf [a, b] gleichmäßig gegen f konvergiert, so ist f auch stetig auf [a, b]. 6.3 Stetige Funktionen auf kompakten Intervallen 73 Beweis. Es sei z ∈ [a, b] ein fester Punkt. Die Stetigkeit von f bei z ergibt sich nun wie folgt. Zu ε > 0 wählt man ein n0 so, dass |fn0 (x) − f (x)| < ε für alle x ∈ [a, b] gilt. Da fn (gleichmäßig) stetig ist, existiert ein δ > 0 mit |fn0 (x) − fn0 (z)| < ε sofern |x − z| < δ. Hieraus folgt nun |f (x) − f (z)| ≤ |f (x) − fn0 (x)| + |fn0 (x) − fn0 (z)| + |fn0 (z) − f (z)| < ε + ε + ε für alle x mit |x − z| < δ. Somit ist f stetig. Beachten Sie, dass punktweise Grenzwerte stetiger Funktionen nicht zu stetigen Funktionen führen müssen (s. Aufgabe 2). Satz 6.20 Es sei ∅ = 6 K beliebige kompakte6 Teilmenge von R oder C. Dann gelten: a) Jede stetige Funktion f : K → R hat auf K ein Maximum und ein Minimum. b) Ist f : K → R stetig, so ist f auf K sogar gleichmäßig stetig. Beweis: Eine Analyse der entsprechenden Beweise für den Fall K = I, I ein kompaktes Intervall, zeigt, dass dort nur der Bolzano-Weierstrass, also die Kompaktheit als Argument verwendet worden ist. Daher gelten die Beweise auch im Fall beliebiger kompakter Mengen. Bemerkung 6.21 Man könnte vermuten, dass ein Zwischenwertsatz auch für stetige Funktionen f : [a, b] → C gültig wäre. Dem ist aber nicht so: Die Funktion f (t) = eit ist eine stetige Funktion f : [0, π] → C mit f (0) = 1 und f (π) = cos π = −1, aber die Gleichung f (t) = 0 hat keine Lösung. Aufgaben Abschnitt 6.3 1. Man zeige, dass die Funktion f (x) = 1 x auf (0, 1] nicht gleichmäßig stetig ist. 2. Wir betrachten die Potenzfunktionen fn (x) = xn auf [0, 1]. Zeigen Sie: 0 für 0 ≤ x < 1, lim fn (x) = 1 für x = 1. n→∞ Man begründe, warum die Folge (fn ) nicht gleichmäßig konvergiert. 3. Ist f (x) = ∞ P ck xk eine Potenzreihe mit Konvergenzradius R < ∞, so konvergiert k=0 die Folge der Polynome Pn (x) = n X ck xk k=0 auf jedem kompakten Intervall I ⊂ (−R, R) gleichmäßig gegen f . 4. Bestimmen Sie mit Hilfe des Nullstellensatzes von Bolzano eine Nullstelle des Polynoms f (x) = x5 − x + 1 im Intervall [−2, 2] auf eine Dezimalstelle genau. 6 hat. Eine Teilmenge M ⊂ R, C heißt kompakt, wenn jede Folge (xn ) ⊆ M einen Häufungspunkt in M 74 6.4 6 STETIGKEIT Grenzwerte von Funktionen Wie bisher sei E = R oder E = C. Wir betrachten die reelle Funktion x3 + 2x2 − x − 2 f (x) = , 3x − 3 die in allen Punkten x 6= 1 definiert und stetig ist und deren Graph in Abbildung 12 dargestellt ist. Abbildung 12: Graph mit Lücke An der Stelle a = 1 ist die Funktion zwar nicht stetig, sie hat aber wenigstens einen Grenzwert im Sinn der folgenden Definition: Definition 6.22 (Grenzwert) Es sei f eine Funktion aus E in E, und es sei a ∈ E ein Häufungspunkt von D(f ). Dann heißt ein Punkt b ∈ E der Grenzwert von f an der Stelle a, wenn für jede Folge (xn ) ⊆ D(f ) mit xn 6= a für alle n ∈ N aus xn → a auch f (xn ) → b folgt. Wir schreiben für diesen Sachverhalt auch lim f (x) = b. x→a Durch Vergleich der Definition der Stetigkeit an der Stelle a mit obiger Definition ergibt sich sofort: Satz 6.23 Ist a ∈ D(f ) ein Häufungspunkt von D(f ), so ist f genau dann bei a stetig, wenn f bei a den Grenzwert f (a) hat. Beispiel 6.24 Für stetige Funktionen bringt die Untersuchung von Grenzwerten in Punkten ihres Definitionsbereiches also keine neue Information über die Funktion. Anders ist es jedoch mit Punkten, die nicht zum Definitionsbereich gehören. Wir kehren zum einführenden Beispiel zurück. Durch Polynomdivision ergibt sich x3 + 2x2 − x − 2 lim = lim x→1 x→1 3x − 3 1 2 3 x +x+ 3 2 = 1 3 17 +1+ = , 3 2 6 die Funktion f hat also bei a = 1 den Grenzwert 17 . Erweitert man den Definitionsbereich 6 der Funktion f (x) durch die zusätzliche Definition f (1) = lim f (x) = x→1 17 , 6 so erhält man eine auf ganz R stetige Funktion. Man sagt dazu, dass die Funktion f stetig fortgesetzt wurde. 6.4 Grenzwerte von Funktionen 75 Für Funktionen einer reellen Veränderlichen kann man überdies links– und rechtsseitige Grenzwerte einführen: Definition 6.25 (Einseitige Grenzwerte) . a) Wir setzen (linksseitiger Grenzwert) lim f (x) = lim f (x) = b, x→a−0 x%a wenn lim f (xn ) = b für alle Folgen xn % a mit xn ∈ D(f ) und xn 6= a gilt. n→∞ b) Wir setzen (rechtsseitiger Grenzwert) lim f (x) = lim = b, x→a+0 x&a wenn lim f (xn ) = b für alle Folgen xn & a mit xn ∈ D(f ) und xn 6= a gilt. n→∞ 1 x&0 x Beispielsweise sind lim 1 x→0+0 x = lim 1 x%0 x = + ∞ und lim 1 x→0−0 x = lim = − ∞. Mit Hilfe von Grenzwerten lassen sich die Unstetigkeitspunkte einer Funktion klassifizieren: Definition 6.26 (Unstetigkeitspunkte) Es sei f eine Funktion aus R in R, es sei a 6∈ D(f ) und es gäbe ein ε > 0 so, dass die punktierte ε-Umgebung Uε0 (a) zu D(f ) gehört. Dann hat f bei a (i) eine Lücke, wenn lim f (x) existiert und endlich ist. x→a (ii) einen Sprung, wenn lim f (x) und lim f (x) existieren, endlich und verschieden sind. x%a x&a (iii) einen Pol, wenn lim f (x) und lim f (x) existieren und ±∞ sind. x%a x&a (iv) eine wesentliche Singularität in den verbleibenden Fällen. Lücken waren uns bereits im einführenden Beispiel begegnet. Hat f eine Lücke bei a, so lässt sich f durch den Ansatz f (a) = lim f (x) in den Punkt a hinein stetig fortsetzen. x→a x Dagegen hat die Funktion f (x) = |x| bei a = 0 einen Sprung von −1 zu +1, sie ist nicht stetig fortsetzbar in den Punkt a = 0. Die Funktion f (x) = 1 x hat bei a = 0 einen Pol. Schließlich ist f (x) = sin x1 ein Beispiel für eine Funktion, die bei a = 0 eine wesentliche Singularität hat. Ihr Graph ist in Abb. 13 dargestellt. Aufgaben zu Abschnitt 6.4 76 6 STETIGKEIT Abbildung 13: f (x) = sin x1 1. Man berechne lim e−x und lim e−x . x→∞ x→−∞ 2. Man berechne x2 −4 , x→2 x−2 a) lim xn e−x , x2 −1 , x%2 x−2 b) lim x→∞ c) lim 1 2. x→∞ 1+x d) lim 3. Unter Verwendung der Potenzreihendarstellung der auftretenden Funktionen berechne man: sin x − 1 cos x − 1 ex − 1 , b) lim , c) lim . a) lim x→0 x→0 x→0 x x x2 6.5 Ganzrationale und gebrochen rationale Funktionen Die bisher entwickelten Techniken sind geeignet, einen umfassenden Einblick in die ganzrationalen und rationalen Funktionen zu gewinnen. Wir beginnen mit der Untersuchung des Verhaltens im Unendlichen. Satz 6.27 Es sei f (x) = n P aj xj eine ganzrationale Funktion mit an 6= 0 und n ≥ 1. j=0 Dann gilt lim |f (x)| = ∞. x→∞ Beweis. Es ist f (x) = an x n an−1 a0 1+ + ... + n . x x Der zweite Faktor strebt für |x| → ∞ gegen 1, der erste Faktor strebt im Betrag gegen Unendlich. Satz 6.28 (Prinzip des Koeffizientenvergleichs) Sind zwei ganzrationale Funktionen wertverlaufsgleich, so stimmen sie in allen Koeffizienten überein. 6.5 Ganzrationale und gebrochen rationale Funktionen 77 Beweis. Es genügt zu zeigen, dass für jede ganzrationale Funktion g(x) = n X aj x j j=0 aus g(x) = 0 für alle x ∈ R die Bedingung a0 = . . . = an = 0 folgt. Wegen 0 = g(0) = a0 ist a0 = 0. Wäre nun an > 0 für n ≥ 1, so hätte man lim g(x) = ∞ nach Satz 6.27 im x→∞ Widerspruch zu g(x) = 0 für alle x ∈ R. Definition 6.29 Für eine ganzrationale Funktion f (x) = n P aj xj 6≡ 0 heißt die Zahl j=0 Grad(f ) = max{j : aj 6= 0} der Grad von f . Ferner setzen wir Grad(0) = −∞. Von grundsätzlicher Bedeutung ist die Frage nach der Existenz und Anzahl von Nullstellen ganzrationaler Funktionen. Wir wollen beweisen, dass jede ganzrationale Funktion vom Grad n ≥ 1 auch n (evtl. komplexe) Nullstellen hat. Dazu ist es zuerst nötig, den Begriff der Vielfachheit einer Nullstelle einzuführen. Satz 6.30 Eine Zahl x0 ∈ C ist genau dann eine Nullstelle der ganzrationalen Funktion f (x), wenn eine Zerlegung f (x) = (x − x0 ) · g(x) mit einer geeigneten ganzrationalen Funktion g(x) möglich ist. Beweis. Hat man eine derartige Zerlegung, so ist f (x0 ) = 0 · g(x0 ) = 0. Sei umgekehrt f (x0 ) = 0. Die Polynomdivision f (x) : (x − x0 ) ergibt eine Zerlegung f (x) = (x − x0 ) · g(x) + q mit einer Zahl q. Aus f (x0 ) = 0 folgt dann aber q = 0. Hat man eine Zerlegung f (x) = (x − x0 )g(x) gegeben, so könnte es sein, dass x0 auch noch eine Nullstelle von g(x) ist. Dann lässt sich der Faktor (x − x0 ) nochmals abspalten, es gilt dann also f (x) = (x − x0 )2 · g1 (x) mit einer neuen ganzrationalen Funktion g1 . Das legt folgende Definition nahe: Definition 6.31 Unter der Vielfachheit einer Nullstelle x0 einer ganzrationalen Funktion f (x) versteht man die größte natürliche Zahl m, für die eine Zerlegung f (x) = (x − x0 )m · g(x) möglich ist. Insbesondere ist g(x0 ) 6= 0. Folgerung 6.32 Für jede ganzrationale Funktion f ist die Summe der Vielfachheiten ihrer Nullstellen nicht grösser als der Grad von f . Insbesondere hat f höchstens so viele Nullstellen, wie der Grad von f angibt. 78 6 STETIGKEIT Beweis. Es seien x0 , . . . , xk die Nullstellen von f mit den Vielfachheiten m0 , . . . , mk . Dann existiert eine Zerlegung f (x) = (x − x0 )m0 · . . . · (x − xk )mk g(x) mit einer geeigneten ganzrationalen Funktion g(x). Ein Gradvergleich ergibt Gradf = m0 + . . . + mk + Grad g ≥ m0 + . . . + mk , womit die Behauptung bewiesen ist. Ein seit Vieta (1540–1603) bis zur berühmten Dissertation von C.F. Gauss im Jahr 1799 offenes Problem war die Frage, ob jede ganzrationale Funktion f vom Grad f = n ≥ 1 auch mindestens eine Nullstelle (und damit n–Nullstellen) hat. Wir werden diesen Satz jetzt beweisen. Dazu beginnen wir mit dem Spezialfall: Satz. Jede (sog. reine) Gleichung xn = a mit n ≥ 1 hat mindestens eine Lösung in C. Beweis. Wir beweisen diesen Satz unter der Voraussetzung, dass die Zahl a eine Darstellung der Form a = r eiϕ , r > 0 , ϕ ∈ R , besitzt. (In Satz 6.42 werden wir zeigen, dass eine solche Darstellung immer möglich ist.) Für solche Zahlen a ist die Zahl √ x = n r eiϕ/n wegen xn = r(eiϕ/n )n = r eiϕ = a eine gesuchte Lösung von xn = a. Satz 6.33 (Fundamentalsatz der klassischen Algebra) (Gauss 1799) a) Jede ganzrationale Funktion f vom Grad(f ) ≥ 1 hat mindestens eine Nullstelle in C. b) Jede ganzrationale Funktion f vom Grad(f ) ≥ 1 lässt sich in C in Linearfaktoren f (x) = an (x − x1 )m1 · . . . · (x − xk )mk zerlegen. Dabei ist m1 + . . . + mk = n. Beweis. Es genügt, die Aussage a) zu beweisen. Die Zerlegung von f in das angegebene Produkt ergibt sich dann durch wiederholte Anwendung von Satz 6.30. Die Idee zum Beweis von a) besteht darin nachzuweisen, dass die Funktion |f (x)| ein Minimum hat und dass dieses Minimum = 0 ist. Wir zeigen als Erstes die Existenz des Minimums. Nach Satz 6.27 existiert eine Zahl K > 0 derart, dass |f (x)| ≥ |f (0)| für alle |x| ≥ K gilt. Auf der kompakten Menge {x : |x| ≤ K} hat die stetige Funktion |f | nach Satz 6.14 aber ein Minimum, etwa bei x0 . Wegen |f (x0 )| ≤ |f (0)| gilt dann aber sogar |f (x0 )| = min |f (x)|. x∈C Wir wollen f (x0 ) = 0 zeigen und nehmen dazu das Gegenteil f (x0 ) 6= 0 an. 6.5 Ganzrationale und gebrochen rationale Funktionen 79 Die ganzrationale Funktion r(x) = f (x0 + x) f (x0 + x) − f (x0 ) = −1 f (x0 ) f (x0 ) hat offenbar bei x = 0 eine Nullstelle. Daher existiert eine Zerlegung f (x0 + x) − 1 = r(x) = xp g(x) mit g(0) 6= 0 und p ≥ 1. f (x0 ) Somit ist f (x0 + x) g(x) = 1 + xp für alle x ∈ C. f (x0 ) f (x0 ) Da |f | bei x0 ein Minimum hat, folgt f (x0 ) 2 f (x0 + x) 2 p p 2 p ≤ 1 = f (x0 ) = |1 + x g(x)| = (1 + x q(x))(1 + x q(x)) f (x0 ) = 1 + 2 Re (xp g(x)) + |xp g(x)|2 , also 0 ≤ 2 Re (xp g(x)) + |xp g(x)|2 für alle x ∈ C. Ersetzt man x durch xj , so folgt nach Multiplikation mit j p 0 ≤ 2 Re 2 x x 1 p xg + p x g , j j j p und der Grenzübergang j → ∞ ergibt schließlich 0 ≤ Re (xp g(0)) für alle x ∈ C. (∗) Wir wählen nun eine Lösung z von z p = i. Mit x = z 0 , z 1 , z 2 , z 3 ergibt sich xp = 1, i, −1, −i, und aus (∗) folgt der Reihe nach 0 0 0 0 ≤ ≤ ≤ ≤ Re g(0) Re (ig(0)) = −Im q(0) Re (−g(0)) = −Re q(0) Re (−ig(0)) = +Im q(0). Hieraus folgt Re g(0) = Im g(0) = 0, also ist g(0) = 0 im Widerspruch zur Konstruktion von g. Das Verhalten gebrochen rationaler Funktionen in den Unstetigkeitspunkten und bei Grenzübergang x → ±∞ ist in folgendem Satz zusammengefasst. Der Beweis ist offensichtlich. Satz. Es sei f (x) = P (x) Q(x) 80 6 STETIGKEIT eine gebrochen rationale Funktion. Durch Division mit Rest kann sie in die Form f (x) = H(x) + p(x) q(x) mit ganzrationalen Funktionen H(x), p(x) und q(x), Grad p(x) < Grad q(x) und maximal gekürzten Quotienten p(x)/q(x) gebracht werden. Dann gelten a) lim |f (x) − H(x)| = 0, die Funktion f verhält sich für x → ±∞ wie H. x→±∞ p(x) = ∞ für q(x0 ) = 0, die Funktion f hat bei x0 einen Pol. b) lim |f (x)| = lim x→x0 x→x0 q(x) Aufgaben zu Abschnitt 6.5 1. Man bestimme die drei Lösungen der Gleichungen z 3 = 1 und z 3 = i. 2. Unter Verwendung von Satz 6.33 beweise man die reelle Version des Fundamentalsatzes der klassischen Algebra: Jede ganzrationale Funktion f mit reellen Koeffizienten besitzt in R eine Zerlegung in lineare und quadratische Faktoren der Form f (x) = an (x − x1 )l1 · . . . · (x − xr )lr · ((x − α1 )2 + β12 )k1 · . . . · ((x − αp )2 + βp2 )kp . Dabei ist n = Grad(f ) = l1 + . . . + lr + 2k1 + . . . + 2kp . 3. Es sei f (x) eine ganzrationale Funktion vom Grad n ≥ 1. Zeigen Sie (im Vorgriff auf gängige Differentiationsregeln): Eine Zahl x0 ist genau dann eine zweifache Nullstelle von f , wenn f (x0 ) = f 0 (x0 ) = 0 und f 00 (x0 ) 6= 0. Charakterisieren Sie entsprechend die m-fachen Nullstellen. 6.6 Sinus, Kosinus und Logarithmus in R und C Wir untersuchen nun den Verlauf der in Definition 5.37 durch Potenzreihen definierten trigonometrischen Funktionen sin x und cos x im Reellen. Wir wissen bereits aus Satz 6.10, dass beide Funktionen auf R stetig sind. Einen ersten Einblick in den Kurvenverlauf gibt der folgende Satz: Abbildung 14: Einschließung der sin-Funktion 6.6 Sinus, Kosinus und Logarithmus in R und C 81 Satz 6.34 Für alle x ∈ R mit 0 < x ≤ 2 gilt 0<x− x3 < sin x < x. 3! Beweis. Es ist sin x = ∞ X k=0 (−1)k (s. Abb 14) x2k+1 , (2k + 1)! und wir zeigen, dass für alle 0 < x ≤ 2 das Leibnizkriterium anwendbar ist. In der Tat gilt für x2 < 6 die Ungleichung x2 ≤ (2k + 2)(2k + 3), woraus offenbar 2k+3 2k+1 x x ≤ (2k + 3)! (2k + 1)! 2k+1 x & 0, und hieraus ergibt sich wie für alle Reihen vom Leibniz– folgt. Also gilt (2k + 1)! Typ die Ungleichung s1 = x − x3 < sin x < s0 = x. 3! sin x = 1. x→0 x Satz 6.35 lim Beweis. Aus Satz 6.34 folgt für alle 0 < x ≤ 2 die Ungleichung sin x x2 < < 1, 3! x die offenbar auch für alle x mit −2 ≤ x < 0 gilt. Der Grenzübergang x → 0 liefert die Behauptung nach dem Vergleichskriterium. 0<1− Satz 6.36 Es gibt genau eine Zahl 1 ≤ ω < 2 mit cos ω = 0. Wir definieren π = 2ω. Bemerkung. Die auf diese Weise definierte Zahl π wird sich später als identisch mit der für Kreisberechnungen wichtigen Konstanten π=Kreisumfang/Kreisdurchmesser erweisen. Beweis. Existenz: Wir betrachten die stetige Funktion f (x) = cos(x) im Intervall [0, 2]. Es ist cos 0 = 1 > 0, und aus den Additionstheoremen und Satz 6.34 folgt 1 2 2 1 cos 2 = 1 − 2 sin2 1 ≤ 1 − 2 1 − ≤ 1 − 2 + = − < 0. 3! 3 3 Daher ergibt sich aus dem Satz von Bolzano die Existenz einer Nullstelle ω ∈ (0, 2). Zum Nachweis der Einzigkeit zeigen wir zunächst, dass im Intervall (0, 1) keine Nullstelle existieren kann. In der Tat gilt für 0 ≤ x < 1 wegen Satz 6.34 die Abschätzung cos2 x = 1 − sin2 x > 1 − x2 > 0. Seien nun 1 ≤ x < x0 < 2 mit cos x = cos x0 = 0 gegeben. Dann ist 0 < x0 − x < 1, woraus wegen Satz 6.34 sicherlich sin(x0 − x) > 0 folgt. Das widerspricht der Gleichung sin(x0 − x) = sin x0 cos x − cos x0 sin x = 0. Daher kann im Intervall [1, 2) nur eine Nullstelle x von cos x existieren. 82 6 STETIGKEIT Satz 6.37 Für 0 < x < π gilt sin x > 0. Beweis. Es ist sin x = 2 sin x2 cos x2 , und wegen Satz 6.34 und Satz 6.36 sind sin x2 > 0 und cos x2 > 0. Satz 6.38 Für alle x ∈ R gelten a) cos(x + π2 ) = − sin x, sin(x + π2 ) = cos x, b) cos(x + 2π) = cos x, sin(x + 2π) = sin x. Beweis. Es ist sin2 π2 = 1 − cos2 π2 = 1 − 0 = 1. Hieraus folgt | sin π2 | = 1. Wegen Satz 6.37 ist dann sogar sin π2 = 1. Daher ergibt das Additionstheorem cos(x + π2 ) sin(x + π2 ) = cos x · cos π2 = sin x · cos π2 sin x sin π2 cos x sin π2 – + = = 0 – 0 + sin x, cos x. Aus a) folgt nun cos(x + π) = cos (x + π2 ) + π 2 = − sin(x + π2 ) = − cos x. Also ist cos(x + 2π) = − cos(x + π) = cos x. Satz 6.39 Die Funktion f (x) = cos x ist auf dem Intervall [0, π] streng monoton fallend, die Funktion f (x) = sin x ist auf [− π2 , π2 ] streng monoton wachsend. Beweis. Es sei 0 ≤ x < x0 ≤ π. Mit a = den Additionstheoremen x0 +x 2 und b = x0 −x 2 > 0 folgt aus Satz 6.37 und cos x − cos x0 = cos(a − b) − cos(a + b) = cos a cos b + sin a sin b − cos a cos b + sin a sin b = 2 sin a sin b > 0. Aus Satz 6.38a) folgt dann die entsprechende Behauptung für die Funktion sin x. Definition 6.40 Die Funktionen cos x und sin x besitzen auf [0 , π] bzw. auf [− π2 , π2 ] streng monotone Umkehrfunktionen, die als Arcus–Funktionen bezeichnet werden: Für −1 ≤ x ≤ 1 ist arcsin x arccos x = = t ⇔ t ⇔ sin t = x cos t = x und und − π2 ≤ t ≤ π2 0 ≤ t ≤ π. In Abbildung 15 sind diese Funktionen graphisch dargestellt. Schliesslich definiert man wie üblich die Tangensfunktion durch tan x = sin x cos x für x 6= π + kπ 2 (k ∈ Z) Wir untersuchen nun die Exponentialfunktion im Komplexen. Überraschenderweise stellt sich in imaginärer Richtung eine Periodizität von der Periodenlänge 2πi ein: 6.6 Sinus, Kosinus und Logarithmus in R und C 83 Abbildung 15: arcsin- und arccos- Funktion Satz 6.41 Es gilt ez1 = ez2 genau dann, wenn z1 − z2 = 2kπi für ein k ∈ Z ist. Insbesondere gilt e2kπi = 1. Beweis. Die Gleichungen ez1 = ez2 und ez1 −z2 = 1 sind äquivalent. Es sei also ez = ea+bi = ea ebi = 1 mit a, b ∈ R. Dann folgt ea = |ea ebi | = 1, was nur für a = 0 möglich ist. Hieraus ergibt sich 1 = ebi = cos b + i sin b, also cos b = 1, was genau für b = 2kπ mit k ∈ Z gilt. In Abbildung 16 ist der Realteil der Funktion f (z) = ez dargestellt, die Periodizität der Exponentialfunktion wird hieraus deutlich. Abbildung 16: Realteil der Funktion ez = ex+iy Wir können nun auch die früher behauptete Existenz der trigonometrischen Darstellung komplexer Zahlen beweisen: Satz 6.42 Jede komplexe Zahl z 6= 0 lässt sich in eindeutiger Weise in der Form z = reiϕ = r(cos ϕ + i sin ϕ) mit r > 0 und − π < ϕ ≤ π darstellen. Dabei ist r = |z| der Betrag von z, und die Zahl ϕ heißt das Argument von z. Man schreibt ϕ = Argz. 84 6 STETIGKEIT Beweis. Es sei z = a + bi gegeben. Wir setzen arccos Re z für Im z ≥ 0 |z| √ r = a2 + b2 = |z| und ϕ = − arccos Re z für Im z < 0. |z| Man rechnet nun nach, dass z = reiϕ gilt: Im Fall Im z ≥ 0, also für 0 ≤ ϕ ≤ π, gelten Re z und |z| p 1p 2 |Im z| Im z 0 ≤ sin ϕ = 1 − cos2 ϕ = |z| − |Re z|2 = = . |z| |z| |z| cos ϕ = Daher ist reiϕ = r(cos ϕ + i sin ϕ) = Re z + i Im z = z. Entsprechend wird der Fall Im z < 0, also −π < ϕ < 0, behandelt. Die Einzigkeit der Darstellung ist eine Folgerung aus Satz 6.41. Beispiel 6.43 Als Beispiel betrachten wir die Zahl z = √ 3 + i. Es ist √ √ 3 π r = 3 + 1 = 2 und ϕ = arccos = . 2 6 Das ergibt π z = 2 ei 6 . Satz 6.44 (Die Moivreschen Formeln) Sind zj = rj eiϕj für j = 1, 2, so gelten a) z1 · z2 = r1 r2 ei(ϕ1 +ϕ2 ) , b) z1n n = r1n eiϕ1 . c) Die Lösungen der Gleichung z n = 1 sind genau die Zahlen zk = ei 2πk n , 0 ≤ k < n. Beweis. Die Aussagen folgen aus den Potenzgesetzen für die Exponentialfunktion. Folgerung 6.45 Die Gleichung z n = a mit a = r eiα 6= 0 hat genau die n verschiedenen Lösungen √ α 2π zk = n r ei( n + n k) ; k = 0, . . . , n − 1. Satz 6.46 (Die komplexe Logarithmusfunktion) Die Funktion f (z) = ez bildet den Streifen S = {a + bi : − π < b ≤ π, a ∈ R} eineindeutig auf die punktierte komplexe Ebene C \ {0} ab. Die Umkehrfunktion ist durch die Formel Lnz = ln |z| + i Argz ; z ∈ C \ {0}, gegeben, und sie heißt (Hauptwert) der komplexen Logarithmusfunktion. Für z > 0 ist Lnz = ln z. 6.6 Sinus, Kosinus und Logarithmus in R und C 85 Abbildung 17: Der Wertebereich von Ln(w) Beweis. Die Eineindeutigkeit von f (z) = ez auf S folgt sofort aus Satz 6.41. Weiter gelten für 0 6= z ∈ C mit ϕ = Argz die Gleichungen eLnz = eln |z|+iϕ = eln |z| eiϕ = |z| eiϕ = z, Ln ez = Ln ea+bi = Ln(ea ebi ) = ln ea + ib = a + ib = z. Beispiel 6.47 Wegen Arg(−1) = π und Arg(i) = π 2 gelten Ln(−1) = ln | − 1| + iπ = iπ, Ln i = ln |i| + i π2 = i π2 , Ln 2i = ln 2 + i π2 . Aufgaben zu Abschnitt 6.6 1. Man zeige ez 6= 0 für alle z ∈ C. (Hinweis: Eulersche Formel) 2. Man zeige a) Die Funktion f (z) = sin z hat in C genau die Nullstellen z = kπ, k ∈ Z. (Hinweis: Man benutze die Formel sin z = (eiz − e−iz )/2i.) b) Die Funktion f (z) = cos z hat in C genau die Nullstellen z = π2 + kπ, k ∈ Z. 3. Man beweise Ln(z1 z2 ) = (Ln z1 + Ln z2 ) mod (2πi) für 0 6= z1 , z2 ∈ C. 4. Definiert man az = ez·Lna für 0 6= a ∈ C, so erhält man auch Exponentialfunktionen mit komplexer Basis. Man berechne ii , iπ , (−1)π . 5. Man beweise die Grenzwertformel aus Satz 6.35 in unter Verwendung der Folgendefinition der Zahl e (s. Satz 4.25). 6. a) Geben Sie alle Lösungen der Gleichung z 7 −1 = 0 in C an und stellen Sie die Zahlen in der komplexen Zahlenebene dar. (Hinweis: Benutzen Sie die trigonometrische Darstellung.) b) Ebenso für z 7 − i = 0. 86 6 STETIGKEIT 7. Es sei z = 0.75+0.5i. Stellen Sie die Folgenglieder {z 1 , z 2 , . . . , z 10 } in der komplexen Ebene dar. (Hinweis: Benutzen Sie die de’Morganschen Formeln.) 8. Geben Sie die folgenden Zahlen in kartesischer Darstellung an: a) Ln(3 + i), b) sin(1 + i), c) (1 + i)2+i , d) ie . 87 7 7.1 Differentialrechnung Differenzierbarkeit und Differentiationsregeln Obwohl die Grundzüge der Differentialrechnung zu großen Teilen in Reellen und Komplexen gemeinsam entwickelt werden können, beschränken wir uns hier im Wesentlichen auf die reelle Theorie. Der interessierte Leser prüfe die folgenden Definitionen und Sätze selbständig auf ihre Übertragbarkeit und Gültigkeit im Komplexen. Definition 7.1 Es sei f eine Funktion aus R in sich und sei a ein innerer Punkt von D(f ). Die Funktion f heißt differenzierbar bei a, wenn der Grenzwert des Differenzenquotienten f (x) − f (a) lim x→a x−a existiert und endlich ist. Im Fall der Existenz heißt diese Zahl der Differentialquotient oder die Ableitung f 0 (a) von f bei a. Die Bedeutung der Differenzierbarkeit liegt in der hiermit verbundenen Linearisierbarkeit ” im Kleinen“, die in geometrischer Fassung die Existenz der Tangente bedeutet (s. Abb. 18). Das ist der Inhalt der sogenannten Weierstraßschen Zerlegungsformel: Satz 7.2 (Weierstraßsche Zerlegungsformel) Die Funktion f ist genau dann bei a differenzierbar, wenn es eine Zahl m und eine Funktion ρ(a, x) in einer Umgebung von a so gibt, dass f (x) = f (a) + m(x − a) + ρ(x, a)(x − a) und lim ρ(x, a) = 0 x→a gelten. Dabei ist dann m = f 0 (a). Beweis. Setzt man ρ(a, x) = lim x→a f (x) − f (a) = m. ist. x−a f (x) − f (a) − m, so gilt lim ρ(x, a) = 0 genau dann, wenn x→a x−a Die Funktion h(x) = f (a) + m(x − a), die als Teilsumme in der Zerlegungsformel auftritt, hat geometrisch die Bedeutung der Tangente im Punkt (a, f (a)). In Abbildung 30.1 ist die Zerlegung grafisch dargestellt. Die Weierstraßsche Zerlegungsformel liefert lineare Näherungen für eine Vielzahl von Funktionen. Als Kostprobe dafür notieren wir sin x ≈ x, √ 1 1 + x ≈ 1 + x. 2 Eine Fehlerabschätzung, die diese Näherungen erst verwendbar macht, wird sich in Satz 7.30 ergeben. Definition 7.3 Eine Funktion f aus R in R heißt differenzierbar auf einer offenen Teilmenge M ⊆ D(f ), wenn f in jedem Punkt von M differenzierbar ist. 88 7 DIFFERENTIALRECHNUNG Abbildung 18: Differenzenquotient und Linearisierung df df bezeichnet. Die Symbolik geht dx dx 0 dabei auf Leibniz zurück, die Symbolik f (x) stammt von Newton (s. 7.8). Die Ableitungsfunktion wird auch durch f 0 (x) = Satz 7.4 Ist f in a differenzierbar, so ist f dort auch stetig. Beweis. Die Weierstrasssche Zerlegungsformel ergibt |f (x) − f (a)| ≤ |x − a| · |m + ρ(x, a)| → 0 für x → a. Die Umkehrung gilt nicht, z.B. ist die Funktion f (x) = |x| auf ganz R stetig, aber an der Stelle a = 0 offenbar nicht differenzierbar. Es gibt aber auch stetige Funktionen, die in keinem Punkt ihres Definitionsbereiches differenzierbar sind (s. Aufgabe 2). Ohne auf Details einzugehen sei bemerkt, dass die Brownsche Bewegung eines Teilchens oder der zeitliche Verlauf eines Aktienkurses auch gute Modelle für nirgends differenzierbare Funktionen sind (Warum?). Das zeigt, dass solche seltsamen Funktionen in der Praxis durchaus auftreten und sogar von einiger Bedeutung sind. Die einseitige Differenzierbarkeit ist eine Abschwächung des Differenzierbarkeitsbegriffes. Eine Funktion f heißt bei einem inneren Punkt a des Definitionsbereiches linksseitig differenzierbar, wenn der linksseitige Grenzwert f (x) − f (a) x%a x−a lim existiert. Die Funktion f (x) = |x| hat bei a = 0 eine links– und eine rechtsseitige Ableitung, die aber beide voneinander verschieden sind. Wir leiten nun wichtige Differentiationsregeln her, mittels derer eine algorithmische Berechnung von Ableitungen möglich sein wird. Satz 7.5 (Differentiationsregeln) Sind die Funktionen f und g in einem inneren Punkt a von D(f ) ∩ D(g) differenzierbar, so sind auch skalare Vielfache, Summe, Differenz, Produkt und im Fall g(a) 6= 0 auch der Quotient der Funktionen f und g bei a differenzierbar, und es gelten die Formeln: 7.1 Differenzierbarkeit und Differentiationsregeln a) (λf )0 (a) b) (f ± g)0 (a) = (f · g)0 (a) 0 f d) g (a) c) = 89 λf( a), f 0 (a) ± g 0 (a), = f (a)g 0 (a) + f 0 (a)g(a), = f 0 (a)g(a) − f (a)g 0 (a) . g(a)2 Beweis. Die Aussagen ergeben sich folgendermaßen aus den Grenzwertsätzen: λf (x) − λf (a) f (x) − f (a) =λ → λf 0 (a), x−a x−a f (x) − f (a) g(x) − g(a) f (x) ± g(x) − (f (a) ± g(a)) = ± → f 0 (a) ± g 0 (a), b) x−a x−a x−a f (x)g(x) − f (a)g(a) g(x) − g(a) f (x) − f (a) c) = f (x) + g(a) → f (a)g 0 (a) + f 0 (a)g(a), x−a x−a x−a f (x)/g(x) − f (a)/g(a) f (x)g(a) − f (a)g(x) d) = = x−a (x − a)g(x)g(a) 1 f (x)g(a)−f (a)g(a) f (a)g(x)−f (a)g(a) 1 = − → (f 0 (a)g(a) − f (a)g 0 (a)). x−a x−a g(x)g(a) 2 g(a) a) Wir betrachten jetzt Superpositionen von Funktionen. Satz 7.6 (Die Kettenregel) Ist a ein innerer Punkt von D(g), ist g(a) ein innerer Punkt von D(f ) und sind g bei a und f bei g(a) differenzierbar, so ist auch F = f ◦ g bei a differenzierbar, und es gilt (f ◦ g)0 (a) = f 0 (g(a)) · g 0 (a). Beweis. Aus der Weierstraßschen Zerlegungsformel für f folgt f (g(x)) − f (g(a)) = [f 0 (g(a)) + ρf (g(x), g(a))] · (g(x) − g(a)), und für g folgt g(x) − g(a) = [g 0 (a) + ρg (x, a)] · (x − a). Einsetzen und Division durch (x − a) ergibt f (g(x)) − f (g(a)) = [f 0 (g(a)) + ρf (g(x), g(a))] · [g 0 (a) + ρg (x, a)] → f 0 (g(a)) · g 0 (a) x−a und für x → a. Unter Verwendung der Leibniz-Symbolik nimmt die Kettenregel die Form einer Kürzungsregel“ an: Sind nämlich f und g differenzierbar und ist z = f (g(x)) und ” y = g(x), so folgt dz dz dy = · . dx dy dx 90 7 DIFFERENTIALRECHNUNG Satz 7.7 (Ableitung der Umkehrfunktion) Die reelle Funktion f sei auf der offenen Teilmenge M ⊆ R stetig und habe die Umkehrfunktion g, die an der Stelle f (a) differenzierbar mit g 0 (f (a)) 6= 0 sei. Dann ist auch f bei a differenzierbar und es gilt f 0 (a) = 1 g 0 (f (a)) . Beweis. Aus Id = g ◦ f und der Zerlegungsformel für g folgt x − a = g(f (x)) − g(f (a)) = g 0 (f (a))(f (x) − f (a)) + ρg (f (x), f (a))(f (x) − f (a)). Die Division durch x − a und der Grenzübergang x → a ergibt nun 1= f (x) − f (a) 0 (g (f (a)) + ρg (f (x), f (a))) → f 0 (a)g 0 (f (a)), x−a also 1 = f 0 (a)g 0 (f (a)). Hieraus folgt die Behauptung. 7.8 (Historische Bemerkungen) Die Differential-Integralrechnung wurde unabhängig voneinander aber gleichzeitig von Gottfried Wilhelm Leibniz und Isaac Newton gegen Ende des 17. Jh. entwickelt. Für Leibniz stand im Zentrum des Interesses die differentielle Abhängigkeit eine Größe y von einer anderen Größe x. Das führte auf die Untersuchung der Differentialquotienten ∆y dy = lim . ∆x→0 dx ∆x Philosophisch wurde der Umgang mit den Differentialen von Leibniz durch seine Monadenlehre begründet. Newton benutzte die Differentialrechnung vor allem zur Beschreibung der zeitlichen Änderung physikalischer Größen. Er nannte diese zeitlichen Änderungen Fluxionen der Größen x = x(t) bzw. y = y(t), und er bezeichnete sie durch ∆x ∆t→0 ∆t ẋ(t) = lim Ableitungen von y und x traten bei Newton als Quotienten y 0 = ẏ/ẋ der Fluxionen auf. dy Wegen (7’) und (8) lässt sich dx in der Tat als Quotient ẏ/ẋ schreiben: dy dy dt dy 1 ẏ = · = · = . dx dx dt dx dt ẋ dt Das zeigt die Äquivalenz beider Begriffsapparate. Definition 7.9 (Höhere Ableitungen) Eine Funktion f heißt auf einer offenen Menge M zweimal differenzierbar, falls f 0 auf M existiert und selbst noch einmal differenzierbar ist. Die Funktion f 00 = (f 0 )0 heißt dann die zweite Ableitung von f . Entsprechend wird die k-te Ableitung im Fall der Existenz durch f (k) = (f k−1 )0 , k ≥ 1, definiert. Dabei setzt man noch f (0) = f . 7.2 Differentiation elementarer Funktionen 91 Abbildung 19: Takagi-Funktion g Aufgaben zu Abschnitt 7.1 1. Man berechne die Ableitung der Funktion f (x) = x2 an Hand der Definition. Man bestimme die Gleichung der Tangente an die Funktion f (x) = x3 + 1 im Punkt (2, f (2)). 2. (Takagi-Funktion) Es sei f : R → [0, 1] die 1-periodische Sägezahnfunktion, die auf dem Intervall [0, 1] durch f (x) = 2x für 0 ≤ x ≤ 0.5 und f (x) = 2 − 2x für 0.5 ≤ x ≤ 1 definiert ist. f (2k x) für k ∈ N sind immer feinere Abbilder von f . Zeigen Die Funktionen fk (x) = 2k Sie ∞ P fk (x) ist auf R gleichmäßig konvergent. (Daher a) Die Funktionenreihe g(x) = k=0 ist g stetig auf R. Die Funktion g heißt Takagi7 -Funktion, s. Abb. 19) b) Zeigen Sie, dass g in keinem Punkt x ∈ R differenzierbar ist. c) Zeigen Sie, dass g auf dem Intervall [0, 1] ebenso viele Maxima hat, wie es reelle Zahlen gibt. 7.2 Differentiation elementarer Funktionen In diesem Abschnitt leiten wir Differentiationsregeln für die uns interessierenden Funktionen her. Wir beginnen mit der Betrachtung von Polynomen. Satz 7.10 Die Ableitung der Funktion fn (x) = xn ist fn0 (x) = n xn−1 für alle n ∈ N. Beweis. Wir beweisen die Aussage induktiv. Für n = 0 ist f0 (x) ≡ 1. Daher ist f00 ≡ 0. 0 Für n > 0 ergibt sich induktiv aus der Produktregel fn+1 (x) = (xn+1 )0 = (x xn )0 = 1 · xn + nxxn−1 = (1 + n)xn . Folgerung 7.11 Für P (x) = n P l=0 7 Teiji Takagi 1875-1969, Tokio an xk ist P 0 (x) = n P k=1 kak xk−1 . 92 7 DIFFERENTIALRECHNUNG Beweis. Die Formel folgt aus der Summenregel und aus Satz 7.10. Satz 7.12 (Differentiation von Potenzreihen) Ist f (x) = ∞ X an xk eine Potenzreihe h=0 mit einem Konvergenzradius R > 0, so gilt 0 f (x) = ∞ X kak xk−1 k=1 im Innern des Konvergenzkreises, und die Konvergenzradien beider Reihen sind gleich. (Bemerkung: Satz und Beweis sind ebenso für komplexe Potenzreihen richtig.) Beweis. Wir setzen g(x) = ∞ P kak xk−1 und h(x) = p k |k ak | = lim k|ak |xk−1 . Wegen k=1 k=1 lim sup ∞ P √ k k · lim sup p k |ak | = lim sup p k |ak | = R−1 sind die Konvergenzradius von g und h ebenfalls gleich R. Wir berechnen nun die Ableitung von f an einer beliebigen Stelle a mit |a| < R. Dazu zerlegen wir X X f (x) = fN (x) + ϕN (x) = ak x k + ak x k , k≤N g(x) = gN (x) + γN (x) = X k≤N h(x) = hN (x) + ηN (x) = X k≤N k>N kak xk−1 + X kak xk−1 und k>N k|ak |xk−1 + X k|ak |xk−1 . k>N Nun sei a mit |a| < R beliebig gegeben. Wir wählen eine Zahl r mit |a| < r < R. Wegen X ϕN (x) − ϕN (a) X xk − ak = ak = ak (xk−1 + axk−2 + . . . + ak−1 ) x−a x − a k>N k>N ist ϕN (x) − ϕN (a) X ≤ |ak | krk−1 = ηN (r) für alle |x| < r. x−a k>N Für den Differenzenquotienten von f bei a gilt dann f (x) − f (a) fN (x) − fN (a) ϕN (x) − ϕN (a) + |γN (a)| − g(a) ≤ − gN (a) + x−a x−a x−a fN (x) − fN (a) ≤ − gN (a) + 2|ηN (r)|. x−a Für gegebenes ε > 0 wählt man nun eine Zahl N so, dass |ηN (r)| < ε ist. Wegen fN0 (a) = gN (a) nach Folgerung 7.11 existiert eine Zahl δ ≤ r − |a| so, dass fN (x) − fN (a) − gN (a) < ε für |x − a| < δ x−a 7.2 Differentiation elementarer Funktionen 93 ausfällt. Daher gilt für alle |x − a| < δ die Abschätzung f (x) − f (a) ≤ 3 ε. − g(a) x−a Das zeigt die Existenz des Grenzwertes und auch die Gleichung f 0 (a) = g(a). Der Satz 7.12 ist speziell anwendbar auf die Potenzreihendarstellung der Funktionen ex , sin x und cos x (s. Aufgabe 2). Wir berechnen die Ableitungen dieser Funktionen aber auch auf die folgende, alternative Weise. Satz 7.13 Für alle x ∈ R gilt (ex )0 = ex . Beweis. Es ist ex − ea et − 1 ex−a − 1 = lim ea = ea lim = ea . x→a x − a x→a t→0 x−a t lim Satz 7.14 Für alle x > 0 gilt (ln x)0 = x1 . Beweis. Die Funktion f (x) = ln x hat die Umkehrfunktion g(y) = ey mit g 0 (y) = ey . Die Formel für die Differentiation der Umkehrkfunktion ergibt dann f 0 (x) = 1 g 0 (f (x)) = 1 ef (x) = 1 eln x = 1 . x Folgerung 7.15 Für alle x > 0 und α 6= 0 gilt (xα )0 = α xα−1 . Beweis. Es ist xα = eα ln x , und die Kettenregel ergibt (xα )0 = (eα ln x )0 = eα ln x · α · 1 = α xα−1 . x Satz 7.16 Für alle x ∈ R gelten (sin x)0 = cos x, (cos x)0 = − sin x. Beweis. Mit a = x + h 2 und b = h 2 ergibt sich aus den Additionstheoremen die Gleichung h h sin(x + h) − sin x = sin(a + b) − sin(a − b) = 2 cos a · sin b = 2 cos x + sin . 2 2 Für h → 0 folgt nach Satz 6.35 hieraus sin(x + h) − sin x h sin(h/2) = cos x + · → cos x. h 2 h/2 Also ist (sin x)0 = cos x. Schließlich gilt π 0 π 0 (cos x) = sin(x + ) = cos(x + ) = − sin x. 2 2 94 7 DIFFERENTIALRECHNUNG Satz 7.17 Für alle − π2 < x < π 2 gilt (tan x)0 = 1 + tan2 x = Beweis. Die Aussage folgt aus tan x = sin x cos x 1 2 cos x . und der Quotientenregel. Satz 7.18 Für alle −1 < x < 1 gelten (arcsin x)0 = √ 1 1−x2 1 und (arccos x)0 = − √1−x 2. Beweis. Die Umkehrfunktion zu f (x) = arcsin x ist g(y) = sin y. Daher ist f 0 (a) = 1 g 0 (f (a)) = 1 1 1 =p =p 2 cos(arcsin x) 1 − sin (arcsin x) 1 − sin2 x wegen cos(arcsin x) > 0 für −1 < x < 1. Bemerkung 7.19 Zur Berechnung von Ableitungen ist manchmal die Formel der sogenannten logarithmischen Differentiation nützlich: Mit f (x) = ln g(x) gilt f 0 (x) = · g 0 (x) nach der Kettenregel. Hieraus folgt 1 g(x) g 0 (x) = g(x) · f 0 (x) als Formel für die Ableitung von g. Aufgaben zu Abschnitt 7.2 1. Man berechne die Ableitungen folgender Funktionen: √ a) f (x) = x + 1, b) f (x) = sin(2 x2 + 1), c) f (x) = x2 e2x , d) f (x) = xx . 2. Berechnen Sie die Ableitungen der Funktionen ex , sin x und cos x durch Differentiation der Potenzreihendarstellungen dieser Funktionen. 3. Fügen Sie durch geeignete Wahl der Parameer a, b die Funktionen f (x) = e2x für x ≥ 0 und g(x) = x2 + ax + b für x < 0 so zusammen, dass eine auf ganz R differenzierbare Funktion h(x) entsteht. 4. Prüfen Sie, ob die Funktion f (x) = x2 · sgnx auf R differenzierbar ist und berechnen Sie ggf. die Ableitung. (Graphische Darstellung von f und f 0 ?) 5. Zeigen Sie, dass die Ableitung der Funktion f (x) = x2 sin x1 für x 6= 0 und f (0) = 0 überall existiert, dass aber f 0 aber nicht überall stetig ist. 6. Die Funktionen Jn (x) = ∞ X (−1)k ( x )2k+n 2 k=0 (n + k)! k! , n ∈ N, heißen Bessel-Funktionen erster Art. Zeigen Sie 2Jn0 = Jn−1 − Jn+1 . 7.3 Mittelwertsätze der Differentialrechnung 7.3 95 Mittelwertsätze der Differentialrechnung Die sogenannten Mittelwertsätze der Differentialrechnung spielen eine zentrale Rolle bei allen Aussagen, bei denen aus Eigenschaften der Ableitung einer Funktion auf die Funktion selbst zurückgeschlossen werden soll. Grob gesagt erlauben sie es, Funktionswertdifferenzen durch Ableitungen auszudrücken. Satz 7.20 (Satz von Michel Rolle (1690–1719)) Ist f stetig auf [a, b], differenzierbar auf (a, b) und gilt f (a) = f (b) = 0, so existiert mindestens ein Punkt ξ ∈ (a, b) mit f 0 (ξ) = 0. Beweis. Da f als differenzierbare Funktion auch auf [a, b] stetig ist, existieren wegen des Satzes vom Minimum und Maximum zwei Zahlen x1 , x2 ∈ [a, b] mit f (x1 ) ≤ f (x) ≤ f (x2 ) für alle x ∈ [a, b]. Insbesondere ist f (x2 ) ≥ f (a) = 0. Gilt dabei sogar f (x2 ) > 0, so ist sicher x2 ∈ (a, b). Daher existiert f 0 (x2 ). Wegen f (x2 + h) − f (x2 ) ≤ 0 für h > 0, ≥ 0 für h < 0 h gilt dann aber f (x2 + h) − f (x2 ) = 0, h→0 h und ξ = x2 genügt der Behauptung des Satzes. Im Fall f (x2 ) = 0 betrachten wir den Minimumpunkt x1 . Gilt auch f (x1 ) = 0, so ist f ≡ 0 auf [a, b] und daher auch f 0 (x) = 0 für alle x ∈ (a, b). Ist aber f (x1 ) < 0, so betrachten wir die Funktion g(x) = −f (x), die bei x1 ein Maximum g(x1 ) = −f (x1 ) > 0 hat. Daher gilt nach dem bereits diskutierten Fall 0 = g 0 (x1 ) = −f 0 (x1 ), und ξ = x1 ist eine gesuchte Nullstelle von f 0 . f 0 (x2 ) = lim Als Verallgemeinerung ergibt sich der Satz 7.21 (Mittelwertsatz der Differentialrechnung) Ist f auf [a, b] stetig und auf (a, b) differenzierbar, so existiert ein Punkt a < ξ < b mit f 0 (ξ) = f (b) − f (a) . b−a Jeder Differenzenquotient ist also als Ableitung realisierbar. Beweis. Die Gerade durch die Punkte P1 = (a, f (a)) und P2 = (b, f (b)) ist durch die Gleichung g(x) = f (b) − f (a) f (b) − f (a) (x − a) + f (a) mit der Ableitung g 0 (x) = b−a b−a gegeben. Die Differenzfunktion h(x) = f (x) − g(x) erfüllt wegen h(a) = f (a) − g(a) = 0 und h(b) = f (b) − g(b) = 0 die Voraussetzungen des Satzes von Rolle. Daher existiert ein ξ ∈ (a, b) mit 0 = h0 (ξ) = f 0 (ξ) − g 0 (ξ). Also ist f 0 (ξ) = g 0 (ξ) = f (b) − f (a) . b−a 96 7 DIFFERENTIALRECHNUNG Abbildung 20: Der Mittelwertsatz der Differentialrechnung Satz 7.22 (2. Version des Mittelwertsatzes) Es sei h > 0 und f sei auf dem Intervall [a − h, a + h] stetig und auf (a − h, a + h) differenzierbar. Dann existiert eine von a und h abhängige Zahl 0 < θ < 1 derart, dass f (a + h) = f (a) + h f 0 (a + θ h). Beweis. Wir setzen F (t) = f (a + th). Dann ist F auf [0, 1] stetig und auf (0, 1) differenzierbar. Nach dem Mittelwertsatz, Satz 7.21, existiert daher eine Zahl 0 < θ < 1 mit F 0 (θ) = F (1) − F (0) = f (a + h) − f (a). 1 Da wegen der Kettenregel die Gleichung F 0 (θ) = h · f 0 (a + θ h) gilt, folgt hieraus die Behauptung. Als erste globale Konsequenz ergibt sich: Folgerung 7.23 Gilt f 0 (x) = 0 für alle x ∈ (a, b), so ist f ≡ const auf (a, b). Beweis. Es seien a < x1 < x2 < b beliebig gegeben. Wegen Satz 7.21 existiert eine Zahl ξ mit x1 ⊂ ξ < x2 und f (x2 ) − f (x1 ) = f 0 (ξ). x2 − x1 Da aber f 0 (ξ) = 0 nach Voraussetzung gilt, ergibt sich f (x1 ) = f (x2 ). Auf (a, b) sind also alle Funktionswerte von f untereinander gleich. Satz 7.24 Gilt f 0 (x) = g 0 (x) für zwei differenzierbare Funktionen f und g auf einem Intervall (a, b), so unterscheiden sich f und g nur durch eine Konstante. Beweis. Die Differenzfunktion h(x) = f (x) − g(x) erfüllt die Voraussetzungen von Satz 7.23 und ist daher konstant. Satz 7.25 (Verallgemeinerter Mittelwertsatz) Es seien f und g auf [a, b] stetig, auf (a, b) differenzierbar und es sei g 0 (x) 6= 0 auf (a, b). Dann existiert eine Zahl ξ ∈ (a, b) mit f (b) − f (a) f 0 (ξ) = 0 . g(b) − g(a) g (ξ) 7.3 Mittelwertsätze der Differentialrechnung 97 Beweis. Wäre g(a) = g(b), so gäbe es nach dem Mittelwertsatz eine Zahl x ∈ (a, b) mit g 0 (x) = 0. Daher ist g(a) 6= g(b). Wir setzen p(x) = f (x) − λ g(x) mit λ= f (b) − f (a) . g(b) − g(a) Dann ist offenbar p(a) = p(b). Nach dem Mittelwertsatz existiert daher ein a < ξ < b mit p0 (ξ) = 0. Also ist 0 = f 0 (ξ) − λ g 0 (ξ), und hieraus folgt die Behauptung des Satzes. Satz 7.26 (Die Regel von Bernoulli–de l’Hospital) Es seien f und g zwei in einer Umgebung von x0 differenzierbare Funktionen mit f (x0 ) = g(x0 ) = 0. Existiert dann der rechts stehende Limes, so existiert auch der andere und es gilt lim x→x0 f (x) f 0 (x) = lim 0 . g(x) x→x0 g (x) Beweis. Nach dem verallgemeinerten Mittelwertsatz existiert zu x und x0 ein ξx zwischen x und x0 mit f (x) − g(x0 ) f 0 (ξx ) f (x) = = 0 . g(x) g(x) − g(x0 ) g (ξx ) Da mit x → x0 auch ξx → x0 gilt, folgt aus der Existenz des rechts stehenden Limes auch die Existenz des links stehenden Limes und die gewünschte Gleichheit. Die Regel von Bernoulli–de l’Hospital ist sehr leistungsstark. Wir demonstrieren sie an einigen Beispielen. Manchmal ist es dabei sinnvoll, die Regel wiederholt anzuwenden. Überdies kann die Regel auch auf einseitige Grenzwerte und durch die Transformation x → 1/x auch auf Grenzwerte mit x → ∞ übertragen werden. a) b) c) x lim sin x = lim cos x2− 1 x = 2 lim xx x→∞ e = x→0 x→0 x lim cos 1 = sin x lim − 2x = lim 2x ex = x→0 x→0 x→∞ 1. x lim − cos 2 = − 21 . lim 2x e = x→0 x→∞ 0. Aufgaben zu Abschnitt 7.3 1. Zeigen Sie: Gilt f 0 (x) ≥ 0 auf einem Intervall (a, b), so ist f auf diesem Intervall monoton wachsend. 2. Man beweise: Ist eine Funktion f auf [0, 1] stetig und auf (0, 1) differenzierbar, gilt ferner f (0) = 0 und gibt es eine Konstante K ≥ 0 mit |f 0 (x)| ≤ K|f (x)| für alle x ∈ (0, 1), so ist f auf dem Intervall [0, 1] identisch Null. 98 7 DIFFERENTIALRECHNUNG 3. Man berechne die Limites a) 7.4 lim ln x , b) x→∞ x √ lim x ln x, c) lim x→1 x&0 1 − x2 , d) 2x 1 1 − . x→0 sin x x + x2 lim Der Satz von Taylor Wir stellen uns die Aufgabe, eine gegebene Funktion f in einer geeigneten Umgebung U (x0 ) eines Punktes x0 durch Polynome Pn zu approximieren. Die Polynome sind dabei zweckmäßiger Weise in folgender Form gegeben: Pn (x) = n X ak (x − x0 )k k=0 Wir suchen also eine Zerlegung f (x) = Pn (x) + Rn+1 (x0 , x) mit einer Fehlerfunktion Rn+1 = Rn+1 (x0 , x), die für x → x0 möglichst schnell“ gegen ” Null streben sollte. Diese Situation ist auf jeden Fall für solche Funktionen f (x) = ∞ X ak (x − x0 )k k=0 gegeben, die durch Potenzreihen erzeugt werden, wenn man für die Polynome Pn einfach die Partialsummen n X ak (x − x0 )k Pn (x) = k=0 wählt. Wir stellen nun die Frage, wie die Koeffizienten ak durch die Funktion f ausgedrückt werden können. Satz 7.27 Gilt f (x) = ∞ P ak (x − x0 )k in U (x0 ), so ist ak = k=0 ak = f (k) (x0 ) , k! f (k) (x0 ) , k ∈ N. k! k ∈ N. Beweis. Potenzreihen können gliedweise differenziert werden. Daher ist f (n) (x) = ∞ X k=n ak k! (x − x0 )k−n , (k − n)! und hieraus folgt f (n) (x0 ) = an · n!. Das ergibt die Behauptung. Satz 7.28 (Identitätssatz für Potenzreihen, Prinzip des Koeffizientenvergleichs) ∞ ∞ X X Aus ak (x − x0 )k = bk (x − x0 )k für alle x ∈ U (x0 ) folgt ak = bk für alle k ∈ N. k=0 k=0 7.4 Der Satz von Taylor 99 Beweis. Definiert man eine Funktion f durch die obigen wertverlaufsgleichen Potenzreif (k) (x0 ) = bk . hen, so folgt aus Satz 7.27 die Gleichung ak = k! Die soeben gefundenen Einsichten legen die folgenden Begriffsbildungen nahe: Definition 7.29 (Taylorformel) Es sei f eine beliebige Funktion, die in einer Umgebung U (x0 ) n-mal differenzierbar ist. Unter den Taylor-Koeffizienten von f bei x0 versteht man die Zahlen ak = f (k) (x0 ) für 0 ≤ k ≤ n. k! Unter dem Taylor-Polynom zu f vom Grad n an der Stelle x0 versteht man das Polynom n X f (k) (x0 ) f 0 (x0 ) f (n) (x0 ) (x − x0 )k = f (x0 ) + (x − x0 ) + . . . + (x − x0 )n . Pn (x) = k! 1! n! k=0 Unter dem Restglied der Ordnung n + 1 versteht man den Ausdruck Rn+1 (x0 , x) = f (x) − Pn (x). Unter der Taylorformel versteht man schließlich die Formel n X f (k) (x0 ) f (x) = Pn (x) + Rn+1 (x0 , x) = (x − x0 )k + Rn+1 (x0 , x), k! k=0 Das Hauptproblem besteht nun in einer Fehlerabschätzung für das Restglied Rn+1 , denn erst dann ist die Taylorformel zur Approximation zu gebrauchen. Dies ist der Inhalt des folgenden Satzes: Satz 7.30 (Satz von Taylor) Die Funktion f sei in U (x0 ) (n + 1)–mal stetig differenzierbar. Dann lässt sich das Restglied Rn+1 (x0 , x) für jedes x ∈ U (x0 ) wie folgt durch die (n + 1)–te Ableitung von f ausdrücken: Rn+1 (x0 , x) = f (n+1) (x0 + ϑL (x − x0 )) (x − x0 )n+1 für ein 0 < ϑL < 1 (n + 1)! (Restglied nach Lagrange), bzw. Rn+1 (x0 , x) = f (n+1) (x0 + ϑC (x − x0 )) (x − x0 )n+1 (1 − ϑC )n für ein 0 < ϑC < 1 n! (Restglied nach Cauchy). 100 7 DIFFERENTIALRECHNUNG Beweis. Es sei 1 ≤ k ≤ n + 1. Es sei x ∈ U (x0 ) mit x > x0 fixiert. Wir wollen den Quotienten Rn+1 (x0 , x)/(x − x0 )k untersuchen und definieren hierzu für t ∈ [x0 , x] die Funktionen n X f (k) (t) (x − t)k F (t) = Rn+1 (t, x) = f (x) − k! k=0 und Gk (t) = (x − t)k . Für die Randpunkte t = x0 bzw. t = x folgt dann F (x0 ) Gk (x0 ) = Rn+1 (x0 , x) , = (x − x0 )k , F (x) Gk (x) = 0, = 0. Zur Anwendung des verallgemeinerten Mittelwertsatzes berechnen wir vorbereitend die Ableitungen von F und G nach t. Es sind F 0 (t) = − n n X X f (k+1) (t) f (k) (t) f (n+1) (t) (x − t)k + (x − t)k−1 = − (x − t)n , k! (k − 1)! n! k=0 k=1 G0k (t) = −k(x − t)k−1 . Nach dem verallgemeinerten Mittelwertsatz gibt es dann eine Zahl ξk ∈ (x0 , x) mit F (x0 ) − F (x) F 0 (ξk ) f (n+1) (ξk )(x − ξk )n f (n+1) (ξk ) Rn+1 (x0 , x) = = = = (x − ξk )n+1−k . (x − x0 )k G(x0 ) − G(x) G0 (ξk ) k · n!(x − ξk )k−1 k · n! Setzt man ϑk = ξk − x0 , x − x0 so ist ξk = x0 + ϑk (x − x0 ) und x − ξk = (x − x0 )(1 − ϑk ). Die Auflösung obiger Formel nach Rn+1 ergibt Rn+1 (x0 , x) = = f (n+1) (ξk ) · (x − x0 )k · (x − ξk )n+1−k k · n! f (n+1) (x0 + ϑk (x − x0 )) (x − x0 )n+1 (1 − ϑk )n+1−k . k · n! Für k = n + 1 folgt hieraus die Lagrange–Darstellung, für k = 1 die Cauchy–Darstellung für das Restglied Rn+1 . Für den häufig auftretenden Spezialfall x0 = 0 ergibt der Satz von Taylor die Darstellung f (x) = n X f (k) (0) k f (n+1) (ϑ x) n+1 x + x , k! (n + 1)! k=0 die man auch als MacLaurin-Formel bezeichnet. 7.4 Der Satz von Taylor 101 Beispiel 7.31 Wir betrachten das Beispiel f (x) = (1 + x)α für x > −1 und α > 0. Für α = n ∈ N ergibt sich aus der binomischen Formel die Darstellung n f (x) = (1 + x) = n X n k=0 k xk . Für α 6∈ N ist eine Verallgemeinerung dieser Formel zu erwarten. Wir berechnen die Taylorkoeffizienten an der Stelle x0 = 0: f (x) = (1 + x)α f 0 (x) = α(1 + x)α−1 .. . (k) f (x) = α · (α − 1) · . . . · (α − k + 1) (1 + x)α−k . Somit ist f (k) (0) α · . . . · (α − k + 1) ak = = = k! k! α . k Mit Cauchys Darstellung des Restgliedes folgt n X α k α (1 + x) = x + (1 + ϑ x)α−n−1 (n + 1)xn+1 (1 − ϑ)n . k n + 1 k=0 α Für α = 1 2 und n = 1 ergibt sich die einfache Näherungsformel √ 1+x≈1+ 1 x. 2 Die Fehlerfunktion 1 R2 (0, x) = kann für |x| < 1 2 2 2 (1 + ϑ x)−3/2 · 2 · x2 (1 − ϑ) dann durch |R2 (0, x)| ≤ 1 · 23/2 · 2 · x2 ≤ x2 4·2 abgeschätzt werden. Also ist √ 1 + x − 1 + 1 x ≤ |x|2 für |x| < 1 . 2 2 Beispielsweise ist p 1, 1 = 1, 05 ± 0, 01. Dieses Verfahren ist auf zahlreiche weitere Funktionen anwendbar. Dabei ergibt sich die Tabelle: 102 7 DIFFERENTIALRECHNUNG Funktion Näherung Fehlerordnung 1 1+x 1−x |x|2 sin x x |x|3 cos x 1 |x|2 sin x x− x3 6 |x|5 cos x 1− x2 2 |x|4 x−1 |x|2 ln(1 + x) Aufgaben zu Abschnitt 7.4 1. Geben Sie die Taylorformel für die Funktion f (x) = sin(x) bei Entwicklung an der Stelle x0 = 0 bis zur Ordnung 2k + 1 an. 2. Geben Sie die Taylorformel für die Funktion f (x) = ln(1 + x) bei Entwicklung an der Stelle x0 = 0 bis zur Ordnung k an. 7.5 Taylorreihen und analytische Funktionen Wir untersuchen in diesem Abschnitt die Darstellung von Funktionen als Potenzreihen. Definition 7.32 (Analytische Funktionen) Eine Funktion f heißt analytisch im Punkt x0 ∈ D(f ), wenn es eine Umgebung U (x0 ) von x0 und eine auf U (x0 ) konvergente Potenzreihe so gibt, dass f (x) = ∞ X ak (x − x0 )k für alle x ∈ U (x0 ) k=0 gilt. Ist f in einer Umgebung U (x0 ) beliebig (= unendlich) oft differenzierbar, so kann man die Taylorreihe zu f ∞ X f (k) (x0 ) T (x) = (x − x0 )k k! k=0 bilden. Dabei ist weder die Konvergenz der Reihe noch die Wertverlaufsgleichheit zu f (x) für Punkte x 6= x0 ohne zusätzliche Voraussetzungen gesichert. Ein Gegenbeispiel ist in Aufgabe 4 angegeben. 7.5 Taylorreihen und analytische Funktionen 103 Satz 7.33 (Hauptsatz über analytische Funktionen) Folgende Bedingungen sind äquivalent: (a) f ist analytisch bei x0 ∈ D(f ). (b) Es existiert eine Umgebung U (x0 ), auf der f mit seiner Taylorreihe übereinstimmt. (c) Es existiert eine Umgebung U (x0 ) von x0 , in der f beliebig oft differenzierbar ist und auf der lim Rn (x0 , x) = 0 für alle x ∈ U (x0 ) n→∞ gilt. Dabei bezeichnet Rn (x0 , x) das Restglied der Ordnung n bei der Entwicklung von f bei x0 . (d) Es existiert eine Umgebung U (x0 ) von x0 und eine Zahl K > 0 so, dass f auf U (x0 ) beliebig oft differenzierbar ist und die folgende Abschätzung erfüllt |f (k) | ≤ k! · K k für alle x ∈ U (x0 ) und alle k ∈ N. Beweis. Wegen Satz 7.28 und Definition 7.29 sind die Beziehungen (a), (b) und (c) äquivalent. Es gelte nun (a), es sei also f (x) = ∞ X ak (x − x0 )k für x ∈ U (x0 ). k=0 Der Konvergenzradius der Reihe sei R > 0. Dann ist sicherlich p 1 lim sup k |ak | = < ∞. R Daher existiert eine Zahl K0 < ∞ mit |ak | ≤ K0k Weiter ist f (n) (x) = ∞ X für alle k ∈ N. k(k − 1) · . . . · (k − n + 1)ak (x − x0 )k−n . k=n Wir wählen nun eine Zahl 0 < r < R mit q = r K0 < 1. Für |x − x0 | < r folgt dann |f (n) (x)| ≤ ∞ X k · . . . · (k − n + 1) · K0k k−n ·r n = K0n k=n = K0n k · . . . · (k − n + 1) q k−n k=n n = K0n ∞ X d d qn ∞ X k=0 ! qk = K0n d d qn 1 1−q n! K0n · ≤ n! = n! K n mit K = K0 /(1 − q)2 . n+1 2n (1 − q) (1 − q) Das beweist (d). Umgekehrt ergibt die Bedingung (d) die folgende Abschätzung für das Restglied (n) f (x0 + ϑ(x − x0 )) n (x − x0 ) ≤ K n · |x − x0 |n = (K|x − x0 |)n → 0 Rn (x0 , x) = n! für |x − x0 | < 1 . K Also gilt (c). 104 7 DIFFERENTIALRECHNUNG Beispiel 7.34 Wir betrachten einige Beispiele und werden dabei Reihendarstellungen für wichtige klassische Funktionen erhalten. Bereits bekannt sind die folgenden Reihendarstellungen, die wegen Satz 7.28 die einzig möglichen Darstellungen sind. Insbesondere stimmen die Koeffizienten in diesen Reihen mit den Taylorkoeffizienten überein. ∞ P xk , x∈R. (4.1) ex = k! (4.2) (4.3) sin x cos x = = k=0 ∞ P k=0 ∞ P (−1)k x2k+1 , (2k+1)! x ∈ R. (−1)k x2k , (2k)! x ∈ R. k=0 Wir erhalten aber auch die folgenden bisher nicht bekannten Darstellungen: ∞ k P α (4.4) (1 + x)α = x , −1 < x < 1, α ∈ R (Binomialreihe) k (4.5) (4.6) ln(1 + x) arctan x = = k=0 ∞ P k=1 ∞ P k=0 (−1)k−1 k xk , (−1)k x2k+1 , 2k+1 −1 < x ≤ 1 −1 < x ≤ 1. Beweis zu (4.4): Wir benutzen die in Beispiel 7.31 hergeleitete Restgliedformel α Rn+1 (0, x) = (n + 1)xn+1 · (1 + ϑ x)α−n−1 (1 − ϑ)n . n+1 α Wir setzen an+1 = n+1 (n + 1) und bn+1 = (1 + ϑ x)α−n−1 (1 − ϑ)n . Dann ist 1 − ϑ n |1 + ϑ x|α−1 ≤ |1 + ϑ x|α−1 |bn+1 | = 1 + ϑ x für alle x ∈ (−1, 1). Daher ist die Folge (bn ) beschränkt. Um an+1 xn+1 → →∞ P 0 für nn+1 und alle |x| < 1 zu zeigen, weisen wir sogar die Konvergenz der Reihe an+1 x für |x| < 1 nach. Dazu berechnen wir den Konvergenzradius. Es ist α(α − 1) · . . . · (α − n) · n! · (n + 1) α − n an+1 an = (n + 1)!α(α − 1) · . . . · (α − n + 1) · n = n → 1. Also ist der Konvergenzradius 1. Hieraus folgt an+1 xn+1 → 0 für |x| < 1, und damit ist Rn+1 (0, x) → 0 bewiesen. Beweis zu (4.5): Eine Möglichkeit würde ähnlich wie bei (4.4) in der Untersuchung des Restgliedes bestehen. Wir gehen aber auf eine andere Weise vor. Dazu betrachten wir die beiden Funktionen ∞ X (−1)k−1 k f (x) = ln(1 + x) und g(x) = x . k k=1 Der Konvergenzradius der Reihe ist offensichtlich R = 1. Daher gilt !0 ∞ ∞ k−1 X X (−1) 1 g 0 (x) = xk = (−1)k xk = k 1+x k=1 k=0 7.5 Taylorreihen und analytische Funktionen 105 1 für alle −1 < x < 1. Andererseits ist f 0 (x) = 1+x . Das zeigt f 0 (x) = g 0 (x) auf (−1, 1). Wegen Satz 7.24 ist dann f (x) = g(x)+ const auf (−1, 1). Für x = 0 ergibt sich 0 = ln 1 = f (0) = g(0) + const = 0 + const, also ist const = 0. Das zeigt f = g auf (−1, 1). Beweis zu (4.6): Wir gehen wie in (4.5) vor. Es gilt ∞ X 1 (arctan x) = = (−1)k x2k = 2 1+x k=0 0 ∞ X (−1)k x2k+1 2k + 1 k=0 !0 für alle x mit |x| < 1. Daraus folgt arctan x = ∞ X (−1)k x2k+1 + c, 2k + 1 k=0 und für x = 0 ergibt sich c = 0. P Satz 7.35 (Abelscher Grenzwertsatz) Ist f (x) = ak xk konvergent auf (−R, R) ∞ X P und konvergiert auch noch ak Rk , so gilt lim f (x) = ak R k . x%R k=0 Wir verzichten auf den Beweis dieses Satzes, wollen ihn aber auf die Reihen (4.5) und (4.6) anwenden. (Einen vollständigen Beweis findet der Leser in Mangoldt–Knopp, Höhere Mathematik Bd. 2 oder in Heuser, Lehrbuch der Analysis, Bd. 1.) Für x = 1 ist auf beide Reihen das Leibnizkriterium anwendbar, womit die Konvergenz gegeben ist. Hieraus folgen die interessanten Formeln ln 2 = und ∞ ∞ X 1 1 1 (−1)k−1 X (−1)k = =1− + − + − k k+1 2 3 4 k=0 k=1 ∞ π X (−1)k 1 1 1 = = 1 − + − + −..., 4 2k + 1 3 5 7 k=0 denn es ist arctan 1 = π4 , was man wie folgt sieht: Aus cos x = − sin(x − π2 ) folgt π/4 cos π/4 = sin(π/4) und somit ist tan π4 = cos = 1. Damit haben wir erstmals eine sin π/4 Reihendarstellung für π erhalten: ∞ X (−1)k 1 1 π=4 = 4 1 − + − +... . 2k + 1 3 5 k=0 Leider konvergiert die Reihe aber sehr langsam, nach dem Leibnizkriterium hat man ja nur 4 |π − sn | ≤ 2n+1 . Die praktische Berechnung von π kann wie folgt erfolgen. Grundlage ist das Additionstheorem tan x + tan y tan(x + y) = . 1 − tan x tan y 106 7 DIFFERENTIALRECHNUNG 5 120 Mit α = arctan 15 folgen tan α = 15 , tan 2α = 12 und tan 4α = 119 . Mit β = 4α − dann 120 −1 tan 4α − tan π4 1 119 tan β = = . π 120 = 1 + tan 4α tan 4 239 1 + 119 π 4 folgt Somit ist (mit n = 8) π 1 1 = 4α − β = 4 arctan − arctan = 4 · 0.197395 − 0.004184 ± 10−6 = 0.785396 ± 10−6 . 4 5 239 π = 3.14159 ± 10−5 Das zeigt schließlich Aufgaben zu Abschnitt 7.5 1. Man finde Reihendarstellungen für die sogenannten hyperbolischen Funktionen sinh x = ex − e−x , 2 cosh x = ex + e−x 2 bei Entwicklung um 0. 2. Man finde die Reihendarstellung für die folgende Funktion zum Entwicklungspunkt x0 = 0: sin x für x 6= 0, f (0) = 1. f (x) = x 3. Man finde die Reihendarstellung für die folgende Funktion zum Entwicklungspunkt x0 = 0: 1+x . f (x) = ln 1−x 4. Man zeige durch vollständige Induktion, dass die Funktion f (x) = e−1/x 0 2 für x 6= 0 für x = 0 beliebig oft differenzierbar ist und dass f (k) (0) = 0 für alle k ∈ N gilt. Insbesondere ist f bei x0 = 0 beliebig oft differenzierbar aber dort nicht analytisch. 7.6 Kurvendiskussionen Die Differentialrechnung ist ein unverzichtbares Hilfsmittel für die Diskussion von Funktionsgraphen. Wir stellen hier die wichtigsten Ergebnisse zusammen. Satz 7.36 Gilt f 0 (x) ≥ 0 für alle x ∈ (a, b), so ist f auf (a, b) monoton wachsend. Gilt sogar f 0 (x) > 0 auf (a, b), so ist f auf (a, b) streng monoton wachsend. 7.6 Kurvendiskussionen 107 Beweis. Angenommen, f wäre nicht (streng) monoton wachsend auf (a, b). Dann würde es Zahlen x1 , x2 ∈ (a, b) mit x1 < x2 und f (x1 ) > f (x2 ) bzw. f (x1 ) ≥ f (x2 ) geben. Nach dem Mittelwertsatz existierte dann aber eine Zahl ξ ∈ (x1 , x2 ) mit f( ξ) = f (x2 ) − f (x1 ) < 0 bzw. x2 − x1 ≤0 im Widerspruch zur vorausgesetzten Positivität der ersten Ableitung. Definition 7.37 Es sei f eine Funktion aus R in R, und es sei x0 ∈ D(f ). (a) f hat bei x0 ein (absolutes) Maximum, wenn f (x0 ) ≥ f (x) für alle x ∈ D(f ) gilt. (b) f hat bei x0 ein lokales Maximum bzw. ein eigentliches lokales Maximum, wenn eine δ–Umgebung Uδ (x0 ) so existiert, dass f (x0 ) ≥ f (x) bzw. f (x0 ) > f (x) für alle x ∈ D(f ) ∩ Uδ0 (x0 ) gilt. Entsprechend werden die Begriffe Minimum, lokales Minimum und und eigentliches lokales Minimum definiert. Oberbegriffe sind Extremwert und lokaler Extremwert. Die Differentialrechnung ist ein leistungsfähiges Hilfsmittel zur Ermittlung lokaler Extremwerte. Satz 7.38 (Notwendiges Kriterium) Ist die Funktion f bei x0 differenzierbar und hat f bei x0 einen lokalen Extremwert, so gilt f 0 (x0 ) = 0. Beweis. Ohne Beschränkung der Allgemeinheit habe f bei x0 ein lokales Maximum, es sei also f (x) ≤ f (x0 ) für alle x ∈ Uδ (x0 ). f (x) − f (x0 ) x − x0 Dann ist Daher ist 0 ≤ lim x%x0 ( ≥0 für x ≤ x0 , x ∈ Uδ (x0 ) ≤0 für x ≥ x0 , x ∈ Uδ (x0 ). f (x) − f (x0 ) f (x) − f (x0 ) = f 0 (x0 ) = lim ≤ 0, also f 0 (x0 ) = 0. x&x0 x − x0 x − x0 Satz 7.39 (Erstes Hauptkriterium für Extremwerte) Die reelle Funktion f sei in einer Umgebung U (x0 ) definiert und erfülle folgende Bedingungen: (a) f ist differenzierbar in U (x0 ). (b) f 0 (x0 ) = 0. (c) Für alle x ∈ U (x0 ) gilt f 0 (x) < 0 im Fall x < x0 und f 0 (x) > 0 im Fall x > x0 (f 0 hat bei x0 einen Vorzeichenwechsel). Dann hat f bei x0 ein eigentliches Minimum. 108 7 DIFFERENTIALRECHNUNG Beweis. Es sei x ∈ U (x0 ). Durch Anwendung des Mittelwertsatzes ergibt sich aus (c) in beiden Fällen x < x0 und x > x0 die Ungleichung f (x) − f (x0 ) = (x − x0 )f 0 (ξ) > 0. Also ist f (x0 ) < f (x) für alle x ∈ U (x0 ). Als Beispiel betrachten wir die Funktion f (x) = x2 − 1 x2 + 1 mit f 0 (x) = (x2 4x . + 1)2 Dann ist f 0 (0) = 0, sowie f 0 (x) < 0 für x < 0 und f 0 (x) > 0 für x > 0. Folglich hat f (x) bei x = 0 ein lokales Minimum. Satz 7.40 (Zweites Hauptkriterium für Extremwerte) Die Funktion f sei (2m + 2)-mal stetig differenzierbar in U (x0 ). Ist f (k) (x0 ) = 0 für alle 1 ≤ k ≤ 2m + 1 und gilt f (2m+2) (x0 ) > 0 bzw. f (2m+2) (x0 ) < 0, so hat f bei x0 ein eigentliches lokales Minimum bzw. Maximum. Beweis. In der Taylorformel ergibt sich durch das Verschwinden der Ableitungen bei Entwicklung bis zu einem Restglied der Ordnung 2m + 2 die Vereinfachung f (x0 + h) − f (x0 ) = f (2m+2) (x0 + ϑ h) 2m+2 h , x0 + h ∈ U (x0 ). (2m + 2)! Ist f (2m+2) (x0 ) > 0, so gilt wegen der Stetigkeit von f (2m+2) auch f (2m+2) (x0 + ϑ h) > 0 für hinreichend kleine |h|. Wegen h2m+2 > 0 für positive und negative h folgt daraus f (x0 + h) − f (x0 ) ≥ 0 für hinreichend kleine |h|. Daher hat f bei x0 ein Minimum. Entsprechend ergibt sich im Falle f (2m+2) (x0 ) < 0 bei x0 ein Maximum. Definition 7.41 (Wendepunkte) Die Funktion f sei bei x0 differenzierbar und es sei t(x) = f (x0 ) + f 0 (x0 ) · (x − x0 ) die Gleichung der Tangente. Dann hat f bei x0 einen eigentlichen Wendepunkt, wenn es ein δ > 0 mit t(x) < f (x) für alle x ∈ (x0 − δ, x) und f (x) < t(x) für alle x ∈ (x0 , x0 + δ) oder t(x) > f (x) für alle x ∈ (x0 − δ, x) und f (x) > t(x) für alle x ∈ (x0 , x0 + δ) gibt. (Die Funktion wechselt bei x0 die durch die Tangente bestimmten Halbebenen.) Satz 7.42 Die differenzierbare Funktion f hat genau dann einen Wendepunkt bei x0 , wenn es ein δ > 0 mit f (x) − f (x0 ) > f 0 (x0 ) für alle x ∈ (x0 − δ, x0 + δ) x − x0 oder f (x) − f (x0 ) < f 0 (x0 ) für alle x ∈ (x0 − δ, x0 + δ) x − x0 gibt. (Die Sekantenanstiege sind immer > oder immer < als der Tangentenanstieg.) 7.6 Kurvendiskussionen Beweis. Gilt 109 f (x) − f (x0 ) > f 0 (x0 ) für alle x ∈ (x0 − δ, x0 + δ), x − x0 so folgen ˙ − x0 ) = t(x) für x > x0 f (x) > f (x0 ) + f 0 (x0 )(x und ˙ − x0 ) = t(x) für x < x0 . f (x) < f (x0 ) + f 0 (x0 )(x Somit hat f bei x0 einen Wendepunkt. Die Umkehrung ist ebenso leicht zu sehen. Satz 7.43 (Hinreichende Bedingung für Wendepunkte) Es sei f (2m+3)-mal stetig differenzierbar in U (x0 ). Gilt dann f (k) (x0 ) = 0 für alle 2 ≤ k ≤ 2m + 2 und f (2m+3) (x0 ) 6= 0, so hat f bei x0 einen Wendepunkt. Beweis. Der Beweis ergibt sich ähnlich zu Satz 7.40 aus der Taylorformel. Definition 7.44 Eine Funktion f heißt konvex auf dem Intervall (a, b), falls für alle a < a1 < ξ < b1 < b die Ungleichung f (ξ) < f (b1 ) − f (a1 ) (ξ − a1 ) + f (a1 ) b 1 − a1 gilt. Geometrisch bedeutet diese Ungleichung, dass die Sekantenabschnitte oberhalb des Funktionsgraphen liegen. Satz 7.45 Ist f 00 (x) > 0 für alle x ∈ (a, b), so ist f auf (a, b) konvex. Beweis. Wegen f 00 > 0 ist f 0 monoton wachsend. Der Mittelwertsatz ergibt daher f (ξ) − f (a1 ) f (b1 ) − f (ξ) = f 0 (τ1 ) < f 0 (τ2 ) = mit a1 < τ1 < ξ < τ2 < b1 . ξ − a1 b1 − ξ Durch Umstellen folgt (f (ξ) − f (a1 ))(b1 − ξ) < (f (b1 ) − f (ξ))(ξ − a1 ), f (ξ)(b1 − a1 ) < f (a1 )(b1 − ξ) + f (b1 )(ξ − a1 ) = f (a1 )(b1 − a1 ) + (f (b1 ) − f (a1 ))(ξ − a1 ). Hieraus ergibt sich die geforderte Ungleichung. Geometrisch beinhaltet die zweite Ableitung nach Satz 7.45 also eine Aussage über die Konvexität bzw. die Krümmung“ des Graphen. Das lässt sich durch die Betrach” tung von Krümmungskreisen präzisieren: Zu vorgegebener Funktion f und gegebenem Punkt P0 = (x0 , f (x0 )) auf dem Graphen ist eine Kreislinie y = k(x) durch diesen Punkt mit f (x0 ) = k(x0 ), f 0 (x0 ) = k 0 (x0 ) und f 00 (x0 ) = k 00 (x0 ) gesucht. Wieviele solcher Kreise gibt es und wie errechnen sich deren Mittelpunkt und Radius? Wir behandeln das Problem 110 7 DIFFERENTIALRECHNUNG Abbildung 21: Krümmungskreis für den Spezialfall f 0 (x0 ) = 0. Die allgemeine Kreisgleichung (x − a)2 + (y − b)2 = r2 wird implizit zweimal nach x differenziert. Das ergibt 2(x − a) + 2(y − b)y 0 = 0, 2 + 2y 0 y 0 + 2(y − b)y 00 = 0. Die Forderungen y(x0 ) = f (x0 ) = y0 , y 0 (x0 ) = f 0 (x0 ) = 0, y 00 (x0 ) = f 00 (x0 ) führen dann auf 1 1 und r = |y0 − b| = 00 . x0 − a = 0, y0 − b = − 00 y (x0 ) |y (x0 )| Damit haben wir bewiesen: Satz 7.46 Für f 0 (x0 ) = 0 ist der Radius des Krümmungskreises der Kehrwert des Betrages der 2. Ableitung. Aufgaben zu 7.6 1. Führen Sie eine Kurvendiskussion für die Funktion f (x) = x durch! 1 + x2 2. Beweisen Sie mittels Kurvendiskussion die Ungleichung ab ≤ ap b q 1 1 + für a, b ≥ 0 und 1 < p, q < ∞ mit + = 1. p q p q 3. Zeigen Sie: Die Funktion f ist genau dann konvex auf dem Intervall I, wenn f (αx + βy) ≤ αf (x) + βf (y) für alle x, y ∈ I und α, β ≥ 0 mit α + β = 1. 4. Beweisen Sie die allgemeine Formel r = (1 + y002 )3/2 für den Krümmungsradius. y000 5. Ein parabolischer Hohlspiegel mit Brennweite f soll durch eine Kugelfläche ersetzt werden. Welcher Kugelradius ist zu wählen? (Hinweis: Zur Bestimmung der Gleichung y = ax2 unter Vorgabe der Brennweite f lassen Sie einen Lichtstrahl parallel zur y-Achse auf einen Kurvenpunkt zum Anstieg 1 auftreffen.) 7.7 Partielle Ableitungen und Gradient 7.7 111 Partielle Ableitungen und Gradient In diesem Abschnitt dehnen wir die Differentialrechnung auf reelle Funktionen mit mehreren reellen Variablen aus. Da wir auf solche Funktionen bisher nicht eingegangen sind, beginnen wir mit einigen Bemerkungen zur Definition und graphischen Darstellung. Definition 7.47 Eine Funktion f : G → R mit G ⊆ Rn heißt eine reellwertige Funktion mit n-Variablen. Den Funktionswert von f zum Argument x = (x1 , . . . , xn ) bezeichnen wir durch z = f (x) = f (x1 , . . . , xn ). Für n = 2 benutzen wir jedoch meistens die Symbolik z = f (x, y) mit x = (x, y). Als Beispiel betrachten wir die auf R2 definierte Funktion z = f (x, y) = y 2 − x2 . Der Graph Graph (f ) = {(x, y, z) : (x, y) ∈ D(f ), z = f (x, y)} dieser Funktion ist dann eine Teilmenge von R3 und kann als Fläche im R3 dargestellt werden. Eine alternative Möglichkeit für die graphische Darstellung ist die Verwendung von Höhenlinienbildern, auch Isohypsen genannt (s. Abb. 22). Abbildung 22: 3D-Darstellung und Höhenlinienbild von z = f (x, y) = y 2 − x2 Eine Möglichkeit der Untersuchung von Funktionen in mehreren Variablen besteht darin, durch Fixieren von (n − 1) Variablen die Funktion auf eine Schar von Funktionen in einer Variablen zurückzuführen. Wendet man diese Methode zur Definition von Ableitungen an, so führt das auf den Begriff der partiellen Ableitung. In den folgenden Definitionen und Sätzen werden wir uns meistens auf den Fall von n = 2 Variablen beschränken, die Verallgemeinerung auf mehr Variablen wird offensichtlich sein. Definition 7.48 (Partielle Ableitungen) Es sei f eine Abbildung aus R2 in R und es sei x0 = (x0 , y0 ) ein innerer Punkt von D(f ). Dann heißt der Grenzwert ∂f f (x0 + h, y0 ) − f (x0 , y0 ) (x0 , y0 ) = lim h→0 ∂x h 112 7 DIFFERENTIALRECHNUNG im Fall der Existenz die partielle Ableitung von f nach x im Punkt (x0 , y0 ). Entsprechend wird die partielle Ableitung von f nach y definiert. Zur Bezeichnung der partiellen Ableitungen ist auch die folgende Symbolik üblich: ∂f ∂f = ∂1 f = fx bzw. = ∂2 f = fy . ∂x ∂y Geometrisch bedeutet die partielle Ableitung nach x den Anstieg der Schnittkurve der Fläche Graph(f ) mit der Ebene y = y0 parallel zur x-z-Ebene (Abb. 23). Entsprechend wird die partielle Ableitung von f nach der zweiten Variablen y als Grenzwert des entsprechenden Differenzenquotienten definiert. Für Funktionen mit mehr als zwei Variablen geht man analog vor. Abbildung 23: Partielle Ableitungen Beispiel 7.49 Es sei f (x, y) = x3 − 3x sin y + y 2 + 4. Dann sind ∂f ∂f = fx (x, y) = 3x2 − 3 sin y und = fy (x, y) = −3x cos y + 2y. ∂x ∂y Definition 7.50 (Gradient) Besitzt die Funktion z = f (x, y) im Punkt x = (x, y) partielle Ableitungen nach allen Variablen, so heißt der Vektor grad f (x) = ∇ f (x) = (fx (x, y), fy (x, y)) der Gradient von f bei x. Das Symbol ∇ wird als Nabla“ gelesen. ” Für das Beispiel 7.49 ergibt sich ∇ f (x, y) = (3x2 − 3 sin y, − 3x cos +2y). Wir wollen jetzt die Weierstraßsche Zerlegungsformel auf den Fall von Funktionen mit mehreren Variablen verallgemeinern. Die Rolle der Tangente wird nun durch die Tangentialebene übernommen. Wir reaktivieren dazu notwendige Kenntnisse aus der linearen Algebra. Es sei h = (h, k) ∈ R2 ein beliebiger Vektor und es sei ∇ f = (fx , fy ) der Gradient von f bei x = (x, y). Dann lässt sich das folgende Skalarprodukt bilden: ∇ f · h = (fx , fy ) · (h, k) = h fx + k fy . Mit dieser Bezeichnung gilt der folgende Satz: 7.7 Partielle Ableitungen und Gradient 113 Satz 7.51 (Weierstraßsche Zerlegungsformel) Es sei x0 = (x0 , y0 ) ein innerer Punkt von D(f ). In einer gewissen Umgebung Uε (x0 ) = {x ∈ R2 : |x − x0 | < ε} von x0 möge fx existieren und stetig sein, während fy wenigstens im Punkt x0 existiere. Dann besitzt f in Uε (x0 ) eine Zerlegung der Form f (x) = f (x0 ) + ∇ f (x0 ) · (x − x0 ) + ρ(x0 , x) · (x − x0 ) mit ρ(x0 , x) → 0 für x → x0 . Die Funktion ρ(x0 , x) = (ρ1 (x0 , x), ρ2 (x0 , x)) ist dabei wieder die Fehlerfunktion. Beweis. Wir setzen x = (x, y). Dann ergibt sich unter Anwendung des Mittelwertsatzes für x, der Weierstraßschen Zerlegungsformel für y und der Stetigkeit von fx die Gleichung f (x) − f (x0 ) = = = = = f (x, y) − f (x0 , y) + f (x0 , y) − f (x0 , y0 ) (x − x0 )fx (ξ, y) + (y − y0 )(fy (x0 , y0 ) + ρ2 (x0 , x)) ∇ f (x0 ) · (x − x0 ) + (x − x0 )(fx (ξ, y) − fx (x0 )) + (y − y0 ) · ρ2 (x0 , x) ∇ f (x0 ) · (x − x0 ) + (x − x0 ) · ρ1 (x0 , x) + (y − y0 ) · ρ2 (x0 , x) ∇ f (x0 ) · (x − x0 ) + ρ(x0 , x) · (x − x0 ). mit ρ(x0 , x) → 0 für x → x0 wegen der vorausgesetzten Stetigkeit von fx . Abbildung 24: Weierstraßsche Zerlegungsformel und Tangentialebene mit Normalenvektor Bemerkung 7.52 . a) Der lineare Teil z = f (x0 ) + ∇ f (x0 ) · (x − x0 ) = f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) kann als Gleichung der Tangentialebene der durch z = f (x, y) gegebenen Fläche im Punkt (x0 , y0 , f (x0 , y0 )) interpretiert werden. Die Weierstraßsche Zerlegungsformel bedeutet für n = 2 also die näherungsweise Ersetzung der Fläche durch ihre Tangentialebene in einer Umgebung des Punktes (x0 , y0 ). xy für (x, y) 6= (0, 0), x2 +y 2 b) Die Funktion f (x, y) = 0 sonst ist ein Beispiel dafür, dass die Voraussetzungen im Satz zur Weierstraßschen Zerlegungsformel nicht ohne weiteres verzichtbar sind (s. Abb. 25). Diese Funktion hat bei 0 = (0, 0) partielle Ableitungen fx (0) = 0 und fy (0) = 0, sie ist aber bei 0 nicht einmal stetig, geschweige denn linearisierbar. 114 7 DIFFERENTIALRECHNUNG Abbildung 25: Gegenbeispiel zur Weierstraßschen Zerlegungsformel Definition 7.53 (Glatte Kurven) Es sei I ein offenes reelles Intervall. Eine koordinatenweise differenzierbare Funktion x = x(t) = (x1 (t), . . . , xn (t)) : I → Rn heißt eine glatte Kurve in Rn , wenn x0 (t) = (x01 (t), . . . , x0n (t)) 6= 0 für alle t ∈ I ist. Beispielsweise ist die Funktion x(t) = (sin t, cos t), 0 < t < 2π eine glatte Kurve. Diese Funktion beschreibt die Kreislinie. Die Gerade x(t) = x0 + t a, t∈R mit 0 6= a ∈ Rn ist ebenfalls eine glatte Kurve. Satz 7.54 Ist x = x(t) eine glatte Kurve, so existiert eine Zerlegung x(t) = x(t0 ) + x0 (t0 ) · (t − t0 ) + ρ(t0 , t) · (t − t0 ) mit lim ρ(t0 , h) = 0. Die Gerade y(t) = x(t0 ) + x0 (t0 ) · (t − t0 ) heißt die Tangente an die h→0 Kurve im Punkt x(t0 ). Beweis. Es genügt, die Weierstraßsche Zerlegungsformel auf jede Koordinate von x separat anzuwenden. Satz 7.55 (Verallgemeinerte Kettenregel/Ableitung längs Kurven) Es sei f in einer Umgebung von x0 = (x0 , y0 ) stetig partiell differenzierbar und es sei x(t) = (x(t), y(t)) eine glatte Kurve mit x(t0 ) = x0 . Dann ist die zusammengesetzte Funktion F (t) = f (x(t), y(t)) bei t0 differenzierbar, und es gilt dF ∂f dx ∂f dy (t0 ) = ∇ f (x0 ) · x0 (t0 ) = · + · . dt ∂x dt ∂y dt Der formale Ausdruck dF = fx dx + fy dy = Differential von F . ∂f ∂f dx + dy heißt auch das totale ∂x ∂y 7.7 Partielle Ableitungen und Gradient 115 Beweis. Mit der Abkürzung x = x(t) ergibt die Weierstraßsche Zerlegungsformel F (t) − F (t0 ) = f (x(t)) − f (x0 ) = ∇ f (x0 ) · (x − x0 ) + ρ(x, x0 ) · (x − x0 ), und die Division durch t − t0 liefert x − x0 x − x0 F (t) − F (t0 ) = ∇ f (x0 ) · + ρ(x, x0 ) · → ∇ f (x0 ) · x0 (t0 ) + 0. t − t0 t − t0 t − t0 Satz 7.56 (Differentiation implizit gegebener Funktionen) Es sei y = f (x) differenzierbar in x0 und es sei F (x, y(x)) = 0 für alle x ∈ U (x0 ). Ist F stetig partiell differenzierbar in einer Umgebung V von (x0 , y0 ) und gilt Fy (x0 , y0 ) 6= 0, so ist y 0 (x0 ) = − Fx (x0 , y0 ) . Fy (x0 , y0 ) Beweis. Wir setzen t = x und wenden die Kettenregel 7.55 auf die Gleichung 0 = Fx F (x, y(x)) an. Dann ist 0 = Fx · x0 + Fy · y 0 , also y 0 = − . Fy Beispiel 7.57 Die Kreislinie kann durch √ y(x) = 1 − x2 , −1<x<1 beschrieben werden. Diese Funktion ergibt sich durch Auflösung der Kreisgleichung F (x, y) = x2 + y 2 − 1 = 0, y > 0. Die Ableitung von y kann dann aus dieser Gleichung nach Satz 7.55 wie folgt berechnet werden: 2x · 1 + 2y · y 0 + 0 = 0, x also y 0 = − . y 7.58 (Die Richtungsableitung) Die Funktion f (x, y) sei in einer Umgebung von x0 = (x0 , y0 ) definiert und dort stetig partiell differenzierbar. Es sei a ∈ R2 ein Richtungsvektor mit |a| = 1. Dann heißt die Zahl df df (x0 + ta) = da dt die Richtungsableitung von f in Richtung a. Wegen der verallgemeinerten Kettenregel gilt df = ∇f (x0 ) · a. da 116 7 DIFFERENTIALRECHNUNG 7.59 (Geometrische Deutung des Gradienten) Es sei f in einer Umgebung U (x0 ) stetig partiell differenzierbar. Die Richtungsableitung nimmt wegen ∇f (x0 ) · a = |∇f (x0 )| · |a| · cos ∠ (∇f, a) → max ihr Maximum für ∠ (∇f, a) = 0 an. Also zeigt ∇f in die Richtung der stärksten Änderung der Funktion f . Wir betrachten nun eine Niveaulinie f (x, y) = c. Die Tangente an die Niveaulinie hat nach Satz 7.56 dann den Anstiegsvektor fx 1 0 (1, y ) = 1, − = (fy , −fx ). fy fy Hieraus folgt 1 (fy , −fx ) = 0. fy Also steht der Gradient senkrecht auf den Niveaulinien. ∇f · (1, y 0 ) = (fx , fy ) · Als erste Anwendung des Apparates der partiellen Ableitungen wollen wir das Problem der implizit definierten Funktionen behandeln. Dieses Problem besteht darin, Bedingungen zu finden, unter denen durch eine Gleichung F (x, y) = 0 eine Funktion y = y(x) definiert wird. Betrachten wir als Beispiel die Kreisgleichung F (x, y) = x2 + y 2 − 1 = 0. Die Kreislinie C = {(x, y) : F (x, y) = 0} kann sicherlich nicht der Graph einer Funktion Abbildung 26: Definition impliziter Funktionen sein. Beschränkt man sich jedoch auf einen geeigneten Ausschnitt B, so kann C ∩ B durchaus der Graph einer Funktion sein. Gibt es dann sogar eine differenzierbare Funktion y = y(x), die die Gleichung F (x, y(x)) = 0 erfüllt, so muss wegen y 0 = −Fx /Fy nach Satz 7.56 sicherlich Fy 6= 0 gelten. Diese Bedingung ist zusammen mit Stetigkeitsvoraussetzungen umgekehrt auch hinreichend, wie der folgende wichtige Satz lehrt: Satz 7.60 (Hauptsatz über implizite Funktionen) Die Funktion z = F (x, y) sei in einer offenen Teilmenge G ⊆ R2 definiert und auf G stetig partiell differenzierbar nach x und y. Ist dann (x0 , y0 ) ein Punkt in G mit F (x0 , y0 ) = 0 und Fy (x0 , y0 ) 6= 0, so existiert ein Rechteck I1 × I2 = [x0 − δ, x0 + δ] × [y0 − ε, y0 + ε] derart, dass die Menge {(x, y) ∈ R2 : F (x, y) = 0} ∩ I1 × I2 der Graph einer auf I1 definierten, stetig differenzierbaren Funktion y = y(x) ist, d.h., zu jedem x ∈ I1 existiert genau ein y ∈ I2 mit F (x, y) = 0. Ferner gilt y 0 = −Fx / Fy auf I1 . 7.7 Partielle Ableitungen und Gradient 117 Beweis. Ohne Beschränkung der Allgemeinheit sei Fy (x0 , y0 ) > 0. Wegen der Stetigkeit von Fy existiert ein Rechteck Q = [x0 −δ1 , x0 +δ1 ] × [y0 −ε , y0 +ε] ⊆ G so, dass Fy > 0 auf diesem Rechteck gilt. Wegen F (x0 , y0 ) = 0 und Fy (x0 , y) > 0 für alle y ∈ [y0 − ε , y0 + ε] gilt F (x0 , y0 + ε) > 0 > F (x0 , y0 − ε). Wegen der Stetigkeit von F existiert dann ein Intervall I1 = [x0 − δ, x0 + δ] ⊆ [x0 − δ1 , x0 + δ1 ] so, dass F (x, y0 + ε) > 0 > F (x, y0 − ε) für alle x ∈ I1 gilt. Für festes x ∈ I1 hat die Funktion g(y) = F (x, y) auf [y0 − ε, y0 + ε] nach dem Nullstellensatz von Bolzano daher eine Nullstelle in I2 = [y0 + ε, y0 + ε]. Also hat F (x, y) = 0 für jedes x ∈ I1 eine Lösung y ∈ I2 . Wir zeigen nun die Einzigkeit der Lösung in I2 . Es seien y1 , y2 ∈ I2 zwei verschiedene Zahlen mit F (x, y1 ) = 0 = F (x, y2 ). Nach dem Mittelwertsatz der Differentialrechnung gibt es dann ein η ∈ I2 mit Fy (x, η) = 0, was im Widerspruch zur Konstruktion von Q steht. Damit wird in I1 ×I2 durch die Gleichung F (x, y) = 0 genau eine Funktion y = y(x) definiert. Wir zeigen nun durch indirekten Beweis zunächst die Stetigkeit von y = y(x). Angenommen, die Funktion wäre an irgendeiner Stelle x ∈ I1 unstetig. Dann gäbe es eine Folge hn → 0 derart, dass lim y(x+hn ) = y ? 6= y(x) gilt. Da aber nach Konstruktion der Funkn→∞ tion y = y(x) die Gleichheit F (x + hn , y(x + hn )) = 0 besteht, folgt nach Grenzübergang F (x, y ? ) = 0, was aber y ? = y(x) nach sich ziehen würde. Dieser Widerspruch zeigt die Stetigkeit von y = y(x). Zum Nachweis der Differenzierbarkeit seien x und x + h zwei Punkte in I1 und es seien y(x) und y(x + h) die zugehörigen Funktionswerte. Wir betrachten die Gerade durch die Punkte (x, y(x)) und (x + h, y(x + h)). Sie ist in R2 durch die Gleichung (X(t), Y (t)) = (x + th, y(x) + t(y(x + h) − y(x)) gegeben. Die Funktion ϕ(t) = F (X(t), Y (t)), 0≤t≤1 erfüllt auf [0, 1] die Voraussetzungen des Mittelwertsatzes. Daher existiert eine Zahl ϑ ∈ (0, 1) derart, dass ϕ0 (ϑ) = ϕ(1) − ϕ(0) ist. Wegen ϕ(0) = F (x, y(x)) = 0 und ϕ(1) = F (x + h, y(x + h)) = 0 ist dann ϕ0 (ϑ) = Fx (X(ϑ), Y (ϑ)) · h + Fy (X(ϑ), Y (ϑ)) · (y(x + h) − y(x)) = 0. Hieraus folgt Fx (X(ϑ), Y (ϑ)) y(x + h) − y(x) =− . h Fy (X(ϑ), Y (ϑ)) Wegen der bereits nachgewiesenen Stetigkeit von y = y(x) existiert dann aber der Grenzwert y 0 (x) = lim h→0 y(x + h) − y(x) Fx (x, y(x)) =− . h Fy (x, y(x)) 118 7 DIFFERENTIALRECHNUNG Der Hauptsatz über implizite Funktionen kann auch auf vektorwertige Funktionen mit mehr als zwei Variablen verallgemeinert werden. Die wichtige Voraussetzung Fy (x0 , y0 ) 6= 0 wird dabei durch die Invertierbarkeit einer gewissen Jakobi-Matrix ersetzt, und anstelle des Satzes von Bolzano zur Auflösung von Gleichungen wird der Banachsche Fixpunktsatz zur Auflösung der entsprechenden (nichtlinearen) Gleichungssysteme herangezogen. Satz 7.61 (Satz über die Existenz der inversen Funktion) Es sei y = f (x) eine im Intervall I definierte Funktion. Ist f in einer Umgebung von x0 ∈ I stetig differenzierbar und gilt f 0 (x0 ) 6= 0, so existiert zu y0 = f (x0 ) ein Intervall J = (y0 − δ, y0 + δ) und eine Funktion g : J → R mit f ◦ g = Id|J . Beweis. Wir setzen F (x, y) = y −f (x) . Dann ist F auf I ×R stetig partiell differenzierbar, und der Satz über implizite Funktionen kann zur Ermittlung der Funktion g(y) = x(y) benutzt werden. Wir beschließen dieses Kapitel mit einer Exkursion zu höheren partiellen Ableitungen. Für eine Funktion z = f (x, y) heißen die beiden Funktionen fx = ∂f ∂x und fy = ∂f . ∂x im Fall der Existenz die partiellen Ableitungen 1. Ordnung. Durch weiteres Differenzieren (falls möglich) entstehen hieraus vier Ableitungen der 2. Ordnung, nämlich: fxx = fyx = ∂2f ∂x2 ∂2f ∂x ∂y = = ∂ ∂f ∂x ∂x ∂ ∂f ∂x ∂y , fyy = , fxy = ∂2f ∂y 2 ∂2f ∂y ∂x = = ∂ ∂f ∂y ∂y ∂ ∂f ∂y ∂x , . Für diese zweiten partiellen Ableitungen gilt dabei der folgende Satz: Satz 7.62 (Satz von H. A. Schwarz (1843–1921)) Ist f auf der offenen Menge U ⊆ R2 stetig partiell differenzierbar nach x und y und existiert auch eine stetige Ableitung fyx auf U , so existiert auch fxy auf U und es ist fxy = fyx auf U. Der Satz kann leicht durch Betrachtung der entsprechenden Differenzenquotienten unter Verwendung von Mittelwertsätzen bewiesen werden. Wir werden aber später unter Verwendung der Integralrechnung einen einfacheren Beweis erhalten. Folgerung 7.63 Ist der Ausdruck A(x, y)dx + B(x, y)dy das totale Differential einer zweimal stetig partiell differenzierbaren Funktion f auf einer offenen Menge U , so gilt ∂A ∂B = auf U. ∂y ∂x 7.7 Partielle Ableitungen und Gradient 119 Diese Bedingung heißt auch Integrabilitätsbedingung des sogenannten Vektorfeldes (A(x, y), B(x, y)). Wir werden später sehen, dass die angegebene Bedingung auch hinreichend ist. Beweis. Gilt A(x, y) = fx (x, y) und B(x, y) = fy (x, y) für eine zweimal stetig partiell differenzierbare Funktion f , so folgt aus Satz 7.62 die Gleichung Ay = fxy = fyx = Bx . Aufgaben zu Abschnitt 7.7 1. Man zeige am Beispiel der Funktion ( 2 2 f (x, y) = x −y x2 +y 2 0 für sonst (x, y) 6= (0, 0) , dass die Existenz der partiellen Ableitungen allein nicht hinreichend für die Gültigkeit der Weierstraßschen Zerlegungsformel ist. 2. Man zeige durch Diskussion der Richtungsableitungen, dass es zu jedem Punkt des durch F (x, y) = x2 − y 2 definierten hyperbolischen Paraboloids zwei Geraden gibt, die ganz in der Fläche verlaufen. 3. Ermitteln Sie die Gleichung der Tangentialebene an die durch z = f (x, y) = 3x2 + 4y 2 gegebene Fläche im Punkt (x0 , y0 , f (x0 , y0 )) = (1, 1, 7). 4. Man zeige unter Verwendung des Mittelwertsatzes: Ist f 0 (x) > 0 für alle x im Intervall I, so ist f auf I streng monoton wachsend. 5. a) Wie lässt sich durch die Gleichung sin xy = 0 eine Funktion definieren? b) Lässt sich die Funktion x = y cos y in einer Umgebung von (0, 0) nach y auflösen? 6. Es sei G ∈ R2 eine offene Menge, es seien z = f (x, y) und z = g(x, y) zwei auf G stetig partiell differenzierbare Funktionen mit den Graphen F bzw. G. Finden Sie Bedingungen an f und g derart, dass die Schnittmenge F ∩ G eine glatte Kurve repräsentiert. (Hinweis: Verwenden Sie den Satz über implizite Funktionen.) 7. Der Differentialoperator ∂2 ∂2 + ∂x2 ∂y 2 heißt zweidimensionaler Laplace–Operator, und die Lösungen der Laplace– Gleichung ∂2f ∂2f ∆f = + =0 ∂x2 ∂y 2 p heißen harmonische Funktionen. Zeigen Sie, dass die Funktion f (x, y) = ln x2 + y 2 auf R2 \ {(0, 0)} harmonisch ist. ∆= 8. Prüfen Sie, ob der Differentialausdruck (exy + xyexy ) dx + x2 exy dy in R2 ein totales Differential ist! 120 7.8 7 DIFFERENTIALRECHNUNG Extremwerte für Funktionen mit mehreren Variablen Wir untersuchen nun Extremwerte für Funktionen mit zwei Variablen. Die Begriffe lokale Extrema werden analog wie im eindimensionalen Fall definiert. Satz 7.64 (Notwendiges Kriterium) Die Funktion z = f (x, y) sei in einer Umgebung U (x0 , y0 ) von (x0 , y0 ) definiert, partiell differenzierbar in (x0 , y0 ) und habe bei (x0 , y0 ) ein lokales Extremum. Dann gilt fx (x0 , y0 ) = 0 und fy (x0 , y0 ) = 0. Beweis. Die Funktionen ϕ(x) = f (x, y0 ) und ψ(y) = f (x0 , y) haben unter den obigen Voraussetzungen auch ein lokales Extremum bei x0 bzw. y0 . Daher ist 0 = ϕ0 (x0 ) = fx (x0 , y0 ) und 0 = ψ 0 (y0 ) = fy (x0 , y0 ). Satz 7.65 (Eine hinreichende Bedingung) Die Funktion z = f (x, y) sei in U (x0 , y0 ) definiert und erfülle die folgenden Bedingungen: (a) f ist in U zweimal stetig partiell differenzierbar. (b) Es sei fx (x0 , y0 ) = 0 und fy (x0 , y0 ) = 0. fxx (x0 , y0 ) fxy (x0 , y0 ) (c) Es sei det = fxx (x0 , y0 )fyy (x0 , y0 ) − fxy (x0 , y0 )2 > 0. fyx (x0 , y0 ) fyy (x0 , y0 ) Dann hat f bei (x0 , y0 ) ein lokales Extremum. Im Fall fxx (x0 .y0 ) < 0 ist es ein Maximum, im Fall fxx (x0 , y0 ) > 0 ein Minimum. Beweis. Wegen (c) ist fxx (x0 , y0 ) 6= 0, und o.B.d.A. sei fxx (x0 , y0 ) > 0. Wegen der Stetigkeit der partiellen Ableitung gibt es eine Umgebung U (x0 , y0 ) > 0 so, dass die Bedingung (c) und die Bedingung fxx (x, y) > 0 für alle (x, y) = (x0 + h, y0 + k) ∈ U (x0 , y0 ) erfüllt ist. Es sei nun (x0 +h, y0 +k) ∈ U (x0 , y0 ) fest gewählt. Wir wollen f (x0 +h, y0 +k) > f (x0 , y0 ) für h · k 6= 0 zeigen. Dazu definieren wir F (t) = f (x0 + t h, y0 + t k) für |t| ≤ 1. Dann ist F 0 (t) = fx (x0 + t h, y0 + t k) · h + fy (x0 + t h, y0 + t k)k, F 00 (t) = fxx (x0 + t h, y0 + t k)h2 + 2fxy (x0 + t h, y0 + t k)hk + fyy (x0 + t h, y0 + t k)k 2 . Wegen (b) ist F 0 (0) = 0. Daher ergibt die Taylorformel angewandt auf die Funktion F (t) mit den Abkürzungen P0 = (x0 , y0 ) und Pϑ = (x0 + ϑh, y0 + ϑk) wegen (c) die Formel 1 f (x0 + h, y0 + k) = F (1) = F (0) + 0 + F 00 (ϑ) 2 1 = f (P0 ) + fxx (Pϑ )h2 + 2fxy (Pϑ )hk + fyy (Pϑ )k 2 2 2 1 = f (P0 ) + fxx (Pϑ ) · h + fxy (Pϑ ) · k 2fxx (Pϑ ) 2 + fyy (Pϑ )fxx (Pϑ ) − fxy (Pϑ ) k 2 > f (x0 , y0 ) 7.8 Extremwerte für Funktionen mit mehreren Variablen 121 Abbildung 27: ellipt. Paraboloid, hyperbol. Paraboloid=Sattelfläche und Affensattel Beispiel 7.66 Wir bestimmen die lokalen Extrema der Funktion f (x, y) = x2 + 2xy + 4y 2 + 2x − 10y + 5. Dazu haben wir zunächst das Gleichungssystem fx (x, y) = 2x + 2y + 2 = 0 fy (x, y) = 2x + 8y − 10 = 0 zu lösen. Das ergibt den Punkt (x0 , y0 ) = (−3, 2) als Kandidaten für einen Extremwert. Wegen fxx (−3, 2)fyy (−3, 2) − fxy (−3, 2)2 = 16 − 4 > 0 liegt in der Tat ein Extremwert vor, und wegen fxx (−3, 2) = 2 > 0 ist es ein Minimum. Der obige Satz besitzt die folgende Verallgemeinerung auf Funktionen mit n ≥ 2 Variablen. Der Beweis wird ähnlich wie oben geführt, man muss nur die aus der Linearen Algebra bekannten Tatsachen über quadratische Formen und ihre Beziehung zu positiv definiten Matrizen ausnutzen: Satz 7.67 Die Funktion z = f (x) mit n Variablen sei in U (x0 ) definiert und erfülle die folgenden Bedingungen: (a) f ist in U zweimal stetig partiell differenzierbar. (b) Es sei ∇f (x0 ) = 0. (c) Die sogenannte Hesse-Matrix 2 ∂ f (x0 ) = ∂2f ∂xi ∂xj sei positiv definit. i,j Dann hat f bei x0 ein lokales Minimum. Implizit trat im Beweis zu Satz 7.65 bereits eine Taylorformel für zwei Variable auf. Allgemein versteht man unter der Taylorformel für eine Funktion mit n reellen Variablen die Formel X ∂ α f (x0 ) f (x) = (x − x0 )α + RN +1 (x0 , x), α! |α|≤N 122 7 DIFFERENTIALRECHNUNG wobei α = (α1 , . . . , αn ) ein Multiindex ist und die folgenden Schreibweisen vereinbart sind: ∂ |α| f (x0 ) |α| = α1 + . . . + αn , α! = α1 ! · . . . · αn !, ∂ α f (x0 ) = , zα = z1α1 · . . . · znαn . ∂xα1 1 · · · ∂xαnn Aufgaben zu Abschnitt 7.8 1. Bestimmen Sie die lokalen Extremwerte für die folgende Funktion: f (x, y) = x2 + xy + y 2 + 2x + 1. 2. Entscheiden Sie durch Extremwertuntersuchungen, ob durch die Gleichung z = x2 − 2xy + 4y 2 + 2x − y + 1 ein elliptisches oder ein hyperbolisches Paraboloid beschrieben wird. 3. Regressionsgerade Einer biologischen Größe y werde eine lineare Abhängigkeit y = f (x) = ax + b von einer Größe x unterstellt. Zur Bestimmung der Parameter a, b wurde eine Messreihe mit n Messwertpaaren (xi , yi ), 1 ≤ i ≤ n, n 2, aufgenommen. Bestimmen Sie a, b derart, dass die mittlere quadratische Abweichung“ ” n 1 X |f (xi ) − yi |2 → min n − 1 i=1 minimal wird. Die Gerade mit den so bestimmten Parametern heißt die Regressionsgerade zur gegebenen Messreihe. Bestimmen Sie die Parameter a, b für die folgende Messreihe, die den Zusammenhang zwischen der Auslenkung x einer Feder und der Federkraft F angibt (Hookesches Gesetz): xi Fi 0.5 1.0 1.5 2.0 2.5 3.0 0.9 1.2 1.4 1.7 2.0 2.2 123 8 8.1 Integralrechnung Das bestimmte Integral Die Integration ermöglicht Volumen- und Flächenberechnungen, und sie erweist sich als eine Umkehrung“ zur Differentiation. Daher wird sie auch ein wesentliches Hilfsmittel ” zur Lösung von Differentialgleichungen sein. Die folgende, mehrstufige Definition orientiert sich an Flächeninhaltsberechnungen und geht auf Bernhard Riemann zurück. Definition 8.1 (Das Riemannsche Integral) Es sei f : [a, b] → R eine beschränkte, reellwertige Funktion. (a) Eine Zerlegung Z von [a, b] ist ein n + 1-Tupel Z = (x0 , . . . , xn ) von Elementen xi ∈ [a, b] mit a = x0 < x1 < . . . < xn = b. Die Intervalle Ii = [xi−1 , xi ) sind dann n S paarweise disjunkt und es gilt Ii = [a, b). i=1 (b) Die Untersumme bzw. Obersumme von f zur Zerlegung Z ist definiert durch S(f, Z) = n X f (Ii )µ(Ii ) bzw. S(f, Z) = i=1 n X f (Ii )µ(Ii ). i=1 Dabei sind µ(Ii ) = xi − xi−1 = Länge des Intervalls Ii = [xi−1 , xi ), f (Ii ) = inf f (x) und x∈Ii f (Ii ) = sup f (x). x∈Ii (c) Die Darbouxsche Untersumme bzw. Obersumme von f auf [a, b] ist definiert durch S(f ) = sup {S(f, z): Z ist Zerlegung von [a, b]} bzw. S(f ) = inf {S(f, z): ist Zerlegung von [a, b]}. Z (d) Gilt nun S(f ) = S(f ), so heißt diese Zahl das (Riemannsche) Integral von f auf [a, b] und die Funktion f heißt (Riemann–)integrierbar auf [a, b]. Man schreibt dafür kurz Zb f (x)dx = S(f ) = S(f ). a 124 8 INTEGRALRECHNUNG Beispiel 8.2 (a) Jede konstante Funktion f (x) ≡ c ist auf jedem Intervall [a, b] integrierbar, und es gilt Zb c dx = c(b − a), a denn alle Obersummen und alle Untersummen haben offenbar den Wert c(b − a). (b) Die sogenannte Dirichlet–Funktion D(x) = 0 für x ∈ R \ Q 1 für x ∈ Q ist auf dem Intervall [0, 1] nicht integrierbar, denn für jede Zerlegung Z gelten offenbar S(f, Z) = 0 und S(f, Z) = 1. Daher sind auch die Darbouxschen Summen S(f ) = 0 und S(f ) = 1 voneinander verschieden. Wir wollen nun allgemeine Integrabilitätskriterien herleiten. Zur Vorbereitung dienen die folgenden Sätze. Definition 8.3 Es seien Z und Z 0 zwei Zerlegungen von [a, b]. Dann heißt Z 0 feiner als Z, in Zeichen Z 0 ≺ Z, wenn jeder Teilpunkt xi von Z auch in Z 0 vorkommt. Satz 8.4 Aus Z 0 ≺ Z folgt S(f, Z) ≤ S(f, Z 0 ) ≤ S(f, Z 0 ) ≤ S(f, Z). Beweis. Jedes Intervall Ii = [xi−1 , xi ) der Zerlegung Z zerfällt unter der gemachten Voraussetzung in eine disjunkte Vereinigung 0 Ii = Ij0 ∪ Ij+1 ∪ . . . ∪ Ij+r 0 von Intervallen Ij+l = [x0j+l−1 , x0j+l ) der Zerlegung Z 0 . Daher ist f (Ii ) µ(Ii ) ≤ r X l=0 0 0 ) µ(Ij+l ) f (Ij+l ≤ r X 0 0 f (Ij+l ) µ(Ij+l ) ≤ f (Ii ) µ(Ii ), l=0 und die Summation über i ergibt S(f, Z) ≤ S(f, Z 0 ) ≤ S(f, Z 0 ) = S(f, Z). Satz 8.5 Für jede auf [a, b] beschränkte Funktion f gilt S(f ) ≤ S(f ). Beweis. Sind Z und Z 0 beliebige Zerlegungen von [a, b], so bilde man eine gemeinsame Verfeinerung Z ∗ dieser Zerlegungen durch Ineinanderfügen dieser beiden Ketten zu einer neuen Kette Z ∗ = (y0 , . . . , yn+m−1 ). Aus Satz 8.4 folgt dann die Ungleichung S(f, Z) ≤ S(f, Z ∗ ) ≤ S(f, Z ∗ ) ≤ S(f, Z 0 ). 8.1 Das bestimmte Integral 125 Also gilt S(f, Z) ≤ S(f, Z 0 ) für alle Zerlegungen Z und Z 0 von [a, b]. Hieraus folgt S(f ) = sup S(f, Z) : Z ist eine Zerlegung von [a, b] ≤ S(f, Z 0 ), und durch Übergang zum Infimum schließlich S(f ) ≤ inf S(f, Z 0 ) : Z 0 ist eine Zerlegung von [a, b] = S(f ). Damit ergibt sich der wichtige Satz: Satz 8.6 (Riemannsches Integrabilitätskriterium) Es sei f eine auf [a, b] beschränkte Funktion. Diese Funktion ist auf [a, b] genau dann integrierbar, wenn es zu jedem ε > 0 eine Zerlegung Z von [a, b] mit S(f, Z) − S(f, Z) < ε gibt. Beweis. Aus der angegebenen Bedingung folgt S(f ) − S(f ) ≤ S(f, Z) − S(f, Z) ≤ ε. Für ε → 0 zeigt dies S(f ) − S(f ) ≤ 0, wegen Satz 8.5 folgt daraus S(f ) = S(f ). Folglich ist f integrierbar. Ist umgekehrt f integrierbar, so wählen wir zu gegebenem ε > 0 Zerlegungen Z und Z 0 mit ε ε S(f, Z 0 ) − S(f ) < und S(f ) − S(f, Z) < . 2 2 Für die gemeinsame Verfeinerung Z ∗ von Z und Z 0 gilt dann wegen S(f ) = S(f ) die Abschätzung S(f, Z ∗ ) − S(f, Z ∗ ) ≤ S(f, Z 0 ) − S(f, Z) = S(f, Z 0 ) − S(f ) + S(f ) − S(f, Z) ≤ ε. Die folgende Formel ermöglicht u.a. auch die Berechnung von Integralen in einfachen Fällen: Folgerung 8.7 (Hauptkriterium) Die Funktion f sei auf [a, b] beschränkt. Ist (Zn ) eine Folge von Zerlegungen von [a, b] mit lim S(f, Zn ) = lim S(f, Zn ), n→∞ n→∞ so ist f auf [a, b] integrierbar, und es gilt Zb f (x)dx = lim S(f, Zn ) = lim S(f, Zn ). n→∞ n→∞ a Beweis. Wegen Satz 8.5 gilt S(f, Zn ) ≤ S(f ) ≤ S(f ) ≤ S(f, Zn ), und aus der Voraussetzung folgt lim S(f, Zn ) = S(f ) = S(f ) = lim S(f, Zn ). n→∞ Hieraus ergibt sich die Behauptung. n→∞ 126 8 INTEGRALRECHNUNG Beispiel 8.8 Es sei a < b. Wir berechnen das Integral Rb x dx. Dazu setzen wir f (x) = x a und bilden die äquidistanten Zerlegungen Zn = {xj : xj = a + j · b−a = a + jh; j = 0, . . . , n}. n Mit h · n = b − a gilt dann n−1 X S(f, Zn ) = (a + jh) · h = j=0 n−1 X 2 2 a·h+j·h =a·h·n+h j = a · h · n + h2 · j=0 j=0 = a · (b − a) + n−1 X n(n − 1) 2 (b − a)2 h h2 n2 h − · hn = a(b − a) + − (b − a). 2 2 2 2 Analog ist S(f, Zn ) = n X (a + jh)h = a(b − a) + h2 j=1 Wegen h = b−a n n(n + 1) (b − a)2 h = a(b − a) + + (b − a). 2 2 2 → 0 für n → ∞ folgt lim S(f, Zn ) = lim S(f, Zn ) = a(b − a) + n→∞ b 2 a2 (b − a)2 = − . 2 2 2 Also ist f (x) = x nach Satz 8.7 integrierbar, und es gilt Zb x dx = b 2 a2 − . 2 2 a Satz 8.9 (1. Existenzsatz) Ist f auf [a, b] stetig, so ist f auf [a, b] auch integrierbar. Beweis. Wir werden Riemanns Integrabilitätskriterium anwenden. Dazu sei ε > 0 beliebig vorgegeben. Da stetige Funktionen auf kompakten Intervallen sogar gleichmäßig stetig sind (siehe Satz 6.17), existiert ein δ > 0 derart, dass gilt: Aus |x − x0 | < δ folgt |f (x) − f (x0 )| < ε auf [a, b]. Wir wählen eine natürliche Zahl n so groß, dass h= b−a n b−a n < δ ausfällt. Dann setzen wir xj = a + j · h und Für Ij = [xj−1 , xj ) gilt dann µ(Ij ) = b−a n für j = 0, . . . , n. < δ. Folglich ist |f (Ij ) − f (Ij )| < ε. Für die Zerlegung Z = (x0 , . . . , xn ) ergibt sich daher S(f, Z) − S(f, Z) = n X (f (Ij ) − f (Ij )) µ(Ij ) ≤ ε · (b − a). j=1 Somit ist f nach dem Riemannschen Kriterium integrierbar. 8.1 Das bestimmte Integral 127 Satz 8.10 (2. Existenzsatz) Ist f auf [a, b] monoton, so ist f auf [a, b] auch integrierbar. Beweis. Sei f monoton wachsend und sei ε > 0 vorgegeben. Wir wählen eine natürliche Zahl n so, dass (b − a) · (f (b) − f (a)) < ε n ausfällt. Sodann setzen wir wie im vorigen Satz b−a , xj = a + j · h und Z = (x0 , . . . , xn ). n Wegen der Monotonie von f gelten h= f (Ij ) = f (xj−1 ) und f (Ij ) ≤ f (xj ). Daher ist n X n b−a X S(f, Z) − S(f, Z) ≤ (f (xj ) − f (xj−1 )) µ(Ij ) = · (f (xj ) − f (xj−1 )) n j=1 j=1 b−a (f (b) − f (a)) < (b − a) ε. n Folglich ist f nach dem Riemannschen Integrabilitätskriterium auch integrierbar. = Definition 8.11 (Die Rechteckregel) Es sei f auf [a, b] beschränkt und es sei h = Die Formel n X Rn (f ) = f (a + jh) · h b−a . n j=1 heißt Rechteckregel für f (s. Abb. 28). Abbildung 28: Die Rechteckregel In der numerischen Mathematik werden die Zahlen Rn (f ) als Näherungswerte für das Integral von f benutzt. Wir wollen eine Fehlerabschätzung für b Z f (x) dx − Rn (f ) a in Abhängigkeit von n bzw. h ermitteln. 128 8 INTEGRALRECHNUNG Satz 8.12 (Fehlerabschätzung für die Rechteckregel) Hat f auf [a, b] eine stetige beschränkte Ableitung mit |f 0 | ≤ K, so ist Z b (b − a)2 . f (x)dx − R (f ) ≤ 2K · n n a Beweis. Wegen des Mittelwertsatzes der Differentialrechnung ist |f (x0 ) − f (x00 )| = |f 0 (ξ)| · |x0 − x00 | ≤ K · |x0 − x00 |. Hieraus folgt für die Zerlegung Z = (x0 , x1 , . . . , xn ) mit den Teilpunkten xj = a + h · j dem Zuwachs h = (b − a)/n und den Intervallen Ij = [xj−1 , xj ) die Abschätzung |f (Ij ) − f (Ij )| ≤ K · µ(Ij ) = K · h, und insbesondere |f (xj ) − f (Ij )| ≤ K · h. Somit ist Z b Z b f (x)dx − Rn (f ) ≤ f (x)dx − S(f, Z) + S(f, Z) − Rn (f ) a a ≤ |S(f, Z) − S(f, Z)| + |S(f, Z) − Rn (f )| ≤ K · h · (b − a) + K · h · (b − a) = 2K · h · (b − a) = 2K (b − a)2 n Bessere Konvergenzgüten (z.B. ≤ M · 1/n2 ) ergeben sich bei der Verwendung der Trapezregel ! n−1 X 1 1 f (a) + f (a + jh) + f (b) · (b − a) Tn (f ) = 2 2 j=1 anstelle der Rechteckregel (s. Aufgabe 6). Aufgaben zu Abschnitt 8.1 Zb 1. Mit der in Beispiel 8.8 angegebenen Methode zeige man Zb 2. Zeigen Sie ex dx = eb − 1. 0 1 dx = ln b für b > 0 unter Verwendung sog. geometrischer Zerlex 1 gungsfolgen Zn = {xj = bj/n : j = 0, . . . , n}. (Satz 4.30 könnte dabei helfen.) Za 3. Berechnen Sie sgn x dx in Abhängigkeit von a. −2 8.2 Eigenschaften Riemannscher Integrale 129 Zπ 4. Berechnen Sie sin x dx unter Verwendung der Rechtecksregel. 0 π (Hinweis: Zur Auswertung der Rn erweitern Sie Rn mit sin 2n und verwenden Sie die bekannte Formel 2 · sin x · sin y = cos(x − y) − cos(x + y).) 5. Es sei f auf [a, b] integrierbar. Zeigen Sie die Stetigkeit der Funktion Zx f (t) dt für a ≤ x ≤ b. Φ(x) = a 6. Finden Sie (unter von Ihnen diktierten Voraussetzungen an die Funktion f ) eine gute Fehlerabschätzung für die Trapezregel. Was hat die Trapezregel mit Trapezen zu tun? 7. Die Riemann-Funktion r : R → [0, ∞) ist wie folgt definiert: r(x) = 0 1 q für x irrational, für x = pq mit teilerfremden p, q und q > 0. a) Beweisen Sie, dass r in jedem irrationalen Punkt stetig und in jedem rationalen Punkt unstetig ist. b) Beweisen Sie, dass die Riemann-Funktion auf [0, 1] integrierbar ist und berechnen Sie das Integral. 8.2 Eigenschaften Riemannscher Integrale Satz 8.13 Es seien f und g auf [a, b] integrierbar und es sei λ ∈ R beliebig gegeben. Dann sind auch f + g und λ f auf [a, b] integrierbar und es gelten: (a) Aus f ≥ 0 auf [a, b] folgt Rb f (x)dx ≥ 0. (Positivität) a (b) Rb f (x) + g(x)dx = a (c) Rb Rb f (x)dx + a λ f (x)dx = λ a Rb Rb g(x)dx (Additivität) a f (x)dx (Homogenität). a Zb f (x)dx ≥ S(f ) ≥ 0. Beweis. Zu a) Aus f ≥ 0 auf [a, b] folgt a Zu b) Offensichtlich gilt S(f, Z) + S(g, Z) ≤ S(f + g, Z) ≤ S(f + g) ≤ S(f + g) ≤ S(f + g, Z) ≤ S(f, Z) + S(g, Z). 130 8 INTEGRALRECHNUNG Zu ε > 0 existiert nun wegen der Integrierbarkeit von f und g eine Zerlegung Z von [a, b] derart, dass S(f, Z) − S(f, Z) < ε und S(g, Z) − S(g, Z) < ε sind. Hieraus folgt Zb Zb g(x)dx − 2ε ≤ S(f, Z) + S(g, Z) ≤ S(f + g) ≤ S(f + g) f (x)dx + a a Zb ≤ S(f, Z) + S(g, Z) ≤ Zb f (x)dx + a g(x)dx + 2 ε. a Für ε → 0 zeigt das S(f + g) = S(f + g) und Zb Zb f (x)dx + a Zb g(x)dx = S(f + g) = S(f + g) = a f (x) + g(x)dx. a Zu c) Für λ ≥ 0 gilt S(λ f, Z) = λ S(f, Z), und hieraus folgt S(λ f ) = λ S(f ). Ebenso zeigt man S(λ f ) = λ S(f ), und das liefert S(λ f ) = λ S(f ) = λ S(f ) = S(λ f ). Analog verfährt man für negative λ. Definition 8.14 Es sei f auf [a, b] integrierbar und es sei f (x) ≥ 0 für alle x ∈ [a, b]. Als Flächeninhalt der Ordinatenmenge I0f = {(x, y) : a ≤ x ≤ b, 0 ≤ y ≤ f (x)} bezeichnen wir die durch µ(I0f ) Zb = f (x)dx a definierte nichtnegative reelle Zahl. Damit haben wir den Zusammenhang zur Inhaltslehre hergestellt. Das erlaubt zukünftig auch eine geometrische Interpretation der auftretenden Formeln. Als Beispiel betrachte man die Aussage (b) der nachstehenden Folgerung: Folgerung 8.15 Es seien f und g auf [a, b] integrierbar. Dann gelten: (a) Aus f ≤ g folgt Rb f (x)dx ≤ a (b) Rb g(x)dx (Monotonie). a Aus K1 ≤ f ≤ K2 mit zwei Konstanten K1 , K2 ∈ R folgt Rb K1 (b − a) ≤ f (x)dx ≤ K2 (b − a) a ( Beschränktheit). 8.2 Eigenschaften Riemannscher Integrale 131 R R R R R Beweis. Aus f ≤ g folgt g − f ≥ 0, also 0 ≤ (g − f ) = g − f , und somit f ≤ g. Die Ungleichung (b) folgt nun aus (a) wegen Zb Zb K1 (b − a) = Zb K1 dx ≤ f (x)dx ≤ a K2 dx = K2 (b − a). a a Satz 8.16 (Additivität des Integrals bezüglich des Integrationsbereiches) Es seien a < c < b. Eine reelle Funktion f ist genau dann auf [a, b] integrierbar, wenn f auf [a, c] und auf [c, b] integrierbar ist. In diesem Fall gilt Zb Zc f (x)dx = a Zb f (x)dx + a f (x)dx. c Beweis. Es seien I 0 = [a, c], I 00 = [c, b] und I = [a, b]. Sind Z 0 und Z 00 Zerlegungen von I 0 bzw. I 00 , so ist Z = Z 0 ∪ Z 00 eine Zerlegung von I. Daher ist 0 00 S I (f, Z 0 ) + S I (f, Z 00 ) ≤ S I (f, Z) ≤ S I (f ). Hieraus folgt 0 00 S I (f ) + S I (f ) ≤ S I (f ). Ist umgekehrt Z eine Zerlegung von I, so sind Z 0 = (Z ∩ [a, c]) ∪ {c} und Z 00 = {c} ∪ (Z ∩ [c, b]) Zerlegungen von I 0 und I 00 , und es gilt Z 0 ∪ Z 00 ≺ Z. Daher ist 0 00 0 00 S I (f, Z) ≤ S I (f, Z 0 ∪ Z 00 ) = S I (f, Z 0 ) + S I (f, Z 00 ) ≤ S I (f ) + S I (f ), also auch 0 00 S I (f ) ≤ S I (f ) + S I (f ). Entsprechend ergibt sich für die Obersummen (f ; −f ) die Ungleichungen I0 I 00 I I0 I I 00 S (f ) + S (f ) ≤ S (f ) und S (f ) ≤ S (f ) + S (f ). Aus diesen wechselseitigen Abschätzungen folgt nun die Behauptung des Satzes. Zur Verallgemeinerung der Formel aus Satz 8.16 definieren wir zusätzlich Za Za f (x)dx = − f (x)dx = 0 und a Zb f (x)dx für a ≤ b. a b Dann ergibt sich der Satz: Satz 8.17 Ist f auf I integrierbar und sind a, b, c ∈ I beliebig gegeben, so ist Zb Zc f (x)dx + a Za f (x)dx + b f (x)dx = 0. c 132 8 INTEGRALRECHNUNG Beweis. Im Fall a = b oder a = c folgt die Behauptung aus der zusätzlichen Definition. Ist a 6= b 6= c 6= a, so kann wegen der Symmetrie der Formel sogar a < c < b angenommen werden. Für diesen Fall ergibt sich die Behauptung aber aus Satz 8.16. Satz 8.18 Ist f auf [a, b] integrierbar, so ist auch |f | integrierbar, und es gilt b Z Zb f (x) dx ≤ |f (x) |dx a (Dreiecksungleichung). a Beweis. Es sei I ⊆ [a, b] beliebig gegeben. Für x1 , x2 ∈ I gilt dann |f (x1 )| − |f (x2 )| ≤ |f (x1 ) − f (x2 )| ≤ f (I) − f (I), und hieraus folgt |f |(I) − |f |(I) ≤ f (I) − f (I). Daher gilt für jede Zerlegung Z die Ungleichung S(|f |, Z) − S(|f |, Z) ≤ S(f, Z) − S(f, Z). Folglich ist mit f auch |f | nach dem Riemannschen Kriterium integrierbar. Ferner ist wegen ±f ≤ |f | nach Satz 8.15 Zb ± Zb ±f (x)dx ≤ f (x)dx = a Zb a a b Zb Z |f (x)|dx, also f (x) dx ≤ |f (x)|dx. Satz 8.19 Ist f auf [a, b] stetig und ist a a Rb |f (x)|dx = 0, so ist f ≡ 0 auf [a, b]. a Beweis. Wäre f (x0 ) 6= 0 für ein x0 ∈ [a, b], so ist die Zahl ε = 21 | f (x0 ) | > 0. Wegen der Stetigkeit von f existiert ein Intervall I0 = [a0 , b0 ] ⊆ [a, b] um x0 mit |f (x) − f (x0 )| < ε für alle x ∈ I0 . Folglich ist |f (x)| ≥ |f (x0 )| − ε = 2ε − ε = ε > 0 und somit Zb0 Zb |f (x)|dx ≥ a Zb0 |f (x)|dx ≥ a0 im Widerspruch zur Voraussetzung. a0 ε dx = ε(b0 − a0 ) > 0 8.3 Mittelwertsätze der Integralrechnung 8.3 133 Mittelwertsätze der Integralrechnung Die Kombination der Grobabschätzung von Integralen mit dem Zwischenwertsatz für stetige Funktionen führt auf die überaus wichtigen Mittelwertsätze der Integralrechnung. Satz 8.20 (Mittelwertsatz der Integralrechnung) Ist f stetig auf dem Intervall [a, b], so existiert eine Zahl ξ ∈ (a, b) mit Zb f (x)dx = f (ξ)(b − a). a Beweis. Nach Satz 8.15 ist Zb min f (x) · (b − a) ≤ f (x)dx ≤ max f (x) · (b − a). a≤x≤b a≤x≤b a Daraus folgt 1 min f (x) ≤ a≤x≤b b−a Zb f (x)dx ≤ max f (x). a≤x≤b a Nach dem Zwischenwertsatz existiert folglich eine Zahl ξ ∈ (a, b) mit 1 f (ξ) = b−a Zb f (x)dx, a und hieraus folgt die Behauptung. Die folgende Umformulierung des Mittelwertsatzes ist oft sehr nützlich: Folgerung 8.21 Ist f stetig auf dem Intervall I, so existiert zu je zwei Punkten x, x+h ∈ I eine Zahl 0 < ϑ < 1 mit x+h Z f (t)dt = h · f (x + ϑ h). x Satz 8.22 (Verallgemeinerter Mittelwertsatz) Sind f und g auf [a, b] stetig und ist g ≥ 0 auf [a, b], so existiert eine Zahl ξ ∈ (a, b) mit Zb Zb f (x)g(x)dx = f (ξ) a g(x)dx. a 134 8 INTEGRALRECHNUNG Beweis. Ist Rb g(x)dx = 0, so gilt g ≡ 0 auf [a, b] nach Satz 8.19. Die Behauptung ist in a diesem Fall daher trivial. Im anderen Fall setzen wir zur Abkürzung K1 = min f (x), K2 = max f (x). Wegen g ≥ 0 folgt K1 g(x) ≤ f (x)g(x) ≤ K2 g(x) für alle x ∈ [a, b], und die Integration Rb und anschließende Division durch g(x)dx ergibt a Zb Zb K1 ≤ g(x)dx ≤ K2 . f (x)g(x)dx a a Der Zwischenwertsatz für f ergibt die Existenz einer Zahl ξ ∈ (a, b) mit Zb Zb f (ξ) = g(x)dx, f (x)g(x)dx a a und hieraus folgt wieder die Behauptung. 8.4 Hauptsatz der Differential– Integralrechnung In diesem Abschnitt werden wir zeigen, dass Integral– und Differentialrechnung komplementär zueinander sind. Die genaue Formulierung wird den Inhalt des Hauptsatzes und seiner Umkehrung ausmachen, und es war die Leistung von Isaac Newton und Gottfried W. Leibniz eben diesen Zusammenhang erkannt zu haben. Wir beginnen dabei mit der Problemstellung, zu einer auf einem offenen Intervall I gegebenen stetigen Funktion f eine Funktion F mit F 0 (x) = f (x) für alle x ∈ I zu finden. Jede solche Funktion F nennen wir eine Stammfunktion von f auf dem Intervall I. Aus Satz 7.24 wissen wir bereits, dass für zwei stetig differenzierbare Funktionen F und G aus F 0 = G0 auf einem Intervall I sofort F = G + const folgt. Stammfunktionen einer gegeben Funktion unterscheiden sich also höchstens durch eine Konstante. Der folgende Hauptsatz zeigt nun, dass man Stammfunktionen durch Integration mit variabler oberer Grenze erhalten kann: Satz 8.23 (Hauptsatz der Differential- Integralrechnung) Es sei f auf einem offenen Intervall I definiert und stetig und es sei a ein beliebiger Punkt aus I. Dann ist die Funktion Zx Φ(x) = f (t) dt, x ∈ (a, b), a eine Stammfunktion von f auf I, es gilt also d dx Zx f (t) dt = f (x) für alle x ∈ I. a (Integration produziert Stammfunktionen und Differentiation hebt Integration auf.) 8.4 Hauptsatz der Differential– Integralrechnung 135 Beweis. Wir untersuchen den Differentialquotienten für Φ(x) und verwenden dabei den Mittelwertsatz der Integralrechnung und die Stetigkeit von f . So ergibt sich: x+h x+h Z Zx Z 1 1 1 Φ(x + h) − Φ(x) = f (t)dt − f (t)dt = f (t)dt = · h · f (x + ϑh) → f (x). h h h h a a x 0 Das zeigt Φ (x) = f (x) für alle x ∈ I. Satz 8.24 (Umkehrung des Hauptsatzes) Ist f auf dem offenen Intervall I stetig und ist F eine Stammfunktion von f auf I, so gilt Zx f (t) dt = F (x) − F (a) für alle x, a ∈ I. a (Mittels Stammfunktionen lassen sich Integrale berechnen.) Wir geben diesem Satz noch eine andere Fassung: Satz 8.25 (Umkehrung des Hauptsatzes, zweite Fassung) Ist F stetig differenzierbar auf I, so ist Zx d F (t) dt = F (x) − F (a). dt a (Integration hebt die Differentiation bis auf eine Konstante auf.) Beweis. Ist F eine Stammfunktion von f , so gilt F 0 (x) = f (x) für alle x ∈ I. Andererseits ist nach Satz 8.23 aber auch Φ0 (x) = f (x) auf I. Daher ist F 0 = Φ0 auf I, und aus Satz 7.24 folgt die Gleichung Φ(x) = F (x) + const, x ∈ I. Für x = a folgt 0 = Φ(a) = F (a) + const, also ist const = −F (a) und somit Zx f (t)dt = Φ(x) = F (x) − F (a). a Definition 8.26 (Unbestimmtes Integral) Unter dem unbestimmten Integral einer stetigen Funktion f (auf einem offenen Intervall I) versteht manRdie Menge aller Stammfunktionen von f (auf I). Das unbestimmte Integral wird durch f (x) dx bezeichnet. R Wegen Satz 7.24 ist F 0 (x) = f (x) äquivalent zu f (x)dx = F (x) + C. Nach den Sätzen 8.23 und 8.24 gilt ferner x Z Z Menge aller Stammfunktionen von f = f (x) dx ⊇ f (t)dt : a ∈ I . a Die früheren Beispiele für die Ableitung von Funktionen führen zu der folgenden Tabelle von Grundintegralen, wie man durch Differentiation leicht bestätigt. Diese Tabelle ist nach Satz 8.24 für die explizite Berechnung von Integralen sehr wertvoll. 136 8 INTEGRALRECHNUNG Tabelle einiger Grundintegrale Gültigkeitsbereich R f (x)dx = F (x) + C Probe (0, ∞) R xα dx = 1 α+1 F0 = f (−∞, 0) ∪ (0, ∞) R dx x (−∞, ∞) R ex dx = ex + C (−∞, ∞) R sin x dx = − cos x + C (−∞, ∞) R cos x dx = sin x + C (− π2 , π2 ) R dx cos2 x (−1, 1) R √ dx 1−x2 xα+1 + C, α 6= −1 = ln |x| + C = tan x + C = arcsin x + C = − arccos x + C1 (−∞, ∞) R dx 1+x2 = arctan x + C = −arccot x + C1 (−∞, ∞) R sinh x dx = cosh x + C (−∞, ∞) R cosh x dx = sinh x + C (−∞, 1) ∪ (1, ∞) R √ dx x2 −1 = arcosh x + C (−∞, ∞) R √ dx x2 +1 = arsinh x + C 8.5 Integrationsmethoden 8.5 137 Integrationsmethoden Der Hauptsatz 8.23 in Kombination mit bereits behandelten Differentiationsregeln ergibt wichtige Integrationsmethoden. Satz 8.27 (Partielle Integration) Sind u und v auf dem offenen Intervall I stetig differenzierbar, so gelten Zb b Z b u(x)v (x)dx = u(x)v(x) − u0 (x)v(x)dx und 0 a a Z u(x)v 0 (x)dx = u(x)v(x) − a Z u0 (x)v(x)dx. b Dabei bedeutet u(x)v(x) = u(b)v(b) − u(a)v(a). a Beweis. Durch Integration der Produktregel (u · v)0 = u0 v + u v 0 ergibt sich nach Satz 8.23 die Formel b Z b Zb 0 u(x)v(x) = u (x)v(x)dx + u(x)v 0 (x)dx, a a a woraus die Behauptung folgt. R Beispiel 8.28 a) Zur Berechnung von x cos x dx setzen wir u(x) = x und v 0 (x) = cos x. Dann ist erfreuerlicherweise u0 (x) = 1 und v(x) = sin x (+C). Somit ergibt sich Z Z x cos x dx = x sin x − 1 · sin x dx = x sin x + cos x + C. R b) Für Anwendungen wichtig (z.B. Energieberechnung) ist das Integral sin2 x dx. Wir schreiben sin2 x = sin x·sin x und setzen u(x) = sin x und v 0 (x) = sin x, v(x) = − cos x. Das ergibt Z Z Z 2 2 sin x dx = − sin x cos x + cos x dx = − sin x cos x + 1 − sin2 x dx Z = − sin x cos x + x − sin2 x dx. R Die Addition von sin2 x dx auf beiden Seiten ergibt Z 1 2 sin2 x dx = − sin x cos x + x + C = x − sin 2x + C, also 2 Z 1 1 C sin2 x dx = x − sin 2x + C1 mit C1 = . 2 2 2 138 8 INTEGRALRECHNUNG R c) Ein weiterer Trick begegnet uns bei der Berechnung des Integrals ln x dx. Diesmal setzen wir ln x = 1 · ln x und u0 (x) = 1, v(x) = ln x, u(x) = x. Das ergibt Z Z Z x ln x dx = 1 · ln x dx = x ln x − dx = x ln x − x + C = x(ln x − 1) + C. x Satz 8.29 (Die Substitutionsregel) Es sei f stetig auf I und es sei g stetig differenzierbar auf I1 mit g(I1 ) ⊆ I. Dann gelten für alle a, b ∈ I1 die Formeln Zb Zg(b) 0 f (g(x))g (x)dx = a Z f (z) dz und Z 0 f (g(x))g (x) dx = f (z) dz g(a) . z=g(x) Beweis. Die Kettenregel ergibt d dx Zg(x) d f (z)dz = dz Z f (z)dz g(a) Also ist g(x) R · z=g(x) d g(x) = f (g(x)) · g 0 (x). dx f (z) dz eine Stammfunktion von f (g(x)) · g 0 (x). g(a) 8.30 (Anwendung der Substitutionsregel von links nach rechts“) ” Wenn der Integrand die Gestalt eines Produktes hat, das sogar in der Form f (g(x)) · g 0 (x) oder g 0 (x)f (g(x)) geschrieben werden kann, so ist die Formel aus Satz 8.29 mit Erfolg anwendbar. Wir geben einige Beispiele. R R R 1 1 2 2 a) x · sin x dx = 2 2x · sin x dx = 2 sin z dz z=x2 = − 12 cos z b) R Z c) sin x cos x e ln x dx x dx = R e dz +C z=x2 z = − 21 cos x2 + C = e z z=sin x Z = = 1 · ln x dx x 1 2 z +C 2 Z = = z=ln x Z d) x dx 1 + x2 = = Z 1 1 2x · dx 2 1 + x2 1 ln |z| +C 2 z=1+x2 = = + C = esin x + C z=sin x z dz z=ln x 1 (ln x)2 + C. 2 Z 1 1 dz 2 z z=1+x2 1 2 ln(1 + x2 ) + C . 8.5 Integrationsmethoden 139 8.31 (Anwendung der Substitutionsregel von rechts nach links“) ” Während in 8.30 die zu verwendenden Substitutionen meistens auf der Hand liegen, ist bei der Anwendung von rechts nach links“ eine geeignete Substitution erst zu entdecken. ”R 2 dz 2 a) Für das Integral √1−z 2 bietet sich wegen cos t = 1 − sin t die Substitution z = sin t an. Es ist dann z 0 = cos t, also Z Z Z 1 cos t dz √ p dt = · cos t dt = | cos t| 1 − z2 1 − sin2 t Z = ± dt = ± t + C = ± arcsin z + C. b) Zur Berechnung des Flächeninhaltes √ des Einheitskreises haben wir den Inhalt der Ordinatenmenge der Kreislinie f (z) = 1 − z 2 zu berechnen. Man setzt wiederum z = sin t und erhält: µ(I0f ) = Z1 √ −1 1 − z 2 dz = Zπ/2 p 1 − sin2 t · cos t dt = −π/2 Zπ/2 cos2 t dt −π/2 π/2 π 1 = . = (t + sin t cos t) 2 2 −π/2 8.32 (Die Lineare Substitution) z = ax + b ist problemlos möglich und führt auf Z Z 1 f (z)dz. f (ax + b)dx = a Wir wenden dieses Ergebnis auf einige Beispiele an: R R a) sin(2x − 1)dx = 21 sin z dz = − 21 cos z + C = − 12 cos(2x − 1) + C. R dx b) Wir betrachten √x2 −4x+1 . Durch die quadratische Ergänzung ergibt sich x2 −4x+1 = √ √ (x − 2)2 − 3. Mit z = x − 2 ist dx = dz, und mit u = z/ 3 ist dz = 3 du. Daraus folgt Z Z Z Z dx 1 dx dz dz √ p √ q = =√ = x2 − 4x + 1 z2 − 3 3 (x − 2)2 − 3 ( √z3 )2 − 1 √ Z 3 du x−2 √ = √ = Arcosh u + C = Arcosh √ + C. u2 − 1 3 3 8.33 (Integration von Potenzreihen) Wir wissen bereits, dass Potenzreihen auf ihrem Konvergenzbereich gliedweise differenziert werden können. Wegen der Umkehrung des Hauptsatzes gilt daher Z X ∞ ∞ Z ∞ X X ak k k ak x dx = ak x + C = xk+1 + C. k + 1 k=0 k=0 k=0 140 8 INTEGRALRECHNUNG 8.34 (Die Grenzen der Berechnung von Stammfunktionen) Es erhebt sich die Frage, ob man eigentlich durch geschickte Anwendung der Integrationsregeln zu jeder vernünftigen Funktion eine Stammfunktion berechnen kann. Natürlich existiert zu jeder stetigen Funktion eine Stammfunktion, hier wird jedoch die Frage nach der formelmäßigen Berechnung gestellt. Zur Präzisierung der zu betrachtenden Funktionenklasse definieren wir: Es sei E die kleinste Menge von Funktionen mit folgenden Eigenschaften: (a) E enthält alle Potenzfunktionen, alle Exponentialfunktionen, alle trigonometrischen Funktionen. (b) Sind f, g ∈ E, so sind auch f ± g, f · g, f / g, f ◦ g und f −1 in E, sofern diese Bildungen definiert sind. Die Menge E heißt die Menge der elementaren Funktionen. Die Differentiationsregeln zeigen die Gültigkeit des folgenden Satzes: Satz. Die Ableitung jeder elementaren Funktion ist wieder elementar. Demgegenüber ist nicht jede Stammfunktion einer elementaren Funktion eine elementare Funktion. Beispielsweise sind die Funktionen Zx Si(x) = Φ(x) = sin t dt t 0 Zx t2 1 1 √ e− 2 dt + 2 2π (Integralsinus) (Gaußsche Fehlerfunktion) 0 keine elementaren Funktionen (J. Liouville 1809–1882). Für einen Beweis dieser Tatsache fehlen uns hier die Hilfsmittel. Beide der o.g. Funktionen haben in der höheren Mathematik größere Bedeutung (Theorie der Fourierreihen und Wahrscheinlichkeitsrechnung). Nach 8.33 sind die Funktionen Si(x) und Φ(x) analytisch, denn die Integranden sind analytisch: sin t 1 t3 t5 t2 t4 = t − + − +... = 1 − + − +..., t t 3! 5! 3! 5! 2 /2 e−t = ∞ ∞ X (−t2 /2)k X (−1)k t2k = . k · k! k! 2 k=0 k=0 Die Integration kann nun zwar gliedweise erfolgen. Damit erhält man zwar eine Potenzreihendarstellung für Si(x) und Φ(x), aber, wie schon erwähnt, sind diese beiden 8.6 Integration rationaler Funktionen 141 Funktionen nachweisbar keine elementaren Funktionen. Aufgaben zu Abschnitt 8.33 1. Berechnen Sie: a) R 2. Zeigen Sie a) R2π b) R2π x2 sin x dx, b) R x2 ex dx, c) R sin x cos x dx. einx e−imx dx = 0 für n, m ∈ N, n 6= m, 0 sin nx sin mx dx = 0 für alle n, m ∈ N, n 6= m. 0 3. Berechnen Sie: R d) √xx2 −1 dx, a) R e) R tan x dx = √ dx 2−x2 R sin x cos x dx, b) R 2 x e−x dx, R ln(2x+1) dx, dx. 4. Entscheiden Sie, für welche k ∈ N die Funktionen fk (x) = xk e−x grierbar sind. 8.6 c) 2 /2 elementar inte- Integration rationaler Funktionen In diesem Abschnitt soll gezeigt werden, dass rationale Funktionen elementar integrierbar sind. Wir werden dies am Beispiel demonstrieren und die notwendigen Verallgemeinerungen für den allgemeinen Fall diskutieren. Die Hauptidee für die Integration rationaler Funktionen besteht in der Anwendung der Methode der Partialbruchzerlegung. Unser Beispiel ist die Funktion f (x) = x2 + 6x + 3 . x3 + x2 − 2 1. Schritt. Wir nehmen eine Zerlegung der Nennerfunktion N (x) = x3 + x2 − 2 in reell irreduzible Faktoren vor (vgl. Aufgabe 2 aus Abschnitt 6.5). Die reelle Nullstelle x0 = 1 von N (x) ermöglicht die Abspaltung des Linearfaktors (x − 1), und es ist N (x) = (x − 1)(x2 + 2x + 2) mit dem irreduziblen Faktor (x2 + 2x + 2). 2. Schritt. Ausgehend von der Zerlegung der Nennerfunktion betrachten wir den Ansatz f (x) = A x2 + 6x + 3 Bx + C = + 2 3 2 x +x −2 x − 1 x + 2x + 2 und versuchen, Zahlen A, B und C geeignet zu bestimmen. Die Multiplikation mit der Nennerfunktion N (x) ergibt x2 + 6x + 3 = A(x2 + 2x + 2) + (Bx + C)(x − 1) = (A + B)x2 + (2A − B + C)x + 2A − C . Der Koeffizientenvergleich führt auf das eindeutig lösbare lineare Gleichungssystem 142 8 INTEGRALRECHNUNG A 2A 2A + B − B + C − C = 1 = 6 = 3 mit den Lösungen A = 2, B = − 1 und C = 1. 3. Schritt. Wir können nun die Einzelterme integrieren. Es ist Z 2 a) I1 = dx = 2 ln | x − 1 | + C, x − 1 Z Z −x + 1 −x + 1 b) I2 = dx = dx, 2 x + 2x + 2 (x + 1)2 + 1 und die Substitution z = x + 1, dz = dx, ergibt Z Z Z −z + 2 z dz dz = − dz + 2 I2 = 2 2 z +1 z +1 1 + z2 Z 1 2z = − dz + 2 arctan z 2 2 z +1 Z 1 1 du + 2 arctan z, (u = z 2 + 1), = − 2 u = − = − 1 ln | z 2 + 1 | + 2 arctan z + C 2 1 ln((x + 1)2 + 1) + 2 arctan(x + 1) + C . 2 Zusammenfassend ist Z f (x)dx = 2 ln |x − 1| − 1 ln(x2 + 1) + arctan(x + 1) + C. 2 Damit ist das Beispiel vollständig behandelt. Der allgemeine Fall einer echt gebrochenen rationalen Funktion f (x) = Z(x) Z(x) = r r N (x) (x − a1 ) 1 · . . . · (x − ak ) k · ((x − b1 )2 + c1 )s1 · . . . · (x − bl )2 + cl )sl führt auf die Partialbruchzerlegung f (x) = A1 Ar 1 B1 x + C1 Bs1 x + Cs1 +...+ +...+ +...+ +..., r 2 1 (x − a1 ) (x − a1 ) ((x − b1 ) + c1 ) ((x − b1 )2 + c1 )s1 und die Algebra lehrt, dass es eindeutig bestimmte reelle Zahlen Aj , Bj , Cj mit dieser Eigenschaft wirklich gibt. Die Integration der Terme Aj (x − a1 )p 8.6 Integration rationaler Funktionen 143 ist durch die Substitution z = x − a1 zu erledigen. Für die Integration von Bj x + Cj ((x − b1 )2 + C1 )q substituieren wir u = x − b1 . Das führt auf einen Ausdruck der Form Dj u Ej Dj u + Ej = + . 2 q 2 q 2 (u + C1 ) (u + C1 ) (u + C1 )q Der erste Summand wird durch die Substitution v = u2 +C1 , dv = 2u du, leicht √zugänglich, 2 2 während der zweite Summand durch die Substitution u = C1 w , du = ± C1 dw, auf die Form Fj 2 (w + 1)q gebracht werden kann. Für Integrale der Form Z 1 Iq : = dw 2 (w + 1)q finden wir schließlich die folgende Rekursionsformeln I1 = arctan w + C, 1 w 2q − 1 Iq+1 = + Iq . 2 q 2q (w + 1) 2q In der Tat führt eine partielle Integration von Iq mit 1 , g 0 (w) = 1, (w2 + 1)q 2qw h0 (w) = − , g(w) = w, 2 (w + 1)q+1 h(w) = auf die Gleichung Z w dw w2 = = + 2q dw (w2 + 1)q (w2 + 1)q (w2 + 1)q+1 Z w w2 + 1 1 = + 2q − dw (w2 + 1)q (w2 + 1)q+1 (w2 + 1)q+1 Z Iq = (w2 w + 2q (Iq − Iq+1 ), + 1)q und die Auflösung dieser Gleichung nach Iq+1 ergibt die behauptete Rekursionsformel. Aufgaben zu 8.6 1. Integrieren Sie die Funktion f (x) = 3x3 − 8x2 + 5x − 9 . x4 − 3x3 + x2 + 4 2. Integrieren Sie die Funktion f (x) = x3 . x2 − 2x + 1 144 8.7 8 INTEGRALRECHNUNG Vertauschung von Limes und Integral Das Problem: Ist (fn ) eine Folge integrierbarer Funktionen auf dem Intervall I und konvergiert die Folge (fn (x)) für jedes x ∈ I, so kann durch die Gleichung f (x) = lim fn (x), n→n x ∈ I, eine neue Funktion f auf I definiert werden. Es erhebt sich nun die Frage, ob f selbst wieder integrierbar ist und ob sogar Z Z lim fn (x)dx = lim fn (x)dx (?) n→∞ n→∞ gilt. Eine solche Aussage war uns in 8.33 bei der Integration von Potenzreihen bereits begegnet. Im allgemeinen ist aber für das Riemannsche Integral eine positive Antwort nur unter ziemlich starken Voraussetzungen zu erhalten. Wir betrachten zunächst zwei Gegenbeispiele. Es sei I = [0, 1]. Die Menge M = [0, 1] ∩ Q der rationalen Zahlen im Intervall I werde zu einer Folge M = {r1 , r2 , . . .} angeordnet. Wir definieren eine Folge (fn ) von Funktionen durch ( fn (x) = 1 für x ∈ {r1 , . . . , rn }, 0 sonst. Dann ist jede Funktion fn integrierbar mit R1 fn (x)dx = 0. Die Grenzfunktion 0 f (x) = lim fn (x) n→∞ ist aber gerade die Dirichlet–Funktion, die sich als nicht Riemann–integrierbar erwiesen hatte. Das zeigt, dass Grenzfunktionen Riemann–integrierbarer Funktionen nicht einmal Riemann–integrierbar sein müssen. Dieser Mangel des Riemannschen Integrals war für H. Lebesgue (1875 – 1941) der Anlass, ein leistungsfähigeres Integral, das heute Lebesgue– Integral genannt wird und von größter Bedeutung in der modernen Mathematik ist, zu schaffen. Die Einführung dieses Integrals geht über dem Rahmen dieses Lehrmaterials hinaus und ist einem Kurs Maß– und Integrationstheorie vorbehalten. Weiter zeigt sich (und dieser Effekt wird auch beim Lebesgue–Integral auftreten), dass im Fall der Integrierbarkeit der Grenzfunktion die Gleichung (?) dennoch nicht gelten muss. Für die in Abbildung 8.7 definierte Folge stetiger Funktionen fn gilt offenbar fn (x) → 0 für alle x ∈ [0, 1], aber andererseits ist Z1 Z1 fn (x) dx = 1 6= 0 = fn (x)dx = 1, also lim 0 Z1 0 0 dx. 0 Um zu positiven Ergebnissen zu kommen, müssen wir bei Verwendung des Riemannschen Integrals stärkere Voraussetzungen an die Güte der Konvergenz fn (x) → f (x) machen. Wir verallgemeinern dazu die Definition der gleichmäßigen Konvergenz (siehe Def. 6.18), die wir bisher nur für stetige Funktionen eingeführt hatten, ein wenig: 8.7 Vertauschung von Limes und Integral 145 Abbildung 29: Eine Funktionenfolge mit limn R fn (x) dx 6= R limn fn (x) dx Definition 8.35 Eine Folge von Funktionen fn heißt gleichmäßig konvergent gegen die Funktion f auf dem Intervall I, wenn die folgende Bedingung erfüllt ist: lim sup | fn (x) − f (x) | = 0. n→∞ x∈I Ein wichtiges Beispiel einer solchen Situation behandelt der folgende Satz, den wir auch schon früher hätten beweisen können: Satz 8.36 Die Folge der Partialsummen einer Potenzreihe f konvergiert auf jeder kompakten Teilmenge des Konvergenzkreises sogar gleichmäßig gegen f . P Beweis. Es sei f (x) = an (x − x0 )n mit Konvergenzradius R > 0 gegeben. Zu jeder kompakten Teilmenge M ⊆ KR (x0 ) = {x : |x − x0 | < R} existiert eine Zahl 0 ≤ ρ < R mit M ⊆ {x : |x − x0 | ≤ ρ} ⊆ KR (x0 ). Also ist ∞ ∞ n X X X ak ρk → 0, ak (x − x0 )k ≤ ak (x − x0 )k ≤ sup sup f (x) − x∈M |x−x0 |≤ρ k=n+1 k=1 k=n+1 was zu beweisen war. Nun gilt der folgende Grenzwertsatz: Satz 8.37 (Ein Grenzwertsatz) Konvergiert die Folge (fn ) von Riemannintegrierbaren Funktionen auf dem beschränkten, abgeschlossenen Intervall I gleichmäßig gegen die Funktion f , so ist f integrierbar und es gilt Z Z lim fn (x)dx = f (x)dx. n→∞ I I Beweis. Die Funktion f ist als gleichmäßiger Grenzwert von beschränkten Funktionen selbst beschränkt. Die Integrierbarkeit von f beweisen wir mit dem Riemannschen Integrabilitätskriterium. Es sei ε > 0 beliebig gegeben. Dann existiert eine Zahl N = N (ε) derart, dass die folgende Ungleichung gilt: ε sup |f (x) − fn (x)| < für alle n ≥ N. µ(I) x∈I 146 8 INTEGRALRECHNUNG Zu fN wählen wir nun eine Zerlegung Z derart, dass S(fN , Z) − S(fN , Z) < ε gilt. Dann ist S(f, Z)−S(f, Z) ≤ |S(f, Z)−S(fN , Z)|+|S(fN , Z)−S(fN , Z)|+|S(fN , Z)−S(f, Z)| < 3ε. Also ist f integrierbar. Überdies gilt Z Z Z |fn (x) − f (x)| dx ≤ ε für alle n ≥ N (ε), f (x)dx ≤ fn (x)dx − I I I und das beweist die Behauptung des Satzes. Anwendung betrachten wir die Formel für die Differentiation eines Integrals nach einem Parameter. Es seien I und J zwei kompakte Intervalle, und die Funktion f (x, t) : ∂ I×J → R sei auf I×J stetig partiell differenzierbar nach t. Dann ist die Ableitung ∂t f (x, t) auf I × J sogar gleichmäßig stetig, und es gilt Z Z d ∂ f (x, t) dx. f (x, t) dx = dt ∂t I I Beweis. Unter Verwendung des Mittelwertsatzes der Differenzialrechnung sieht man, dass die Folge der Differenzenquotienten bezüglich t gleichmäßig auf I gegen die partielle Ableitung konvergiert. Daher ist der Satz 8.37 anwendbar. Aufgaben zu Abschnitt 8.7 d 1. Berechnen Sie dt Z1 d sin(tx) dx und dt 0 Zt sin(tx) dx. 0 2. Darf man für die Funktionenfolge (fn (x)) mit fn (x) = R∞ mit dem Integral −∞ vertauschen? 8.8 √1 2πn x2 e− 2n den Limes lim n→∞ Uneigentliche Integrale Wir wollen in diesem Abschnitt die Integration auf unbeschränkte Intervalle und auf unbeschränkte Funktionen ausdehnen. Dazu definieren wir: Definition 8.38 Die Funktion f sei auf dem Intervall [a, b) definiert und auf jedem abgeschlossenen Teilintervall [a, c] ⊆ [a, b) integrierbar. Dann heißt Zb Zc f (x) dx = lim f (x) dx c%b a a das uneigentliche Integral von f auf [a, b), falls der Limes existiert. Entsprechend wird die Integration auf (a, b] und auf (a, b) definiert. 8.8 Uneigentliche Integrale 147 Bemerkung 8.39 Falls f auf dem Intervall [a, b] integrierbar ist, so fallen das eigentliche und das soeben definierte uneigentliche Integral zusammen, so dass die Symbolik nicht zweideutig ist. In der Tat gilt für integrierbare Funktionen die Abschätzung Zc Z b Zb f (x) dx = f (x) dx≤ |b − c| · sup |f (x)| → 0 für c % b. f (x) dx − a≤x≤b a a c Beispiel 8.40 Wir betrachten einige Beispiele. K RK −x R∞ −x −x e dx = lim −e = 1 − lim (−e−K ) = 1. (a) e dx = lim (b) R1 ln x dx = lim R∞ 1 R1 ε&0 ε 0 (c) K→∞ K→∞ 0 0 1 x RK dx = lim K→∞ 1 K→∞ 0 1 ln x dx = lim x ln x − x = lim (−1 − ε ln ε + ε) = −1 ε&0 ε&0 ε 1 x dx = lim ln K = ∞ K→∞ ∞ ( R∞ dx ∞ x−α+1 = lim = (d) 1 α K→∞ −α + 1 1 x 1 α−1 für 0 < α < 1 für α > 1. Uneigentliche Integrale können auch vorteilhaft bei Konvergenzuntersuchungen unendlicher Reihen eingesetzt werden, wir hatten das folgende Kriterium bereits in 5.11 benutzt. Satz 8.41 (Cauchyscher Integraltest) Es sei f eine monoton fallende nicht negative Funktion auf [1, ∞). Dann gilt Z∞ f (x) dx < ∞ genau dann, wenn ∞ X f (n) < ∞. n=1 1 Beweis. Die Idee des Beweises besteht darin, die Summen K P f (n) als Ober- bzw. Un- n=1 tersummen des Riemannschen Integrals aufzufassen. Es gelte zunächst R∞ f (x) dx < ∞. 1 Wegen ∞ X f (n) = lim K→∞ n=2 K X n=2 f (n) = lim K X K→∞ Z∞ ZK f (n)·(n−(n−1)) ≤ lim konvergiert dann die Reihe. Setzen wir umgekehrt 1 ∞ P f (x)dx < ∞ f (x)dx = K→∞ n=2 1 f (n) < ∞ voraus, so folgt n=1 ZK Z2 f (x)dx ≤ 1 ZK f (x)dx ≤ f (1) + f (x)dx + 1 2 K−1 X n=1 f (n) ≤ f (1) + ∞ X n=1 f (n) < ∞. 148 8 INTEGRALRECHNUNG Daraus folgt lim RK K→∞ 1 f (x)dx < ∞. In 5.11 haben wir das Kriterium bereits zur Untersuchung der Dirichlet-Reihen ∞ P k=1 1 kα in Abhängigkeit von α > 0 benutzt und einen Umschlag im Konvergenzverhalten für α = 1 gefunden. Da wir inzwischen über leistuungsfähige Methoden zur Berechnung von Integralen verfügen, können wir aber mit Hilfe des Integraltestes sogar Feinuntersuchungen zu dieser Reihe anstellen. Dies ist der Inhalt von Aufgabe 1. Als weiteres Beispiel betrachten wir die Γ-Funktion. 8.42 (Die Γ-Funktion) Die Funktion Z∞ Γ(s) = xs−1 e−x dx, s > 0, 0 heißt Gamma-Funktion. Der Name wurde zu Ehren von Carl Friedrich Gauss gewählt und die Nützlichkeit dieser Funktion werden wir sogleich beleuchten. Wir weisen zunächst die Konvergenz des Integrals nach. Es sei s > 0. Die Funktion f (x) = xs−1 e−x ist auf [1, ∞) nichtnegativ und wegen f 0 (x) = (s − 1)xs−2 e−x − xs−1 e−x = (s − 1 − x)xs−2 e−x < 0 für x > s − 1 auf (s − 1, ∞) auch monoton fallend. Für die Konvergenz von R∞ f (x)dx genügt es daher 1 nach 8.41, die Konvergenz der Reihe X f (n) = n≥s ∞ X ns−1 en n=1 nachzuweisen. Das Wurzelkriterium ergibt √ n ns−1 e−n → also konvergiert die Reihe und damit auch R∞ 1 < 1, e f (x)dx. Weiter ist 1 Z1 x 0 s−1 −x Z1 e dx ≤ x 0 s−1 Z1 dx = lim x ε→0 ε s−1 1 xs 1 = dx = lim ε→0 s s ε für alle s > 0. Das zeigt insgesamt, dass Γ(s) für alle s > 0 definiert ist. Wir beweisen nun die wichtige Rekursionsformel: Γ(1) = 1 und Γ(s + 1) = s Γ(s) für alle s > 0. 8.9 Integration und Inhaltslehre 149 In der Tat erhält man (Partielle Integration!): ∞ Z∞ Z∞ s −x s −x xs−1 e−x dx = 0 + s Γ(s), Γ(s + 1) = x e dx = −x e + s 0 Z∞ Γ(1) = 0 0 ∞ e−x dx = −e−x 0 = 1. 0 Als Folgerung ergibt sich Γ(n + 1) = n! für alle n ∈ N. Die Γ-Funktion ist also eine differenzierbare Fortsetzung der Fakultätsfunktion (s. Aufgabe 4). Aufgaben zu Abschnitt 8.8 1. Man zeige unter Verwendung von 8.41, dass die Reihe die Reihe ∞ P n=2 ∞ P n=2 1 n(ln n)2 1 n ln n auch noch divergiert, aber bereits konvergiert. 2. Man berechne die 1. kosmische Geschwindigkeit. 3. Fertigen Sie eine Skizze des Graphen der Γ-Funktion an. 4. Beweisen Sie, dass die Γ-Funktion auf (0, ∞) konvex ist. 8.9 Integration und Inhaltslehre Den Flächeninhalt der Ordinatenmenge einer stetigen Funktion haben wir bereits in Definition 8.14 mit Hilfe des Integrals eungeführt. In diesem Abschnitt wollen wir nun allgemein und systematisch den Riemannschen Flächeninhaltsbegriff einführen, auch um eine höherdimensionale Inhaltslehre zu begründen. Nach der bereits von Archimedes benutzten Exhaustionsmethode (= Methode des Ausschöpfens) gehen wir dabei folgendermaßen und in großer Analogie zur Definition des Riemannschen Integrals vor: Definition 8.43 (Der 2dim Riemannschen Inhalt) Der zweidimensionale mannsche Inhalt einer Menge M ⊂ R2 wird schrittweise definiert: Rie- 1. Unter einem Eichquadrat n–ter Ordnung verstehen wir eine Menge der Form m m+1 k k+1 Qn;m,k = n , × n, ⊂ R2 für k, m, n ∈ Z. 2 2n 2 2n Es sei Qn die Menge aller Eichquadrate n-ter Ordnung. Die Zahl en = der elementare Flächeninhalt der Eichquadrate n-ter Ordnung. 1 2 2n heißt 150 8 INTEGRALRECHNUNG 2. Für eine beschränkte Menge M ⊆ R2 definieren wir den inneren bzw. äußeren Inhalt der Menge M vom Grad n durch µn (M ) = en ·card{Q ∈ Qn : Q ⊆ M } bzw. µn (M ) = en ·card{Q ∈ Qn : M ∩Q 6= ∅}. Weiter definieren wir den inneren bzw. äußeren Inhalt von M durch µ(M ) = sup µn (M ) = lim µn (M ) bzw. µ(M ) = inf µn (M ) = lim µn (M ). n∈N n→∞ n→∞ n∈N 3. Schließlich heißt die Menge M quadrierbar, wenn µ(M ) = µ(M ) ist. In diesem Fall heißt die Zahl µ(2) (M ) = µ(M ) = µ(M ) der 2–dimensionale Riemannsche oder auch der Peano–Jordansche Inhalt von M . Abbildung 30: Der Riemannsche Inhalt einer Menge M Nicht jede Teilmenge M ⊂ R2 ist quadrierbar, ein solches Beispiel ist die Ordinatenmenge der Dirichletfunktion, also die Menge M = {(x, y) ∈ R2 : x ∈ Q ∩ [0, 1], y ∈ [0, 1]}. Für diese Menge ist nämlich µ(M ) = 0 6= µ(M ) = 1. Ohne große Mühe (bitte ausführen!) beweist man: Satz 8.44 Der zweidimensionale Inhalt µ = µ(2) hat die folgenden Eigenschaften: (a) µ(Q) = en für alle Eichquadrate Q ∈ Qn und µ(∅) = 0. (b) Sind M1 , M2 ⊆ R2 quadrierbar mit M1 ⊆ M2 , so ist µ(M1 ) ≤ µ(M2 ). (Monotonie) (c) Sind M1 , M2 ⊆ R2 quadrierbar und disjunkt, so ist M1 ∪ M2 quadrierbar und es gilt µ(M1 ∪ M2 ) = µ(M1 ) + µ(M2 ). (Additivität) (d) Sind I1 , I2 Intervalle in R, so ist I1 × I2 quadrierbar und es gilt µ(I1 ×I2 ) = µ(1) (I1 )·µ(1) (I2 ). (Dimensionsredukion) (e) Für jede Matrix A ∈ R2,2 und alle Eichquadrate Q gilt µ(A(Q)) = µ{A~x : ~x ∈ Q} = | det A| · µ(Q). 8.9 Integration und Inhaltslehre 151 Wir wollen nun Methoden zur effektiven Berechnung von Inhalten entwickeln. Definition 8.45 (Normalbereich) Eine Teilmenge M ⊆ R2 heißt ein Normalbereich bezüglich der y-Achse, wenn es ein Intervall I = [a, b] ⊆ R und stetige Funktionen f und g auf I so gibt, dass M = Mgf = {(x, y) : x ∈ I, g(x) ≤ y ≤ f (x)}. Die Verbindung von Inhaltslehre und Integration ist nun durch den folgenden Satz gegeben: Satz 8.46 Normalbereiche Mgf sind quadrierbar, und es gilt µ(Mgf ) = f (x) Zb Z Zb f (x) − g(x) dx = a dy dx. a g(x) Bemerkung. Das 2-dim. Cavallierische Prinzip ist ein Spezialfall dieses Satzes. Beweis. Wir setzen M = Mgf . Es sei Z eine beliebige Zerlegung des Intervalls I. Dann gilt nach Satz 8.44,(c)–(e), sicherlich S(f, Z) − S(g, Z) ≥ µ(M ) ≥ µ(M ) ≥ S(f, Z) − S(g, Z). Der Übergang zum Infimum (l. S.) bzw. Supremum (r. S.) über allen Zerlegungen liefert Zb Zb f (x) − g(x) dx ≥ µ(M ) ≥ µ(M ) ≥ f (x) − g(x) dx. a a Also ist µ(M ) = µ(M ) = Rb f (x) − g(x) dx. a Beispiel 8.47 (a) Für 0 < a < b sei M das durch das Intervall I = [a, b] und die Funktionen f (x) = x und g(x) = 0 beschriebene Trapez. Dann ist b Zb x2 b 2 − a2 (2) µ (M ) = (x − 0)dx = = . 2 a 2 a (b) Wir berechnen den Flächeninhalt A der Ellipse mit den achsenparallelen Halbmessern a und b. Die Ellipse wird dann von den Funktionen r x 2 f± (x) = ±b 1 − , x ∈ [−a, a], a berandet. Daher ist sie ein Normalbereich und es gilt (s.a. Beispiel 8.31b)) Za r Z1 √ x 2 A=2 b 1− dx = 2b a 1 − t2 dt = b · a · π. a −a Aufgabe: Beweisen Sie die Formel e) in Satz 8.44. −1 152 8 INTEGRALRECHNUNG 8.10 Gebietsintegrale Will man die Masse eines Körpers B ⊆ R3 mit inhomogener Dichte ρ = ρ(x, y, z) ermitteln, so hat man ein Integral der Form Z ρ(x, y, z) d V (x, y, z) m= B zu berechnen. Dabei wird dV (x, y, z) als ein Volumenelement bezeichnet. Es soll der Inhalt dieses Abschnitts sein, ein solches Gebietsintegral zu definieren und dessen Eigenschaften zu untersuchen. Dabei gehen wir in Analogie zur Konstruktion des 1-dimensionalen Riemann-Integrals vor. Definition 8.48 (Gebietsintegrale) Es sei B ⊆ Rn eine beschränkte, abgeschlossene und quadrierbare Menge, und es sei f (x) = f (x1 , . . . , xn ) = eine auf B definierte und beschränkte Funktion. 1. Eine Zerlegung Z von B ist ein endliches System Z = {Mi : 1 ≤ i ≤ n} von n S quadrierbaren Mengen Mi ⊆ B mit µ(Mi ∩ Mj ) = 0 für i 6= j und Mi = B. i=1 2. Die Obersumme bzw. Untersumme von f zur Zerlegung Z ist S(f, Z) = n X f (Mi ) µ(Mi ) bzw. S(f, Z) = i=1 n X f (Mi ) µ(Mi ) i=1 mit f (Mi ) = sup{f (x) : x ∈ Mi } und f (Mi ) = inf{f (x) : x ∈ Mi }. 3. Die Darbouxsche Obersumme bzw. Untersumme von f ist definiert durch S(f ) = inf {S(f, Z) : Z Zerlegung von B}, S(f ) = sup {S(f, Z) : Z Zerlegung von B}. 4. Gilt S(f ) = S(f ), so heißt diese Zahl das Integral von f auf B, und man setzt Z Z f (x) dx = f (x1 , . . . , xn ) d(x1 , . . . , xn ) = S(f ) = S(f ). B B Für das Gebietsintegral lassen sich ähnliche Kriterien wie für das 1-dimensionale Riemannsche Integral aufstellen. Insbesondere gilt wiederum: Satz 8.49 (Riemannsches Integrabilitätskriterium) Eine Funktion f ist integrierbar auf der quadrierbaren Menge B ⊆ Rn genau dann, wenn es zu jedem ε > 0 eine Zerlegung Z von B derart gibt, dass S(f, Z) − S(f, Z) < ε ausfällt. 8.10 Gebietsintegrale 153 Da für stetige Funktionen f auf abgeschlossenen beschränkten Teilmengen B ⊆ Rn wiederum der Satz vom Maximum und Minimum und der Satz von der gleichmäßigen Stetigkeit gilt, beweist man wie in 8.9 den folgenden: Satz 8.50 (Existenzsatz) IstR B ⊆ Rn abgeschlossen, beschränkt und quadrierbar und ist f auf B stetig, so existiert f (x) dx. B Beweis. sei ε > 0 gegeben. Zu ε existiert wegen der gleichmäßigen Stetigkeit von f auf B ein δ > 0 derart, dass für alle Punktepaare x, x0 ∈ B mit |x−x0 | ≤ δ auch |f (x)−f (x0 )| ≤ ε gilt. Wir wählen eine Zerlegung Z = {Mi : 1 ≤ i ≤ n} mit d(Mi ) = sup{|x−x0 | : x, x0 ∈ M } ≤ δ. Dann gilt f (Mi ) − f (Mi ) ≤ ε. Folglich ist S(f, Z) − S(f, Z) = n X (f (Mi ) − f (Mi )) µ(Mi ) ≤ ε · i=1 n X µ(Mi ) = ε µ(B). i=1 Da ε beliebig war, ist f nach Satz 8.49 integrierbar. Ohne Schwierigkeiten zeigt man, dass das Gebietsintegral positiv, additiv und homogen ist. Ferner gilt für stetige Integranden der Mittelwertsatz, den man wiederum wie im 1-dimensionalen Fall beweist: Satz 8.51 (Mittelwertsatz) Ist B ⊆ Rn quadrierbar, abgeschlossen, beschränkt und zusammenhängend8 und ist f auf B stetig, so existiert ein x0 ∈ B mit Z f (x) dx = f (x0 ) · µ(B). B Wir sind nunmehr in der Lage, Gebietsintegrale unter geeigneten Voraussetzungen auf wiederholte eindimensionale Integration zurückzuführen und somit die Technik der Stammfunktionen auszunutzen. Wir begnügen uns dabei mit dem zweidimensionalen Fall. Satz 8.52 (Reduktionssatz, iterierte Integration) Es sei Q = I × J ⊆ R2 ein abgeschlossenes Rechteck und es sei f auf Q definiert und stetig. Dann gilt Z Z Z Z Z f (x, y)dy dx. f (x, y)d(x, y) = f (x, y)dx dy = Q J I I J Das Gebietsintegral auf dem Rechteck Q kann also durch zwei iterierte 1-dimensionale Integrale berechnet werden. Beweis. Wir setzen Z α= Z f (x, y)d(x, y) und β = Q 8 Z f (x, y)dx dy. J I Eine Menge B heißt (bogen-)zusammenhängend, wenn je zwei Punkten x, y ∈ B durch eine Kurve, die ganz in B verl}äuft, verbunden werden können. 154 8 INTEGRALRECHNUNG Es sei ε > 0 beliebig gegeben. Da f auf der kompakten Menge Q sogar gleichmäßig stetig √ ist, existiert ein δ > 0 derart, dass | f (x)−f (x0 ) | < ε für alle x, x0 ∈ Q mit |x−x0 | ≤ 2 δ gilt. Wir wählen disjunkte Zerlegungen {Ii : 1 ≤ i ≤ n} von I und {Jj : 1 ≤ j ≤ m} von J mit d(Ii ) ≤ δ und d(Jj ) ≤ δ für alle i, j. Dann√ist {Ii × Jj : 1 ≤ i ≤ n, 1 ≤ j ≤ m} eine disjunkte Zerlegung von Q mit d(Ii × Jj ) ≤ 2δ. Weiter ist X Z XZ Z α= f (x, y)d(x, y) und β = f (x, y)dx dy. i,j i,j J j Ii ×Jj Ii Wir betrachten die Differenz zweier Summanden zum Index i, j. Es ist Z Z Z f (x, y)d(x, y) − f (x, y)dx dy ≤ Ii ×Jj Jj Ii ≤ max f (x, y) · µ(Ii × Jj ) − min f (x, y) · µ(2) (Ii )µ(2) (Jj ) Ii ×Jj ≤ Ii ×Jj max f (x, y) − min f (x, y) · µ(2) (Ii × Jj ) ≤ εµ(2) (Ii × Jj ). Ii ×Jj Ii ×Jj Das ergibt α−β ≤ε· X µ(2) (Ii × Jj ) = ε · µ(2) (Q). i,j Entsprechend zeigt man β − α ≤ ε · µ(2) (Q). Folglich ist |α − β| ≤ ε · µ(2) (Q). Da ε > 0 beliebig war, ist das nur für α = β möglich. Als Beispiel betrachten wir die Funktion f (x, y) = x2 y auf dem Rechteck B = [−1, 1] × [0, 1]. Es ist Z 2 Z1 Z1 x y d(x, y) = B 2 Z1 x y dy dx = −1 0 x −1 2y 2 1 dx = 2 0 Z1 −1 1 x3 2 x2 dx = = . 2 6 −1 6 Der Reduktionssatz lässt sich von Rechtecken auf Normalbereiche verallgemeinern: Satz 8.53 (Iterierte Integrale, Fubini) Es seien g, h : [a, b] → R stetige Funktionen, und es sei Mgh = {(x, y) : a ≤ x ≤ b, g(x) ≤ y ≤ h(x)} ⊆ R2 der hierdurch definierte Normalbereich. Ferner sei f : Mgh → R eine stetige Funktion. Dann ist h(x) Zb Z Z f (x, y)d(x, y) = Mgh f (x, y)dy dx. a g(x) Beweis. Wie im Beweis zu Satz 8.46 gezeigt wurde, existiert zu jedem ε > 0 eine endliche Menge von paarweise disjunkten Rechtecken Qi = Ii × Ji mit n [ X (2) h (2) h M= Qi ⊆ Mg und µ (Qi ) − µ (Mg ) < ε. i=1 i 8.10 Gebietsintegrale 155 Unter Verwendung der Additivität des Riemannschen Inhalts und des zweidimensionalen Riemannschen Integrals folgt nun Z Z Z f (x, y)d(x, y) f (x, y)d(x, y) = f (x, y)d(x, y) − M Mgh Mgh \M ≤ max | f | · µ(2) (Mgh \ M ) = max | f | · ε. Für das Integral über M ergibt sich mit Satz 8.52 die Gleichung Z Z X Z X Z f (x, y)d(x, y) = f (x, y)d(x, y) = f (x, y)d(x, y) = S M i Qi i Qi Ii Z f (x, y)dy dx. Ji Sind die Intervalle Ii hinreichend schmal gewählt, so ist (h(x) − g(x)) − µ(Ji ) ≤ ε für alle x ∈ Ii auf Grund der gleichmäßigen Stetigkeit von h und g. Somit gilt h(x) Z Z f (x, y)dy ≤ max | f | · ε für alle x ∈ Ii . f (x, y)dy − Ji g(x) Das ergibt wegen des Reduktionssatzes für Rechtecke: h(x) Z Zb Z f (x, y)d(x, y) − f (x, y)dy dx a M g(x) Z X = Z Ii Ji i f (x, y)dy dx − X Z i Ii h(x) Z f (x, y)dy dx g(x) h(x) Z X Z Z dx = f (x, y)dy − f (x, y)dy i Ii Ji ≤ max | f | · ε · g(x) X µ(Ii ) = (b − a) max | f | · ε. i Die Zusammensetzung beider Ungleichungen liefert schließlich h(x) Z Zb Z ≤ ε · const f (x, y)d(x, y) − f (x, y)dy dx Mgh a g(x) für alle ε > 0. Folglich sind beide Terme untereinander gleich. 156 8 INTEGRALRECHNUNG Z |x| d(x, y) mit EK = {(x, y) : Beispiel 8.54 Wir berechnen p x2 + y 2 ≤ 1. Es ist EK √ Z1−x2 Z1 Z |x| dy dx = |x| d(x, y) = √ − 1−x2 −1 EK Z1 Z1 = 2 2x √ √ |x| · 2 1 − x2 dx −1 Z0 1− x2 dx = −2 √ Z1 z dz = 2 1 0 0 √ √ 1 ( z)3 1 z dz = = . 3 0 3 8.55 (Ein Gegenbeispiel) Die Reduktionsformeln 8.52 und 8.53 lassen die Frage aufkommen, warum wir Gebietsintegrale nicht von Hause aus durch iterierte niederdimensionale Integrale definiert haben. Als Mahnung zur Vorsicht betrachten wir das folgende Beispiel iterierter (uneigentlicher) Integrale, RR R R wo aus der Existenz des Integrals f (x, y)dx dy nicht einmal die Existenz von f (x, y)dy dx folgen muss. Dazu sei f (x, y) = Z1 Z1 Dann ist Z1 f (x, y)dx dy = 0 −1 0 Z1 Z1 Z1 f (x, y)dy dx wegen −1 0 x/y 0 für für y>0 . y=0 1 Z1 x2 dy = 0 dy = 0, während das Integral 2y −1 0 x dy = sgn(x) · ∞ für x 6= 0 nicht existiert. y 0 R Im Vorgriff auf dreidimensionale Inhaltslehre µ(3) und Integration d(x, y, z) zeigen wir unter Verwendung eines entsprechenden Satzes über iterierte Integrale die nützliche Formel. Sie ließe sich auch mittels Satz 8.58 und Zylinderkoordinaten beweisen. Beispiel 8.56 (Volumenformel für Rotationskörper) Es sei p B = (x, y, z) : a ≤ x ≤ b, y 2 + z 2 ≤ f (x) ein Körper, der durch Rotation der Kurve y = f (x) um die x-Achse entsteht. Dann gilt [ p B= Kx mit Kx = {(y, z) : y 2 + z 2 ≤ f (x)}. a≤x≤b Somit ist (3) Zb Z Z µ (B) = d(x, y, z) = d(y, z)dx = a B (3) Zb a Kx Zb Das ergibt schließlich µ (B) = π a µ f (x)2 dx. (2) Zb (Kx )dx = a f (x)2 π dx. 8.11 Die Transformationsformel 157 Abbildung 31: Rotationskörper Für die dreidimensionale Kugel Kr mit Radius r > 0 ergibt das (3) Zr 2 2 (r − x ) dx = π µ (Kr ) = π −r x3 r x− 3 2 r = 4 π r3 . 3 −r Aufgaben zu Abschnitt 8.10 1. Berechnen Sie das Volumen des Rotationsellipsoids 2 y2 z2 3 x E = (x, y, z) ∈ R : 2 + 2 + 2 ≤ 1 . a b b Z 2. Berechnen Sie das Integral Θ = x2 + y 2 d(x, y, z) für die Scheibe B vom Radius B r und der Dicke h, also B = {(x, y, z) : 0 ≤ z ≤ h, x2 + y 2 ≤ r2 } ⊆ R3 . (Θ ist in der Physik das sogenannte axiale Trägheitsmoment der Scheibe B). 8.11 Die Transformationsformel Wir stellen die Frage, wie sich eine Koordinatentransformation auf die Integration und Inhaltsberechnung auswirkt. Im Ergebnis dieser Betrachtungen werden wir eine leistungsfähige Transformationsformel für mehrdimensionale Integrale erhalten, die als Verallgemeinerung der Substitutionsformel auf den mehrdimensionalen Fall aufgefasst werden kann. Wir beginnen mit dem einfachsten Fall, der linearen Koordidatentransformation. Dazu sei A ∈ Rn,n eine quadratische Matrix mit det A 6= 0. Diese Matrix erzeugt eine Abbildung, die wir ebenfalls durch A bezeichnen: A : Rn → Rn vermöge u 7→ x(u) = A · u. In Koordinaten von u = (u1 , . . . , un ) und x = (x1 , . . . , xn ) ausgedrückt heißt das xi = n X j=1 aij uj mit A = (aij ), 158 8 INTEGRALRECHNUNG und für späteres vermerken wir ∂ xi = aij . ∂ uj Es sei nun Q ⊆ Rn ein Quader. Dann ist sein Bild A(Q) ein Parallelepiped (s. Figur 8.11). Abbildung 32: Affine Abbildung eines Rechtecks Die lineare Algebra bzw. Satz 8.44e) zeigen, dass für die Inhalte die folgende Formel gilt: µ(A(Q)) = | det A| · µ(Q). (1) Für die Integration stetiger Funktionen f auf A(Q) ergibt sich dann durch Approximation der Integrale durch Zerlegungssummen die Beziehung Z Z X X f (x) dx ≈ f (ξi ) µ (A(Qi )) = f (ξi )· | det A|·µ(Qi ) ≈ f (x(u)) | det A| du, Q A(Q) also die Transformationsformel Z Z f (x)dx = f (x(u)) · | det A| du (2) Q A(Q) für beliebige lineare Abbildungen A : Rn → Rn mit det A 6= 0 und alle auf A(Q) stetigen Funktionen f . Folgerung 8.57 Das mehrdimensionale Integral ist invariant bezüglich Kongruenzabbildungen des Raumes. Beweis. Kongruenzabbildungen lassen sich in der Form x = T(u) = A · u + u0 beschreiben. Hierbei ist u0 ein fester Punkt in Rn und A ist eine orthogonale Matrix. Wegen | det A| = 1 für solche Matrizen folgt die Behauptung aus (2). Es sei nun T : Q → T (Q) ⊆ Rn eine nichtlineare Transformation, die die Punkte u ∈ Q auf x = x(u) abbildet. Die Weierstraßsche Zerlegungsformel ergibt die Linearisierung x = x(u) = x0 + ∂ xi ∂ uj (u − u0 ) + ρ(u0 , u − u0 ) · (u − u0 ). (3) 8.11 Die Transformationsformel 159 Die hierin auftretende Matrix ∂ xi ∂ uj = ∂ x1 ... ∂ u1 .. . ∂ xn ... ∂ u1 ∂ x1 ∂ un ∂ xn ∂ un heißt Jacobi-Matrix , und sie gibt den wesentlichen Teil der Linearisierung an. Die Abbildung T lässt sich im Kleinen“ also durch eine lineare Abbildung ersetzen (s. Abb. ” 8.11). Abbildung 33: Nichtlineare Abbildung eines Rechtecks Folglich ergibt sich für kleine Quader Q mit den Formeln (1) und (3) die Näherungsformel ∂ xi µ(x(Q)) ≈ det · µ(Q), ∂ uj die wir symbolisch auch in der Form ∂ x i · du dx = det ∂ uj ausdrücken. Benutzt man diese Näherungen und die Überlegungen, die zur Formel (2) führten so lässt sich der folgende Satz herleiten. n Satz 8.58 (Transformationsformel) Es sei Q ⊆ Rn ein Quader in R , essei x = x(u) eine stetig partiell differenzierbare Abbildung von Q auf x(Q) mit det ∂∂ uxji 6= 0 für alle x ∈ Q. Dann gilt für jede auf x(Q) stetige Funktion f die Formel Z Z ∂ x i du. f (x)dx = f (x(u)) · det ∂ uj x(Q) Q Der detaillierte Beweis erfordert aber mit den beschränkten Mitteln der Riemannschen Integrationstheorie erheblichen Aufwand. Da wir im Rahmen der Lebesguesschen Integrationstheorie noch weit stärkere Transformationsformeln mit eleganten Methoden erhalten werden (Satz von Radon-Nikodym), verzichten wir im Gegensatz zum bisherigen Vorgehen in diesem Material auf den präzisen Beweis und wenden uns stattdessen den vielfältigen Anwendungen dieses wichtigen Satzes zu. 160 8 INTEGRALRECHNUNG 8.59 (Transformation auf Polarkoordinaten) Wir betrachten als Beispiel den wichtigen Fall der Transformation auf Polarkoordinaten. Die kartesischen Koordinaten (x, y) werden dabei vermöge der Gleichungen x = r cos ϕ y = r sin ϕ durch die Polarkoordinaten (r, ϕ) ausgedrückt. Ein Rechteck im (r, ϕ)−Koordinatensystem von der Form Q = [r1 , r2 ] × [0, 2 π] wird dabei auf einen Kreisring mit den Radien r1 , r2 in der (x, y)-Ebene abgebildet. Die Funktionaldeterminante hat den Wert ∂x cos ϕ −r sin ϕ ∂ϕ = ∂y sin ϕ r cos ϕ ∂ϕ ∂x ∂r det ∂y ∂r = r cos2 ϕ + r sin2 ϕ = r, und diese Transformation ist für alle ϕ ∈ [0, 2 π] und alle r > 0 zulässig. Die Transformationsformel ergibt die Gleichung Z Z f (x, y) d(x, y) = f (x(r, ϕ), y(r, ϕ)) r d(r, ϕ). Q A(Q) Symbolisch ist also d(x, y) = r d(r, ϕ). Für den Flächeninhalt eines Kreissektors S vom Radius R und Winkel ϕ0 ergibt sich beispielsweise Z µ(S) = Zϕ0 ZR Z d(x, y) = S r dr dϕ = 0 [0,R]×[0,ϕ0 ] R2 ϕ0 . r dr dϕ = 2 0 Beispiel 8.60 Die Verwendung der Transformation von Polarkoordinaten erlaubt zusammen mit dem Reduktionssatz auch die Berechnung des in der Wahrscheinlichkeitsrechnung R∞ −x2 /2 wichtigen Integrals α = e dx. Es ist nämlich −∞ Z∞ α·α = −x2 /2 e Z∞ dx · −∞ −y 2 /2 e Z −∞ Z = −r 2 /2 e [0,∞)×[0,2π] e−(x dy = 2 +y 2 )/2 d(x, y) R2 Z2π Z∞ r d(r, ϕ) = −r 2 /2 e 0 0 Z2π − r 2 /2 −e r dr dϕ = 0 ∞ dϕ = 2 π. 0 8.11 Die Transformationsformel Das ergibt 161 Z∞ α= e− x 2 /2 dx = √ 2 π. −∞ Aufgaben zu Abschnitt 8.11 1. Berechnen Sie das Volumen des Kreiszylinders mit Radius 1 und Achse = z-Achse, der durch die Ebenen z = 0 und z = 4 − x − 2y abgeschnitten wird. 2. Der Schwerpunkt S = (xS , yS , zS ) eines Körpers V ⊆ R3 mit Dichte ρ = 1 berechnet sich nach den Formeln (Summe aller Drehmomente ist Null): Z Z Z 1 1 1 xS = x d(x, y, z), yS = y d(x, y, z), zS = z d(x, y, z) V V V V V V Man berechne den Schwerpunkt des Körpers aus Aufgabe 1. 3. Das Trägheitsmoment J einer um die z-Achse rotierenden Scheibe S vom Radius R und Höhe h und Dichte ρ = 1 ergibt sich wie folgt. Berechnen Sie dies Integral. Z J = x2 + y 2 d(x, y, z). S 4. Man berechne das Trägheitsmoment einer um eine Achse rotierenden Kugel vom Radius R nach der Formel Z J= x2 + y 2 d(x, y, z). Kugel 5. Weisen Sie die folgenden Transformationsformeln nach: a) Die Transformation auf Zylinderkoordinaten ist definiert durch x ρ cos ϕ y = ρ sin ϕ für 0 < ρ und 0 ≤ ϕ < 2π. z z Dabei ist ρ der Abstand des Punktes P (x, y, z) von der z-Achse, ϕ = arccos x ρ und z die Höhe über der (x, y)-Ebene. Erläutern Sie die Namensgebung und zeigen Sie d(x, y, z) = ρ d(ρ, ϕ, z) . b) Die Transformation auf Kugelkoordinaten ist definiert durch x r cos ϕ cos ϑ y = r sin ϕ cos ϑ für 0 < r, −π < ϕ ≤ π und − π/2 < ϑ < π/2. z r sin ϑ Dabei ist r der Abstand des Punktes P (x, y, z) vom Ursprung, ϕ die geographische Länge und ϑ die geographische Breite (s. Abbildung 48.3). Erläutern Sie die Namensgebung und zeigen Sie d(x, y, z) = r2 cos ϑ d(r, ϑ, ϕ) . 6. Berechnen Sie die Werte von Γ( 12 ) und Γ( 23 ). 162 8 INTEGRALRECHNUNG Abbildung 34: Zylinder- und Kugelkoordinaten 8.12 Das Volumen der n-dimensionalen Kugel Wir benutzen die Methoden der vorhergehenden Abschnitte zur Berechnung des Volumens Vn (r) der n-dimensionalen Kugel Kn (r) = {x ∈ Rn : |x| ≤ r}. Die Dehnung u 7→ x(u) = r u überführt die Einheitskugel in die Kugel vom Radius r, und die Funktionaldeterminante dieser Abbildung ist rn . Das zeigt Z Vn (r) = µ(Kn (r)) = Z rn du = rn µ(Kn (1)). dx = Kn (r) Kn (1) Also ist Vn (r) = rn · Vn (1). Es genügt daher, das Volumen Vn = Vn (1) der Einheitskugel in Abhängigkeit von n zu ermitteln. Hierfür ergeben sich folgende Resultate: V1 = R1 dx = 2, d(x, y) = R2π R1 −1 V2 V3 = = R K2 0 R R1 d(x, y, z) = rdr dϕ = π, 0 R d(y, z)dx = −1 y 2 +z 2 ≤1−x2 K3 = R1 −1 R1 R2π −1 0 (1 − x ) · π dx = π x − x3 3 2 √ 1−x R 2 ρ dρ dϕ dx 0 1 = 4 π. 3 −1 Durch Reduktion des vierdimensionalen Integrals auf zwei iterierte zweidimensionale Integrale erhält man 8.12 Das Volumen der n-dimensionalen Kugel V4 = R d(x, y, z, w) R = 163 R d(x, y)d(w, z) z 2 +w2 ≤1 x2 +y 2 ≤1−(z 2 +w2 ) K4 √ R2π R1 R2π = 0 0 0 = ρ dρ dϕ · σ dσ dψ 0 R1 4 π 2 12 1−σ R 2 (1 − σ 2 ) σ d σ = 2 π 2 0 σ2 2 − σ4 4 1 π 2 = . 2 0 Entsprechend dem Vorgehen zur Berechnung von V3 und V4 beweist man durch vollständige Induktion schließlich V2k = πk 2k+1 π k und V2k+1 = k! 3 · 5 · . . . · (2k + 1) Tatsächlich gilt für k ≥ 1 : Z p V2k = V2k−2 1 − (x2 + y 2 ) d(x, y) x2 +y 2 ≤1 π k−1 (1 − (x2 + y 2 ))k−1 d(x, y) (k − 1)! Z = x2 +y 2 ≤1 π k−1 = (k − 1)! Z2π Z1 0 πk (1 − ρ2 )k−1 ρ dρ dϕ = (k − 1)! 0 Z1 tk−1 dt = πk , k! 0 und Z1 V2k+1 = 1 Z √ 2 V2k ( 1 − x ) dx = πk πk (1 − x2 )k dx = k! k! −1 −1 R1 Für das Integral Ik = Z1 (1 − x2 )k dx. −1 (1 − x2 )k dx führt die Substitution x = sin t auf −1 Zπ/2 Ik = cos2k t cos t dt, −π/2 und die partielle Integration ergibt Zπ/2 Ik = 0 + 2k 2k−1 cos Zπ/2 2 t · sin t dt = 2k −π/2 −π/2 Zπ/2 = 2k −π/2 cos2k−1 t · (1 − cos2 t) dt cos2k−2 t · cos t dt − 2k Zπ/2 −π/2 cos2k t cos t dt = 2k · Ik−1 − 2k Ik . 164 8 INTEGRALRECHNUNG Das liefert die Rekursionsformel 2k 2k · (2k − 2) · . . . · 2 2k+1 · k! Ik = Ik−1 = · 2= . 2k + 1 (2k + 1) · . . . · 3 (2k + 1) · . . . · 3 Also ist V2k+1 = π k · 2k+1 . 3 · 5 · . . . · (2k + 1) Abschließend untersuchen wir das Volumenverhältnis zwischen der n-dimensionalen Einheitskugel n X Kn = {x ∈ Rn : x2i ≤ 1} i=1 und dem umschließenden n-dimensionalen Würfel Wn = {x ∈ Rn : max | xi | ≤ 1}. 1≤i≤n Da P 2k /k! konvergiert (Quotientenkriterium), ist lim 2k /k! = 0. Daraus folgt k→∞ lim n→∞ µ(Kn ) = µ(Wn ) lim n→∞ Vn = 0. 2n Hochdimensionale Einheitskugeln haben also sehr kleine Volumina. Aufgaben zu Abschnitt 8.12 1. Die Oberfläche der n-dimensionalen Kugel Kn (r) berechnet sich nach der Formel d Vn (r). dr Begründen Sie die Formel und ermitteln Sie die Oberfläche explizit. |∂Kn (r)| = 2. Berechnen Sie das Volumen des Torus mit dem Seelenradius R und dem Radius r < R der Querschnittsfläche. 8.13 Kurven und Bogenlängen Zur Untersuchung von Kurven ist es notwendig, diesen Begriff mathematisch präzis zu definieren. Definition 8.61 (Kurve) Unter einer Parameterdarstellung einer Kurve versteht man eine eindeutige, stetige Abbildung t 7→ P (t) = (x1 (t), . . . , xn (t)) ∈ Rn eines Intervalls [ta , te ] ⊆ R in den Raum Rn .Die Menge C = {P (t) : ta ≤ t ≤ te } heißt die zugehörige Kurve. Wir sprechen von einer glatten Kurve, wenn für alle t ∈ (ta , te ) die Ableitung P 0 (t) = (x01 (t), . . . , x0n (t)) existiert, stetig und für alle t ∈ (ta , te ) von 0 verschieden ist. 8.13 Kurven und Bogenlängen 165 Beispiel 8.62 1. Strecken sind gegeben durch P (t) = P0 + ta, ta ≤ t ≤ te , wobei a ein beliebiger, von Null verschiedener Vektor des Rn ist. 2. Die Kreislinie in der Ebene mit Zentrum 0 und Radius R ist gegeben durch R sin t P (t) = , 0 ≤ t ≤ 2π. R cos t 3. Die Ellipsenlinie ist gegeben durch A sin t P (t) = , B cos t 0 ≤ t ≤ 2π, wobei A und B die beiden Halbmesser der Ellipse sind. 4. Die Schraubenlinie im Raum um die z-Achse mit Steigung α ist gegeben durch x(t) R sin t P (t) = y(t) = R cos t , 0 ≤ t ≤ 2π. z(t) αt/2π Definition 8.63 (Bogenlänge) Es sei C eine Kurve mit Parameterdarstellung t 7→ P (t). Jede Zerlegung Z = {ta = t0 < t1 < t2 < . . . < tN = te } des Intervalls I = [ta , te ] erzeugt eine Folge von Knotenpunkten {P (t0 ), P (t1 ), . . . , P (tN )} auf C, deren Verbindung mit Geradenstücken einen Polygonzug Z ergibt, dessen Länge durch Lg(C, Z) = N X |P (tj ) − P (tj−1 )| j=1 gegeben ist (s. Abb. 8.13). Unter der Kurvenlänge Lg(C) verstehen wir den (möglicherweise unendlichen Wert) ( N ) X Lg(C) = sup Lg(C, Z) = sup |P (tj ) − P (tj−1 )| : Z = {tj }j=0,...,N ist eine Zerlegung . j=1 Unter der Bogenlänge der Kurve verstehen wir die Funktion s(t) = Lg(Ctta ) = Lg{P (τ ) : ta ≤ τ ≤ t}. Es ist offensichtlich, dass die so definierte Länge Lg und die Bogenlänge s nicht von der gewählten Parameterdarstellung abhängen (Beweis?). Satz 8.64 Glatte Kurven t 7→ P (t) haben eine endliche Länge und es gelten Zt s(t) = ta |P 0 (τ )| dτ und s0 (t) = |P 0 (t)|. 166 8 INTEGRALRECHNUNG Abbildung 35: Zur Definition der Bogenlänge Beweis. Es sei Z = {t0 < t1 < . . . < tn } eine Zerlegung von It = [ta , t]. Nach dem Hauptsatz der Differential–Integralrechnung gilt (koordinatenweise) Ztk P 0 (τ )dτ. P (tk ) − P (tk−1 ) = bk−1 Aus der linearen Algebra ist die Formel |~a| = max ~a · ~b bekannt. Hiermit folgt |~b|≤1 Ztk Ztk Ztk Ztk P 0 (τ )dτ = max P 0 (τ )·~b dτ ≤ max P 0 (τ )·~b dτ = |P 0 (τ )| dτ. |P (tk )−P (tk−1 )| = |~b|≤1 |~b|≤1 bk−1 bk−1 bk−1 bk−1 Das ergibt n X |P (tk ) − P (tk−1 )| ≤ k=1 Damit ist s(t) ≤ Rt Ztk n X Zt 0 |P (τ )|dτ = k=1 t k−1 |P 0 (τ )|dτ. ta |P 0 (τ )|dτ bewiesen. Insbesondere ist Lg(C) = s(te ) ≤ Rte |P 0 (τ )|dτ < ∞. ta ta Wir betrachten jetzt das Kurvenstück {P (τ ), t ≤ τ ≤ t + h}. Dann gilt nach obigem Zt+h |P (t + h) − P (t)| ≤ s(t + h) − s(t) ≤ |P 0 (τ )| dτ, t also ist Zt+h P (t + h) − P (t) s(t + h) − s(t) 1 ≤ ≤ |P 0 (τ )|dτ = |P 0 (τ ∗ )| h h h t ∗ für ein geeignetes τ ∈ (t, t + h) nach dem Mittelwertsatz. Für h & 0 folgt daraus |P 0 (t)| ≤ s0 (t) ≤ |P 0 (t)|, also s0 (t) = |P 0 (t)|. (Der Vollständigkeit halber hätte auch noch der linksseitige Grenzwert h % 0 betrachtet werden müssen.) Die Integration dieser Gleichung ergibt wegen s(ta ) = 0 die Behauptung des Satzes. 8.14 Oberflächeninhalte und Flächenintegrale 167 8.65 Wir betrachten einige Beispiele. 1. Der Kreisumfang ist Z2π 0 |P (t)|dt = Lg(C) = 0 Z2π p r2 sin2 t + r2 cos2 t dt = 2π · r. 0 2. Der Umfang der Ellipse ist Z2π Lg(C) = |P 0 (t)|dt = Z2π p Z2π r 0 0 0 a2 sin2 t + b2 cos2 t dt = a sin2 t + b2 cos2 t dt a2 Z2π p Z2π r b2 2 1 − (1 − 2 ) cos t dt = a 1 − γ cos2 t dt = a a 0 0 2 mit γ = 1 − ab 2 . Dieses Integral ist für a 6= b nicht elementar auswertbar, es heißt ein elliptisches Integral 2. Gattung. 3. Die Länge der Schraubenlinie für eine Umrundung ist Lg(C) = Z2π p 2 r2 sin t + r2 cos2 t + a2 dt = 0 Z2π √ r2 + a2 dt = √ r2 + a2 · 2π. 0 Aufgaben zu Abschnitt 8.13 1. Berechnen Sie die Bogenlängenfunktion für die Schraubenlinie. > 2. Die logarithmische Spirale ist definiert durch t 7→ et cos(2πt), sin(2πt) . Zeichnen Sie diese Kurve und berechnen Sie die Bogenlänge s(t) für t0 = 0. > 3. Die Archimedische Spirale ist definiert durch t 7→ t · cos(2πt), sin(2πt) . Zeichnen Sie diese Kurve und berechnen Sie die Bogenlänge s(t) für t0 = 0. 8.14 Oberflächeninhalte und Flächenintegrale Gekrümmte Flächen traten bereits wiederholt als Graphen von Funktionen z = f (x, y) auf (s. z.B. Abb. 23 oder Abb. 36). Wir wollen uns dem Problem der Bestimmenung des Flächeninhalts solcher Flächen zuwenden. Die Idee besteht wie im Fall der Bestimmung von Bogenlängen wieder darin, die Fläche in kleine Parallelogramme“zu zerlegen und den ” Flächeninhalt durch die Summe der Flächeninhalte der Parallelogramme zu definieren. Es sei also F = {(x, y, f (x, y)) : (x, y) ∈ B} ⊆ R3 der Graph einer stetig differenzierbaren Funktion f : B → R auf einer quadrierbaren Menge B ⊆ R2 . Wir wollen den Flächeninhalt 168 8 INTEGRALRECHNUNG Abbildung 36: Flächeninhalt gekrümmter Flächen |F | so definieren, dass er für den Fall planarer Figuren F (d.h. f=linear) mit dem 2dim Riemannschen Inhalt µ(2) (F ) zusammenfällt. Wie oben bereits beschrieben nehmen wir dazu eine Zerlegung von B in kleine Rechtecke Qi,j mit dem Flächeninhalt ∆x · ∆y vor. Es sei Fi,j = {(x, y, f (x, y)) : (x, y) ∈ Qi,j } die zu Qi,j gehörige Fläche. Wir ersetzen diese Fläche durch das von den Vektoren Px und Py aufgespannten Parallelogramm Pi,j . Dann erhalten wir q |Fi,j | ≈ |Pi,j | = |Px × Py | = |(−fx , −fy , 1)| · ∆x · ∆y = 1 + fx2 + fy2 · ∆x · ∆y. Somit wäre |F | = X |Fi,j | ≈ i,j X |Pxi × Pyj | = i,j Xq 1 + fx2 + fy2 · ∆x · ∆y. i,j Ausgehend von diesen heuristischen überlegungen definieren wir daher |F | = Z q 1+ fx2 + fy2 q d(x, y) und symbolisch d|F | = 1 + fx2 + fy2 d(x, y), B und wenden uns der Behandlung eines Beispiels zu. Beispiel 8.66 (Kugeloberfläche) Wir berechnen die Oberfläche der 3dim Kugel mit Radius R. Dies ist die Menge F = {(x, y, z) : x2 + y 2 + z 2 = R2 }. Die Halbkugeloberfläche HKF wird dann als Graph der Funktion p f (x, y) = R2 − (x2 + y 2 ) mit B = {(x, y) : x2 + y 2 ≤ R2 } beschrieben. Die partiellen Ableitungen sind −x −y fx (x, y) = p und fy (x, y) = p . 2 2 2 2 R − (x + y ) R − (x2 + y 2 ) 8.14 Oberflächeninhalte und Flächenintegrale 169 Somit erhalten wir unter zusätzlicher Verwendung von Polarkoordinaten r2 = x2 + y 2 für B die Formel Z s Z q R2 1 + fx2 + fy2 d(x, y) = 2 d(x, y) |F | = 2|HKF | = 2 R2 − (x2 + y 2 ) B B Z 2π Z R r Z R r 2 R 1 2 p = 2 2 dr r dr dϕ = 2πR R2 − r 2 R2 1 − ( Rr )2 0 0 0 = 2πR 2 Z1 √ 1 dt = 4πR2 . 1−t 0 Alternativ gehen wir noch einen p zweiten Weg zur Auswertung des Integrals, indem wir das Flächendifferential d|F | = 1 + fx2 + fy2 d(x, y) sofort in Kugelkoordinaten ausdrücken. Mit x = R cos θ cos ϕ und y = R cos θ sin ϕ ist x2 + y 2 = R2 cos2 θ und ∂(x, y) 2 − sin θ cos ϕ det =R − sin θ sin ϕ ∂(θ, ϕ) − cos θ sin ϕ = −R2 sin θ cos θ. cos θ cos ϕ Damit ergibt sich für das Flächenelement r q R2 · R2 sin θ cos θ d(θ, ϕ) = R2 cos θ dθ dϕ. d|F | = 1 + fx2 + fy2 d(x, y) = 2 2 2 R − R cos θ Somit ist auf diesem Weg Z |F | = B d|F | = R2 Z2π Zπ/2 cos θ dθ ϕ = R2 · 2 · 2π = 4πR2 . 0 −pi/2 Die so erhaltene Formel für das Flächenelement in Kugelkoordinaten lässt sich aber unter vollständiger Umgehung der langwierigen Herleitung auch sofort aus Abb. 37 ablesen: Für das Flächenstückchen d|F | erhält man mit der Formel Länge × Breite sofort Abbildung 37: Das Flächenelement der Kugeloberfläche in Kugelkoordinaten 170 8 INTEGRALRECHNUNG das Ergebnis d|F | = R2 · cos θ dθ dϕ. Dieses Vorgehen ist dadurch gerechtfertigt, dass der Inhalt ja bewegungsinvariant ist und dass für Rechtecke die genannte Flächenformel angewandt werden kann. Dieses anschauliche Vorgehen, das insbesondere von Physikern meistens praktiziert wird, ist wegen seiner Effektivität sehr zu empfehlen. Im Zweifelsfall kann ja dann immer noch der lange Weg über nachträgliche Koordinatentransformationen und die Jacobi-Determinante gegangen werden. Abschließend bemerken wir, dass das Rechnen mit Volumen-, Kurven- und Flächenintegrals maßgeblich auf dem Umgang mit Ausdrücken der Form g(u1 , . . . , un ) d(u1 , . . . , un ) beruht. Dieser Weg wird systematisch im Analysisteil IV zur Vektoranalysis verfolgt werden, das zentrale Objekt werden dort eben solche Differentialformen“ sein. ” Aufgaben zu Abschnitt 8.14 1. Berechnen Sie den Inhalt der Paraboloidfläche zur Funktion f (x, y) = x2 + y 2 , die in der Höhe z = 1 abgeschnitten ist. 2. Berechnen Sie die Oberfläche eines geraden Kreiskegels mit Radius 1 und Höhe 1 (Grundfläche eingeschlossen.). 3. Zeigen, dass die Torusoberfläche |T | den Inhalt |F | = 4π 2 rR hat. p Hinweis: Am besten zeigen Sie d|T | = 1 + fx2 + fy2 d(x, y) = (R + r cos ϕ)r dϕ dψ. 8.15 Fraktale Dimensionen - Wo ist das Gleis 9 3 /4 ? Die bekannte Kochsche Kurve hat keine endliche Länge, schlimmer noch, jeder noch so kleine Ausschnitt hat eine unendliche Länge. Andererseits ist der zweidimensionale Inhalt der Kurve Null. Mit den bisherigen Inhaltsbegriffen ist die Kochsche Kurve also nicht zu analysieren. Dieses Phänomen tritt in der Natur häufig auf: Küstenlinien von Inseln, Reliefs zerklüfteter Gebirge, Oberfläche von Schwämmen, Wolken oder Gebirge usw. B. Mandelbrodt lenkte 1960 die mathematische Öffentlichkeit auf dieses Problem. Bekannt ist seine Frage: Wie lang ist die Küstenlinie von England wirklich? Wir wollen hier analytische Mittel entwickeln, um Phänomene dieser Art behandeln zu können. Erinnern wir uns an die Definition des d-dimensionalen äußeren Riemannschen Inhalts einer Menge M ⊆ Rd (in 8.43 hatten wir dies für d = 2 eingeführt.). Es ist µ(M ) = inf 2−n·d card Q ∈ Qdn : Q ∩ M 6= ∅ , n∈N 8.15 Fraktale Dimensionen - Wo ist das Gleis 9 3 /4 ? 171 wobei Qdn die Menge aller achsenparallelen d-dimensionalen Quadrate“ in dyadischen ” Gitter mit der Gitterbreite 2−n bezeichnet. Definiert man für Teilmengen M ⊆ Rd einen α-dimensionalen äußeren Inhalt durch µα (M ) = inf 2−n·α card{Q ∈ Qdn : Q ∩ M 6= ∅}, n so ergibt sich für α = d der d-dimensionale äußere Inhalt, und α = 1, 2, 3, . . . liefert den 1-, 2- bzw. 3-dimensionalen äußeren Inhalt. Ist M eine glatte Kurve in Rd , so gelten µ1 (M ) 6= 0 und µ2 (M ) = 0. Die äußeren Inhalte sind also geeignet, die Dimension zu beschreiben. Derart motiviert lassen wir nun für α beliebige positive reelle Zahlen zu und nennen die Zahl dim M = inf α > 0 : µα (M ) = 0 = sup α > 0 : µα (M ) > 0 die Hausdorff-Dimension von M . Man kann zeigen (und das ist zur endgültigen Rechtfertigung der Definition nötig), dass diese Zahl nicht von der Dimension des einbettenden Raumes Rd abhängt. Zur praktischen Bestimmung der Hausdorff-Dimension sind die folgenden offensichtlichen Rechenregeln sehr nützlich: Satz 8.67 Für 0 < α ≤ d und M, M1 , M2 ⊂ Rd gelten: 1) µα (M1 ∪ M2 ) = µα (M1 ) + µα (M2 ) für M1 ∩ M2 = ∅. Additivität 2) µα (A · M ) = | det A|α/d · µα (M ) für A ∈ Rd,d mit det A 6= 0. (Transformationsformel) Wir berechnen nun die Hausdorff-Dimension für einige Beispiele. 1. Eine Strecke hat die Hausdorff-Dimension 1. 2. Die Kochsche Kurve K entsteht aus der primitiven Figur durch wiederholtes Ersetzen der vier Segmente durch im Maßstab 1:3 verkleinerter Kopien der primitiven Figur. Also gilt mit Satz 8.67 1 α α α µ (K) = µ (K1 ∪ K2 ∪ K3 ∪ K4 ) = 4 · µ · K = 4 · 3−α · µα (K), 3 und für µα (K) folgt hieraus 4 = 3α , also dim K = log 4 ≈ 1.26. log 3 3. Die Cantormenge C ⊆ R (auch Cantor-Staub genannt) entsteht aus dem Einheitsintervall I = [0, 1] durch Herausschneiden des mittleren Drittels 13 , 23 und fortgesetzter Wiederholung dieses Verfahrens auf die verbleibenden Teilintervalle. 172 8 INTEGRALRECHNUNG Die Menge C ist also wieder eine disjunkte Vereinigung von zwei auf ein Drittel verkleinerten Kopien von C. Daher gilt 1 α α · C = 2 · 3−α · µα (C). µ (C) = 2 · µ 3 Für µα (C) 6= 0 folgt also 2 = 3α , und somit dim C = α = ln 2 ≈ 0.63. ln 3 Aufgaben zu Abschnitt 8.15 1. Man berechne die Hausdorff-Dimension des Sierpinski-Dreiecks, das aus einem gleichseitigen Dreick durch Zerlegung in vier gleichseitige Teildreiecke mit halber Seitenlänge, der Wegnahme des inneren Dreiecks und fortgesetzter Wiederholung des Prozesses auf die entstehenden Teildreiecke entsteht. 2. Es sei C die übliche Cantormenge. Berechnen Sie die Hausdorff-Dimension von C × C. 3. In den Harry-Potter-Romanen fährt der Zug nach Hogwarts von Gleis 9 3 /4 . Konstruieren Sie eine Menge der Dimension 9 3 /4 . Hinweis: Versuchen Sie dazu, die Konstruktion der Cantormenge zu modifizieren oder einen binären Baum zu verwenden. Anhang: Computerprogramme zur Erzeugung von Fraktalen Fraktale (natürlich nur deren Approximationen!!) können mit der Programmiersprache LOGO sehr einfach produziert werden. Die Programmiersprache LOGO (eine listenorientierte Sprache) kann frei über die Adresse http://www.softronix.com/logo.html ⇒ MWS Logo Kits ⇒ Setup Kit bezogen werden. Hier sind die in der Vorlesung verwendeten Programme: 1. Schneeflocke (v. Koch-Kurve, Hausdorff-Dim = ln 4/ ln 3 ) to SCHNEEFLOCKE :N MAKE ”s 729 MAKE ”i :n WHILE [:i>1] [MAKE ”i :i-1 MAKE ”s :s/3] HOME SETPOS [-250 -250] CLEAN RIGHT 30 SEITE :N RIGHT 120 SEITE :N RIGHT 120 SEITE :N RIGHT 90 end to SEITE :N IFELSE :N=1 [FD :S] [SEITE :N-1 LEFT 60 SEITE :N-1 RIGHT 120 SEITE :N-1 LEFT 60 SEITE :N-1] end 8.15 Fraktale Dimensionen - Wo ist das Gleis 9 3 /4 ? 173 2. Binärer Baum mit Stauchung F < 1/2 (Hausdorff-Dim = ln 2/ ln F −1 ) to BAUM :N :F HOME SETPOS [50 -500] CLEAN MAKE ”S 500 ZWEIG :N :S end to ZWEIG :N :S IF :N>0 [FD :S LEFT 45 ZWEIG :N-1 :S*:F RIGHT 90 ZWEIG :N-1 :S*:F LEFT 45 BACK :S] end 3. FARN to FARN CLEARSCREEN SETPOS [0 -400] CLEAN F1 10 180 end to F1 :N :S IFELSE :N=0 [ ][FD :S left 30 F1 :N-1 0.35*:S RIGHT 32 F1 :N-1 0.8*:S RIGHT 40 F1 :N-1 0.35*:S left 42 BACK :S] end 4. Hilbertkurve (raumfüllende Kurve, Hausdorff-Dim =2) to HILBERT :N CLEARSCREEN SETPOS [-200 200] CLEAN MAKE ”I :N MAKE ”S 256 WHILE [:I>1] [MAKE ”I :I-1 MAKE ”S :S/2] RIGHT 90 H :N 90 end to H :N :W IFELSE :N=0 [ ][left -:W H :N-1 -:W FD :S RIGHT -:W H :N-1 :W FD :S H :N-1 :W RIGHT -:W FD :S H :N-1 -:W left -:W ] end Abbildung 38: Fraktale: v. Kochkurve, binärer Baum, Farn, Hilbertkurve 174 9 9 ERGÄNZUNGEN Ergänzungen 9.1 Der Approximationssatz von Weierstrass Satz 9.1 (Weierstrassscher Approximationssatz) Zu jeder auf dem Intervall [0, 1] stetigen Funktion f existiert eine Folge (Bn ) von Polynomen mit lim max f (x) − Bn (x) = 0. n→∞ x∈[0,1] Beweis zu Satz 9.1: Die Konstruktion der approximierenden Polynome Bn basiert auf den Polynomen n k pk (x) = x (1 − x)n−k für k = 0, . . . , n, k die zur Abtastung der Funktion f besonders geeigent sind und die auch in der Stochastik bei der Binomialverteilung auftreten. Sie geben nämlich die Wahscheinlichkeit dafür an, bei einer Serie von n Versuchen genau k Treffer zu erzielen, wenn x die Einzelwahrscheinlichkeit für einen Treffer ist. In Abb. 39 sind einige dieser Polynome dargestellt. Abbildung 39: Binomialverteilungen für n = 100 und einige k = 10, 20, . . . Für diese Polynome beweist man die folgenden Gleichungen (Wie?): 1. n P pk (x) = 1, (Die Binomialverteilung ist eine Wahrscheinlichkeitsverteilung) k=0 2. n P k · pk (x) = nx, (Erwartungswert der Binomialverteilung = nx) k=0 3. n P (k − nx)2 · pk (x) = nx(1 − x). (Varianz der Binomialverteilung = nx(1 − x)) k=0 Nun sei eine stetige Funktion f : [0, 1] → R gegeben. Zu f und zu jedem n ∈ N definieren wir auf [0, 1] das n-te Bernsteinpolynom n X k Bn (x) = f pk (x) n k=0 9.1 Der Approximationssatz von Weierstrass 175 und zeigen |f (x) − Bn (x)| < 2ε für hinreichend große n = n(ε). Da f auf [0, 1] gleichmäßig stetig ist, existiert zu gegebenem ε > 0 ein δ > 0 mit |f (x) − f (x0 )| < ε für |x − x0 | ≤ δ. (1) Nun ist X . . . . . . . + |x−k/n|>δ |x−k/n|≤δ n X X k pk (x) ≤ f (x) − f |f (x) − Bn (x)| = n k=0 Für den ersten dieser Summanden haben wir dann wegen (1) die Abschätzung X n X <ε· . . . pk (x) = ε. |x−k/n|≤δ k=0 Zur Abschätzung des zweiten Summanden setzen wir M = max |f (x)| < ∞ und erhalten x∈[0,1] n X X X X (k − nx)2 . . . ≤ 2M pk (x) = 2M pk (x) ≤ 2M · pk (x) n2 δ 2 |x−k/n|>δ |x−k/n|>δ |k−nx|>nδ k=0 = 2M M M · nx(1 − x) ≤ 2 < ε für n > 2 . 2 2 nδ 2δ n 2δ ε Damit ist der Satz vollständig bewiesen. Wir beweisen nun eine trigonometrische Variante des Approximationssatzes, die zur Approximation stetiger periodischer Funktionen benötigt wird. Definition 9.2 Unter einem trigonometrischen Polynom (n-ten Grades) versteht man eine Funktion der Form h(x) = n X k=0 ak cos kx + n X ak sin kx (mit an 6= 0 oder bn 6= 0). k=1 Die Menge aller trigonometrischen Polynome auf R wird durch T (R) bezeichnet. Satz 9.3 Produkte und Linearkombinationen trigonometrischer Polynome ergeben wieder trigonometrische Polynome. (Man sagt, diese Menge bildet eine Algebra). P P Insbesondere sind die Funktionen k ck cosk x und k dk sink x als trigonometrische Polynome darstellbar. Beweis. Die Addition bzw. Subtraktion der Formeln aus Satz 5.39 c), d) (siehe auch Aufgabe 2 zum Abschnitt 5.5) liefert die Formeln cos(n + m)x + cos(n − m)x cos(n + m)x − cos(n − m)x sin(n + m)x + sin(n − m)x = 2 cos nx · cos mx, = 2 sin nx · sin mx, = 2 sin nx · cos mx. 176 9 ERGÄNZUNGEN Durch wiederholte Anwendung dieser Formeln folgt die Behauptung. Satz 9.4 (Approximationssatz von Weierstrass in trigonometrischer Form) Jede 2π-periodische, stetige Funktion f : R → R lässt sich auf R gleichmäßig durch trigonometrische Polynome approximieren, d.h., zu jedem ε > 0 existiert ein trigonometrisches Polynonom h ∈ T (R) mit max |f (x) − h(x)| < ε. x∈R Beweis9 . Teil 1. Wir zeigen die Behauptung zunächst für gerade Funktionen f : [−π, π] → R. Dazu führen wir eine Transformation t = cos x für x ∈ [0, π] bzw. x = arccos t für t ∈ [−1, 1] ein. Dann gehört die Funktion g(t) = f (arccos t) zu C[−1, 1]. Zu jedem ε > 0 existiert n P daher ein Polynom P (t) = ck tk mit max |P (t) − g(t)| < ε. Setzen wir k=0 t∈[−1,1] h(x) = P (cos x) = n X ck cosk x ∈ T (R), k=0 so gilt die Abschätzung max |h(x)−f (x)| = max |h(x)−f (x)| = max |P (t)−f (arccos t)| = max |P (t)−g(t)| < ε. x∈R x∈[0,π] t∈[−1,1] t∈[−1,1] Teil 2. Wir zeigen, dass sich Funktionen der Form g(x) = f (x) · sin2 x, wobei f eine 2πperiodische, stetige Funktion ist, durch trigonometrische Polynome approximieren lassen. Dazu betrachten wir die beiden 2π-periodischen geraden Funktionen g1 (x) = f (x) − f (−x) f (x) + f (−x) · sin2 x und g2 (x) = · sin x. 2 2 Diese Funktionen sind nach Teil 1 durch trigonometrische Polynome approximierbar. Dann ist nach Satz 9.3 auch g2 (x) · sin x approximierbar, und wegen g(x) = g1 (x) + g2 (x) · sin x auch g. Teil 3. Der allgemeine Fall: Es sei f : R → R stetig und 2π-periodisch. Wir zerlegen f (x) = f (x) · sin2 x + f (x) · cos2 x. Der erste Summand ist wegen Teil 2 appoximierbar. Für den zweiten Summanden gilt mit der Substitution x = z − π2 die Gleichung f (x) · cos2 x = f (z − π2 ) · cos2 (z − π2 ) = f (z − π2 ) · sin2 (z) = g(z). Nach Teil 2 ist g(z) durch trigonometrische Polynome h(z) approximierbar. Somit ist f (x) · cos2 x = g(x + π2 ) durch Funktionen der Form h(x + π2 ) approximierbar. Diese Funktionen lassen sich aber offenbar als trigonometrische Polynome in x schreiben. 9 Der Beweis folgt der Literatur Brehmer/Apelt: Analysis I, Abschnitt 2.7.3, Satz 2. 9.2 Metrische Räume 9.2 177 Metrische Räume Viele Definitionen und Sätze lassen sich von R und C auf andere Situatuionen verallgemeinern. Dazu brauchen wir nur den in R, C, Rn benutzten Abstandsbegriff |x − y| zwischen zwei Punkten axiomatisch zu fassen. Das führt auf der folgenden Begriff: Definition 9.5 (Metrischer Raum) Es sei X eine nichtleere Menge: Eine Funktion d : X × X → R+ heißt eine Metrik oder auch Distanzfunktion auf X, falls die nachfolgenden Bedingungen erfüllt sind. Das Paar (X, d) heißt in diesem Fall ein metrischer Raum. 1. Für alle x, y ∈ X gilt d(x, y) ≥ 0, und d(x, y) = 0 impliziert x = y. (Separiertheit) 2. Stets ist d(x, y) = d(y, x). (Symmetrie) 3. Für drei Punkte x, y, z ∈ X gilt d(x, z) ≤ d(x, y) + d(y, z). (Dreiecksungleichung) Beispiel 9.6 Neben R, C, Rn mit den kanonischen Metriken erwähnen wir die folgenden wichtigen Beispiele. 1. X = C[a, b] = Menge aller stetigen Funtionen mit d(f, g) = max |f (x) − g(x)|. x∈[a,b] 2. X = `∞ = Menge aller beschränkten Zahlenfolgen mit d (ξn ), (ηn ) = sup |ξn − ηn |. n∈N 3. X = c0 = Menge aller Nullfolgen mit der Metrik d (ξn ), (ηn ) = max |ξn − ηn |. n∈N 4. X = R mit der Metrik d(x, y) = | arctan x − arctan y|. (Dreiecksungleichung?) 5. X = `1 = Menge aller absolut summierbaren Zahlenfolgen x = (ξn ) mit der Metrik ∞ P d1 (ξn ), (ηn ) = |ξn − ηn |. n=0 In metrischen Räumen kann man ε-Kugeln bzw. ε-Umgebungen eines Punktes x0 ∈ X durch folgenden Ansatz einführen: Uε (x0 ) = {x ∈ X : d(x, x0 ) < ε}. Damit ist es nun möglich, die Begriffe des Grenzwertes oder Häufungspunktes einer Folge, des inneren Punktes einer Teilmenge M ⊆ X, die Begriffe offene bzw. abgeschlossene Menge und den Begriff des Abschlusses wie früher für die Fälle R, C problemlos zu verallgemeinern. Als Beispiel nennen wir: Definition 9.7 Eine Folge (xn ) ⊂ X heißt konvergent gegen a ∈ X lim d(xn , a) = 0. n→∞ Also a = lim xn ⇐⇒ lim d(xn , a) = 0. n→∞ n→∞ Die Folge (xn ) heißt eine Cauchyfolge, wenn für jedes ε > 0 ein N = N (ε) so existiert, dass d(xn , xm ) < ε für alle m, n ≥ N (ε) gilt. 178 9 ERGÄNZUNGEN Auch grundlegende Sätze lassen sich problemlos übertragen. Beispielsweise gilt der Satz: Satz 9.8 Eine Menge M ⊆ X ist genau dann abgeschlossen, wenn sie alle ihre Häufungspunkte enthält. Zu den Sätzen, die nicht in allen Fällen richtig sind, gehören dagegen: a) Jede Cauchyfolge ist konvergent. (Z.B. ist in Beispiel 9.6.4 die Folge (xn ) = (n) eine Cauchyfolge ohne Grenzwert.) b) Jede beschränkte Folge hat einen Häufungspunkt. (Die Folge aus a) hat keinen Häufungspunkt, sie ist aber beschränkt. In Beispiel 9.13 wird ein weiteres Gegenbeispiel angegeben.) Metrische Räume mit a) heißen vollständige metrische Räume, Räume mit b) heißen kompakte metrische Räume. Zu den wichtigsten Beispielen vollständiger Räume gehören neben Rn die Räume stetiger Funktionen: Satz 9.9 Es sei C[a, b] die Menge aller stetigen Funktionen f : [a, b] → R mit der Metrik d∞ (f, g) = max |f (x)−g(x)|. (Tschebyscheff-Metrik) x∈[a,b] Dann ist C[a, b] ein vollständiger metrischer Raum. Beweis. Offenbar ist die Konvergenz fn → f in dieser Metrik gerade die in 6.18 eingeführte gleichmäßige Konvergenz. Die Behauptung folgt nun durch Anwendung der Beweisidee aus Satz 6.19. Kompakte Räume werden im folgenden Abschnitt genauer untersucht. 9.3 Kompakte Mengen In diesem Abschnitt wird der Begriff der kompakten Menge, den wir im Fall R bzw. C in Satz 6.20 bereits kennengelernt haben, auf allgemeine metrische Räume verallgemeinert. Im Folgenden sei also X ein fixierter metrischer Raum. Definition 9.10 Eine Teilmenge K eines metrischen Raumes X heißt kompakt, wenn jede Folge von Elementen aus K einen zu K gehörenden Häufungspunkt hat. Satz 9.11 Jede kompakte Menge ist beschränkt und abgeschlossen. Beweis. Jede eine kompakte Menge K enthält nach Definition alle ihre Häufungspunkte. Somit ist sie abgeschlossen. Wäre die Menge K nicht beschränkt, so könnte man in M eine Folge von Elementen an mit d(an , am ) ≥ 1 für m, n ∈ N mit m > n finden (Wie denn?). Diese Folge kann aber keine Cauchyteilfolge enthalten, daher hat sie keinen Häufungspunkt. In den Räumen X = R, C oder Rn gilt bekanntlich auch die Umkehrung des obigen Satzes: 9.3 Kompakte Mengen 179 Satz 9.12 (Satz von Bolzano-Weierstrass) Eine Teilmenge K von R, Rn bzw. Cn ist genau dann kompakt, wenn sie abgeschlossen und beschränkt ist. Ein entsprechender Satz ist aber nicht in jedem metrischen Raum richtig, wie das folgende Beispiel zeigt. n Beispiel 9.13 Die Teilmenge M = {en : n ∈ N} ⊂ c0 mit en = (0, .^. ., 1, 0, . . .) ∈ c0 ist beschränkt und abgeschlossen, aber die Folge (ei )i∈N hat bzgl. der üblichen Metrik in c0 keinen Häufungspunkt. Somit ist M nicht kompakt. Kompaktheit ist die entscheidende Eigenschaft, um die in Abschnitt 6.3 für stetige reelle Funktionen auf Intervallen bewiesenen Eigenschaften auf stetige Funktionen f : X → R, X ein metrischer Raum, zu verallgemeinern. Hierzu gehört der folgende Satz: Satz 9.14 (Satz vom Maximum und Minimum) Ist K kompakt, so hat jede stetige Funktion f : K → R auf K ein Maximum und ein Minimum. Mit gleicher Technik ergibt sich: Satz 9.15 Sind A, B zwei kompakte Teilmengen von X, so existieren zwei Punkte a0 ∈ A und b0 ∈ B mit d(a0 , b0 ) = inf{d(x, y) : x ∈ A, y ∈ B} = d(A, B), der Abstand“ der Mengen A, B wird also angenommen. ” Die folgenden Sätze zeigen die Verwandtschaft kompakter Mengen mit endlichen Mengen. Sie sind von großer Wichtigkeit. Satz 9.16 Jede kompakte Menge K ist präkompakt, d.h., zu jedem ε > 0 existiert eine endliche Teilmenge F ⊂ K mit [ K⊆ Uε (x). x∈F Beweis. Wir führen den Beweis indirekt. Angenommen, es gäbe ein ε0 > 0 derart, dass obige Inklusion für keine endliche Teilmenge F ⊂ K erfüllt sei. Wir konstruieren nun induktiv eine Folge (xn ) in K ohne Häufungspunkt. Es sei x0 ∈ K beliebig gewählt. Wegen K \ Uε0 (x0 ) 6= ∅ existiert ein x1 ∈ K \ Uε0 (x0 ). Wegen K \ Uε0 (x0 ) ∪ Uε0 (x1 ) 6= ∅ existiert ein x2 ∈ K \ Uε0 (x0 ) ∪ Uε0 (x1 ) . So fortfahrend ergibt sich eine Folge (xn ) ⊆ K mit d(xn , xm ) ≥ ε0 für n > m. Daher enthält (xn ) keine Cauchyteilfolge, sie kann also keinen Häufungspunkt haben. Satz 9.17 (Überdeckungssatz von Heine-Borel) Es sei X metrischer Raum. Eine Menge K ⊆ X ist genau dann kompakt, wenn es zu jedem System (Oα )α∈A von offenen n S S Mengen mit K ⊆ Oα ein endliches Teilsystem {Oα1 , . . . , Oαn } mit K ⊆ Oαj gibt. α∈A Man sagt auch, dass K die endliche Überdeckungseigenschaft hat. j=1 180 9 ERGÄNZUNGEN Beweis. Wir zeigen die Notwendigkeit der Bedingung durch indirekten Schluss: Es sei K kompakt, und es sei (Oα )α∈I eine offene Überdeckung von K derart, dass für jedes endliche n S Teilsystem K \ Oαi 6= ∅ gilt. Wir konstruieren zwei Folgen (Kj ) und (xj ) auf folgende i=1 Weise: Es sei K0 = S K und ε1 = 1. Da K präkompakt ist, existiert eine endliche Menge F1 ⊆ K0 mit K0 ⊆ U1 (x). Da K0 nicht von endlich vielen der {Oα } überdeckt werden x∈F1 kann, existiert ein x ∈ F1 , wir nennen es x1 , derart, dass die Menge K1 = K0 ∩ U1a (x1 ) nicht von endlich vielen {Oα } überdeckt werden kann. Wir wiederholen das Verfahren mit K1 und ε2 = 12 . Das ergibt eine Kette abgeschlossener Mengen K0 ⊇ K1 ⊇ K 2 ⊇ . . . und eine Folge (xj ) von Elementen mit a xj ∈ Kj = Kj−1 ∩ U1/j (xj ) derart, dass kein Kj durch endlich viele {Oα } überdeckt werden kann. Da K = K0 kompakt ist, hat die Folge (xj ) einen Häufungspunkt x∗ . Da {Oα } die Menge K0 überdeckt, existiert ein Oα mit x∗ ∈ Oα . Da Oα offen ist, existiert ein δ > 0 mit Uδ (x∗ ) ⊆ Oα . Wir wählen 1 δ a ein n mit < und xn ∈ Uδ/2 (x∗ ). Dann ist Kn ⊆ Uδ/3 (xn ) ⊆ Uδ/2 (xn ) ⊆ Uδ (x∗ ) ⊆ Oα n 3 im Widerspruch dazu, dass Kn nicht durch endlich viele {Oα } überdeckt werden kann. Wir zeigen die Umkehrung durch indirekten Beweis. Angenommen, es gäbe eine Folge (xj ) ⊂ K ohne Häufungspunkte. Wir konstruieren nun eine Überdeckung von K, die keine endliche Überdeckung besitzt. Da sich kein xj unendlich oft wiederholen kann, enthält die Folge unendlich viele verschiedene Elemente. Wir können also durch eventuellen Übergang zu einer Teilfolge annehmen, dass bereits die Folge (xj ) aus paarweise verschiedenen Elementen besteht. Da (xj ) keine Häufungspunkte besitzt, ist die Folge eine abgeschlossene Teilmenge von X, die Menge U = X \ (xj ) ist somit offen. Da insbesondere kein xj ein Häufungspunkt der Folge sein kann, existiert zu jedem j ein εj > 0 mit xi 6∈ Uεj (xj ) für alle i 6= j. Daher ist {Uεi (xi ) : i ∈ N} ∪ {U } eine offene Überdeckung von K, die keine endliche Teilüberdeckung besitzt. Als elegante Anwendung beweisen wir die folgende Verallemeinerung von Satz 6.17: Satz 9.18 (Satz über die gleichmäßige Stetigkeit) Es sei K kompakt und die Funktion f : K → R sei stetig. Dann ist f auf K sogar gleichmäßig stetig, d.h. ∀ε > 0∃δ > 0∀x, x0 ∈ K : d(x, x0 ) < δ ⇒ |f (x) − f (x0 )| < ε. Beweis. Es sei ε > 0 fixiert. Da f : K → R stetig ist, existiert zu jedem Punkt x ∈ K ein δx > 0 mit |f (x) − f (x0 )| < ε/2 für alle x0 ∈ Uδx (x). Wegen [ K⊆ Uδx /2 (x) x∈K und der Kompaktheit von K existiert eine endliche Menge {x1 , . . . , xn } mit K⊆ n [ Uδxj /2 (xj ). j=1 Die Zahl δ = min δxj /2 > 0 hat damit die gesuchte Eigenschaft. j=1,...,n 9.4 Wege zur Einführung der Exponentialfunktion f (x) = ex 9.4 181 Wege zur Einführung der Exponentialfunktion f (x) = ex 1. Genetische Konstruktion en = e · . . . · e, n ∈ N −n n e = 1/e , −n∈N √ n m m/n e = e , m ∈ Z, n ∈ N ex = lim exn für xn → x mit xn ∈ Q n→∞ (Diese Methode ist nur für reelle Argumente x ∈ R verwendbar!) 2. Folgendefinition n für x ∈ R ex = lim 1 + nx n→∞ (Diese Methode ist nur für reelle Argumente x ∈ R verwendbar!) 3. Potenzreihe x ∞ X xn für x ∈ R, C, Rd,d n! (Diese Methode ist auch für komplexe Argumente x ∈ C oder sogar für x=quadratische Matrix oder x=Operator verwendbar) e = n=0 4. Differentialgleichung y = ex ist die eindeutig bestimmte Lösung des sogenannten ”Anfangswertproblems” y 0 = y mit y(0) = 1. 5. Funktionalgleichung y = ex ist die eindeutig bestimmte, differenzierbare Lösung der Funktionalgleichung y(x + s) = y(x) · y(s) für alle s, x ∈ R, und y(1) = e. (Die Voraussetzung der Differenzierbarkeit kann sogar durch die schwächere Voraussetzung der Stetigkeit ersetzt werden. Auch Monotonie oder sogar nur lokale Beschränktheit genügen!) Begründungen: 1) Dies wurde in Satz 2.12 gezeigt. 2) Dies wurde in Satz 4.27 gezeigt. 3) Dies ist Inhalt von Satz 5.32 und Definition 5.33. 4) Offenbar löst die Funktion y = y(x) = ex das Anfangswertproblem. Zum Beweis der Einzigkeit sei g eine weitere Lösung. Dann ist die Ableitung (Quotientenregel!) der Funktion h(x) = g(x)/ex offenbar konstant Null, also ist h eine konstante Funktion. Wegen h(1) = 1 ist h konstant 1, also ist g(x) = ex für alle x ∈ R. 182 9 ERGÄNZUNGEN 5) Einerseits erfüllt die e-Funktion die gestellten Bedingungen. Andererseits folgen aus der gegebenen Bedingung y(0) = 1 und y 0 = a · y mit a = y 0 (0). Somit ist y(x) = eax nach 4., und wegen y(1) = e folgt a = 1. Unter der Voraussetzung der Monotonie wurde die Behauptung in Satz 2.14 gezeigt. Für stetige oder beschränkte Funktionen überlassen wir den Nachweis dem Leser. WARNUNG: Es gibt auch unstetige (sehr wilde) Lösungen der genannten Funktionalgleichung. Man muss dazu die Menge R als unendlichdimensionalen über Q betrachten. Mit jeder Bassis dieses Vektorraumes kann man dann (sogar unendlich viele) unstetige Lösungen konstruieren. Siehe zu diesem Thema auch: Die allgemeine Lösung der Cauchyschen Funktionalgleichung f (x + y) = f (x) + f (y). Aufgaben zu Abschnitt 9.4 1) Der Turmbau zu Babel: Es soll ein hoher (1000 m oder sogar ∞ hoch), runder Turm aus Beton gebaut gebaut werden. Welches Profil ist aus statischen Gründen zu wählen? Hinweis: Beachten Sie, dass Baumaterialien nur eine bestimmte Druckbelastung aushalten, oberhalb dieser sie zu Staub zerdrückt werden. Richten Sie das Profil daher so ein, dass die Druckbelastung in jedem Punkt Ihres Bauwerks gleich ist. Abbildung 40: Turmbau 9.5 Die logische Abhängigkeit der zentralen Sätze 9.5 Die logische Abhängigkeit der zentralen Sätze 183 184 9.6 9 ERGÄNZUNGEN Kontrollfragen zur Analysis 1. Der geordnete Körper der reellen Zahlen (a) Erläutern Sie die Axiome des geordneten Körpers der reellen Zahlen. (b) Wie werden Wurzeln konstruiert? (c) Wie werden Exponentialfunktionen f (x) = ax definiert/konstruiert? 2. Der Körper der komplexen Zahlen (a) Wie lassen sich komplexe Zahlen in der Gaußschen Ebene veranschaulichen? Wie werden Addition und Multiplikation analytisch und graphisch durchgeführt? (b) Wie erfolgt die trigonometrische Darstellung komplexer Zahlen? (c) Erläutern Sie die Eulersche Formel! 3. Folgen und Grenzwerte (a) Was versteht man unter Folgen in R, C und Rd ? Wie lassen sie sich veranschaulichen? (b) Erläutern Sie die Begriffe: Konvergente Folge, beschränkte Folge, monotone Folge. Geben Sie Beziehungen zwischen diesen Eigenschaften an und begründen Sie diese! (c) Geben Sie einige Konvergenzkriterien an! Demonstrieren Sie die Kriterien an Beispielen! (d) Erläutern Sie das Prinzip der Intervallschachtelung! Gebeb Sie Anwendungen! Geben Sie Beispiele an! (e) Was sind Häufungspunkte einer Folge? Was besagt der Satz von BolzanoWeierstraß und wie wird er bewiesen? (f) Was sind Cauchyfolgen? Formulieren Sie das Cauchy-Kriterium! (g) Definieren und erläutern Sie wichtige topologische Grundbegriffe! (h) Was ist der Inhalt des Banachschen Fixpunktsatzes (in R), welche Anwendungen kennen Sie? (i) Was sind metrische Räume? Geben Sie Beispiele! Wann heißen Folgen in metrischen Räumen konvergent? Was sind Cauchyfolgen in metrischen Räumen? Wann heißt ein metrischer Raum vollständig? Geben Sie Beispiele. 4. Reihen in R und C (a) Was versteht man unter einer Reihe? Wann heißt eine Reihe konvergent und was ist ihr Grenzwert? (b) Geben Sie Konvergenzkriterien an! Erläutern Sie diese an Beispielen! (c) Geben Sie Kriterien für die absolute Konvergenz von Reihen an! (d) Wann und wie lassen sich Produkte von Reihen berechnen? 9.6 Kontrollfragen zur Analysis 185 (e) Erläutern Sie Begriff und Eigenschaften von Potenzreihen! Geben Sie Anwendungen! 5. Stetigkeit von Funktionen (a) Wann heißt eine Funktion stetig an einer Stelle a? Geben Sie Beispiele und Gegenbeispiele! (b) Wie vererbt sich die Stetigkeit auf zusammengesetzte Funktionen? (c) Was sind Grenzwerte von Funktionen? Nennen Sie wichtige Beispiele! (d) Was besagt der Zwischenwertsatz, und wie wird er bewiesen? (e) Nennen Sie fundamentale Eigenschaften stetiger Funktionen auf kompakten Intervallen in R bzw. auf kompakten Mengen in metrischen Räumen. 6. Elementare Funktionen (a) Was sind ganzrationale Funktionen? Erläutern Sie den Fundamentalsatz der klassischen Algebra in R und in C! (b) Geben Sie mehrere mögliche Definitionen der Exponentialfunktion f (x) = ex und ihrer Umkehrfunktion an! (c) Wie werden trigonometrische Funktionen in R und C definiert? 7. Differentialrechnung (a) Wann heißt eine Funktion f bei a differenzierbar? (b) Erläutern Sie das Prinzip der Linearisierbarkeit im Kleinen (Weierstraßsche Zerlegungsformel)! (c) Nennen Sie einige Differentiationsregeln und beweisen Sie die Produktregel! (d) Wie lautet der Satz von Rolle? Wie wird er bewiesen? (e) Was besagt der Mittelwertsatz der Differentialrechnung? Wie wird er bewiesen? Geben Sie mindestens zwei Anwendungen! (f) Erläutern Sie das Verfahren der Taylorentwicklung! (g) Was sind analytische Funktionen? Geben Sie Beispiele und Gegenbeispiele an! (h) Erläutern Sie Verfahren zur Kurvendiskussion! (i) Was sind partielle Ableitungen? (j) Was bedeutet Linearisierbarkeit im Kleinen für Funktionen z = f (x, y) mit zwei Variablen? (k) Nennen Sie Eigenschaften des Gradienten! (l) Wie werden Extremwerte für Funktionen mit mehreren Variablen bestimmt? (m) Wie sieht eine Taylorentwicklung für Funktionen mit zwei Variablen aus? 8. Integralrechnung (a) Erläutern Sie die Konstruktionsschritte zur Bildung des Riemannschen Integrals! 186 9 ERGÄNZUNGEN (b) Nennen Sie hinreichende Bedingungen für die Integrierbarkeit! (c) Erläutern und beweisen Sie den Hauptsatz der Differential- und Integralrechnung mit allen seinen Teilen! (d) Nennen und erläutern Sie Rechenregeln für das Riemannsche Integral und Methoden zur Ermittlung von Stammfunktionen! (e) Erläutern Sie den Zusammenhang von Inhalt und Integral. (f) Nennen Sie einige Methoden zur Berechnung mehrdimensionaler Integrale! Demonstrieren Sie dies an Beispielen. (g) Wie werden Volumina, Bogenlängen und Flächeinhalte berechnet? (h) Was wissen Sie zur Vertauschbarkeit von Limes und Integral? 9. Ergänzungen (a) Was sind Fraktale? (b) Definieren Sie den Raum C[a, b] und geben Sie einige gute und schlechte Eigenschaften dieses Raumes an! (c) Was besagt der Approximationssatz von Weierstrass? (d) Nennen Sie einige äquivalente Eigenschaften kompakter Mengen in R bzw. in metrischen Räumen. Index Γ-Funktion, 148 e, Definition, 32 π Berechnung, 106 Definition, 81 ε-Umgebung, 26 punktierte, 40 Äquivalenz logische, 2 Überdeckungssatz von Heine-Borel, 179 arsinh, 19 Cesaro-Mittel, 30 Gaußsche Zahlenebene, 22 Riemann-Funktion, 129 Takagi-Funktion, 91 Cauchysche Produktreihe, 58 Cauchyscher Integraltest, 51, 147 Cavallierisches Prinzip , 151 cosh, 19 Darbouxsche Untersumme, 123 Dezimalbruchentwicklung, 10, 42, 52 Dichtheitsaxiom, 9 Differential totales, 114 Differentialquotient, 87 Differentiationsregeln, 88 Kettenregel, 89 Potenzreihe, 92 Umkehrfunktion, 90 Differenziation Umkehrfunktion, 90 Differenzierbarkeit, 87 linksseitige, rechtsseitige, 88 Divergenzkriterium, 59 Dominanzkriterium, 28 Abelscher Grenzwertsatz, 105 Ableitung, 87 höhere, 90 partielle, 111 Abschluss einer Menge, 44 Approximationssatz von Weierstrass, 174 Archimedisches Axiom, 8 arcosh, 19 Arcus-Funktionen, 82 Aussage, 2 Aussageform, 1 Eulersche Formel, 64 Eulersche Zahl, 32 Exponentialfunktion, 16 komplexe, 62 Extremwerte, 107 Flächeninhalt, 130 Folge, 25 konvergent, 26 Teil-, 25 Fundamentalsatz der klass. Algebra, 78 reelle Version, 80 Funktion Dirichlet-, 68 Takagi, 91 analytische, 102 Dirichlet, 124 Eigenschaften, 13 Exponential–, 16 Charakterisierungssatz, 18 Reihendarstellung, 62 Gamma-, 148 ganzrationale, 76 Bernoulli–de l’Hospital, Regel von, 97 Bernsteinpolynome, 174 Besselfunktionen, 94 Betrag komplexer Zahlen, 23 reeller Zahlen, 21 binärer Baum , 173 Binomialrreihe, 104 Binomischer Lehrsatz, 7 Bogenlänge, 165 Bolzano, Nullstellensatz von, 70 Cantormenge, 171 Cauchy-Kriterium für Folgen, 42 für Reihen, 50 Cauchyfolge, 41, 177 187 188 INDEX Grad, 77 implizite, 116 komplexe Logarithmus–, 84 Logarithmus–, 18 Potenz–, 13 transzendente, 80 trigonometrische– Reihendarstellung, 64 Umkehr–, 14 voreindeutig, 13 Gebietsintegral, 152 geometrische Summe, 6 Gradient, 112 Grenzwert, 26 von Funktionen, 74 von links/rechts, 75 Grenzwertsätze, 50 für Folgen, 28 Grundintegrale, 135 Häufungspunkt, 43 einer Folge, 38 einer Menge, 40 Halbierungsverfahren, 39 Haufungspunkt Stetigkeit, 74 Hauptsatz über analytische Funktionen, 103 über implizite Fkt., 116 der Diff-Int-Rechn., Umkehrung, 135 der Diff-Integralrechnung, 134 Hausdorff-Dimension, 171 Hesse-Matrix, 121 Hilbertkurve, 173 Identitätssatz für Potenzreihen, 98 Infimum, 7 Inhalt Riemannscher, 149 Injektion, 13 Integrabilitätsbedingung, 119 Integral elliptisches, 167 iteriertes, 153 mehrdimensionales, 152 Riemannsches, 123 unbestimmtes, 135 uneigentliches, 146 Intervallschachtelung, 36 Jacobi-Matrix, 159 Kardinalzahl, 3 Kettenregel, 89 Verallgemeinerte, 114 Kochsche Kurve, 170 Koeffizientenvergleich, 76 Komlexe Zahlen, 22 komplexe Zahl Betrag, 23 Imaginärteil, 23 konjugierte, 23 Realteil, 23 trigonometrische Darstellung, 83 komplexe Zahlen, 22 trigonometrische Darstellung, 65 konkav, 109 Konvergenz absolute, 54 gleichm, 145 gleichmäßige, 72, 178 punktweise, 72 unbedingte, 55 Konvergenzbereich, 59 Konvergenzkriterium Bolzano, 32 konvex, 109 Krümmungskreis, 109 Kreisscheibensatz, 37 Kreuzmenge, 3 Kugelkoordinaten, 161 Kurve, 114, 164 glatte, 164 Kurvendiskussion, 106 Lücke, 75 Leibnizkriterium, 53 Leibnizreihe, 37, 43 liminf, 39 limsup, 39 Logarithmusreihe, 104 Majorantenkriterium, 54 Menge abgeschlossen, 43 INDEX Abschluss, 44 kompakt, 73, 178 offen, 43 prkompakt, 179 zusammenhängend, 153 Mengenbildung, 2 Metrik, 177 metrischer Raum, 177 kompakter, 178 vollständig, 178 Mittelwertsatz der Integralrechnung, 133 Mittelwertsatz der Diff.rechnung, 95 Moivresche Formeln, 84 Monotonie, 14 1. Hauptsatz, 15 2. Hauptsatz, 69 Normalbereich, 151 Nullfolge, 27 Nullstelle ganzrat. Funktion, 78 Vielfachheit, 77 Nullstellensatz von Bolzano, 70 Partialsummen, 48 Partielle Integration, 137 Pol, 75 Polarkoordinaten, 160 Potenzmenge, 3 Potenzreihe, 59 Prinzip des Koeffizientenvergleichs, 98 Punkt innerer, 43 Quotientenkriterium, 54 Randpunkt, 43 Rechteckregel, 127 Regel von Bernoulli-de l’Hospital, 97 Regressionsgerade, 122 Reihe, 48 Dirichlet, 51 absolute Konvergenz, 54 alternierende, 53 Bolzanosches Konvergenzkriterium, 50 geometrische, 49 189 harmonische, 49 notwendiges Konvergenzkriterium, 50 Restglied, 99 von MacLaurin, 100 Restgliedformel von Cauchy, 99 von Lagrange, 99 Riemann-Integral, 123 Riemannscher Umordnungssatz, 55 Rolle, Satz von, 95 Satz Approximationssatz von Weierstrass, 174 Approximationssatz von Weierstrass, trigonometrische Form, 176 Heine-Borel, 179 vom Maximum und Minimum, 71 von Bolzano, 32 von Bolzano-Weierstraß, 39 von Bolzano-Weierstraß für Mengen, 40 von Cauchy-Hadamard, 60 von H. A. Schwarz, 118 von Riemann, 56 von Taylor, 99 Satz vom Maximum und Minimum, 179 Satz von Fubini, 154 Schranke, 7 Sierpinski-Dreieck, 172 sinh, 19 Spirale Archimedische, 167 logarithmische, 167 Sprung, 75 Stammfunktion, 134 Stetigkeit, 66 ε − δ−Definition, 66 gleichmäßige, 71 Substitutionsregel, 138 Superposition, 13 Supremum, 7 Surjektion, 13 Tangente, 114 Taylor -Koeffizienten, 99 -formel, 99 190 -formel für n Variable, 121 -polynom, 99 -reihe, 99 Transformationsformel, 159 Trapezregel, 128 Trigonometrische Polynome, 175 Tschebyscheff-Metrik, 178 Ungleichung Bernoullische, 5 Vergleichskriterium, 30 Wahrheitswert, 1 Weierstraßsche Zerlegungsformel, 87, 113 Wendepunkt, 108 Wurzelkriterium, 54 Zahlenfolge beschränkt, 27 quasistationär, 25 stationär, 25 Zerlegung, 123 äquidistante, 126 Zerlegungssumme, 123 Zetafunktion, 51 Zwischenwertsatz, 71 Zylinderkoordinaten, 161 INDEX