Jürgen Pöschel etwas analysis Ws 2010–11 inhaltsverzeichnis Inhaltsverzeichnis 3 0 Grundlagen 0-a Aussagenlogik 8 0-b Mengen 14 0-c Abbildungen 21 Aufgaben 29 1 Reelle 1-a 1-b 1-c 1-d 1-e 1-f 1-g 2 Natürliche, ganze und rationale Zahlen 2-a Natürliche Zahlen 54 2-b Ganze und rationale Zahlen 64 2-c Abzählbarkeit und Mächtigkeit 66 Aufgaben 72 3 Komplexe Zahlen 3-a Vorüberlegungen 76 3-b Konstruktion der komplexen Zahlen 3-c Einige elementare Eigenschaften 78 3-d Fundamentalsatz der Algebra 81 Aufgaben 82 Zahlen Die Körperaxiome 34 Die Anordnungsaxiome 37 Das Vollständigkeitsaxiom 41 Wurzeln 45 Die erweiterte Zahlengerade 47 Intervalle 48 Eindeutigkeit 49 Aufgaben 51 77 3 inhaltsverzeichnis 4 5 4 Folgen 4-a 4-b 4-c 4-d 4-e 4-f 4-g 4-h Reihen 5-a 5-b 5-c 5-d Grenzwerte reeller Folgen 86 Grenzwertsätze 89 Einige wichtige Grenzwerte 92 Existenzsätze 94 Häufungswerte 100 Uneigentliche Grenzwerte 102 Normierte Räume und Banachräume 104 Der Folgenraum c 112 Aufgaben 114 Konvergenz 120 Absolute Konvergenz 122 Konvergenzkriterien 125 Reihen in Banachräumen 129 Aufgaben 131 6 Stetigkeit 6-a Stetige Funktionen und Abbildungen 136 6-b Stetige Funktionen auf Intervallen 144 6-c Topologische Grundbegriffe 150 6-d Stetigkeit und Kompaktheit 159 6-e Funktionsgrenzwerte 165 6-f Stetige Fortsetzung 170 6-g Die Funktionenräume B(D) und CB(D) 172 Aufgaben 177 7 Integration 7-a Treppenfunktionen 184 7-b Das Cauchyintegral 186 7-c Eigenschaften des Cauchyintegrals 7-d Regelfunktionen 190 7-e Integration in Banachräumen 194 Aufgaben 195 188 inhaltsverzeichnis 8 Differenziation 8-a Definitionen und Rechenregeln 198 8-b Lokale Extrema und Mittelwertsatz 205 8-c Der Hauptsatz 210 8-d Bestimmung von Integralen 213 8-e Höhere Ableitungen 217 8-f Taylorpolynome und Taylorreihe 220 Aufgaben 226 9 Spezielle Funktionen 9-a Logarithmusfunktion 230 9-b Exponenzialfunktion 232 9-c Sinus und Cosinus 237 9-d Tangens und Arcusfunktionen 242 9-e Exp, Sin und Cos im Komplexen 245 9-f Die Hyperbelfunktionen 250 Aufgaben 253 10 Ergänzungen 10-a Die Regeln von l’Hospital 258 10-b Uneigentliche Integrale 261 10-c Zwei Beispiele 267 10-d Faltungen 270 10-e Diracfolgen 273 Aufgaben 278 11 Elementare Differenzialgleichungen 11-a Grundbegriffe 282 11-b Lineare Differenzialgleichungen 286 11-c Separierbare Differenzialgleichungen 289 11-d Homogene Differenzialgleichungen 296 Aufgaben 299 Literatur 301 Index 302 Bezeichnungen 314 Mehr Aufgaben 316 5 6 0 Grundlagen Das grundlegende Handwerkszeug des Mathematikers ist die Aussagenlogik, und zu den grundlegenden Begriffen der modernen Mathematik gehören die Begriffe der Menge und der Abbildung. Ohne diese ist kaum eine mathematische Aussage präzise zu formulieren. Grundlagenfragen sind allerdings immer auch schwierige Fragen. Sie setzen eine tiefere Kenntnis der Materie voraus, um ihre Bedeutung und ihren Reiz zu erschließen. Für einen Neuling sind sie dagegen ein trockenes, wenig appetitanregendes Brot. Wir werden die Aussagenlogik sowie die Begriffe der Menge und der Abbildung daher nur in einem ›naiven‹ Sinn kurz ansprechen. Wir verzichten auf eine mathematisch präzise Formulierung, da Aufwand und Ertrag für unsere Zwecke in keinem vernünftigen Verhältnis stehen. Im Wesentlichen geht es darum, sich auf einen Sprachgebrauch für alles Weitere zu verständigen. 0 1 7 0 grundlagen 0-a aussagenlogik Das Gebäude der Mathematik wird mit den Regeln der Aussagenlogik errichtet. Dessen Bausteine sind Aussagen im Sinne von Aristoteles, denen genau einer von zwei möglichen Wahrheitswerten zukommt. 0.1 Aristotelischer Aussagebegriff tertium non datur 1 . Ï Eine Aussage ist entweder wahr oder falsch – Es gibt in der Mathematik also kein vielleicht – solche Aussagen werden gar nicht erst zugelassen. ¸ Beispiele Aristotelische Aussagen sind beispielsweise: a. Eine Woche hat sieben Tage. b. 2 ist eine Primzahl. 2 c. Es gibt unendlich viele Primzahlen. d. Es gibt unendlich viele Primzahlzwillinge. 3 Keine Aussagen im Sinne der Mathematik sind dagegen e. Hoffentlich ist die Woche bald zu Ende. f. Nachts ist es kälter als draußen. g. Wenn heute, dann morgen. µ Dabei ist unerheblich, ob der Wahrheitswert einer Aussage tatsächlich bekannt ist. So ist ›Es gibt unendlich viele Primzahlzwillinge‹ sicher wahr oder falsch, nur wissen wir dies im Jahr 2010 nicht. Logische Verknüpfungen Aussagen lassen sich zu neuen Aussagen logisch verknüpfen. Das Ergebnis einer solchen Verknüpfung legt man in einer Wahrheitstafel fest. So wird die Verknüpfung zweier Aussagen p und q durch und und oder, in Symbolen p ∧ q respektive p ∨ q , durch folgende Wahrheitstafel definiert. Dabei stehe 1 für wahr und 0 für falsch. 1 Ein Drittes gibt es nicht. 2 Eine natürliche Zahl heißt prim, wenn sie genau zwei Teiler besitzt, nämlich 1 und sich selbst. Somit ist 2 eine Primzahl, nicht aber 1 . 3 Ein Primzahlzwilling liegt vor, wenn p und p + 2 prim sind, wie zum Beispiel 5 und 7 . 8 0 2 06.09.2011–09:35 aussagenlogik p q 1 1 0 0 0-a p∧q p∨q 1 0 1 0 1 0 0 0 1 1 1 0 . Das logische und entspricht dem allgemeinen Sprachgebrauch: p ∧ q ist nur wahr, wenn sowohl p als auch q wahr sind. Beim logischen oder ist dagegen zu beachten, dass es immer einschließend gemeint ist: p ∨ q ist wahr, wenn p oder q oder beide wahr sind. Das umgangssprachliche oder ist dagegen meist ausschließend gemeint. ›Es regnet oder ich gehe spazieren‹ meint üblicherweise ›Entweder es regnet, oder ich gehe spazieren‹. ¸ Beispiel Folgende Aussagen sind wahr: √ a. 0 < 1 und 2 ist irrational. √ b. 0 < 1 oder 2 ist irrational. √ c. 0 < 1 oder 2 ist rational. µ Die Definition der Negation einer Aussage p durch nicht, in Symbolen ¬p , bereitet keine Schwierigkeiten: p ¬p 1 0 0 1 . Die Verneinung einer konkreten Ausssage kann dagegen durchaus Schwierigkeiten machen. ¸ Beispiele a. Es ist nicht so, dass, wenn es heute schneit, morgen die Sonne scheint. b. Es gilt nicht limt→∞ sin t = 0 . µ Schließlich benötigen wir noch die logische Verknüpfung zweier Aussagen p und q durch wenn-dann und genau-dann-wenn, in Symbolen p → q und p ↔ q : p q 1 1 0 0 06.09.2011–09:35 1 0 1 0 p→q p↔q 1 0 1 1 1 0 0 1 . 0 3 9 0 grundlagen Das logische genau-dann-wenn folgt dabei wieder der Umgangssprache: p ↔ q ist wahr, wenn p und q denselben Wahrheitsgehalt haben. Ungewohnt ist anfangs dagegen das logische wenn-dann: die Verknüpfung p → q ist vereinbarungsgemäß wahr, wenn entweder p und q wahr sind, oder wenn p falsch ist. In letzterem Fall spielt der Wahrheitsgehalt von q keine Rolle. Egal was ich aus einer falschen Aussage p folgere, die logische Verknüpfung als Ganzes wird als wahr gewertet – ex falso quodlibet 4 . Diese Konvention ist einerseits praktisch, und andererseits tatsächlich gar nicht so weit vom umgangssprachlichen Verständnis entfernt. Mit den genannten Verknüpfungen lassen sich sehr komplexe Ausdrücke bilden. Um dabei Klammern zu sparen, legt man fest, dass ¬ vor ∨, ∧ vor → vor ↔ bindet. So ist p ∨ ¬q → p gleichbedeutend mit (p ∨ (¬q)) → p . Tautologien Ein mathematisches Gebäude wird errichtet, indem aus einfachen Grundannahmen – den sogenannten Axiomen – und bereits bewiesenen Aussagen durch korrekte logische Schlüsse neue Aussagen gewonnen werden. Jeder einzelne logische Schluss von einer Aussage p auf eine Aussage q stellt dabei sicher, dass q immer dann wahr ist, wenn p wahr ist. Ist p dagegen falsch, so interessiert q nicht weiter. Mit anderen Worten, die Aussageverknüpfung p → q ist immer wahr. Definition Eine Tautologie ist eine Aussage, die immer wahr ist. Ist eine Aussage immer falsch, so spricht man von einer Kontradiktion oder einem Widerspruch. Ï ¸ Beispiel Die einfachste Tautologie ist p ∨ ¬p , die einfachste Kontraktion ist p ∧ ¬p . µ Ist p → q immer wahr, so schreiben wir p ⇒ q, gelesen p impliziert q . Dieser Ausdruck ist genau genommen eine Metaausage, also eine Aussage über eine Aussage. Mit p ⇒ q sagen wir aus, dass wann immer p gilt, dann auch q gilt. 4 Aus Falschem alles Beliebige. 10 0 4 aussagenlogik 0-a Entsprechend steht p a q, gelesen p äquivalent q , für die Aussage, dass p ↔ q immer wahr ist. In diesem Fall nehmen p und q immer denselben Wahrheitswert an, sie stellen daher dieselbe logische Funktion dar. So gilt beispielsweise p → q a ¬p ∨ q, wie man anhand einer Wahrheitstafel sofort verifiziert: p q ¬p 1 1 0 0 1 0 1 0 0 0 1 1 p → q ¬p ∨ q 1 0 1 1 1 0 1 1 . Der logische Ausdruck p → q ist also äquivalent zum Ausdruck ¬p ∨ q . Auf dieselbe Weise kann man eine Fülle weiterer logischer Äquivalenzen verifizieren. Hier sind die wichtigsten betreffend ∧ und ∨ . 0.2 Es gelten die Distributivgesetze Logische Äquivalenzen (p ∧ q) ∨ r a (p ∨ r ) ∧ (q ∨ r ), (p ∨ q) ∧ r a (p ∧ r ) ∨ (q ∧ r ), die Regeln von de Morgan ¬(p ∧ q) a ¬p ∨ ¬q, ¬(p ∨ q) a ¬p ∧ ¬q, sowie die Regel von der doppelten Negation ¬(¬p) a p. Ï Eine ∧- respektive ∨-Verknüpfung wird also verneint, indem die einzelnen Aussagen verneint und die Junktoren ∧ und ∨ vertauscht werden. ¸ Beispiele a. ›Es stimmt nicht, dass es regnet oder ich spazieren gehe‹ ist gleichbedeutend mit ›Es regnet nicht, und ich gehe nicht spazieren‹. b. Bezeichnet 0 á 1 die Verneinung von 0 < 1 und Q die Menge der rationalen Zahlen, so gilt p p ¬(0 < 1 ∨ 2 ∈ Q) a 0 á 1 ∧ 2 ∉ Q. µ 0 5 11 0 grundlagen Beweistechniken Die nächsten Äquivalenzen bilden die Grundlage für einige der wichtigsten Beweistechniken und werden ebenfalls anhand von Wahrheitstafeln verifiziert. 0.3 Abtrennungs- und Syllogismusregel p ∧ (p → q) ⇒ q, Es gilt (p → q) ∧ (q → r ) ⇒ p → r . Ï Diese Regeln beschreiben die Technik des direkten Beweises. Die Abtrennungsregel besagt ›Gilt p , und folgt q aus p , so gilt auch q ‹, und die Syllogismusregel besagt ›Folgt q aus p , und r aus q , so folgt auch r aus p ‹. Dies entspricht dem Alltagsgebrauch und soll nicht weiter illustriert werden. 0.4 Kontrapositionsregel Es gilt p → q a ¬q → ¬p. YYYYY Ï Zur Abwechslung noch einmal ein Beweis mit Wahrheitswerttafel: p q 1 1 0 0 1 0 1 0 p→q 1 0 1 1 ¬q ¬p 0 1 0 1 0 0 1 1 ¬q → ¬p 1 0 1 1 . YYYYY Die Kontrapositionsregel ist die Grundlage des indirekten Beweises. Statt q aus p zu folgern, zeigt man, dass die Verneinung von q zur Verneinung von p führt. 0.5 ¸ Beispiel eines indirekten Beweises Wir behaupten: Ist das Quadrat einer natürlichen Zahl n gerade, so ist auch n gerade. Der Beweis erfolgt indirekt. Wir negieren die Folgerung und nehmen an, dass n nicht gerade ist. Dann ist n ungerade und damit von der Form n = 2m + 1 mit einer ganzen Zahl m á 0 . Elementare arithmetische Umformungen – hier die binomische Formel – führen dann zu n2 = (2m + 1)2 = 4m2 + 4m + 1 = 2(2m2 + 2m) + 1 = 2k + 1 mit der ganzen Zahl k = 2m2 + 2m á 0 . Also ist n2 ebenfalls ungerade. Dies ist die Negation der Voraussetzung, und der indirekte Beweis ist abgeschlossen. µ 12 0 6 aussagenlogik 0.6 Widerspruchsregel 0-a Es gilt ¬p → q ∧ ¬q ⇒ p. Ï Die Widerspruchsregel ist die Grundlage des Widerspruchsbeweises, oder reductio ad absurdum. Um eine Aussage p zu beweisen, nehmen wir an, dass sie nicht gilt, also ¬p wahr ist. Können wir daraus einen Widerspruch ableiten, also eine Aussage der Form q ∧ ¬q , die immer falsch ist, so folgt, dass p wahr ist. 0.7 ¸ Beispiel eines Widerspruchsbeweises Das klassische Beispiel eines Wider√ spruchsbeweises ist der Beweis der Irrationalität von 2 . √ Wir nehmen an, 2 ist rational. Dann ist also p r 2 = s mit natürlichen Zahlen r und s . Wir können annehmen, dass r und s nicht beide gerade sind, denn andernfalls dividieren wir r und s so lange durch 2 , bis dieser Zustand erreicht ist. √ Gilt nun 2 = r /s , so folgt durch Quadrieren 2s 2 = r 2 . Also ist r 2 gerade. Dann ist auch r selbst gerade – siehe Beispiel 0.5 – und damit r = 2t mit einer anderen natürlichen Zahl t . Aus 2s 2 = r 2 und r = 2t folgt dann aber 2s 2 = 4t 2 , oder s 2 = 2t 2 . Also ist auch s gerade – siehe wieder Beispiel 0.5. Also sind r und s beide gerade, im Widerspruch zur Annahme, dass r und s nicht beide gerade sind. µ Schließlich erwähnen wir noch die 0.8 Äquivalenzregel Es gilt p ↔ q a p → q ∧ q → p. Ï Die Äquivalenz zweier Aussagen ist also gleichbedeutend damit, dass jede der beiden Aussagen aus der anderen folgt. Salopp gesagt: ›man muss beide Richtungen zeigen‹. ¸ Beispiel Das Quadrat einer natürlichen Zahl n ist gerade genau dann, wenn n gerade ist. 0 7 13 0 grundlagen Die →-Richtung haben wir oben gezeigt. Die ←-Richtung besteht darin zu zeigen, dass das Quadrat einer geraden natürlichen Zahl ebenfalls gerade ist. Dies ist als Übung überlassen. µ Es gibt natürlich noch eine Reihe weiterer elementarer Beweistechniken, beispielsweise den Induktionsbeweis. Diese werden wir später kennenlernen. 0-b mengen Der Begriff der Menge wurde am Ende des 19. Jahrhunderts von Georg Cantor wie folgt eingeführt. 0.9 Naive Definition (Cantor 1895) Eine Menge ist eine Zusammenfassung M von bestimmten, wohlunterschiedenen Objekten unserer Anschauung oder unseres Denkens (welche die Elemente von M genannt werden) zu einem Ganzen. Ï ›So stelle ich mir eine Menge auch vor‹, würde man wohl sagen. Tatsächlich ist dies aber alles andere als eine präzise Definition. Was ist denn ein ›bestimmtes Objekt‹, und aus welchen Objekten besteht unsere ›Anschauung‹ insgesamt? Es dauerte auch nicht lange, bis die Widersprüchlichketi dieser Definition erkannt wurde. Bertrand Russell entdeckte um 1901 ein besonders einfaches Beispiel. Bildet man die Menge M aller Mengen X , die sich nicht selbst enthalten – in Symbolen M = {X : X ∉ X } – so lässt sich nicht entscheiden, ob M sich selbst enthält oder nicht. Nimmt man M ∈ M an, so folgt hieraus M ∉ M . Nimmt man dagegen M ∉ M an, so folgt hieraus wiederum M ∈ M . Ein analoges, nicht-mathematisches Beispiel ist das Paradoxon des Barbiers eines Dorfes, der alle Männer im Dorf rasiert, die sich nicht selbst rasieren. Auch hier kann man nicht entscheiden, ob der Barbier sich selbst rasiert oder nicht . . . Mathematisch ist dieser Zustand natürlich nicht haltbar, und führte zur Entwicklung der axiomatischen Mengenlehre von Zermelo, Fraenkel und anderen. Hier lassen sich nicht mehr völlig beliebige Objekte zu Mengen zusammenfassen. Insbesondere ist die Russelsche Konstruktion keine Menge mehr, und die Frage, ob M zu M gehört, stellt sich nicht mehr. 14 0 8 mengen 0-b Wir werden uns aber nicht mit der axiomatischen Mengenlehre beschäftigen – so wie es auch die meisten Mathematiker halten. Alle Mengen, mit denen wir zu tun haben werden, sind Mengen auch im axiomatischen Sinn, und das soll uns genügen. Mengen Für unseren Gebrauch ist eine Menge bestimmt durch die in ihr enthaltenen Elemente. Ist M eine Menge, so ist ein beliebiges Objekt m – wieder so ein unbestimmter Begriff – entweder Element von M , geschrieben m ∈ M, oder nicht Element von M , geschrieben m ∉ M. Insbesondere enthält eine Menge jedes ihrer Elemente nur einmal, und auf deren Reihenfolge kommt es nicht an. Zwei Mengen sind gleich, wenn sie dieselben Elemente enthalten. Es gibt auch eine Menge ohne Elemente, die sogenannte leere Menge ∅ = { }. Es gibt nur eine leere Menge. Enthält eine Menge nur endlich viele Elemente, so können wir sie durch Aufzählung aller ihrer Elemente angeben: {H, i, l, f, e} , { , , } . ¸ Beispiele ∅ ∉ ∅, ∈ { , , } , í ∉ { , , } , {1, 2, 3} = {3, 2, 1} . µ Bei der Aufzählung ist es erlaubt, Elemente einer Menge mehrfach zu nennen, auch wenn sie nur einmal enthalten sind. Betrachtet man beispielsweise die allgemeine Lösungsmenge einer quadratischen Gleichung, so möchte man diese als {x1 , x2 } schreiben und dabei auch den Fall einschließen, dass x1 = x2 gilt. ¸ Beispiel Es ist {1, 1, 1} = {1, 1} = {1} . µ 0 9 15 0 grundlagen Ist die Elementzahl nicht mehr endlich, so helfen gelegentlich Pünktchen, die ein ›und so weiter‹ andeuten. So bezeichnet N = {1, 2, 3, . . .} die Menge der natürlichen Zahlen 5 . Streng genommen ist . . . zwar immer mehrdeutig und daher nicht exakt. Man verwendet die Pünktchen als bequeme Abkürzung aber immer dann, wenn dieses ›und so weiter‹ wirklich offensichtlich ist und keine intellektuelle Anstrengung erfordert. Schließlich werden Mengen auch durch Eigenschaften ihrer Elemente charakterisiert – und dies ist eigentlich auch die einzige Möglichkeit, nicht-endliche Mengen anzugeben. So bezeichnet P = {n ∈ N : n ist prim} = {2, 3, 5, 7, 11, . . .} die Menge aller Primzahlen. Allgemein schreibt man {m : A(m)} für die Menge aller Objekte m , die bei Einsetzen in eine Aussageform A 6 eine wahre Aussage ergeben. Will man nur die Elemente einer Grundmenge M betrachten, so schreibt man anstelle von {m : m ∈ M ∧ A(m)} kürzer {m ∈ M : A(m)} . Für wichtige Mengen haben sich Standardbezeichnungen eingebürgert. So bezeichnen beispielsweise N, Z, Q, R, C die Mengen der natürlichen, ganzen, rationalen, reellen und komplexen Zahlen, die wir später noch genauer betrachten werden. Teilmengen Eine Menge N ist Teilmenge einer Menge M , geschrieben N ⊂ M, wenn jedes Element von N auch in M enthalten ist. Dies schließt auch die Gleichheit der beiden Mengen ein 7 . Im Fall der echten Inklusion schreiben wir deshalb ⊊ . Es gilt also N ⊊ M a N ⊂ M ∧ N ≠ M. 5 Es ist reine Definitionssache, ob die natürlichen Zahlen bei 0 oder 1 beginnen. Das naive Zählen beginnt aber natürlicherweise bei 1 . 6 Eine Aussageform enthält eine oder mehrere Variablen und geht erst durch Einsetzen konkreter Objekte in eine aristotelische Aussage über. 7 Dies ist zwar inkonsistent im Vergleich zu < und à , aber allgemeiner Brauch. 16 0 10 mengen 0-b ¸ Beispiele ∅ ⊂ {1, 2, 3} ⊂ {1, 2, 3} ⊊ N, ∅ ⊂ ∅, ∅ ⊊ {∅} , N ⊂ Z ⊂ Q ⊂ R ⊂ C, {1, 2, 3} Æ P ⊊ N, wobei P die Menge der Primzahlen bezeichnet. µ Mengenoperationen Für Vereinigung, Durchschnitt und Differenz zweier Mengen schreiben wir wie üblich A ∪ B, Es ist also A ∩ B, A Ø B. 8 A ∪ B Í {m : m ∈ A ∨ m ∈ B } , A ∩ B Í {m : m ∈ A ∧ m ∈ B } , A Ø B Í {m : m ∈ A ∧ m ∉ B } . Man nennt A Ø B auch das relative Komplement von B in A . ¸ Beispiele {H, i, l} ∪ {e, l, f} = {H, i, l, f, e} , {H, i, l} ∩ {e, l, f} = {l} , {H, i, l} Ø {e, l, f} = {H, i} . Für eine beliebige Menge M gilt außerdem M ∪ ∅ = M, M ∩ ∅ = ∅, M Ø ∅ = M, ∅ Ø M = ∅, insbesondere ∅ Ø ∅ = ∅ . µ Sehr oft betrachtet man im Rahmen einer Theorie Teilmengen einer festen Grundmenge M . Beispielsweise sind Funktionen einer reellen Veränderlichen immer auf Teilmengen der Menge R der reellen Zahlen definiert. Die Differenz 8 Mit Í wird die linke Seite durch die rechte Seite definiert. Analog wird Î verwendet. 0 11 17 0 grundlagen · 0-1 Vereinigung, Durchschnitt und Differenz A A∪B B A∩B AØB einer Teilmenge A ⊂ M zur Grundmenge M bezeichnet man als das Komplement von A bezüglich M , geschrieben C M A Í M Ø A = {m ∈ M : m ∉ A} . Ist M aus dem Kontext bekannt, so schreibt man für das diesbezügliche Komplement auch Ac . Für diese Mengenoperationen gelten eine Fülle von Rechenregeln, von denen wir die wichtigsten notieren. 0.10 Rechenregeln für Mengenoperationen Es gelten die Distributivgesetze (A ∩ B) ∪ C = (A ∪ C) ∩ (B ∪ C), (A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C), das Verschmelzungsgesetz (A ∩ B) ∪ A = A = (A ∪ B) ∩ A, für Teilmengen eines gemeinsamen Universums M die Regeln von de Morgan (A ∩ B)c = Ac ∪ B c , (A ∪ B)c = Ac ∩ B c , sowie das Doppelkomplementgesetz (Ac )c = A. · 0-2 Ï Komplement einer Menge M A Ac 18 0 12 mengen 0-b Jede dieser Identitäten kann mithilfe einer Mengentafel bewiesen werden. Ein beliebiges Element ist in jeder einzelnen Menge entweder enthalten oder nicht. Schreiben wir dafür wieder 1 respektive 0 , so ergibt sich zum Beispiel das erste Verschmelzungsgesetz aus folgender Mengentafel: YYYYY A B 1 1 0 0 1 0 1 0 A ∩ B (A ∩ B) ∪ A 1 0 0 0 A ∪ B (A ∪ B) ∩ A 1 1 0 0 1 1 1 0 1 1 0 0 . YYYYY Potenzmenge Ist M eine beliebige Menge, so bezeichnet man die Menge aller ihrer Teilmengen als die Potenzmenge von M , geschrieben P(M) . Für jede beliebige Menge gilt immer M ∈ P(M), ∅ ∈ P(M). Wie wir noch sehen werden, ist die Potenzmenge einer Menge ›größer‹, genauer mächtiger als M selbst. Eine Menge, deren Elemente selbst Mengen sind, wird auch als Mengensystem bezeichnet. ¸ Beispiele Für M = {0} ist P(M) = {∅, {0}} = {∅, M } , für M = {0, 1} ist P(M) = {∅, {0} , {1} , M } . Man beachte, dass M Æ P(M) , denn die Elemente von M sind nicht selbst in P(M) enthalten, sondern in Mengen ›verpackt‹. µ ¸ Beispiel P(∅) = {∅} , P(P(∅)) = P({∅}) = {∅, {∅}} , P(P(P(∅))) = {∅, {∅} , {{∅}} , {∅, {∅}}} . Stellt man sich die leere Menge ∅ als Sack vor, der nichts enthält, so ist {∅} ein Sack, der einen leeren Sack enthält, und {{∅}} ein Sack, der einen Sack enthält, der einen leeren Sack enthält. Dies sind sehr unterschiedliche Dinge! µ 0 13 19 0 grundlagen Kartesisches Produkt Sind A und B zwei beliebige Mengen, so ist deren kartesisches Produkt die Menge aller geordneten Paare, die sich aus Elementen von A an erster Position und Elementen von B an zweiter Position bilden lassen. In Symbolen: A × B Í {(a, b) : a ∈ A, b ∈ B } . Den Begriff des geordneten Paares verwenden wir hierbei ebenso naiv wie den Begriff der Menge. Wir begnügen uns mit der Festlegung, dass ein geordnetes Paar (a, b) eindeutig durch seine beiden Komponenten a und b und deren Reihenfolge festgelegt ist 9 . Ein Paar ist also etwas wesentlich anderes als eine zweielementige Menge. Für a ≠ b ist (a, b) ≠ (b, a), ¸ Beispiel {a, b } = {b, a} . Mit A = { , } und B = { , } ist A × B = {(, ), (, ), (, ), (, )} , B × A = {(, ), (, ), (, ), (, )} . Insbesondere ist A × B ≠ B × A . µ Ist eine der beteiligten Mengen leer, so ist das kartesische Produkt vereinbarungsgemäß ebenfalls leer. Für jede Menge M gilt also M × ∅ = ∅ × M = ∅ . Analog werden Produkte aus mehr als zwei Mengen definiert. So ist A3 Í A × A × A Í {(a, b, c) : a, b, c ∈ A} die Menge aller Tripel (a, b, c) mit Komponenten in A . Allgemein ist für jede natürliche Zahl n á 1 An Í {(a1 , a2 , . . . , an ) : a1 , . . . , an ∈ A} die Menge aller n-Tupel mit Komponenten in A . Siehe dazu auch den entsprechenden Abschnitt auf Seite 24. ¸ Beispiel Der dreidimensionaln Raum unserer Anschauung wird beschrieben durch die Menge aller geordneten Tripel reeller Zahlen, R3 = R × R × R = {(x, y, z) : x, y, z ∈ R} = {(x1 , x2 , x3 ) : x1 , x2 , x3 ∈ R} . µ 9 Eine mengentheoretische Definition des Paares wäre (a, b) Í {a, {a, b }} . 20 0 14 abbildungen 0-c 0-c abbildungen Mengen kann man aufeinander abbilden. Der Begriff der Abbildung ist von ebenso fundamentaler und weitreichender Bedeutung wie der Begriff der Menge. Auch hier werden wir uns mit einer naiven Definition begnügen. 0.11 Naive Definition Seien A und B zwei beliebige Mengen. Eine Abbildung oder Funktion f von A nach B ist eine Vorschrift, die jedem Element a ∈ A genau ein Element b ∈ B zuordnet, in Symbolen: f : A → B, a , b = f (a). Ï Diese Definition ist ›naiv‹, da wir an eine anschauliche Bedeutung der Begriffe ›Vorschrift‹ und ›zuordnen‹ appellieren, ohne diese zu präzisieren. Sie ist sogar leicht irreführend, da sie suggeriert, dass jede Abbildung in Gestalt einer Formel daherkommt. Dem ist aber nicht so! Sehr viele wichtige mathematische Funktionen sind nur implizit definiert, ohne einen expliziten formelmäßigen Ausdruck. Man kann sogar beweisen, dass es für sie solche Formeln nicht gibt. Dies gilt zum Beispiel für die Lösungen der meisten Differenzialgleichungen. ¸ Beispiele a. Die aus der Schule vertraute quadratische Funktion ist t , ϕ(t) = t 2 . ϕ : R → R, b. Die Funktion π : N → Z, n , π (n) = card {p ∈ P : p à n} liefert für jede natürliche Zahl n die Anzahl der Primzahlen à n . Diese kann nicht durch einen formelmäßigen Ausdruck angegeben werden. c. Es gibt keine Abbildung einer nichtleeren Menge A in die leere Menge. Denn einem Punkt a ∈ A kann ja kein Bildpunkt zugeordnet werden. µ Ist f : A → B, a , b = f (a) eine Funktion, so nennt man A ihren Definitionsbereich, B ihren Wertebereich. Ferner heißt b der Funktionswert von f an der Stelle a , oder Bildpunkt von a . Der Punkt a selbst heißt Urbild von b unter f . Einem Punkt a ∈ A ist immer genau ein Bildpunkt b ∈ B zugeordnet, aber ein Punkt b ∈ B kann mehrere Urbilder haben – siehe Abbildung 0-3. 0 15 21 0 grundlagen · 0-3 Funktion f : A → B A Keine Funktion B Die Menge aller Bildpunkte, also die Menge f (A) Í {f (a) : a ∈ A} , heißt das Bild von A unter f . Während ein Wertebereich meist leicht angegeben werden kann – man braucht B ja nur ›groß genug‹ zu wählen –, ist das genaue Bild einer Funktion gelegentlich schwer zu bestimmen. 0.12 ¸ Beispiel Im vorangehenden Beispiel ist ϕ(R) = [0, ∞) = {x ∈ R : x á 0} und, da es unendlich viele Primzahlen gibt, π (N) = {0, 1, 2, . . .} = N ∪ {0} . µ Im Falle endlicher Mengen A und B ist eine Funktion f : A → B im Prinzip immer durch ein Pfeildiagramm wie in Abbildung 0-3 angebbar. Die Punkte bezeichnen die Elemente der Mengen A und B , und die Pfeile deren Zuordnung durch die Abbildung f . Eine Funktion liegt genau dann vor, wenn von jedem Punkt der Menge A genau ein Pfeil ausgeht. Andererseits dürfen Punkte in B von keinem, einem, oder mehreren Pfeilen getroffen werden. Es dürfen sogar alle Punkte aus A auf ein- und denselben Punkt in B abgebildet werden. Graph Jede Funktion f : A → B bestimmt eindeutig ihren Graph Γ (f ) Í {(a, b) ∈ A × B : b = f (a)} . Dies ist diejenige Teilmenge des kartesischen Produktes A × B , die aus allen Paaren der Form (a, f (a)) mit a ∈ A besteht. 22 0 16 abbildungen 0-c ¸ Beispiel Handelt es sich bei A und B um die reelle Gerade oder Teilmengen hiervon, so können wir Graphen oft zeichnerisch in gewohnter Weise wie in Abbildung 0-4 darstellen. µ Umgekehrt bestimmt ein Graph Γ (f ) eindeutig die dahinter stehende Funktion f . Denn zu jedem a ∈ A existiert genau ein b ∈ B , so dass (a, b) ∈ Γ (f ) , und dieses b ist damit der Bildpunkt von a unter f . Diesen Zusammenhang kann man für eine mengentheoretische Definition des Funktionsbegriffs nutzen. 0.13 Mengentheoretische Definition Eine Funktion f : A → B ist eine Teilmenge von A × B , in der jedes a ∈ A in genau einem Paar an erster Stelle auftritt. Ï Diese Definition vermeidet Begriffe wie ›Vorschrift‹ und ›zuordnen‹ und die Assoziation von ›Funktion‹ mit ›Formel‹, ist dafür aber eher unanschaulich. In jedem Fall ist eine Funktion ein Objekt, das aus einem Definitionsbereich, einem Wertebereich und einer funktionalen Relation zwischen beiden besteht. Zwei Funktionen sind daher auch gleich nur dann, wenn sie in allen diesen Aspekten gleich sind. Das heißt, zwei Funktionen f : A → B, g: U → V sind gleich genau dann, wenn A = U, 0.14 B=V und f (a) = g(a) für alle a ∈ A = U . ¸ Beispiel Es besteht ein großer Unterschied zwischen der Funktion ϕ von Beispiel 0.12 und der Funktion ψ : [0, ∞) → [0, ∞) , ψ(t) = t 2 . Die Funktion ψ ist umkehrbar, ϕ nicht – siehe Beispiel 0.16. µ · 0-4 Graphen der Funktionen ϕ und π t2 π (n) 4 1 1 1 t 1 5 n 0 17 23 0 grundlagen Standardfunktionen ¸ Beispiele a. Von der leeren Menge gibt es genau eine Abbildung in jede gegebene Menge B , die leere Abbildung e : ∅ → B . Dabei darf B ebenfalls leer sein. b. Die Abbildung idA : A → A, a,a heißt die Identität auf A . Ist die Grundmenge klar, schreibt man auch id . c. Seien A und B nicht leer, und b ∈ B fest. Dann heißt A → B, a,b eine konstante Abbildung. d. Ist M ⊂ A , so heißt χM : A → {0, 1} , χM (a) = 1 für a ∈ M, 0 für a ∈ M c , die charakteristische Funktion von M auf A . e. Ist A ⊂ B und eine Funktion f : B → X gegeben , so heißt g : A → X, a , f (a) die Einschränkung von f auf A . Die übliche Bezeichnung hierfür ist f A . µ Es folgen noch einige Funktionen spezieller Art, die unter anderen Namen bekannt sind. Dazu sei X eine beliebige nichtleere Menge. Tupel und Folgen Für jede natürliche Zahl n á 1 sei An Í {1, 2, . . . , n} die Menge der ersten n natürlichen Zahlen. Eine Funktion f : An → X wird vollständig beschrieben durch ihre n Funktionswerte xk = f (k), 1 à k à n. Diese können wir in Form eines n-Tupels (x1 , . . . , xn ) angegeben. Der Funktionswert xk = f (k) ist dann die k-te Koordinate oder Komponente des Tupels, und als Kurznotation für Funktionen auf An sind zwei solche Tupel gleich, wenn alle entsprechenden Koordinaten gleich sind: (x1 , . . . , xn ) = (y1 , . . . , yn ) a xk = yk , 24 0 18 1 à k à n. abbildungen 0-c Das n-fache kartesische Produkt einer Menge X , X n = {(x1 , . . . , xn ) : x1 , . . . , xn ∈ X } , ist die Menge aller n-Tupel mit Koordinaten in X . Am häufigsten wird uns der n-dimensionale reelle Raum Rn begegnen. Entsprechend wird eine Funktion f: N→X vollständig beschrieben durch ihre Funktionswerte fk = f (k), k = 1, 2, . . . . Man spricht von einer Folge in X , und schreibt sie in der Form (f1 , f2 , . . . ) = (fk )ká1 = (fk ). Folgen werden wir genauer in Kapitel 4 studieren. Operationen Eine Funktion ? : X ×X →X lässt sich auffassen als eine binäre Operation oder innere Verknüpfung auf X . Jedem Paar (a, b) ∈ X × X wird ein neues Element c = ?(a, b) ∈ X zugeordnet. Die übliche Schreibweise hierfür ist c = a ? b. Eine binäre Operation ? auf X heißt kommutativ, falls a?b =b?a für alle a, b ∈ X . Sie heißt assoziativ, falls a ? (b ? c) = (a ? b) ? c für alle a, b, c ∈ X . Bemerkung Ist eine Operation ? nicht kommutativ, so bedeutet das nicht, dass a ? b ≠ b ? a für alle a ≠ b gilt. Es genügt dafür ein einziges Beispiel. Ç 0 19 25 0 grundlagen Komposition Seien f : M → N und g : N → O zwei Abbildungen, anschaulich f g M -→ N -→ O. Das Bild von f ist also im Definitonsbereich von g enthalten. Dannn ist die Komposition von f mit g definiert als die Abbildung g ◦ f : M → O, m , (g ◦ f )(m) Í g(f (m)). Gelesen wird dies › g nach f ‹ oder › g kringel f ‹. Die Komposition operiert immer von rechts nach links: zuerst wird f angewandt, danach g . Man überlegt sich leicht, dass die Komposition assoziativ, aber im Allgemeinen nicht kommutativ ist. Auf dem Raum F (M) aller Abbildungen von M in sich definiert die Komposition eine Operation: ◦ : F (M) × F (M) → F (M), (g, f ) , g ◦ f . Injektionen, Surjektionen, Bijektionen Definition Eine Abbildung f : A → B heißt (i) injektiv, wenn jeder Bildpunkt höchstens ein Urbild besitzt, (ii) surjektiv, wenn jeder Punkt der Bildmenge ein Urbild besitzt, (iii) bijektiv, wenn sie injektiv und surjektiv ist. Ï Eine Abbildung f : A → B ist somit injektiv, wenn für alle a, b ∈ A gilt: f (a) = f (b) ⇒ a = b. Sie ist surjektiv, wenn f (A) = B. Man sagt dann auch, f bildet A auf B ab. Sie ist bijektiv, wenn jeder Punkt b ∈ B genau ein Urbild a ∈ A besitzt. 0.15 Satz Eine Abbildung f : A → B ist bijektiv genau dann, wenn es eine Abbildung φ : B → A gibt mit φ ◦ f = idA , f ◦ φ = idB . In diesem Fall ist φ eindeutig bestimmt. Ï 26 0 20 abbildungen · 0-5 0-c Injektion, Surjektion, und Bijektion Injektiv, nicht surjektiv Surjektiv, nicht injektiv Bijektiv ⇒ Ist f bijektiv, so gibt es zu jedem b ∈ B genau ein a ∈ A mit f (a) = b . Definieren wir φ durch φ(b) = a , so hat φ die gewünschten Eigenschaften. ⇐ Wegen f ◦ φ = idB ist f surjektiv. Gilt nun f (a1 ) = f (a2 ) für zwei Elemente von A , so folgt aus φ ◦ f = idA die Gleichung YYYYY a1 = φ(f (a1 )) = φ(f (a2 )) = a2 . Also ist f auch injektiv, und damit bijektiv. Ist nun ψ : B → A eine weitere Abbildung mit ψ ◦ f = idA und f ◦ ψ = idB , so folgt ψ = ψ ◦ idB = ψ ◦ f ◦ ϕ = idA ◦ ϕ = ϕ. Also ist φ eindeutig bestimmt. Y Y Y Y Y Umkehrabbildung Aufgrund des letzten Satzes ist eine bijektive Abbildung f : A → B umkehrbar, und wir können ihre Umkehrabbildung f −1 definieren als die eindeutig bestimmte Abbildung f −1 : B → A mit der Eigenschaft, dass f −1 ◦ f = idA , f ◦ f −1 = idB . Die Komposition umkehrbarer Abbildungen ist wieder umkehrbar, und es gilt – siehe Aufgabe 18 – (g ◦ f )−1 = f −1 ◦ g −1 . 0 21 27 0 grundlagen · 0-6 Abbildung und Umkehrabbildung f −1 f 0.16 ¸ Beispiele a. Die Abbildung ψ von Beispiel 0.14 ist bijektiv und damit umkehrbar, ihre Umkehrfunktion ist die Quadratwurzelfunktion p ψ−1 : [0, ∞) → [0, ∞) , t , t . Die Abbildung ϕ von Beispiel 0.12 ist nicht umkehrbar, da sie nicht injektiv ist. Zum Beispiel ist ϕ(−1) = ϕ(1) = 1 . b. Die Umkehrfunktion der Exponentialfunktion, exp : R → (0, ∞) , t , et , ist die Logarithmusfunktion, log : (0, ∞) → R, t , log t. Eine andere übliche Bezeichnung ist ln für logarithmus naturalis. µ · 0-7 Die Umkehrfunktion von exp exp log 28 0 22 aufgaben 0 aufgaben 1 Welche der folgenden Aussagen sind wahr? a. p → q ∧ ¬q ⇒ ¬p . b. ∅ ∈ P(∅) . c. {0} × {0} = {(0)} . d. Es gibt keine Abbildung in die leere Menge. e. N ⊂ M a Mc Æ Nc . f. Für f : A → B gilt f (A) = B . g. Eine Abbildung f : A → B ist injektiv genau dann, wenn sie umkehrbar ist. h. Die Umkehrabbildung von f besteht aus den Kehrwerten von f . 2 In der Bibliothek des Grafen Dracula gibt es keine zwei Bücher, deren Inhalt aus gleich vielen Wörtern besteht. Außerdem ist die Anzahl der Bücher größer als die Anzahl der Wörter jedes einzelnen Buches. Diese Aussagen genügen, um den Inhalt mindestens eines Buches aus Draculas Bibliothek genau zu beschreiben. Was steht in dem Buch? 3 Wie lauten die Assoziativ- und Kommutativgesetze für ∧ und ∨ ? 4 Vereinfachen Sie die folgenden Ausdrücke: a. 5 (p ∧ ¬p) ∨ q b. (p ∨ ¬p) ∧ q Definieren Sie das umgangsspachliche entweder-oder durch eine Wahrheitstafel und stellen Sie es durch logische Ausdrücke mit ¬, ∧, ∨ dar. 6 Die folgende Wahrheitstafel umfasst mögliche Alternativen zur Definition der wenn-dann-Verknüpfung: p q p→q p_q p%q p>q 1 1 1 1 1 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 1 0 1 0 . Diskutieren Sie die logische Bedeutung jeder dieser Verknüpfungen, und warum diese keine gute Wahl einer Definition von p → q wären. 7 Seien p und q Aussagen, von denen wir nur wissen, dass p → q gilt. Was können wir dann über folgende Ausdrücke aussagen? a. ¬q → ¬p b. ¬p → ¬q c. q → ¬p d. ¬p → q . 8 Zeigen Sie, dass ¬(A → B) a A ∧ ¬B . 9 Die logische Verknüpfung nicht-und, englisch nand, wird definiert durch p | q a ¬(p ∧ q). 0 23 29 0 grundlagen a. Stellen Sie die Wahrheitstafel für | auf. b. Zeigen Sie: ¬p a p | p . c. 10 Stellen Sie p ∧ q und p ∨ q ausschließlich durch die nand-Verknüpfung dar. Erläutern Sie das Russelsche Paradoxon: Bildet man M = {X : X ∉ X } so führt M ∈ M zu M ∉ M , und M ∉ M führt zu M ∈ M . 11 12 13 Diskutieren Sie alle Fälle, in denen A × B = B × A . Verifizieren Sie die folgenden Aussagen über Teilmengen A, B einer Menge M . a. A ⊂ B c a B ⊂ Ac . b. A ⊂ B a B c ⊂ Ac . Beweisen Sie die Distributivgesetze, (A ∩ B) ∪ C = (A ∪ C) ∩ (B ∪ C), (A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C), und die Regeln von de Morgan, (A ∩ B)c = Ac ∪ B c , 14 (A ∪ B)c = Ac ∩ B c . Beschreiben Sie geometrisch das kartesische Produkt a. zweier Intervalle, b. zweier Geraden, d. einer Geraden und einer Kreislinie, 15 16 e. c. eines Intervalls und einer Kreislinie, zweier Kreislinien. Für eine Abbildung f : A → B sind folgende Aussagen äquivalent. a. f ist injektiv. b. f −1 (f (U )) = U für jede Teilmenge U ⊂ A . c. f (A1 ∩ A2 ) = f (A1 ) ∩ f (A2 ) für alle A1 , A2 ⊂ A . Eine Abbildung f : A → B ist a. injektiv genau dann, wenn es eine Abbildung g : B → A gibt, so dass g ◦ f = idA , b. surjektiv genau dann, wenn es eine Abbildung h : B → A gibt, so dass f ◦ h = idB . 17 Seien f : M → N und g : N → O zwei Abbildungen. Zeigen Sie: Sind f und g injektiv respektive surjektiv, so auch g ◦ f . Gilt auch die Umkehrung? 18 Seien f : M → N und g : N → O zwei bijektive Abbildungen. Zeigen Sie, dass dann auch g ◦ f : M → O bijektiv ist, und dass (g ◦ f )−1 = f −1 ◦ g −1 . 19 Sei F (M, X) der Raum aller Abbildungen f : M → X . Eine Operation ∗ auf X induziert auf F (M, X) eine Operation ç : F (M, X) × F (M, X) → F (M, X), 30 0 24 (f , g) , f ç g, aufgaben 0 durch die punktweise Definition (f ç g)(m) = f (m) ∗ g(m), m ∈ M. Zeigen Sie: ç ist kommutativ respektive assoziativ auf F (M, X) genau dann, wenn ∗ kommutativ respektive assoziativ auf M ist. – Üblicherweise schreibt man für diese induzierte Operation wieder ∗ statt ç . 20 Eine Abbildung f : A → B induziert Mengenabbildungen f : P(A) → P(B), 10 f (M) Í {f (x) ∈ B : x ∈ M } und f −1 : P(B) → P(A), f −1 (N) = {x ∈ A : f (x) ∈ N } . Man nennt f (M) das Bild von M und f −1 (N) das Urbild von N . a. Für A1 , A2 ⊂ M und B1 , B2 ⊂ N gilt f −1 (B1 ∪ B2 ) = f −1 (B1 ) ∪ f −1 (B2 ), f (A1 ∪ A2 ) = f (A1 ) ∪ f (A2 ). b. Mit denselben Bezeichnungen gilt f −1 (B1 ∩ B2 ) = f −1 (B1 ) ∩ f −1 (B2 ), f (A1 ∩ A2 ) ⊂ f (A1 ) ∩ f (A2 ). c. 21 Geben Sie ein Beispiel, wo f (A1 ∩ A2 ) ⊊ f (A1 ) ∩ f (A2 ) . In einem Zoologiebuch aus Gallusien heißt es: »Jede ungebrochselte Kalupe ist dorig, und jede foberante Kalupe ist dorig. In Gallusien gibt es sowohl dorige wie undorige Kalupen«. Welche der folgenden Aussagen sind wahr? Aussagen, die nicht ableitbar sind, sind dabei als falsch zu bewerten. Das Präfix un- ist gleichbedeutend mit der logischen Negation. a. Es gibt gebrochselte Kalupen. b. Es gibt sowohl gebrochselte wie ungebrochselte Kalupen. c. Alle undorigen Kalupen sind gebrochselt. d. Einige gebrochselte Kalupen sind unfoberant. 10 Streng genommen müsste diese mit einem anderen Symbol bezeichnet werden, wie zum Beispiel f˜ , um sie von f , und f −1 von der Umkehrfunktion zu unterscheiden. Es sollte aber immer aus dem Kontext klar sein, welche Abbildung gemeint ist. 0 25 31 32 0 26 1 Reelle Zahlen Die reellen Zahlen bilden das Fundament der gesamten Analysis. Es ist daher sinnvoll, sich zunächst Klarheit über dieses Fundament zu verschaffen. Der konstruktive – und historisch korrekte – Zugang beginnt bei den natürlichen Zahlen und führt über die Konstruktion der ganzen und der rationalen Zahlen zu den reellen Zahlen. Jedesmal ist ein neues Zahlensystem auf dem vorangehenden aufzubauen, und es sind die gewünschten Eigenschaften nachzuweisen. Man erhält so ein tief gegründetes Fundament, doch ist die sorgfältige Ausführung langwierig. Auch trägt es unmittelbar wenig zum Verständnis der eigentlichen Analysis bei. Der axiomatische – und hier beschriebene – Zugang zu den reellen Zahlen ist direkter. Er besteht darin, eine endliche Anzahl von Postulaten – die sogenannten Axiome – über reelle Zahlen zu formulieren, die den Ausgangspunkt für alle weiteren Schlüsse bilden. Diese Axiome werden nicht weiter hinterfragt. Sie mögen evident sein, wenn man sie auf eine bestimmte Vorstellung von den reellen Zahlen bezieht. Doch mathematisch gesehen ist dies unerheblich. Diese Axiome machen keine Aussage, was die reellen Zahlen sind. Sie legen nur fest, welche Eigenschaften sie haben. Und nur diese Eigenschaften sind für alles Folgende relevant. 1 Das hier beschriebene Axiomensystem der reellen Zahlen ist nicht das einzig mögliche. Doch es hat sich als tragfähig und zweckmäßig erwiesen. Alles, was wir über die reellen Zahlen wissen, lässt sich aus ihm ableiten. 1 Euklid hat in seinen Axiomen der Geometrie noch versucht zu umschreiben, was man sich unter Punkt, Gerade und Fläche vorstellen soll. Hilbert stellte dem die Auffassung gegenüber, dass dies unerheblich ist. In allen geometrischen Sätzen müsse man statt Punkt, Gerade und Fläche ebensogut Tisch, Stuhl und Krug sagen können. 1 1 33 1 reelle zahlen 1-a d i e k ö r p e r a x i o me Zunächst einmal bilden die reellen Zahlen einen Körper. Das ist eine Menge, in der zwei Operationen erklärt sind, die üblicherweise als Addition und Multiplikation bezeichnet werden, und die den folgenden Körperaxiomen genügen. 1.1 Körperaxiome Eine Menge K mit zwei Operationen + und · , genannt Addition und Multiplikation, heißt Körper, wenn in ihm die Axiome der Addition: (a-1) Die Addition ist assoziativ und kommutativ, (a-2) Es gibt ein Element 0 ∈ K , genannt neutrales Element der Addition, so dass x + 0 = x für alle x ∈ K , (a-3) Zu jedem Element x ∈ K existiert ein Element y ∈ K , genannt das additiv Inverse zu x , so dass x + y = 0 , die Axiome der Multiplikation: (m-1) Die Multiplikation ist assoziativ und kommutativ, (m-2) Es gibt ein Element 1 ∈ K verschieden von 0 , genannt neutrales Element der Multiplikation, so dass x ·1 = x für alle x ∈ K , (m-3) Zu jedem Element x ∈ K verschieden von 0 existiert ein Element y ∈ K , genannt das multiplikativ Inverse zu x , so dass x ·y = 1 , und das Distributivgesetz (d) Für alle x, y, z ∈ K gilt x ·(y + z) = (x ·y) + (x ·z) gelten. Ï Präziser gesagt ist ein Körper ein Tripel (K, +, · ) , bestehend aus einer Menge K mit zwei Operationen + und · mit den oben genannten Eigenschaften. Ist aber klar, welche Operationen gemeint sind, spricht man einfach vom Körper K . Um Klammern zu sparen, vereinbart man, dass ›Punktoperationen‹ stärker binden als ›Strichoperationen‹. Auch lässt man meistens den Punkt weg und schreibt xy für x ·y . Das Distributivgesetz lautet dann x(y + z) = xy + xz. 1.2 ¸ Beispiele für Körper a. Der kleinste Körper ist F = {0, 1} , wenn man 1+1Í0 definiert und ansonsten wie üblich addiert und multipliziert. 2 2 Die Standardbezeichnung für diesen Körper ist F2 . 34 1 2 06.09.2011–09:35 die körperaxiome 1-a b. Die Menge Q der rationalen Zahlen mit der üblichen Addition und Multiplikation bildet einen Körper. c. Dasselbe gilt für die Menge C der komplexen Zahlen. d. Die Menge √ √ Q( 2 ) Í a + b 2 : a, b ∈ Q √ bildet einen Körper, wobei Q ⊂ Q( 2 ) . e. Eine rationale Funktionen mit rationalen Koeffizienten ist gegeben durch einen Ausdruck der Gestalt am x m + · · · + a1 x + a0 , bn x n + · · · + b1 x + b0 m, n á 0, mit a0 , . . . , am , b0 , . . . , bn ∈ Q und bn ≠ 0 . Die Menge M dieser Funktionen mit der üblichen Addition und Multiplikation bildet einen Körper. µ Zunächst bemerken wir, dass die neutralen und die inversen Elemente notwendigerweise eindeutig sind. Dies muss also nicht explizit gefordert werden. 1.3 Lemma In einem Körper sind die neutralen und inversen Elemente eindeutig bestimmt. Ï Y Y Y Y Y Beweis Sei 0̃ ein weiteres neutrales Element der Addition. Dann gilt Axiom (a-2) sowohl für 0 als auch für 0̃ . Zusammen mit Axiom (a-1) ergibt sich hieraus 0̃ = 0̃ + 0 = 0 + 0̃ = 0, also 0̃ = 0 . Damit ist die Eindeutigkeit des neutralen Elementes gezeigt. Ist ỹ neben y ein weiteres additiv Inverses zu x , so folgt aus x + y = 0 und x + ỹ = 0 und der Assoziativität und Kommutativität der Addition ỹ = ỹ + 0 = ỹ + (x + y) = y + (x + ỹ) = y + 0 = y. Also ist ỹ = y . – Entsprechend argumentiert man für die Multiplikation. Y Y Y Y Y Man schreibt nun −x für das additiv Inverse zu x , und x −1 oder 1/x für sein multiplikativ Inverses, falls x ≠ 0 . Ferner vereinbart man die Schreibweisen x − y Í x + (−y) und x Í x/y Í xy −1 y für y ≠ 0. Mit diesen Vereinbarungen erhalten wir die Lösungen der Gleichungen a + x = b und ax = b in vertrauter Form. Der Beweis ist als Übung überlassen: 06.09.2011–09:35 1 3 35 1 1.4 reelle zahlen Satz In einem Körper K besitzt die Gleichung (i) a + x = b die eindeutige Lösung x = b − a , (ii) ax = b für a ≠ 0 die eindeutige Lösung x = b/a . Ï Folgerungen Die folgenden Rechenregeln sind für die reellen Zahlen wohlvertraut und folgen unmittelbar aus den Körperaxiomen. Das bedeutet aber, dass sie auch in jedem beliebigen Körper gelten. 1.5 Satz (i) (ii) (iii) (iv) (v) (vi) In einem Körper K gilt: −(−x) = x , (x −1 )−1 = x für x ≠ 0 , 0·x = 0 , (−1)·x = −x , x(y − z) = xy − xz , xy = 0 ⇒ x = 0 ∨ y = 0 . Ï Bemerkung In einem Körper ist ein Produkt also nur 0 , wenn wenigstens ein Faktor 0 ist. Man sagt, ein Körper ist nullteilerfrei. Ç Y Y Y Y Y Beweis (i) Aus (−x) + x = x + (−x) = 0 folgt, dass x das additive Inverse zu −x ist. Aufgrund der vereinbarten Notation ist somit x = −(−x) . (ii) Analog zu (i). (iii) Es ist 0 = 0 + 0 , und mit dem Distributivgesetz 0·x = (0 + 0)·x = 0·x + 0·x. Addition des additiv Inversen von 0·x ergibt 0 = 0·x . (iv) Mit (iii) ist 0 = 0·x = (1 + (−1))·x = 1·x + (−1)·x = x + (−1)·x. Also ist (−1)·x das additiv Inverse zu x , was die Behauptung ist. (v) Mit (iv) erhält man x(y − z) = x(y + (−1)·z) = xy + (−1)·xz = xy + (−xz) = xy − xz. (vi) Sei xy = 0 . Ist x = 0 , so sind wir fertig. Ist x ≠ 0 , so können wir die Gleichung mit x −1 multiplizieren, und mit (iii) folgt y = 0 . Y Y Y Y Y 36 1 4 die anordnungsaxiome 1-b Mit (i) und (iv) folgt übrigens die wohlbekannte Rechenregel (−1)·(−1) = −(−1) = 1, die hiermit auch bewiesen ist. Wir werden alle diese Regeln im Folgenden verwenden, ohne explizit auf den Satz zu verweisen. Bemerkung Wir haben etwas mühsam Dinge bewiesen, die wir über die reellen Zahlen ›immer schon‹ wussten. Der Satz gilt aber in jedem beliebigen Körper, also auch dann, wenn dessen Elemente mit reellen Zahlen keine Ähnlichkeit haben, und die Zeichen + und · etwas völlig anderes bedeuten. Darin liegt die Stärke der axiomatischen Methode: Gelten die Körperaxiome, so gelten auch sofort eine Fülle weiterer Sätze, unabhängig davon, was man sich unter dem Körper vorstellt. Ç ¸ In jedem Körper gelten die Regeln des Bruchrechnens, wie zum Beispiel a c ad + bc + = , b d bd YYYYY Beweis (ab −1 falls bd ≠ 0. µ Aus den Axiomen folgt mit den vereinbarten Bezeichnungen + cd−1 )(bd) = ab−1 bd + cd−1 bd = ab−1 bd + cd−1 db = ad + bc. Somit ist ab−1 + cd−1 = (ad + bc)(bd)−1 , und das ist die Behauptung. Y Y Y Y Y 1-b d i e a n o r d n u n g s axiome Reelle Zahlen kann man nicht nur addieren und multiplizieren, man kann sie auch hinsichtlich ihrer Größe vergleichen. Diesen Größenvergleich kann man darauf zurückführen, dass eine geeignete Teilmenge existiert, deren Elemente ›positiv‹ genannt werden. 1.6 Anordnungsaxiome Ein Körper K heißt angeordnet, wenn es in ihm eine Teilmenge P , genannt Positivbereich, gibt, so dass Folgendes gilt: (o-1) Für jedes a ∈ K gilt genau eine der drei Aussagen a ∈ P, a = 0, −a ∈ P . (o-2) Mit a, b ∈ P ist auch a + b ∈ P, ab ∈ P . Ï 1 5 37 1 reelle zahlen Ein angeordneter Körper ist dann ein Quadrupel (K, +, · , P ) , bestehend aus einem Körper K mit Addition + , Multiplikation · , und einem Positivbereich P . Sind alle diese Bestandteile aus dem Kontext klar, sprechen wir einfach vom angeordneten Körper K . ¸ a. Der Körper Q der rationalen Zahlen mit den üblichen positiven Zahlen ist angeordnet. b. Im Körper M der rationalen Funktionen mit rationalen Koeffizienten aus Beispiel 1.2 bilden die Funktionen mit an bm > 0 einen Positivbereich. Somit ist M angeordnet. c. Die Körper F und C können nicht angeordnet werden, wie in Beispiel 1.9 gezeigt wird. µ Für a ∈ P schreibt man üblicherweise a > 0 und nennt a positiv. Das erste Anordnungsaxiom fordert also, dass immer genau eine der Aussagen a>0 oder a=0 oder −a>0 (1) zutrifft. Das zweite fordert, dass Summe und Produkt positiver Elemente wieder positiv sind. In einem angeordneten Körper K erklärt man weiter a > b :a a − b > 0, a á b :a a > b ∨ a = b, und entsprechend a < b und a à b . Mit diesen Bezeichnungen und (1) gilt dann folgende 1.7 Trichotomie Für je zwei Elemente a und b eines angeordneten Körpers K gilt genau eine der drei Relationen a>b oder a=b oder a < b. Ï Noch etwas Terminologie: Ein Element a heißt nichtnegativ, falls a á 0 , nichtpositiv, falls a à 0 , und negativ, falls a < 0 . Dies dürfte nicht weiter überraschen. Rechenregeln Es folgen einige Rechenregeln für Ungleichungen in angeordneten Körpern, die für die reellen Zahlen – hoffentlich – ebenfalls wohlvertraut sind. 38 1 6 die anordnungsaxiome 1.8 In einem angeordneten Körper K gilt: Satz (i) (ii) (iii) (iv) (v) (vi) (vii) 1-b a>b a>b a>b a>b a<b a≠0 1 > 0. YYYYY (ii) a −a < −b , ∧ b > c ⇒ a > c, ⇒ a + c > b + c, ∧ c > 0 ⇒ ac > bc , ∧ c < 0 ⇒ ac > bc , ⇒ a2 Í a·a > 0 , Ï Beweis (i) Dies folgt aus a − b = (−b) − (−a) . Aus a − b > 0 und b − c > 0 folgt mit (o-2) auch a − c = (a − b) + (b − c) > 0. (iii) Aus a − b > 0 folgt auch (a + c) − (b + c) = a − b > 0 . (iv) Mit a − b > 0 und c > 0 ist mit (o-2) auch (a − b)c > 0 , und damit ac − bc > 0 . (v) Mit a < 0 ist −a > 0 wegen (i), und es folgt −ac < −bc mit (iv). Nochmalige Anwendung von (i) liefert die Behauptung. (vi) Ist a ≠ 0 , so ist entweder a > 0 oder a < 0 . Die Behauptung folgt dann im ersten Fall mit (iv) und im zweiten Fall mit (v), indem man c = a und b = 0 wählt. (vii) Dies folgt aus (vi) mit a = 1 . Y Y Y Y Y Man beachte, dass wir 1 > 0 nicht als Axiom fordern mussten. Dies ist vielmehr eine Folge ›elementarer‹ Annahmen. Wir werden auch diese und ähnliche Regeln im Folgenden verwenden, ohne explizit auf den Satz zu verweisen. 1.9 ¸ a. Der kleinste Körper F = {0, 1} kann nicht angeordnet werden. Denn mit 1 > 0 wäre dann auch 1 + 1 > 0 , aber dem widerspricht 1 + 1 = 0 . b. Auch der Körper C der komplexen Zahlen kann nicht angeordnet werden. Denn es ist i ≠ 0 , aber sowohl die Annahme i > 0 wie auch die Annahme i < 0 führen zu dem Widerspruch −1 = i2 > 0 . Siehe auch Aufgabe 4. µ 1 7 39 1 reelle zahlen · 1-1 |t| Graph der Betragsfunktion 1 1 t Betrag In einem angeordneten Körper ist der Betrag |a| eines Elementes definiert durch a für a á 0, |a| Í −a für a < 0. Für diesen gelten die folgenden Rechenregeln. 1.10 Satz (i) (ii) (iii) (iv) (v) Für den Betrag |·| in einem angeordneten Körper gilt: |−a| = |a| sowie − |a| à a à |a| , |a| á 0, und |a| = 0 a a = 0 , |ab| = |a| |b| , |x − a| < ε a a − ε < x < a + ε , |a + b| à |a| + |b| (Dreiecksungleichung). Ï Die Berechtigung der Bezeichnung Dreiecksungleichung wird sich erst im Kontext der komplexen Zahlen ergeben. Dort existiert eine ähnliche Betragsfunktion, auch wenn C nicht angeordnet ist. Y Y Y Y Y Beweis (i)–(iii) folgen unmittelbar aus der Definition des Betrags und sind als Übung überlassen. (iv) Wir bemerken zunächst, dass wegen (ii) notwendigerweise ε > 0 gilt. Mit (i) folgt dann |x − a| < ε a −ε < x − a < ε a a − ε < x < a + ε. (v) Für a + b á 0 ist |a + b| = a + b à |a| + |b| . Ist aber a + b < 0 , so ergibt sich ebenfalls |a + b| = −(a + b) = (−a) + (−b) à |a| + |b| . In jedem Fall gilt somit (v). Y Y Y Y Y 40 1 8 das vollständigkeitsaxiom 1.11 Korollar Für den Betrag |·| gilt die umgekehrte Dreiecksungleichung ||a| − |b|| à |a − b| . YYYYY 1-c Beweis Ï Aufgrund der Dreiecksungleichung ist |a| à |b| + |a − b| und damit |a| − |b| à |a − b| . Vertauschen wir a und b , so erhalten wir ebenso |b| − |a| à |a − b| . Mit (ii) des vorangehenden Satzes ergibt dies die Behauptung. Y Y Y Y Y 1-c d a s v o l l s t ä n d i gkeitsaxiom Bisher haben wir über die reellen Zahlen nichts gesagt, was nicht auch für die rationalen Zahlen gilt – sowohl Q als auch R sind angeordnete Körper. Die rationalen Zahlen haben aber den entscheidenden Nachteil, dass es von ihnen ›nicht genug gibt‹. So haben wir in Beispiel 0.7 gezeigt, dass es keine rationale Zahl gibt, deren Quadrat 2 ergibt. Es besteht somit die Notwendigkeit, die ›Löcher‹ zwischen den rationalen Zahlen ›auszufüllen‹. Diese ›Füllung‹ kann auf unterschiedliche Weise konstruiert werden, zum Beispiel mit Hilfe von Dezimaldarstellungen, Cauchyfolgen, Intervallschachtelungen, oder dedekindschen Schnitten. Hier wollen wir jedoch nur das Ergebnis solcher Konstruktionen – also die Vollständigkeit der reellen Zahlen – axiomatisch beschreiben. Auch dies kann auf verschiedenen Wegen geschehen. Wir beschreiben den Weg über dedekindsche Schnitte, der konzeptionell einfach ist und direkt zur Existenz von Suprema und Infima führt. Für das Folgende ist es bequem, die < -Notation zu erweitern. Für Teilmengen A, B und Elemente c eines angeordneten Körpers K sei A < c :a a < c für alle a ∈ A, A < B :a a < b für alle a ∈ A und b ∈ B. Entsprechend sind A à c und A à B erklärt. 1 9 41 1 reelle zahlen Dedekindsche Schnitte Definition Sei K ein angeordneter Körper. Ein Paar (A, B) nichtleerer Teilmengen von K heißt dedekindscher Schnitt, falls A ∪ B = K, A ∩ B = ∅, und A < B. Ein Element c ∈ K heißt Schnittzahl eines dedekindschen Schnittes, falls A à c à B. Ï Die Mengen A und B bilden also eine Zerlegung von K : es gilt A ∪ B = K, A ∩ B = ∅. (2) Eine solche Zerlegung bildet einen dedekindschen Schnitt, wenn außerdem A unterhalb von B angeordnet ist und beide Mengen nicht leer sind. Eine Schnittzahl c ist ein Element von K , dass zwischen A und B passt. Wegen (2) gehört c entweder zu A oder zu B . Welche der beiden Mengen das ist, ist unerheblich. ¸ a. Für jedes c ∈ K ist A Í {a ∈ K : a < c } , B Í {a ∈ K : c à a} ein dedekindscher Schnitt mit Schnittzahl c . Dasselbe gilt, wenn < und à vertauscht werden. b. Im angeordneten Körper Q definieren die Mengen A Í {r ∈ Q : r à 0 ∨ r 2 < 2} , B Í {r ∈ Q : r > 0 ∧ r 2 > 2} , einen dedekindschen Schnitt. Dieser besitzt in Q allerdings keine Schnittzahl, denn diese wäre eine Lösung der Gleichung x 2 = 2 – siehe Seite 45. µ Bemerkung Ein Schnitt (A, B) muss keine Schnittzahl haben. Existiert sie aber, so ist sie eindeutig – siehe Aufgabe 2. Ç Die Forderung, dass die reellen Zahlen keine ›Löcher‹ aufweisen, übersetzt sich nun in die Forderung, dass es dort keine dedekindschen Schnitte ohne Schnittzahl gibt. Man sagt dazu auch, die reellen Zahlen seien vollständig. 1.12 Vollständigkeitsaxiom Ein angeordneter Körper K heißt vollständig, wenn jeder dedekindsche Schnitt eine Schnittzahl besitzt. Ï Damit haben wir alle Axiome versammelt, die wir für die Beschreibung der reellen Zahlen benötigen. 42 1 10 das vollständigkeitsaxiom 1.13 1-c Charakterisierung der reellen Zahlen Die reellen Zahlen bilden einen vollständigen angeordneten Körper, der mit R bezeichnet wird. Ï Dieser Körper ist, wie wir noch in Abschnitt 1-g skizzieren werden, bis auf Isomorphie eindeutig. Daher ist es auch berechtigt, ihn mit einem einzigen Symbol, R , zu bezeichnen und von dem Körper der reellen Zahlen zu sprechen. Damit ist natürlich noch nichts über die Existenz der reellen Zahlen gesagt. Dies erfordert eine Konstruktion, die ausgehend von den natürlichen Zahlen N das Gebäude N⊂Z⊂Q⊂R aus ganzen, rationalen und reellen Zahlen aufbaut. Dies werden wir, wie gesagt, hier nicht tun. Vielmehr werden wir im nächsten Kapitel die natürlichen, ganzen und rationalen Zahlen in R ›wiederentdecken‹. Supremum und Infimum Die Vollständigkeit eines angeordneten Körpers steht in einem engen Zusammenhang mit der Existenz sogenannter Suprema und Infima. In der Tat sind dies zwei Erscheinungsformen ein- und desselben Sachverhalts. Sei K ein angeordneter Körper. Eine Teilmenge A ⊂ K heißt nach oben beschränkt, wenn es ein t ∈ K gibt mit A à t, und man nennt t eine obere Schranke von A . Unter allen oberen Schranken von A gibt es höchstens eine kleinste obere Schranke.Existiert sie, so wird sie Supremum von A genannt und mit sup A bezeichnet. Das Supremum von A ist also eine obere Schranke von A , die von keiner anderen oberen Schranke von A unterboten wird. Für jede obere Schranke t von A gilt also A à sup A à t. Ist andererseits s < sup A , so existiert wenigstens ein Punkt a ∈ A mit a > s , denn andernfalls wäre s ja eine kleinere obere Schranke als sup A . Analog werden die Begriffe nach unten beschränkt und untere Schranke von A definiert. Existiert eine größte untere Schranke, so wird sie Infimum von A genannt und mit inf A bezeichnet. Für jede untere Schranke s von A gilt dann s à inf A à A, und für jedes t > inf A existiert ein a ∈ A mit a < t . 1 11 43 1 reelle zahlen Es ist allerdings möglich, dass ein solches Supremum oder Infimum nicht existiert. So ist im angeordneten Körper Q die Menge A Í {r ∈ Q : r á 0 ∧ r 2 à 2} nach oben beschränkt, besitzt aber keine kleinste obere Schranke. Denn diese wäre eine Lösung der Gleichung x 2 = 2 , die es ja in Q nicht gibt. Die Existenz eines Supremums oder Infimums setzt vielmehr voraus, dass der angeordnete Körper auch vollständig ist. Tatsächlich sind beide Eigenschaften äquivalent, wie der folgende Satz zeigt. 1.14 Satz In einem angeordneten Körper K sind folgende Aussagen äquivalent. (i) Jeder dedekindsche Schnitt besitzt eine Schnittzahl. (ii) Jede nichtleere, nach oben beschränkte Menge besitzt ein Supremum. (iii) Jede nichtleere, nach unten beschränkte Menge besitzt ein Infimum. Ï Y Y Y Y Y Beweis (i) ⇒ (ii) Wir nehmen an, dass jeder dedekindsche Schnitt eine Schnittzahl besitzt. Zu zeigen ist, dass dann jede nach oben beschränkte, nichtleere Teilmenge von K ein Supremum besitzt. Sei also M eine solche Menge. Dann ist die Menge aller strikten oberen Schranken von M , B = {b ∈ K : M < b } , nicht leer, und es gilt M ∩ B = ∅ . Ferner ist auch die Menge A=KØB nicht leer, da M ⊂ A . Offensichtlich ist A ∩ B = ∅ und A ∪ B = K . Es gilt nun A < B. Denn andernfalls gäbe es ein a ∈ A und ein b ∈ B mit a á b . Da b eine obere Schranke von M ist, wäre auch a eine obere Schranke von M und damit Element von B , und nicht von A , ein Widerspruch. Also bilden A und B einen dedekindschen Schnitt, und nach Voraussetzung existiert eine Schnittzahl c : A à c à B. Wegen M ⊂ A ist c eine obere Schranke von M , und wegen c à B ist es die kleinste obere Schranke. Also ist c = sup M. Somit besitzt jede nach oben beschränkte Menge ein Supremum. 44 1 12 wurzeln 1-d (ii) ⇒ (i) Nun nehmen wir umgekehrt an, dass jede nichtleere, nach oben beschränkte Menge ein Supremum besitzt. Zu zeigen ist, dass jeder dedekindsche Schnitt eine Schnittzahl besitzt. Sei (A, B) ein dedekindscher Schnitt. Da B nicht leer ist, ist A nach oben beschränkt, und nach Annahme existiert c = sup A. Es gilt dann auch c à B , denn andernfalls gäbe es ein b ∈ B mit b < c , und b wäre eine kleinere obere Schranke von A als c . Also gilt A à c à B. Somit besitzt jeder dedekindsche Schnitt eine Schnittzahl. (i) a (iii) Diese Aussage ist symmetrisch zur Aussage (i) a (ii) und wird genauso bewiesen. Y Y Y Y Y Die Existenz von Schnittzahlen ist also äquivalent zur Existenz von Suprema beschränkter Mengen. Das Vollständigkeitsaxiom könnte also ebenso darin bestehen, dass jede nach oben beschränkte Teilmenge eines angeordneten Körpers ein Supremum besitzt. Wir haben die Charakterisierung durch Dedekindsche Schnitte gewählt, da diese konzeptionell einfacher sind. In Abschnitt 4-g werden wir noch eine weitere, wesentlich allgemeinere Charakterisierung der Vollständigkeit mithilfe von Cauchyfolgen kennenlernen, die nicht auf Anordnungsaxiomen basiert. 1-d wurzeln Wir zeigen jetzt, dass jede positive reelle Zahl tatsächlich eine Wurzel hat. Die reellen Zahlen leisten also das, was die rationalen Zahlen nicht leisten. 1.15 Satz und Definition Zu jeder reellen Zahl a > 0 existiert genau eine reelle Zahl p w > 0 mit w 2 = a . Diese wird mit a bezeichnet und Quadratwurzel oder kurz Wurzel von a genannt. Ï YYYYY Beweis Für positive reelle Zahlen u und v gilt u < v a u2 < v 2 (3) – siehe Aufgabe 6. Zwei verschiedene positive reelle Zahlen können daher nicht Wurzel derselben Zahl a > 0 sein. Dies zeigt die Eindeutigkeit der Wurzel. 1 13 45 1 reelle zahlen Um ihre Existenz zu zeigen, bemerken wir zunächst, dass für a > 0 p p a−1 = a −1 , denn die Quadrate beider Seiten sind gleich. Damit können wir den Fall 0 < a à 1 auf den Fall a á 1 zurückführen. Sei jetzt also a á 1 . Betrachte die Menge A = x ∈ R : x á 0 ∧ x2 à a . Diese Menge ist nicht leer, denn wegen 02 = 0 < 1 à a gilt 0 ∈ A . Sie ist auch beschränkt, denn A à a . Also existiert w = sup A . Bleibt zu zeigen, dass w 2 = a . Betrachte dazu die reelle Zahl v=w− w2 − a . w +a Eine kurze Rechnung ergibt v 2 = a + c(w 2 − a), c= a2 − a á 0. (w + a)2 Wäre w 2 > a , so folgt v < w sowie a à v 2 . Wegen (3) wäre v somit eine bessere obere Schranke von A als dessen Supremum w , ein Widerspruch. Wäre andererseits w 2 < a , so folgt w < v sowie v 2 à a . Somit wäre w keine obere Schranke von A , ebenfalls ein Widerspruch. Bleibt also nur die Möglichkeit w 2 = a . Damit ist auch die Existenz der Wurzel aus a gezeigt. Y Y Y Y Y Die Wurzelfunktion ist die Umkehrfunktion der Funktion t , t 2 auf dem Strahl {t : t á 0} . Ihren Graphen erhält man durch Vertauschen der Abszisse und Ordinate, siehe Abbildung 1-2. · 1-2 t2 Die Wurzelfunktion als Umkehrfunktion √ t der Parabel auf [0, ∞) 1 1 46 1 14 die erweiterte zahlengerade 1-e 1-e d i e e r w e i t e r t e zahlengerade Ist eine nichtleere Teilmenge A der reellen Zahlen nach oben beschränkt, so existiert deren Supremum sup A in R . Dafür schreibt man auch sup A < ∞. Andernfalls ist A nach oben unbeschränkt, und dafür schreibt man auch sup A = ∞. Analoges gilt für inf A > −∞ und inf A = −∞ . Auch in vielen anderen Situationen sind die Symbole ∞ und −∞ nützlich. Wir treffen daher folgende Vereinbarung. Definition Unter der erweiterten Zahlengerade versteht man die Menge R̄ Í R ∪ {−∞, ∞} zusammen mit der Vereinbarung −∞ < x < ∞ für alle x ∈ R . Ï Als Beispiel formulieren wir einen Satz über die Approximierbarkeit von sup A durch Punkte in A , der gleichermaßen für beschränkte und unbeschränkte Mengen gilt. Er gilt sogar für die leere Menge, wenn wir sup ∅ Í −∞, inf ∅ Í ∞ vereinbaren. 1.16 Approximationssatz Sei A ⊂ R . Dann existiert zu jeder reellen Zahl s < sup A ein a ∈ A mit a > s . Ebenso existiert zu jeder reellen Zahl t > inf A ein a ∈ A mit a < t . Ï Beweis Wir betrachten das Supremum. Für A = ∅ ist nichts zu zeigen, da es keine reelle Zahl kleiner als sup A = −∞ gibt. Sei also A ≠ ∅ und s < sup A . Gäbe es nun kein a ∈ A mit a > s , so wäre YYYYY A à s < sup A. Falls sup A < ∞ , so widerspricht dies der Eigenschaft von sup A , die kleinste obere Schranke von A zu sein. Falls aber sup A = ∞ , so widerspricht dies der Unbeschränktheit von A . In jedem Fall erhalten wir einen Widerspruch. Also gibt es ein a ∈ A mit a > s . Y Y Y Y Y 1 15 47 1 reelle zahlen 1-f intervalle Die wichtigsten Teilmengen der reellen Zahlen sind die Intervalle. Definition Ein Intervall ist eine Teilmenge der reellen Zahlen, die mit je zwei Punkten auch alle dazwischen liegenden Punkte enthält. Ï Die leere Menge ∅ ist ein Intervall, denn die Voraussetzung, zwei Punkte in ihr zu finden, ist schon nicht erfüllt. Ebenso ist jede 1-Punkt-Menge {a} ein Intervall. Ist ein Intervall I nicht leer, so definieren wir a = inf I, b = sup I als dessen linken respektive rechten Endpunkt. Diese Punkte gehören zur erweiterten Zahlengerade R̄ , die Fälle a = −∞, b=∞ sind also möglich. Ebenso kann a = b sein. Ist a < b , so folgt aus dem Approximationssatz 1.16 und der Definition des Intervalls, dass auch die Menge {x : a < x < b } 3 zu I gehört. Intervalle unterscheiden sich daher nur darin, welche Endpunkte dazu gehören und welche nicht. Definition Ein nichtleeres Intervall I heißt links abgeschlossen, falls es seinen linken Endpunkt enthält, andernfalls heißt es links offen. Entsprechend sind rechts abgeschlossen und rechts offen erklärt. Ï Es gibt somit vier Arten von Intervallen: das offene Intervall (a, b) Í {x : a < x < b } , −∞ à a à b à ∞, mit der Vereinbarung (a, a) = ∅ ; das abgeschlossene Intervall [a, b] Í {x : a à x à b } , −∞ < a à b < ∞, mit der Vereinbarung [a, a] = {a} ; und die halboffenen Intervalle (a, b] Í {x : a < x à b } , −∞ à a à b < ∞, [a, b) Í {x : a à x < b } , −∞ < a à b à ∞. Dabei sind a = −∞ und b = ∞ genau dann zugelassen, wenn das betreffende Intervallende offen ist. Daher sind alle diese Intervalle in R enthalten. 3 Im Folgenden schreiben wir einfach x statt x ∈ R . 48 1 16 eindeutigkeit · 1-3 1-g Verschiedene Intervalle (−∞, a) [b, c] a b (e, f ) {d} c d e f ¸ a. Das leere Intervall ∅ ist sowohl offen wie abgeschlossen. 4 b. Jede Ein-Punkt-Menge {a} ⊂ R ist ein abgeschlossenes Intervall. c. R = (−∞, ∞) ist ein offenes Intervall. d. R∗ = R Ø {0} ist kein Intervall. e. Jedes von (−∞, ∞) verschiedene unbeschränkte Intervall ist von einem der vier Formen (a, ∞) , [a, ∞) , (−∞, b) , (−∞, b] , a, b ∈ R. µ Die Länge eines nichtleeren Intervalls I ist definiert als |I| Í sup I − inf I. |I| nimmt den Wert ∞ genau dann an, wenn I unbeschränkt ist. ¸ a. Es ist |[a, a]| = 0 , |[a, b]| = |(a, b)| = b − a, a < b, und |(−∞, ∞)| = ∞ − (−∞) = ∞ + ∞ = ∞ . µ 1-g eindeutigkeit Wir haben erklärt, was es bedeutet, dass die reellen Zahlen einen vollständigen, angeordneten Körper bilden. Wir wollen jetzt noch kurz skizzieren, dass es im Wesentlichen nur einen solchen Körper gibt. Es ist durchaus möglich, ganz unterschiedliche Modelle der reellen Zahlen zu konstruieren – also Mengen mit zwei Operationen und einem Positivbereich, in denen sämtliche geforderten Axiome gelten. Diese verschiedenen Modelle sind jedoch alle von derselben Gestalt – man kann sie mitsamt ihren Strukturen eins-zu-eins aufeinander abbilden. Mathematisch gesagt sind sie isomorph. 4 Im Unterschied zur Umgangssprache schließen sich ›offen‹ und ›abgeschlossen‹ also nicht gegenseitig aus. 1 17 49 1 reelle zahlen Im Fall der reellen Zahlen bedeutet dies Folgendes. 1.17 Isomorphiesatz Sind (R, +, ·, P ) und (R0 , +0 , · 0 , P 0 ) zwei vollständige angeordnete Körper, so existiert eine bijektive Abbildung Φ : R → R0 derart, dass Φ(x + y) = Φ(x) +0 Φ(y), Φ(x ·y) = Φ(x) · 0 Φ(y) (4) und x < y a Φ(x) <0 Φ(y) für alle x, y ∈ R gilt. Ï Es spielt also zum Beispiel keine Rolle, ob ich zwei Operanden zuerst in R addiere und das Ergebnis mit Φ abbilde, oder ob ich zuerst die Operanden mit Φ abbilde und danach in R0 addiere. Y Y Y Y Y Beweisskizze Für jede Abbildung Φ mit den geforderten Eigenschaften gilt notwendigerweise Φ(0) = 00 und Φ(1) = 10 , denn beispielsweise ist wegen (4) Φ(x) = Φ(x + 0) = Φ(x) +0 Φ(0) für alle x ∈ R und damit Φ(0) = 00 . Es ist daher notwendigerweise Φ(0) Í 00 , Φ(1) Í 10 zu definieren. Soll nun (4) gelten, so ist Φ damit auch für alle natürlichen, ganzen und rationalen Zahlen festgelegt. Zum Beispiel ist Φ(2) = Φ(1 + 1) = Φ(1) +0 Φ(1) = 10 +0 10 . Mit Hilfe der Vollständigkeit dehnt man die Definition von Φ schließlich auf ganz R aus. Y Y Y Y Y Bemerkung Die angeordneten Körper R und Q sind nicht isomorph, denn es gibt keine Bijektion zwischen R und Q – siehe dazu Abschnitt 2-c. Ç 50 1 18 aufgaben 1 aufgaben 1 Welche Aussagen sind wahr? a. Die reellen Zahlen sind vollständig, weil es mehr reelle als rationale Zahlen gibt. b. In einer beschränkten Menge A ⊂ R existert ein Element a = inf A . c. Ein abgeschlossenes Intervall ist beschränkt. d. Aus ab = −ab folgt b = 0 . e. Es gibt kein leeres Intervall. f. In Q besitzt keine Teilmenge ein Supremum. g. R̄ ist ein vollständiger Körper. h. Jede Zerlegung von R besitzt eine Schnittzahl. 2 Sei K ein angeordneter Körper, und 2 Í 1 + 1 . Zeigen Sie: a. 0 < 1 < 2. b. Ist a < b , so ist a < (a + b)/2 < b . c. Jeder dedekindsche Schnitt in K hat höchstens eine Schnittzahl. 3 Warum hat in einem Körper die Null kein multiplikativ Inverses? 4 Zeigen Sie: Existieren in einem Körper K zwei Elemente a und b mit a2 + b2 = −1, so kann dieser Körper nicht angeordnet werden. 5 In einem Körper K mit Addition t und Multiplikation u sei die Null und die Eins. ¯ bezeichnet. Zeigen Sie, dass Das additiv Inverse zu einem Element werde mit ¯ u ¯ = . 6 Zeigen Sie für zwei positive Elemente a, b eines angeordneten Körpers: a < b a a2 < b2 . √ x 2 = |x| für alle x ∈ R . 7 Zeigen Sie, dass 8 Vervollständigen Sie den Beweis von Satz 1.10. 9 Es sei M ⊂ R nicht leer und inf M > 0 . Man zeige, dass die Menge Mi Í {1/x : x ∈ M } nach oben beschränkt ist, und dass sup Mi = 1/ inf M . 10 Seien A und B nichtleere beschränkte Teilmengen von R , und A + B Í {a + b : a ∈ A, b ∈ B } . Zeigen Sie, dass sup (A + B) = sup A + sup B . Gilt dies auch für die Multiplikation? 11 Ungleichung vom arithmetischen und geometrischen Mittel: Für a, b á 0 gilt 1 19 51 1 reelle zahlen p 12 ab à a+b . 2 Cauchyungleichung: Für reelle Zahlen a, b und ε > 0 gilt 2ab à εa2 + b2 /ε. 13 Für reelle Zahlen a, b ≠ 0 gilt a + b á 2. b a Für welche a, b gilt Gleichheit? 14 Beweisen Sie für reelle Zahlen a, b die Identitäten max {a, b } = a + b + |a − b| , 2 min {a, b } = a + b − |a − b| . 2 Was gilt für max {a, b } − min {a, b } ? 15 Sei I ⊂ R ein offenes Intervall. Welche Gestalt hat dann R Ø I ? Diskutieren Sie alle möglichen Fälle. 16 Sei A ⊂ R eine beliebige Teilmenge. Dann gilt für jedes s ∈ R mit inf A < s < sup A A ∩ (s, ∞) ≠ ∅, 17 A ∩ (−∞, s) ≠ ∅. Eine reelle, nicht rationale Zahl wird irrational genannt – was nicht mit unvernünftig zu übersetzen ist. Zeigen Sie: Sind a, b, c, d rational mit ad − bc ≠ 0 , und ist x irrational mit cx + d ≠ 0 , so ist auch ξÍ ax + b cx + d irrational. 18 Zeigen Sie, dass die Wurzelfunktion das Intervall [0, ∞) bijektiv auf sich selbst abbildet und streng monoton steigt: p p 0 à a < b ⇒ a < b. 19 Seien r rational und z irrational. Zeigen Sie, dass auch r + z und r z irrational sind. 20 Zeigen Sie, dass die Wurzel aus 12 nicht rational ist. 52 1 20 2 Natürliche , ganze und rationale Zahlen Die Existenz der reellen Zahlen setzen wir von nun an voraus. Jetzt geht es darum, unter diesen die natürlichen, ganzen, und rationalen Zahlen zu identifizieren. Die natürlichen Zahlen sind uns von frühester Kindheit durch das Zählen von Objekten vertraut: 1 Í 1, 2 Í 1 + 1, 3 Í 2 + 1 = 1 + 1 + 1, und so weiter. . . : von einer natürlichen Zahl gelangen wir zur nächsten, indem wir 1 addieren, ad infinitum. Auch wissen wir, dass 1 < 2 < 3 < ... , in Übereinstimmung mit den Anordnungsaxiomen. Dies gilt übrigens in jedem angeordneten Körper, den wir brauchen ja nur die Information, dass 0 < 1 . Daraus ergibt sich, dass jeder angeordnete Körper seine eigene Version der natürlichen Zahlen enthält. Die additiv Inversen zu den natürlichen Zahlen zuzüglich der Null ergeben den Ring der ganzen Zahlen. Die Brüche aus allen ganzen Zahlen ergeben dann den Körper der rationalen Zahlen. 2 1 53 2 natürliche, ganze und rationale zahlen 2-a n a t ü r l i c h e z a h len Um das ›und so weiter‹ der Konstruktion der natürlichen Zahlen mathematisch zu präzisieren, führen wir folgenden Begriff ein. Definition Eine Teilmenge N von R heißt induktiv, wenn gilt: (a) 1 ∈ N . (b) Ist a ∈ N , so ist auch a + 1 ∈ N . Ï Bemerkung Man kann auch 0 ∈ N statt 1 ∈ N fordern. Dies ist allein eine Frage der Konvention und mathematisch unerheblich. Ç ¸ a. Die Menge {m + n/3 : m, n ∈ N} ist induktiv. b. Die Mengen Z , Q und R sind induktiv. c. Die Menge P aller Primzahlen ist nicht induktiv. µ Der Durchschnitt zweier und sogar beliebig vieler induktiver Mengen ist wieder eine induktive Menge, denn in jeder dieser Mengen sind die Bedingungen (a) und (b) erfüllt. Die kleinste solche Menge erhält man, indem man die Schnittmenge aller induktiven Teilmengen der reellen Zahlen bildet. Dies charakterisiert die natürlichen Zahlen als Teilmenge der reellen Zahlen. Definition Die Menge N der natürlichen Zahlen ist der Durchschnitt aller induktiven Teilmengen von R . Ï Bezeichnet I die Familie aller induktiven Teilmengen von R , so schreibt man hierfür auch NÍ \ N. N∈I 2.1 Induktionssatz Ist N eine induktive Teilmenge von N , so ist N = N . Ï Nach Voraussetzung ist N ⊂ N . Es ist aber auch N ⊂ N , da N eine induktive Menge ist und N als Durchschnitt aller induktiven Teilmengen von R definiert ist. Also gilt N = N . Y Y Y Y Y YYYYY Vollständige Induktion Der Induktionssatz bildet die Grundlage der vollständigen Induktion, die ebenfalls zu den fundamentalen Beweistechniken der Mathematik zählt. Die einfachste und am häufigsten gebrauchte Form ist das folgende 54 2 2 06.09.2011–09:35 natürliche zahlen 2.2 Induktionsprinzip 2-a Sei A(n) eine Aussageform, für die gilt: (i) A(1) ist wahr. (ii) Ist A(n) wahr für ein n ∈ N , so ist auch A(n + 1) wahr. Dann ist A(n) für alle n ∈ N wahr. Ï Y Y Y Y Y Sei N Í {n ∈ N : A(n) ist wahr} . Dann ist 1 ∈ N wegen (i), und aus n ∈ N folgt n + 1 ∈ N wegen (ii). Also ist N eine induktive Teilmenge von N . Mit dem Induktionssatz ist somit N = N . Y Y Y Y Y Um eine Aussage A(n) für alle natürlichen Zahlen n mit Hilfe der vollständigen Induktion zu beweisen, ist also Folgendes zu tun. (a) Induktionsanfang: Zeige, dass A(1) wahr ist. (b) Induktionsschritt: Nehme an, dass A(n) für ein beliebiges n á 1 wahr ist. Folgere daraus, dass auch A(n + 1) wahr ist. Dann ist die Aussage A(n) für alle n ∈ N bewiesen. Das Induktionsprinzip bereitet erfahrungsgemäß anfangs Schwierigkeiten, hat es doch den Anschein, als würde man sich nach dem Münchhausenprinzip am eigenen Schopf aus dem Sumpf ziehen. Das trifft sogar zu, wenn man nur den Induktionsschritt betrachtet. Der Induktionsanfang stellt die gesamte Argumentation jedoch auf eine feste Basis. Er ist zwar oft trivial, aber trotzdem unentbehrlich. Zunächst zwei einfache Beispiele zur vollständigen Induktion. 2.3 Satz Für alle n á 1 gilt 1 + 2 + ··· + n = n(n + 1) . Ï 2 Y Y Y Y Y Induktionsanfang: Für n = 1 reduziert sich die Gleichung auf 1 = 1·2/2 , ist also richtig. Induktionsschluss: Für ein beliebiges n á 1 setzten wir jetzt voraus, dass die behauptete Gleichung gilt. Dann erhalten wir 1 + 2 + · · · + n + (n + 1) = (1 + 2 + · · · + n) + (n + 1) n(n + 1) +n+1 2 n2 + n + 2n + 2 = 2 (n + 1)(n + 2) = . 2 = Also gilt die behauptete Gleichung auch für n + 1 , und wir sind fertig. Y Y Y Y Y 06.09.2011–09:35 2 3 55 2 2.4 natürliche, ganze und rationale zahlen Bernoullische Ungleichung (1 + x)n á 1 + nx. Für alle reellen x á −1 und alle n ∈ N gilt Ï Induktionsanfang: Für n = 1 ist (1 + x)1 = 1 + x = 1 + 1·x . Induktionsschluss: Für ein beliebiges n á 1 setzen wir jetzt voraus, dass YYYYY (1 + x)n á 1 + nx, x á −1. Außerdem gilt für alle n ∈ N und x ∈ R die Unlgeichung nx 2 á 0 . Zusammen mit 1 + x á 0 – hier brauchen wir erst die Annahme x á −1 – erhalten wir dann (1 + x)n+1 = (1 + x)(1 + x)n á (1 + x)(1 + nx) = 1 + x + nx + nx 2 á 1 + x + nx = 1 + (n + 1)x, wobei die Induktionsannahme nach der ersten Zeile zur Anwendung kommt. Y Y Y Y Y Bemerkung Eine gerne gebrauchte Metapher für die vollständige Induktion ist das Erklimmen einer Leiter. Weiß man, wie man die erste Sprosse einer Leiter erklimmt, und wie man von einer beliebigen Sprosse zur nächsten gelangt, so kann man jede noch so hohe Leiter erklimmen. Ç Rechenregeln 2.5 Für alle n, m ∈ N gilt: Satz (i) (ii) (iii) (iv) (v) n á 1. n + m ∈ N sowie nm ∈ N . Es ist entweder n = 1 oder n − 1 ∈ N . Ist n > m , so ist n − m ∈ N . Ist n < m à n + 1 , so ist m = n + 1 . Ï (i) Die Menge {n ∈ N : n á 1} ist eine induktive Teilmenge von N . Aufgrund des Induktionssatzes 2.1 ist sie gleich N . (ii) Fixiere m ∈ N und betrachte die Aussage YYYYY A(n) : n + m ∈ N. Ia: Es gilt A(1) , da ja m ∈ N , also auch m + 1 ∈ N . Is: Gilt A(n) , so ist also n + m ∈ N . Dann ist auch (n + 1) + m = (n + m) + 1 ∈ N , es gilt also auch A(n + 1) . Somit gilt A(n) für alle n ∈ N . Da m ∈ N beliebig war, ist die Aussage für alle n und m in N bewiesen. Analog verfährt man mit dem Produkt nm . 56 2 4 natürliche zahlen (iii) 2-a Betrachte hierzu A(n) : (n = 1) ∨ (n − 1 ∈ N). Ia: A(1) ist sicher richtig. Is: Es gelte A(n) , also (n = 1) ∨ (n − 1 ∈ N) . Im ersten Fall ist dann (n + 1) − 1 = n = 1 ∈ N , und im zweiten Fall folgt ebenso (n + 1) − 1 = (n − 1) + 1 = n ∈ N . Also ist auch A(n + 1) richtig, und die Aussage ist bewiesen. (iv) Betrachte hierzu die Aussage A(n) : n − m ∈ N für alle m < n mit m ∈ N. Ia: A(1) ist richtig, denn wegen (i) gibt es kein m ∈ N , für dass die Behauptung geprüft werden müsste. Is: Es gelte A(n) . Zu zeigen ist dann, dass (n + 1) − m ∈ N für alle m < n + 1 mit m ∈ N. Für m = 1 ist dies klar. Ist dagegen m > 1 , so ist 1 à m − 1 < n wegen (iii), und nach Induktionsannahme ist dann auch n − (m − 1) ∈ N . Das ist aber äquivalent mit (n + 1) − m ∈ N . (v) Sei n < m à n + 1 . Dann ist m − n à 1 . Aus (iv) folgt aber m − n ∈ N und damit m − n á 1 wegen (i). Also ist m − n = 1 . Y Y Y Y Y Bemerkung Die letzte Aussage bedeutet, dass es zwischen n und n + 1 keine weitere natürliche Zahl gibt. Gilt also beispielsweise n < A für eine Menge A ⊂ N , so gilt auch n + 1 à A . Ç In manchen Fällen ist es notwendig, die Induktion nicht bei 1 , sondern später zu beginnen. So gilt zum Beispiel 2n á n2 nur für N 3 n ≠ 3 . 2.6 Variiertes Induktionsprinzip Sei A(n) eine Aussageform, für die gilt: (a) A(n0 ) ist richtig für ein n0 ∈ N . (b) Ist A(n) richtig für irgendein n á n0 , so ist auch A(n + 1) richtig. Dann ist A(n) für alle natürlichen Zahlen n á n0 richtig. Ï Y Y Y Y Y Man setzt N Í {n ∈ N : A(n + n0 − 1) ist wahr} und zeigt wie beim Induktionsprinzip 2.2 , dass N eine induktive Teilmenge von N ist. Also ist N = N , und das entspricht der Behauptung, Y Y Y Y Y 2 5 57 2 natürliche, ganze und rationale zahlen Minimum und Maximum 2.7 Satz vom Minimum Jede nichtleere Teilmenge A ⊂ N besitzt ein minimales Element. Das heißt, es existiert ein m ∈ A mit m à A . Ï Wegen 1 à N ist A nach unten beschränkt. Da A nicht leer ist, existiert somit die reelle Zahl YYYYY m = inf A. Zu zeigen ist, dass m ein Element von A ist. Aufgrund des Approximationssatzes 1.16 existiert zu m + 1 ein a ∈ A , das m unterbietet, so dass m à a < m + 1. Wir wollen zeigen, dass m = a gilt. Angenommen, es gilt statt dessen m < a < m + 1. Dann folgt mit dem Approximationssatz die Existenz eines weiteren b ∈ A mit m à b < a < m + 1. Dann aber wäre b − a eine natürliche Zahl kleiner als 1 , was unmöglich ist. Also muss m = a gelten, und a ist das gesuchte minimale Element. Y Y Y Y Y 2.8 Korollar Es gibt keine uninteressanten natürlichen Zahlen. Ï Angenommen, die Menge U = {n ∈ N : n ist uninteressant} ist nicht leer. Dann besitzt U ein minimales Element m , die kleinste uninteressante natürliche Zahl. Das ist natürlich eine interessante Zahl – Widerspruch. Y Y Y Y Y YYYYY 2.9 Satz vom Maximum Jede nichtleere, beschränkte Teilmenge A ⊂ N besitzt ein maximales Element. Das heißt, es existiert ein m ∈ A mit A à m . Ï YYYYY Nach Voraussetzung ist die Menge B = {b ∈ N : A à b } nicht leer. Nach dem Satz vom Minimum besitzt B somit ein minimales Element m . Zu zeigen ist, dass m ∈ A . Angenommen, es ist m ∉ A . Dann ist A < m und damit auch A à m − 1 . Da A nicht leer sein soll, ist m > 1 und damit auch m − 1 eine natürliche Zahl. Also ist auch m − 1 ∈ B , und m war doch nicht das minimale Element von B – ein Widerspruch. Y Y Y Y Y 58 2 6 natürliche zahlen 2-a Das Prinzip des Archimedes Alles bisher Gesagte gilt in jedem angeordneten Körper, denn bisher haben wir in diesem Abschnitt das Vollständigkeitsaxiom nicht benötigt. Somit ist in jedem angeordneten Körper die Menge N der natürlichen Zahlen wohldefiniert, und es gilt beispielsweise der Satz vom Maximum. Da die Folge 1 < 2 < 3 < . . . ›immer weiter wächst‹, ist die Menge N der natürlichen Zahlen in R offensichtlich unbeschränkt. Doch auch diese scheinbar triviale Tatsache erfordert einen Beweis. 2.10 Prinzip des Archimedes Die Menge der natürlichen Zahlen ist in den reellen Zahlen nach oben unbeschränkt. Ï Y Y Y Y Y Falls doch, so existiert b = sup N in R . Wegen b − 1 < b existiert aufgrund des Approximationssatzes 1.16 ein n ∈ N mit b − 1 < n à b. Aber dann ist b < n + 1 ∈ N , und somit b doch keine obere Schranke von N – ein Widerspruch. Y Y Y Y Y Aus dem Prinzip des Archimedes ergeben sich zwei einfache Folgerungen, die fundamental für den weiteren Aufbau der Analysis sind. 2.11 Korollar 1 0< Zu jeder reellen Zahl ε > 0 existiert ein n ∈ N mit 1 < ε. n Ï Y Y Y Y Y Aufgrund des Prinzips des Archimedes gibt es ein n ∈ N mit n > 1/ε . Für dieses n gilt dann die Behauptung. Y Y Y Y Y 2.12 Korollar 2 Zu je zwei positiven reellen Zahlen x und h existiert genau eine natürliche Zahl n , so dass (n − 1)h à x < nh. YYYYY Ï Die Menge {m ∈ N : x/h < m} ist wegen des archimedischen Prinzips nicht leer und nach unten beschränkt. Nach dem Satz vom Minimum besitzt sie ein minimales Element n , für das n − 1 à x/h < n gelten muss. Wegen h > 0 ist dies äquivalent zur Behauptung. Die Eindeutigkeit von n folgt aus der Eindeutigkeit des Infimums einer Menge. Y Y Y Y Y 2 7 59 2 natürliche, ganze und rationale zahlen Der Beweis des archimedischen Prinzips stützt sich auf die Existenz eines Supremums, also letztlich auf die Vollständigkeit der reellen Zahlen. Man könnte meinen, dass dies nur der Bequemlichkeit geschuldet ist, denn Vollständigkeit von R und Unbeschränktheit von N haben auf den ersten Blick wenig miteinander zu tun. Dem ist aber nicht so, wie das folgende Beispiel zeigt. ¸ Im Körper M der rationalen Funktionen mit rationalen Koeffizienten aus Beispiel 1.2 bilden die konstanten Funktionen n/1 die natürlichen Zahlen, und für diese gilt n x < , 1 1 n ∈ N. Somit ist N in M beschränkt. µ Das archimedische Prinzip ist somit unabhängig von den Anordnungsaxiomen und nicht aus diesen ableitbar. Daher ist folgende Definition sinnvoll. Definition Ein angeordneter Körper heißt archimedisch angeordnet, wenn N in ihm unbeschränkt ist. Ï ¸ Q und R sind archimedisch angeordnete Körper, M jedoch nicht. µ Rekursion Auf dem Prinzip der vollständigen Induktion beruht auch das Prinzip der rekursiven Definition. Zunächst einige Beispiele. Die Fakultät n! einer natürlichen Zahl n ist rekursiv definiert durch 1! Í 1, n! Í n·(n − 1)! , n á 2. Der Wert von n! wird also für n > 1 durch den Wert von (n − 1)! erklärt. Nach endlich vielen Schritte ist n! auf 1! zurückgeführt: 2! = 2·1! = 2·1, 3! = 3·2! = 3·2·1, .. . n! = n·(n − 1)· . . . ·2·1. Außerdem definiert man noch 0! Í 1 . Die Fakultät spielt eine wichtige Rolle bei vielen kombinatorischen Problemen. Zum Beispiel gibt es genau n! verschiedene Bijektionen der Menge An = {1, . . . , n} auf sich selbst. Mit anderen Worten, es gibt genau n! verschiedene Anordnungen, oder Permutationen, von n verschiedenen Objekten. 60 2 8 natürliche zahlen 2-a Die Potenzen an eines Elementes a eines Körpers sind rekursiv erklärt durch an Í a·an−1 , a1 Í a, n á 2. Mit Induktion beweist man die üblichen Potenzgesetze: an am = an+m , (an )m = anm . Die allgemeine Summe von n Elementen a1 , . . . , an schreibt man als n X ak = a1 + a2 + · · · + an . k=1 Deren rekursive Definition ist 1 X n X ak Í a1 , k=1 ak Í k=1 n−1 X ak + an , n á 2. k=1 Entsprechend erklärt man das allgemeine Produkt n Y ak = a1 a2 · · · an . k=1 ¸ Beispiel n! = Die Definitionen der Fakultät und der Potenz sind äquivalent zu n Y k, an = k=1 2.13 n Y a. Allgemeines Kommutativgesetz ration, so ist die Summe n X µ k=1 Ist + eine assoziative und kommutative Ope- ak = a1 + · · · + an k=1 unabhängig von der Reihenfolge der Summanden. Entsprechendes gilt für Produkte. Ï YYYYY Wir übergehen den Beweis, siehe zum Beispiel [Blatter, Analysis 1]. Y Y Y Y Y Als Summationsindex kann man jedes Symbol verwenden: n X k=1 ak = n X i=1 ai = n X aν . ν=1 Der Summationsindex muss auch nicht bei 1 starten. Zum Beispiel erklärt man q 0 X X für q < p, ak Í ak Í a + ··· + a für q á p. p q k=p pàkàq Entsprechendes gilt für Produkte. 2 9 61 2 2.14 natürliche, ganze und rationale zahlen In einem Körper gilt: Satz (i) (ii) (iii) n X k=1 n X k=1 n X ak + n X k=1 abk = a n X bk = (ak + bk ) . k=1 n X bk . k=1 m X ak · k=1 bl = l=1 X a k bl . Ï 1àkàn 1àlàm In der letzten Gleichung erstreckt sich die Doppelsumme über alle möglichen Kombinationen der Indizes k und l mit 1 à k à n und 1 à l à m . Sie umfasst somit n·m Summanden. Wegen des allgemeinen Kommutativgesetzes kommt es auf deren Reihenfolge nicht an und muss nicht näher spezifiziert werden. Wir zeigen nur (iii) mit Induktion über n . Für n = 1 ist die Aussage gleichbedeutend mit (ii). Ist die Gleichung richtig für ein n á 1 und alle m á 1 , so folgt X X n+1 m n m X X ak · bl = ak + an+1 · bl YYYYY k=1 l=1 k=1 = n X ak · k=1 = l=1 m X X l=1 X m X bl l=1 X ak bl + 1àkàn 1àlàm = bl + an+1 ak bl k=n+1 1àlàm ak bl . 1àkàn+1 1àlàm Also gilt sie auch für n + 1 und alle m á 1 . Y Y Y Y Y Entsprechend werden andere Sätze verallgemeinert. Beispielsweise lautet die allgemeine Dreiecksungleichung X n X n ak |ak | . à k=1 k=1 Mit diesen Rechenregeln lassen sich viele Summen und Produkte ohne expliziten Rückgriff auf die vollständige Induktion bestimmen. Als Beispiel betrachten wir die 2.15 Geometrische Summe Für jedes reelle q und alle n á 1 gilt (1 − q)(1 + q + · · · + qn ) = 1 − qn+1 . 62 2 10 Ï natürliche zahlen YYYYY 2-a Es ist (1 − q) n X n X qk = k=0 qk − k=0 n X qk+1 = 1 + k=0 n X qk − k=1 n−1 X qk+1 − qn+1 . k=0 Schreiben wir l = k + 1 , so wird n−1 X qk+1 = k=0 n X ql = l=1 n X qk . k=1 Die beiden mittleren Terme heben sich somit auf, und die Behauptung folgt. Y Y Y Y Y Für q ≠ 1 ergibt dies die vertraute Formel für die geometrische Summe, 1 + q + · · · + qn = 1 − qn+1 . 1−q Diese gilt übrigens auch für n = 0 . Eine allgemeinere Version dieser Gleichung findet sich in Aufgabe 2. Allgemeine Rekursion Das Rekursionsprinzip mag auf den ersten Blick einleuchten, so wie auch das Induktionsprinzip. Dennoch bedarf es eines Beweises, dass durch rekursive Definitionen tatsächlich Folgen in eindeutiger Weise definiert werden. Dies leistet der folgende Satz. 2.16 Satz Sei X eine beliebige Menge, und für jedes n ∈ N sei eine Abbildung φn : X n → X gegeben. Dann existiert zu jedem a ∈ X eine Folge (fn )ná1 in X mit f1 = a, fn = φn−1 (f1 , . . . , fn−1 ), n > 1. Ï Das bedeutet, dass mit dem Startwert f1 Í a sukzessive f2 Í φ1 (f1 ), f3 Í φ2 (f1 , f2 ), .. . fn Í φn−1 (f1 , . . . , fn−1 ) eindeutig erklärt sind. Die Abbildung φn−1 definiert den Folgenwert fn als Funktion der ersten n − 1 Folgenwerte f1 , . . . , fn−1 . In unseren Beispielen sind alle diese Funktionen gleich und hängen von nur einem Argument ab. 2 11 63 2 natürliche, ganze und rationale zahlen Der Beweis dieses Satzes erfolgt – natürlich – durch vollständige Induktion und ist zum Beispiel in [ae, S. 43] ausgeführt. ¸ Die Fibonacchifolge (fn )ná1 = (1, 1, 2, 3, 5, 8, 13, 21, . . . ) ist rekursiv erklärt durch f1 = 1, f2 = 1, fn = fn−1 + fn−2 , n á 3. Die Rekursionsvorschriften sind φ1 (f1 ) = f1 , φn−1 (f1 , . . . , fn−1 ) = fn−1 + fn−2 , n á 3, und die Fibonacchifolge resultiert aus dem Startwert 1 . µ 2-b g a n z e u n d r a t i onale zahlen Definition und Satz Die Menge Z Í {m − n : n, m ∈ N} heißt Menge der ganzen Zahlen. Es gilt Z = {−n : n ∈ N} ∪ {0} ∪ N Î {. . . , −2, −1, 0, 1, 2, . . .} . Ï Y Y Y Y Y Sei für den Moment Z = {. . . , −2, −1, 0, 1, 2, . . .} . Dann gilt Z ⊂ Z , denn jedes Element von Z kann als Differenz zweier natürlicher Zahlen geschrieben werden. Um auch Z ⊂ Z zu zeigen, sei m − n ∈ Z . Ist m = n , so ist m − n = 0 ∈ Z . Ist m > n , so ist m − n ∈ N ⊂ Z . Ist aber m < n , so ist mit demselben Argument −(m − n) ∈ N und damit m − n ebenfalls Element von Z . Da damit alle Möglichkeiten erfasst sind, gilt auch Z ⊂ Z . Y Y Y Y Y 2.17 Satz In der Menge Z gelten alle Axiome eines angeordneten Körpers mit Ausnahme der Existenz eines multiplikativen Inversen. Insbesondere ist die Gleichung n + x = m in Z immer eindeutig lösbar, und zwar mit x = m − n . Ï Man sagt, die ganzen Zahlen bilden einen Ring mit Eins. Der Beweis dieses Satzes ist Routine. 64 2 12 ganze und rationale zahlen · 2-1 2-b [t] Graph der Gaußklammer 1 1 t Die Sätze vom Minimum und Maximum gelten in Z in folgender Form. Sie werden auf die entsprechenden Sätze für natürliche Zahlen zurückgeführt. 2.18 Satz Jede nach oben beschränkte Menge ganzer Zahlen besitzt ein Maximum, jede nach unten beschränkte Menge ganzer Zahlen besitzt ein Minimum. Ï ¸ a. Die Funktion [·] : R → Z, x , [x] Í max {n ∈ Z : n à x } wird als Gaußklammer bezeichnet. Zum Beispiel ist [π ] = 3 und [−π ] = −4 . µ Definition und Satz Die Menge Q Í {m/n : m ∈ Z, n ∈ N} heißt Menge der rationalen Zahlen. Zusammen mit dem Positivbereich P = {m/n : m, n ∈ N} bildet Q einen angeordneten Körper. Insbesondere ist die Gleichung nx = m mit n ≠ 0 in Q immer eindeutig lösbar, und zwar mit x = m/n . Ï Auch der Beweis dieses Satzes ist Routine. Die Darstellung einer rationalen Zahl als Quotient ganzer Zahlen ist nicht eindeutig, vielmehr gilt p/q = m/n a np = mq. Die Anordnung der rationalen Zahlen lässt sich auf die Anordnung der ganzen Zahlen zurückführen, indem man p/q < r /s :a ps < qr erklärt. Man überlege sich, dass dies nicht von der Darstellung der rationalen Zahlen abhängt. 2 13 65 2 natürliche, ganze und rationale zahlen Der folgende Satz drückt aus, dass die rationalen Zahlen dicht in R liegen. 2.19 Satz Zu zwei beliebigen reellen Zahlen a < b existiert immer eine rationale Zahl r mit a < r < b . Ï YYYYY Es ist b − a > 0 . Dazu existiert 2.11 ein n ∈ N mit 0 < 1/n < b − a. Also ist bn − an > 1 , und es gibt eine ganze Zahl m mit an < m < bn . Damit gilt dann a < m/n < b, und die rationale Zahl r = m/n hat die gewünschte Eigenschaft. Y Y Y Y Y 2-c a b z ä h l b a r k e i t und mächtigkeit Gibt es mehr rationale Zahlen als natürliche Zahlen? Gibt es mehr reelle Zahlen als rationale Zahlen? Und gibt es Mengen, die ›noch größer‹ sind als die Menge der reellen Zahlen? Um diese Fragen zu beantworten, definieren wir zuerst, wann wir zwei Mengen als ›gleich groß‹ ansehen wollen. Definition Zwei Mengen A und B heißen gleichmächtig, geschrieben A ∼ B , wenn sie bijektiv aufeinander abgebildet werden können. Ï Dies entspricht der intuitiven Vorstellung. Können wir die Elemente zweier Mengen paarweise zuordnen, ohne dass am Ende ein Element übrig bleibt, so betrachten wir diese Mengen als gleich groß. Dazu müssen wir die Mengen nicht einmal abzählen oder auf andere Weise ihre Größe quantifizieren. Offensichtlich definiert ∼ eine Äquivalenzrelation, deren Klassen aus gleichmächtigen Mengen bestehen. ¸ a. Die Mengen {H, i, l, f, e} und { , , , , } sind gleichmächtig. b. Die Mengen N und 2N = {2n : n ∈ N} sind gleichmächtig, eine Bijektion ist zum Beispiel n , 2n . c. Ebenso sind N und Z gleichmächtig, eine Bijektion ist beispielsweise n/2, n gerade, N → Z, n , (1 − n)/2, n ungerade. Diese nummeriert Z als Folge 0, 1, −1, 2, −2, 3, −3, . . . durch. µ 66 2 14 abzählbarkeit und mächtigkeit 2-c Als Standardmengen für endliche Mengen definieren wir A0 Í ∅, An Í An−1 ∪ {n} = {1, . . . , n} , n á 1. Die Mengen An sind tatsächlich nicht gleichmächtig und von N verschieden, wie die beiden folgenden Sätze zeigen. 2.20 Es gilt Am ∼ An genau dann, wenn m = n . Ï Satz Y Y Y Y Y Ist m = n , so sind die beiden Mengen gleich, also erst recht gleichmächtig. Sei also umgekehrt Am ∼ An , wobei wir noch 1 à m à n annehmen können. Wir argumentieren induktiv bezüglich n . Für n = 1 ist m = n , und die Behauptung ist richtig. Ist n > 1 , so existiert nach Annahme zwischen beiden Mengen eine Bijektion, die wir noch so einrichten können, dass n , m . Die Einschränkung dieser Bijektion auf Am−1 ist dann auch eine Bijektion zwischen Am−1 und An−1 , es ist also Am−1 ∼ An−1 . Nach Induktionsannahme folgt hieraus m − 1 = n − 1 . Also ist m = n , und wir sind fertig. Y Y Y Y Y 2.21 Es ist An N für alle n ∈ N . Ï Satz Der Beweis ist ähnlich zum vorangehenden Beweis und als Übungsaufgabe überlassen. Y Y Y Y Y YYYYY Definition (i) (ii) (iii) (iv) Eine nichtleere Menge M heißt endlich, falls M ∼ An für ein n ∈ N , abzählbar unendlich, falls M ∼ N , abzählbar, wenn sie endlich oder abzählbar unendlich ist, überabzählbar, wenn sie nicht abzählbar ist. Ï Wegen des vorangehenden Satzes ist eine Menge nicht gleichzeitig endlich und abzählbar unendlich. Die Definition ist also sinnvoll. Eine Bijektion φ : N → M zwischen N und einer abzählbar unendlichen Menge M können wir als ›Durchnummerierung‹ aller Elemente von M auffassen. Sie erlaubt es, alle Elemente in Form einer Folge m1 , m2 , m3 , . . . mit mn = φ(n) hinzuschreiben, so dass M = {mn : n á 1} . Obendrein tritt jedes Folgenglied genau einmal auf. Definition Die Anzahl oder Kardinalität einer Menge ist |M| Í n falls M ∼ An , ∞ sonst. Ï 2 15 67 2 natürliche, ganze und rationale zahlen Andere gebräuchliche Bezeichnungen sind card M und Anz(M) . Die so definierte Anzahlfunktion macht keinen Unterschied zwischen ›abzählbar unendlich‹ und ›überabzählbar‹. Abzählbare Mengen Zunächst einige Beobachtungen zu abzählbaren Mengen. Dass Teilmengen abzählbarer Mengen wieder abzählbar sind, ist nicht überraschend. Zuerst betrachten wir die Menge N selbst. 2.22 Satz Jede Teilmenge von N ist entweder endlich oder abzählbar unendlich. Ï Y Y Y Y Y Man zeigt durch Induktion über die Schranke, dass jede beschränkte Teilmenge A von N endlich ist. Ist also A nicht endlich, so ist A unbeschränkt. Wir können dann eine Abbildung φ: N → A induktiv definieren durch φ(1) Í min A, φ(n) Í min {m ∈ A : m > φ(n − 1)} , n á 2. Aus dieser Definition folgt φ(1) < φ(2) < · · · und allgemein φ(n) < φ(m), n < m. Die Funktion φ ist somit streng monoton steigend und damit injektiv. Bleibt zu zeigen, dass φ surjektiv auf A ist. Zu beliebigen q ∈ A sollte p Í min {n : φ(n) á q } der richtige Kandidat sein. In der Tat folgt unmittelbar aus dieser Definition q à φ(p). Für p > 1 gilt außerdem φ(p − 1) < q , denn φ(p − 1) á q widerspräche der Definition von p . Zusammen mit der Definition von φ erhalten wir damit φ(p) = min {m ∈ A : m > φ(p − 1)} à q. Also ist φ(p) = q . Y Y Y Y Y Da jede abzählbare Menge bijektiv auf N oder eine der Mengen An abgebildet werden kann, folgt aus diesem Satz das entsprechende Result für beliebige abzählbare Mengen. 68 2 16 abzählbarkeit und mächtigkeit 2.23 Korollar 2-c Jede Teilmenge einer abzählbaren Menge ist abzählbar. Ï Abzählbarkeit ›vererbt‹ sich also auf Teilmengen – was nicht weiter überrascht. Interessanter ist da schon die Frage, ob zum Beispiel ›abzählbar × abzählbar = abzählbar‹ gilt. Das ist in der Tat richtig. 2.24 Satz YYYYY Die Menge N × N ist abzählbar. Ï Wir ordnen die Elemente von N × N in folgendem Matrixschema an: (1, 1) (1, 2) (1, 3) (2, 1) (2, 2) (2, 3) (3, 1) (3, 2) (3, 3) .. .. .. . . . ··· ··· ··· .. . Dieses nummerieren wir durch, indem wir sukzessive die Diagonalen durchnummerieren, deren Elemente (n, m) die gleiche ›Quersumme‹ n + m haben. Die ersten Glieder dieser Folge sind (1, 1), (2, 1), (1, 2), (3, 1), (2, 2), (1, 3), . . . . Dies liefert eine Bijektion N → N × N . Y Y Y Y Y 2.25 Korollar Das kartesische Produkt zweier, und allgemeiner endlich vieler abzählbarer Mengen ist abzählbar. Ï Y Y Y Y Y Wir betrachten nur den Fall zweier abzählbar unendlicher Mengen. Es sei also A ∼ N und B ∼ N . Dann aber ist A × B ∼ N × N , und die Behauptung folgt mit N × N ∼ N aus dem vorangehenden Satz. Das kartesische Produkt von mehr als zwei, aber endlich vielen abzählbaren Mengen behandelt man mit Induktion über die Anzahl der Faktoren. Y Y Y Y Y Bemerkung Das kartesische Produkt abzählbar vieler abzählbarer Mengen ist dagegen nicht mehr abzählbar. Ç 2.26 Satz Die Menge Q der rationalen Zahlen ist abzählbar. Ï Y Y Y Y Y Wählen wir für jede rationale Zahl auf irgendeine Weise eine eindeutige Darstellung r = m/n mit m ∈ Z und n ∈ N . so erhalten wir eine Bijektion zwischen Q und einer Teilmenge von Z × N . Da diese Teilmenge abzählbar ist, ist auch Q abzählbar. Y Y Y Y Y 2 17 69 2 natürliche, ganze und rationale zahlen Überabzählbare Mengen Wir wollen zunächst die Frage klären, ob es überhaupt überabzählbare Mengen gibt. Der nächste Satz führt zu einer positiven Antwort. 2.27 Es gibt keine Surjektion einer beliebigen Menge X auf P(X) . Ï Satz Y Y Y Y Y Für X = ∅ ist P(X) = {∅} . Da die Bildmenge einer auf der leeren Menge definierten Abbildung ebenfalls leer ist und somit ∅ nicht zu derem Bild gehören kann, ist die Behauptung in diesem Fall richtig. Sei jetzt X ≠ ∅ , und φ : X → P(X) eine beliebige Abbildung. Um zu zeigen, dass φ nicht surjektiv sein kann, betrachten wir die Teilmenge A Í {x ∈ X : x ∉ φ(x)} ∈ P(X). Angenommen, es git ein ξ ∈ X mit φ(ξ) = A . Wäre ξ ∈ A , so bedeutete dies ξ ∉ φ(ξ) = A . Wäre aber ξ ∉ A , so implizierte dies ξ ∈ φ(ξ) = A . Das klappt also hinten und vorne nicht, und so gibt es kein ξ ∈ X mit φ(ξ) = A . Y Y Y Y Y Da man X immer bijektiv auf eine Teilmenge von P(X) abbilden kann – man nehme beispielsweise die Abbildung X → P(X) mit x , {x } – ist somit P(X) immer mächtiger als X . Somit ist P(N) mächtiger als N und damit überabzählbar. Es ist sogar jede der Mengen N, P(N), P(P(N)), P(P(P(N))), ... mächtiger als die vorangehende, ad infinitum . . . . Aber was gilt für die reellen Zahlen? 2.28 Die Menge R der reellen Zahlen ist überabzählbar. Ï Satz YYYYY Angenommen, R ist abzählbar. Dann gibt es eine Nummerierung 1 x0 , x1 , x2 , x3 , . . . aller reellen Zahlen. Mithilfe einer fallenden Folge von Intervallen In = [an , bn ] , n á 0, konstruieren wir eine weitere reelle Zahl ξ , die nicht in dieser Nummerierung vorkommt. Wir definieren diese Intervallfolge induktiv. Als I0 wählen wir ein beliebiges Intervall der Länge 1 , das nicht den Punkt x0 enthält: I0 Í [a0 , b0 ] x0 . 1 Wir fangen zur Abwechslung bei 0 an. 70 2 18 abzählbarkeit und mächtigkeit · 2-2 2-c Konstruktion der Intervalle In In−1 an−1 xn In an bn = bn−1 Ist nun In−1 für n > 0 bereits konstruiert, so wählen wir In als linkes oder rechtes abgeschlossenes Drittel von In−1 so, dass In Í [an , bn ] xn . Das ist sicher möglich, da xn nicht in beiden Dritteln gleichzeitig enthalten sein kann – wenn xn überhaupt zu In gehört. Offensichtlich ist In ⊂ In−1 . Für die Randpunkte der so definierten Intervalle gilt dann für jedes n á 0 a0 à a1 à a2 à · · · à an < bn à · · · à b2 à b1 à b0 . Also gilt auch A Í {an : n á 0} < B Í {bn : n á 0} . Insbesondere ist A nach oben beschränkt, und es existiert ξ = sup A wegen der Vollständigkeit von R . Es gilt dann A à ξ à B, denn alle Elemente von B sind obere Schranken von A , und ξ ist die kleinste obere Schranke. Dann aber gilt ξ ∈ In für alle n á 0 , und damit ξ ≠ xn für alle n á 0 aufgrund der Konstruktion der In . Das ist ein Widerspruch. Y Y Y Y Y Bemerkung Die Intervalle In bilden eine sogenannte Intervallschachtelung, siehe Aufgabe 21. Ç 2 19 71 2 natürliche, ganze und rationale zahlen aufgaben 1 Welche Aussagen sind wahr? a. Zu jedem ε > 0 existiert ein n á 1 mit 1/n < εn . b. Die Menge der rationalen Zahlen ist mächtiger als die der natürlichen Zahlen. c. Die Menge R ist keine induktive Menge. d. Die Menge aller abzählbaren Teilmengen von Q ist abzählbar. 2 Seien a, b reelle Zahlen. Zeigen Sie für alle n ∈ N die Identität an+1 − bn+1 = (a − b)(an + an−1 b + · · · + abn−1 + bn ). 3 Zeigen Sie, dass die Potenzmenge einer n-elementigen Menge genau 2n Elemente hat. 4 Zeigen Sie, dass es genau n! verschiedene Bijektionen π : An → An gibt. 5 Für jedes n ∈ N ist 1 + 22 + 22 6 Für welche n á 1 gilt 2n > n2 + n ? Mit Beweis! 7 Für die Abbildung ϕ : N → N gelte ϕ(n + 1) > ϕ(n) für alle n á 1 . Dann gilt n n+1 durch 7 teilbar ist. ϕ(n) á n für alle n á 1 . 8 Sei 0 < xk < 1 für 1 à k à n . Dann gilt X X n n n n Y X a. xk xk−1 á n2 b. (1 + xk ) á 1 + xk k=1 9 k=1 k=1 c. n X (1 − xk ) á 1 − k=1 n X xk . k=1 k=1 k3 = (1 + · · · + n)2 k=1 d. n X (2k − 1) = n2 . k=1 Beweisen Sie die folgenden Ungleichungen. a. 11 k=1 n Y Beweisen Sie die folgenden Identitäten. n n X X a. k = n(n + 1)/2 b. k2 = n(n + 1)(2n + 1)/6 k=1 10 c. n p X 1 √ á n k k=1 b. (2n)! 4n á 2 (n! ) n+1 c. n−1 X k=1 k3 < n X n4 k3 . < 4 k=1 a. Für jedes n á 1 ist keine der n aufeinanderfolgenden Zahlen (n + 1)! + k mit k = 2, . . . , n + 1 prim. b. Sind p1 , . . . , pn Primzahlen, so ist auch p = p1 · · · pn + 1 prim. 12 Zeigen Sie, dass jede nach unten beschränkte Teilmenge von Z ein minimales Element besitzt. 13 72 Beweisen Sie An N für alle n á 1 . 2 20 aufgaben 14 2 Beschreiben Sie die im Beweis von Satz 2.24 beschriebene Bijektion explizit als Abbildung φ : N × N → N, (m, n) , k = φ(m, n). Geben Sie auch die Umkehrabbildung an. 15 Ist die Menge aller endlichen Teilmengen von N abzählbar? Mit Beweis! 16 Kann man nur bis 3 zählen, so ist {a, b, c, d} überabzählbar. 17 Schubfachprinzip: Eine Abbildung ϕ : Am → An mit m > n kann nicht injektiv sein. – Man kann also nicht n + 1 Objekte auf n Schubladen verteilen, ohne dass wenigstens eine Schublade zwei Objekte enthält. 18 Sei π : An → An eine Bijektion. Ist n ungerade, so ist Qn k=1 (πk − k) gerade. Hinweis: Schubfachprinzip. 19 Eine nichtleere Menge X ist genau dann abzählbar, wenn es eine Surjektion von N auf X gibt. 20 21 Zeigen Sie, dass in jedem Intervall positiver Länge unendlich viele rationale Zahlen liegen. Eine Folge (In )ná1 nichtleerer abgeschlossener Intervalle heißt Intervallschachtelung, wenn In+1 ⊂ In für alle n á 1 , und wenn zu jedem ε > 0 ein In mit |In | < ε existiert. Zeigen Sie: a. Zu jeder Intervallschachtelung (In )ná1 existiert genau ein x ∈ R , so dass \ In = {x } . ná1 b. Zu jedem x ∈ R gibt es eine solche Intervallschachtelung mit rationalen Endpunkten. 22 Einem französischem Mathematiker ist es endlich gelungen, die erste These der Juli-Revolution – ›Alle Menschen sind gleich‹ – mathematisch zu beweisen: Ist M eine Menge mit endlich vielen Elementen, so ist a Ð b für alle a, b ∈ M , wobei ‘ Ð ’ für die politische Gleichheit steht. Beweis durch Induktion: Induktionsanfang: Hat M genau ein Element, so ist die Aussage wohl richtig, denn jeder ist sich selbst gleich. Induktionsschluss: Die Aussage sei richtig für alle Mengen mit n Elementen, und es sei M eine Menge mit n + 1 Elementen. Ist b irgendein Element in M und N = M Ø {b } , so sind alle Elemente von N nach Induktionsannahme ›Ð‹. Bleibt noch b Ð c für ein beliebiges c ∈ N zu zeigen. Es sind aber b, c ∈ Ñ = M Ø {d} für irgendein weiteres Element d in M , nach Induktionsvoraussetzung also auch b Ð c . . . Wo steckt der Fehler in der vollständigen Induktion? 23 n Die binomischen Koeffizienten Bm für 0 à m à n sind induktiv definiert durch 2 21 73 2 natürliche, ganze und rationale zahlen n n n+1 Bm−1 + Bm = Bm , Bnn = Bnn = 1, 1 à m à n. Zeigen Sie, dass n Bm = n! . m! (n − m)! n Bemerkung: Die übliche, etwas sperrige Notation für Bm ist 24 n m , gelesen › n über m ‹. Beweisen Sie mit den binomischen Koeefizienten von Aufgabe 23 für n á 1 die binomischen Formeln n X (1 + t)n = Bkn t k , k=0 und allgemeiner (a + b)n = n X k=0 74 2 22 Bkn an−k bk . 3 Komplexe Zahlen Wir haben bisher das Zahlengebäude N⊂Z⊂Q⊂R beschrieben. Von unten betrachtet, werden die ganzen Zahlen als Erweiterung der natürlichen Zahlen eingeführt, um uneingeschränkt die Gleichung m+x =n innerhalb dieses Zahlensystems lösen zu können. Die rationalen Zahlen werden eingeführt, um uneingeschränkt die Gleichung ax = b, a ≠ 0, lösen zu können. Die rationalen Zahlen werden zu dem angeordneten Körper der reellen Zahlen vervollständigt, um unter anderem die quadratische Gleichung x 2 = a, a á 0, uneingeschränkt lösen zu können. Mehr ist allerdings auch nicht möglich! Denn in jedem angeordneten Körper gilt ja x 2 á 0 . Eine Gleichung wie x 2 = −1 ist dort unerfüllbar. Trotzdem bleibt das Bedürfnis, auch diese Gleichung zu lösen. Dies führt zur Erweiterung der reellen Zahlen zu den komplexen Zahlen, und damit zu einer weiteren Stufe unseres Gebäudes N ⊂ Z ⊂ Q ⊂ R ⊂ C. Dieser Erweiterungskörper C kann natürlich nicht mehr angeordnet sein. 3 1 75 3 komplexe zahlen 3-a v o r ü b e r l e g u n g en Angenommen, es gibt einen Erweiterungskörper K ⊃ R mit einem gewissen Element, nennen wir es einmal i , so dass i2 = −1. Dann ist jedenfalls i ∉ R . Ferner gehören auch alle Ausdrücke der Form z Í x + yi, x, y ∈ R, zu K , wobei man Re z Í x, Im z Í y den Real- respektive Imaginärteil von z nennt. Diese sind eindeutig bestimmt. 3.1 Behauptung YYYYY Real- und Imaginärteil von z = x + yi sind eindeutig bestimmt. Ï Ist x + yi = u + vi , so folgt x − u = (v − y)i. Ist v − y = 0 , so ist auch x − u = 0 , und wir sind fertig. Ist aber v − y ≠ 0 , so können wir diese Gleichung umformen zu i= x−u . v −y Dann ist aber i eine reelle Zahl – ein Widerspruch. Y Y Y Y Y Wir setzen jetzt C Í {z = x + yi ∈ K : x, y ∈ R} . Für die Addition und Multiplikation von Elementen z = x + yi und w = u + vi in C gilt dann notwendigerweise z + w = (x + u) + (y + v)i, zw = (xu − yv) + (xv + yu)i. 3.2 Behauptung C mit diesen Operationen ist ein Körper. Ï Y Y Y Y Y Beweis der Behauptung die Null und Eins in C . Ferner ist Zum Beispiel sind 0C = 0+0i und 1C = 1+0i 1 1 x − yi x − yi = = = 2 , z x + yi (x + yi)(x − yi) x + y2 76 3 2 06.09.2011–09:35 konstruktion der komplexen zahlen 3-b also 1 x y = 2 − 2 i. z x + y2 x + y2 Dies ist ein wohldefiniertes Element in C für x 2 + y 2 ≠ 0 , also für z ≠ 0 . Auf diese Weise zeigt man: Sind z und w in C , dann auch z + w, −z, zw sowie z−1 für z ≠ 0. Die übrigen Körperaxiome sind leicht verifiziert. Y Y Y Y Y Gibt es also überhaupt einen Erweiterungskörper K von R mit der gewünschten Eigenschaft, so enthält dieser immer den Körper C . Damit ist allerdings noch nichts über dessen Existenz gesagt. Wir kommen nicht umhin, einen solchen Körper explizit zu konstruieren – wobei wir uns natürlich von unseren Vorüberlegungen leiten lassen. 3-b k o n s t r u k t i o n d er komplexen zahlen Sei K Í R × R = {(x, y) : x, y ∈ R} und definiere (x, y) ⊕ (u, v) Í (x + u, y + v), (x, y) (u, v) Í (xu − yv, xv + yu). Dann rechnet man unter anderem nach: (i) (ii) (iii) (iv) ⊕ und sind assoziativ und kommutativ. Es gilt das Distributivgesetz. Es ist 0K = (0, 0) und 1K = (1, 0) . Die inversen Elemente sind −(x, y) = (−x, −y) und x y (x, y)−1 = , − , (x, y) ≠ 0K . x2 + y 2 x2 + y 2 Das Ergebnis lautet: 3.3 Satz (K, ⊕, ) ist ein Körper. Ï Bemerkung Ganz ähnlich verfährt man bei der Konstruktion der ganzen Zahlen aus den natürlichen Zahlen, und der rationalen Zahlen aus den ganzen Zahlen. Statt ›Zahlen‹ betrachtet man in jedem dieser Fälle Zahlenpaare und definiert für diese Operationen, die die vertraute Addition und Multiplikation nachbilden. Ç 06.09.2011–09:35 3 3 77 3 komplexe zahlen Dieser Körper K erweitert R in folgendem Sinn. Die Abbildung φ : R → K, x , φ(x) = (x, 0) ist injektiv und kommutiert mit den Operationen – das heißt, für alle x, y ∈ R gilt φ(x + y) = φ(x) ⊕ φ(y), φ(x ·y) = φ(x) φ(y), Wir können deshalb R mit dem Unterkörper φ(R) = R × {0} ⊂ K identifizieren. Setzen wir jetzt noch 1 Í (1, 0), i Í (0, 1), und schreiben im Folgenden wieder + statt ⊕ und · statt , so wird (x, y) = (x, 0) + (0, y) = x 1 + y i. Mit anderen Worten: 1 und i sind Basisvektoren des zweidimensionalen reellen Vektorraumes K , und z = x + yi ist eine kompakte Schreibweise für die Linearkombination x 1 + y i . In diesem Körper gilt dann unter anderem i2 = (0, 1) (0, 1) = (−1, 0) = − 1. Von nun an schreiben wir für diesen Körper C und nennen ihn den Körper der komplexen Zahlen. 3-c e i n i g e e l e m e n t are eigenschaften Geometrisch stellt man die Menge C = {x + yi : x, y ∈ R} als Punkte in der komplexen Ebene dar. Der Realteil wird auf der Abszisse, der Imaginärteil auf der Ordinate abgetragen. Diese werden auch als die reelle und imaginäre Achse der komplexen Ebene bezeichnet. Als komplexe Konjugation bezeichnet man die Abbildung σ : C → C, 78 3 4 σ (x + yi) = x − yi, einige elementare eigenschaften 3-c · 3-1 y z = x + yi Komplexe Ebene, Konjugation und i Betrag | |z 1 x −y z̄ = x − yi die z auf die zu ihr komplex konjugierte Zahl z̄ Í σ (z) abbildet. Geometrisch handelt es sich um die Spiegelung der komplexen Ebene an der x-Achse. 3.4 Für komplexe Zahlen gilt: Satz (i) (ii) (iii) (iv) (v) Re z = (z + z̄)/2 , Im z = (z − z̄)/2i . z ∈ R a z̄ = z . ¯ = z. z̄ z1 + z2 = z̄1 + z̄2 und z1 z2 = z̄1 z̄2 . zz̄ = x 2 + y 2 mit x = Re z und y = Im z . Ï Der vorletzte Punkt besagt, dass σ ein Automorphismus von C ist, also eine bijektive Abbildung, die mit den Körperoperationen vertauscht: σ (z + w) = σ (z) + σ (w), YYYYY σ (zw) = σ (z)σ (w). Zum Beispiel ist 1 1 1 (z − z̄) = ((x + yi) − (x − yi)) = 2yi = y = Im z, 2i 2i 2i und damit z ∈ R a Im z = 0 a z − z̄ = 0 a z = z̄. Die übrigen Aussagen sind ebenso leicht zu beweisen. Y Y Y Y Y 3 5 79 3 komplexe zahlen Betrag Den Betrag |x| einer reellen Zahl x haben wir mithilfe der Ordnung der reellen Zahlen definiert. Eine solche Ordnung steht uns für die komplexen Zahlen nicht zur Verfügung. Interpretieren wir jedoch |x| als Abstand zum Punkt 0 , so können wir einen Betrag auch für komplexe Zahlen sinnvoll definieren. √ Aufgrund des Satzes von Pythagoras ist x 2 + y 2 der euklidische Abstand des Punktes z = x + iy vom Nullpunkt der komplexen Ebene. Außerdem ist x 2 + y 2 = zz̄ , wie man sofort nachrechnet. Für jedes z ∈ C definieren wir daher p √ |z|C Í zz̄ = x 2 + y 2 als den Betrag der komplexen Zahl z = x + yi . Ist z reell, also Im z = 0 , so gilt p |z|C = x 2 = |x|R . Wir müssen daher nicht zwischen dem Betrag einer reellen und dem Betrag einer komplexen Zahl unterscheiden und schreiben hierfür in Zukunft einfach |·| . 3.5 Für komplexe Zahlen gilt: Satz (i) (ii) (iii) (iv) |Re z| à |z| , |Im z| à |z| . |z| á 0 , und |z| = 0 a z = 0 . |zw| = |z| |w| . |z + w| à |z| + |w| (Dreiecksungleichung). Ï YYYYY Aussagen (i) und (ii) sind klar. Aussage (iii) folgt aus |zw|2 = zwzw = zz̄w w̄ = |z|2 |w|2 . Für die Dreiecksungleichung (iv) bemerken wir, dass |z + w|2 = (z + w)(z̄ + w̄) = zz̄ + zw̄ + w z̄ + z̄w̄ = |z|2 + 2 Re(zw̄) + |w|2 . Wegen |Re zw̄| à |z| |w̄| = |z| |w| folgt hieraus weiter |z + w|2 à |z|2 + 2 |z| |w| + |w|2 = (|z| + |w|)2 . Wurzelziehen ergibt die Behauptung. Y Y Y Y Y 80 3 6 fundamentalsatz der algebra · 3-2 3-d z+w in der komplexen Ebene w |z + w | |z| |w | Dreiecksungleichung z 3-d f u n d a m e n t a l s a tz der algebra Unser Ausgangspunkt war, eine Lösung für die Gleichung x2 + 1 = 0 zu konstruieren. Tatsächlich haben wir viel mehr erreicht! 3.6 Fundamentalsatz der Algebra Jede Gleichung zn + an−1 zn−1 + · · · + a1 z + a0 = 0, n á 1, mit komplexen Koeffizienten a0 , a1 , . . . , an−1 besitzt wenigstens eine Lösung in C . Ï Für diesen wichtigen Satz gibt es eine ganze Reihe verschiedener Beweise. Wir werden einen davon später geben. 3 7 81 3 komplexe zahlen aufgaben 1 Sei S = {z ∈ C : |z| = 1} . Welche Aussagen sind wahr? a. Die komplexe Multiplikation ist eine Operation auf S . b. Für z ∈ S ist z−1 = −z . c. Für z ∈ S ist z−1 = z̄ . d. Die Gleichung z4 = 1 hat in S genau zwei Lösungen. 2 Bestimmen Sie zu den komplexen Zahlen z1 = 3 + 2i, z2 = 2 − 4i, z3 = −i, z4 = 1 − i die komplex Konjugierten, die Beträge, die multiplikativ Inversen, sowie alle möglichen Produkte und Quotienten. Stellen Sie die Ergebnisse immer in der Form u + vi dar. 3 Bringen Sie die folgenden komplexen Zahlen in die Form u + vi : z1 = 1+i , 1−i 2 − 3i z2 = 3 + 4i , z3 = (2 + 3i)3 , z4 = 77 X in . n=1 4 Für z ∈ C und λ ∈ R gilt Im λz = λ Im z . 5 Man beweise die umgekehrte Dreiecksungleichung, |z + w| á |z| − |w| und die Parallelogrammidentiät, |z + w|2 + |z − w|2 = 2 |z|2 + 2 |w|2 . 6 Skizzieren Sie die folgenden Mengen in der komplexen Ebene. A = {1 < |z − 1 + i| < 2} , B = {|z − 1| = |z + 1|} , C = {|z − 1| · |z + 1| = r 2 } , 7 r > 0. Zeigen Sie, dass es in C nur die Körperautomorphismen z , z und z , z̄ gibt. Hinweis: Ist ϕ ein solcher Automorphismus, so betrachte man ϕ(i) . 8 Hauptteil der Wurzel: Zeigen Sie, dass es zu jedem z ∈ C Ø (−∞, 0] genau ein w ∈ C gibt mit w 2 = z, Re w > 0. Und zwar ist s w= 82 3 8 |z| + Re z + iσ 2 s |z| − Re z , 2 σ = sgn(Im z). aufgaben 9 3 a. Definieren Sie eine Addition und eine Multiplikation auf dem Raum s = Abb(N, C) aller komplexen Folgen so, dass das Distributivgesetz gilt und es eine Null 0s und eine Eins 1s gibt. Man sagt, s bildet einen Ring mit Eins. b. Warum ist s damit kein Körper? 3 9 83 84 3 10 4 Folgen Eine Folge in einer beliebigen Menge X ist eine Funktion f : N → X, die man üblicherweise durch Aufzählung ihrer Funktionswerte in der Form (f1 , f2 , f3 , . . . ) = (fn )ná1 = (fn )n = (fn ) angibt. Man spricht von Zahlenfolgen, wenn alle Folgenglieder reelle oder komplexe Zahlen sind. An einer Folge interessiert uns vor allem ihr asymptotisches Verhalten – also wie sie sich verhält, wenn der Folgenindex gegen Unendlich strebt. Gibt es zum Beispiel einen Punkt, dem sich die Folge ›beliebig genau annähert‹ und den man als ihren Grenzwert bezeichnen könnte? Die reelle Folge 1 n ná1 1 1 1 = 1, , , . . . , , . . . 2 3 n beispielsweise scheint gegen 0 zu streben, denn die Folgenglieder sind positiv, werden aber immer kleiner. Dagegen hat die reelle Folge ((−1)n )ná1 = (−1, 1, −1, 1, −1, . . . ) wohl keinen Grenzwert, da sie ständig zwischen 1 und −1 wechselt, sondern statt dessen zwei Häufungswerte. Der Begriff des Grenzwertes ist von fundamentaler Bedeutung für die gesamte Analysis. Er präzisiert die intuitive Vorstellung, dass eine Folge einem bestimmten Punkt ›beliebig nahe‹ kommt. Auf ihm basieren die Konzepte der Stetigkeit, Integration und Differenziation. 4 1 85 4 folgen 4-a g r e n z w e r t e r e e ller folgen Wir betrachten zunächst reelle Folgen, also Folgen aus reellen Zahlen. Definition Eine Folge (an )ná1 reeller Zahlen heißt konvergent, wenn es eine reelle Zahl a gibt, so dass zu jedem ε > 0 ein N á 1 existiert, so dass |an − a| < ε, n á N. Diese Zahl a heißt der Grenzwert der Folge, geschrieben lim an = a, n→∞ und man sagt, (an ) konvergiert gegen a für n gegen unendlich. Ï Andere Schreibweisen hierfür sind an → a, n → ∞, oder auch kurz lim an = a oder an → a . Die in der Definition geforderte Eigenschaft wird als ε-N-Test bezeichnet. Es gilt an → a für n → ∞ genau dann, wenn es zu jeder Fehlerschranke ε > 0 eine Indexschranke N á 1 gibt, jenseits derer alle Folgenglieder einen Abstand kleiner als ε von a haben: n á N ⇒ |an − a| < ε. Die Schranke N hängt im Allgemeinen von ε ab, weshalb man auch oft N(ε) schreibt. Es ist aber nicht erforderlich, diese Abhängigkeit explizit anzugeben. Es genügt zu zeigen, dass es immer ein solches N gibt. Bei Konvergenzfragen kommt es auf die ersten Folgenglieder offensichtlich nicht an. Es spielt keine Rolle, ob die Indizierung einer Folge bei 0 , 1 , oder einer anderen natürlichen Zahl beginnt. Daher kann man auf eine explizite Angabe im Allgemeinen verzichten. – Nun die ersten Beispiele konvergenter Folgen. ¸ Jede konstante reelle Folge ist konvergent 1 . µ Y Y Y Y Y Ist (an ) konstant, so ist an = a für alle n . Dann ist an − a = 0 für alle n und somit erst recht 0 = |an − a| < ε für jedes ε > 0 . Also ist auch a der Grenzwert dieser Folge, und es gilt limn→∞ an = a . Y Y Y Y Y 4.1 ¸ Die reelle Folge (1/n)ná1 ist konvergent mit Grenzwert 0 : lim n→∞ 1 = 0. µ n 1 Eine Folge heißt natürlich konstant, wenn alle Folgenglieder identisch sind. 86 4 2 06.09.2011–09:35 grenzwerte reeller folgen · 4-1 4-a ε-N-Test für eine Nullfolge a ε n −ε N Y Y Y Y Y Zu jedem ε > 0 existiert nach dem Prinzip des Archimedes eine natürliche Zahl N mit 1/N < ε . Dann gilt für alle n á N ebenfalls 0< 1 1 à < ε, n N n á N. Somit gilt auch 1 − 0 < ε, n n á N. Damit haben wir für jedes ε > 0 ein geeignetes N á 1 gefunden. Somit gilt 1/n → 0 für n → ∞ . Y Y Y Y Y Bemerkung Die beiden Beispiele zeigen, dass eine konvergente Folge ihren Grenzwert annehmen kann, aber nicht annehmen muss. Ç Eine konvergente reelle Folge mit Grenzwert 0 wird auch Nullfolge genannt. Eine Folge (an ) ist also eine Nullfolge genau dann, wenn es zu jedem ε > 0 ein N á 1 gibt, so dass |an | < ε, n á N. Die allgemeine Konvergenz lässt sich mit dem Begriff der Nullfolge ausdrücken: 4.2 Notiz Eine Folge (an ) ist konvergent mit Grenzwert a genau dann, wenn (an − a) eine Nullfolge bildet. Ï 06.09.2011–09:35 4 3 87 4 folgen Eindeutigkeit und Beschränktheit Die Definition des Grenzwertes suggeriert, dass eine konvergente Folge nur einen Grenzwert haben kann. Dies erfordert allerdings einen Beweis. 4.3 Eindeutigkeitssatz bestimmt. Ï Der Grenzwert einer konvergenten reellen Folge ist eindeutig Y Y Y Y Y Angenommen, eine reelle Folge (an ) hat zwei Grenzwerte b ≠ c . Dann ist ε Í |b − c| > 0 . Zu ε/2 > 0 existiert dann ein N á 1 , so dass |an − b| < ε/2, |an − c| < ε/2, n á N. Hieraus folgt mit der Dreiecksungleichung |b − c| à |b − aN | + |aN − c| < ε/2 + ε/2 = ε. Dies ist ein Widerspruch zur Wahl ε = |b − c| . Y Y Y Y Y Eine reelle Folge (an ) heißt beschränkt, wenn sup {|an | : n á 1} < ∞. Die Menge {an : n á 1} aller Folgenglieder ist also in R beschränkt. 4.4 Beschränktheitssatz Eine konvergente reelle Folge ist beschränkt. Ï Y Y Y Y Y Ist (an ) konvergent mit Grenzwert a , so gibt es zum Beispiel zu ε = 1 ein N á 1 , so dass |an − a| < 1 für alle n á N . Mit der Dreiecksungleichung folgt |an | à |an − a| + |a| < 1 + |a| , n á N. Wählen wir jetzt M = 1 + max {|a| , |a1 | , . . . , |aN−1 |} , so gilt sicher |an | à M für alle n . Somit ist die Folge (an ) beschränkt. Y Y Y Y Y Definition Eine nicht konvergente Folge heißt divergent. Ï ¸ a. Jede unbeschränkte Folge ist divergent. b. Die reelle Folge ((−1)n )ná1 ist divergent. c. Jede Abzählung von Q ∩ [0, 1] ist divergent. µ Die Beispiele zeigen, dass aus der Beschränktheit einer Folge nicht deren Konvergenz folgt. Wir werden jedoch bald sehen, dass jede beschränkte monotone Folge konvergiert, und dass jede beschränkte Folge eine konvergente Teilfolge besitzt. 88 4 4 grenzwertsätze 4-b 4-b grenzwertsätze Um Folgen auf Konvergenz zu untersuchen, wendet man nur selten den ε-N-Test an. Meistens greift man mithilfe sogenannter Grenzwertsätze auf bereits bekannte Grenzwerte zurück. Wir bemerkten bereits, dass (an ) gegen a genau dann konvergiert, wenn (an − a) eine Nullfolge bildet. Letzteres zeigt man meist durch Vergleich mit einer bekannten Nullfolge. 4.5 Majorantenkriterium Gilt |an − a| à |bn | für alle n mit einer Nullfolge (bn ) , so ist die Folge (an ) konvergent mit Grenzwert a . Ï YYYYY Nach Voraussetzung existiert zu jedem ε > 0 ein N á 1 , so dass |bn | < ε, n á N. Dann gilt erst recht |an − a| à |bn | < ε für alle n á N . Somit konvergiert (an ) gegen a . Y Y Y Y Y n = 1 . Denn n+1 n 1 1 n + 1 − 1 = n + 1 < n , ¸ Es gilt lim n→∞ und die rechte Seite bildet aufgrund von Beispiel 4.1 eine Nullfolge. µ Nullfolgen sind gewissermaßen ›robust‹: Multiplizieren wir sie gliedweise mit einer lediglich beschränkten Folge, so erhalten wir wieder eine Nullfolge. 4.6 Nullfolgensatz Ist (an ) eine Nullfolge und (bn ) beschränkt, so ist auch (an bn ) eine Nullfolge. Ï YYYYY Nach Voraussetzung existiert ein M > 0 , so dass |bn | à M, n á 1. Da (an ) eine Nullfolge bildet, existiert zu jedem ε > 0 ein N mit |an | < ε , M n á N. Dann aber gilt |an bn | = |an | |bn | < ε ·M = ε, M n á N. Das aber bedeutet, dass an bn → 0 . Y Y Y Y Y 4 5 89 4 folgen ¸ a. Für eine beliebige beschränkte Folge (bn ) gilt lim n→∞ bn = 0. n Zum Beispiel ist limn→∞ (−1)n /n = 0. b. Das Produkt der Nullfolge (1/n) mit der unbeschränkten Folge (n2 ) ist die unbeschränkte Folge (n) und damit divergent. Auf die Beschränktheit der Folge (bn ) kann im Nullfolgensatz also nicht verzichtet werden. µ Grenzwertgleichungen Es folgen die klassischen Grenzwertsätze für Summe, Produkt und Quotient konvergenter Folgen. 4.7 Satz Sind die reellen Folgen (an ) und (bn ) konvergent mit an → a und bn → b , so konvergieren auch (|an |) , (an + bn ) und (an bn ) , und es gilt |an | → |a| , an + bn → a + b, an bn → ab. Ist außerdem b ≠ 0 , so existiert an /bn für alle hinreichend großen n , und es konvergiert (an /bn ) mit an /bn → a/b. Ï Betrag: Es gilt |an | − |a| à |an − a| aufgrund der umgekehrten Dreiecksungleichung. Da die rechte Seite eine Nullfolge bildet, folgt die Behauptung mit dem Majorantenkriterium. Summe: Sei ε > 0 . Dann existieren ein Na á 1 und ein Nb á 1 , so dass YYYYY |an − a| < ε/2, n á Na , |bn − b| < ε/2, n á Nb . Für n á N = max {Na , Nb } gilt dann |(an + bn ) − (a + b)| à |an − a| + |bn − b| < ε/2 + ε/2 = ε. Somit konvergiert (an + bn ) gegen a + b . Produkt: Es ist an bn − ab = (an − a)bn + (bn − b)a. Nach Voraussetzung sind (an − a) und (bn − b) Nullfolgen, und nach dem Beschränktheitssatz ist (bn ) beschränkt. Also sind aufgrund des Nullfolgensatzes auch (an − a)bn und (bn − b)a Nullfolgen. Mit dem eben Bewiesenen ist auch deren Summe eine Nullfolge, und damit auch (an bn − ab) . Also gilt an bn → ab . 90 4 6 grenzwertsätze 4-b Quotient: Aufgrund der eben bewiesenen Produktregel genügt es zu zeigen, dass 1/bn → 1/b . Nach Voraussetzung ist b ≠ 0 , also ε = |b| /2 > 0 . Dazu existiert ein N á 1 , so dass |bn − b| < ε, n á N. Dann aber ist |bn | á |b| − |bn − b| á 2ε − ε = ε, n á N. Somit ist bn ≠ 0 für n á N und (1/bn )náN beschränkt.2 Schreiben wir jetzt 1 1 b − bn − = , bn b bn b so ist die rechte Seite aufgrund des Nullfolgensatzes wieder eine Nullfolge. Also gilt 1/bn → 1/b . Y Y Y Y Y Für konvergente Folgen (an ) und (bn ) gilt somit lim |an | = |lim an | lim (an + bn ) = lim an + lim bn , lim (an bn ) = lim an · lim bn , lim (an /bn ) = (lim an )/(lim bn ), falls lim bn ≠ 0. Man sagt, die Grenzwertbildung vertauscht mit dem Betrag und den arithmetischen Operationen. ¸ a. Bevor man diese Grenzwertgleichungen anwenden kann, sind oft einfache Umformungen nötig, um konvergente Folgen zu erhalten. Ein typisches Beispiel sind Quotienten, deren Zähler und Nenner für sich betrachtet divergieren: n2 + 2n + 3 2 3 = 1 + + 2 → 1. n2 n n b. Allgemein kürzt man rationale Ausdrücke durch die höchste Potenz, die in Zähler und Nenner auftritt: n 1/n 0 = → = 0, n2 + 2n + 3 1 + 2/n + 3/n2 1 und (n2 + 1)(n − 3) 1 + 1/n2 (1 − 3/n) 1·1 1 = → 3 = . 3 (2n + 1)3 2 8 (2 + 1/n) µ 2 Da es auf die ersten Folgenglieder nicht ankommt, fordern wir nicht explizit, dass alle bn von Null verschieden sind. 4 7 91 4 folgen Grenzwertungleichungen Wir betrachten jetzt den Zusammenhang zwischen Grenzwertübergängen und Ungleichungen. 4.8 Lemma Sei (an ) konvergent mit an → a und b eine reelle Zahl. Gilt für jedes ε > 0 die Ungleichung an à b + ε unendlich oft, so ist a à b . Ï Y Y Y Y Y Wäre a > b , so wäre ε = (a − b)/2 > 0 . Wegen an → a gibt es dazu ein N á 1 , so dass |an − a| < ε für alle n á N . Insbesondere gilt dann an > a − ε = b + ε, n á N. Dann gilt aber an à b + ε nicht mehr unendlich oft. Y Y Y Y Y 4.9 Satz Sind die reellen Folgen (an ) und (bn ) konvergent mit an → a und bn → b , und gilt an à bn für unendlich viele n , so gilt auch a à b . Ï Y Y Y Y Y Zu jedem ε > 0 existiert ein N á 1 , so dass |bn − b| < ε für n á N . Insbesondere gilt dann bn < b + ε für alle n á N , und folglich an à bn à b + ε für unendlich viele n . Mit dem vorangehenden Lemma folgt die Behauptung. Y Y Y Y Y Achtung: Diese Sätz gelten nicht mit < an Stelle von à . Zum Beispiel ist 1− 1 1 <1+ , n n n á 1, aber lim 1 − n→∞ 1 1 = 1 = lim 1 + . n→∞ n n Strikte Ungleichungen überleben einen Grenzübergang im Allgemeinen nicht. 4-c e i n i g e w i c h t i g e grenzwerte 4.10 Lemma Für jede reelle Zahl q mit |q| < 1 gilt lim qn = 0. n→∞ Ï Y Y Y Y Y Wir können 0 < |q| < 1 an nehmen, denn der Fall q = 0 ist trivial. Schreibe dann |q| = 92 4 8 1 , 1+r r = 1 − |q| > 0. |q| einige wichtige grenzwerte Mit (1 + r )n á 1 + nr aufgrund der Bernoullischen Ungleichung |qn | = |q|n = 2.4 4-c erhalten wir 1 1 1 à à . (1 + r )n 1 + nr nr Auf der rechten Seite steht eine Nullfolge, und die Behauptung folgt mit dem Majorantenkriterium 4.5 . Y Y Y Y Y 4.11 Lemma Für jedes reelle q mit |q| < 1 und jedes p ∈ Z gilt lim np qn = 0. n→∞ Man sagt, qn dominiert jede Potenz von n , falls |q| < 1 . Ï YYYYY Sei q ≠ 0 und an Í np |q|n . Mit den Grenzwertsätzen an+1 1 p = 1+ |q| → |q| < 1, an n 4.7 gilt denn p ist fest, und der Ausdruck in Klammern konvergiert gegen 1 . Zu einer beliebigen reellen Zahl θ mit |q| < θ < 1 gibt es dann ein N á 1 , so dass an+1 < θ < 1, an n á N. Also ist 0 < an+1 à θan für alle diese n , und damit 0 < an à θ n−N aN , n á N. Da N fest ist, bildet die rechte Seite aufgrund des letzten Lemmas eine Nullfolge. Aufgrund des Majorantenkriteriums 4.5 ist damit auch (an ) eine Nullfolge. Y Y Y Y Y 4.12 Lemma Für jede reelle Zahl a gilt an = 0. n→∞ n! lim Man sagt, n! wächst schneller als jede Potenz einer reellen Zahl. Ï YYYYY Fixiere irgendein θ mit 0 < θ < 1 . Dann gibt es ein N á 1 , so dass |a| à θ, n n á N. Für alle n á N gilt dann 0< n N n Y Y Y |a| |a| |a|N n−N |a|n θ= = à · θ . n! k k k=N+1 N! k=1 k=1 Die rechte Seite bildet eine Nullfolge, und die Behauptung folgt mit dem Majorantenkriterium 4.5 . Y Y Y Y Y 4 9 93 4 4.13 folgen Im nächsten Lemma antizipieren wir die Existenz und Monotonie der nten Wurzelfunktion auf den positiven reellen Zahlen, die wir in Abschnitt 6-b erklären. √ Lemma lim n n = 1. Ï n→∞ YYYYY Für jedes ε > 0 gilt n →0 (1 + ε)n wegen Lemma 4.11 mit p = 1 und q = 1/(1 + ε) . Also gibt es ein N á 1 , so dass n < 1, (1 + ε)n n á N. Dies ist äquivalent mit n < (1 + ε)n , oder p n n < 1 + ε, n á N. √ n Da auch 1 à n für alle n á 1 , folgt hieraus np n − 1 < ε, n á N. Da es für jedes ε > 0 ein solches N gibt, folgt die Behauptung. Y Y Y Y Y 4-d existenzsätze Bisher gingen wir davon aus, dass wir den Grenzwert einer konvergenten Folge kennen – schließlich spielt dieser eine wichtige Rolle in der Definition ihrer Konvergenz. Tatsächlich sieht man jedoch vielen Folgen nicht an, welchen Grenzwert sie haben. Die Folge en = n X 1 1 1 1 =1+ + + ··· + , k! 1! 2! n! k=0 n = 1, 2, . . . , zum Beispiel scheint zu konvergieren, doch kennen wir ihren Grenzwert nicht. Oft will man bestimmte reelle Zahlen auch als Grenzwert bestimmter Folgen definieren, wie zum Beispiel e = lim en . n→∞ Es stellt sich deshalb die Frage, ob man nur durch Betrachten einer Folge selbst auf deren Konvergenz und die Existenz eines Grenzwertes schließen kann. – Am einfachsten ist diese Frage für monotone Folgen zu beantworten. 94 4 10 existenzsätze 4-d Monotone Folgen Definition Eine reelle Folge (an ) heißt monoton steigend, falls an à an+1 für alle n gilt. Sie heißt streng monoton steigend oder strikt steigend, falls an < an+1 für alle n gilt. Analog sind monoton fallende und streng monoton fallende Folgen definiert. Schließlich heißt eine Folge (streng) monoton, wenn sie (streng) monoton steigt oder fällt. Ï Konvergiert eine Folge (an ) monoton gegen einen Grenzwert a , so schreibt man statt an → a auch genauer an a für monoton steigende, und an a für monoton fallende Folgen. 4.14 Satz von der monotonen Konvergenz indexSatz!von der monotonen Konvergenz Eine monotone Folge (an ) ist konvergent genau dann, wenn sie beschränkt ist. In diesem Fall gilt an sup {an : n ∈ N} für monoton steigende Folgen, und an inf {an : n ∈ N} für monoton fallende Folgen. Ï ⇒ Jede konvergente Folge ist beschränkt 4.4 . ⇐ Sei umgekehrt etwa (an ) monoton steigend und beschränkt. Dann ist die Menge A = {an : n ∈ N} beschränkt, und es existiert YYYYY a = sup A < ∞. Aufgrund des Approximationssatzes aN ∈ A mit 1.16 existiert zu jedem ε > 0 ein Element a − ε < aN à a. Aufgrund der Monotonie der Folge (an ) gilt dann auch a − ε < aN à an à a, n á N. Das aber bedeutet, dass |an − a| < ε für n á N . Da ε > 0 beliebig war, gilt lim an = a = sup {an : n ∈ N} . Y Y Y Y Y n→∞ 4 11 95 4 folgen Bemerkung Die Existenz des Grenzwertes folgt somit aus der Existenz eines Supremums oder Infimums, und damit aus der Vollständigkeit der reellen Zahlen. Im Körper Q gilt der Satz daher nicht – siehe Aufgabe 17 Ç 4.15 ¸ Die Summen en = n X 1 1 1 1 1 =1+ + + + ··· + k! 1 1·2 1·2·3 n! k=0 definieren eine Folge (en ) , die sicher streng monoton steigt. Außerdem gilt en à 1 + 1 + 1 + ··· + 2 n−1 n 1 1 =1+2 1− à3 2 2 für alle n , die Folge ist also beschränkt. Also existiert die Eulersche Zahl ∞ n X X 1 1 = . n→∞ k! k! k=0 k=0 e Í lim en = lim n→∞ µ Teilfolgen Nicht jede reelle Folge ist monoton. Man kann aber immer eine monotone Teilfolge auswählen, indem man nur einen Teil der Folgenglieder betrachtet und die übrigen ignoriert. Definition Ist (an )n eine Folge in einer Menge X und (nk )k eine strikt wachsende Folge natürlicher Zahlen, so heißt (ank )k = (an1 , an2 , . . . ) eine Teilfolge von (an ) . Die Folge (nk )k selbst heißt eine Auswahlfolge. Ï Bemerkung Funktional betrachtet ist eine Teilfolge die Komposition einer Folge a : N → X mit einer streng monoton steigenden Abbildung ϕ : N → N , a ◦ ϕ = (aϕ(n) )ná1 = (aϕ(1) , aϕ(2) , . . . ). Die Menge aller Auswahlfolgen ϕ , und damit die Menge aller möglichen Teilfolgen einer Folge, ist übrigens überabzählbar. Ç ¸ Die Folge ((−1)n ) besitzt die beiden Teilfolgen ((−1)2k )ká1 = (1, 1, . . . ), ((−1)2k−1 )ká1 = (−1, −1, . . . ), 3 und natürlich noch viele andere, zum Beispiel ((−1)k! ) , ((−1)k ) , et cetera. µ 96 4 12 existenzsätze 4-d Es ist leicht einzusehen, dass jede Teilfolge einer konvergenten Folge ebenfalls konvergent ist und denselben Grenzwert wie die ursprüngliche Folge besitzt. Interessanter ist die Frage, ob jede beliebige Folge eine konvergente Teilfolge besitzt. Die Antwort gibt der Satz von Bolzano-Weierstraß, der auf folgendem Lemma basiert. 4.16 Lemma YYYYY Jede reelle Folge (an ) enthält eine monotone Teilfolge. Ï Betrachte die Menge A = {n ∈ N : an á am für alle m á n} = {n ∈ N : an = sup {an , an+1 , . . .}} . Ist A unendlich, so definieren die Elemente von A eine Auswahlfolge (nk ) mit der Eigenschaft, dass ank á ank+1 . Also ist (ank ) monoton fallend. Ist dagegen A endlich, so ist A beschränkt. Zu jedem hinreichend großem n existiert dann immer ein m > n mit an < am . Aus diesen Indizes können wir induktiv eine monoton steigende Teilfolge (ank ) konstruieren. Y Y Y Y Y 4.17 Satz von Bolzano-Weierstraß gente Teilfolge. Ï Jede beschränkte reelle Folge besitzt eine konver- Mit dem vorangehenden Lemma können wir aus einer beschränkten Folge eine monotone Teilfolge auswählen. Diese ist immer noch beschränkt. Also ist sie mit dem Satz von der monotonen Konvergenz konvergent. Y Y Y Y Y YYYYY ¸ a. Jede Abzählung der rationalen Zahlen im Intervall [0, 1] besitzt eine konvergente Teilfolge. b. Die monotone Folge (1, 2, 3, . . . ) besitzt offensichtlich keine konvergente Teilfolge, ist aber auch nicht beschränkt. Beschränktheit ist also eine notwendige Voraussetzung für den Satz von Bolzano-Weierstraß. µ Cauchyfolgen Wann aber ist eine beschränkte Folge auch ohne Auswahl einer Teilfolge konvergent? Die Beantwortung dieser Frage führt zum Begriff der Cauchyfolge. 4 13 97 4 folgen Definition Eine reelle Folge (an ) heißt Cauchyfolge, wenn es zu jedem ε > 0 ein N á 1 gibt, so dass |an − am | < ε, n, m á N. Ï In einer Cauchyfolge wird der Abstand aller Folgenglieder untereinander also beliebig klein, wenn deren Index nur groß genug ist. Dafür reicht es allerdings nicht, nur den Abstand aufeinanderfolgender Folgenglieder, also |an − an+1 | , zu betrachten. Alle Abstände |an − am | müssen klein werden, wenn n und m hinreichend groß sind. 4.18 ¸ a. Die Summen hn = n X 1 1 1 1 = 1 + + + ··· + k 2 3 n k=1 definieren eine streng monoton steigende Folge (hn ) mit |hn − hn−1 | = 1 → 0. n Trotzdem ist diese Folge divergent, wie wir im nächsten Kapitel sehen werden. b. Für die Summen en von Beispiel 4.15 gilt für alle m > n á 4 |en − em | = m X k=n+1 m X 1 1 1 à à n. k k! 2 2 k=n+1 Da die rechte Seite eine Nullfolge bildet, ist (en ) eine Cauchyfolge. µ Das letzte Beispiel ist nicht überraschend, da wir bereits wissen, dass die Folge (en ) konvergiert. Denn es gilt: 4.19 Satz Jede konvergente reelle Folge ist eine Cauchyfolge. Ï Y Y Y Y Y Sei (an ) konvergent mit Grenzwert a . Dann existiert zu ε > 0 ein N á 1 mit |an − a| < ε/2, n á N. Für beliebige n, m á N gilt dann aufgrund der Dreiecksungleichung |an − am | à |an − a| + |am − a| < ε/2 + ε/2 = ε. Somit ist (an ) eine Cauchyfolge. Y Y Y Y Y ¸ Umgekehrt gilt damit auch, dass eine Folge divergiert, wenn sie keine Cauchyfolge ist. So divergiert ((−1)n ) , weil für alle n á 1 (−1)n+1 − (−1)n = 2. µ 98 4 14 existenzsätze 4-d Uns kommt es natürlich auf die Umkehrung dieses Satzes an, also auf die Frage, ob eine Cauchyfolge immer konvergiert. Dazu formulieren wir zunächst zwei Teilergebnisse, die auch in einem allgemeineren Zusammenhang gelten. 4.20 Lemma 1 Jede Cauchyfolge ist beschränkt. Ï Y Y Y Y Y Dies wird genauso bewiesen wie der Beschränktheitssatz 4.4 , man wählt nur statt des Grenzwerts a ein Folgenglied am mit hinreichend großem m . Y Y Y Y Y 4.21 Lemma 2 Besitzt eine Cauchyfolge eine konvergente Teilfolge, so ist auch die Gesamtfolge konvergent, und die Grenzwerte stimmen überein. Ï Y Y Y Y Y Sei (ank ) eine konvergente Teilfolge der Cauchyfolge (an ) und a der Grenzwert dieser Teilfolge. Zu jedem ε > 0 existiert dann aufgrund der Cauchyfolgen-Eigenschaft ein Nc á 1 , so dass |an − am | < ε/2, n, m á Nc , sowie aufgrund der Konvergenz der Teilfolge ein Nt á 1 , so dass |ank − a| < ε/2, nk á Nt . Fixieren wir ein nk á max {Nc , Nt } , so folgt |an − a| à |an − ank | + |ank − a| < ε/2 + ε/2 = ε, n á N. Da ε > 0 beliebig war, folgt an → a . Y Y Y Y Y Zusammen mit dem Satz von Bolzano-Weierstrass folgt nun das Konvergenzkriterium von Cauchy, das ohne Kenntnis des Grenzwerts auskommt. 4.22 Cauchykriterium Eine reelle Folge ist konvergent genau dann, wenn sie eine Cauchyfolge ist. Ï YYYYY ⇒ Das ist Satz 4.19. ⇐ Eine reelle Cauchyfolge (an ) ist wegen Lemma 1 beschränkt. Nach dem Satz von Bolzano-Weierstraß besitzt sie also eine konvergente Teilfolge. Mit Lemma 2 ist dann auch die gesamte Cauchyfolge konvergent mit demselben Grenzwert. Y Y Y Y Y 4.23 ¸ Die durch dn = n X (−1)k 1 1 (−1)n =1− + − ··· + k! 1! 2! n! k=0 definierte Folge (dn ) ist nicht monoton, doch für m > n á 4 gilt |dn − dm | à m X 1 1 à n k! 2 k=n+1 4 15 99 4 folgen mit derselben Abschätzung wie in Beispiel 4.18. Also ist (dn ) eine Cauchyfolge und damit konvergent. Ihr Grenzwert ist übrigens der Kehrwert der Eulerschen Zahl, lim dn = 1 1 = . e lim en Dies ergibt sich aus der Potenzreihendarstellung der Exponenzialfunktion in Abschnitt 9-b. µ 4-e häufungswerte Es gibt Folgen, die nicht konvergieren, aber trotzdem einem oder mehreren Punkten immer wieder ›beliebig nahe‹ kommen. Statt von einem Grenzwert spricht man in diesen Fällen von Häufungswerten. Definition Eine reelle Zahl a heißt Häufungswert einer reellen Folge (an ) , wenn es zu jedem ε > 0 und jedem N á 1 ein n á N gibt, so dass |an − a| < ε. Ï Da es zu jedem N ein solches n á N gibt, ist die Menge {n : |an − a| < ε } unbeschränkt. Es gibt also unendlich viele n mit |an − a| < ε . Diese Aussage gilt für jedes ε > 0 . Der Begriff der Umgebung macht diese Situation etwas klarer. Ist a ∈ R und ε > 0 , so nennen wir die Menge Uε (a) Í {x ∈ R : |x − a| < ε } die ε-Umgebung von a . Sie besteht aus allen reellen Zahlen x , deren Abstand von a strikt kleiner als ε ist. Ferner vereinbaren wir folgende Redeweise. In einer abzählbaren Menge X gilt eine Eigenschaft A für unendlich viele x , wenn die Menge {x ∈ X : A(x)} unbeschränkt ist. Sie gilt für fast alle x , oder für alle bis auf endlich viele x , wenn die Menge {x ∈ X : ¬A(x)} endlich und damit beschränkt ist. ¸ a. Fast alle Primzahlen sind ungerade. b. Unendlich viele – aber nicht fast alle – natürlichen Zahlen sind ungerade. c. Fast alle ungeraden Zahlen sind nicht durch 2 teilbar. µ Mit diesen Begriffen können wir Häufungs- und Grenzwerte wie folgt charakterisieren. 100 4 16 häufungswerte 4.24 4-e Charakterisierung von Häufungs- und Grenzwert Eine reelle Zahl a ist Häufungswert einer reellen Folge (an ) genau dann, wenn in jeder ε-Umgebung von a unendlich viele Folgenglieder liegen. Sie ist Grenzwert dieser Folge genau dann, wenn in jeder ε-Umgebung von a fast alle Folgenglieder liegen. Ï Jeder Grenzwert ist somit ein Häufungswert. Aber nicht jeder Häufungswert ist ein Grenzwert. Eine Folge kann keinen, einen, oder viele Häufungswerte haben. Selbst wenn sie nur einen Häufungswert hat, muss dieser kein Grenzwert sein. ¸ a. Die Folge ((−1)n )ná0 besitzt genau zwei Häufungswerte, 1 und −1 . b. Die Folge (1, 2, 3, . . . ) besitzt keinen Häufungswert. c. Die Folge (0, 1, 0, 2, 0, 3, . . . ) besitzt 0 als einzigen Häufungswert. d. Ist (qn ) eine Abzählung von Q , so ist die Menge der Häufungswerte dieser Folge genau die Menge R aller reellen Zahlen. Denn wäre eine reelle Zahl a kein Häufungswert der Abzählungsfolge (qn ) , so existierte ein ε > 0 , so dass in Uε (a) nur endlich viele Folgenglieder liegen. Das widerspricht aber der Tatsache, dass in jedem offenen Intervall unendlich viele rationale Zahlen liegen. µ Zwischen Häufungswert und Teilfolge besteht folgender Zusammenhang, der auch als Charakterisierung von Häufungswerten dienen kann. 4.25 Satz Eine reelle Folge (an ) besitzt a als Häufungswert genau dann, wenn es eine Teilfolge von (an ) gibt, die gegen a konvergiert. Ï YYYYY ⇐ Gibt es eine Teilfolge (ank ) mit ank → a , so liegen in jeder εUmgebung von a fast alle Glieder der Teilfolge, und damit auch unendlich viele Glieder der Originalfolge. Also ist a ein Häufungswert dieser Folge. ⇒ Sei umgekehrt a ein Häufungswert der Folge (an ) . Sei (εn ) eine beliebige, monoton fallende Nullfolge positiver Zahlen. Dazu definieren wir rekursiv eine Auswahlfolge (nk ) durch n1 Í 1 und nk Í min n > nk−1 : an ∈ Uεk (a) , k á 2. Da a ein Häufungswert ist, sind die betrachteten Mengen nicht leer und besitzen somit ein Minimum. Aufgrund der Konstruktion gilt hierfür nk > nk−1 . Wir behaupten, dass ank → a . Nun, zu jedem ε > 0 existiert ein K á 1 mit εK < ε . Da (εn ) monoton fällt, gilt für alle k á K dann ank ∈ Uεk (a) ⊂ UεK (a) ⊂ Uε (a). In jeder ε-Umgebung von a liegen somit fast alle Glieder der Teilfolge (ank ) . Also gilt ank → a . Y Y Y Y Y 4 17 101 4 folgen Den Satz von Bolzano-Weierstraß können wir damit auch so formulieren. 4.26 Satz von Bolzano-Weierstraß für Häufungswerte ge besitzt einen Häufungswert. Ï Jede beschränkte reelle Fol- Y Y Y Y Y Jede beschränkte reelle Folge besitzt eine konvergente Teilfolge. Deren Grenzwert ist damit Häufungswert der Gesamtfolge. Y Y Y Y Y 4-f u n e i g e n t l i c h e grenzwerte Folgen wie (1, 4, 9, 16, . . . ) sind zwar divergent, ›konvergieren‹ aber doch in gewisser Weise gegen Unendlich. Um dies zu präzisieren, definieren wir die offenen Intervalle Uε (∞) Í (1/ε, ∞), Uε (−∞) Í (−∞, −1/ε) als ε-Umgebungen von ∞ respektive −∞ . Es gilt beispielsweise Uε (∞) ⊂ Uδ (∞), 0 < ε < δ, die Umgebungen werden also ›kleiner‹, wenn ε kleiner wird. – Die ε-N-Bedingung für Grenzwerte lässt sich nun wörtlich auf diesen Fall ausdehnen. Definition Eine reelle Folge (an ) konvergiert uneigentlich gegen ∞ , wenn in jeder ε-Umgebung von ∞ fast alle Folgenglieder liegen. Entsprechendes gilt für −∞ . Ï Man bezeichnet ∞ als den uneigentlichen Grenzwert einer solchen Folge und schreibt limn→∞ an = ∞ oder an → ∞, n → ∞. Dies ist genau dann der Fall, wenn jede beliebige Schranke von fast allen Folgengliedern übertroffen wird. Mit anderen Worten, zu jedem M > 0 existiert ein N á 1 , so dass an > M für alle n á N . p n ¸ Es gilt lim n! = ∞ . µ n→∞ YYYYY Sei M > 0 . Wegen M n /n! → 0 Mn < 1, n! 4 18 gibt es ein N , so dass n á N. Für n á N ist also n! > M n und damit 102 4.12 √ n n! > M . Y Y Y Y Y uneigentliche grenzwerte 4-f Auch im Fall der uneigentlichen Konvergenz ist der Grenzwert eindeutig bestimmt. Aber natürlich ist eine uneigentlich konvergente Folge nicht beschränkt. Die Grenzwertgleichungen 4.7 verallgemeinern sich nur teilweise. Wir schreiben dazu an c , wenn an > c für fast alle n gilt. 4.27 Satz Für reelle Folgen (an ) und (bn ) gilt: (i) (ii) (iii) (iv) an → ∞ ∧ bn c ⇒ an + bn → ∞ . an → ∞ ∧ bn c > 0 ⇒ an bn → ∞ . |an | → ∞ ⇒ a−1 n → 0. an → 0 ∧ an 0 ⇒ a−1 n → ∞. Ï Man mache sich klar, dass die -Bedingungen notwendig sind. Ohne sie werden die Aussagen falsch. YYYYY (i) an > Sei ε > 0 so klein, dass 1 − cε > 0 . Dann gilt für fast alle n 1 − cε . ε Also gilt auch für fast alle n a n + bn > 1 − cε 1 +c = . ε ε Fast alle Glieder der Folge an + bn liegen somit in Uε (∞) . (ii) − (iv) Übungsaufgabe. Y Y Y Y Y Identifizieren wir die Symbole ±∞ mit uneigentlich konvergenten Folgen, so rechtfertigt dieser Satz die folgenden Vereinbarungen für das Rechnen mit diesen Symbolen. Wir definieren ∞ + x Í ∞, x > −∞, −∞ + x Í −∞, x < ∞, ∞·x Í ∞, x > 0, −∞·x Í −∞, x > 0, ∞·x Í −∞, x < 0, −∞·x Í ∞, x < 0, sowie x Í 0, ±∞ x ∈ R. Nicht erklärt sind dagegen die Ausdrücke ∞ − ∞, ±∞·0, ±∞ , ±∞ denn mit geeigneten Folgen lässt sich jeder Wert als Grenzwert realisieren – siehe Aufgabe 21. 4 19 103 4 folgen Erweiterte Sätze Wir erweitern jetzt noch drei Existenzsätze auf uneigentliche Grenzwerte. 4.28 Erweiterter Approximationssatz In jeder nichtleeren Menge A reeller Zahlen existiert eine Folge (an ) , die gegen sup A konvergiert. Entsprechendes gilt für inf A . Ï Y Y Y Y Y Sei a = sup A , und (εn ) eine beliebige monotone Nullfolge positiver Zahlen. Aufgrund des Approximationssatzes 1.16 existiert zu jedem n ein Element an ∈ Uεn (a) ∩ A. Dies gilt sowohl für a < ∞ als auch für a = ∞ . Die so gewonnene Folge (an ) liegt in A und konvergiert gegen a : zu jedem ε > 0 existiert ein N mit εN < ε , und für alle n á N gilt εn à εN und damit an ∈ Uεn (a) ⊂ UεN (a) ⊂ Uε (a). Y Y Y Y Y 4.29 Erweiterter Satz von der monotonen Konvergenz Jede monotone Folge konvergiert gegen einen eigentlichen oder uneigentlichen Grenzwert. Ï Y Y Y Y Y Ist die Folge beschränkt, so kommt der Satz von der monotonen Konvergenz zur Anwendung. Andernfalls ist die Folge unbeschränkt. Wegen der Monotonie hat sie dann den uneigentlichen Grenzwert ∞ oder −∞ . Y Y Y Y Y 4.30 Erweiterter Satz von Bolzano-Weierstraß Jede reelle Folge besitzt eine eigentlich oder uneigentlich konvergente Teilfolge. Ï Y Y Y Y Y Dies folgt mit dem Satz von der Existenz monotoner Teilfolgen und dem erweiterten Satz von der monotonen Konvergenz. Y Y Y Y Y ¸ a. Die monotone Folge (n! n! ) konvergiert uneigentlich gegen ∞ . b. Die Folge (0, 1, 0, 2, 0, 3, . . . ) besitzt die konvergente Teilfolge (0, 0, . . . ) und die uneigentlich konvergente Teilfolge (1, 2, 3, . . . ) . c. Die Folge ((−1)n n) besitzt die uneigentlich konvergenten Teilfolgen (2, 4, 6, . . . ) und (−1, −3, −5, . . . ) . µ 4-g n o r m i e r t e r ä u me und banachräume Bisher haben wir Folgen in R betrachtet. Aber natürlich sind auch Folgen in C , Rn und anderen Räumen wichtig. Um auch dort Begriffe wie Konvergenz 104 4 20 normierte räume und banachräume 4-g und Grenzwert definieren zu können, betrachten wir nun reelle Vektorräume, die mit einer Norm versehen sind. Die Norm spielt in diesen Räume die Rolle, die der Betrag für reelle Zahlen spielt. Definition Eine Norm auf einem reellen Vektorraum E ist eine Funktion k·k : E → R, so dass für alle x, y ∈ E und alle λ ∈ R gilt: (n-1) kxk á 0 , und kxk = 0 a x = 0 (Definitheit), (n-2) kλxk = |λ| kxk (positive Homogenität), (n-3) kx + yk à kxk + kyk (Dreiecksungleichung). Ï Das Paar (E, k·k) nennt man einen normierten Raum. Ist die Norm aus dem Kontext klar oder nicht weiter relevant, lässt man deren Angabe auch weg. Die Bedingungen (n-1)–(n-3) abstrahieren die wesentlichen Eigenschaften, die die Betragsfunktion auf R und C auszeichnen und die eine Längenfunktion auf einem Vektorraum aufweisen sollte. Zum Beispiel gilt hierfür immer auch die umgekehrte Dreiecksungleichung. 4.31 Lemma Für jede Norm auf einem reellen Vektorraum gilt die umgekehrte Dreiecksungleichung kxk − kyk à kx − yk . YYYYY 4.32 Ï Wie der Beweis von 1.11, nur mit k·k anstelle von |·| . Y Y Y Y Y ¸ a. Auf R wie auf C definiert der Betrag |·| eine Norm, die sogenannte Betragsnorm. Die Normeigenschaften haben wir in 1.10 und 3.5 verifiziert. b. Auf dem Rn wird durch kxk1 Í |x1 | + · · · + |xn | für x = (x1 , . . . , xn ) die sogenannte Summennorm, und durch kxk∞ Í max {|x1 | , . . . , |xn |} die sogenannte Maximumsnorm definiert. Die Normeigenschaften sind leicht zu verifizieren. µ Um auch den vertrauten euklidischen Abstand zwischen zwei Punkten des R2 oder R3 als Norm zu erkennen, betrachten wir zuerst Vektorräume, auf denen ein Skalarprodukt definiert ist. Definition Ein Skalarprodukt auf einem reellen Vektorraum E ist eine Funktion 4 21 105 4 folgen h·, ·i : E × E → R, für die für alle x, y ∈ E und alle λ ∈ R gilt: (s-1) hx, xi á 0 , und hx, xi = 0 a x = 0 (Definitheit), (s-2) hx, yi = hy, xi (Symmetrie), (s-3) hλx + µy, zi = λ hx, zi + µ hy, zi (Linearität). Ï Wegen der Symmetrie ist ein reelles Skalarprodukt auch linear im zweiten Argument. Es handelt sich also um eine bilineare Form. Für Skalarprodukte gilt folgende grundlegende Ungleichung. 4.33 Cauchy-Schwarz-Bunjakowski-Ungleichung reellen Vektorraum E gilt hx, yi2 à hx, xi hy, yi , x, y ∈ E. Für ein Skalarprodukt auf einem Ï Für alle reellen Zahlen t gilt YYYYY 0 à hx + ty, x + tyi = hx, xi + 2t hx, yi + t 2 hy, yi . Da die behauptete Ungleichung sicher für y = 0 gilt, können wir y ≠ 0 annehmen und t = − hx, yi / hy, yi wählen. Einsetzen in die vorangehende Ungleichung ergibt dann 0 à hx, xi − 2 hx, yi2 hx, yi2 hx, yi2 + = hx, xi − . hy, yi hy, yi hy, yi Daraus folgt hx, yi2 à hx, xi hy, yi . Y Y Y Y Y 4.34 Ist h·, ·i ein Skalarprodukt auf einem Vektorraum E , so definiert q kxk Í hx, xi, x ∈ E, Satz eine Norm auf E . Ï Definitheit und positive Homogenität von k·k sind leicht zu verifizieren. Ferner ist aufgrund der Cauchyungleichung q q |hx, yi| à hx, xi hy, yi = kxk kyk . YYYYY Daraus folgt kx + yk2 = hx + y, x + yi = hx, xi + 2 hx, yi + hy, yi à kxk2 + 2 kxk kyk + kyk2 = (kxk + kyk)2 . 106 4 22 normierte räume und banachräume 4-g Wurzelziehen ergibt die Behauptung. Y Y Y Y Y ¸ Das Standardskalarprodukt auf dem Rn ist h·, ·i : Rn × Rn → R, hx, yi Í X xi y i . 1àiàn Es definiert die euklidische Norm q kxke Í |x1 |2 + · · · + |xn |2 . Sie misst aufgrund des Satzes von Pythagoras den euklidischen Abstand des Punktes x vom Nullpunkt und wird deshalb auch natürliche Norm genannt. µ Wir haben damit erste Beispiele von normierten Räumen, viele weitere werden folgen. Eine zentrale Rolle spielen sie zum Beispiel in der Funktionalanalysis, wo man verschiedenste Räume von Funktionen und Abbildungen studiert. Umgebungen Wir definieren nun die Konvergenz von Folgen in einem beliebigen normierten Vektorraum (E, k·k) . Die ε-Umgebungen eines Punktes a sind hier die Mengen Uε (a) Í {x ∈ E : kx − ak < ε } . Sie werden auch offene ε-Kugeln um a genannt und mit Bε (a) bezeichnet. Allerdings sehen sie nur im Fall der euklidischen Norm wie ›handelsübliche‹ Kugeln aus, wie Abbildung 4-2 zeigt. Dies ist aber unerheblich. Wesentlich ist, dass es um zwei verschiedene Punkte eines normierten Raumes immer ε-Umgebungen gibt, die sich nicht treffen. Man sagt, man kann je zwei verschiedene Punkte durch offene Umgebungen trennen. 4.35 Trennungseigenschaft Zu je zwei verschiedenen Punkten a und b eines normierten Raumes gibt es immer ein ε > 0 derart, dass Uε (a) ∩ Uε (b) = ∅. Ï Wegen a ≠ b ist ε = ka − bk /2 > 0 . Gäbe es ein c ∈ Uε (a) ∩ Uε (b) , so wäre aufgrund der Dreiecksungleichung YYYYY ka − bk à ka − ck + kc − bk < ε + ε = ka − bk , was offensichtlich Unfug ist. Also sind Uε (a) und Uε (b) disjunkt. Y Y Y Y Y 4 23 107 4 folgen Verschiedene Einheitskugeln im R2 · 4-2 Summennorm Euklidische Norm Maximumnorm Konvergenz Die Definition einer konvergenten Folge und ihres Grenzwerts in einem normierten Raum ist nun dieselbe wie im reellen Fall. Definition und Satz Eine Folge (an ) in einem normierten Raum E heißt konvergent mit Grenzwert a , falls jede ε-Umgebung von a fast alle Folgenglieder enthält. Dieser Grenzwert a ist eindeutig bestimmt. Ï Y Y Y Y Y Zu jedem b ≠ a existiert nach dem Trennungssatz 4.35 ein ε > 0 , so dass die ε-Umgebungen und a und b disjunkt sind. Da fast alle Folgenglieder in Uε (a) liegen, liegen höchstens endlich viele in Uε (b) . Also kann b kein Grenzwert der Folge sein. Y Y Y Y Y 4.36 Notiz In einem normierten Raum (E, k·k) konvergiert eine Folge (an ) genau dann gegen a , wenn (kan − ak) eine reelle Nullfolge bildet. Ï Dies ergibt sich aus YYYYY an ∈ Uε (a) a kan − ak < ε a kan − ak ∈ Uε (0). Y Y Y Y Y Grenzwertsätze Auch die wesentlichen Sätze verallgemeinern sich von reellen Folgen mühelos auf Folgen in normierten Räumen. Wir fassen uns daher kurz. 4.37 Konvergiert (an ) gegen a , so konvergiert (kan k) gegen kak . Ï Satz Wegen der umgekehrten Dreiecksungleichung gilt YYYYY kan k − kak à kan − ak → 0. Y Y Y Y Y 108 4 24 normierte räume und banachräume 4.38 4-g Eine konvergente Folge ist beschränkt. Das heißt, es gilt Satz sup {kan k : n á 1} < ∞. Ï Y Y Y Y Y Da wegen dem vorangehenden Satz die Folge (kan k) konvergiert, ist sie beschränkt und das Supremum über alle kan k endlich. Y Y Y Y Y 4.39 Grenzwertgleichung für Linearkombinationen Sind (an ) und (bn ) zwei konvergente Folgen in einem normierten Vektorraum mit an → a und bn → b , so ist auch jede Linearkombination (λan + µbn ) konvergent mit λan + µbn → λa + µb. YYYYY Ï Es ist k(λan + µbn ) − (µa + λb)k à |λ| kan − ak + |µ| kbn − bk . Auf der rechten Seite steht eine Nullfolge, da nach Voraussetzung an → a und bn → b . Also bildet auch die linke Seite eine Nullfolge, und die Behauptung folgt mit obiger Notiz. Y Y Y Y Y Konvergenz in Rm und C Von besonderem Interesse sind Folgen im Rm , genannt vektorwertige Folgen. 3 Wir zeigen, dass die Konvergenz einer solchen Folge (xn ) gleichbedeutend ist mit der Konvergenz jeder ihrer Koordinaten. Sei xn = (xn,1 , . . . , xn,m ), 4.40 Satz a = (a1 , . . . , am ). Eine vektorwertige Folge konvergiert bezüglich der euklidischen Norm genau dann, wenn sie komponentenweise konvergiert. Es gilt also xn → a im Rm genau dann, wenn xn,i → ai in R für i = 1, . . . , m . Ï YYYYY Für 1 à i à m gilt |xn,i − ai |2 à X |xn,l − al |2 à 1àlàm X 2 |xn,l − al | . 1àlàm Wurzelziehen ergibt |xn,i − ai | à kxn − ake à X |xn,l − al | , 1 à i à m. (1) 1àlàm Gilt xn → a , so bildet kxn − ake eine Nullfolge. Also bildet auch die linke Seite von (1) eine Nullfolge, und es folgt xn,i → ai für 1 à i à m . 3 Wir schreiben hier Rm statt Rn , da wir n als Folgenindex benötigen. 4 25 109 4 folgen Gilt umgekehrt diese letzte Aussage, so bildet die rechte Seite von (1) aufgrund der Grenzwertgleichungen 4.7 eine Nullfolge. Also ist auch kxn − ake eine Nullfolge, und es gilt xn → a in Rm . Y Y Y Y Y Gleichung (1) ist übrigens gleichbedeutend mit kxn − ak∞ à kxn − ake à kxn − ak1 . Außerdem gilt offensichtlich kxn − ak1 à n kxn − ak∞ . Bemerkung In Abschnitt 6-d werden wir sehen, dass komponentenweise Konvergenz in Rm gleichbedeutend ist mit Normkonvergenz in jeder Norm auf dem Rm , insbesondere auch der Summen- und Maximumsnorm. Ç Folgen in C , genannt komplexe Folgen, können als ein Spezialfall betrachtet werden, wenn man C als zweidimensionalen reeller Vektorraum auffasst. 4.41 4.42 Korollar Eine komplexe Folge konvergiert genau dann, wenn die Real- und Imaginärteile ihrer Folgenglieder konvergieren. Ï Satz von Bolzano-Weierstraß im Rm Jede beschränkte vektorwertige Folge besitzt eine konvergente Teilfolge. Ï Y Y Y Y Y Sei (xn ) eine beschränkte vektorwertige Folge. Dann ist auch jede Komponentenfolge (xn,i ) mit 1 à i à m beschränkt. Nach dem Satz von BolzanoWeierstraß für reelle Folgen existiert eine erste Teilfolge (xnk ) , deren erste Koordinate konvergiert. Aus dieser können wir eine zweite Teilfolge (xnl ) auswählen, wo auch die zweite Koordinate konvergiert. Und so weiter, bis zur m-ten Koordinate. Es existiert somit eine Teilfolge (xnr ) , in der alle Koordinaten konvergieren. Gemäß dem letzten Satz konvergiert diese Folge dann auch im Rm . Y Y Y Y Y Cauchyfolgen und Banachräume Cauchyfolgen in normierten Räumen werden genau wie reelle Cauchyfolgen definiert. Definition Eine Folge (an ) in einem normierten Vektorraum heißt Cauchyfolge, wenn es zu jedem ε > 0 ein N á 1 gibt, so dass kan − am k < ε, n, m á N. Ï Jede konvergente Folge ist wieder eine Cauchyfolge, und Lemma 1 und 2 für Cauchyfolgen von Seite 99 gelten genauso in normierten Räumen. In den Beweisen muss man lediglich |·| als Norm interpretieren. Es gilt daher folgender 110 4 26 normierte räume und banachräume 4.43 Satz 4-g In einem normierten Vektorraum gilt: (a) Jede konvergente Folge ist eine Cauchyfolge. (b) Jede Cauchyfolge ist beschränkt. (c) Besitzt eine Cauchyfolge eine konvergente Teilfolge, so ist die gesamte Folge konvergent mit demselben Grenzwert. Ï Das Cauchykriterium gilt jedoch im Allgemeinen nicht mehr: Es gibt normierte Vektorräume, in denen Cauchyfolgen keinen Grenzwert haben. Vielmehr ist dies eine Eigenschaft, die eine wichtige Klasse von normierten Räume auszeichnet, während sie anderen Räumen fehlt. Definition Ein normierter Vektorraum heißt vollständig, wenn in ihm jede Cauchyfolge einen Grenzwert besitzt. Ein vollständiger, normierter Vektorraum wird Banachraum genannt. Ï Die einfachsten Beispiele von Banachräumen kennen wir bereits. 4.44 Satz Die Räume R und C mit der Betragsnorm sowie Rn mit der euklidischen Norm sind vollständig, also Banachräume. Ï Y Y Y Y Y Jede Cauchyfolge ist beschränkt. Da in den genannten Räumen der Satz von Bolzano-Weierstraß gilt, besitzt jede Cauchyfolge auch eine konvergente Teilfolge. Dann ist aber auch die Cauchyfolge selbst konvergent. Y Y Y Y Y Bemerkung Wir werden in Abschnitt 6-d sehen, dass der Rn mit jeder Norm vollständig ist, da dort alle Normen äquivalent sind. Ç 4 27 111 4 folgen 4-h der folgenraum c Wir geben nun ein Beispiel eines vollständigen unendlich-dimensionalen Vektorraumes, sowie eines darin enthaltenen nicht-vollständigen Unterraums. Diese Resultate werden wir später nicht benötigen, der Abschnitt kann also beim ersten Lesen übersprungen werden. Wir betrachten den Raum c aller konvergenten reellen Folgen, 4.45 c Í { a = (an ) : (an ) ist reell und konvergent} . ¯ Lemma Der Raum c ist ein reeller Vektorraum bezüglich punktweiser Addition und skalarer Multiplikation von Folgen. Ï Die Linearkombination λa + µ b zweier Elemente in c ist erklärt durch ¯ ¯ (λa + µ b)n = λan + µbn , n á 1. ¯ ¯ Aus dem Satz über Grenzwertgleichungen 4.7 folgt, das λa + µ b ebenfalls kon¯ ¯ vergiert, also Element von c ist. Somit ist c ein reeller Vektorraum. Y Y Y Y Y YYYYY 4.46 Mit der Supremumsnorm Lemma kak Í sup |an | ¯ ná1 wird c zu einem normierten Vektorraum. Ï Y Y Y Y Y Da jede konvergente Folge beschränkt ist, ist k·k eine Abbildung von c nach R . Die Normeigenschaften sind leicht zu verifizieren. Zum Beispiel ist ka + bk = sup |an + bn | ¯ ¯ ná1 à sup (|an | + |bn |) ná1 à sup |an | + sup |bn | = kak + kbk . Y Y Y Y Y ¯ ¯ ná1 ná1 4.47 Satz Der normierte Raum (c, k·k∞ ) ist vollständig. Ï Y Y Y Y Y Sei (am ) eine Cauchyfolge in c , mit Folgengliedern am = (am,n )ná1 . ¯ ¯ Dann ist auch jede Komponentenfolge (am,n )má1 , n = 1, 2, . . . eine reelle Cauchyfolge, denn |ak,n − al,n | à kak − al k für jedes n . Aufgrund ¯ ¯ der Vollständigkeit von R existieren also die Grenzwerte bn = lim am,n , m→∞ 112 4 28 n = 1, 2, . . . , der folgenraum c 4-h und wir können aus ihnen eine Folge b = (bn )ná1 bilden. Es ist nun zu zeigen, ¯ dass b ebenfalls konvergiert und damit zu c gehört, und dass am → b in der ¯ ¯ ¯ Supremumsnorm. Da eine Cauchyfolge vorliegt, existiert zu jedem ε > 0 ein K á 1 , so dass kak − al k < ε für k, l á K . Also gilt für alle n á 1 ¯ ¯ |ak,n − al,n | à kak − al k < ε, k, l á K. ¯ ¯ Wegen al,n → bn für jedes n á 1 folgt hieraus durch Grenzwertübergang |ak,n − bn | à ε, k á K, n á 1. (2) Außerdem existiert für die konvergente Folge aK zu diesem ε > 0 ein N á 1 mit ¯ aK,n − aK,m < ε, n, m á N. Aus den letzten beiden Ungleichungen folgt dann für n, m á N |bn − bm | à bn − aK,n + aK,n − aK,m + aK,m − bm < 3ε. Da zu jedem ε > 0 ein solches N á 1 existiert, ist b eine Cauchyfolge, somit ¯ konvergent und Element von c . Aus (2) folgt außerdem kak − bk à ε, k á K. ¯ ¯ Somit konvergiert (am ) in der Supremumsnorm gegen b . Y Y Y Y Y ¯ ¯ Die Grenzwertabbildung Λ : c → R, a = (an ) , Λa = lim an ¯ ¯ n→∞ definiert auf c eine linear Funktion, für die gilt |Λa| = |lim an | à sup |an | = kak . ¯ ¯ Ihr Kern ist der Raum aller Nullfolgen, c0 Í Λ−1 {0} = { a ∈ c : lim an = 0} . ¯ Dieser Raum ist also ebenfalls ein Vektorraum. 4.48 Satz Der Unterraum c0 aller Nullfolgen in c ist ebenfalls vollständig bezüglich der Supremumsnorm. Ï Y Y Y Y Y Eine Cauchyfolge (am ) in c0 ist auch eine Cauchyfolge in c , besitzt so¯ mit einen Grenzwert a in c aufgrund der Vollständigkeit von c . Ein Widerspruch¯ sargument zeigt, dass a ebenfalls eine Nullfolge sein muss. Also konvergiert ¯ (am ) in c0 . Y Y Y Y Y ¯ 4 29 113 4 folgen Betrachte jetzt in c0 die Menge c00 Í {(an ) ∈ c0 : an = 0 für fast alle n} aller Nullfolgen mit nur endlich vielen nicht-verschwindenden Folgengliedern. Man sieht leicht, das dies ein Untervektorraum von c0 ist. 4.49 Der Unterraum c00 mit der Supremumsnorm ist nicht vollständig. Ï Satz YYYYY Zum Beispiel definiert 1 1 1 , 0, . . . , am = 1, , , . . . , 2 3 m−1 ¯ m á 2, eine Folge in c00 , die in c0 gegen 1 1 1 a = 1, , , . . . = 2 3 n ná1 ¯ konvergiert, denn kam − ak = 1/m → 0 . Da aber a ∉ c00 , konvergiert die Folge ¯ ¯ ¯ (am ) in c00 nicht. Y Y Y Y Y ¯ aufgaben 1 Welche der folgenden Aussagen ist wahr? Beschränkte reelle Folgen a. sind konvergent. b. haben mindestens einen Häufungspunkt. c. haben höchstens einen Häufungspunkt. d. können nicht monoton sein. 2 Welche der folgenden Aussagen ist wahr? a. Es gibt eine unbeschränkte reelle Folge mit genau drei Häufungspunkten. b. Eine reelle Folge mit genau einem Häufungswert ist konvergent. c. Eine unbeschränkte Folge hat keinen Häufungswert. d. Eine monotone Zahlenfolge ist entweder konvergent oder unbeschränkt. 3 e. Eine divergente Zahlenfolge hat keinen Häufungspunkt. f. Eine divergente Folge hat mindestens zwei Häufungspunkte. Gibt es eine Folge (an )ná1 in [0, 1] , a. die abzählbar unendlich viele Häufungswerte hat? b. die überabzählbar viele Häufungswerte hat? c. deren Häufungswerte genau die rationalen Zahlen in [0, 1] sind? d. mit |am − an | á ε/n für alle m > n á 1 und irgendeinem ε > 0 ? 114 4 30 aufgaben 4 Formulieren Sie einen ε-N-Test dafür, dass eine reelle Folge (an ) keine Nullfolge bildet. 5 Konstruieren Sie zu einer beliebigen Zahl x ∈ R Ø Q eine Folge (an ) in Q , die gegen x 4 konvergiert. 6 Einschliessungssatz: Seien (an ) , (bn ) , (cn ) reelle Zahlenfolgen mit an à bn à cn , n á 1. Konvergieren (an ) und (cn ) mit demselben Grenzwert b , so konvergiert auch (bn ) gegen b . 7 Es gelte an → a und bn → b . Zeigen Sie, dass max {an , bn } → max {a, b } . 8 Untersuchen Sie die Konvergenz der Folge (an ) mit an = bnk , cnl + d bc ≠ 0, in Abhängigkeit von k, l ∈ N0 = N ∪ {0} . 9 Bestimmen Sie die Grenzwerte der Folgen mit Gliedern √ n! n + (−1)n n a. np , p á 1 b. c. n n n − (−1)n √ √ √ √ n d. n+1 − n e. n2 + n − n f. 2n + 3n + 4n . 10 Bestimmen Sie die Häufungspunkte der Folgen mit Gliedern n n (−2)n n+1 a. (−1)n b. (−1)n 2 c. d. (1 + (−1)n ) + (−1)n n+1 n +1 n2 + 1 n 11 Sei (an ) eine Folge in (0, ∞) . Dann gilt 1/an → 0 genau dann, wenn an → ∞ . 12 Sei (an ) eine Folge in (0, ∞) und bn = n X ak + a−1 , k n á 1. k=1 Dann ist (1/bn ) eine Nullfolge. Hinweis: Aufgabe 11. 13 Zu einer beliebigen reellen Zahl a > 1 definiere man drei Folgen (an ) , (bn ) , (cn ) durch p p p p p p √ an = n + a − n , bn = n + n − n , cn = n + n/a − n . Dann gilt an > bn > cn für n < a2 , aber an → 0 , bn → 1/2 und cn → ∞ . 14 Eine reelle Folge ist konvergent genau dann, wenn sie beschränkt ist und genau einen Häufungswert hat. 15 Eine reelle Folge ist konvergent genau dann, wenn sie beschränkt ist und jede konvergente Teilfolge denselben Grenzwert hat. Auf die Beschränktheit kann dabei nicht verzichtet werden. 4 31 115 4 16 folgen Bestimmen Sie, in Abhängigkeit von x ∈ R , die Häufungswerte der Folge (an ) mit an = nx − [nx], n á 1. Hierbei bezeichnet [·] die Gaußklammer. 17 Sei a > 1 . Zeigen Sie, dass die Folge a 1 an + , n á 1. a1 = a, an+1 = 2 an √ monoton fallend gegen a konvergiert. Wieso ist dies ein Gegenbeispiel zum Satz von der monotonen Konvergenz 18 4.14 in Q ? Von der Folge (an ) konvergieren die Teilfolgen (a2n ) , (a2n+1 ) und (a3n ) . Konvergiert dann auch (an ) ? Mit Beweis oder Gegenbeispiel! 19 Gibt es eine divergente komplexe Folge (zn ) derart, dass sowohl (|zn |) als auch (Re zn ) konvergieren? 20 In einem normierten Raum ist jede Umgebung Uε (a) konvex. Das heißt, mit x, y ∈ Uε (a) ist auch (1 − t)x + ty ∈ Uε (a), 21 22 0 à t à 1. Geben Sie Beispiele reeller Folgen (an ) und (bn ) mit an → ∞ und bn → 0 , so dass a. lim an bn = ∞ , b. lim an bn = −∞ , c. lim an bn = c , wobei c eine beliebige reelle Zahl. Seien a, b beliebige reelle Zahlen, und die Folge (an ) rekursiv definiert durch a1 Í a, a2 Í b, an Í an−1 + an−2 , n á 3. 2 Zeigen Sie, dass (an ) konvergiert, und bestimmen Sie den Grenzwert. 23 a. Sei (an )ná1 eine konvergente reelle Folge. Zeigen Sie, dass auch die Folge (bn ) mit bn Í a1 + · · · + an , n n á 1, konvergiert, und zwar mit demselben Grenzwert wie (an ) . b. Geben Sie ein Beispiel einer divergenten Folge (an ) , für die (bn ) konvergiert. 24 Angenommen, es existiert der Grenzwert 1 n = a. lim 1 + n→∞ n Wie kann man dann 2 n lim 1 + = b, n→∞ n 116 4 32 1 n lim 1 − =c n→∞ n aufgaben 4 durch a ausdrücken? 25 Die reelle Folge (xn ) konvergiert genau dann, wenn es ein θ ∈ (0, 1) gibt, so dass die Folge (yn ) mit yn = xn + θxn−1 konvergiert. 26 Ist pn /qn eine konvergente Folge rationaler Zahlen mit qn > 0 und irrationalem Grenzwert, so gilt |pn | → ∞ und qn → ∞ . 27 Zeigen Sie, dass auf dem Rn gilt: kxk∞ à kxke à kxk1 à n kxk∞ . 28 Limes superior und Limes inferior: Jeder reellen Folge (an ) wird durch ân Í sup {am : m á n} , ǎn Í inf {am : m á n} eine monoton fallende Folge (ân ) und eine monoton steigende Folge (ǎn ) zugeordnet. Deren eigentliche oder uneigentliche Grenzwerte, a∗ = lim sup an Í lim ân , a∗ = lim inf an Í lim ǎn , n→∞ n→∞ n→∞ n→∞ werden der Limes superior respektive der Limes inferior der Folge (an ) genannt. a. Es ist a∗ = inf sup am , a∗ = sup inf am . n mán n mán b. Es gilt a∗ à a∗ , und beide Punkte sind Häufungswerte der Folge (an ) . c. Bezeichnet H die Menge aller Häufungswerte von (an ) in R̄ , so ist a∗ = sup H, a∗ = inf H. Somit ist a∗ der größte und a∗ der kleinste Häufungswert der Folge (an ) in R̄ . d. Ist −∞ < a∗ < ∞ , so existiert zu jedem ε > 0 ein N á 1 , so dass an < a∗ + ε, n á N. ∗ Ist a = −∞ , so existiert zu jedem ε > 0 ein N á 1 , so dass an < −1/ε, n á N. Entsprechendes gilt für a∗ . e. Es ist (an ) eigentlich oder uneigentlich konvergent genau dann, wenn a∗ = a∗ . In diesem Fall ist lim an = lim sup an = lim inf an . 4 33 117 118 4 34 5 Reihen Folgen besonderer Art sind unendliche Summen ∞ X ak = a1 + a2 + . . . k=1 reeller oder komplexer Zahlen, denen wir bereits in einigen Beispielen des Abschnitts 4-d begegnet sind. Da man nicht sämtliche Glieder einer Folge (ak ) auf einmal summieren kann, steht eine solche Summe vielmehr für die Folge der Partialsummen sn = n X ak , n á 1, k=1 die man in gewohnter Weise untersuchen kann. Solche Reihen lassen sich in jedem Vektorraum bilden. In dieser Vektorraum ein Banachraum, so folgt mithilfe entsprechender Konvergenzkriterien auch die Existenz der unendlichen Reihe. Auf diesen Aspekt kommen wir im letzten Abschnitt zurück. Zunächst betrachten wir Reihen reeller oder komplexer Zahlen. Übrigens kann man jede Zahlenfolge (an ) auch als Partialsummenfolge einer Reihe auffassen, nämlich a1 + ∞ X (ak − ak−1 ). k=2 Denn es ist sn = a1 + n X (ak − ak−1 ) = an . k=2 Folgen und Reihen sind somit zwei Erscheinungsformen ein und derselben Sache. 5 1 119 5 reihen 5-a konvergenz Eine Zahlenreihe oder einfach Reihe ist ein Ausdruck der Form ∞ X ak k=1 mit reellen oder komplexen Gliedern a1 , a2 , . . . . Die endlichen Summen sn Í n X ak k=1 heißen die n-ten Partialsummen dieser Reihe. P∞ Definition Die Reihe k=1 ak heißt konvergent, wenn die Folge ihrer Partialsummen konvergiert. Ihr Grenzwert heißt Wert dieser Reihe. Konvergiert die Folge der Partialsummen dagegen nicht, so heißt die Reihe divergent. Ï Im Falle der Konvergenz haben wir also ∞ X ak = s Í lim sn = lim n→∞ k=1 n→∞ n X ak . k=1 Geht es nur um die Konvergenz und kommt es auf die ersten Glieder der Reihe P P nicht an, schreibt man auch kürzer k ak oder schlicht ak . Die Summation einer Reihe kann natürlich bei einem beliebigen ganzzahligen Index beginnen, nicht nur bei 1 . Bemerkung ∞ X Eigentlich ist zu unterscheiden zwischen der formalen Reihe ak , k=1 deren Konvergenz noch nicht fest steht und die auch divergieren kann, und der konvergenten Reihe ∞ X k=1 ak = lim n→∞ n X ak . k=1 Die formale Reihe steht für die Folge ihrer Partialsummen, die konvergente Reihe für deren Grenzwert. Dieser Unterschied kommt in dieser allgemein üblichen Notation nicht zum Ausdruck. Ç ¸ a. In Beispiel 4.15 zeigten wir die Konvergenz der Reihe 120 5 2 ∞ X 1 = e. k! k=0 06.09.2011–09:35 konvergenz 5-a b. Die Partialsummen der Reihe ∞ X 1 k2 k=1 sind monoton steigend, da alle Summanden positiv sind. Sie sind auch beschränkt, denn n n n X X X 1 1 1 1 1 à = − < 1. =1− 2 k k(k − 1) k − 1 k n k=2 k=2 k=2 Aufgrund des Satzes von der monotonen Konvergenz 4.14 ist die betrachtete Reihe also konvergent. Übrigens wusste bereits Euler, dass ∞ X π2 1 = . µ k2 6 k=1 5.1 Für Zahlenreihen gilt natürlich ebenfalls das Cauchykriterium, das folgende Form annimmt. P Cauchykriterium Die Zahlenreihe k ak konvergiert genau dann, wenn es zu jedem ε > 0 ein N á 1 gibt, so dass X m < ε, a k m á n á N. Ï k=n Wegen YYYYY X m ak = |sm − sn−1 | , k=n ist dies das Cauchykriterium 5.2 4.22 für die Zahlenfolge der Partialsummen (sn ) . Y Y Y Y Y Ein Spezialfall des Cauchykriteriums ist notwendige P Nullfolgenkriterium Ist die Reihe k ak konvergent, so bilden ihre Glieder an eine Nullfolge. Ï Y Y Y Y Y Konvergiert die Folge der Partialsummen, so folgt für an = sn − sn−1 aus den Grenzwertgleichungen der Grenzwert lim an = lim (sn − sn−1 ) = lim sn − lim sn−1 = 0. Y Y Y Y Y Natürlich ist das Nullfolgenkriterium nicht hinreichend für die Konvergenz einer Reihe – das wäre ja auch zu einfach. Das folgende ist das Standardbeispiel. 06.09.2011–09:35 5 3 121 5 5.3 reihen ¸ Die harmonische Reihe ist divergent: ∞ X 1 = ∞. k k=1 YYYYY µ Es gilt s2n − sn = 2n X k=n+1 2n X 1 1 1 á = . k k=n+1 2n 2 Die Partialsummen bilden somit keine Cauchyfolge und sind daher divergent. Da sie monoton wachsen, konvergiert die harmonische Reihe uneigentlich gegen ∞ . Y Y Y Y Y Die Grenzwertsätze für Folgen übertragen sich auf dem Weg über die PartiP alsummen zu entsprechenden Sätzen für Reihen. Sind zum Beispiel k ak und P P k bk konvergente Reihen, so ist auch die Reihe k (λak + µbk ) konvergent, und es gilt X (λak + µbk ) = λ X k ak + µ k X bk . k Wir führen das nicht weiter aus. 5-b a b s o l u t e k o n v e rgenz In einer endlichen Summe ist es kein Problem, die Reihenfolge der Summanden beliebig zu ändern, wenn die Addition kommutativ ist – die Summe ändert sich nicht. In einer unendlichen Reihe ist dies aber keineswegs immer so. Dazu bedarf es einer stärkeren Form der Konvergenz. P Definition Eine Reihe k ak heißt absolut konvergent, wenn die Absolutreihe P k |ak | konvergiert. Eine konvergente, aber nicht absolut konvergente Reihe heißt bedingt konvergent. Ï 5.4 Satz von der absoluten Konvergenz Eine Reihe ist absolut konvergent genau dann, wenn ihre Absolutreihe beschränkt ist. Jede absolut konvergente Reihe ist auch konvergent, und es gilt die Dreiecksungleichung X ∞ X ∞ ak |ak | . à k=1 122 5 4 k=1 Ï absolute konvergenz 5-b P Die Folge der Partialsummen der Absolutreihe k |ak | ist monoton steigend. Aufgrund des Satzes von der monotonen Konvergenz 4.14 konvergiert sie genau dann, wenn sie beschränkt ist. In diesem Fall erfüllt sie auch das Cauchykriterium. Wegen YYYYY X m X m ak |ak | à k=n k=n erfüllt dann auch P k ak das Cauchykriterium 5.1 , ist also konvergent. In X n X n a |ak | k à k=1 k=1 kann man dann erst rechts, dann links zum Grenzwert n → ∞ übergehen, um die Dreiecksungleichung zu erhalten. Y Y Y Y Y Die Umkehrung des Satzes gilt nicht – sonst wäre der Begriff der absoluten Konvergenz ja auch unnötig. Zum Beispiel konvergiert die alternierende harmonische Reihe ∞ X (−1)k+1 1 1 1 = 1 − + − ± ... k 2 3 4 k=1 5.5 – siehe Beispiel 5.15 – , während die Absolutreihe divergiert – siehe 5.3. Das klassische Beispiel einer absolut konvergenten Reihe ist die geometrische Reihe. P∞ Satz Die geometrische Reihe k=1 qk ist absolut konvergent für |q| < 1 mit ∞ X qk = k=1 1 , 1−q und divergent für |q| á 1 . Ï YYYYY Für q ≠ 1 sind die Partialsummen sn = 1 + q + . . . + q n = 2.15 n+1 1−q . 1−q Für |q| < 1 gilt qn → 0 4.10 , und aus den Grenzwertgleichungen Konvergenz der geometrischen Reihe mit ∞ X k=0 qk = 1 , 1−q 4.7 folgt die |q| < 1. Die absolute Konvergenz folgt hieraus, indem wir q durch |q| ersetzen. Für |q| á 1 dagegen divergiert die Reihe, da qn keine Nullfolge bildet 5.2 . Y Y Y Y Y 5 5 123 5 reihen Wir beschreiben noch genauer, in welchem Sinn absolut konvergente Reihen in beliebiger Reihenfolge aufsummiert werden können. Eine Umordnung einer P Reihe k ak ist gegeben durch eine Bijektion σ : N → N, 5.6 P die zugehörige umgeordnete Reihe ist k aσ (k) . Es treten also genau dieselben P Summanden wie in k ak auf, ihre Reihenfolge ist aber unter Umständen sehr verschieden, wenn die Menge {n : σ (n) ≠ n} nicht endlich ist. P Umordnungssatz Ist die Reihe k ak absolut konvergent, so ist auch jede Umordnung dieser Reihe absolut konvergent, und der Wert der Reihe ändert sich nicht. Ï P Y Y Y Y Y Sei s = ká1 ak , und sei σ : N → N eine Bijektion. Wegen der absoluten P Konvergenz der Reihe ká1 ak existiert zu jedem ε > 0 ein N á 1 , so dass m X |ak | < ε, m á n á N. k=n Dann gilt mit n = N und m → ∞ auch ∞ X |ak | à ε. k=N Die Glieder a1 , . . . , aN−1 haben in der umgeordneten Reihe den Index M = max k : σ (k) ∈ {1, 2, . . . , N − 1} . Für n á N und m á M gilt dann X m ∞ X X n ak − aσ (k) |ak | à ε, à k=1 k=1 P ká1 aσ (k) maximal (1) k=N denn in der Differenz heben sich die Glieder a1 , . . . , aN−1 auf, während jedes weitere Glied sich entweder ebenfalls aufhebt oder genau einmal stehen bleibt. Durch Grenzübergang n → ∞ erhalten wir hieraus X m m X X ∞ ak − aσ (k) = s − aσ (k) m á M. à ε, k=1 k=1 k=1 Da zu jedem ε > 0 ein solches M existiert, folgt die Konvergenz der umgeordneten Reihe gegen denselben Grenzwert s . Es gilt also ∞ X k=1 124 5 6 aσ (k) = s = ∞ X k=1 ak . konvergenzkriterien 5-c Bleibt noch zu zeigen, dass die umgeordnete Reihe auch absolut konvergiert. Dazu genügt es, in (1) bei ak und aσ (k) die Beträge zu nehmen. Das heißt, es gilt ebenso X m X ∞ à ε, |a | − |a | m á M. k σ (k) k=1 Also ist P k=1 ká1 aσ (k) beschränkt und damit konvergent. Y Y Y Y Y Dass dieser Satz nicht selbstverständlich ist, demonstriert der komplementäre Satz über bedingt konvergente Reihen. 5.7 Riemannscher Umordnungssatz Ist eine reelle Reihe konvergent, aber nicht absolut konvergent, so existiert zu jeder reellen Zahl s eine Umordnung dieser Reihe, die gegen s konvergiert. Ï Wir beweisen diesen Satz hier nicht, da wir ihn nicht benötigen. Siehe dazu Aufgabe 10. 5-c k o n v e r g e n z k r i terien Das einfachste Konvergenzkriterium ergibt sich aus dem Vergleich einer P Reihe mit einer konvergenten Majorante. Dabei heißt eine reelle Reihe k bk mit P nichtnegativen Gliedern Majorante einer Reihe k ak , wenn |ak | à bk für fast alle k gilt. 5.8 Majorantenkriterium Besitzt eine Reihe eine konvergente Majorante, so ist sie absolut konvergent. Ï YYYYY Nach Voraussetzung existiert ein N á 1 , so dass m X k=n |ak | à m X k=n bk à ∞ X bk < ∞, m á n á N. k=n P Also ist die Absolutreihe k |ak | beschränkt, und die Behauptung folgt mit dem Satz von der absoluten Konvergenz 5.4 . Y Y Y Y Y Bemerkung Die Kontraposition des Majorantenkriteriums ist das MinoranP tenkriterium: Gilt ak á bk á 0 für fast alle k und divergiert k bk , so divergiert P auch k ak . Ç 5 7 125 5 reihen Als erste Anwendung des Majorantenkriteriums betrachten wir das Verdichtungskriterium von Cauchy und seine Anwendung auf die Zetafunktion. 5.9 Verdichtungskriterium Sei (an ) eine monoton fallende, reelle Nullfolge. Dann sind die beiden Reihen X X an und 2n a2n ná1 ná0 entweder beide konvergent oder beide divergent. Ï YYYYY Auf Grund der Monotonie der an gilt: 1·a2 à a2 à 1·a1 , 2·a4 à a3 + a4 à 2·a2 , 4·a8 à a5 + · · · + a8 à 4·a4 , und allgemein 2n a2n+1 à a2n +1 + · · · + a2n+1 à 2n a2n . Addition dieser Summen ergibt n X 2k a2k+1 à k=0 n+1 2X k=2 ak à n X 2k a2k . k=0 P Konvergiert die rechts stehende Reihe, so konvergiert auch k ak . Divergiert dagegen die rechts stehende Reihe, dann divergiert auch die links stehende Reihe, P und damit auch k ak . Somit haben beide Reihen dasselbe Konvergenzverhalten. Y Y Y Y Y 5.10 ¸ Die Zetafunktion ζ(r ) = X 1 1 1 = 1 + r + r + ... r n 2 3 ná1 konvergiert für r > 1 und divergiert für r à 1 . YYYYY 1 µ Betrachte die verdichtete Reihe ∞ X n=0 2n · ∞ ∞ X X 1 n−r n = 2 = qn , (2n )r n=0 n=0 q = 21−r . Diese Reihe ist konvergent für q = 21−r < 1 , und damit für r > 1 , und ansonsten divergent. Y Y Y Y Y 1 Reelle Exponenten werden in Abschnitt 9-b erklärt. Im Moment genügt es, r ∈ Z anzunehmen. 126 5 8 konvergenzkriterien 5.11 5-c Die Wahl spezieller Majoranten führt zu handlichen Konvergenzkriterien. Besonders einfach und praktisch sind das Wurzel- und das Quotientenkriterium, die auf der geometrischen Reihe als Majorante beruhen. Im Folgenden greifen wir auf die Definition der n-ten Wurzel vor, die erst in Abschnitt 6-b erfolgt. Die Ergebnisse dort sind aber unabhängig von diesem Kapitel, so dass kein Zirkelschluss vorliegt. p P Wurzelkriterium Sei n an eine Zahlenreihe. Konvergiert die Folge ( n |an | ) und gilt q n lim |an | < 1, n→∞ so ist die Reihe absolut konvergent. Gilt dagegen q n lim |an | > 1, n→∞ so ist die Reihe divergent. Ï Im ersten Fall existiert ein q mit 0 < q < 1 und ein N á 1 , so dass q n |an | < q, n á N. P Also gilt |an | à qn für n á N , und die geometrische Reihe n qn bildet eine P konvergente Majorante zu n an . Im anderen Fall ist |an | á 1 für fast alle n . Somit bilden die an keine Nullfolge, und die Reihe divergiert. Y Y Y Y Y YYYYY ¸ a. Die Reihe ∞ X nr z n n=1 konvergiert absolut für jedes z ∈ C mit |z| < 1 und jedes r ∈ N , denn q p n n nr |z|n = nr |z| → |z| < 1, n → ∞. b. Für die Reihe X 1 1 1 = 1 + r + r + ... r n 2 3 ná1 gilt dagegen 4.13 1 lim n√ r = n→∞ n 1 √ n lim n r = 1. Somit ist das Wurzelkriterium nicht anwendbar. In diesem Fall ist auch tatsächlich sowohl Konvergenz (für r > 1 ) als auch Divergenz (für r à 1 ) möglich. µ 5 9 127 5 5.12 reihen P Quotientenkriterium Sei n an eine Zahlenreihe. Konvergiert die Folge sukzessiver Quotienten (|an+1 /an |) und gilt an+1 < 1, lim n→∞ an so ist die Reihe absolut konvergent. Gilt dagegen an+1 > 1, lim n→∞ an so ist die Reihe divergent. Ï Im ersten Fall gibt es ein q mit 0 < q < 1 und ein N á 1 , so dass YYYYY |an+1 | à q, |an | n á N. Also ist |an+1 | à q |an | für n á N , und mit Induktion folgt |an | à qn−N |aN | = cN qn , cN = q−N |aN | . P Also ist n cN qn eine konvergente Majorante. Im anderen Fall gibt es ein N á 1 , so dass |an | á |an−1 | á · · · á |aN | > 0 für n á N . Somit bilden die an keine Nullfolge, und die Reihe divergiert. Y Y Y Y Y Als Anwendung betrachten wir eine der wichtigsten Reihen der Mathematik. 5.13 Die Exponenzialreihe Satz exp z Í ∞ X zn z2 z3 =1+z+ + + ... n! 2! 3! n=0 ist für jedes z ∈ C absolut konvergent. Ï YYYYY Wir können z ≠ 0 annehmen. Dann gilt an+1 |z| |z|n+1 n! n → ∞. a = (n + 1)! |z|n = n + 1 → 0, n für jedes z ∈ C . Also konvergiert die Reihe überall absolut. Y Y Y Y Y Die bisherigen Konvergenzkriterien sichern die absolute Konvergenz, nicht aber die bedingte Konvergenz. Da diese aufgrund des Umordnungssatzes recht delikat ist, erwähnen wir nur das einfachste Kriterium für sogenannte alternierende Reihen. Dies sind reelle Reihen der Form ∞ X (−1)n an = a0 − a1 + a2 − . . . , n=0 wobei an á 0 für alle n . 128 5 10 reihen in banachräumen 5.14 5-d P Leibnizkriterium Die alternierende Reihe ná0 (−1)n an konvergiert, falls (an ) monoton fallend gegen Null konvergiert. Ï YYYYY Für die Partialsummen der Reihe gilt s2n−1 à s2n+1 à s2n+2 à s2n , n á 1, denn es ist s2n − s2n+2 = a2n+1 − a2n+2 á 0, s2n+1 − s2n−1 = a2n − a2n+1 á 0, s2n+2 − s2n+1 = a2n+2 á 0. Die ungeraden und geraden Partialsummen sind also jeweils monoton und beschränkt, und damit konvergent. Da 0 à s2n − s2n−1 = a2n 0, haben sie auch denselben Grenzwert. Also konvergiert die gesamte Reihe. Y Y Y Y Y 5.15 ¸ Die alternierende harmonische Reihe ∞ X n=1 (−1)n+1 1 1 1 1 = 1 − + − + ... n 2 3 4 konvergiert nach dem Leibnizkriterium übrigens log 2 , siehe Bemerkung 9.4. µ 5.14 , denn 1/n 0 . Ihr Grenzwert ist 5-d r e i h e n i n b a n a c hräumen Bisher haben wir Zahlenreihen betrachtet, also Reihen mit reellen oder komplexen Gliedern. Reihen kann man aber aus Elementen eines beliebigen Banachraumes bilden, denn wir benötigen ja nur die Operation der Addition und die Konvergenz der Partialsummen. Ist also (E, |·|) ein beliebiger Banachraum, so ist eine Reihe in E ein AusP∞ druck der Form k=1 ak mit Gliedern ak in E . Die Reihe heißt konvergent in E , wenn die Folge ihrer Partialsummen sn = a1 + · · · + an in E konvergiert. Das Nullfolgenkriterium, das Cauchykriterium und der Satz von der absoluten Konvergenz gelten unverändert weiter, wir müssen lediglich den Betrag |·| als Norm interpretieren. Dasselbe gilt für das Wurzel- und Quotientenkriterium. 5 11 129 5 reihen Nicht mehr gelten solche Sätze, die auf der Anordnung von R gründen, die also zum Beispiel den Begriff der Monotonie verwenden. Reihen beschränkter linearer Operatoren Sei (E, |·| ein beliebiger Banachraum. Für einen linearen Operator A : E → E definiert man kAk Í sup x≠0 |Ax| = sup |Ax| , |x| |x|=1 (2) wobei auch der Wert ∞ zugelassen ist. Man nennt A beschränkt, falls kAk < ∞ , und bezeichnet mit L(E) = {A : E → E : kAk < ∞} den Raum aller beschränkten linearen Operatoren auf E . Für A ∈ L(E) gilt immer |Ax| à kAk |x| , x ∈ E. ¸ Ist E der Banachraum Rn mit der euklidischen Norm, so ist L(E) der Raum aller linearen Selbstabbildungen des Rn . Diesen kann man mit dem Raum aller reellen n × n -Matrizen identifizieren. Seine Dimension ist also n2 . µ 5.16 Satz Auf L(E) definiert k·k eine Norm, die von |·| induzierte Operatornorm. Mit dieser wird L(E) ein Banachraum. Ï YYYYY Der Beweis ist nicht schwierig, wir übergehen ihn aber. Y Y Y Y Y Operatoren in L(E) können wir auch multiplizieren, indem wir sie hintereinander ausführen. Das Ergebnis ist wieder ein beschränkter Operator, denn für Operatoren A, B ∈ L(E) gilt kABk à kAk kBk , wie man anhand der Definition (2) verifiziert. L(E) bildet daher eine sogenannte Banachalgebra. In ihr können wir addieren und multiplizieren. Insbesondere können wir auch wieder eine Exponenzialreihe bilden. Definition und Satz exp A Í Das Exponenzial von A ∈ L(E) ist die Reihe ∞ X Ak 1 2 1 3 =I+A+ A + A + ... , k! 2! 3! k=0 wobei I die Identitätsabbildung bezeichnet. Diese Reihe ist absolut konvergent in L(E) , und es gilt kexp Ak à exp kAk . Ï 130 5 12 aufgaben YYYYY 5 Aus kABk à kAk kBk folgt mit vollständiger Induktion kAk k à kAkk , k á 1. Daher gilt wegen der absoluten Konvergenz der reellen Exponenzialreihe n ∞ n X X X kAkk kAkk kAk k à à = exp kAk < ∞ k! k! k! k=0 k=0 k=0 für alle n á 1 . Somit konvergiert die Reihe exp A absolut in L(E) . Die behauptete Ungleichung folgt dann aus X ∞ n X X n Ak kAkk kAk k à à = exp kAk k! k! k! k=0 k=0 k=0 und Grenzübergang n → ∞ . Y Y Y Y Y Exponenziale linearer Operatoren spielen eine zentrale Rolle in der Untersuchung und Beschreibung linearer Diffenzial- und Evolutionsgleichungen. aufgaben 1 Welche der folgenden Aussagen ist wahr? Eine Reihe ist konvergent genau dann, wenn a. die Folge ihrer Partialsummen beschränkt ist. b. die Folge ihrer Partialsummen konvergent ist. c. ihre Glieder eine Nullfolge bilden. d. ihre Glieder eine streng monotone Nullfolge bilden. e. 2 ihre Glieder eine alternierende Nullfolge bilden. Sei qn = |an+1 /an | . Welche der folgenden Aussagen über P an sind korrekt? a. Hat (qn ) keinen Grenzwert, so ist die Reihe divergent. b. Ist qn < 1 für fast alle n , so ist die Reihe konvergent. c. Ist qn < 2/3 für fast alle n , so ist die Reihe konvergent. d. Ist qn = 1 für unendlich viele n , so ist die Reihe divergent. e. 3 Ist qn = 1 für fast alle n , so ist die Reihe divergent. Zeigen Sie, dass X 1àkà2n 4 1 n á1+ k 2 für n á 0 . Bestimmen Sie die Werte der Reihen X (−1)n X 1 a. b. . n 2 −1 2 4n ná0 ná1 5 13 131 5 5 6 7 8 reihen X 1 die Fehlerabschätzung Beweisen Sie für die Partialsummen der Reihe e = k! ká0 1 , n á 1. |e − sn | < n! n Untersuchen sie die folgenden Reihen auf Konvergenz. √ √ X X n! X n+1 − n n+4 √ a. b. c. n2 − 3n + 1 nn n X X √ √ (−1)n n e. (−1) n+1 − n f. g. nπ − (−1)n n 1 n 1− √ n X n! 3·5· · · · ·(2n + 1) d. X Für welche z ∈ C konvergieren die Reihen X (7z)7n X 2 X n! c. zn b. qn zn , 0 < q < 1 ? a. nn n7 P Sei (an ) monoton fallend und ná1 an = s endlich. Dann gilt 0 à an à s/n für n á 1 und nan → 0 . 9 10 P Zeigen Sie die Divergenz der Reihe an mit 1/n, n gerade, an = −1/n2 , n ungerade. Die Reihe P n an sei bedingt konvergent. Mit a+ = max {a, 0} und a– = − min {a, 0} gilt dann X a+n = ∞, n X a–n = ∞. n Beweisen Sie damit den Riemannschen Umordnungssatz 5.7 . 11 Verallgemeinertes Wurzel- und Quotientenkriterium: Gilt q an+1 n lim sup |an | < 1 oder lim sup a < 1, n→∞ n→∞ n P so ist n an absolut konvergent. Hinweis: Siehe Aufgabe 4.28 für lim sup . 12 Raabesches Konvergenzkriterium: Eine Reihe P n an mit positiven Gliedern ist konvergent, wenn es α > 1 gibt, so dass für fast alle n an+1 α à1− . an n Hinweis: Es gibt eine Majorante der Form 13 n c/nα mit geeignetem c . P a. Abelsche partielle Summation: Mit Bn = 1àkàn bk gilt X X ak bk = am Bm − an+1 Bn + (ak − ak+1 )Bk , n<kàm Hinweis: Schreiben Sie bk = Bk − Bk−1 . 132 P 5 14 n<k<m n < m. aufgaben 5 b. Abelsches Konvergenzkriterium: Ist (an ) monoton und beschränkt und konvergiert P P die Reihe bn , so konvergiert auch an bn . c. Dirichletsches Konvergenzkriterium: Konvergiert (an ) monoton gegen Null und P P bn beschränkt, so konvergiert an bn . sind die Partialsummen von 14 P Die Reihe n an sei konvergent. Welche der folgenden Reihen konvergiert? X n+1 Xp X an a. an b. n an c. n 1 + |an | ná1 ná1 ná1 15 Die Reihe P n an habe positive Glieder und sei divergent. Was kann man über die folgenden Reihen aussagen? X an X an a. b. 2 n 1 + an n 1 + n an 16 c. X n an 1 + a2n Eine punktförmige Schnecke kriecht auf einem 1 m langen Gummiband mit der konstanten Geschwindigkeit von 5 cm/min vorwärts. Am Ende der ersten und jeder weiteren Minute wird das Band homogen um jeweils einen Meter gedehnt. Wird die Schnecke in endlicher Zeit das rechte Ende erreichen, wenn sie zu Beginn der ersten Stunde am linken Ende startet? 5 15 133 134 5 16 6 Stetigkeit Mit dem Begriff der Stetigkeit verbindet sich die Vorstellung einer Bewegung ohne abrupte Sprünge. Geometrisch entsteht die Vorstellung einer Kurve, die man ›in einem Zug und ohne abzusetzen‹ zeichnen kann. Natürlich ist dies keine mathematische Definition. So gibt es stetige Kurven, die ein Quadrat vollständig ausfüllen und sich damit jedem Zeichenversuch entziehen. Oder es gibt Funktionen, die in irrationalen Punkten stetig, in rationalen Punkten dagegen unstetig sind. Dennoch weist die naive Vorstellung in die richtige Richtung. Wenn man sich mit dem Argument einer Funktion einem festen Punkt nähert, so sollten sich auch die zugehörigen Funktionswerte einem festen Wert nähern, und nicht wild herumspringen. Beschreiben wir den Abstand zum festen Punkt durch δ und den Abstand zum festen Wert durch ε , so erhalten wir bereits den Begriff der Stetigkeit in einem Punkt in der heute üblichen ε-δ-Charakterisierung. Anders als in der naiven Vorstellung ist diese Stetigkeit aber eine lokale Eigenschaft. Sie kommt einem einzelnen Punkt im Definitionsbereich zu, und hängt ausschließlich vom Verhalten der Funktion in einer kleinen Umgebung dieses Punktes ab. Im ›nächsten‹ Punkt kann alles schon ganz anders aussehen . . . Erst die Stetigkeit in allen Punkten des Definitionsbereichs kommt der naiven Vorstellung näher. Sie bildet die Grundlage für so fundamentale Sätze wie den Zwischenwertsatz, den Satz über Umkehrfunktionen oder den Satz über Minimum und Maximum. 6 1 135 6 stetigkeit 6-a s t e t i g e f u n k t i o nen und abbildungen Wir betrachten zuerst Funktionen f : R ⊃ D → R, wobei D ⊂ R eine beliebige Teilmenge der reellen Zahlen bezeichnet. Typischerweise ist dies ein Intervall, aber dies ist keine Voraussetzung. 6.1 Definition Eine Funktion f : R ⊃ D → R heißt stetig im Punkt a ∈ D , wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass x ∈ D ∧ |x − a| < δ ⇒ |f (x) − f (a)| < ε. Ï (1) Mit Quantoren ausgedrückt: ∀ ∃ ∀ |x − a| < δ → |f (x) − f (a)| < ε. (2) ε>0 δ>0 x∈D Ausgedrückt mit Umgebungen bedeutet dies, dass zu jedem ε > 0 ein δ > 0 existiert, so dass f jeden Punkt in Uδ (a) ∩ D auf einen Punkt in Uε (f (a)) abbildet. Es gilt also x ∈ Uδ (a) ∩ D ⇒ f (x) ∈ Uε (f (a)). (3) Oder kürzer f (Uδ (a) ∩ D) ⊂ Uε (f (a)). (4) Für den Graphen von f bedeutet dies, dass zu jedem horizontalen ε-Streifen W = Uε (f (a)) ein vertikaler δ-Streifen V = Uδ (a) existiert, so dass der Graph von f über V ∩ D ganz in W enthalten ist – siehe Abbildung 6-1. V = Uδ (a) · 6-1 Im Punkt a stetige Funktion f (a) ε W = Uε (f (a)) δ a 136 6 2 06.09.2011–09:35 stetige funktionen und abbildungen 6-a · 6-2 Im Punkt a unstetige Funktion f (a) ε a ¸ Die quadratische Funktion f : R → R , t , t 2 ist in jedem Punkt a ∈ R stetig. Denn ist 0 < ε < 1 und |t − a| < δ Í ε , 1 + 2 |a| so ist |t + a| à |t − a| + 2 |a| à 1 + 2 |a| und damit |f (t) − f (a)| = |t 2 − a2 | = |t + a| |t − a| < (1 + 2 |a|) δ = ε. µ Bemerkung Man beachte, dass in (1), (2) und (3) nur solche x ∈ Uδ (a) betrachtet werden, die auch zum Definitionsbereich D von f gehören. Es ist nicht erforderlich, dass f auf der gesamten δ-Umgebung von a definiert ist. Ç Definition Eine Funktion f : R ⊃ D → R heißt unstetig im Punkt a ∈ D , wenn sie dort nicht stetig ist. Ï Für die Unstetigkeit von f im Punkt a genügt es also, wenn es ein ε > 0 gibt, so dass in jeder δ-Umgebung von a wenigstens ein Punkt x ∈ D existiert, so dass f (x) nicht in Uε (f (a)) liegt. Oder mit Quantoren: ∃ ∀ ∃ |x − a| < δ ∧ |f (x) − f (a)| á ε. ε>0 δ>0 x∈D Dies ist die Negation von (2). Stetigkeit in einem Punkt ist eine lokale Eigenschaft. Das heißt, sie hängt nur vom Verhalten der Funktion in einer hinreichend kleinen Umgebung dieses Punktes ab. Mehr noch, man kann von der Stetigkeit in einem Punkt a nicht auf die Stetigkeit in einem anderen Punkt b schließen, auch wenn er noch so nahe bei a liegt. Ein Beispiel hierfür ist die Thomaefunktion – siehe Aufgabe 10. Soweit die lokale Stetigkeit. Nun die globale Stetigkeit. 06.09.2011–09:35 6 3 137 6 stetigkeit · 6-3 Signumfunktion sgn t 1 −1 Definition Eine Funktion f : D → R heißt stetig auf D , oder kurz stetig, wenn sie in jedem Punkt von D stetig ist. Ï Umgekehrt ist f auf D unstetig, wenn sie in wenigstens einem Punkt von D unstetig ist. Ein unstetiger Punkt genügt also, um die Stetigkeit auf ganz D zu ruinieren. ¸ a. Jede konstante Funktion t , c ist auf R stetig. b. Die Identitätsfunktion t , t ist auf R stetig. c. Die Betragsfunktion t , |t| ist auf R stetig. d. Die Vorzeichen- oder Signumfunktion t>0 1, sgn : R → R, sgn(t) = 0, t=0 −1, t < 0 ist in 0 unstetig und in allen anderen Punkten stetig. e. Die Gaußklammer t , [t] ist in jedem Punkt t ∈ R Ø Z stetig und in jedem Punkt t ∈ Z unstetig. f. Die Dirichletfunktion 1, t ∈ Q δ : R → R, δ(t) = 0, t ∉ Q ist in keinem Punkt stetig. g. Ist f : D → R stetig, so ist auch die Einschränkung von f auf eine beliebige Teilmenge von D stetig. Für die Stetigkeit ist es daher unerheblich, ob die Definitionsmenge D eine ›schöne‹ Menge ist. µ Stetige Abbildungen Der Begriff der Stetigkeit ist natürlich nicht nur für reellwertige Funktionen auf der reellen Geraden erklärt. Er ist auch sinnvoll für Abbildungen zwischen 138 6 4 stetige funktionen und abbildungen 6-a Uε (f (a)) · 6-4 Im Punkt a stetige f Abbildung f f (a) a f (Uδ (a)) Uδ (a) Räumen, in denen in irgendeiner Weise ein Abstand definiert ist. Als erste Verallgemeinerung in diese Richtung definieren wir nun Stetigkeit für Abbildungen zwischen normierten Vektorräumen. Wer will, kann sich darunter den Rn mit der euklidischen Norm vorstellen. Seien (E, k·kE ) und (F , k·kF ) normierte Vektorräume, D ⊂ E eine beliebige Teilmenge, und f: D→F eine Abbildung. Definition 6.1 überträgt sich auf diese Situation, wenn wir den reellen Betrag durch die entsprechenden Normen ersetzen und die Mengen Uδ (a) = {x ∈ E : kx − akE < δ} die Rolle der δ-Umgebungen übernehmen. 6.2 Definition Eine Abbildung f : E ⊃ D → F heißt stetig im Punkt a ∈ D , wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass x ∈ D ∧ kx − akE < δ ⇒ kf (x) − f (a)kF < ε. Ï Sie heißt stetig auf D , wenn sie in jedem Punkt von D stetig ist. Drücken wir dies wie in (4) durch Umgebungen aus, in diesem Fall also Uδ (a) = {x ∈ E : kx − akE < δ} , Uε (b) = {y ∈ F : ky − bkF < ε } , so erhalten wir folgende Definition Eine Abbildung f : E ⊃ D → F heißt stetig im Punkt a ∈ D , wenn zu jeder ε-Umgebung um f (a) eine δ-Umgebung um a existiert, so dass f (Uδ (a) ∩ D) ⊂ Uε (f (a)). Ï Für D ⊂ R und F = R erhalten wir wieder Definition 6.1. 6 5 139 6 stetigkeit Das Folgenkriterium Der nächste Satz charakterisiert Stetigkeit mithilfe von Folgen. Dies erlaubt uns, Stetigkeitssätze aus entsprechenden Sätzen über Folgen abzuleiten. 6.3 Folgenkriterium Eine Abbildung f : E ⊃ D → F ist stetig im Punkt a ∈ D genau dann, wenn für jede Folge (xn ) in D gilt: xn → a ⇒ f (xn ) → f (a). Ï Wichtig: Dies muss für jede Folge in D mit Grenzwert a gelten, nicht nur für eine, die einem gerade gut gefällt. YYYYY ⇒ Sei (xn ) eine beliebige Folge in D , die gegen a konvergiert. Sei ε > 0 . Wegen der Stetigkeit von f in a existiert dazu ein δ > 0 , so dass kf (x) − f (a)kF < ε, x ∈ Uδ (a) ∩ D. Zu diesem δ > 0 existiert ein N á 1 , so dass kxn − akE < δ, n á N. Da alle xn in D liegen, gilt xn ∈ Uδ (a) ∩ D für n á N , und wir erhalten kf (xn ) − f (a)kF < ε, n á N. Da für jedes ε > 0 ein solches N á 1 existiert, gilt f (xn ) → f (a) . ⇐ Wir zeigen die Kontraposition. Angenommen, f ist nicht stetig in a . Dann gibt es ein ε > 0 , und zu jedem n á 1 einen Punkt xn ∈ U1/n (a) ∩ D mit kf (xn ) − f (a)kF á ε. Wir erhalten eine Folge (xn ) in D mit xn → a , aber f (xn ) 3 f (a) . Y Y Y Y Y 6.4 Korollar Eine Abbildung f : E ⊃ D → F ist stetig auf D , wenn sie jede konvergente Folge in D in eine konvergente Folge in F abbildet. Ï Ist also f auf D stetig und konvergiert (xn ) in D , so gilt lim f (xn ) = f ( lim xn ). n→∞ n→∞ Bei stetigen Funktionen darf man also ›lim‹ und ›f ‹ vertauschen. Stetigkeitssätze Wie bei der Folgenkonvergenz stellen wir nun die Frage, wie sich Stetigkeit mit Körper- und Vektorraumoperationen verträgt. Zuerst betrachten wir 140 6 6 stetige funktionen und abbildungen 6-a reellwertige Funktionen auf einer beliebigen Teilmenge D eines normierten Vektorraums E und die Körperoperationen in R . 6.5 Satz Sind die Funktionen f , g : E ⊃ D → R stetig im Punkt a ∈ D , so sind es auch die Funktionen f + g und f g , sowie f /g im Fall g(a) ≠ 0 . Ï Y Y Y Y Y Betrachte zum Beispiel f /g . Ist (xn ) eine beliebige Folge in D mit Grenzwert a , so gilt wegen des Folgenkriteriums f (xn ) → f (a), g(xn ) → g(a). Mit den Grenzwertgleichungen 4.7 gilt wegen g(a) ≠ 0 dann auch f (xn )/g(xn ) → f (a)/g(a). Das ist gleichbedeutend mit (f /g)(xn ) → (f /g)(a). Da dies für jede solche Folge gilt, ist f /g wegen des Folgenkriteriums in a stetig. Alles Übrige beweist man genauso. Y Y Y Y Y 6.6 Korollar Sind die Funktionen f , g : D → R stetig auf D , so sind es auch f + g und f g , sowie f /g , falls g ≠ 0 auf ganz D . Ï Bemerkung Aufgrund dieses Satzes bildet der Raum C(D) Í {f : D → R : f ist stetig auf D } einen linearen Vektorraum über R . Da auch das Produkt zweier Elemente in ihm erklärt ist und wieder zu C(D) gehört, ist er sogar eine Algebra. In Abschnitt 6-g betrachten wir diesen Raum noch genauer. Ç ¸ Aus der Stetigkeit der konstanten und der Identitätsfunktion folgt mit 6.5 die Stetigkeit aller Polynome, also Funktionen p : R → R der Gestalt p(t) = an t n + an−1 t n−1 + . . . a1 t + a0 mit reellen Koeffizienten a0 , . . . , an . Der Grad eines solchen Polynoms ist übrigens das größte n , für das an ≠ 0 gilt – also sup {n : an ≠ 0} . Das Nullpolynom hat demnach den Grad −∞ . 1 µ 1 Nur mit dieser Vereinbarung gilt beispielsweise, dass der Grad des Produkts zweier Polynome die Summe der Grade der Faktorpolynome ist. 6 7 141 6 stetigkeit · 6-5 Komposition von f f und g a f (a) g g◦f g(f (a)) Für Abbildungen in einen beliebigen normierten Vektorraum F sind lediglich Linearkombinationen erklärt. Der entsprechende Stetigkeitssatz folgt hier unmittelbar aus 4.39. 6.7 Satz Sind die Abbildungen f , g : E ⊃ D → F stetig im Punkt a ∈ D , so ist es auch jede Linearkombination λf + µg : D → F . Entsprechendes gilt für die Stetigkeit auf ganz D . Ï Wir betrachten nun die Komposition zweier stetiger Abbildungen. 6.8 Satz Ist f stetig im Punkt a ∈ D , und ist g in einer Umgebung von f (a) definiert und im Punkt f (a) stetig, so ist auch g ◦ f stetig im Punkt a . Ï Y Y Y Y Y Ist (xn ) eine beliebige Folge in D mit Grenzwert a , so gilt aufgrund des Folgenkriteriums f (xn ) → f (a) . Für alle hinreichend großen n liegt dann f (xn ) im Definitionsbereich von g . Aufgrund des Folgenkriteriums gilt dann auch g(f (xn )) → g(f (a)) . Es gilt somit (g ◦ f )(xn ) → (g ◦ f )(a). Da dies für jede Folge (xn ) mit Grenzwert a gilt, ist g ◦ f im Punkt a stetig. Y Y Y Y Y 6.9 Korollar Ist f stetig auf D und g stetig auf einer Obermenge von f (D) , so ist auch g ◦ f stetig auf D . Ï ¸ Die Funktion p t , 1 + t2 ist auf R stetig. Denn das Polynom 1 + t 2 ist auf R stetig und nichtnegativ, und die Wurzel ist auf [0, ∞) ebenfalls stetig – wie wir in Abschnitt 6-b sehen. µ Lipschitzstetige Abbildungen Eine große und wichtige Klasse stetiger Abbildungen bilden die lipschitzstetigen Abbildungen. 142 6 8 stetige funktionen und abbildungen 6-a Definition Eine Abbildung f : D → F heißt lipschitzstetig auf D , oder auch dehnungsbeschränkt, wenn es eine Konstante L á 0 gibt, so dass kf (u) − f (v)kF à L ku − vkE , u, v ∈ D. Die Konstante L heißt Lipschitzkonstante. Ï Bemerkung Mit L ist auch jede größere reelle Zahl eine Lipschitzkonstante. Ist f lipschitz, so erhält man die kleinstmögliche Lipschitzkonstante auf D mit L = sup u≠v u,v∈D kf (u) − f (v)kF . ku − vkE Ç Die Berechtigung der Bezeichnung lipschitzstetig ergibt sich aus dem nächsten Lemma. 6.10 Lemma Jede lipschitzstetige Funktion ist stetig. Ï Y Y Y Y Y Sei f lipschitz mit Lipschitzkonstante L . Zu gegebenen ε > 0 wähle man δ = ε/(L + 1) > 0 . Für alle u, a ∈ D mit ku − akE < δ gilt dann kf (u) − f (a)kF à L ku − akE < Lδ = Lε < ε. L+1 Da δ unabhängig vom betrachteten Punkt a ∈ D ist, folgt daraus die Stetigkeit von f auf ganz D . Y Y Y Y Y ¸ a. Auf jedem normierten Raum sind konstante Funktionen lipschitz mit L = 0 , und die Identität ist lipschitz mit L = 1 . b. Auf C sind die Abbildungen z , Re z, z , Im z, z , z̄ sämtlich lipschitz mit L = 1 . Zum Beispiel ist z − z̄ w − w̄ |z − w| + |z̄ − w̄| = |z − w| . |Im z − Im w| = 2i − 2i à 2 c. Auf jedem normierten Raum ist die Norm k·k lipschitz mit L = 1 Dies ist gerade die umgekehrte Dreiecksungleichung: kuk − kvk à ku − vk . d. Die Parabel t , t 2 ist auf R nicht lipschitz, denn für u > v = 0 ist |u2 − v 2 | |u2 | = = |u| |u − v| |u| nicht beschränkt. Sie ist aber lipschitz auf jedem beschränkten Intervall – siehe Aufgabe 11. µ 6 9 143 6 stetigkeit 6-b s t e t i g e f u n k t i o nen auf intervallen Wir betrachten nun einige fundamentale Eigenschaften stetiger reellwertiger Funktionen auf einem Intervall. Dazu zählen der Zwischenwertsatz, der Satz über Umkehrfunktionen, und der Satz vom Minimum und Maximum. Zwischenwerte 6.11 Zwischenwertsatz von Bolzano Sei f : [a, b] → R stetig mit f (a) ≠ f (b) . Dann existiert zu jeder reellen Zahl w zwischen f (a) und f (b) mindestens ein c ∈ (a, b) mit f (c) = w . Ï Y Y Y Y Y Wir können annehmen, dass f (a) < w < f (b) . Andernfalls gehen wir zur Funktion −f und den Zwischenwert −w über. Betrachte die Menge A = {x ∈ [a, b] : f (x) < w } ⊂ [a, b] . Diese Menge ist beschränkt und wegen a ∈ A nicht leer. Somit existiert die reelle Zahl c = sup A à b . Da [a, b] ein Intervall ist, gilt auch c ∈ [a, b] . Wir wollen zeigen, dass f (c) = w . Aufgrund des Approximationsatzes 4.28 existiert eine Folge (xn ) in A mit limn→∞ xn = c . Da f stetig ist und f (xn ) < w für alle n , folgt 4.9 lim f (xn ) = f (c) à w. n→∞ Wegen w < f (b) ist c ≠ b und somit c < b . Wäre nun f (c) < w , so wäre f aus Stetigkeitsgründen auch in einer kleinen, ganz in [a, b] enthaltenen Umgebung von c kleiner als w . Es gäbe also ein d ∈ (c, b) mit f (d) < w . Dann aber wäre d ∈ A , im Widerspruch zur Definition von c als dem Supremum von A . Also gilt nicht f (c) < w , sondern f (c) = w . Y Y Y Y Y Der Zwischenwertsatz gilt nicht, wenn f nicht stetig oder der Definitionsbereich kein Intervall ist, siehe Abbildung 6-7. Ein wichtiger Spezialfall des Zwischenwertsatzes liefert die Existenz einer Nullstelle einer Funktion, also eines Punktes x mit f (x) = 0 . 6.12 Nullstellensatz Ist f : [a, b] → R stetig und f (a)f (b) < 0 , so besitzt f in (a, b) mindestens eine Nullstelle. Ï Entweder ist f (a) < 0 < f (b) oder f (a) > 0 > f (b) . In beiden Fällen können wir den Satz von Bolzano mit w = 0 anwenden. Y Y Y Y Y YYYYY 144 6 10 stetige funktionen auf intervallen 6-b · 6-6 Zwischenwertsatz f (b) von Bolzano w f (a) a 6.13 c b Allgemeiner Zwischenwertsatz allgemeiner Zwischenwertsatz Sei I ein beliebiges Intervall und f : I → R stetig. Dann nimmt f jeden Wert zwischen infI f Í inf {f (t) : t ∈ I } und supI f Í sup {f (t) : t ∈ I } mindestens einmal an. Ï Sei infI f < w < supI f . Dann gibt es aufgrund des Approximationssatzes 1.16 Punkte a ∈ I und b ∈ I mit f (a) < w < f (b) . Wenden wir den Satz von Bolzano 6.11 auf die Einschränkung von f auf das abgeschlossene Intervall zwischen a und b an, so erhalten wir die Behauptung. Y Y Y Y Y YYYYY Bemerkung Alle drei Versionen des Zwischenwertsatzes sind tatsächlich äquivalent. Das heißt, aus jedem der drei Sätze lassen sich die beiden anderen Sätze ableiten. Ç 6.14 Beispiel und Satz Jedes reelle Polynom ungeraden Grades besitzt mindestens eine reelle Nullstelle. Ï YYYYY Ein reelles Polynom ungeraden Grades, p(t) = a2n+1 t 2n+1 + a2n t 2n + · · · + a1 t + a0 , mit a2n+1 ≠ 0 und reellen Koeffizienten a0 , . . . , a2n+1 , definiert eine stetige Funktion p : R → R . Die Nullstellen von p bleiben unverändert, wenn wir p · 6-7 Gegenbeispiele zum Zwischenwertsatz w kein Intervall unstetige Funktion 6 11 145 6 stetigkeit durch a2n+1 dividieren. Wir können daher a2n+1 = 1 annehmen und p in der Form p(t) = t 2n+1 (1 + a2n t −1 + · · · + a0 t −2n−1 ) , t ≠ 0, schreiben. Der Term in Klammern konvergiert für t → ±∞ gegen 1 . Also wird p für hinreichend große t positiv und hinreichend kleine t negativ. Die Existenz einer Nullstelle folgt dann aus dem Nullstellensatz 6.12 . Y Y Y Y Y Der Satz ist falsch für Polynome geraden Grades. Das Polynom 1 + t 2 beispielsweise besitzt keine reelle Nullstelle. Eine zweite Konsequenz des allgemeinen Zwischenwertsatzes betrifft die Gestalt stetiger Bilder von Intervallen. 6.15 Ist I ein Intervall und f : I → R stetig, so ist auch f (I) ein Intervall. Ï Satz YYYYY Es ist f (I) = {f (t) : t ∈ I } . Gehören zwei Punkte u < v zu f (I) , so nimmt f also die Werte u und v an. Dann nimmt f aufgrund des Zwischenwertsatzes auf I auch jeden dazwischen liegenden Werte an. Es gilt also auch [u, v] ⊂ f (I) . Somit enthält f (I) mit je zwei Punkten auch alle dazwischen liegenden Punkte. Per definitionem ist f (I) damit ein Intervall. Y Y Y Y Y Umkehrfunktionen Definition Eine Funktion f : D → R heißt monoton steigend, falls u < v ⇒ f (u) à f (v) für alle u, v ∈ D . Sie heißt streng monoton steigend, falls u < v ⇒ f (u) < f (v) für alle u, v ∈ D . Analog sind monoton fallende und streng monoton fallende Funktionen definiert. Schließlich heißt eine Funktion (streng) monoton, wenn sie (streng) monoton steigt oder fällt. Ï ¸ a. Jede konstante Funktionen t , c ist auf R monoton steigend und monoton fallend. b. Die Identitätsfunktion t , t ist auf R streng monoton steigend. c. Die Parabel t , t 2 ist auf (−∞, 0] strong monoton fallend und auf [0, ∞) streng monoton steigend. µ 146 6 12 stetige funktionen auf intervallen 6-b Eine auf einem Intervall I streng monotone Funktion f ist injektiv und damit auf ihrer Bildmenge umkehrbar. Ist f außerdem stetig, so ist die Bildmenge f (I) ebenfalls ein Intervall 6.15 . Wir zeigen jetzt, dass f −1 auf diesem Intervall auch wieder stetig und streng monoton ist. Die Funktion f −1 hat also dieselben Eigenschaften wie f . 6.16 Satz über stetige Umkehrfunktionen Sei I ein Intervall. Ist f : I → R streng monoton steigend und stetig, so gilt: (i) J = f (I) ist wieder ein Intervall. (ii) f : I → J ist bijektiv und besitzt eine Umkehrfunktion f −1 : J → I . (iii) Die Umkehrfunktion f −1 ist ebenfalls stetig und streng monoton steigend. Entsprechendes gilt für streng monoton fallende Funktionen. Ï Bemerkung Dieser Satz gilt für jedes beliebige Intervall, also beispielsweise auch für I = [0, ∞) oder I = R . Ç Y Y Y Y Y Ist f : I → R streng monoton steigend, so ist f injektiv und auf der Bildmenge J = f (I) umkehrbar. Die Umkehrfunktion f −1 : J → I existiert somit auf jeden Fall. Wegen der strengen Monotonie von f gilt auch t1 á t2 ⇒ s1 = f (t1 ) á s2 = f (t2 ). Die Kontraposition hiervon ist s1 < s2 ⇒ t1 = f −1 (s1 ) < t2 = f −1 (s2 ). Also ist auch f −1 streng monoton steigend. All dies gilt auch für nichtstetige, streng monoton steigende Funktionen. Ist f außerdem stetig, so ist J wieder ein Intervall 6.15 , und es bleibt die Stetigkeit von f −1 auf J zu zeigen. Sei zunächst t0 kein Randpunkt von I . Ist ε > 0 hinreichend klein, so gilt I0 = (t0 − ε, t0 + ε) ⊂ I . Aufgrund der Monotonie von f gilt dann auch f (I0 ) = (f (t0 − ε), f (t0 + ε)) Î J0 ⊂ J, und es ist s0 = f (t0 ) ∈ J0 . Wählen wir jetzt zum Beispiel δ Í min {s0 − f (t0 − ε), f (t0 + ε) − s0 } , so ist δ > 0 und Uδ (s0 ) ⊂ J0 . Ferner gilt f −1 (Uδ (s0 )) ⊂ f −1 (J0 ) = I0 = Uε (t0 ). Da zu jedem ε > 0 ein solches δ > 0 existiert, ist f −1 also in t0 stetig. – Für Randpunkte gilt ein entsprechendes Argument. Y Y Y Y Y 6 13 147 6 stetigkeit · 6-8 f −1 Funktion und Umkehrfunktion f s0 Uδ (s0 ) I0 a t0 b Eine Anwendung dieses Satzes liefert uns – endlich – die Existenz der n-ten Wurzeln als stetige Funktionen auf der Halbgeraden [0, ∞) . 6.17 Satz Für jedes n á 2 besitzt die Funktion t , t n auf [0, ∞) eine streng monoton steigende, stetige Umkehrfunktion p n [0, ∞) → [0, ∞) , t , t, die sogenannte n-te Wurzelfunktion Ï Sei n á 2 . Auf I = [0, ∞) ist die Funktion f : t , t 2 polynomial, also stetig, und streng monoton steigend, da YYYYY un − v n = (u − v)(un−1 + un−2 v + · · · + v n−1 ) > 0 für alle u > v á 0 . Da f (0) = 0 und f offensichtlich nach oben unbeschränkt ist, gilt auch f (I) = I . Alle Aussagen folgen daher aus dem vorangehenden Satz. Y Y Y Y Y Minimum und Maximum Für eine beliebige Funktion f : D → R existiert immer das Supremum über ihren Definitionsbereich, sup f Í sup {f (t) : t ∈ D } = sup f (D), D wenn wir auch den Wert ∞ zulassen. Es muss aber keinen Punkt in D geben, an dem f diesen Wert annimmt, auch wenn f beschränkt ist. Siehe Abbildung 6-9 für zwei Beispiele dieser Art. 148 6 14 stetige funktionen auf intervallen 6-b · 6-9 sup Kein Minimum oder Maximum inf offenes Intervall unstetige Funktion Gibt es dagegen einen Punkt c ∈ D mit f (c) = supD f , so spricht man von einem Maximum und schreibt sup f = max f = f (c). D D Man sagt, f nimmt sein Supremum im Punkt c an. Der Punkt c selbst wird eine Maximalstelle von f genannt. Ein Maximum ist in jedem Fall endlich. Entsprechend sind das Minimum minD f und eine Minimalstelle erklärt. Der folgende Satz sagt aus, dass eine stetige Funktion auf einem abgeschlossenen Intervall immer ihr Supremum und Infimum annimmt. 6.18 Satz vom Minimum und Maximum te u, v ∈ [a, b] mit f (u) à f (t) à f (v), Ist f : [a, b] → R stetig, so existieren Punk- t ∈ [a, b] . Insbesondere gilt f (u) = inf f = min f , [a,b] f (v) = sup f = max f . [a,b] [a,b] Ï [a,b] Y Y Y Y Y Sei m Í inf[a,b] f , wobei auch −∞ zugelassen ist. Aufgrund des Approximationssatzes 4.28 existiert eine Folge (xn ) in [a, b] mit f (xn ) → m . Da diese Folge beschränkt ist, besitzt sie nach dem Satz von Bolzano-Weierstraß eine konvergente Teilfolge (xnk ) mit Grenzwert u . Da a à xn à b für alle n , ist dann auch a à u à b , es gilt also xnk → u ∈ [a, b] . Aufgrund der Stetigkeit von f ist f (u) = limk→∞ f (xnk ) . Da aber f (xnk ) Teilfolge der konvergenten Folge f (xn ) ist, erhalten wir insgesamt f (u) = lim f (xnk ) = lim f (xn ) = m = inf f . k→∞ n→∞ [a,b] Insbesondere ist m endlich. – Entsprechend für das Supremum. Y Y Y Y Y 6 15 149 6 stetigkeit · 6-10 Satz vom Minimum max und Maximum min a u v b Bemerkung Dieser Satz wird falsch, wenn das Intervall nicht abgeschlossen oder die Funktion nicht stetig ist – siehe Abbildung 6-9. Ç Als Korollar erhalten wir eine Verbesserung von 6.15 für abgeschlossene Intervalle. 6.19 Korollar Eine stetige Funktion auf einem abgeschlossenen Intervall ist beschränkt und bildet dieses wieder auf ein abgeschlossenes Intervall ab. Ï Für die anderen Intervalltypen gilt dieses Korollar nicht. Eine stetige Funktion kann auf einem offenen Intervall unbeschränkt sein, oder das Bild kann ein abgeschlossenes Intervall sein. 6-c t o p o l o g i s c h e g rundbegriffe Sei weiterhin E ein beliebiger normierter Raum mit Norm k·k . Es reicht aber, sich den Rn mit der euklidischen Norm vorzustellen. Offene Mengen Mit Hilfe der δ-Umgebungen eines Punktes, Uδ (a) = {x ∈ E : kx − ak < δ} definieren wir nun den grundlegenden Begriff der offenen Menge. 6.20 150 Definition Eine Teilmenge A eines normierten Raumes E heißt offen, wenn sie mit jedem Punkt auch eine δ-Umgebung dieses Punktes enthält. Das heißt, zu jedem a ∈ A existiert ein δ > 0 , so dass Uδ (a) ⊂ A . Ï 6 16 topologische grundbegriffe · 6-11 6-c Offene Menge A und offene Kugel Br (a) Uδ (a) a a Uδ (a) a r Br (a) A ¸ a. Jedes offene Intervall (a, b) ⊂ R, −∞ à a < b à ∞, ist offen im normierten Raum R . Denn für jedes c ∈ (a, b) gilt Uδ (c) = (c − δ, c + δ) ⊂ (a, b) , δ = min {c − a, b − c, 1} . Dies gilt auch für a = −∞ und b = ∞ . Die Bezeichnung ›offenes Intervall‹ ist somit konsistent mit Definition 6.20. b. Die Intervalle ∅ und R sind ebenfalls offen. c. Ein abgeschlossenes Intervall [a, b] ist nicht offen, denn jede δ-Umgebung von a oder b enthält auch Punkte, die nicht zu [a, b] gehören. d. In einem normierten Raum E ist jede offene Kugel Br (a) Í {x ∈ E : kx − ak < r } , r > 0, offen. Denn ist b ∈ Br (a) , so ist δ = r − kb − ak > 0 . Für jedes x ∈ Uδ (b) gilt dann aufgrund der Dreiecksungleichung kx − ak à kx − bk + kb − ak < δ + kb − ak = r . Somit gilt Uδ (b) ⊂ Br (a) . µ Der folgende Satz beschreibt die grundlegenden topologischen Eigenschaften offener Mengen. In der allgemeinen Theorie topologischer Räume spielen sie die Rolle von Axiomen für Familien offener Mengen. 6.21 Satz In einem normierten Raum E gilt: (i) ∅ und E sind offen. (ii) Die Vereinigung beliebig vieler offener Mengen ist offen. (iii) Der Durchschnitt endlich vieler offener Mengen ist offen. Ï 6 17 151 6 stetigkeit (i) Die leere Menge ist offen, da es gar keine Punkte gibt, für die eine Umgebung gebraucht wird. E ist offen, da E jede Umgebung enthält. (ii) Sei (Aλ )λ∈I eine beliebige Familie offener Teilmengen von E . Ist [ a∈ Aλ , YYYYY λ∈I so ist also a ∈ Aµ für wenigstens ein µ ∈ I . Da die Menge Aµ offen ist, enthält sie auch eine Umgebung Uδ (a) von a . Somit gilt [ Uδ (a) ⊂ Aµ ⊂ Aλ . λ∈I (iii) Sei (Ak )1àkàn eine endliche Familie offener Teilmengen von E , und \ a∈ Ak . 1àkàn Dann gibt es zu jedem 1 à k à n ein δk > 0 derart, dass Uδk (a) ⊂ Ak . Es ist δ = min {δ1 , . . . , δn } > 0 , und für dieses δ gilt dann Uδ (a) ⊂ Uδk (a) ⊂ Ak , 1 à k à n. Also gilt auch Uδ (a) ⊂ \ 1àkàn Ak . Y Y Y Y Y Bemerkung Wesentlich für den Beweis von (iii) ist, dass das Minimum endlich vieler positiver Zahlen wieder positiv ist. Dies gilt nicht für unendlich viele Zahlen, und (iii) ist auch falsch für unendliche Durchschnitte. So ist beispielsweise \ (−1/k, 1/k) = {0} ká1 in R nicht offen. Ç Eine Menge ist nicht per se offen. Oder wissenschaftlicher ausgedrückt, Offenheit ist keine intrinsische Eigenschaft, die sich innerhalb einer Menge selbst erschließt. Es kommt vielmehr darauf an, in welchem Raum man sich befindet. So ist zum Beispiel eine Strecke ohne ihre Endpunkte als Teilmenge der reellen Geraden offen – dann handelt es sich um ein offenes Intervall –, als Teilmenge der euklidischen Ebene aber nicht. Daher sagt man auch genauer, die Menge A ist offen in E , wenn man Missverständnisse ausschließen will. Eine intrinsische Eigenschaft ist zum Beispiel die Kompaktheit einer Menge, die wir in Abschnitt 6-d betrachten. 152 6 18 topologische grundbegriffe 6-c Abgeschlossene Mengen Abgeschlossene Mengen sind als Komplemente offener Mengen erklärt. Definition Eine Teilmenge A eines normierten Raumes E heißt abgeschlossen, wenn ihr Komplement Ac offen in E ist. Ï Der folgende Satz beschreibt die grundlegenden topologischen Eigenschaften abgeschlossener Mengen. 6.22 Satz In einem normierten Raum E gilt: (i) ∅ und E sind abgeschlossen. (ii) Der Durchschnitt beliebig vieler abgeschlossener Mengen ist abgeschlossen. (iii) Die Vereinigung endlich vieler abgeschlossener Mengen ist abgeschlossen. Ï Y Y Y Y Y Für beliebige Familien von Teilmengen eines Raumes gelten die Regeln von de Morgan, [ c \ \ c [ A = λ Acλ , A = λ Acλ . λ λ λ λ Damit folgen alle Aussagen über abgeschlossene Mengen aus den entsprechenden Aussagen über offene Mengen, indem man die Komplemente betrachtet. Die Details seien als Übungsaufgabe überlassen. Y Y Y Y Y 6.23 ¸ a. Die Intervalle ∅ und R sind abgeschlossen und offen, denn ∅c = R und Rc = ∅ . b. Jedes abgeschlossene Intervall [a, b] ist abgeschlossen, denn c [a, b] = (−∞, a) ∪ (b, ∞) ist offen. Ebenso sind [a, ∞) und (−∞, b] abgeschlossen. · 6-12 Abgeschlossene Menge A und abgeschlossene Kugel B̄r (a) Uδ (b) b Uδ (b) b A a r B̄r (a) 6 19 153 6 stetigkeit c. Die abgeschlossenen Kugeln B̄r (a) Í {x ∈ E : kx − ak à r } , r á 0, sind abgeschlossen. Denn für jedes b ∉ B̄r (a) gilt Uδ (b) ∩ B̄r (a) = ∅, δ = kb − ak − r > 0, wie man durch ein Widerspruchsargument zeigt. Also ist das Komplement von B̄r (a) offen. d. Einpunktige Mengen sind abgeschlossen, denn {a} = B̄0 (a) . Also ist auch jede endliche Teilmenge eines beliebigen normierten Raumes abgeschlossen. e. Halboffene beschränkte Intervalle, also [a, b) und (a, b] , sind weder offen noch abgeschlossen. f. Die Vereinigung unendlich vieler abgeschlossener Mengen ist im Allgemeinen nicht mehr abgeschlossen. Beispielsweise ist [ −1 + 2−k , 1 − 2−k = (−1, 1). µ ká1 Bemerkung Man beachte, dass ›abgeschlossen‹ nicht die logische Negation von ›offen‹ darstellt. Denn der Gesamtraum und die leere Menge sind gleichzeitig offen und abgeschlossen. Ç Abschluss Um abgeschlossene Mengen besser zu verstehen, definieren wir den Begriff des Häufungspunktes. Definition Ein Punkt a ∈ E heißt Häufungspunkt einer Menge A ⊂ E , wenn in jeder Umgebung von a unendlich viele Punkte von A liegen. Ï Die Menge aller Häufungspunkte von A wird die abgeleitete Menge von A genannt und mit A0 bezeichnet. Diese kann auch leer sein, wie dies zum Beispiel bei endlichen Mengen der Fall ist. ¸ a. A = {1, 2, 3} besitzt keine Häufungspunkte: A0 = ∅ . b. B = {1/n : n á 1} besitzt 0 als einzigen Häufungspunkt: B 0 = {0} . c. Die Menge Q besitzt jede reelle Zahl als Häufungspunkt: Q0 = R . µ Der Abschluss einer Menge A ist definiert als A− Í A ∪ A0 . Der folgende Satz rechtfertigt diese Bezeichnung. 154 6 20 topologische grundbegriffe 6.24 Lemma 6-c Der Abschluss A− einer beliebigen Menge A ist abgeschlossen. Ï Ist b ∉ A− , so ist b ∉ A und b ∉ A0 . Dann existiert eine Umgebung des Punktes b , die nur endlich viele Punkte von A enthält, wobei b selbst nicht dazu gehört. Das Minimum ihrer Abstände zu b ist deshalb eine positive Zahl δ . Die Umgebung Uδ (b) enthält dann keinen Punkt von A und ist somit ganz im Komplement von A− enthalten. Da für jeden Punkt im Komplement von A− eine solche Umgebung existiert, ist dieses offen. Also ist A− selbst abgeschlossen. Y Y Y Y Y YYYYY 6.25 Lemma Für eine Teilmenge A eines normierten Raumes E sind äquivalent: (i) A0 ⊂ A . (ii) A = A− . (iii) A ist abgeschlossen. Ï (i) ⇒ (ii) Aus A0 ⊂ A folgt natürlich A− = A ∪ A0 = A . (ii) ⇒ (iii) Das ist der letzte Satz. (iii) ⇒ (i) Ist A abgeschlossen, so ist Ac offen, und jeder Punkt in Ac enthält eine von A disjunkte Umgebung. Also kann kein Punkt von Ac Häufungspunkt von A sein, und es muss A0 ⊂ A gelten. Y Y Y Y Y YYYYY Schließlich charakterisieren wir abgeschlossene Mengen noch durch ein Folgenkriterium. 6.26 Charakterisierung abgeschlossener Mengen Eine Teilmenge A eines normierten Raumes E ist abgeschlossen genau dann, wenn jede Folge in A , die in E konvergiert, ihren Grenzwert in A hat. Ï ⇒ Sei (an ) eine Folge in A mit Grenzwert a in E . Ist a selber ein Folgenglied, so ist a ∈ A . Andernfalls ist a Häufungspunkt von A und damit a ∈ A0 . Nach Voraussetzung ist aber A0 ⊂ A . ⇐ Ist a ∈ A0 , so existiert eine Folge (an ) in A mit an → a . Nach Voraussetzung ist dann a ∈ A . Also gilt A0 ⊂ A und damit A− = A . Y Y Y Y Y YYYYY Offener Kern und Rand Wir haben damit abgeschlossene Mengen für unsere Zwecke hinreichend charakterisiert. Da diese als Komplemente offener Mengen definiert sind, erhalten wir auch eine entsprechende Charakterisierung offener Mengen. Definition Ein Punkt a ∈ E heißt innerer Punkt einer Menge A ⊂ E , wenn A eine δ-Umgebung von a enthält. Ï 6 21 155 6 stetigkeit Die Menge aller inneren Punkte von A heißt offener Kern von A und wird mit A◦ bezeichnet. 6.27 Notiz Der offene Kern A◦ einer beliebigen Menge A ist offen. Ï Ist A◦ leer, so sind wir fertig. Ist a ∈ A◦ , so enthält A eine Umgebung Uδ (a) . Dann ist auch jeder Punkt von Uδ (a) ein innerer Punkt von A . Es gilt somit Uδ (a) ⊂ A◦ . Also ist A◦ offen. Y Y Y Y Y YYYYY 6.28 Charakterisierung offener Mengen Eine Teilmenge A eines normierten Raums E ist offen genau dann, wenn jeder Punkt von A ein innerer Punkt von A ist, also A = A◦ gilt. Ï Ist A offen, so ist jeder Punkt von A auch innerer Punkt von A und deshalb A = A◦ . Gilt umgekehrt A = A◦ , so ist A nach dem vorangehenden Satz offen. Y Y Y Y Y YYYYY ¸ a. Für I = [a, b) ⊂ R ist I ◦ = (a, b) und I − = [a, b] . b. Für A = [a, b) × {0} ⊂ R2 dagegen ist A◦ = ∅, A− = [a, b] × {0} . c. Für die offene Kugel M = Br (a) mit r > 0 ist M ◦ = M, M − = B̄r (a). µ Offensichtlich gilt A◦ ⊂ A ⊂ A− für jede Menge A in E . Die Differenz aus Abschluss und Innerem bezeichent man als Rand einer Menge. Definition und Satz Der Rand einer Menge A ⊂ E ist die Menge ∂A Í A− Ø A◦ . Der Rand einer Menge ist abgeschlossen, und es ist a ∈ ∂A genau dann, wenn jede Umgebung von a sowohl A also auch Ac trifft. Ï YYYYY Es ist ∂A = A− ∩ (A◦ )c . Daraus folgen beide Behauptungen. Y Y Y Y Y ¸ a. ∂∅ = ∅ und ∂E = ∅ . b. ∂ [a, b] = ∂ (a, b) = {a, b } . c. Für A = [a, b] × {0} ⊂ R2 ist ∂A = A . d. Für jede Menge A gilt ∂(∂A) = ∂A . µ 156 6 22 topologische grundbegriffe 6-c Stetigkeit Wir wollen nun Stetigkeit mit Hilfe von offenen Mengen charakterisieren. Da wir Abbildungen mit beliebigen Definitionsbereichen zulassen, benötigen wir hierzu noch den Begriff der relativen Umgebung. Definition Ist D ⊂ E eine beliebige Teilmenge und a ∈ D , so heißt Uδ (a) ∩ D, δ > 0, eine D-relative oder kurz relative δ-Umgebung von a . Eine Teilmenge A ⊂ D heißt relativ offen, wenn A mit jedem Punkt a auch eine relative Umgebung von a enthält. Ï ¸ a. Ist D offen, so ist eine Teilmenge A ⊂ D relativ offen genau dann, wenn sie offen ist. Denn für jeden Punkt a ∈ D gibt es ein δ > 0 , so dass Uδ (a) ⊂ D . b. Für D = [a, b] gilt Uδ (a) ∩ [a, b] = [a, a + δ) , 0 < δ < b − a. Also ist jedes jedes halboffene Intervall [a, a + δ) mit 0 < δ < b − a eine relativ offene Umgebung von a . µ Es gilt nun folgender fundamentale Zusammenhang zwischen stetigen Abbildungen und offenen Mengen. Zuerst die lokale Situation. 6.29 Satz Eine Abbildung f : E ⊃ D → F ist stetig in a ∈ D genau dann, wenn das Urbild jeder ε-Umgebung von f (a) eine relative δ-Umgebung von a enthält. Ï YYYYY ⇒ Sei f stetig in a , und Uε (f (a)) eine ε-Umgebung von f (a) . Dann existiert zu diesem ε ein positives δ , so dass f (Uδ (a) ∩ D) ⊂ Uε (f (a)). (5) Also gilt auch · 6-13 Relative δ-Umgebungen a Uδ (a) ∩ [a, b] Uδ (a) ∩ D a a+δ b D 6 23 157 6 stetigkeit Uδ (a) ∩ D ⊂ f −1 (Uε (f (a))). (6) Somit enthält die rechts stehende Menge wie gefordert eine relative δ-Umgebung von a . ⇐ Sei ε > 0 . Dann enthält das Urbild der ε-Umgebung von f (a) eine relative δ-Umgebung von a . Es gilt also (6) mit einem geeigneten δ > 0 . Dann gilt aber auch (5). Also ist f in a stetig. Y Y Y Y Y 6.30 Satz Eine Abbildung f : E ⊃ D → F ist stetig auf D genau dann, wenn das Urbild jeder offenen Menge relativ offen ist. Ï ⇒ Sei W ⊂ F eine beliebige offene Teilmenge und V = f −1 (W ) . Ist V leer, so ist nichts zu tun. Ist a ∈ V , so ist f (a) ∈ W , und W enthält eine ε-Umgebung von f (a) . Aufgrund des vorangehenden Satzes enthält V eine relative δ-Umgebung von a . Da dies für jedes a ∈ V gilt, ist V relativ offen. ⇐ Mit dem vorangehenden Satz folgt, dass f in jedem Punkt von D stetig ist. Also ist f auf ganz D stetig. Y Y Y Y Y YYYYY Dieser Satz ist in zweierlei Hinsicht wichtig. Einerseits charakterisiert er Stetigkeit durch eine topologische Eigenschaft, indem er nur Bezug auf offene und relativ-offene Teilmengen nimmt. Dies ermöglicht es, Stetigkeit in allgemeinen topologischen Räumen zu definieren, in denen keine Norm oder eine allgemeinere Metrik zur Verfügung steht. Dies wird uns allerdings im Rahmen dieser Analysis nicht beschäftigen. Andererseits ermöglicht er uns, Mengen als offen zu erkennen, die als Urbilder offener Mengen unter stetigen Abbildungen dargestellt werden können. Dasselbe gilt für abgeschlossene Mengen als Komplemente offener Mengen: 6.31 Korollar Ist f : E → F stetig, so ist das Urbild jeder abgeschlossenen Menge in F eine abgeschlossene Menge in E . Ï Dies folgt aus f −1 (Ac ) = (f −1 (A))c . Y Y Y Y Y YYYYY · 6-14 Stetiges Urbild einer ε-Umgebung mit relativer δ-Umgebung f D a f (a) Uδ (a) 158 6 24 Uε (f (a)) stetigkeit und kompaktheit 6-d ¸ a. Ist f : E → R stetig, so ist die Nullstellenmenge von f , N(f ) Í {a ∈ E : f (a) = 0} , abgeschlossen, denn diese ist das Urbild der abgeschlossenen Menge {0} . b. In einem normierten Raum sind die Einheitssphäre und Einheitskugel, S Í {a ∈ E : kak = 1} , B Í {a ∈ E : kak à 1} , abgeschlossen. Denn diese sind die Urbilder der abgeschlossen Mengen {1} respektive [0, 1] unter der stetigen Funktion k·k : E → R . µ 6-d s t e t i g k e i t u n d kompaktheit Der Zwischenwertsatz von Bolzano und der Umkehrsatz für monotone Funktionen basieren auf der Anordnung der reellen Zahlen in einem Intervall. Sie lassen sich daher nicht ohne Weiteres auf Definitionsbereiche in beliebigen Vektorräumen verallgemeinern. Beim Satz vom Minimum und Maximum dagegen ist dies möglich. Voraussetzung ist allerdings, dass der Definitionsbereich eine spezielle topologische Eigenschaft aufweist: er muss kompakt sein. Kompakte Mengen Definition Eine Teilmenge K eines normierten Raumes E heißt kompakt, wenn jede Folge in K eine in K konvergente Teilfolge besitzt. Ï Wesentlich ist, dass die Teilfolge nicht nur konvergent ist, sondern dass ihr Grenzwert ebenfalls in der Menge K liegt. ¸ a. Die leere Menge ∅ ist kompakt. b. Jede endliche Teilmenge eines beliebigen normierten Raumes E ist kompakt. Denn eine beliebige Folge in K muss wenigstens einen Punkt unendlich oft enthalten. Die entsprechende Teilfolge ist dann konvergent in K . c. Ein abgeschlossenes Intervall ist kompakt 6.36 . d. Ein offenes Intervall ist nicht kompakt. µ Zunächst zwei einfache Beobachtungen, wie wir aus kompakten Mengen weitere kompakte Mengen erhalten. 6.32 Lemma Die Vereinigung endlich vieler kompakter Mengen ist kompakt. Ï 6 25 159 6 stetigkeit Seien K1 , . . . , Kn kompakte Mengen, und YYYYY K = K1 ∪ · · · ∪ Kn . Ist (an ) eine Folge in K , so muss wenigstens eine Menge Km unendlich viele Folgenglieder enthalten. Die aus diesen Gliedern gebildete Teilfolge ist dann ganz in Km enthalten. Da Km kompakt ist, enthält sie ihrerseits eine in Km konvergente Teilfolge. Diese zweite Teilfolge ist dann auch in der Obermenge K konvergent. Somit ist K kompakt. Y Y Y Y Y 6.33 Jede abgeschlossene Teilmenge einer kompakten Menge ist kompakt. Ï Lemma Y Y Y Y Y Sei A ⊂ K eine abgeschlossene Teilmenge der kompakten Menge K . Ist (an ) eine Folge in A , so auch in K . Sie besitzt somit eine in K konvergente Teilfolge. Wegen 6.26 gehört deren Grenzwert zu A . Y Y Y Y Y Wir notieren jetzt zwei notwendige Eigenschaften einer kompakten Menge. 6.34 Satz Eine kompakte Teilmenge eines normierten Raumes ist abgeschlossen und beschränkt. Ï Y Y Y Y Y Sei K ⊂ E kompakt. Ist a ein Häufungspunkt von K , so ist a auch Grenzwert einer Folge in K . Folglich gehört auch a zu K , da K kompakt ist. K enthält somit alle seine Häufungspunkte und ist damit abgeschlossen. Angenommen, K ist nicht beschränkt. Dann existiert zu jedem n á 1 ein an ∈ K mit kan k á n . Die so gewonnene Folge (an ) in K besitzt keine konvergente Teilfolge, denn für jeden Punkt a ∈ E gilt kan − ak á kan k − kak á n − kak á 1, n á kak + 1. Das aber widerspricht der Kompaktheit von K . Also ist K beschränkt. Y Y Y Y Y Die Umkehrung dieses Satzes gilt im Allgemeinen nicht. Genauer gesagt ist in einem unendlich dimensionalen Vektorraum eine abgeschlossene und beschränkte Menge im Allgemeinen nicht kompakt. ¸ Betrachte die abgeschlossene Einheitskugel B im Folgenraum c , und darin die Folge (em )má1 der Einheitsfolgen, wo em aus einer 1 an m-ter Stelle und 0 an allen anderen Stellen besteht. Wegen kem − en k = 1, m ≠ n, kann diese Folge keine konvergente Teilfolge besitzen. µ Die Umkehrung des letzten Satzes gilt jedoch in endlich-dimensionalen Räumen: 160 6 26 stetigkeit und kompaktheit 6.35 Satz 6-d Eine Teilmenge von R , C oder Rn ist kompakt genau dann, wenn sie abgeschlossen und beschränkt in der euklidischen Norm ist. Ï ⇒ Dies ist der vorangehende Satz. ⇐ Sei K abgeschlossen und beschränkt, und (an ) eine Folge in K . Da K beschränkt ist, existiert nach dem Satz von Bolzano-Weierstraß eine konvergente Teilfolge. Da K abgeschlossen ist, gehört deren Grenzwert ebenfalls zu K . Also besitzt (an ) eine in K konvergente Teilfolge. Y Y Y Y Y YYYYY 6.36 ¸ a. Unter allen Intervallen sind genau die abgeschlossenen Intervalle [a, b] kompakt. b. Jede endliche Vereinigung abgeschlossener Intervalle ist kompakt. c. Die abgeschlossene Einheitskugel B und die Einheitssphäre S im Rn sind kompakt. µ Stetige Abbildungen auf kompakten Mengen Wir haben bereits gesehen, dass das stetige Bild eines abgeschlossenen Intervalls wieder ein abgeschlossenes Intervall ist. Tatsächlich ist dies ein Spezialfall des folgenden Satzes über stetige Bilder kompakter Mengen. 6.37 Ist K ⊂ E kompakt und f : K → F stetig, so ist auch f (K) kompakt. Ï Satz Sei (bn ) eine beliebige Folge in f (K) . Zu jedem n existiert mindestens ein an ∈ K mit bn = f (an ) . Die so gewonnene Folge (an ) besitzt in der kompakten Menge K eine konvergente Teilfolge (ank ) mit Grenzwert a ∈ K . Aufgrund der Stetigkeit von f gilt für die entsprechende Teilfolge (bnk ) , dass YYYYY bnk = f (ank ) → f (a) ∈ f (K). Somit besitzt (bn ) eine in f (K) konvergente Teilfolge. Da dies für jede beliebige Folge in f (K) gilt, ist diese Menge kompakt. Y Y Y Y Y Bisher war der Bildraum ein beliebiger normierter Raum F . Jetzt betrachten wir speziell reellwertige Funktionen auf kompakten Mengen. 6.38 Zweiter Satz vom Minimum und Maximum Ist K ⊂ E kompakt und f : K → R stetig, so existieren Punkte u und v in K mit f (u) à f (x) à f (v), x ∈ K. Insbesondere gilt f (u) = inf f = min f , K K f (v) = sup f = max f . K Ï K 6 27 161 6 stetigkeit · 6-15 δ-Umgebungen von a in äquivalenten Normen a Wie im Fall des abgeschlossenen Intervalls nimmt die Funktion f auf K also ihr Infimum und Supremum an. Insbesondere ist jede stetige, reellwertige Funktion auf einer kompakten Menge beschränkt. Y Y Y Y Y Nach dem vorangehenden Satz ist f (K) kompakt in R und damit beschränkt. Also ist zum Beispiel m = infK f > −∞ . Wie im vorangehenden Beweis existiert eine Folge (an ) in K mit f (an ) → m . Da K kompakt ist, existiert eine konvergente Teilfolge (ank ) mit Grenzwert u ∈ K . Aufgrund der Stetigkeit von f gilt dann f (u) = lim f (ank ) = lim f (an ) = m. Das Infimum wird also an der Stelle u angenommen. Entsprechend argumentiert man für das Supremum. Y Y Y Y Y Normen auf Rn R 6.39 n Als Anwendung des letzten Satzes zeigen wir, dass alle Normen auf dem äquivalent sind im Sinne der folgenden Definition. Definition Zwei Normen k·ka und k·kb auf einem Vektorraum E heißen äquivalent, wenn es eine Konstante c > 0 gibt, so dass c −1 kxka à kxkb à c kxka , x ∈ E. Ï Geometrisch betrachtet sind zwei Normen äquivalent, wenn jede ε-Umgebung in der einen Norm eine δ-Umgebung bezüglich der anderen Norm enthält. Beide Normen definieren dann dieselben offenen und abgeschlossenen Mengen, oder wie man sagt, dieselbe Topologie. Damit ist auch der Stetigkeitsbegriff derselbe: Eine Abbildung, die bezüglich einer Norm stetig ist, ist es auch bezüglich jeder äquivalenten Norm. Offensichtlich stellt die Äquivalenz von Normen eine Äquivalenzrelation dar. Um die Äquivalenz aller Normen auf dem Rn zu zeigen, genügt es daher, ihre Äquivalenz zur euklidischen Norm zu zeigen. 162 6 28 stetigkeit und kompaktheit 6.40 6-d Lemma Auf dem Rn ist jede Norm lipschitzstetig bezüglich der euklidischen Norm k·ke . Ï Sei N eine Norm auf Rn . Schreiben wir x = x1 e1 +· · ·+xn en bezüglich der Standardbasis des Rn , so folgt aus den Normeigenschaften von N , dass YYYYY N(x) = N(x1 e1 + · · · + xn en ) à |x1 | N(e1 ) + · · · + |xn | N(en ) à (N(e1 ) + · · · + N(en )) max {|x1 | , . . . , |xn |} = L kxk∞ , L = N(e1 ) + · · · + N(en ) . Mit der umgekehrten Dreiecksungleichung für N und kxk∞ à kxke erhalten wir hieraus N(u) − N(v) à N(u − v) à L ku − vk∞ à L ku − vke für alle u, v ∈ Rn . Also ist N lipschitzstetig. Y Y Y Y Y 6.41 Satz Jede Norm auf dem Rn ist äquivalent zur euklidischen Norm. Ï Sei N eine Norm auf Rn . Die Einheitssphäre S = {x ∈ Rn : kxke = 1} bezüglich der euklidischen Norm ist abgeschlossen und beschränkt, somit kompakt. Da N nach dem vorangehenden Lemma stetig bezüglich der euklidischen Norm ist, nimmt N auf S ihr Minimum und Maximum an. Das Minimum kann nicht Null sein, denn N nimmt den Wert 0 nur im Nullpunkt an, und der gehört nicht zu S . Somit existieren Konstanten 0 < m à M mit YYYYY m à N(x) à M, x ∈ S. Für beliebiges 0 ≠ x ∈ Rn gilt dann aufgrund der positiven Homogenität von N N(x) = N(x̃) kxke , x̃ = x ∈ S. kxke Zusammen mit der letzten Abschätzung von N auf S folgt daraus m kxke à N(x) à M kxke , x ≠ 0. Dies gilt offensichtlich auch für x = 0 , und wir sind fertig. Y Y Y Y Y Auf dem Rn sind also alle Normen äquivalent. Für Stetigkeitsaussagen über Funktionen auf dem Rn ist es daher nicht notwendig, die Norm zu spezifizieren. 6 29 163 6 stetigkeit Gleichmäßige Stetigkeit Die Stetigkeit einer Abbildung f : D → F ist gleichbedeutend mit ∀ ∀ ∃ ∀ a∈D ε>0 δ>0 x∈Uδ (a)∩D |f (x) − f (a)|F < ε. Hierbei hängt die Wahl von δ im Allgemeinen auch vom Punkt a ab. ›Funktioniert‹ dagegen ein δ für alle a , so spricht man von gleichmäßiger Stetigkeit. Definition Eine Abbildung f : D → F heißt gleichmäßig stetig auf D , wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass für alle a, x ∈ D gilt: |x − a|E < δ ⇒ |f (x) − f (a)|F < ε. Ï Bei einer gleichmäßig stetigen Funktion bewirkt eine Änderung des Arguments um δ eine Änderung des Funktionswertes um höchstens ε an jeder beliebigen Stelle des Definitionsbereiches. Mit Quantoren ausgedrückt, ∀ ∃ ∀ ∀ ε>0 δ>0 a∈D x∈Uδ (a)∩D |f (x) − f (a)|F < ε. ¸ a. Jede lipschitzstetige Abbildung ist gleichmäßig stetig. Der Beweis ist genau der Beweis von Lemma 6.10. b. Die Funktion t , t −1 ist nicht gleichmäßig stetig auf (0, ∞) . Denn für die Folge der Punkte tn = 1/n gilt 1 1 → 0, |tn+1 − tn | = − n + 1 n aber |f (tn+1 ) − f (tn )| = |n + 1 − n| = 1, n á 1. Zu 0 < ε < 1 gibt es daher kein δ > 0 mit der erforderlichen Eigenschaft. µ Eine stetige Funktion ist nicht notwendigerweise gleichmäßig stetig. Auf kompakten Definitionsbereichen ist das jedoch anders. 6.42 Ist K ⊂ E kompakt und f : K → F stetig, so ist f gleichmäßig stetig. Ï Satz Angenommen, f ist auf K nicht gleichmäßig stetig. Dann existieren ein ε > 0 , und zu jedem n á 1 zwei Punkte un ≠ vn in K mit YYYYY |un − vn |E < 1 , n |f (un ) − f (vn )|F á ε. Da K kompakt ist, besitzt die Folge (un ) eine konvergente Teilfolge (unk ) mit Grenzwert a in K . Wegen |un − vn |E < 1/n konvergiert auch (vnk ) gegen 164 6 30 funktionsgrenzwerte 6-e denselben Grenzwert a . Aus der Stetigkeit von f folgt dann aber für hinreichend große k die Ungleichung |f (unk ) − f (vnk )|F à |f (unk ) − f (a)|F + |f (vnk ) − f (a|F < ε/2 + ε/2 = ε, ein offensichtlicher Widerspruch. Y Y Y Y Y √ ¸ Die Wurzelfunktion · ist auf jedem kompakten Intervall [0, b] gleichmäßig stetig, aber nicht lipschitzstetig. µ Wir werden diesen Satz erst in der mehrdimensionalen Analysis benötigen, zum Beispiel bei der Vertauschbarkeit von Differenziation und Integration ?? . 6-e f u n k t i o n s g r e n z werte Ist eine Funktion f in einem Punkt a ihres Definitionsbereichs stetig, so ist f (a) = lim f (xn ) n→∞ für jede Folge (xn ) im Definitionsbereich von f , die gegen a konvergiert. Ein solcher Grenzwert kann aber auch existieren, wenn f im Punkt a gar nicht definiert oder dort unstetig ist – siehe Beispiele 6.48 unten. Wir wollen daher solche Grenzwerte unabhängig von einem eventuell vorliegenden Funktionswert definieren. Sei dazu U̇δ (a) Í Uδ (a) Ø {a} = {x ∈ E : 0 < kx − akE < δ} die punktierte δ-Umgebung des Punktes a ∈ E . 6.43 Definition Sei a ein Häufungspunkt des Definitionsbereichs von f : D → F . Dann heißt w ∈ F Grenzwert von f im Punkt a , geschrieben lim f (x) = w, (7) x→a wenn für jedes ε > 0 ein δ > 0 existiert, so dass f (U̇δ (a) ∩ D) ⊂ Uε (w). Ï Man beachte, dass die Funktion f an der Stelle a selbst nicht ausgewertet wird und somit nicht definiert zu sein braucht. Andererseits ist U̇δ (a) ∩ D für alle δ > 0 nicht leer, da a als Häufungspunkt von D vorausgesetzt wird. 6 31 165 6 6.44 stetigkeit Folgenkriterium für Grenzwerte Sei a ein Häufungspunkt des Definitionsbereiches von f : D → F . Dann gilt limx→a f (x) = w genau dann, wenn lim f (xn ) = w n→∞ für jede gegen a konvergierende Folge (xn ) in D Ø {a} . Ï Y Y Y Y Y Der Beweis ist praktisch identisch mit dem Beweis des Folgenkriteriums für Stetigkeit in einem Punkt 6.3 . ⇒ Gilt limx→a f (x) = w , so existiert zu jedem ε > 0 ein δ > 0 , so dass f (U̇δ (a) ∩ D) ⊂ Uε (w). Ist (xn ) eine Folge in D Ø {a} mit Grenzwert a , so existiert zu diesem δ wiederum ein N á 1 , so dass xn ∈ Uδ (a) für alle n á N . Es gilt sogar xn ∈ U̇δ (a) ∩ D, n á N. da die xn ja in D Ø {a} liegen. Also gilt f (xn ) ∈ Uε (w), n á N. Da für jedes ε > 0 solch ein N existiert, gilt limn→∞ f (xn ) = w . ⇐ Angenommen, es gilt nicht limx→a f (x) = w . Da jede punktierte Umgebung von a Punkte aus D enthält, gibt es ein ε > 0 , so dass in jeder punktierten 1/n -Umgebung von a ein xn ∈ D existiert mit f (xn ) ∉ Uε (w). Diese xn bilden eine Folge in D Ø {a} mit Grenzwert a , für die f (xn ) sicher nicht gegen w konvergiert. Y Y Y Y Y Aus diesem Kriterium ergibt sich die folgende Charakterisierung der Stetigkeit, die oft auch als deren Definition dient. 6.45 Korollar Eine Funktion f : D → F ist stetig in einem Häufungspunkt a ∈ D genau dann, wenn limx→a f (x) = f (a) . Ï Natürlich gibt es auch ein 6.46 Cauchykriterium für Funktionsgrenzwerte Sei a Häufungspunkt des Definitionsbereiches von f : D → F . Existiert zu jedem ε > 0 ein δ > 0 , so dass kf (u) − f (v)kF < ε, so existiert limx→a f (x) . Ï 166 6 32 u, v ∈ U̇δ (a) ∩ D, (8) funktionsgrenzwerte 6-e Als Häufungspunkt von D ist a = lim xn mit einer Folge (xn ) in D . Aufgrund der Voraussetzung ist (f (xn )) eine Cauchyfolge in F . Aufgrund der Vollständigkeit von F existiert daher YYYYY w = lim f (xn ). Ersetzen wir in Annahme (8) ε durch ε/2 , f (v) durch f (xn ) und gehen wir zum Grenzwert über, so folgt kf (u) − wkF à ε/2 < ε, u ∈ U̇δ (a) ∩ D. Also gilt limx→a f (x) = w . Y Y Y Y Y Mit dem Folgenkriterium 6.44 erhalten wir außerdem Grenzwertsätze für Funktionen aus den Grenzwertsätzen für Folgen. Wir notieren die Ergebnisse für reelle Funktionen ohne Beweis. 6.47 Grenzwertsätze Sei a ein Häufungspunkt von D . Besitzen die Funktionen f , g : D → R die Grenzwerte lim f (x) = u, x→a lim g(x) = v, x→a so gilt auch (i) lim (λf + µg)(x) = λu + µv x→a für λ, µ ∈ R , (ii) lim (f g)(x) = uv , x→a (iii) lim (f g −1 )(x) = uv −1 , x→a falls v ≠ 0 . Gilt außerdem f à g in einer punktierten Umgebung von a , so ist u à v . Ï Bemerkung Natürlich gilt (i) auch für Abbildungen in einen beliebigen Banachraum F . Ç 6.48 ¸ a. Führt man die Polynomdivision aus, so ist x3 − 1 = lim (x 2 + x + 1) = 3. x→1 x − 1 x→1 lim b. Es ist lim x sin x −1 = 0 x→0 wegen x sin x −1 à |x| für x ≠ 0 . c. Die Funktion x , sin x −1 hat in 0 keinen Grenzwert. d. Die Dirichletfunktion δ besitzt in keinem einzigen Punkt der reellen Gerade einen Grenzwert. µ 6 33 167 6 stetigkeit Einseitige Grenzwerte Auf der reellen Geraden macht es für eine Funktion oft einen Unterschied, ob man sich einem Punkt von links oder rechts nähert. Für eine auf einer Teilmenge D ⊂ R definierten Funktion f erklärt man deshalb noch den linksseitigen Grenzwert f– (a) Í lim f (x) Í lim (f | Da– )(x), x a Da– Í D ∩ (−∞, a), x→a und den rechtsseitigen Grenzwert f+ (a) Í lim f (x) Í lim (f | Da+ )(x), x a Da+ Í D ∩ (a, ∞). x→a Andere übliche Bezeichnungen hierfür sind f (a−) und f (a+) . √ √ ¸ a. Für die Wurzelfunktion gilt limx→0 x = limx 0 x = 0 . b. Für die Vorzeichenfunktion sgn gilt lim sgn(x) = −1 < sgn(0) = 0 < 1 = lim sgn(x). x 0 x 0 c. Für die Gaußklammer [·] : R → R gilt in jedem Punkt m ∈ Z lim [x] = m − 1 < [m] = m = lim [x] . x m x m Man sagt dazu auch, [·] ist in m rechtsseitig stetig. d. Die Funktion x , sin x −1 besitzt in x = 0 weder einen links- noch einen rechtsseitigen Grenzwert. µ Bemerkung Der Grenzwert von f in a existiert genau dann, wenn beide einseitigen Grenzwerte existieren und übereinstimmen: lim f (x) = w a lim f (x) = w = lim f (x). x→a x a x a Ç Monotone Funktionen haben die Eigenschaft, dass ihre einseitigen Grenzwerte immer existieren, ohne jegliche Stetigkeitsannahme. 6.49 Satz Ist f : R → R monoton, so existieren in jedem Punkt die links- und rechtsseitigen Grenzwerte von f , und es gilt sup f = f– (a) à f (a) à f+ (a) = inf f . (−∞,a) Ï (a,∞) Y Y Y Y Y Sei zum Beispiel f monoton steigend. In jedem Punkt a ∈ R existiert dann das Supremum über alle Funkionswerte von f auf (−∞, a) , also fm (a) Í sup f à f (a). (−∞,a) 168 6 34 funktionsgrenzwerte 6-e · 6-16 Einseitige Grenzwerte lim f (x) x a einer monotonen f (a) Funktion lim f (x) x a a Dazu existiert eine Folge (xn ) mit xn a und f (xn ) fm (a) . Aus Monotoniegründen konvergieren dann auch die Funktionswerte entlang jeder anderen, linksseitig gegen a konvergierenden Folge gegen denselben Grenzwert. Also existiert der linksseitige Grenzwert, und es gilt fm (a) = sup f = f– (a) à f (a). (−∞,a) Entsprechend argumentiert man für den rechtsseitigen Grenzwert. Y Y Y Y Y Bemerkung Eine monotone Funktion f : R → R ist stetig in a genau dann, wenn f– (a) = f+ (a) . Andernfalls bezeichnet man die Differenz dieser Grenzwerte als die Sprunghöhe von f in a . Ç Uneigentliche Grenzwerte Für eine Funktion f : D → R mit D ⊂ R sind auch uneigentliche Grenzwerte definiert. Wir müssen dazu nur Umgebungen von ∞ und −∞ wie in Abschnitt 4-f erklären, also zum Beispiel Uδ (∞) = U̇δ (∞) = (δ−1 , ∞), δ > 0. Das Folgenkriterium gilt ebenfalls entsprechend. So ist zum Beispiel ∞ ein Häufungspunkt von D , wenn Uδ (∞) für jedes δ > 0 Punkte von D enthält. Es gilt dann lim f (x) = w, x→∞ wenn es zu jedem ε > 0 ein M > 0 gibt, so dass |f (x) − w| < ε, x ∈ D ∩ (M, ∞). Und dies gilt genau dann, wenn für jede Folge (xn ) in D mit xn → ∞ auch lim f (xn ) = w. n→∞ 6 35 169 6 stetigkeit Entsprechend sind uneigentliche Grenzwerte ±∞ für x → a oder x → ±∞ erklärt, indem in Definition 6.43 die Umgebungen entsprechend interpretiert werden. ¸ a. lim x→∞ 1 1 = lim = 0, x→−∞ x x lim x 0 1 = ∞, x lim x 0 1 = −∞ . x b. Für jedes Polynom p mit p(t) = t n + an−1 t n−1 + · · · + a0 gilt ∞, n gerade, lim p(t) = ∞, lim p(t) = t→∞ t→−∞ −∞, n ungerade. c. Für eine konvergente reelle Folge a = (an ) ist limn→∞ an = limt→∞ a(t) , ¯ ¯ wenn wir die rechts stehende Folge als Funktion a : N → R auffassen. µ ¯ 6-f s t e t i g e f o r t s e t zung Wir haben festgestellt, dass eine Funktion f : D → F in einem Häufungspunkt a ∈ D stetig ist genau dann, wenn f (a) = lim f (x). x→a Existiert andererseits dieser Grenzwert in einem Häufungspunkt a von D , der nicht zu D gehört, so lässt sich mit seiner Hilfe die Funktion f in den Punkt a hinein stetig fortsetzen. 6.50 Satz über stetige Fortsetzung Ist a ∉ D ein Häufungspunkt des Definitionsbereiches der Funktion f : D → F , und existiert der Grenzwert w = lim f (x), x→a so ist die fortgesetzte Funktion f ¯ ¯ f : D ∪ {a} → F , f = w auf D in a stetig in a . Ï Dies folgt aus den Folgenkriterien für die Stetigkeit in einem Punkt und den Funktionsgrenzwert 6.44 . Y Y Y Y Y YYYYY ¸ Die Funktion 170 6 36 6.3 stetige fortsetzung f : R Ø {1} → R, f (x) = 6-f x3 − 1 x−1 von Beispiel 6.48 lässt sich auf R stetig fortsetzen durch f¯(1) = 3 . Hierbei handelt es sich übrigens um die Ableitung von x 3 − 1 im Punkt 1 . µ Besonders einfach und elegant lassen sich lipschitzstetige Abbildungen von beliebigen Mengen auf deren Abschluss fortsetzen. 6.51 Satz Sei D eine beliebige Teilmenge eines normierten Vektorraumes E , sei F ein Banachraum, und f : D → F lipschitzstetig. Dann existiert genau eine stetige Fortsetzung von f auf den Abschluss von D , f¯D = f . f¯ : D − → F , Diese ist ebenfalls lipschitz mit derselben Lipschitzkonstanten wie f . Ï YYYYY Sei f lipschitz auf D mit kf (u) − f (v)kF à L ku − vkE , u, v ∈ D. Ist (xn ) eine Cauchyfolge in D , so ist (f (xn )) eine Cauchyfolge in F , denn kf (xn ) − f (xm )kF à L kxn − xm kE . Wegen der Vollständigkeit von F ist (f (xn )) damit auch konvergent. Der Grenzwert hängt auch nur vom Grenzwert von (xn ) ab und nicht von der Auswahl der Folge. Denn sind (xn ) und (x̃n ) zwei Cauchyfolgen mit demselben Grenzwert, so ist (xn − x̃n ) eine Nullfolge in E , und damit auch (f (xn ) − f (x̃n )) auch eine Nullfolge in F . Also haben (f (xn )) und f (x̃n ) denselben Grenzwert. In jedem Punkt a ∈ D 0 existiert also f¯(a) Í lim f (x). x→a Dies ist auch die einzige Möglichkeit, f stetig auf D − = D ∪ D 0 fortzusetzen. Diese Fortsetzung ist ebenfalls lipschitz. Konvergieren (un ) und (vn ) in D gegen Punkte u und v in D 0 , so gilt kf¯(u) − f¯(v)kF = lim kf (un ) − f (vn )kF n→∞ à lim L kun − vn kE n→∞ = L ku − vkE . Y Y Y Y Y Als Anwendung dieses Satzes definieren wir im nächsten Kapitel das Cauchyintegral für Regelfunktionen als stetige Fortsetzung eines Integrals für Treppenfunktion. 6 37 171 6 stetigkeit 6-g d i e f u n k t i o n e n räume B(D) und C B(D) Sei D eine beliebige Teilmenge eines normierten Raumes E und F (D) Í {f : D → R} der Vektorraum aller reellwertigen Funktionen auf D . Wir wollen Folgen in F (D) , also Folgen von Funktionen auf D , und deren Konvergenz betrachten. Für Folgen in F (D) gibt es vielfältige Möglichkeiten, die Konvergenz gegen eine Funktion f in F (D) zu definieren. Die einfachste ist die punktweise Konvergenz. Definition Eine Folge (fn ) in F (D) konvergiert punktweise gegen eine Funktion f ∈ F (D) , falls fn (x) → f (x) für jedes x ∈ D . Ï Die punktweise Konvergenz betrachtet die Funktionenfolge in jeden Punkt x isoliert und unabhängig von allen anderen Punkten ihres Definitionsbereiches D . Daher ist es möglich – und sogar wahrscheinlich –, dass Eigenschaften der Folgenfunktionen beim Grenzübergang verlorengehen. Dies gilt zum Beispiel für die Stetigkeit, die ja im Mittelpunkt dieses Kapitels steht. ¸ a. Für 0 à t à 1 gilt pn (t) Í t n → 0 0 à t < 1, 1 t = 1. Die stetigen Funktionen pn konvergieren also auf [0, 1] punktweise gegen eine im Punkt 1 unstetige Funktion – siehe Abbildung 6-17. b. Für t ∈ R gilt gn (t) Í nt → sgn(t). 1 + |nt| · 6-17 Die Parabeln t , t n 1 auf [0, 1] und ihre Grenzfunktion 1 172 6 38 die funktionenräume B(D) und C B(D) · 6-18 Die Funktionen t , 6-g nt und ihre Grenzfunktion sgn 1 + |nt| 1 −1 Die stetigen Funktionen gn konvergieren also auf R punktweise gegen die unstetige Signumfunktion – siehe Abbildung 6-18. µ Um dies zu verhindern, benötigen wir eine stärkere Form der Konvergenz. Definition Eine Folge (fn ) in F (D) konvergiert gleichmäßig gegen f ∈ F (D) , geschrieben fn % f , falls für jedes ε > 0 ein N á 1 existiert, so dass |fn (x) − f (x)| < ε für alle x ∈ D und n á N . Ï Anders als bei der punktweisen Konvergenz müssen also alle Punkte den εN-Test gleichzeitig bestehen. Anschaulich bedeutet dies, dass in jedem ε-Schlauch um den Graphen der Grenzfunktion f die Graphen fast aller Funktionen fn liegen müssen – siehe Abbildung 6-19. Unter gleichmäßiger Konvergenz bleibt Stetigkeit nun erhalten. 6.52 Satz Konvergiert die Folge (fn ) in F (D) gleichmäßig gegen f und sind alle fn stetig, so ist auch f stetig. Der gleichmäßige Limes stetiger Funktionen ist somit ebenfalls stetig. Ï Sei a ∈ D und ε > 0 . Da die Fogle (fn ) gleichmäßig konvergiert, existiert ein n á 1 , so dass YYYYY |f (x) − fn (x)| < ε/3, x ∈ D. 6 39 173 6 stetigkeit Da fn stetig ist, existiert ferner zum Punkt a ein δ > 0 , so dass |fn (x) − fn (a)| < ε/3, x ∈ Uδ (a) ∩ D. Daraus folgt für f und alle x ∈ Uδ (a) ∩ D die Abschätzung |f (x) − f (a)| à |f (x) − fn (x)| + |fn (x) − fn (a)| + |fn (a) − f (a)| < ε/3 + ε/3 + ε/3 = ε. Da für jedes a ∈ D und ε > 0 ein solches δ > 0 existiert, ist f stetig. Y Y Y Y Y Interessant ist, dass sich die gleichmäßige Konvergenz in F (D) mithilfe einer Norm ausdrücken lässt. Dazu definieren wir die Supremumsnorm kf kD Í sup |f (x)| . x∈D Für eine unbeschränkte Funktion f ist allerdings kf kD = ∞ , was für eine Norm ja nicht zulässig ist. Erst auf Räumen beschränkter Funktionen wird dies tatsächlich eine Norm. 6.53 Definition und Notiz Die Räume B(D) Í f ∈ F (D) : kf kD < ∞ , CB(D) Í f ∈ B(D) : f ist stetig mit der Supremumsnorm k·kD sind normierte Vektorräume. Ï Linearkombinationen beschränkter Funktionen sind wieder beschränkt. Dasselbe gilt für stetige Funktionen. Somit sind beide Räume Vektorräume, und die Funktion k·kD ist dort per definitionem endlich. Von den Normeigenschaften YYYYY · 6-19 ε ε-Schlauch um f ε f fn 174 6 40 die funktionenräume B(D) und C B(D) 6-g benötigt nur die Dreiecksungleichung etwas Aufmerksamkeit. Es ist aber kf + gkD = sup |f (x) + g(x)| x∈D à sup (|f (x)| + |g(x)|) x∈D à sup |f (x)| + sup |g(x)| = kf kD + kgkD . Y Y Y Y Y x∈D x∈D Konvergenz bezüglich der Supremumsnorm ist nichts anderes als gleichmäßige Konvergenz, denn kfn − f kD < ε ist gleichbedeutend mit |fn (x) − f (x)| < ε, x ∈ D. Zusammen mit dem Satz über den gleichmäßigen Limes stetiger Funktionen können wir daher die vorangehende Notiz verbessern. 6.54 Satz Die Räume B(D) und CB(D) mit der Supremumsnorm sind vollständig, also Banachräume. Ï Y Y Y Y Y Sei (fn ) eine Cauchyfolge in B(D) bezüglich der Supremumsnorm. Dann ist (fn (x)) für jedes x ∈ D eine Cauchyfolge in R und damit wegen der Vollständigkeit von R konvergent. Definieren wir also eine Funktion f : D → F durch f (x) Í lim fn (x), x ∈ D, n→∞ so konvergiert (fn ) punktweise gegen f . Zu zeigen ist, dass auch f ∈ B(D) und (fn ) in der Supremumsnorm gegen f konvergiert, also kfn − f kD → 0 gilt. Aus der Cauchy-Eigenschaft der Folge (fn ) , kfn − fm kD = sup |fn (x) − fm (x)| < ε/2, n, m á N(ε), x∈D folgt aber durch punktweisen Grenzübergang m → ∞ auch |fn (x) − f (x)| à ε/2, n á N(ε), x ∈ D, und damit kfn − f kD < ε, n á N(ε). Also konvergiert (fn ) gleichmäßig gegen f . Mit ε = 1 und einem geeigenten fn folgt außerdem kf kD à kfn kD + 1 < ∞ . Also ist f beschränkt und damit f ∈ B(D) . 6 41 175 6 stetigkeit Damit ist gezeigt, dass jede Cauchyfolge in B(D) einen Grenzwert in diesem Raum hat. Also ist B(D) vollständig. Sind alle fn außerdem stetig, so ist wegen 6.52 auch f als deren gleichmäßiger Limes stetig. Also hat eine Cauchyfolge in CB(D) einen Grenzwert, der ebenfalls wieder zu CB(D) gehört. Also ist auch dieser Raum vollständig. Y Y Y Y Y Der vorangehende Satz macht keine Annahmen über den Definitionsbereich D . Dies kann zum Beispiel auch der Gesamtraum sein. Besonders elegant ist der Sachverhalt allerdings für kompakte Definitionsbereiche, da wir hier die Beschränktheit für stetige Funktionen nicht explizit fordern müssen. Sei dazu C(D) Í f ∈ F (D) : f ist stetig . Es ist dann CB(D) = C(D) ∩ B(D) . 6.55 Korollar Ist K kompakt, so ist C(K) mit der Supremumsnorm vollständig. Ï Nach dem zweiten Satz vom Minimum und Maximum 6.38 ist jede stetige Funktion auf einer kompakten Menge beschränkt. Für kompakte Mengen gilt deshalb YYYYY C(K) = CB(K). Die Behauptung folgt dann aus dem letzten Satz. Y Y Y Y Y Wir werden dieses Korollar vor allem auf die Räume C([a, b]) stetiger reeller Funktionen auf kompakten Intervallen anwenden. Bemerkung Alles Vorhergehende gilt auch für Abbildungen in einen beliebigen Banachraum F . So bildet C(D, F ) Í f : D → F stetig einen Vektorraum, und der Unterraum CB(D, F ) Í f ∈ C(D, F ) : kf kD,F Í supx∈D kf (x)kF < ∞ bildet einen Banachraum. Dasselbe gilt für C(K, F ) , wenn K kompakt ist. Die Beweise sind praktisch dieselben. Ç 176 6 42 aufgaben 6 aufgaben 1 Gegeben sind zwei Funktionen f , g : R → R . Welche der folgenden Aussagen sind wahr? a. Ist f ist beschränkt, so nimmt f sein Maximum an. b. Ist f ist beschränkt, so ist f lipschitz. c. Ist f ◦ g stetig, so ist f stetig. d. Ist f stetig, so existiert limx→∞ f (x) . e. 2 Sind f und g unstetig, so auch f ◦ g . Welche Aussagen über eine Funktion f : [0, 1] → R sind wahr? a. Ist f monoton, so ist f beschränkt. b. Ist f unbeschränkt, so ist f nicht stetig. c. Wechselt f das Vorzeichen, so hat f eine Nullstelle. d. Nimmt f ihr Minimum und Maximum an, so ist f stetig. e. 3 Ist f injektiv und stetig, so ist f streng monoton. Welche der folgenden Aussagen über Teilmengen des Rn sind wahr? a. Eine abgeschlossene Menge ist kompakt. b. Eine offene Menge enthält nur innere Punkte. c. Ist eine Menge nicht offen, so ist sie abgeschlossen. d. Eine Menge kann nicht gleichzeitig offen und abgeschlossen sein. e. Ein Randpunkt einer Menge ist immer auch ein Häufungspunkt dieser Menge. f. Ist der Rand einer Menge leer, so ist die Menge offen. g. Enthält eine Menge keinen Häufungspunkt, so ist sie nicht offen. 4 Was ist wahr? Konvergiert eine Folge (fn ) stetiger Funktionen fn : [0, 1] → R a. gegen eine stetige Funktion, so ist die Konvergenz gleichmäßig. b. gegen eine unstetige Funktion, so ist die Konvergenz nicht gleichmäßig. c. punktweise, dann auch gleichmäßig. d. punktweise, aber nicht gleichmäßig, so ist die Grenzfunktion unstetig. 5 Zeigen Sie, dass jede Funktion f : D → R in einem isolierten Punkt stetig ist. Dabei heißt ein Punkt a ∈ D isolierter Punkt von D , wenn es ein δ > 0 gibt, so dass Uδ (a) ∩ D = {a} . 6 7 Sind die Funktionen f , g : D → R stetig, so auch f ∧ g : D → R, (f ∧ g)(x) = max {f (x), g(x)} , f ∨ g : D → R, (f ∨ g)(x) = min {f (x), g(x)} . Zeigen Sie, dass die Funktion h : R → (−1, 1) , t, t 1 + |t| bijektiv ist, und dass h und h−1 stetig sind. 6 43 177 6 8 stetigkeit Ist die Funktion f : Q → Q, x, 0, x< 1, x> √ √ 2, 2 stetig? Gilt der Zwischenwertsatz? 9 Ist f : D → F lipschitzstetig, so ist [f ]D Í sup u≠v u,v∈D kf (u) − f (v)kF ku − vkE die kleinstmögliche Lipschitzkonstante auf D . 10 Die Thomaefunktion – eine Art modifizierte Dirichletfunktion – ist definiert durch 0, x∉Q τ : R → R, τ(x) Í 1/q, x = p/q mit teilerfremden p, q und q > 0. Zeigen Sie: τ ist in jedem rationalen Punkt unstetig und sonst stetig. 11 Die Parabel t , t 2 ist auf jedem kompakten Intervall lipschitzstetig, nicht aber auf der gesamten reellen Geraden. 12 Sei I ein offenes Intervall, und f : I → R im Punkt a ∈ I stetig. Dann existiert zu jedem ε > 0 ein δ > 0 , so dass |f (x)| á (1 − ε) |f (a)| , x ∈ Uδ (a). Gilt entsprechend auch |f (x)| à (1 + ε) |f (a)| ? 13 14 Zeigen Sie, dass jede lineare Abbildung A : Rn → Rm lipschitzstetig ist. Sei f : [a, b] → R monoton, und Jε = {t ∈ [a, b] : |f+ (t) − f– (t)| > ε } die Menge aller Sprungstellen größer als ε . Zeigen Sie: a. Für jedes ε > 0 ist Jε endlich. b. Die Menge aller Sprungstellen von f ist abzählbar. 15 Sei (E, k · k) ein normierter Raum und M ⊂ X nichtleer. Zeigen Sie, dass die Abstandsfunktion dM : E → R, dM (x) Í inf kx − mk m∈M lipschitzstetig ist mit Lipschitzkonstante 1 . 16 Sei h·, ·i ein Skalarprodukt auf einem reellen Vektorraum E . Zeigen Sie, dass für jedes l ∈ E die Linearform E → R , x , hl, xi lipschitzstetig ist. 17 Es gibt keine stetige Funktion f : R → R , die jeden Wert ihres Wertebereiches f (R) genau zweimal annimmt. 178 6 44 aufgaben 18 6 Sei I = [a, b] und f : I → I stetig. Zeigen Sie, dass f mindestens einen Fixpunkt besitzt, also einen Punkt p ∈ I mit f (p) = p . 19 Ist eine Funktion [a, b] → R stetig und injektiv, so ist sie streng monoton. 20 Für die Funktion f : [0, 1] → [0, 1] , f (t) = t t rational 1−t t irrational zeige man: 21 a. f ist bijektiv. b. f ist auf keinem Teilintervall monoton. c. f ist nur im Punkt 1/2 stetig. Es seien an > 0 für alle n á 1 und P ná1 an konvergent. Zu einer Abzählung q von Q definiere man dann f : R → R, X f (t) = an . n : q(n)àt Dann ist f a. streng monoton, b. in jedem irrationalen Punkt stetig, c. 22 in jeder rationalen Zahl r unstetig mit Sprunghöhe an , wobei q(n) = r . Ist f : [0, 1] → [0, 1] stetig mit f (0) = f (1) = 0 , so existiert zu jedem n á 1 ein Punkt x ∈ [0, 1] mit f (x) = f (x + 1/n) für x ∈ In = [0, 1 − 1/n] . 23 Zeigen Sie für Teilmengen eines normierten Raumes E die folgenden Aussagen: a. d. 24 A ⊂ B ⇒ A− ⊂ B − . ◦ b. (A ∪ B)− = A− ∪ B − . c. (A− )− = A− . − A = E Ø (E Ø A) . Zeigen Sie, dass der Abschluss einer Teilmenge A ⊂ E die kleinste abgeschlossene Menge ist, die A enthält: \ A− = {F ⊂ E : A ⊂ F ∧ F abgeschlossen} . 25 Beweisen oder widerlegen Sie für Teilmengen A, B eines normierten Raumes die folgenden Aussagen. a. (A ∪ B)◦ = A◦ ∪ B ◦ . b. (A ∩ B)◦ = A◦ ∩ B ◦ . 26 Bestimmen Sie alle kompakten Teilmengen von {0} ∪ {1/n : n ∈ N} ⊂ R . 27 Es seien E und F normierte Räume. Dann ist f : E → F stetig genau dann, wenn f (A− ) ⊂ (f (A))− für jede Teilmenge A ⊂ E . 6 45 179 6 28 stetigkeit Seien A und B abgeschlossene Teilmengen eines normierten Raums, g : A → R und h : B → R stetig, und g | A ∩ B = h | A ∩ B . Dann ist auch f : A ∪ B, f = g auf A h auf B stetig. 29 Zeigen Sie: Eine Teilmenge K ⊂ R ist kompakt genau dann, wenn jede reellwertige stetige Funktion auf K beschränkt ist. 30 Sei K0 ⊃ K1 ⊃ . . . eine fallende Folge nichtleerer, kompakter Teilmengen eines T ná0 Kn nicht leer. normierten Raumes. Dann ist 31 Jeder endlich-dimensionale Unterraum eines normierten Raumes ist abgeschlossen. 32 Sei f : R → R periodisch. Das heißt, es gilt f (t + T ) = f (t) für ein T > 0 und alle t ∈ R . Gilt dann lim f (t) = 0, t→∞ so ist f (t) = 0 für alle t ∈ R . 33 Welche der durch die folgenden Ausdrücke definierten Funktionenfolgen (fn ) konvergieren gleichmäßig auf (0, 1) ? √ 1 t n t b. c. a. 1 + nt 1 + nt 34 d. (1 − t)t n + t . Zeigen Sie, dass die Funktionenfolge (un ) in C([−1, 1]) mit q un (t) = t 2 + 1/n2 gleichmäßig gegen die Betragsfunktion u = |·| konvergiert. Gilt dies auch in C(R) ? 35 Man untersuche, ob die Partialsummen von X (−1)n nt ná1 auf (0, 1] punktweise, gleichmäßig, oder absolut konvergieren. 36 Die Funktionen fn : [0, ∞) → [0, ∞) seien rekursiv definiert durch q f0 (t) = 0, fn+1 (t) = t + fn (t) . Ist diese Folge gleichmäßig konvergent? 37 Zeigen Sie, dass jede stetige Funktion f : [a, b] → R gleichmäßig durch eine Folge stetiger, stückweise affiner Funktionen approximiert werden kann. 38 180 Sei D eine beliebige Teilmenge eines normierten Raumes. 6 46 aufgaben 6 a. Gilt fn % f und gn % g in B(D) , so gilt auch fn gn % f g . b. Gilt fn % f in B(D) und infD fn á α > 0 für alle n , so gilt auch 1/fn % 1/f . 39 Sei D ⊂ R . Zeigen Sie, dass M(D) Í {f ∈ B(D) : f ist monoton steigend} eine abgeschlossene Teilmenge von B(D) bezüglich der Supremumsnorm bildet. 40 Satz von Dini: Sei K eine kompakte Teilmenge eines normierten Raumes. Konvergiert eine Folge (fn ) in C(K) punktweise und monoton gegen eine Grenzfunktion f und ist diese stetig, so konvergiert (fn ) sogar gleichmäßig gegen f . 41 Man gebe Beispiele, dass im Satz von Dini in Aufgabe 40 monotone Konvergenz und Stetigkeit der Grenzfunktion notwendige Annahmen sind. 6 47 181 182 6 48 7 Integration Der Flächeninhalt eines Rechtecks bestimmt sich aus dem Produkt der Längen seiner beiden Seiten. Doch wie bestimmt sich der Inhalt krummlinig begrenzter Flächen, beispielweise einer Ellipse? Oder die Fläche zwischen dem Graphen einer Funktion und der Abszisse, wenn diese Funktion nicht konstant ist? Die naheliegende, bereits von Archimedes angewandte Idee ist, solche Flächen durch Rechteckflächen – deren Inhalt wir ja kennen – zu approximieren. Wenn alles gut geht, konvergieren deren Flächeninhalte gegen einen Wert, den wir als den Inhalt dieser krummlinig begrenzten Fläche definieren können. Wir werden daher das Integral zuerst für sogenannte Treppenfunktionen definieren. Diese sind stückweise konstant, und ihr Integral ist nichts anderes als die mit Vorzeichen gewichtete Summe der zugehörigen Rechteckflächen. Dieses Integral repräsentiert somit unseren vertrauten Flächenbegriff. Anschließend geht es darum, dieses Integral auf Funktionen auszudehnen, die sich durch Treppenfunktionen approximieren lassen. Diese Approximation kann allerdings auf unterschiedliche Weisen erfolgen, und führt zu unterschiedlichen Integralbegriffen wie dem Cauchy-, Riemann- oder Lebesgueintegral. Wir beschränken uns hier auf das Cauchyintegral, auch Regelintegral genannt, da es für unsere unmittelbaren Zwecke ausreicht und am leichtesten zu definieren ist. 7 1 183 7 integration 7-a t r e p p e n f u n k t i o nen 7.1 Definition Eine Zerlegung Z eines Intervalls [a, b] ist ein Tupel (t0 , . . . , tn ) reeller Zahlen mit a = t0 < t1 < · · · < tn = b. Eine Funktion ϕ : [a, b] → R heißt Treppenfunktion, wenn es eine derartige Zerlegung von [a, b] und reelle Zahlen c1 , . . . , cn gibt, so dass ϕ | (tk−1 , tk ) = ck , k = 1, . . . , n. Der Raum aller Treppenfunktionen auf [a, b] wird mit Tab bezeichnet. Ï Die Funktionswerte an den Zerlegungspunkten sind hier nicht relevant, da sie nicht in das zu definierende Integral eingehen. Da eine Treppenfunktion nur endlich viele verschiedene Werte annimmt, ist sie auch beschränkt. Es gilt also Tab ⊂ Bab Í B([a, b]). Verschiedene Treppenfunktionen ϕ und ψ basieren im Allgemeinen auf verschiedenen Zerlegungen. Fasst man aber die Teilungspunkte ihrer Zerlegungen zu einer gemeinsamen Verfeinerung zusammen, so lassen sich beide über derselben Zerlegung definieren. Dann ist auch λϕ + µψ wieder eine Treppenfunktion. Somit bilden alle Treppenfunktionen auf [a, b] einen Vektorraum. Notiz Der Raum Tab aller Treppenfunktionen auf dem Intervall [a, b] ist ein reeller Untervektorraum von Bab . Ï Die folgende Definition des Integrals einer Treppenfunktion verallgemeinert unsere Vorstellung des Flächeninhalts eines Rechtecks. · 7-1 Eine Treppenfunktion ϕ ∈ Tab a 184 7 2 t1 t2 t3 b 06.09.2011–09:35 treppenfunktionen 7-a · 7-2 Gemeinsame Zerlegung zweier Treppenfunktionen a 7.2 t1 t2 t3 t4 b Definition und Satz Das Integral einer Treppenfunktion ϕ wie in Definition 7.1 ist n X Jab (ϕ) Í ck (tk − tk−1 ). (1) k=1 Dieses Integral hängt nicht von der Darstellung von ϕ ab. Ï Seien ϕ1 und ϕ2 zwei Treppenfunktionen in Tab mit gleichen Funktionswerten, aber verschiedenen Zerlegungen Z1 respektive Z2 . Aus diesen Zerlegungen können wir immer eine gemeinsame Verfeinerung Z bilden. Der Übergang von Z1 oder Z2 zu Z besteht darin, in endlich vielen Schritten einem Teilintervall (tk−1 , tk ) einen weiteren Teilungspunkt tl hinzuzufügen. Bei einem solchen Schritt wird in der Integralsumme der Term YYYYY ck (tk − tk−1 ) ersetzt durch den Term ck (tk − tl ) + ck (tl − tk−1 ). Dies ändert die Integralsumme offensichtlich nicht. Somit hängt Jab (ϕ) nur von der Funktion ϕ und nicht von ihrer Darstellung ab. Y Y Y Y Y ¸ a. Die charakteristische Funktion χJ eines beliebigen Intervalls J ⊂ [a, b] ist eine Treppenfunktion, und Jab (χJ ) = |J| ist die Länge dieses Intervalls. b. Eine Funktion ϕ0 , die nur an endlich vielen Punkten in [a, b] nicht Null ist, ist eine Treppenfunktion, und es ist Jab (ϕ0 ) = 0 . µ · 7-3 Regelfunktion f und approximierender Treppenfunktion ϕ 06.09.2011–09:35 f ϕ 7 3 185 7 integration Das Integral (1) ordnet jeder Treppenfunktion in Tab eine reelle Zahl zu. Wir erhalten also eine reellwertige Funktion Jab : Tab → R, ϕ , Jab (ϕ). In klassischer Terminologie spricht man von einem Funktional auf Tab . 7.3 Satz Das Funktional Jab : Tab → R hat folgende Eigenschaften: (i) Linearität: Jab (λϕ + µψ) = λJab (ϕ) + µJab (ψ) . ϕ à ψ ⇒ Jab (ϕ) à Jab (ψ) . (ii) Monotonie: ϕ | (a, b) = w ⇒ Jab (ϕ) = (b − a)w. (iv) Lipschitzstetigkeit: Jab (ϕ) − Jab (ψ) à kϕ − ψk[a,b] (b − a) . Ï (iii) Normierung: Y Y Y Y Y Wählen wir für ϕ und ψ eine Darstellung mit einer gemeinsamen Zerlegung von [a, b] , so folgen die ersten zwei Behauptungen aus der Definition von Jab . Die dritte Behauptung ist ebenso offensichtlich. Schließlich folgt aus (1) X |Jab (ϕ)| à |ck | (tk − tk−1 ) 1àkàn à max {|c1 | , . . . , |cn |} X (tk − tk−1 ) 1àkàn = kϕk[a,b] (b − a). Wegen der Linearität von Jab folgt daraus die Lipschitzstetigkeit. Y Y Y Y Y Für Treppenfunktionen haben wir somit ein Integral definiert, das unseren Vorstellungen entspricht. Dies sind natürlich noch nicht die Funktionen, die uns eigentlich interessieren – sie sind ja nicht einmal stetig. Dies erreichen wir jedoch mit einer stetigen Fortsetzung des Funktionals Jab auf einer größeren Raum. 7-b d a s c a u c h y i n t e gral Wegen seiner Lipschitzstetigkeit können wir das Funktional Jab mithilfe des Fortsetzungssatzes 6.51 auf eindeutige Weise stetig auf den Abschluss von Tab im Raum Bab fortsetzen. Definition Der Abschluss von Tab bezüglich der Supremumsnorm heißt Raum der Regelfunktionen auf dem Intervall [a, b] und wird mit Rab bezeichnet. Die stetige Fortsetzung des Funktionals Jab auf Rab heißt das Regelintegral oder Cauchyintegral auf [a, b] und wird wieder mit Jab bezeichnet. Ï 186 7 4 das cauchyintegral 7-b Es ist also Rab = (Tab )− ⊂ Bab , und eine Funktion f ∈ Bab ist eine Regelfunktion genau dann, wenn sie gleichmäßiger Limes einer Folge (ϕn ) von Treppenfunktionen in Tab ist: ϕn % f . Das Cauchyintegral einer solcher Funktion ist dann definiert als Jab (f ) Í lim Jab (ϕn ). Der Fortsetzungssatz 6.51 garantiert, dass diese Definition unabhängig ist von der Wahl der Folge (ϕn ) , die gleichmäßig gegen f konvergiert. Dies ist im Moment eine sehr abstrakte Definition. Weder wissen wir, welche Funktionen genau Regelfunktionen sind, noch wie deren Integral zu bestimmen ist. Das erste Problem werden wir gleich betrachten, für das zweite benötigen wir noch die Differenzialrechnung des nächsten Kapitels. Zunächst stellen wir fest, dass das Integral Jab auf Rab dieselben Eigenschaften wie auf Tab hat. 7.4 Permanenzsatz Das Cauchyintegral Jab : Rab → R, f , Jab (f ) hat dieselben Eigenschaften wie seine Einschränkung auf Tab , also Linearität, Monotonie, Normiertheit, und Lipschitzstetigkeit. Ï Linearität: Sind f und g der gleichmäßige Limes der Treppenfunktionen (ϕn ) respektive (ψn ) , so ist λf + µg der gleichmäßige Limes der Treppenfunktionen (λϕn + µψn ) . Dann gilt YYYYY Jab (λf + µg) = lim Jab (λϕn + µψn ) = λ lim Jab (ϕn ) + µ lim Jab (ψn ) = λJab (f ) + µJab (g). Monotonie: Wegen der Linearität des Funktionals genügt es zu zeigen, dass á 0 für eine nichtnegative Funktion f ∈ Rab . Gilt ϕn % f und f á 0 , so gilt auch Jab (f ) + ϕn % f, + ϕn = max (ϕn , 0) . + + Die ϕn sind ebenfalls Treppenfunktionen, und es ist Jab (ϕn ) á 0 . Also ist auch + Jab (f ) = lim Jab (ϕn ) á 0. Normiertheit und Lipschitzeigenschaft: sen 6.51 . Y Y Y Y Y Hier ist nichts Neues zu bewei- 7 5 187 7 integration 7-c e i g e n s c h a f t e n des cauchyintegrals 7.5 Sei c ∈ [a, b] . Dann gilt a f [a,c] ∈ Rac ∧ f [c,b] ∈ Rcb , Intervalladditivität f ∈ Rab und in diesem Fall gilt weiter Jab (f ) = Jac (f ) + Jcb (f ) . Ï YYYYY Für Treppenfunktionen ϕ ist offensichtlich, dass ϕ ∈ Tab a ϕ[a,c] ∈ Tac ∧ ϕ[c,b] ∈ Tcb , sowie Jab (ϕ) = Jac (ϕ) + Jcb (ϕ) . Gegebenenfalls fügt man c als weiteren Teilungspunkt hinzu. Entsprechendes gilt dann auch für die gleichmäßigen Limites von Treppenfunktionen. Zum Beispiel ist Jab (f ) = lim Jab (ϕn ) = lim ( Jac (ϕn ) + Jcb (ϕn )) = lim Jac (ϕn ) + lim Jcb (ϕn ) = Jac (f ) + Jcb (f ). Y Y Y Y Y 7.6 Zusatz Mit der Vereinbarung Jab (f ) = −Jba (f ) für a > b und Jaa (f ) = 0 gilt Jab (f ) = Jac (f ) + Jcb (f ) für beliebige a, b, c und jede Regelfunktion f , die auf dem kleinsten, alle Integrationsgrenzen umfassenden Intervall definiert ist. Ï YYYYY Dies ist eine Routinerechnung. Y Y Y Y Y Von nun an verwenden wir die auf Leibniz zurückgehende Integralschreibweise, die aus einem stilisierten S besteht. Definition Eine Regelfunktion f ∈ Rab heißt integrierbar auf [a, b] , ihr Integral mit den Integrationsgrenzen a und b ist Zb f Í Jab (f ). Ï a Die Intervalladditivität schreibt sich damit Zb Zc Zb f = f+ f a a c für jede auf einem alle Integrationsgrenzen umfassenden Intervall integrierbare Funktion f . 188 7 6 eigenschaften des cauchyintegrals 7-c · 7-4 Mittelwertsatz der Integralrechnung mit p ≡1 a 7.7 c b Dreiecksungleichung Ist f auf [a, b] integrierbar, so auch |f | , und es gilt Z b Z b fà |f | . Ï (2) a a Y Y Y Y Y Ist f gleichmäßiger Limes der Treppenfunktionen ϕn , so ist auch |f | gleichmäßiger Limes der Funktionen |ϕn | . Da diese ebenfalls Treppenfunktionen sind, ist auch |f | eine Regelfunktion. Für jede Treppenfunktion ϕn gilt nun offensichtlich mit der entsprechenden Zerlegung Z b X Zb n X n ϕn = c (t − t ) à |c | (t − t ) = |ϕn | . k k k−1 k k k−1 a k=1 a k=1 Mit n → ∞ folgt hieraus die Behauptung (2). Y Y Y Y Y 7.8 Mittelwertsatz der Integralrechnung Seien f und p integrierbar auf [a, b] , außerdem sei f stetig und p á 0 . Dann existiert ein c ∈ [a, b] , so dass Zb Zb f p = f (c) p. Ï a a Y Y Y Y Y Auf [a, b] nimmt f sein Minimum m und sein Maximum M an 6.18 . Es gilt dann m à f à M , und wegen p á 0 dann auch mp à f p à Mp . Aufgrund der Monotonie des Integrals folgt Zb Zb Zb m pà fp à M p. a Ist nun Rb a a a p = 0 , so ist nichts tun. Andernfalls ist Rb a p > 0 und damit Z b −1 Z b màµÍ p f p à M. a a Nach dem Zwischenwertsatz von Bolzano gibt es ein c ∈ [a, b] mit f (c) = µ . Das ist die Behauptung. Y Y Y Y Y 7 7 189 7 7.9 integration Vertauschungsatz Eine Cauchyfolge (fn ) in Rab ist konvergent, und es gilt Zb a Zb lim fn = lim a fn . Ï (3) Y Y Y Y Y Dies folgt aus der Definition des Regelintegrals. Eine Cauchyfolge (fn ) in Rab ist auch eine Cauchyfolge im umgebenden Banachraum Bab und hat dort einen Grenzwert f . Da aber Rab abgeschlossen ist, ist auch f ∈ Rab , also integrierbar. Gleichung (3) ist gerade die Stetigkeit des Funktionals Jab auf Rab . Y Y Y Y Y 7-d regelfunktionen Wir wollen jetzt Regelfunktionen durch ein handhabbares Kriterium charakterisieren. Zunächst eine einfache Feststellung. 7.10 Eine Regelfunktion besitzt höchstens abzählbar viele Unstetigkeitsstellen. Ï Satz Sei f ∈ Rab und f = lim ϕn . Jede Treppenfunktion ϕn hat nur endlich viele Unstetigkeitsstellen. Die Menge S der Unstetigkeitsstellen aller ϕn ist somit abzählbar. Nun ist jedes ϕn auf [a, b] Ø S stetig. Als gleichmäßiger Limes der ϕn ist dann f auf dieser Menge ebenfalls stetig. Y Y Y Y Y YYYYY Wir sagen, eine Funktion f : [a, b] → R besitzt in jedem Punkt einseitige Grenzwerte, wenn auf [a, b) alle rechts- und auf (a, b] alle linksseitigen Grenzwerte von f existieren. 7.11 Satz Eine Regelfunktion f : [a, b] → R besitzt in jedem Punkt von [a, b] einseitige Grenzwerte. Ï Y Y Y Y Y Wir betrachten den linksseitigen Grenzwert in einem Punkt c ∈ (a, b] . Sei f der gleichmäßige Limes einer Folge (ϕn ) in Tab . Zu gegebenen ε > 0 existiert dann eine Treppenfunktion ϕn mit kf − ϕn k[a,b] < ε/2. (4) Die Treppenfunktion ϕn wiederum ist auf einem kleinen, offenen Intervall links von c konstant, unabhängig davon, ob c ein Teilungspunkt ist oder nicht. Das heißt, zu ϕn gibt es ein δ > 0 und ein w ∈ R , so dass ϕn (c−δ,c) = w. Für u, v ∈ (c − δ, c) folgt dann mit (4) 190 7 8 regelfunktionen 7-d |f (u) − f (v)| à |f (u) − w| + |w − f (v)| = |f (u) − ϕn (u)| + |ϕn (v) − f (v)| < ε. Für jede von links gegen c konvergierende Folge (tn ) bildet f (tn ) somit eine Cauchyfolge, denn für tn , tm ∈ (c − δ, c) gilt dann |f (tn ) − f (tm )| < ε. Außerdem hängt ihr Grenzwert nicht von (tn ) ab. Also existiert der linksseitige Grenzwert f– (c) = limt c f (t) . – Das Argument für rechtsseitige Grenzwerte ist entsprechend. Y Y Y Y Y Wir zeigen jetzt, dass auch die Umkehrung dieses Satzes gilt. Dafür benötigen wir noch den folgenden Spezialfall eines Satzes über kompakte Mengen. 7.12 Überdeckungslemma von Heine-Borel Sei [a, b] ein kompaktes Intervall und (Iλ )λ∈Λ eine beliebige Familie offener Intervalle mit [ Iλ . [a, b] ⊂ λ∈Λ Dann enthält diese Familie auch eine endliche Teilüberdeckung von [a, b] . Das heißt, es gibt endlich viele Intervalle Iλi , . . . , Iλm in (Iλ )λ∈Λ , so dass [ Iλi . Ï [a, b] ⊂ 1àiàm Y Y Y Y Y Angenommen, es gibt keine solche endliche Teilüberdeckung. Dann können wir induktiv eine fallende Folge von abgeschlossenen Intervallen [a, b] Î J0 ⊃ J1 ⊃ · · · konstruieren mit |Jn | = 2−n |J0 | = 2−n |[a, b]| , die alle ebenfalls keine endliche Teilüberdeckung besitzen. Denn besitzt Jn keine endliche Teilüberdeckung, so besitzt die linke oder rechte abgeschlossene Hälfte von Jn ebenfalls keine, und diese definieren wir als Jn+1 . Der Durchschnitt aller dieser Intervalle enthält genau einen Punkt p ∈ [a, b] . Dieser ist in wenigstens einem Intervall Iλp der Überdeckung enthalten. Da Iλp offen ist, enthält es aber auch alle Intervalle Jn mit n hinreichend groß. Das heißt, diese Intervalle Jn werden sogar von nur einem Intervall Iλp der Familie überdeckt. Dies ist ein Widerspruch zur Konstruktion der Jn . Y Y Y Y Y 7 9 191 7 integration · 7-5 I5 I2 Endliche Teil- I1 I4 I3 überdeckung und zugehörige Zerlegung a t1 7.13 Satz b Die Funktion f : [a, b] → R besitze in jedem Punkt von [a, b] einseitige Grenzwerte. Dann ist f der gleichmäßige Limes von Treppenfunktionen. Ï Sei ε > 0 . Zu jedem Punkt c ∈ [a, b] existiert aufgrund der Existenz der einseitigen Grenzwerte eine Umgebung Uδ (c) , so dass YYYYY |f (u) − f (v)| < ε (5) für alle u, v ∈ (c − δ, c) ∩ [a, b] sowie alle u, v ∈ (c, c + δ) ∩ [a, b] . Die Familie der entsprechenden Umgebungen Uδ (c) mit c ∈ [a, b] bildet eine offene Überdeckung von [a, b] . Nach dem Lemma von Heine-Borel besitzt diese eine endliche Teilüberdeckung. Es gibt also endlich viele Punkte c1 , . . . , cm , so dass [a, b] ⊂ Uδ1 (c1 ) ∪ · · · ∪ Uδm (cm ). Sei Z = (t0 , . . . , tn ) diejenige Zerlegung von [a, b] , die aus allen Mittelund Endpunkte dieser m Intervalle bestehen, die innerhalb von [a, b] liegen, zuzüglich der Punkte a und b selbst. Jedes Zerlegungsintervall (tk−1 , tk ) gehört dann entweder zu einer linken oder einer rechten Hälfte eines dieser m Intervalle. Wegen (5) schwankt die Funktion f dort um weniger als ε . Zu dieser Zerlegung Z definieren wir eine Treppenfunktion ϕ ∈ Tab durch ϕ(tk−1 ,tk ) = f (sk ), sk = tk−1 + tk , 2 1 à k à n. Außerdem setzen wir der Vollständigkeit halber ϕ(tk ) = f (tk ), 0 à k à n. Dann gilt wegen (5) auf jedem Zerlegungsintervall kϕ − f k[tk−1 ,tk ] à kf (sk ) − f k(tk−1 ,tk ) < ε. Also gilt insgesamt kϕ − f k[a,b] < ε. Da zu jedem ε > 0 eine solche Treppenfunktion existiert, ist die Behauptung bewiesen. Y Y Y Y Y 192 7 10 regelfunktionen 7-d Zusammengefasst erhalten wir folgende eindeutige Charakterisierung der Regelfunktionen 7.11 7.13 . 7.14 Korollar Eine Funktion f : [a, b] → R ist eine Regelfunktion genau dann, wenn sie in jedem Punkt des Intervalls [a, b] einseitige Grenzwerte besitzt. Insbesondere sind stetige, stückweise stetige und monotone Funktionen Regelfunktionenen und damit integrierbar. Ï Dabei heißt eine Funktion f : [a, b] → R stückweise stetig, wenn es eine Zerlegung (t0 , . . . , tn ) von [a, b] gibt, so dass die Einschränkungen f | (tk−1 , tk ) für 1 à k à n stetig sind und einseitige Grenzwerte in den Endpunkten besitzen. Beispielsweise sind die Signumfunktion und die Gaußklammer stückweise stetig. Das folgende Lemma wird im nächsten Kapitel die Verbindung herstellen zwischen der Integral- und der Differentialrechnung. 7.15 Riemannsches Lemma Ist f : [a, b] → R integrierbar, so gilt Z Z 1 c+h 1 c+h lim f = f– (c), lim f = f+ (c) h0 h c h0 h c für jeden Punkt c ∈ (a, b] respektive c ∈ [a, b) . Ï Y Y Y Y Y Wir betrachten den rechtsseitigen Limes in einem Punkt c ∈ [a, b) . Sei h > 0 so klein, dass auch c + h ∈ [a, b] . Dann ist Z 1 c+h f+ (c) = f+ (c), h c da in diesem Integral f+ (c) konstant ist. Also ist Z c+h Z c+h Z c+h = 1 à 1 f+ (c) − 1 f (c) − f |f+ (c) − f | . (f ) + h h c h c c Wegen limt c f (t) = f+ (c) existiert zu jedem ε > 0 ein δ > 0 so, dass |f+ (c) − f (t)| < ε, c à t à c + δ. Zusammen mit der vorletzten Abschätzung erhalten wir also Z c+h Z c+h < 1 f+ (c) − 1 f ε = ε, 0 < h < δ. h h c c Da zu jedem ε > 0 ein solches δ > 0 existiert, folgt Z 1 c+h lim f = f+ (c) h0 h c Für c ∈ (a, b] und h < 0 mit c + h ∈ [a, b] argumentiert man entsprechend. Y Y Y Y Y 7 11 193 7 integration 7-e i n t e g r a t i o n i n banachräumen Das Integral einer Treppenfunktion ist nichts anderes als eine Linearkombination seiner Funktionswerte. Es lässt sich daher ebenso gut definieren, wenn diese Werte Elemente eines beliebigen Banachraumes E sind. Definition Eine Funktion ϕ : [a, b] → E heißt E-wertige Treppenfunktion, wenn es eine Zerlegung (t0 , . . . , tn ) des Intervalls [a, b] und Elemente w1 , . . . , wn in E gibt, so dass ϕ(tk−1 ,tk ) = wk , k = 1, . . . , n. Das Integral einer solchen Treppenfunktion ist Jab (ϕ) Í n X wk (tk − tk−1 ). k=1 Dieses hängt nicht von der Darstellung von ϕ ab. Ï Bezeichnen wir mit Tab (E) den Raum aller E-wertigen Treppenfunktionen auf [a, b] , so definiert das Integral eine Abbildung Jab : Tab (E) → E, ϕ , Jab (ϕ). Diese ist wieder linear, normiert und lipschitz, denn genau wie im Beweis von 7.3 erhält man kJab (ϕ)kE à kϕk[a,b],E (b − a) mit kϕk[a,b],E = sup kϕ(t)kE . t∈[a,b] Betrachten wir Tab (E) als Unterraum des Banachraumes Bab (E) Í B([a, b] , E) , so können wir wieder den Fortsetzungssatz 6.51 anwenden. Definition Der Abschluss von Tab (E) ⊂ Bab (E) bezüglich der Supremumsnorm k·k[a,b],E heißt Raum der E-wertigen Regelfunktionen auf dem Intervall [a, b] und wird mit Rab (E) bezeichnet. Die stetige Fortsetzung des Funktionals Jab auf Rab (E) heißt Regel- oder Cauchyintegral auf [a, b] und wird mit Zb f a bezeichnet. Ï 194 7 12 aufgaben 7 Eine Funktion f in Bab (E) gehört also zu Rab (E) genau dann, wenn es eine Folge (ϕn ) in Tab (E) gibt, so dass kf − ϕn k[a,b],E → 0. Das Cauchyintegral einer solcher Funktion ist dann Zb f Í lim Jab (ϕn ). a n→∞ Dieses ist unabhängig von der Wahl der approximierenden Folge (ϕn ) . Der Permanenzsatz und die Intervalladditivität gelten unverändert. Auf die Monotonie müssen wir allerdings verzichten, da sie in allgemeinen Banachräumen keinen Sinn macht. Ebenso bleiben die Dreiecksungleichung, das Riemannsche Lemma, und die Charakterisierung der Regelfunktionen unverändert. Es ist lediglich der reelle Betrag |·| durch die Banachraumnorm k·kE zu ersetzen. Es gilt daher folgender Satz. 7.16 Satz Eine Funktion f : [a, b] → E ist eine Regelfunktion genau dann, wenn sie in jedem Punkt des Intervalls [a, b] einseitige Grenzwerte besitzt. Jede Regelfunktion besitzt höchstens abzählbar viele Unstetigkeitsstellen. Insbesondere sind stückweise stetige Funktionen Regelfunktionen und damit integrierbar. Ï Vektor- und matrixwertige Integrale treten beispielsweise bei der Lösung von höherdimensionalen Differenzialgleichungen auf und in der Funktionalanalysis. aufgaben 1 Welche der folgenden Aussagen sind wahr? a. Jede beschränkte Funktion f : [a, b] → R ist integrierbar. b. Eine integrierbare Funktion hat nur endlich viele Unstetigkeitsstellen. c. Die charakteristische Funktion jeder Teilmenge von [0, 1] ist eine Treppenfunktion. d. Jede offene Überdeckung von (0, 1) besitzt eine endliche Teilüberdeckung. 2 Zeigen Sie, dass die Thomaefunktion τ von Aufgabe 6.10 integrierbar ist mit R1 0 τ = 0. Konstruieren Sie eine Folge von Treppenfunktionen, die gleichmäßig gegen τ konvergiert. 3 Zeigen Sie, dass die Dirichletfunktion auf keinem Intervall integrierbar ist. 7 13 195 7 integration 4 Das Produkt zweier Regelfunktionen ist wieder eine Regelfunktion. 5 Jeder Regelfunktion f ∈ Rab sei die Funktion f– : (a, b] → R ihrer linksseitigen und die Funktion f+ : [a, b) → R ihrer rechtsseitigen Grenzwerte zugeordnet. Zeigen Sie: a. f– ist linksseitig stetig. Das heißt, es gilt f– (c) = lim f– (t), c ∈ (a, b] . t c Analog ist f+ rechtsseitig stetig. b. Es gibt eine abzählbare Menge S ⊂ [a, b] , so dass f– = f = f+ auf [a, b] Ø S . c. Es gilt Zb Zb f = a 6 a Zb f– = a f+ . Für die Funktion f ∈ Rab gelte Zb f á 0, f = 0. a Dann ist f+ = f– = 0 . 7 Zeigen Sie, dass auf C([a, b]) ein Skalarprodukt definiert wird durch hf , gi Í 8 Sei f ∈ Rab . Dann existiert zu jedem ε > 0 ein ϕ ∈ C([a, b]) mit Rb a fg. Zb |f − ϕ| < ε. a 9 Es sei f eine Regelfunktion auf [a − 1, b + 1] und τh f = f (· + h) . Dann existiert zu jedem ε > 0 ein δ ∈ (0, 1) , so dass Zb a 10 |τh f − f | < ε, |h| < δ. Eine Funktion f : [a, b] → Rn ist eine Regelfunktion genau dann, wenn jede Komponentenfunktion eine reellwertige Regelfunktion ist. 11 Jede Treppenfunktion ist der gleichmäßige Limes stetiger Funktionen. 12 Sei f : [a, b] → R stetig. Dann existiert zu jedem ε > 0 ein δ > 0 , so dass Z n b X f− f (tk )(tk − tk−1 ) < ε a k=1 für jede Zerlegung Z = (t0 , . . . , tn ) mit Feinheit sup1àkàn (tk − tk−1 ) < δ . Hinweis: Man verwende die gleichmäßige Stetigkeit von f 196 7 14 6.42 . 8 Differenziation Die Ableitung beschreibt das punktuelle Veränderungsverhalten einer Funktion. Betrachten wir t , f (t) in der Nähe eines Punktes a , so geht es um die Änderung der abhängigen Größe, f (t) − f (a) , im Verhältnis zur Änderung der unabhängigen Größe, t − a , wenn t sich a nähert. Im einfachsten Fall ist dieses Verhältnis konstant, nämlich dann, wenn es sich bei f um eine lineare oder affine Funktion handelt. Andernfalls kann man versuchen, eine affine Funktion zu finden, die die gegebene Funktion in der Umgebung von a am besten approximiert. Existiert eine solche bestapproximierende Gerade, so ist sie eindeutig – es handelt sich um die Tangente an den Graphen von f im Punkt a . Ihre Steigung ist die Ableitung von f in a . Diese Interpretation der Ableitung werden wir später auf höhere Dimensionen verallgemeinern. Die Steigung der bestapproximierenden Geraden erscheint dort als allgemeine lineare Abbildung. · 8-1 Ableitung und lineare Approximation f (t) f (a) a α(t) t 8 1 197 8 differenziation 8-a d e f i n i t i o n e n u nd rechenregeln Es sei im Folgenden I immer ein nichtentartetes Intervall, also ein Intervall mit mehr als einem Punkt. Ferner sei f: I→R eine reellwertige Funktion auf I . Wie die Stetigkeit ist die Differenzierbarkeit zunächst eine lokale Eigenschaft. 8.1 Definition Eine Funktion f : I → R heißt differenzierbar im Punkt a ∈ I , wenn es ein m ∈ R gibt, so dass lim t→a |f (t) − f (a) − m(t − a)| = 0. |t − a| (1) In diesem Fall heißt m die erste Ableitung von f im Punkt a und wird mit f 0(a) bezeichnet. Ï Andere gebräuchliche Bezeichnungen neben f 0(a) sind Df (a), df (a), dt f˙(a). Die letzte Bezeichnung ist vor allem im Kontext von Differenzialgleichungen üblich, wo die unabhängige Variable als Zeit interpretiert wird. Die affine Funktion α : t , f (a) + m(t − a) (2) beschreibt eine Gerade durch den Punkt f (a) mit der Steigung m . Gleichung (1) lautet damit lim t→a |f (t) − α(t)| = 0. |t − a| und bedeutet, dass der Approximationsfehler f (t) − α(t) schneller als die lineare Funktion t − a verschwindet. Unter allen Geraden durch f (a) gibt es höchstens eine mit dieser Eigenschaft – siehe Aufgabe 3. Somit handelt es sich bei α mit m = f 0(a) um die bestapproximierende Gerade an f durch f (a) , und man nennt sie die Linearisierung von f im Punkt a . Geometrisch handelt es sich um die Tangente an den Graphen von f im Punkt a . Diese Definition der Differenzierbarkeit in einem Punkt scheint etwas umständlich. Sie hat aber den Vorteil, sich auf höhere Dimensionen verallgemeinern zu lassen. Für reelle Funktionen auf einem Intervall handelt es sich aber genau um den klassischen Differenzenquotienten und seinen Grenzwert. 198 8 2 06.09.2011–09:35 definitionen und rechenregeln 8.2 Differenzierbarkeitssatz sind äquivalent: 8-a Für eine Funkion f : I → R und einen Punkt a ∈ I (i) f ist differenzierbar in a mit f 0(a) = m . (ii) Es gibt ein m ∈ R und eine im Punkt a stetige Funktion ε : I → R mit ε(a) = 0 gibt, so dass f (t) = f (a) + m(t − a) + ε(t)(t − a), t ∈ I. (3) (iii) Es existiert der Grenzwert lim t→a f (t) − f (a) f (a + h) − f (a) = lim =m t−a h h→0 In diesem Fall ist f 0(a) = m . Ï (i) a (ii) Setzen wir YYYYY ε(t) = f (t) − f (a) − m(t − a) , t−a t ≠ a, so ist ε wegen (??) stetig in a durch 0 fortgesetzbar, und es gilt offensichtlich (??). Umgekehrt folgt aus (??) unmittelbar (??). (ii) a (iii) Mit den Bezeichnungen von (??) ist f (t) − f (a) = m + ε(t), t−a t ≠ a. Verschwindet ε stetig in a , so ist m = lim (m + ε(t)) = lim t→a t→a γ(t) − γ(a) . t−a Existiert umgekehrt der Grenzwert auf der rechten Seite, so ist ε stetig fortsetzbar im Punkt a mit dem Wert 0 , und es gilt (??). Y Y Y Y Y Wir haben nicht explizit vorausgesetzt, dass f im Punkt a stetig ist. Da in (3) aber ε im Punkt a stetig ist, ist es auch die rechte Seite von (3) und damit f . Notiz 8.3 Ist f im Punkt a differenzierbar, so ist f in a auch stetig. Ï ¸ a. Jede affine Funktion λ : t , mt + b ist in jedem Punkt von R differenzierbar, und in jedem Punkt gilt λ0 (a) = m . Ihre Tangente dort hat die Geradengleichung α(t) = λ(a) + λ0 (a)(t − a) = mt + b = λ(t). Jede Gerade ist daher in jedem Punkt ihre eigene Tangente. 06.09.2011–09:35 8 3 199 8 differenziation √ b. Die Wurzelfunktion t , t ist in jedem Punkt a > 0 differenzierbar, denn √ √ a+h − a 1 h 1 √ → √ , = √ h → 0. h h a+h + a 2 a Es gilt also √ 0 a = 1 √ , 2 a a > 0. Im Punkt a = 1 beispielsweise ist die Tangentengleichung t , 1 + t/2 . Für a = 0 und h 0 dagegen divergiert der Differenzenquotient, und die Wurzelfunktion ist in 0 nicht differenzierbar. c. Die Betragsfunktion |·| ist im Punkt 0 nicht differenzierbar, da es dort keine eindeutige bestapproximierende Tangente gibt. µ Rechenregeln Mit den Ableitungen für affine Funktionen und einigen Rechenregeln lassen sich bereits die Ableitungen vieler weiterer Funktionen ohne Betrachtung von Differenzenquotienten berechnen. Um die Beweise zu vereinfachen, formulieren wir zunächst ein Differenzierbarkeitskriterium, das wir im Folgenden verwenden, ohne es jedesmal zu zitieren. 8.4 Differenzierbarkeitskriterium Es ist f : I → R ist im Punkt a ∈ I differenzierbar genau dann, wenn es eine in a stetige Funktion ϕ : I → R gibt, so dass f (t) = f (a) + ϕ(t)(t − a), t ∈ I. In diesem Fall ist ϕ(a) = f 0(a) . Ï YYYYY 8.5 Satz Die Äquivalenz mit (3) ergibt sich mit ϕ(t) = m + ε(t) . Y Y Y Y Y Sind f , g : I → R im Punkt a ∈ I differenzierbar, so sind es auch f + g , f g , und falls g(a) ≠ 0 , auch f /g , und es gelten die Summen-, Produkt- und Quotientenregeln (f + g)0 (a) = (f 0 + g 0 )(a) (f g)0 (a) = (f 0g + f g 0 )(a) (f /g)0 (a) = ((f 0g − f g 0 )/g 2 )(a). YYYYY 200 8 4 Nach Voraussetzung ist Ï definitionen und rechenregeln 8-a f (t) = f (a) + ϕ(t)(t − a), g(t) = g(a) + ψ(t)(t − a), mit im Punkt a stetigen Funktionen ϕ , ψ , wobei ϕ(a) = f 0(a) , ψ(a) = g 0 (a) . Für das Produkt folgt daraus (f g)(t) = (f g)(a) + (f (a)ψ(t) + ϕ(t)g(a))(t − a) + ϕ(t)ψ(t)(t − a)2 = (f g)(a) + [f (a)ψ(t) + ϕ(t)g(a) + ϕ(t)ψ(t)(t − a)] (t − a). Der Ausdruck in eckigen Klammern ist stetig im Punkt a und hat dort den Wert f (a)ψ(a) + ϕ(a)g(a) = f (a)g 0 (a) + f 0(a)g(a). Also ist f g in a differenzierbar mit der behaupteten Ableitung. Die übrigen Aussagen werden analog bewiesen. Y Y Y Y Y Als erste Anwendung bestimmen wir die Ableitung der natürlichen Potenzen. 8.6 Für alle n á 1 und t ∈ R gilt Satz (t n )0 = nt n−1 (4) wobei in diesem Zusammenhang 00 Í 1 . Dasselbe gilt für n à 0 und t ≠ 0 mit t n Í 1/t −n . Ï Für n = 1 ist dies die Ableitung der Identitätsfunktion, (t)0 = 1 . Mit Induktion und der Produktregel erhält man für n á 1 YYYYY (t n+1 )0 = (t n t)0 = (t n )0 t + t n (t)0 = nt n−1 t + t n = (n + 1)t n , wie es sein soll. Für n < 0 erhält man hieraus mit der Quotientenregel 1 0 −(t −n )0 (t n )0 = = −n t t −2n n nt −n−1 = −n+1 = nt n−1 . Y Y Y Y Y = t −2n t Der Fall n = 0 ist klar. ¸ Ein reelles Polynom ist überall differenzierbar, und es gilt X n k=0 ak t k 0 = n X kak t k−1 . µ k=1 8 5 201 8 differenziation Kettenregel und Umkehrregel Wie bei der Stetigkeit untersuchen wir nun die Frage, unter welchen Bedingungen die Differenzierbarkeit bei Verkettung und Umkehrung von Funktionen erhalten bleibt. 8.7 Kettenregel Es seien f : I → J in a ∈ I und g : J → R in f (a) ∈ J differenzierbar. Dann ist auch g ◦ f in a differenzierbar, und es gilt (g ◦ f )0 (a) = g 0 (f (a))f 0(a). YYYYY Ï Nach Voraussetzung ist f (t) = f (a) + ϕ(t)(t − a), g(s) = g(b) + ψ(s)(s − a), (5) mit im Punkt a respektive b = f (a) stetigen Funktionen ϕ und ψ , wobei ϕ(a) = f 0(a), ψ(b) = g 0 (b) = g 0 (f (a)). Ersetzen wir in (5) nun s durch f (t) und b durch f (a) , so wird s − b = f (t) − f (a) = ϕ(t)(t − a), und wir erhalten (g ◦ f )(t) = (g ◦ f )(a) + [ψ(f (t))ϕ(t)] (t − a). Der Ausdruck in eckigen Klammern ist stetig im Punkt a mit Wert ψ(f (a))ϕ(a)) = g 0 (f (a))f 0(a). Also ist g ◦ f in a differenzierbar mit der behaupteten Ableitung. Y Y Y Y Y √ ¸ Die Funktion f : t , 1 + t 2 ist auf ganz R differenzierbar, und es gilt f 0(t) = √ 8.8 t . 1 + t2 µ Umkehrregel Sei f : I → J stetig und bijektiv. Ist f im Punkt a ∈ I differenzierbar und f 0(a) ≠ 0 , so ist die Umkehrfunktion f −1 : J → I im Punkt b = f (a) differenzierbar, und es gilt (f −1 )0 (b) = 1 f 0(f −1 (b)) . Ï (6) Y Y Y Y Y Nach Voraussetzung ist wieder f (t) = f (a) + ϕ(t)(t − a) mit einer im Punkt a stetigen Funktion ϕ , wobei ϕ(a) = f 0(a) ≠ 0 . Es existiert dann ein δ > 0 , so dass ϕ(t) ≠ 0 für alle t ∈ Uδ (a) ∩ I . Für diese t können wir die erste 202 8 6 definitionen und rechenregeln 8-a Gleichung umformen zu t =a+ f (t) − f (a) . ϕ(t) Mit s = f (t) und b = f (a) und damit t = g(s) und a = g(b) ist dies gleichbedeutend mit g(s) = g(b) + 1 (s − b). ϕ(g(s)) Da der Nenner im Punkt b stetig ist und nicht verschwindet, ist g im Punkt b differenzierbar, und die Ableitung ist g 0 (b) = 1 1 = 0 ϕ(g(b)) f (g(b)) wie behauptet. Y Y Y Y Y Bemerkung Man kann Gleichung (6) übrigens leicht mithilfe der Identität f (f (t)) = t rekonstruieren. Aufgrund der Kettenregel gilt ja −1 f 0(f −1 (b))(f −1 )0 (b) = 1, also (f −1 )0 (b) = 1 . f 0(f −1 (b)) Dies ist allerdings kein Ersatz für den vorangehenden Beweis. Wir müssen ja zuerst wissen, dass f −1 im Punkt b differenzierbar ist, um die Kettenregel anwenden zu dürfen. Ç ¸ Die Funktion f : [0, ∞) → [0, ∞) mit f (t) = t 2 ist strikt wachsend, bijektiv und differenzierbar mit Ableitung f 0(t) = 2t > 0. Diese ist nicht 0 für t ≠ 0 . Die Umkehrfunktion g = f −1 ist deshalb in jedem Punkt s = t 2 > 0 differenzierbar, mit Ableitung g 0 (s) = Mit g(s) = √ 1 f 0(g(s)) = 1 . 2g(s) s erhalten wir wieder das Ergebnis von Beispiel 8.3, √ ( s)0 = 1 √ . µ 2 s 8 7 203 8 differenziation Differenzierbare Funktionen Definition Eine Funktion f : I → R heißt differenzierbar auf I , oder einfach differenzierbar, wenn sie in jedem Punkt von I differenzierbar ist. In diesem Fall heißt die Funktion f 0 : I → R, t , f 0(t) die Ableitung von f . Ist f 0 außerdem stetig, so heißt f stetig differenzierbar auf I . Ï Der Raum aller auf I stetig differenzierbaren reellen Funktionen wird mit C 1(I) bezeichnet. Offensichtlich gilt C 1(I) ⊊ C 0(I) Í C(I). Es gibt sogar stetige Funktionen auf R gibt, die in keinem einzigen Punkt differenzierbar sind – siehe Abschnitt 10-c. Aus den lokalen Differenziationsregeln ergeben sich ohne große Mühe die folgenden Ergebnisse für differenzierbare Funktionen. 8.9 Satz Sind f und g in C 1(I) , so sind auch f + g und f g in C 1(I) , und es gilt (f + g)0 = f 0 + g 0 , (f g)0 = f 0g + f g 0 . Verschwindet g nirgends auf I , so ist auch f /g in C 1(I) , und es gilt (f /g)0 = (f 0g − f g 0 )/g 2 . Ï Aufgrund dieses Satzes ist C 1(I) nicht nur ein Vektorraum, sondern eine kommutative Algebra – das heißt, es ist im Raum neben der Addition eine Multiplikation erklärt, für die die Assoziativ-, Kommutativ- und Distributivgesetze gelten. 8.10 Kettenregel Sind f und g beide C 1, und ist g ◦ f auf dem Definitionsintervall von f erklärt, so ist auch g ◦ f eine C 1-Funktion, und es gilt (g ◦ f )0 = (g 0 ◦ f )·f 0. Ï (7) Die globale Umkehrregel formulieren wir im nächsten Abschnitt – siehe Satz 8.18 –, da wir hierfür den Monotoniesatz benötigen. 204 8 8 lokale extrema und mittelwertsatz · 8-2 8-b Satz von Fermat c 8-b l o k a l e e x t r e m a und mittelwertsatz Es liegt nahe, dass die Ableitung einer Funktion Aufschluss gibt über ihr lokales Verhalten – ob sie zum Beispiel monoton ist oder eine Extremstelle ausbildet. Dies wollen wir jetzt untersuchen. – Zuerst betrachten wir lokale Extrema. Definition Eine Funktion f : I → R besitzt im Punkt c ∈ I ein lokales Minimum, wenn es eine Umgebung Uδ (c) gibt, so dass f (c) à f (t), t ∈ Uδ (c) ∩ I. Sie besitzt in a ein striktes lokales Minimum, wenn außerdem f (c) < f (t) für t ≠ c gilt. Entsprechend ist ein (striktes) lokales Maximum definiert. Ï Lokale Minima und Maxima werden gemeinsam als Extrema bezeichnet. Punkte, an denen ein lokales Extremum vorliegt, werden Extremstellen genannt, genauer Minimal- und Maximalstellen. 8.11 Satz von Fermat Besitzt f : I → R in einem inneren Punkt c von I ein lokales Extremum und ist f in diesem Punkt differenzierbar, so gilt f 0(c) = 0 . Ï Y Y Y Y Y Sei zum Beispiel c eine Minimalstelle von f im Innern von I . Dann existiert ein δ > 0 , so dass f (c + h) − f (c) á 0, |h| < δ. Also gilt f (c + h) − f (c) á 0 à0 h für 0 < h < δ, (8) für 0 > h > −δ. Da f in c differenzierbar ist, existiert lim h→0 f (c + h) − f (c) = f 0(c). h 8 9 205 8 differenziation Aus der Betrachtung der einseitigen Grenzwerte in (8) folgt aber f 0(c) á 0 als auch f 0(c) à 0 . Somit muss f 0(c) = 0 gelten. Y Y Y Y Y Beide Voraussetzungen des Satzes – Lage der Extremstelle c im Innern und Differenzierbarkeit im Punkt c – sind notwendig. In einer Extremstelle am Rand muss die Ableitung nicht verschwinden, und an einer Extremstelle im Innern muss eine Funktion nicht differenzierbar sein. Es gilt auch nicht die Umkehrung des Satzes: Ein kritischer Punkt, im Innern oder am Rande, ist nicht notwendigerweise eine Extremstelle. Siehe dazu Abbildung 8-3. Punkte, in denen die Ableitung einer Funktion verschwindet, haben eine besondere Bedeutung und deshalb auch einen besonderen Namen. Definition Ist f : I → R im Punkt c differenzierbar und f 0(c) = 0 , so heißt c ein stationärer oder kritischer Punkt von f . Ï Der Satz von Fermat besagt also, dass eine Extremstelle im Innern notwendig ein kritischer Punkt ist, wenn die Funktion dort differenzierbar ist. Geometrischer gesprochen muss der Graph von f an einer Extremstelle eine horizontale Tangente aufweisen. Mittelwertsätze Eine erste Anwendung des Satzes von Fermat sind Mittelwertsätze. Zuerst betrachten wir einen Spezialfall. 8.12 Satz von Rolle Sei f : [a, b] → R stetig und auf (a, b) differenzierbar. Gilt f (a) = f (b) , so existiert ein c ∈ (a, b) mit f 0(c) = 0 . Ï Ist f konstant, so verschwindet f 0 überall, und jeder Punkt in [a, b] ist ein kritischer Punkt. Sei also f nicht konstant. Die stetige Funktion f nimmt auf [a, b] ihr Minimum und Maximum an, und beide können nicht am Rand liegen, da f sonst konstant wäre. Also besitzt f wenigstens eine Extremstelle c YYYYY · 8-3 Zu den Voraussetzungen des Satzes von Fermat Extremstellen am Rand 206 8 10 Extremstelle nicht differenzierbar kritischer Punkt keine Extremstelle lokale extrema und mittelwertsatz 8-b im Innern von [a, b] . Da f dort auch differenzierbar ist, ist nach dem Satz von Fermat f 0(c) = 0 . Y Y Y Y Y Bemerkung Der Satz von Rolle gilt natürlich erst recht, wenn f auf ganz [a, b] differenzierbar ist. Es ist aber sinnvoll, hier und im Folgenden nur die Differenzierbarkeit auf (a, b) zu verlangen, um auch Funktionen zu erfassen, die in den Endpunkten des Intervalls stetig, aber nicht differenzierbar sind – wie in Abbildung 8-4 skizziert. Und überhaupt vermeidet ein Mathematiker gerne Bedingungen, die er nicht benötigt . . . Ç · 8-4 Satz von Rolle a 8.13 c b Mittelwertsatz Ist f : [a, b] → R stetig und auf (a, b) differenzierbar, so existiert ein Punkt c ∈ (a, b) mit f (b) − f (a) = f 0(c)(b − a). Ï Y Y Y Y Y Subtrahieren wir von der Funktion f die Sekante durch die Eckpunkte ihres Graphen – siehe Abbildung 8-5 –, so erhalten wir die Funktion ϕ mit ϕ(t) = f (t) − m(t − a), m= f (b) − f (a) . b−a (9) Für diese Funktion gilt ϕ(a) = ϕ(b) . Auch ist ϕ auf [a, b] stetig und auf (a, b) differenzierbar. Nach dem Satz von Rolle existiert also ein c ∈ (a, b) mit ϕ0 (c) = f 0(c) − m = 0. Dies ist äquivalent zur Behauptung. Y Y Y Y Y Der Wert m in (9) stellt die mittlere Steigung der Funktion f im Intervall [a, b] dar. Der Mittelwertsatz sagt also aus, dass an wenigstens einer Stelle im Innern des Intervalls die Tangentensteigung gleich der mittleren Steigung ist. Der Satz von Rolle ist hiervon ein Spezialfall, denn für f (b) = f (a) ist m = 0 . Andererseits haben wir den Mittelwertsatz gerade mit dem Satz von Rolle bewiesen. Beide Sätze sind somit äquivalent. Eine etwas flexiblere Formulierung des Zwischenwertsatzes ist die folgende, wo es nicht auf die Anordnung der Punkte ankommt. 8 11 207 8 8.14 differenziation Zweite Formulierung des Mittelwertsatzes Ist f auf dem abgeschlossenen Intervall mit den Endpunkten t und t + h stetig und im Innern differenzierbar, so existiert ein θ ∈ (0, 1) , so dass f (t + h) − f (t) = f 0(t + θh) h. Ï Dies folgt aus dem Mittelwertsatz, indem man für h > 0 das Intervall [x, x + h] und für h < 0 das Intervall [x + h, x] betrachtet. Y Y Y Y Y YYYYY Folgerungen 8.15 Schrankensatz Sei f : [a, b] → R stetig, auf (a, b) differenzierbar, und f 0 sei auf (a, b) beschränkt. Dann gilt für alle u < v in [a, b] die Ungleichung |f (v) − f (u)| à (v − u) sup |f 0 (t)| . u<t<v Insbesondere ist f lipschitz auf [a, b] mit Konstante supa<t<b |f 0 (t)| . Ï Nach Voraussetzung sind beide Suprema im Satz endlich. Die erste Behauptung folgt dann aus dem Mittelwertsatz 8.13 , angewandt auf zwei beliebige Punkte u < v in [a, b] . Die zweite Behauptung folgt daraus unmittelbar. Y Y Y Y Y YYYYY 8.16 Monotoniesatz Sei f : [a, b] → R stetig und auf (a, b) differenzierbar. (i) f ist konstant auf [a, b] genau dann, wenn f 0 = 0 auf (a, b) . (ii) f ist monoton steigend auf [a, b] genau dann, wenn f 0 á 0 auf (a, b) . (iii) f ist streng monoton steigend auf [a, b] , wenn f 0 > 0 auf (a, b) . Entsprechendes gilt für ›monoton fallend‹. Ï Zu je zwei beliebigen Punkten u < v in [a, b] existiert aufgrund des Mittelwertsatzes ein Punkt c ∈ (u, v) ⊂ (a, b) mit YYYYY f (v) − f (u) = f 0(c)(v − u) á 0. · 8-5 Zum Mittelwertsatz f (b) − f (a) = f 0(c) b−a a 208 8 12 c b lokale extrema und mittelwertsatz 8-b Ist nun f 0 = 0 auf (a, b) , so folgt hieraus f (v) = f (u) für alle u < v und damit die Konstanz von f . Umgekehrt verschwindet natürlich die Ableitung einer konstanten Funktion überall. Ist andererseits f 0 á 0 auf (a, b) , so folgt hieraus f (v) − f (u) á 0 . Also gilt f (u) à f (v) für alle u < v , und f ist monoton steigend. Umgekehrt folgt hieraus f (t) − f (c) á 0, t−c t ∈ [a, b] Ø {c}. Dasselbe gilt dann auch für den Grenzwert t → c , also f 0(c) . Die letzte Behauptung folgt analog. Y Y Y Y Y Man beachte, dass die Umkehrung von (iii) nicht gilt. Aus der strengen Monotonie folgt nicht, dass die Ableitung nirgends verschwindet. So ist die Funktion t , t 3 streng monoton steigend, aber ihre Ableitung 3t 2 verschwindet bei t = 0 . Aus dem Monotoniesatz ergibt sich ein einfaches Kriterium für das Vorliegen einer Extremalstelle. 8.17 Satz Die Funktion f sei auf dem offenen Intervall I differenzierbar und besitze in c ∈ I einen kritischen Punkt. Ist f 0 in einer Umgebung von c streng monoton steigend respektive fallend, so besitzt f in c ein striktes lokales Minimum respektive Maximum. Ï Angenommen, es existiert eine Umgebung Uδ (c) ⊂ I , in der f 0 streng monoton steigt. Wegen f 0(c) = 0 gilt dann f 0(c−δ,c) < 0, f 0(c,c+δ) > 0. YYYYY Also ist f auf (c−δ, c) streng monoton fallend und auf (c, c+δ) streng monoton steigend. Somit liegt bei c ein striktes Minimum. Y Y Y Y Y Schließlich erhalten wir noch einen kompakten Satz über Umkehrfunktionen. 8.18 Satz über differenzierbare Umkehrfunktionen Ist f in C 1(I) und verschwindet f 0 nirgends, so ist f umkehrbar, die Umkehrfunktion f −1 ist auf f (I) ebenfalls C 1, und es gilt (f −1 )0 = 1 . f −1 f0◦ Ï Da f 0 auf I stetig ist und nirgends verschwindet, hat f 0 festes Vorzeichen. Aufgrund des Monotoniesatzes 8.16 ist daher f streng monoton und somit umkehrbar. Aufgrund des Umkehrsatzes 8.8 ist, da f 0 nirgends verschwindet, g = f −1 auf f (I) differenzierbar, und es ist g 0 = (f 0 ◦ g)−1 ebenfalls stetig. Y Y Y Y Y YYYYY 8 13 209 8 differenziation 8-c der hauptsatz Die Differenziation ordnet einer Funktion f ihre Ableitung f 0 zu. Umgekehrt kann man fragen, ob eine gegebene Funktion f die Ableitung einer anderen Funktion ist. Dies ist die Frage nach der Existenz einer Stammfunktion. Um diese Frage für Regelfunktionen vollständig zu beantworten, definieren wir die links- und rechtsseitige Ableitung einer Funktion f , f 0– (a) Í lim f (a + h) − f (a) h f 0+ (a) Í lim f (a + h) − f (a) , h h0 und h0 wenn diese Grenzwerte existieren. Offensichtlich ist f in einem inneren Punkt a differenzierbar genau dann, wenn dort links- und rechtsseitige Ableitung übereinstimmen. In diesem Fall ist f 0– (a) = f 0(a) = f 0+ (a) . Definition Eine Funktion F : I → R heißt Stammfunktion einer Regelfunktion f : I → R , wenn F in jedem Punkt von I einseitige Ableitungen besitzt und F±0 = f± gilt. In einem Randpunkt von I ist dabei nur der jeweilige einseitige Grenzwert zu betrachten. Ï Bemerkung Ist f stetig, so ist eine Stammfunktion F differenzierbar, und es gilt F 0 = f auf ganz I . In diesem Fall ist F sogar stetig differenzierbar. Ç Stammfunktionen sind nicht eindeutig. Ist F eine Stammfunktion, so auch F + c . Auf einem Intervall ist dies aber die einzige Unbestimmtheit. 8.19 Lemma Auf einem Intervall unterscheiden sich verschiedene Stammfunktionen einer Regelfunktion nur durch eine additive Konstante. Ï Y Y Y Y Y Seien G und H zwei Stammfunktionen derselben Regelfunktion f auf dem Intervall I . Dann besitzt auch G − H in jedem Punkt einseitige Ableitungen – das ist eine leichte Übung –, und es gilt 0 0 (G± − H± )0 = G± − H± = f± − f± = 0. Also ist G − H auf I sogar differenzierbar, und es gilt (G − H)0 = 0 . Aufgrund des Monotoniesatzes 8.16 ist G − H konstant. Y Y Y Y Y 210 8 14 der hauptsatz 8-c Die fundamentale Beobachtung ist nun, dass man eine Stammfunktion einer Regelfunktion f erhält, indem man das Integral über f als Funktion der oberen Grenze betrachtet. 8.20 Stammfunktionensatz Sei f auf I integrierbar und c ∈ I ein beliebiger Punkt. Dann definiert Zt Φ(t) Í f, t ∈ I, c eine lipschitzstetige Stammfunktion Φ : I → R von f . Ï Y Y Y Y Y Ist f auf I integrierbar, so auch auf jedem Teilintervall von I . Die Funktion Φ ist daher für jedes t ∈ I definiert. Aus der Additivität des Integrals folgt dann Zv Zu Zv Φ(v) − Φ(u) = f− = f, u, v ∈ I. c c u Für u < v folgt hieraus mit der Dreiecksungleichung Z v Zv à |Φ(v) − Φ(u)| = f |f | à kf kI (v − u). u u Also ist Φ lipschitz mit L-Konstante kf kI . Für a, a + h ∈ I ist Z a+h Z a+h 1 Φ(a + h) = Φ(a) + f = Φ(a) + f h. h a a Aufgrund des Riemannschen Lemmas 7.15 besitzt der Ausdruck in eckigen Klammern für h 0 und h 0 die einseitigen Grenzwerte f 0– (a) respektive f 0+ (a) . Dies bedeutet aber, dass Φ die entsprechenden einseitigen Ableitungen besitzt, und dass 0 Φ± (a) = f± (a). Somit ist Φ eine Stammfunktion von f . Y Y Y Y Y Bemerkung Ist f insbesondere stetig, so gilt überall Z t 0 f = f (t). c Dies folgt auch aus dem Mittelwertsatz der Integralrechnung Φ(t + h) − Φ(t) 1 = h h 7.8 , denn Z t+h f = f (t + θh) → f (t), h → 0. t In diesem Sinne sind Differenzieren und Integrieren inverse Operationen. Ç 8 15 211 8 differenziation · 8-6 Φ(t + h) − Φ(t) = hf (t + θh) f t t + θh t + h ¸ Die Signumfunktion ist auf jedem kompakten Intervall integrierbar, und eine Stammfunktion ist ( ) Zt t, t á 0 Φ(t) = sgn = = |t| . −t, t < 0 0 Da sgn nur in 0 nicht stetig ist, gilt Φ 0 (t) = |t|0 = sgn t für t ≠ 0 sowie 0 Φ± (0) = sgn ± (0) = ±1. µ Der vorangehende Satz eröffnet nun die Möglichkeit, Integrale mithilfe von Stammfunktionen zu berechnen. 8.21 Hauptsatz der Differenzial- und Integralrechnung bar und F eine Stammfunktion von f , so gilt Zb a b f = F Í F (b) − F (a). Ist f auf [a, b] integrier- Ï a Für die Stammfunktion Φ des vorangehenden Satzes gilt per construc- YYYYY tionem Zb Φ(b) − Φ(a) = Za f− c Zb f = c f. a Jede andere Stammfunktion F von f unterscheidet sich von Φ nur durch eine additive Konstante 8.19 . Also ist auch Zb F (b) − F (a) = Φ(b) − Φ(a) = a f. Y Y Y Y Y Ist f stetig differenzierbar, so ist f selbst Stammfunktion seiner Ableitung f 0 . Es gilt also folgender Spezialfall. 8.22 Korollar 212 8 16 Ist f auf [a, b] stetig differenzierbar, so gilt bestimmung von integralen Zb a b f = f . 0 8-d Ï a Wegen des Hauptsatzes wird eine Stammfunktion auch als unbestimmtes Integral bezeichnet, während das Integral mit Intervallgrenzen bestimmtes Integral genannt wird. Genauer gilt folgende Sprachregelung. Definition Das unbestimmte Integral einer stetigen Funktion f ist die Familie Z f Í {F + c : c ∈ R} aller Stammfunktionen von f auf einem Intervall. Ï Gewöhnlich schreibt man dafür einfach F + c . In Formelsammlungen wird auch die Konstante c oft weggelassen. ¸ Das unbestimmte Integral eines Polynoms ist ZX n n X ak t k = k=0 k=0 n+1 X ak−1 ak k+1 t +c = t k + c. k+1 k k=1 Ferner ist 1 2 Z p 1 √ = t + c, t Z et = et + c. µ 8-d b e s t i m m u n g v o n integralen Von nun an verwenden wir die übliche Leibnizsche Integralnotation Zb Zb f = f (t) dt, a a die vor allem bei der Substitutionsregel zweckmäßig ist. Dabei ist die Integrationsvariable, ähnlich wie ein Summationsindex, frei wählbar. Es ist also Zb Zb Zb f (t) dt = f (u) du = f (x) dx. a a a Die Bestimmung von Integralen beruht auf der Bestimmung von Stammfunktionen, also einer Lösung der Gleichung F 0 = f zu gegebenem f . Jede Differenziationsregel liefert eine Integrationsregel, indem man sie ›rückwärts‹ liest. Gilt also zum Beispiel (arctan t)0 = 1 1 + t2 8 17 213 8 differenziation – siehe Abschnitt 9-d –, so ist umgekehrt Z 1 = arctan t + c. 1 + t2 Insbesondere folgen aus der Produkt- und Kettenregel die Regeln der partiellen Integration und der Substitution, die wir nun formulieren. 8.23 Sind f und g auf [a, b] stetig differenzierbar, so gilt Partielle Integration Zb a YYYYY b Z b f 0(t)g(t) dt = f (t)g(t) f (t)g 0 (t) dt. − Ï a a Die Integrale existieren, da die Integranden stetig sind. Also gilt Zb Zb 0 f (t)g(t) dt + f (t)g 0 (t) dt a a Zb = (f 0g + f g 0 )(t) dt = a Zb a b (f g)0 (t) dt = (f g) , a was die Behauptung ergibt. Y Y Y Y Y Man erhält die entsprechende Formel für die unbestimmten Integrale, indem man die Integrationsgrenzen weglässt. Eine äquivalente Formulierung ist Z Z f (t)g(t) = F (t)g(t) − F (t)g 0 (t), wenn F eine Stammfunktion von f ist. In den folgenden Beispielen greifen wir auf einige spezielle Funktionen vor, die wir im nächsten Kapitel einführen. ¸ a. Wegen (et )0 = et ist Z t t t e dt = t e − Z et dt = t et − et + c = (t − 1)et + c. So erhält man zum Beispiel Z1 0 1 t et dt = (t − 1)et = 1. 0 b. Mit den Ableitungsregeln für trigonometrische Funktionen erhält man Z Z Z sin2 t dt = sin t sin t dt = − sin t cos t + cos2 t dt. Mit cos2 t = 1 − sin2 t folgt hieraus Z Z sin2 t dt = − sin t cos t + t − sin2 t dt. 214 8 18 bestimmung von integralen 8-d R Also ist 2 sin2 t dt = t − sin t cos t + c. , So erhält man zum Beispiel π Zπ 1 π sin2 t dt = (t − sin t cos t) = 2. 2 0 0 c. Manchmal hilft es, einen neutralen Faktor 1 ›aufzuleiten‹. Für den Logarithmus erhält man so Z Z log t dt = 1· log t dt Z = t log t − t log0 t dt Z = t log t − 1 dt = t log t − t + c. Zum Beispiel ist 1 Z1 log t dt = (t log t − t) = −1. 0 0 Dazu später mehr in Abschnitt 10-b. µ 8.24 Substitutionsregel Ist ϕ stetig differenzierbar auf I = [a, b] und f stetig auf dem Bildintervall ϕ(I) , so gilt Z ϕ(b) Zb f (t) dt = f (ϕ(s))ϕ0 (s) ds. Ï (10) ϕ(a) YYYYY a Für eine beliebige Stammfunktion F von f gilt (F ◦ ϕ)0 = (F 0 ◦ ϕ)ϕ0 = (f ◦ ϕ)ϕ0 . Daraus folgt Z ϕ(b) ϕ(a) ϕ(b) b f (t) dt = F = F ◦ ϕ ϕ(a) a Zb = (F ◦ ϕ)0 (s) ds = a Zb f (ϕ(s))ϕ0 (s) ds a mit zweimaliger Anwendung des Hauptsatzes. Y Y Y Y Y Für unbestimmte Integrale erhält Gleichung (10) die Form Z Z 0 f (ϕ(s))ϕ (s) ds = f (t) dt . t=ϕ(s) Das heißt, in einer Stammfunktion von f wird t durch ϕ(s) ersetzt. Die ›einfache‹ Anwendung der Substitutionsregel besteht darin zu erkennen, dass der Integrand aus der Anwendung der Kettenregel hervorgegangen ist und das Integral daher die Form der rechten Seite in Gleichung (10) hat. 8 19 215 8 differenziation ¸ Im unbestimmten Integral Z √ t dt 1 + t2 ist der Zähler – bis auf den Faktor 2 – die Ableitung der Funktion unter der Wurzel. Wir können daher die Substitutionsregel mit ϕ(t) = 1 + t 2 anwenden: Z Z Z Z t 2t ϕ0 (t) 1 1 1 ds √ √ p √ dt = dt = dt = . 2 2 2 ϕ(t) s s=ϕ(t) 1 + t2 1 + t2 Mit Kenntnis der Stammfunktion von √1s in Beispiel 8.3 erhalten wir Z p p t √ dt = s + c = 1 + t 2 + c. 2 1+t s=ϕ(t) Für das entsprechende bestimmte Integral gilt dann b Zb p t 2 √ dt = 1 + t , 1 + t2 a a da die Integrationskonstante c bei der Differenzbildung verschwindet. µ Die ›nicht so einfache‹ Anwendung der Substitutionsregel besteht darin, in einem Integral die gegebene Integrationsvariable durch eine neue zu ersetzen, um so den Integranden zu vereinfachen. Die richtige Substitution kann schnell zum Ziel führen, die falsche vollends ins Dickicht. Hier wird das Integrieren teilweise zu einer Kunst, die viel Erfahrung und Übung erfordert. Rβ Um in einem vorgelegten Integral α f (t) dt eine neue Integrationsvariable s = ψ(t) einführen zu können, muss allerdings ψ auf [α, β] umkehrbar sein. Mit der auf dem Bildintervall [a, b] = [ψ(α), ψ(β)] erklärten Umkehrung t = ϕ(s) ist dann wieder Zβ Z ϕ(b) Zb f (t) dt = f (t) dt = f (ϕ(s))ϕ0 (s) ds. α ϕ(a) a Formal gelangt man zu dieser Formel, indem man t = ϕ(s) differenziert zu dt = ϕ0 (s) ds und im linken Integral die entsprechende Subsitution vornimmt. Mit etwas Glück wird das Integral danach einfacher . . . . ¸ a. Im Integral Z p t 1 + t dt 216 8 20 höhere ableitungen 8-e p führen wir s = 1 + t als neue Variable ein. Diese Funktion ist umkehrbar für s á 0 , die Umkehrung ist t = s 2 − 1 . Es ist dann dt = 2s ds , und wir erhalten Z Z Z p t 1 + t dt = (s 2 − 1)s ·2s ds = 2 (s 4 − s 2 ) ds. Dies ist nun elementar lösbar. Im bestimmten Integral sind die Integrationsgrenzen noch entsprechend zu transformieren: √1+b Z √1+b Zb p 2 4 2 5 3 (s − s ) ds = . t 1 + t dt = 2 √ (3s − 5s )√ 15 1+a a 1+a b. Typische Anwendungen der Substitutionsregel sind die Translation und die Streckung der Integrationsvarablen: Zb Z b+c f (t + c) dt = a f (s) ds, Zb f (ct) dt = c −1 a Zb s = t + c, a+c Z bc f (s) ds, s = ct, c ≠ 0, f (s) ds, s = tn. ac f (t n )t n−1 dt = n−1 a Z bn an µ 8-e h ö h e r e a b l e i t u ngen Ist f : I → R differenzierbar, so ist die Ableitung f 0 : I → R wieder eine reelle Funktion auf I . Somit kann man fragen, ob f 0 ebenfalls differenzierbar ist. Ist dies der Fall, erhält man die zweite Ableitung von f , f 00 Í (f 0)0 : I → R. So kann man fortfahren, so lange die jeweilige Ableitung ebenfalls differenzierbar ist, und induktiv die höheren Ableitungen von f erklären durch f (0) Í f , f (r ) Í (f (r −1) )0 , r á 1. Insbesondere ist f (1) = f 0 und f (2) = f 00 . Andere gebräuchliche Bezeichnungen für die r -te Ableitung sind ∂ rf , D rf . 8 21 217 8 differenziation Man sagt, f ist r -mal differenzierbar, wenn f , f 0, . . . , f (r ) existieren. Ist außerdem f (r ) stetig, so heißt f r -mal stetig differenzierbar. Die Klasse dieser Funktionen wird mit C r (I) bezeichnet, und man sagt, eine Funktion f ∈ C r (I) ist eine C r -Funktion, oder kurz, ist C r . Schließlich definiert man noch C ∞(I) Í \ C r (I), r á0 den Raum der unendlich oft differenzierbaren Funktionen I → R . Man erhält damit eine unendliche Skala von Funktionenräumen C ∞(I) ⊊ · · · C r +1(I) ⊊ C r (I) · · · ⊊ C 0(I). Jede Inklusion ist eine echte Inklusion, denn natürlich gibt es für jedes r á 0 C r -Funktionen, die nicht C r +1 sind. 8.25 ¸ a. Jede Potenz t , t n mit n á 0 ist unendlich oft differenzierbar, mit (t n )(r ) = n(n − 1) · · · (n − r + 1) t n−r = n! t n−r , (n − r )! r á 1. Insbesondere ist (t n )(n) = n! und (t n )(n+1) ≡ 0 . b. Jedes Polynom ist unendlich oft differenzierbar. Ist das Polynom p vom Grad n , so ist p (n+1) = 0 . c. Die Funktion t , t 2 cos t −1 ist im Punkt t = 0 differenzierbar, aber nicht stetig differenzierbar. d. Die Funktionen exp , sin und cos sind auf R unendlich oft differenzierbar. Dasselbe gilt für log auf (0, ∞) . µ Jede Linearkombination von C r -Funktionen ist wieder eine C r -Funktion, wie man induktiv mithilfe der Regel (αf + βg)0 = αf 0 + βg 0 leicht zeigt. Somit ist C r (I) ein reeller Vektorraum. Es gilt aber noch mehr. 8.26 Satz Das Produkt zweier C r -Funktionen f und g ist wieder eine C r -Funktion, und es gilt die Leibnizsche Formel (f g)(r ) = r X Bsr f (r −s) g (s) (11) s=0 mit den Binomialkoeffizienten Bsr = 218 8 22 r! . Ï s ! (r − s)! höhere ableitungen YYYYY 8-e Für den Beweis benötigen wir nur die Identitäten B0r = Brr = 1 und r Bs−1 + Bsr = Bsr +1 , 1 à s à r. (12) Die explizite Kenntnis dieser Koeffizienten ist nicht nötig – siehe Aufgabe 4-23. Für r = 1 folgt die Behauptung damit aus der Produktregel. Ist nun der Satz für r á 1 bereits bewiesen und sind f und g C r +1-Funktionen, so können wir Gleichung (11) nochmals differenzieren und erhalten mit (12) (f g)(r +1) = r X h i Bsr f (r −s+1) g (s) + f (r −s) g (s+1) s=0 = r X Bsr f (r +1−s) g (s) + s=0 rX +1 r Bs−1 f (r +1−s) g (s) s=1 = f (r +1) g (0) + f (0) g (r +1) + r X r (Bsr + Bs−1 )f (r +1−s) g (s) s=1 = rX +1 Bsr +1 f (r +1−s) g (s) . s=0 Sind außerdem alle Ableitungen von f und g stetig, so ist offensichtlich auch der in dieser Gleichung rechts stehende Ausdruck stetig. Y Y Y Y Y Wie bei der Stetigkeit und der Differenzierbarkeit untersuchen wir jetzt noch die Komposition und die Umkehrung von Funktionen im Hinblick auf höhere Ableitungen. Überraschungen gibt es hier nicht. 8.27 Satz Sind f und g beide C r -Funktionen mit r á 1 , und ist die Komposition g ◦ f auf dem Definitionsintervall von f erklärt, so ist auch g ◦ f eine C r -Funktion. Ï Y Y Y Y Y Für r = 1 ist dies Satz 8.10. Wir können daher induktiv annehmen, dass der Satz für ein r á 1 gilt. Mit der Kettenregel ist (g ◦ f )0 = (g 0 ◦ f ) · f 0. Sind f und g beide C r +1, so ist g 0 C r , und nach Induktionsannahme ist g 0 ◦ f ebenfalls C r . Da f 0 ebenfalls C r ist, ist es auch das Produkt (g 0 ◦ f )·f 0 aufgrund des letzten Satzes. Also ist die Ableitung (g ◦ f )0 C r , und g ◦ f selbst somit C r +1. – Die Stetigkeitsaussage folgt analog. Y Y Y Y Y 8.28 Satz Ist f ∈ C r (I) mit r á 1 und verschwindet f 0 nirgends auf I , so ist f umkehrbar, und die Umkehrfunktion f −1 ist ebenfalls C r . Ï YYYYY Für r = 1 ist dies Satz 8.18, und die Ableitung von g = f −1 ist 8 23 219 8 differenziation g0 = 1 f0◦ g . Ist nun f eine C r -Funktion, und setzen wir h : t , 1/t für t ≠ 0 , so stellt sich g0 = h ◦ f 0 ◦ g dar als Komposition von drei mindestens r − 1-mal stetig differenzierbaren Funktionen. Nach dem letzten Satz ist g 0 somit C r −1. Also ist g selbst C r . Y Y Y Y Y ¸ Differenziert man die erste Ableitung einer Umkehrfunktion g = f −1 , so erhält man als zweite Ableitung g 00 = (−1)(f 0 ◦ g)−2 · f 00 ◦ g · g 0 = (−1)(f 0 ◦ g)−3 f 00 ◦ g =− f 00 ◦ g . µ (f 0 ◦ g)3 8-f t a y l o r p o l y n o m e und taylorreihe Sei f eine reelle Funktion auf einem Intervall I und a ∈ I ein beliebiger Punkt. Die Stetigkeit von f im Punkt a ist gleichbedeutend mit der lokalen Approximierbarkeit von f durch eine konstante Funktion, denn es gilt ja f (t) = f (a) + ε(t) mit einer in a stetigen und dort verschwindenden Funktion ε . Die Differenzierbarkeit von f in a ist gleichbedeutend mit der lokalen Approximierbarkeit durch eine lineare Funktion, denn f (t) = f (a) + f 0(a)(t − a) + ε(t)(t − a) wiederum mit einer in a stetigen und dort verschwindenden Funktion ε . Man kann daher fragen, ob sich eine Funktion in der Umgebung eines Punktes auch durch Polynome höherer Ordnung approximieren lässt, so dass f (t) = n X ak (t − a)k + ε(t)(t − a)n k=0 mit einer in a stetigen und dort verschwindenden Funktion ε . 220 8 24 (13) taylorpolynome und taylorreihe 8-f Um eine Idee von der Gestalt einer solchen Approximation zu gewinnen, sei der Einfachheit halber f (t) = n X ak (t − a)k . k=0 Dann ist natürlich f (a) = a0 , und allgemeiner f (k) (a) = k! ak , 0 à k à n. Im Falle eines Polynoms f vom Grad n gilt somit die Identität f (t) = n X f (k) (a) (t − a)k . k! k=0 Dies nehmen wir zum Anlass für folgende Definition. Definition Ist f n-mal differenzierbar auf I und a ∈ I , so heißt Tan f (t) Í n X f (k) (a) (t − a)k k! k=0 das n-te Taylorpolynom von f am Entwicklungspunkt a . Ï Insbesondere ist wieder Ta0 f (t) = f (a), Ta1 f (t) = f (a) + f 0(a)(t − a) Ta2 f (t) = f (a) + f 0(a)(t − a) + f 00(a) (t − a)2 . 2 Schreiben wir t = a + h , so ist Tan f (a + h) = f (a) + f 0(a)h + f (n) (a) n f 00(a) 2 h + ··· + h . 2 n! Restgliedformeln Das Taylorpolynom allein ist bedeutungslos, solange man nicht weiß, wie gut Tan f die Funktion f approximiert. Für den Approximationsfehler, das sogenannte Restglied, gibt es zahlreiche Darstellungen. 8.29 Restgliedformel in Integralform f (t) = Tan f (t) + Ran f (t), Für f ∈ C n+1(I) gilt a, t ∈ I, (14) mit dem Restglied 8 25 221 8 differenziation Ran f (t) 1 = n! = Zt (t − s)n f (n+1) (s) ds a hn+1 n! Z1 (1 − s)n f (n+1) (a + sh) ds 0 für t = a + h . Ï Y Y Y Y Y Wir zeigen (14) mit Induktion über n . Für n = 0 ist dies der Hauptsatz, denn für f ∈ C 1(I) und a, t ∈ I gilt Zt f (t) = f (a) + f 0(s) ds = Ta0 f (t) + Ra0 f (t). a Gilt die Darstellung (14) für ein n − 1 á 0 1 und ist f ∈ C n(I) , so können wir in der Integraldarstellung von Ran−1 f partiell integrieren und erhalten t Z 1 1 t Ran−1 f (t) = − (t − s)n f (n) (s) (t − s)n f (n+1) (s) ds + n! n! a a 1 (t − a)n f (n) (a) + Ran f (t). = n! Zusammen mit der Induktionsannahme für n−1 erhalten wir also wie gewünscht f (t) = Tan−1 f (t) + Ran−1 f (t) = Tan−1 f (t) + 1 (t − a)n f (n) (a) + Ran f (t) n! = Tan f (t) + Ran f (t). Die zweite Formel folgt aus der ersten mit t = a + h und der Substitution s = a + uh . Damit ist ds = h du und t − s = (1 − u)h . Ersetzen wir abschließend wieder u durch s , folgt die zweite Darstellung. Y Y Y Y Y Bemerkung Der Beweis zeigt, dass Taylorpolynom und Restgliedformel gleichzeitig aus dem Hauptsatz der Differenzial- und Integralrechnung mittels partieller Integration folgen. Ç Für f ∈ C n+1(I) erhalten wir mit der Restgliedformel f (t) = Tan f (t) + ε(t)(t − a)n mit einer stetigen und in a verschwindenden Funktion ε . Wir können deshalb das Taylorpolynom Tan f als das bestapproximierende Schmiegepolynom vom Grad n an f im Punkt a auffassen. Für n = 1 ist dies wieder die Tangente in diesem Punkt. 1 Das spart einige › n + 1 ‹ in der folgenden Formel. 222 8 26 taylorpolynome und taylorreihe 8-f Die folgende Restgliedformel ist zwar für Abschätzungen oft zu ungenau, ist aber recht handlich und von der gleichen Form wie der n + 1-te Term des Taylorpolynoms. 8.30 Sei f ∈ C n+1(I) und a, a + h ∈ I . Dann existiert ein Restglied von Lagrange θ ∈ (0, 1) , so dass Ran f (a + h) = hn+1 f (n+1) (a + θh). (n + 1)! Ï Da f (n+1) stetig ist und (1 − s)n á 0 auf [0, 1] , folgt mit dem Mittelwertsatz der Integralrechnung 7.8 Z1 (1 − s)n f (n+1) (a + sh) ds YYYYY 0 = f (n+1) (a + θh) Z1 (1 − s)n ds = 0 n+1 Nach Multiplikation mit h formel in Integralform. Y Y Y Y Y 1 f (n+1) (a + θh). n+1 /n! folgt die Behauptung mit der zweiten Restglied- Anwendungen Als erste Anwendung beweisen wir die Umkehrung zu Beispiel 8.25. 8.31 Satz Verschwindet f (n+1) , so ist f ein Polynom vom Grad höchstens n , und es gilt f = Tan f für alle a ∈ R . Ï Verschwindet f (n+1) , so verschwindet aufgrund der Restgliedformeln für jeden Punkt a , und es folgt f = Tan f . Also ist f ein Polynom vom Grad höchstens n . Ist umgekehrt f ein solches Polynom, so verschwindet offensichtlich f (n+1) identisch. Y Y Y Y Y Ran f YYYYY Jedes Polynom lässt sich also in sein Taylorpolynom an jeder beliebigen Stelle umentwickeln, und das Ergebnis ist wieder ein Polynom vom selben Grad. Für (1 + t)n erhalten wir auf diese Weise die 8.32 Binomische Formel (1 + t)n = n X Für n á 1 gilt Bkn t k k=0 mit den Binomialkoeffizienten Bkn = n! , k! (n − k)! 0 à k à n. Ï 8 27 223 8 differenziation YYYYY Für das Polynom p : t , (1 + t)n gilt aufgrund des letzten Satzes p(t) = T0n p(t) = n X p (k) (0) n t , k! k=0 und es ist p (k) (0) n · · · (n − k + 1) n! = = = Bkn . Y Y Y Y Y k! k! k! (n − k)! Bemerkung Üblicherweise werden die Binomialkoeffizienten durch eine Rekursionsformel wie in Aufgabe 4-23 definiert. Die Definition hier ist davon unabhängig. Ç Die binomische Formel für natürliche Exponenten n ist natürlich eine algebraische Identität, die man wie in Aufgabe 4-24 mit Induktion über n beweist. Differenzialrechnung ist erst für die binomische Reihe mit reellen Exponenten erforderlich, die wir in Satz 8.34 betrachten. Taylorreihe Ist f beliebig oft differenzierbar, so können wir Taylorpolynome jeder Ordnung bilden. Dies führt zum Begriff der Taylorreihe. Definition Für f ∈ C ∞(I) und a ∈ I heißt Ta f (t) Í ∞ X 1 (k) f (a)(t − a)k k! k=0 die Taylorreihe von f am Entwicklungspunkt a . Ï Die Taylorreihe Ta f konvergiert immer im Entwicklungspunkt a selbst und hat dort den Wert f (a) . Das ist trivial. Eine ganz andere Frage ist, ob sie auch in anderen Punkten konvergiert, und ob ihr Wert dort mit der Funktion selbst übereinstimmt. Definition Konvergiert die Reihe in einer Umgebung von a und gilt dort Ta f (t) = f (t), so heißt f um a entwickelbar in seine Taylorreihe. Ï Im Falle der Konvergenz der Taylorreihe im Punkt t gilt also 0 = f (t) − Ta f (t) = lim (f (t) − Tan f (t)) = lim Ran f (t). n→∞ Somit erhalten wir sofort folgendes 224 8 28 n→∞ taylorpolynome und taylorreihe 8.33 Entwicklungskriterium lim Ran f (t) = 0. n→∞ 8-f Es gilt f (t) = Ta f (t) genau dann, wenn Ï Als Beispiel betrachten wir die binomische Formel für beliebige reelle Exponenten. Wir greifen dabei der Definition von t α und der Differenziationsregel (t α )0 = αt α−1 in Abschnitt 9-b vor. 8.34 Binomische Reihe für reelle Exponenten X α n (1 + t)α = t , |t| < 1, Bn Für α ∈ R gilt ná0 mit B0α Í 1 und α Bn Í α · · · (α − n + 1) , 1·2 · · · n n á 1. Ï Die Funktion f : t , (1 + t)α ist auf (−1, ∞) unendlich oft differenzierbar, mit YYYYY f (n) (t) = α(α − 1) · · · (α − n + 1) (1 + t)α−n . Daraus folgt α(α − 1) · · · (α − n + 1) f (n) (0) α . = = Bn n! 1·2 · · · n Für das n − 1-te Restglied erhalten wir die Integraldarstellung Z1 α n R0n−1 f (t) = nBn t (1 − s)n−1 (1 + st)α−n ds. 0 Ist jetzt |t| < 1 , so ist 1 − s < 1 + st und damit Z1 n−1 n α R (1 + st)α−1 ds. f (t) à nBn |t| 0 0 α Das Integral ist eine Konstante, und nBn |t|n → 0 für n → ∞ , wie man mit einer Quotientenbetrachtung verifiziert. Y Y Y Y Y ¸ a. Für natürliche Exponenten erhalten wir wieder die klassische binomische n Formel, denn Bm = 0 für m > n . α b. Für α = −1 ist Bn = (−1)n−1 . Für |t| < 1 ist somit X 1 =1+ (−1)n t n , 1+t ná1 wie es sein sollte. 8 29 225 8 differenziation c. Für α = 1/2 und |t| < 1 erhalten wir p X 1 1 1 3 5 4 1+t =1+ bn t n = 1 + t − t 2 + t − t ± ... 2 8 16 128 ná1 mit bn = (−1)n (−1)·1·3 · · · (2n − 3) . µ 2n 1·2 · · · n Konvergiert die Taylorreihe in einer Umgebung des Entwicklungspunktes a , so bedeutet dies jedoch keineswegs, dass auch das Restglied verschwindet. In Abschnitt 10-c beschreiben wir eine Funktion φ ∈ C ∞(R) , deren Taylorreihe im Punkt 0 identisch Null ist, aber φ außerhalb des Nullpunkt nicht darstellt. Funktionen in C ∞(I) , die sich in jedem Punkt in ihre Taylorreihe entwickeln lassen, heißen reell analytisch, und ihre Klasse wird mit C ω(I) bezeichnet. Einige wichtige analytische Funktionen werden wir im folgenden Kapitel konstruieren. aufgaben 1 Sei f : [a, b] → R stetig und auf (a, b) differenzierbar. Welche Aussagen sind wahr? a. Ist f monoton steigend, so ist f 0 á 0 auf (a, b) . b. Ist f umkehrbar, so besitzt f keinen kritischen Punkt. c. Ist f nicht monoton, so besitzt f einen kritischen Punkt. d. Besitzt f im Punkt a eine Minimalstelle, so ist f 0(a) = 0 . 2 e. Ist f (a) á f (b) , so ist f 0(c) à 0 für wenigstens ein c ∈ (a, b) . f. Ist f umkehrbar, so ist auch f −1 differenzierbar. Bestimmen Sie die Linearisierungen im Punkt a = 0 der Funktionen f mit Funktionsterm √ a. 1+t b. 3 1 1−t c. (1 + t)n d. √ n 1 + t. Sei f : I → R im Punkt a ∈ I stetig. Gibt es eine affine Funktion α : t , m(t − a) + b mit lim t→a |f (t) − α(t)| = 0, |t − a| so ist diese eindeutig bestimmt, und es ist b = f (a) und m = f 0(a) . 4 Verbesserter Schrankensatz: Sei f : [a, b] → R lipschitzstetig und auf (a, b) differenzierbar. Dann ist f lipschitzstetig auf [a, b] genau dann, wenn f 0 auf (a, b) 226 8 30 aufgaben 8 beschränkt ist. Die bestmögliche Lipschitzkonstante ist in diesem Fall L = sup |f 0(t)| . a<t<b 5 Zwischenwertsatz für die erste Ableitung: Sei f : [a, b] → R stetig und auf (a, b) differenzierbar. Dann nimmt f 0 jeden Wert zwischen inf(a,b) f 0 und sup(a,b) f 0 an. Achtung: Es wird nicht erforderlich, dass f 0 stetig ist. 6 Sei f : [a, b] → R stetig, auf (a, b) stetig differenzierbar, und f 0 sei auf [a, b] stetig fortsetzbar. Dann ist f in a und b ebenfalls differenzierbar. 7 Für t á 0 und n á 1 ist Sie die Ableitung von t 8 √ n 1/n t = t 1/n definiert als die Umkehrfunktion von t n . Bestimmen mit Hilfe des Umkehrsatzes. Eine Funktion f : R → R heißt gerade, falls f (−t) = f (t) , ungerade, falls f (−t) = −f (t) für alle t ∈ R . Zeigen Sie: Ist f differenzierbar und gerade respektive ungerade, so ist f 0 ungerade respektive gerade. 9 Es sei f : [a, b] → R stetig differenzierbar mit f (a) < f (b) und f 0(a) < 0 . Dann besitzt f in (a, b) einen kritischen Punkt. 10 Bestimmen Sie die folgenden Integrale. Zur Erinnerung: exp0 = exp , sin0 = cos und cos0 = − sin . Z1 a. t 2 e−t dt 0 Zπ e. Z1 b. 0 c. Z1 p t 1 + t 2 dt Z1 d. 0 0 Z1 cos t e−t dt f. −π 11 2 t e−t dt sin2 t dt 0 √ t dt 1 + t2 Zπ sin nt sin mt dt g. 0 für n, m ∈ Z Sei f ∈ C 2(I) und c ein innerer Punkt von I . Zeigen Sie: a. Ist f 0(c) = 0 und f 00(c) > 0 , so ist c eine Minimalstelle von f . b. Ist c eine Minimalstelle von f , so ist f 0(c) = 0 und f 00(c) á 0 . c. 12 Dies ist falsch, wenn nur f 0(c) = 0 und f 00(c) á 0 vorausgesetzt wird. Ist f an der Stelle a einmal respektive zweimal differenzierbar, so ist f (a + h) − f (a − h) , 2h f (a + h) − 2f (a) + f (a − h) f 00(a) = lim . h2 h→0 f 0(a) = lim h→0 13 Zeigen Sie, dass die durch Zt L(t) = 1 ds , s t > 0, definierte Funktion L : [0, ∞) → R der Funktionalgleichung L(uv) = L(u) + L(v) 8 31 227 8 differenziation genügt. Bestimmen Sie auch limt→∞ L(t) und limt→0 L(t) . 14 Sei f ∈ C n+1(I) und a, t ∈ I , und schreibe f (t) = Tan f (t) + ε(t)(t − a)n , t ≠ a. Geben Sie die Funktion ε explizit in Integralform an und zeigen Sie, dass sie im Punkt a stetig ist und dort verschwindet. 15 Restglied von Schlömilch: Sei f ∈ C n+1(I) und 0 à p à n . Dann gibt es zu a, a + h ∈ I ein θ ∈ (0, 1) , so dass Ran f (a + h) = hn+1 f (n+1) (a + θh)(1 − θ)n−p . (p + 1)·n! Für p = 0 ist dies das Restglied von Cauchy. 16 P Beweisen Sie den Abelschen Grenzwertsatz: Konvergiert die reelle Reihe ná0 an , so P konvergiert die Potenzreihe ná0 an t n gleichmäßig auf [0, 1] gegen eine stetige Funktion. Insbesondere gilt X X lim an t n = an . t 1 ná0 ná0 Hinweis: Beweis des Abelschen Konvergenzkriteriums in Aufgabe 5-13. 17 Beweisen Sie folgende Aussagen über die binomische Reihe X (1 + t)α = Bnα t n . ná0 a. Für α á 0 konvergiert die Reihe gleichmäßig auf [−1, 1] . Hinweis: Aufgabe 5-12. b. Für −1 < α < 0 konvergiert die Reihe für t = 1 und divergiert für t = −1 . c. 18 Für α à −1 divergiert die Reihe sowohl für t = 1 als auch t = −1 . Gegeben ist f : R → R, a. f (t) = t(1 + 2t sin 1/t), t ≠ 0, 0, t = 0. f ist auf überall differenzierbar. b. Es ist f 0(0) > 0 . c. 228 In jeder Umgebung von 0 existieren Intervalle, auf denen f streng monoton fällt. 8 32 9 Spezielle Funktionen Spezielle Funktionen sind das Salz der Analysis. An erster Stelle stehen dabei die Exponenzialfunktion und die trigonometischen Funktionen, mit deren Hilfe Wachstums- und Schwingungsvorgänge beschrieben werden. Solche Vorgänge werden, entsprechend ihrer physikalischen Natur, durch Differenzialgleichungen beschrieben. Das einfachste und zugleich wichtigste Wachstumsgesetz ist ϕ̇ = ϕ. Der Punkt ˙ anstelle des Strichs 0 ist dabei die physikalische Schreibweise für die Ableitung nach der Zeit. Bezeichnet ϕ irgendeine positive Messgröße, so bringt diese Gleichung zum Ausdruck, dass die Veränderungsrate ϕ̇ proportional zu ϕ selbst ist – wobei der Proportionalitätsfaktor hier der Einfachheit halber auf Eins gesetzt ist. Das einfachste Schwingungsgesetz wird beschrieben durch die Gleichung ϕ̈ = −ϕ. Bezeichnet ϕ die Auslenkung aus einer gewissen Ruhelage, so bringt sie zum Ausdruck, dass die Rückstellkraft, also im Wesentlichen die Beschleunigung ϕ̈ , proportional zur Auslenkung ϕ wächst und in die entgegengesetzte Richtung weist. Lösungen des Wachstumsgesetzes werden durch Exponenzialfunktionen, Lösungen des Schwingungsgesetzes durch trigonometrische Funktionen beschrieben. Den allgemeinen Existenzsatz für Lösungen von Differenzialgleichungen werden wir allerdings erst später beschreiben. Ersatzweise konstruieren wir Lösungen ›von Hand‹, was glücklicherweise nicht schwierig ist. 9 1 229 9 spezielle funktionen 9-a l o g a r i t h m u s f u nktion Um zur Exponenzialfunktion zu gelangen, beginnen wir mit der Logarithmusfunktion, die natürlich auch selbst von Interesse ist. Der natürliche Logarithmus ist die Funktion Zt ds log : (0, ∞) → R, t , . Ï 1 s Definition Für die Logarithmusfunktion gilt somit log0 (t) = 1 , t log(1) = 0. (1) Umgekehrt liefert Integration von 1 bis t wieder den Logarithmus. Gleichung (1) definiert somit den Logarithmus eindeutig. – Aus der Definition ergibt sich sofort die charakteristische 9.1 Funktionalgleichung des Logarithmus log(uv) = log(u) + log(v). Für u, v > 0 gilt Ï Mit der Substitution s = ut wird Z uv Zu Z uv Zu Zv ds ds ds ds dt = + = + , s s 1 1 s u 1 s 1 t YYYYY und das ist die Behauptung. Y Y Y Y Y 9.2 Die Logarithmusfunktion ist streng monoton steigend und bildet wegen Satz lim log(t) = ∞, t→∞ lim log(t) = −∞, t→0 die Halbgerade (0, ∞) surjektiv auf R ab. Ï Wegen log0 (t) = 1/t > 0 ist log streng monoton steigend 8.16 . Offensichtlich ist auch log(2) > 0 . Aus der Funktionalgleichung 9.1 folgt dann YYYYY log(2n ) = n log(2) → ±∞, n → ±∞. Wegen 2n → ∞ für n → ∞ und 2n → 0 für n → −∞ ergeben sich die behaupteten Grenzwerte. Y Y Y Y Y Da log0 = t −1 streng monoton fällt, ergibt sich für die Logarithmusfunktion bereits im Wesentlichen der Graph in Abbildung 9-1. Da t −1 auf (0, ∞) unendlich oft differenzierbar ist, ist es auch der Logarithmus. Tatsächlich ist er sogar reell analytisch. 230 9 2 06.09.2011–09:35 logarithmusfunktion 9.3 Satz 9-a Die Logarithmusfunktion ist reell analytisch auf (0, ∞) und besitzt die Potenzreihenentwicklung log(1 + t) = X (−1)n−1 ná1 tn t2 t3 =t− + ∓ ..., n 2 3 |t| < 1. Ï Für jedes a > 0 gilt aufgrund der Funktionalgleichung YYYYY log(a + h) = log(a) + log(1 + h/a). Es genügt daher zu zeigen, dass log(1 + t) um 0 durch seine Taylorreihe dargestellt wird. Dann exstiert eine solche Darstellung auch um jeden anderen Punkt a > 0 . Sei g(t) = log(1 + t) . Dann ist für n á 1 (n − 1)! , (1 + t)n g (n) (t) = (−1)n−1 (2) und g (n) (0) (−1)n−1 = . n! n Da außerdem g(0) = 0 , hat die Taylorreihe T0 g die im Satz angegebene Gestalt. Für das Restglied in Integralform erhalten wir mit Satz 8.29 und Gleichung (2) R0n g(t) = t n+1 Z1 0 (1 − s)n ds. (1 + st)n+1 (3) Für s á 0 und t á −1 ist 1 − s à 1 + st , und letztere Funktion hat bezüglich s die Stammfunktion t −1 log(1 + st) . Somit erhalten wir n R g(t) à |t|n+1 0 Z1 0 1 ds à |t|n |log(1 + t)| . 1 + st Somit konvergiert T0 g auf (−1, 1) gegen g . Y Y Y Y Y 9.4 Bemerkung Mit (3) kann man auch R0n g(1) → 0 für n → ∞ zeigen. Die Darstellung von Satz 9.3 gilt somit auch für t = 1 und ergibt log 2 = 06.09.2011–09:35 X (−1)n−1 1 1 1 = 1 − + − ± ... . n 2 3 4 ná1 Ç 9 3 231 9 spezielle funktionen 9-b e x p o n e n z i a l f u n ktion Der Logarithmus ist streng monoton steigend, und seine Ableitung verschwindet nirgends. Also besitzt er eine Umkehrfunktion e : R → (0, ∞) , die ebenfalls streng monoton steigt und überall differenzierbar ist. Ihre Ableitung ist e0 = 1 1 = = e. 1/e log0 ◦ e Somit erhalten wir eine Lösung des Wachstumsgesetzes ϕ̇ = ϕ . Für diese gilt wegen log(1) = 0 außerdem e(0) = 1. Umgekehrt bestimmt jeder solche Anfangswert eindeutig eine Lösung des Wachstumsgesetzes: 9.5 Eindeutigkeitssatz Jede Lösung der Differenzialgleichung ϕ̇ = ϕ ist eindeutig bestimmt durch ihren Anfangswert ϕ(0) = ϕ0 , und zwar ist ϕ = ϕ0 e . Ï Sei ϕ eine solche Lösung, also ϕ0 = ϕ . Da die eben eingeführte Funktion e nirgends verschwindet, dürfen wir ϕ/e bilden. Dann ist YYYYY (ϕ/e)0 = ϕ0 /e − ϕe0 /e2 = ϕ/e − ϕ/e = 0. Also ist ϕ/e konstant, und Auswertung bei 0 ergibt ϕ/e ≡ ϕ/e0 = ϕ0 . Daraus folgt die Behauptung. Y Y Y Y Y Definition und Satz Es gibt genau eine auf der reellen Gerade differenzierbare Lösung des Anfangswertproblems ϕ̇ = ϕ, ϕ(0) = 1. (4) Diese wird Exponenzialfunktion genannt und mit exp bezeichnet. Ï Bemerkung In Ermangelung des allgemeinen Existenz- und Eindeutigkeitssatzes für Lösungen gewöhnlicher Differenzialgleichungen haben wir auf die Logarithmusfunktion zurückgegriffen, um uns überhaupt eine Lösung von (4) zu verschaffen. Deren Eindeutigkeit zu zeigen war dann kein großes Problem. Ç Um die wesentlichen Eigenschaften der Exponenzialfunktion abzuleiten, stützen wir uns im Folgenden nur noch (4) und nicht den Logarithmus. Wir 232 9 4 exponenzialfunktion 9-b folgen also der physikalischen Vorgehensweise und betrachten exp als Lösung des Wachstumsgesetzes (4) und log als Umkehrfunktion von exp . 9.6 Funktionalgleichung der Exponenzialfunktion Für reelle s, t gilt exp(s + t) = exp(s) exp(t). (5) Insbesondere gilt exp(t) exp(−t) = 1. Ï (6) Y Y Y Y Y Als Funktion von t betrachtet erfüllen beide Seiten der Gleichung (5) die Differenzialgleichung ϕ0 = ϕ . Außerdem haben sie denselben Wert bei t = 0 . Aufgrund des Eindeutigkeitssatzes 9.5 sind sie daher gleich. – Die zweite Glechung folgt hieraus mit exp(t) exp(−t) = exp(0) = 1 . Y Y Y Y Y 9.7 Satz Die Exponenzialfunktion exp ist streng monoton steigend mit lim exp(t) = ∞, t→∞ lim exp(t) = 0. t→−∞ Insbesondere ist exp : R → (0, ∞) surjektiv. Ï Y Y Y Y Y Wegen (6) ist exp nirgends Null und damit aus Stetigkeitsgründen überall positiv. Also ist auch exp0 überall positiv und damit exp streng monoton steigend. Es folgt exp(1) > 1 und exp(n) = exp(1 + · · · + 1) = (exp(1))n → ∞, n → ∞, also auch exp(t) → ∞ für t → ∞ . Wieder mit (6) ist dann lim exp(t) = lim exp(−t) = lim t→−∞ t→∞ t→∞ 1 = 0. Y Y Y Y Y exp(t) Bemerkung Aufgrund der letzten beiden Sätzen erhalten wir sogar einen Gruppenisomorphismus exp : (R, +) → (R+ , ·). Das Addieren reeller Zahlen und das Multiplizieren positiver Zahlen sind also isomorphe Operationen, die durch die Exponenzial- und Logarithmusfunktion aufeinander abgebildet werden. Ç 9.8 Satz Die Exponenzialfunktion ist reell analytisch auf R und besitzt die überall konvergierende Potenzreihendarstellung exp(t) = X tn t2 =1+t+ + ... . n! 2! ná0 Ï 9 5 233 9 spezielle funktionen · 9-1 Exponenzial- und Logarithmusfunktion exp log 1 1 YYYYY Sei g = exp . Aufgrund der Differenzialgleichung für exp gilt g (n) (t) = exp(t), g (n) (0) 1 = , n! n! n á 0. Somit hat die Taylorreihe T0 g die angegebene Gestalt. Für das Restglied nach Lagrange erhalten wir für |t| à r die gleichmäßige Abschätzung n−1 |t|n rn R kg (n) k[−r ,r ] à exp(r ) → 0, g(t) à 0 n! n! n → ∞. Also konvergiert T0 g auf der reellen Geraden gegen g . Y Y Y Y Y 9.9 Lemma Die Exponenzialfunktion wächst schneller gegen Unendlich als jede Potenz. Das heißt, für alle n ∈ Z gilt tn →0 exp(t) für t → ∞. Ï Y Y Y Y Y Für n à 0 ist alles klar. Für n á 1 folgt aus der Potenzreihenentwicklung von exp die grobe Abschätzung exp(t) á t 2n , (2n)! t > 0. Für t > 0 gilt daher 0< 234 9 6 tn (2n)! < → 0, exp(t) tn t → ∞. Y Y Y Y Y exponenzialfunktion 9-b Die Funktion et Bis jetzt ist noch nicht klar, wie die Exponenzialfunktion zu ihrem Namen kommt – was sie also mit Exponenziation zu tun hat. Das wollen wir jetzt klären. Aufgrund unserer früheren Definition der Eulerschen Zahl und der Potenzreihendarstellung von exp ist e= ∞ X 1 = exp(1). n! n=0 Potenzen von e – wie auch von jeder anderen positiven reellen Zahl – können wir für rationale Exponenten n/m erklären durch en/m Í (e1/m )n , wobei e1/m die eindeutig bestimmte, positive m-te Wurzel Wir zeigen nun, das dies mit exp(n/m) übereinstimmt. 9.10 Lemma von e bezeichnet. Für n ∈ Z und m ∈ N gilt en/m = exp(n/m). YYYYY 6.17 Ï Für n á 0 ist aufgrund der Funktionalgleichung exp(n) = exp(1 + · · · + 1) = exp(1) · · · exp(1) = en , wobei die Pünktchen für n Summanden bzw Faktoren stehen. Für n à −1 folgt dann mit (6) ebenfalls exp(n) = 1 1 = −n = en . exp(−n) e Für m á 1 gilt dann analog exp(1/m)m = exp(m/m) = exp(1) = e , somit ist nach Definition der m-ten Wurzel exp(1/m) = e1/m . Bildet man von beiden Seiten die n-te Potenz, folgt die Behauptung. Y Y Y Y Y Für jede rationale Zahl t gilt also et = exp(t) . Aus Stetigkeitsgründen ist daher folgende Definition dieses Symbols auch für reelle t sinnvoll. Für alle t ∈ R ist X tn et Í exp(t) = . Ï n! ná0 Definition Es gilt dann unter anderem es+t = es et , wie es sich für eine Exponenzialfunktion gehört. 9 7 235 9 spezielle funktionen Allgemeine Potenzen Potenzen einer positiven reellen Zahl a können wir für rationale Exponenten n/m wie zuvor erklären durch an/m Í (a1/m )n . Und wie zuvor zeigt man auch hier, dass mit a = exp(log a) auch an/m = exp((n/m) log a). Daher ist folgende Definition sinnvoll. Definition und Satz Für a > 0 und t ∈ R ist at Í exp(t log a). Die Funktion t , at ist auf R streng monoton steigend und stetig differenzierbar, und für alle s, t ∈ R gilt (i) as+t = as at , (ii) ast = (as )t , (iii) (at )0 = at log a . Ï YYYYY Alle Eigenschaften folgen unmittelbar aus der Definition, zum Beispiel (at )0 = (exp(t log a))0 = exp(t log a) log a = at log a. Y Y Y Y Y Vertauschen wir die Rollen von a und t , so haben wir mit at zugleich auch die allgemeine Potenzfunktion t a für t > 0 und alle reellen a erklärt. Dazu ebenfalls die wichtigsten Eigenschaften. 9.11 Satz Für jedes reelle a ist die Funktion t , t a auf (0, ∞) stetig differenzierbar, und es gilt (i) log t a = a log t , (ii) (t a )0 = at a−1 . Ï YYYYY Es ist log t a = log(exp(a log t)) = a log t und (t a )0 = exp(a log t)0 = exp(a log t) a at a = = at a−1 . Y Y Y Y Y t t Bemerkung Damit haben wir die Differenziationsregel für t n auf beliebige reelle Exponenten t a ausgedehnt. Ç 236 9 8 sinus und cosinus 9-c 9-c s i n u s u n d c o s i n us Die Sinus- und Cosinusfunktion erhalten wir als spezielle Lösungen der Schwingungsgleichung ϕ̈ = −ϕ. Den Nachweis der Existenz solcher Lösungen verschieben wir dabei auf Abschnitt 9-d und betrachten zuerst deren Eindeutigkeit. 9.12 Eindeutigkeitssatz Anfangswerte ϕ(0) = ϕ0 , YYYYY Jede Lösung von ϕ̈ = −ϕ ist eindeutig bestimmt durch ihre ϕ̇(0) = ψ0 . Ï Für zwei beliebige Lösungen u und v von ϕ̈ = −ϕ gilt ∂t (uv̇ − u̇v) = uv̈ − üv = −uv + uv = 0. Genauso rechnet man nach, dass ∂t (u2 + u̇2 ) = 0, ∂t (v 2 + v̇ 2 ) = 0. Folglich haben die Vektoren (u, u̇) und (v, v̇) als Funktionen von t konstante Länge und schließen immer denselben Winkel ein. Stimmen sie also zum Zeitpunkt 0 überein, dann auch zu jedem anderen Zeitpunkt t . Somit bestimmen die Anfangswerte ϕ0 und ψ0 eine Lösung eindeutig. Y Y Y Y Y Bemerkung Der Zeitpunkt 0 für die Anfangswerte ist nur der Einfachheit halber gewählt. Jeder andere Zeitpunkt t0 ist ebenso gut. Ç 9.13 Satz und Definition Es gibt jeweils genau eine auf der reellen Geraden zweimal differenzierbare Lösung der Differenzialgleichung ϕ̈ = −ϕ mit ϕ(0) = 0, ϕ0 (0) = 1, respektive ϕ(0) = 1, ϕ0 (0) = 0. Diese werden Sinus und Cosinus genannt und mit sin respektive cos bezeichnet. Sie sind reell analytisch und besitzen die Potenzreihenentwicklungen sin(t) = X ná0 (−1)n t 2n+1 , (2n + 1)! cos(t) = X ná0 (−1)n t 2n . (2n)! Ï Y Y Y Y Y Ist eine Lösung zweimal differenzierbar und ϕ̈ = −ϕ , so ist sie auch beliebig oft differenzierbar. Die Taylorreihenentwicklung ist dann eine einfache Rechenaufgabe, und das Restglied schätzt man wie bei der Exponenzialfunktion ab. Y Y Y Y Y 9 9 237 9 spezielle funktionen Im Folgenden geht es darum, die wesentlichen Eigenschaften dieser Funktionen zu bestimmen. Die Potenzreihenentwicklungen sind dabei allerdings wenig hilfreich – so sieht man ihnen nicht im Geringsten an, dass sie periodische Funktionen definieren. Vielmehr stützen wir uns auf die Differenzialgleichung. 9.14 Für alle s, t ∈ R gilt Satz (i) (ii) (iii) (iv) (v) sin(−t) = − sin(t), cos(−t) = cos(t) , sin(s + t) = sin(s) cos(t) + cos(s) sin(t) , cos(s + t) = cos(s) cos(t) − sin(s) sin(t) , sin0 (t) = cos(t), cos0 (t) = − sin(t) , sin2 (t) + cos2 (t) = 1 . Ï Y Y Y Y Y Die ersten vier Behauptungen ergeben sich aus dem Eindeutigkeitssatz. Denn beide Seiten jeder Gleichung sind Lösungen der Gleichung ϕ̈ = −ϕ mit denselben Anfangswerten bei 0 . Die letzte Behauptung ergibt sich aus (s 2 + c 2 )0 = 2ss 0 + 2cc 0 = 2sc − 2cs = 0, wobei s = sin und c = cos . Die Funktion s 2 + c 2 ist also konstant und gleich ihrem Wert 1 bei 0 . Y Y Y Y Y Aussage (i) bedeutet, dass der Sinus eine ungerade, der Cosinus eine gerade Funktion ist. Ihre Graphen sind demnach symmtrisch zum Ursprung respektive zur Ordinatenachse. Die Zahl π Wir kommen nun zur Zahl π , einer der wichtigsten Zahlen der Mathematik. Wir definieren sie als die erste positive Nullstelle der Sinusfunktion. 9.15 Satz und Definition Es gibt eine eindeutig bestimmte reelle Zahl π > 0 , so dass sin(t) > 0 für 0 < t < π und sin(π ) = 0. Ï YYYYY Aus Stetigkeitsgründen gibt es wegen c(0) = 1 ein δ > 0 , so dass c(t) > 0, 0 à t à δ. Wegen s 0 = c ist dann s strikt wachsend auf [0, δ] und damit s(t) > 0, 0 < t à δ. (7) Zu zeigen bleibt damit, dass s überhaupt eine positive Nullstelle besitzt. Angenommen, es ist s(t) > 0 für alle t > 0 . Wegen c 0 = −s ist dann c strikt fallend für t > 0 . Hätte c eine Nullstelle, so gäbe es auch ein τ mit c(τ) < 0 . 238 9 10 sinus und cosinus 9-c Dann aber wäre s 0 (t) = c(t) à c(τ) < 0, t á τ, und s hätte dann doch eine Nullstelle rechts von τ . Hätte c andererseits keine Nullstelle, so wäre s wegen s 0 = c strikt wachsend, und aus c 0 (t) = −s(t) à −s(τ) < 0, t á τ, folgt analog, dass c doch nicht für alle t á τ positiv sein kann. Somit besitzt s mindestens eine Nullstelle in (0, ∞) , und wir können π Í inf {x ∈ (0, ∞) : s(x) = 0} definieren. Wegen Gleichung (7) ist π á δ > 0 . Y Y Y Y Y 9.16 Satz Die Cosinusfunktion bildet das Intervall [0, π ] streng monoton fallend auf [−1, 1] ab, und es gilt cos(π /2) = 0, YYYYY sin(π /2) = 1. Ï Aufgrund des letzten Satzes ist c 0 (t) = −s 0 (t) < 0, 0 < t < π, und somit c strikt fallend auf [0, π ] . Betrachten wir c 2 (t) + s 2 (t) = 1 bei t = π , so folgt c 2 (π ) = 1 . Da aber bereits c(0) = 1 , muss c(π ) = −1 gelten. Mit den Additionstheoremen des vorletzten Satzes ist dann noch 2s(π /2)c(π /2) = s(π ) = 0, und deshalb c(π /2) = 0 und s(π /2) = 1 . Y Y Y Y Y Nun können wir endlich feststellen, dass Sinus und Cosinus periodische Funktionen sind. Tatsächlich gelten eine ganze Reihe ›periodischer Beziehungen‹. 9.17 Satz Sinus und Cosinus sind antiperiodisch mit der Periode π und periodisch mit der Periode 2π : sin(t + π ) = − sin(t), sin(t + 2π ) = sin(t), und ditto für den Cosinus. Außerdem gilt sin(t + π /2) = cos(t), cos(t + π /2) = − sin(t). Ï Y Y Y Y Y Dies folgt entweder aus den Additionstheoremen für s und c 9.14 und deren speziellen Werten bei π /2 und π , oder wiederum mit dem Argument, dass beide Seiten jeder Gleichung Lösungen von ϕ̈ = −ϕ mit denselben Anfangswerten sind. Y Y Y Y Y 9 11 239 9 spezielle funktionen · 9-2 Sinus und Cosinus sin π −π 2π cos −1 Für den Graphen der Sinusfunktion bedeutet dies zum Beispiel: – Verschiebung um 2π führt ihn in sich selbst über, – Verschiebung um π und Spiegelung an der x-Achse ebenso, – Verschiebung um −π /2 ergibt den Graphen der Cosinusfunktion. Insgesamt können wir damit die Graphen dieser Funktionen wie in Abbildung 9-2 skizzieren. Der Schul-Sinus Bis jetzt ist noch nicht klar, was dieser Sinus mit dem ›Schul-Sinus‹ zu tun hat. Um dies zu klären, sei S = {(x, y) : x 2 + y 2 = 1} der Einheitskreis, und S+ = S ∩ {y á 0} , S– = S ∩ {y à 0} dessen obere und untere Hälfte. 9.18 Satz Die Abbildung γ : R → R2 , t , (cos t, sin t) bildet [0, π ] bijekitv auf S+ und [π , 2π ] bijektiv auf S– ab. Ï · 9-3 Die Abbildung γ : t , (cos t, sin t) γ 0 π 2π S+ γ(π ) γ(0) = γ(2π ) S– 240 9 12 sinus und cosinus 9-c · 9-4 Schul-Sinus und Schul-Cosinus γ(t) = (cos t, sin t) t 1 sin t cos t YYYYY γ(0) Wegen s 2 (t) + c 2 (t) = 1 und s(t) á 0 auf [0, π ] ist klar, dass γ : [0, π ] → S+ . Da c auf [0, π ] strikt fällt, ist diese Abbildung injektiv. Und sie ist surjektiv, da zu jedem x ∈ [−1, 1] ein t ∈ [0, π ] existiert mit c(t) = x , und dort ist p p s(t) = 1 − c 2 (t) = 1 − x 2 = y. Die Behauptung zu γ : [π , 2π ] → S– folgt analog. Y Y Y Y Y Aus den beiden letzten Sätzen folgt, dass als Funktion von t der Punkt γ(t) = (cos t, sin t) eine 2π -periodische Bahn auf dem Einheitskreis S beschreibt. Sein Geschwindigkeitsvektor ist γ̇(t) = (− sin t, cos t), und seine Absolutgeschwindigkeit ist gleichförmig q kγ̇(t)ke = sin2 t + cos2 t = 1. Die Länge der Bahn vom Zeitpunkt 0 bis zum Zeitpunkt t ist demnach t – Genaueres dazu folgt in einem späteren Kapitel. Nimmt man diese Länge t als das Bogenmaß des zwischen den Punkten γ(0) , (0, 0) und γ(t) eingeschlossenen Winkels, so erhält man die geometrische Definition des Sinus und Cosinus wie in Abbildung 9-4: sin t = Gegenkathete , Hypotenuse cos t = Ankathete , Hypotenuse wobei im Einheitskreis die Länge der Hypotenuse 1 ist. 9 13 241 9 spezielle funktionen 9-d t a n g e n s u n d a r cusfunktionen Mit Sinus und Cosinus verbunden sind einige weitere trigonometrische Funktionen. Wir erwähnen noch den Tangens, die übrigen übergehen wir. Der Tangens ist auf {t ∈ R : cos t ≠ 0} definiert durch Definition und Satz sin t . cos t tan t = Er ist ungerade, π -periodisch und stetig differenzierbar mit Ableitung tan0 t = 1 + tan2 t. Ï Y Y Y Y Y Der Quotient einer geraden und einer ungeraden Funktion ist immer ungerade. Ferner ist 9.17 tan(t + π ) = sin(t + π ) − sin t sin t = = = tan t. cos(t + π ) − cos t cos t Die stetige Differenzierbarkeit folgt aus der Quotientenregel und tan0 t = cos2 t + sin2 t sin0 t cos t − sin t cos0 t = = 1 + tan2 t, cos2 t cos2 t da cos auf dem Definitionsbereich von tan nirgends verschwindet. Y Y Y Y Y Offenbar ist die Tangensfunktion unendlich oft differenzierbar. Sie ist sogar reell analytisch, und es gilt tan t = X (−1)n ná0 t 2n+1 , 2n + 1 |t| < 1. Der Beweis sei als Übungsaufgabe überlassen. Arcusfunktionen Die Umkehrfunktion der exp-Funktion ist die log-Funktion. Was sind die Umkehrfunktionen von sin , cos und tan ? Umkehrbarkeit setzt Injektivität voraus. Eine periodische Funktion ist aber geradezu die Antithese einer injektiven Funktion – sie wiederholt sich ja ständig. Um die betreffenden Funktionen ›umkehrbar zu machen‹, müssen wir sie daher auf geeignete Intervalle einschränken. Hierfür gibt es zwar unendlich viele Möglichkeiten, doch die Einschränkungen sin[−π /2,π /2] , cos[0,π ] , tan(π /2,π /2) 242 9 14 tangens und arcusfunktionen 9-d · 9-5 Tangens 1 −π −π /2 π /2 π sind die üblichen. Diese Funktionen sind umkehrbar, ihre Umkehrfunktionen werden Arcussinus, Arcuscosinus und Arcustangens genannt und mit arcsin , arccos und arctan bezeichnet. 9.19 Satz Die Funktionen arcsin : [−1, 1] → [−π /2, π /2] , arccos : [−1, 1] → [0, π ] , R → (−π /2, π /2) , arctan : sind stetig und im Innern ihrer Definitionsbereiche stetig differenzierbar, mit arcsin0 t = √ 1 , 1 − t2 1 arccos0 t = − √ , 1 − t2 arctan0 t = 1 . 1 + t2 Ï Y Y Y Y Y Betrachte arctan . Die Funktion tan : (−π /2, π /2) → R besitzt eine strikt positive Ableitung und ist surjektiv. Sie ist daher umkehrbar, und die Umkehrfunktion arctan ist auf R differenzierbar. Für die Ableitung gilt mit s = arctan t arctan0 t = 1 1 1 = = . tan0 s 1 + t2 1 + tan2 s Analog werden die übrigen Behauptungen bewiesen. Y Y Y Y Y Bemerkung Die hier definierten Arcusfunktionen werden als die Hauptzweige der jeweiligen Arcusfunktion bezeichnet. Schränkt man sin , cos , tan auf andere geeignete Intervalle ein, so erhält man entsprechende Nebenzwerge dieser Funktionen. Ç 9 15 243 9 spezielle funktionen · 9-6 Hauptzweige des Arcussinus und Arcuscosinus mit arccos Teilen zweier Nebenzweige π /2 −1 1 arcsin −π /2 Lösung der Schwingungsgleichung Wir zeigen jetzt noch die Existenz von Lösungen der Schwingungsgleichung. Ausgangspunkt ist die Definition des Arcustangens als Stammfunktion von (1 + t 2 )−1 . Aus seiner Umkehrung, dem Tangens, rekonstruieren wir dann den Sinus und Cosinus. Natürlich werden wir bei dieser Konstruktion diese Begriffe nicht explizit verwenden, sondern lediglich ›mitdenken‹. Durch Zt ds ω(t) Í 2 0 1+s wird eine stetig differenzierbare, ungerade und streng monoton steigende Funktion ω auf R definiert. Da das Integral für alle t gleichmäßig beschränkt ist, ist die Bildmenge von ω ein gewisses offenes Intervall (−α, α) . Für ihre Umkehrfunktion τ = ω−1 gilt dort τ0 = 1 = 1 + τ 2. ω0 ◦ τ Setzen wir s= √ 244 9 16 τ 1 + τ2 , c= √ 1 1 + τ2 , exp, sin und cos im komplexen · 9-7 9-e Hauptzweig des Arcustangens mit zwei Nebenzweigen π /2 1 −π /2 so ergibt eine einfache Rechnung s 0 = c und c 0 = −s . Also sind beide Funktionen auf (−α, α) Lösungen der Gleichung ϕ00 = −ϕ . Für ihre Anfangswerte findet man s(0) = c 0 (0) = 0, s 0 (0) = c(0) = 1. Es bleibt nur noch, diese Lösungen auf ganz R fortzusetzen. Wegen lim s(t) = lim c 0 (t) = ±1, t→±α t→±α lim c(t) = lim s 0 (t) = 0 t→±α t→±α ist dies durch entsprechendes Ansetzen der Abschnitte möglich. Somit haben wir eine Lösung der Differenzialgleichung ϕ̈ = −ϕ mit den Anfangswerten wie in Satz 9.13 gefunden. – Natürlich stellen wir im Nachhinein fest, dass α = π . 9-e e x p , s i n u n d c o s im komplexen Die Funktionen sin , cos und exp können eigentlich kaum unterschiedlicher sein: sin und cos sind periodisch, beschränkt und besitzen unendlich viele Nullstellen, exp ist streng monoton, unbeschränkt, und ohne jede Nullstelle. Tatsächlich handelt es sich um ein und dieselbe Funktion. Der Zusammenhang wird deutlich, wenn wir diese auch für komplexe Argumente betrachten. Da die Potenzreihenentwicklungen von exp , sin und cos ebenso für alle komplexen Argumente konvergieren, ist folgende Definition naheliegend. 9 17 245 9 9.20 spezielle funktionen Definition Für z ∈ C ist exp z Í X zn n! ná0 sowie z2n+1 , (2n + 1)! ná0 X z2n cos z Í (−1)n . Ï (2n)! ná0 sin z Í X (−1)n Die Theorie der Potenzreihen zeigt, dass diese Funktionen in z beliebig oft differenzierbar und auch wieder reell analytisch sind. Ihre Ableitungen erhält man durch gliedweises Differenzieren der Potenzreihen, zum Beispiel exp0 = X ná1 X zn zn−1 = = exp . (n − 1)! n! ná0 Entsprechend erhält man sin0 = cos und cos0 = − sin . Ausmultiplizieren liefert außerdem die Funktionalgleichung exp(z + w) = exp(z) exp(w) für alle z, w ∈ C . Hieraus folgt beispielsweise, dass exp auch im Komplexen keine Nullstelle hat. Momentan brauchen wir diese Resultate jedoch nicht. Uns genügt folgende grundlegende Identität, wobei wieder ez Í exp z . 9.21 Eulersche Formel Für alle z ∈ C gilt eiz = cos z + i sin z. Ï Y Y Y Y Y Da die Reihen in Definition 9.20 absolut konvergieren, können wir einsetzen und umordnen, so dass i2 z2 i3 z3 i4 z4 i5 z5 + + + + ... 2! 3! 4! 5! z2 iz3 z4 iz5 = 1 + iz − − + + + ... 2! 3! 4! 5! z4 4 z3 z5 z2 = 1− + z + ... + i z − + + ... 2! 4! 3! 5! eiz = 1 + iz + = cos z + i sin z. Y Y Y Y Y Für reelle Argumente t gilt natürlich ebenfalls eit = cos t + i sin t . Setzen wir π ein, so erhalten wir die berühmte 246 9 18 exp, sin und cos im komplexen 9.22 9-e Eulersche Gleichung eiπ + 1 = 0. Ï Viele Mathematiker halten sie für die schönste Gleichung der Mathematik. Sie verbindet ihre fünf wichtigsten Zahlen, 0, 1, e, π, i, auf geradezu mystische Weise. Identifizieren wir C mit R2 , und die komplexe Zahl eit mit dem Punkt (cos t, sin t) , so lautet das Ergebnis von Satz 9.18 wie folgt. 9.23 Satz Die Funktion cis : R → C, t , eit bildet [0, 2π ) bijektiv auf den Einheitskreis S = {z ∈ C : |z| = 1} ab und ist periodisch mit der Periode 2π . Ï › cis ‹ ist ein Akronym für › cos + i sin ‹. Diese Abbildung wickelt also die reelle Gerade gleichmäßig mit der Periode 2π so um den Einheitskreis, dass aufgrund der Additionstheoreme für Sinus und Cosinus 9.14 ei(s+t) = eis eit , oder cis(s + t) = cis(s) cis(t). Es handelt sich also um einen Endomorphismus von (R, +) nach (S, · ) . Umgekehrt führt die Funktionalgleichung für eit zu den Additionstheoremen für sin und cos . Einerseits ist ei(s+t) = cos(s + t) + i sin(s + t), andererseits ist dies gleich eis eit = (cos s + i sin s)(cos t + i sin t) = (cos s cos t − sin s sin t) + i (sin s cos t + cos s sin t). Ein Vergleich der Real- und Imaginärteile ergibt dann die Additionstheoreme. Ebenso leicht erhält man die Formeln von Moivre, (cos t + i sin t)n = eint = cos nt + i sin nt, aus denen mit den binomischen Formeln Identitäten für sin nt und cos nt folgen. 9 19 247 9 spezielle funktionen · 9-8 z = a + ib = r eiφ b Polardarstellung r φ a Schließlich gilt cos t = Re eit = eit + e−it , 2 sin t = Im eit = eit − e−it . 2i Beginnt man das Studium der Speziellen Funktionen mit der exp-Funktion im Komplexen, und insbesondere der cis-Funktion, so werden cos und sin mithilfe dieser Formeln definiert. Die Polardarstellung komplexer Zahlen Bisher kennen wir die kartesische Darstellung z = a + ib komplexer Zahlen. Die cis-Funktion ermöglicht die ebenso nützliche Polardarstellung. 9.24 Zu jedem z ∈ C∗ existieren genau ein r > 0 und φ ∈ [0, 2π ) , so dass Satz z = r eiφ . Die reelle Zahl φ heißt das Argument der komplexen Zahl z ≠ 0 . Ï Jede komplexe Zahl z ∈ C∗ kann geschrieben werden als YYYYY z = r w, r = |z| > 0, w= z ∈ S. |z| Aufgrund des letzten Satzes existiert genau ein φ ∈ [0, 2π ) mit w = eiφ . Somit existiert eine solche Darstellung. Diese ist auch eindeutig, denn notwendigerweise ist r = |z| , und die Gleichung eiφ = z/|z| hat nur eine Lösung φ im Intervall [0, 2π ) . Y Y Y Y Y Das Argument von z ≠ 0 ist also diejenige eindeutige reelle Zahl φ mit eiφ = z , |z| 0 à φ < 2π . Wegen der Periodizität der cis-Funktion gilt dann auch z = r eiφ = r ei(φ+2π n) , n ∈ Z. Für z = 0 dagegen ist das Argument nicht erklärt. 248 9 20 exp, sin und cos im komplexen 9-e 2 · 9-9 ζ7 Die siebten Einheitswurzeln ζ7 = e2π i/7 3 ζ7 7 ζ7 = 1 4 ζ7 6 5 ζ7 ζ7 Mithilfe der Polardarstellung lassen sich zum Beispiel alle Wurzeln einer komplexen Zahl bestimmen. Zuerst betrachten wir die Wurzeln aus 1 . Natürlich √ n ist 1 = 1 , und im Reellen ist damit alles gesagt. Im Komplexen gilt aber mehr. 9.25 Satz Es gibt genau n verschiedene komplexe n-te Wurzeln der Zahl 1 , die sogenannten n-ten Einheitswurzeln. Diese sind ζn = e2π i/n und dessen Potenzen ζnk mit k = 2, . . . , n . Ï Y Y Y Y Y Offenbar ist 0 keine Wurzel aus 1 . Somit können wir für die gesuchten Wurzeln z = r eiφ ansetzen. Dann gilt zn = r n einφ = 1 genau dann, wenn r = 1 und nφ = 2π k a φ = 2π k n für eine ganze Zahl k . Also ist z = ζnk für ein k ∈ Z . Dies sind dies genau n verschiedene Punkte 9.23 , zum Beispiel für k = 1, . . . , n . Y Y Y Y Y 9.26 Satz Zu jeder komplexen Zahl z = r eiψ ≠ 0 gibt es genau n verschiedene n-te Wurzeln, nämlich wk = w0 ζnk , k = 1, . . . , n, √ n mit w0 = r eiψ/n . Ï Für w0 gilt sicher w0n = z . Ist wν irgendeine weitere n-te Wurzel, so ist wν /w0 eine n-te Einheitswurzel, also gleich ζnk für ein 0 à k < n . Das ergibt die Behauptung. Y Y Y Y Y YYYYY 9 21 249 9 spezielle funktionen · 9-10 Sinus hyperbolicus und Cosinus cosh hyperbolicus sinh 9-f d i e h y p e r b e l f u nktionen 9.27 Satz und Definition Es gibt jeweils genau eine auf der reellen Geraden zweimal differenzierbare Lösung der Differenzialgleichung ϕ̈ = ϕ mit ϕ(0) = 0, ϕ0 (0) = 1 respektive ϕ(0) = 1, ϕ0 (0) = 0. Diese werden Sinus hyperbolicus und Cosinus hyperbolicus genannt und mit sinh respektive cosh bezeichnet. Sie sind reell analytisch und besitzen die Darstellung sinh t = X et − e−t t 2n+1 = , 2 (2n + 1)! ná0 cosh t = X t 2n et + e−t = . 2 (2n)! ná0 Ï Y Y Y Y Y Man verifiziert sofort, dass die angegebenen Funktionen die Gleichung ϕ̈ = ϕ erfüllen und die geforderten Anfangswerte haben. Die Eindeutigkeit dieser Lösungen wird in Aufgabe 12 betrachtet. Y Y Y Y Y Diese Funktionen sind natürlich ebenso in der ganzen komplexen Ebene erklärt. Wir beschränken und hier aber auf die reellen Aspekte. 250 9 22 die hyperbelfunktionen 9-f · 9-11 Tangens hyperbolicus 1 −1 9.28 Für alle t ∈ R gilt Satz (i) sinh t = −i sin it, cosh t = cos it , (ii) sinh(−t) = − sinh t, cosh(−t) = cosh t , (iii) sinh2 t − cosh2 t = 1 . Ï YYYYY Alle diese Behauptungen sind als Übung überlassen. Y Y Y Y Y Die Funktion sinh steigt streng monoton auf R und bildet die reelle Gerade bijektiv auf sich selbst ab. Die Funktion cosh fällt streng monoton auf (−∞, 0] und wächst streng monoton auf [0, ∞) und bildet beide Intervalle bijektiv auf [1, ∞) ab. Insgesamt stellen sich deren Graphen wie in Abbildung 9-10 dar. 9.29 Definition und Satz tanh t = Der Tangens hyperbolicus ist auf R definiert durch sinh t cosh t und bildet R streng monoton steigend und surjektiv auf (−1, 1) ab. Ï Aus dem Vorangehenden ergibt sich, dass sinh und tanh ohne Einschränkung umkehrbar sind, während bei cosh die Einschränkung auf [0, ∞) umkehrbar ist. Deren Umkehrungen werden Areasinus hyperbolicus, Areatangens hyperbolicus und Areacosinus hyperbolicus genannt und mit arsinh , artanh und arcosh , respektive, bezeichnet. 9.30 Satz Für arsinh : R → R , arcosh : [1, ∞) → [0, ∞) und artanh : (−1, 1) → R gilt im Innern ihrer Definitionsbereiche p p arsinh t = log(t + t 2 + 1 ), arcosh t = log(t + t 2 − 1 ) sowie artanh t = 1 1+t log . 2 1−t Ï 9 23 251 9 spezielle funktionen Betrachte YYYYY t = cosh s = es + e−s , 2 t á 0. Dann ist t á 1 und 2t es = e2s + 1 , oder e2s − 2t es + 1 = 0. Dies ist eine quadratische Gleichung für es mit den beiden Lösung p es = t ± t 2 − 1 . Von diesen ist nur die Pluslösung gröser oder gleich 1 . Somit ist p s = arcosh t = log(t + t 2 − 1 ). Die beiden übrigen Identitäten erhält man auf analoge Weise. Y Y Y Y Y Zum Schluss listen wir noch sämtliche Ableitungen auf. Die einzelnen Rechnungen sind eine einfache Übung. 9.31 Satz Im Innern der jeweiligen Definitionsbereiche gilt sinh0 t = cosh t, cosh0 t = sinh t, tanh0 t = 1 − tanh2 t sowie arsinh0 t = √ 1 , t2 + 1 arcosh0 t = √ und artanh0 t = 252 9 24 1 . 1 − t2 Ï 1 , t2 − 1 aufgaben 9 aufgaben 1 Welche Aussagen sind wahr? a. Die Funktionalgleichung ϕ(u + v) = ϕ(u)ϕ(v) hat unendliche viele Lösungen. b. sin it mit t ∈ R hat keine Nullstellen. c. eit mit t ∈ R ist streng monoton. d. Die komplexe Sinusfunktion ist unbeschränkt. 2 e. arctan ist die Umkehrfunktion von sin/cos . f. arcosh 0 = 1 . Die differenzierbare Funktion ϕ : R → R genüge der Funktionalgleichung ϕ(u + v) = ϕ(u)ϕ(v), sei aber nicht identisch 0 . Zeigen Sie: 3 a. ϕ(0) = 1 . b. ϕ(t) > 0 für alle t ∈ R . c. ϕ0 (t) = aϕ(t) für alle t ∈ R mit a = ϕ0 (0) . d. ϕ(t) = exp(at) . Die Umkehrfunktion zu t , at mit a > 0 , a ≠ 1 , ist der Logarithmus zur Basis a , bezeichnet mit loga . Zeigen Sie: loga t = 4 log t = loga e· log t. log a Zeigen Sie, dass für jedes α > 0 lim x −α log x = 0, x→∞ lim x α log x = 0. x→0 Zeigen Sie damit auch, dass limx 0 x x = 1 . 5 a. Sei ω > 0 . Wie lautet die Lösung des Anfangswertproblems ϕ̈ = −ω2 ϕ, ϕ(0) = ϕ0 , ϕ̇(0) = ψ0 ? b. Zeigen Sie, dass der Raum aller Lösungen von ϕ̈ = −ω2 ϕ mit ω ∈ R einen zweidimensionalen reellen Vektorraum bildet. c. 6 Wie sieht dieser Raum für ω = 0 aus? a. Zeigen Sie, dass t à log(1 + t) à t, 1+t t á 0. b. Folgern Sie hieraus für a ∈ R a a n exp à 1+ à exp(a), 1 + a/n n c. n á 1. Bestimmen Sie 9 25 253 9 spezielle funktionen a n lim 1 + . n→∞ n 7 Zeigen Sie sin(n + 1/2)x 1 + cos x + cos 2x + · · · + cos nx = , 2 2 sin x/2 indem Sie die linke Seite mit cos x = (eix + e−ix )/2 als geometrische Reihe darstellen. 8 Beweisen Sie das Additionstheorem für die Tangensfunktion: Es gilt tan(x + y) = tan x + tan y , 1 − tan x tan y wann immer die Ausdrücke tan x , tan y und tan(x + y) erklärt sind. 9 Untersuchen Sie, für welche α, β á 0 die Funktion t α sin t −β , t ≠ 0, f : R → R, f (t) = 0, t = 0, im Punkt t = 0 a. stetig b. differenzierbar 10 Für kein a ∈ R ist (cos na)ná0 ) eine Nullfolge. 11 a. Für alle t ∈ R und n ∈ N gilt c. stetig differenzierbar ist. |sin nt| à n |t| . b. Es gibt t ∈ R und a ∈ R , so dass |sin at| > a |t| . 12 Sei ϕ eine Lösung der Differenzialgleichung ϕ̈ = ϕ mit ϕ(0) = 0 und ϕ̇(0) = 0 . Dann folgt a. (ϕ̇2 − ϕ2 ). = 0 , b. ϕ̇2 = ϕ2 , c. ϕ ≡ 0 . 13 Additionstheoreme für Hyperbelfunktionen: Es gilt sinh(u + v) = sinh u cosh v + cosh u sinh v, cosh(u + v) = cosh u cosh v + sinh u sinh v. 14 Man zeige, dass sinh u cosh v = 2 sinh 15 Man zeige arcsin t = 16 254 u+v u−v cosh . 2 2 X 1·3 · · · (2n − 1) t 2n+1 , 2·4 · · · 2n 2n + 1 ná0 |t| < 1. Geben Sie die Polardarstellungen der folgenden komplexen Zahlen an. √ a. 1 + i b. −1 c. 1 − 3 i 9 26 aufgaben 17 Bestimmen Sie a. sin i b. cos i c. ii d. √ 5 9 i 9 27 255 256 9 28 10 Ergänzungen In den letzten vier Kapiteln legten wir die Grundlagen für die Theorie der Integration und Differenziation von Funktionen einer reellen Variablen und definierten einige wenige der vielen speziellen Funktionen der Analysis. Dabei beschränkten wir uns auf das absolut Notwendige. In diesem Kapitel wollen wir die Grundlagen noch ein wenig verbreitern und auch erste mathematische Anwendungen erwähnen. Dazu gehören die Berechnung von Grenzwerten mit den Regeln von l’Hospital, die Abschätzung von Reihen mithilfe uneigentlicher Integrale, die Glättung von Funktionen mithilfe von Faltungsoperationen und der Approximationssatz von Weierstraß. 10 1 257 10 ergänzungen 10-a d i e r e g e l n v o n l’hospital Sehr häufig sind sogenannte unbestimmte Ausdrücke der Form 0/0 zu bestimmen – das heißt, Grenzwerte wie lim t→0 sin t , t lim t→0 1 − cos2 t , t2 wo Zähler und Nenner gleichzeitig gegen Null konvergieren. Für diesen Fall gibt es eine nützliche Regel, die auf der Taylorformel basiert. 10.1 Einfache Regel von l’Hospital Punkt a ∈ I sei Seien f , g ∈ C r (I) mit r á 1 , und in einem f (ν) (a) = g (ν) (a) = 0, ν = 0, . . . , r − 1, sowie g (r ) (a) ≠ 0 . Dann gilt lim t→a f (t) f (r ) (a) = (r ) . g(t) g (a) Insbesondere existiert der links stehende Grenzwert. Ï Da nach Annahme alle Ableitungen von f und g bis zur Ordnung r − 1 in a verschwinden, verschwinden auch die entsprechenden Taylorpolynome, und mit der Restgliedformel von Lagrange ist YYYYY f (t) = 1 (r ) f (ã)(t − a)r , r! g(t) = 1 (r ) g (â)(t − a)r r! mit gewissen Punkten ã , â zwischen t und a . Da aus Stetigkeitsgründen auch g (r ) ≠ 0 nahe a , ist f (r ) (ã) f (t) = (r ) . g(t) g (â) Der Grenzwert auf der rechten Seite existiert für t → a , da Zähler und Nenner stetig sind und g (r ) (a) nicht verschwindet, und wir erhalten lim t→a f (t) f (r ) (ã) f (r ) (a) = (r ) = lim (r ) g(t) t→a g (â) g (a) wie behauptet. Y Y Y Y Y ¸ a. lim t→0 b. lim t→0 258 10 2 sin t cos t = lim = 1. t→0 t 1 1 − cos2 t sin t cos t cos2 t − sin2 t = lim = lim = 1. 2 t→0 t→0 t t 1 06.09.2011–09:35 die regeln von l’hospital 10-a c. Für f ∈ C 1 (I) gilt in jedem Punkt a ∈ I lim t→a f 0(t) f (t) − f (a) = lim = f 0(a). t→a t−a 1 d. Man darf nicht vergessen zu überprüfen, ob tatsächlich alle Voraussetzungen der Regel erfüllt sind. So ist zum Beispiel 0 = lim t→0 2t t2 ≠ − lim = −2. t→0 sin t cos t µ Der allgemeine Fall Oft handelt es sich bei a um einen Randpunkt eines Definitionsintervalls, in dem f 0 und g 0 nicht definiert sind. Auch ist der Fall eines uneigentlichen Randpunktes a = ∞ oder a = −∞ von Interesse, sowie unbestimmte Ausdrücke der Form ∞/∞ . Auf alle diese Fälle lässt sich die Regel von l’Hospital verallgemeinern. Grundlage ist der folgende verallgemeinerte Mittelwertsatz. 10.2 Verallgemeinerter Mittelwertsatz Sind die Funktionen f , g : [a, b] → R stetig, auf (a, b) differenzierbar, und hat g 0 keine Nullstelle in (a, b) , so gibt es ein c ∈ (a, b) mit f (b) − f (a) f 0(c) = 0 . g(b) − g(a) g (c) Ï Da g 0 stetig ist und nirgends verschwindet, ist g streng monoton und umkehrbar. Mit α = g(a) und β = g(b) folgt dann mit dem Mittelwertsatz b β f = f ◦ g −1 = (f ◦ g −1 )0 (γ)(β − α) YYYYY a α = f 0(g −1 (γ)) (g(b) − g(a)) g 0 (g −1 (γ)) mit einem γ zwischen α und β . Setzen wir c = g −1 (γ) ∈ (a, b) , so folgt daraus die Behauptung. Y Y Y Y Y 10.3 Regel von l’Hospital Es seien f , g ∈ C 1 (I) und g 0 ≠ 0 auf I . Ferner sei a ein eigentlicher oder uneigentlicher Randpunkt von I und lim f (t) = lim g(t) = 0 t→a t→a oder lim g(t) = ±∞. t→a Dann gilt lim t→a f 0(t) f (t) = lim 0 , g(t) t→a g (t) (1) falls der letzte Grenzwert auf der erweiterten Zahlengerade existiert. Ï 06.09.2011–09:35 10 3 259 10 ergänzungen YYYYY Sei λ = lim t→a f 0(t) . g 0 (t) (2) Wir zeigen, dass im Fall λ < ∞ zu jedem λ+ > λ ein Intervall Iδ = U̇δ (a) ∩ I existiert, so dass f (t) à λ+ , g(t) t ∈ Iδ . (3) Analog zeigt man im Fall λ > −∞ , dass zu jedem λ– < λ ein ähnliches Intervall Iδ existiert, so dass f (t) á λ– , g(t) t ∈ Iδ . Beides zusammen ergibt die Behauptung (1). Sei also λ < λ+ < ∞ . Da der Grenzwert in Gleichung (2) existiert, gibt es ein ε > 0 und ein Intervall Iδ = U̇δ (a) ∩ I , so dass f 0(t) à λ+ − ε, g 0 (t) t ∈ Iδ . Mit dem verallgemeinerten Mittelwertsatz folgt hieraus f (t) − f (s) f 0(u) = 0 à λ+ − ε, g(t) − g(s) g (u) s, t ∈ Iδ , (4) mit einem von s und t abhängenden u ∈ Iδ . Gilt jetzt limt→a f (t) = limt→a g(t) = 0 , so folgt mit s → a hieraus (3). Gilt dagegen beispielsweise limt→a g(t) = ∞ , so schreiben wir zuerst f (t) f (t) − f (s) f (s) = + . g(t) g(t) g(t) Für irgendein festes s ∈ Iδ und t hinreichend nahe bei a ist g(t) − g(s) > 0 , so dass mit (4) f (t) g(t) − g(s) f (s) à (λ+ − ε) + , g(t) g(t) g(t) t ∈ Iθ , auf einem hinreichend kleinen Intervall Iθ ⊂ Iδ . Für t → a konvergiert die rechte Seite gegen λ+ − ε . Wählen wir also θ nochmal kleiner, so gilt auch f (t) à λ+ , g(t) t ∈ Iθ , und damit wieder (3). Der Fall limt→a g(t) = −∞ geht genauso. Y Y Y Y Y 260 10 4 uneigentliche integrale 10-b Bemerkung Der Beweis gilt gleichermaßen für den Fall t → a und t → ±∞ , als auch für den Fall, dass es sich in (1) um einen uneigentlichen Grenzwert handelt. Ç t2 2t 2 = lim t = lim t = 0 . t→∞ e t→∞ e et ¸ a. lim t 2 e−t = lim t→∞ b. lim t→∞ t→∞ 1/t log t = lim = 0. t→∞ 1 t Andere unbestimmte Ausdrücke wie 0 · ∞ und ∞ − ∞ lassen sich oft in eine Form bringen, auf die die Regel von l’Hospital angewendet werden kann: c. lim t log t = lim t→0 t→0 log t 1/t = − lim = − lim t = 0 . t→0 1/t 2 t→0 1/t d. lim t log(1 + 1/t) = lim t→∞ s→0 1/(1 + s) log(1 + s) = lim = 1. µ s→0 s 1 10-b u n e i g e n t l i c h e i ntegrale Das Integral haben wir bisher für Funktionen definiert, die auf einem kompakten Intervall definiert und dort integrabel und damit auch beschränkt sind. Dies reicht auf die Dauer jedoch nicht aus. Wir wollen, wenn möglich, auch Funktionen auf unbeschränkten Intervallen sowie unbeschränkte Funktionen integrieren. Betrachte dazu eine Funktion f : [a, b) → R mit a < b à ∞ . Das Intervall ist also entweder rechts unbeschränkt, oder die Funktion ist möglicherweise an der rechten Intervallgrenze unbeschränkt. Definition Es sei a < b à ∞ , und die Funktion f : [a, b) → R sei über jedem kompakten Teilintervall [a, c] ⊂ [a, b) integrabel. Existiert der Limes Zb Zc f (t) dt Í lim a c b f (t) dt, a so heißt er das uneigentliche Integral von f über [a, b] , und man sagt, das uneigentliche Integral konvergiert. Andernfalls divergiert es. – Entsprechendes gilt für Funktionen f : (a, b] → R mit −∞ à a < b . Ï 10 5 261 10 ergänzungen Z∞ ¸ a. 0 dt √ t Z∞ c. Zr r →∞ 0 0 Z1 b. e−t dt = lim 1 dt √ t r e−t dt = − lim e−t = lim (1 − e−r ) = 1. r →∞ 0 r →∞ Z1 p 1 p dt √ = 2 lim t = 2 lim (1 − ε ) = 2. = lim ε ε 0 ε ε 0 ε 0 t p p r = 2 lim t = 2 lim ( r − 1) = ∞. µ r →∞ r →∞ 1 Ein an beiden Integrationsgrenzen uneigentliches Integral wird auf die einseitigen Fälle zurückgeführt: Definition Es sei ∞ à a < b à ∞ , und die Funktion f : (a, b) → R sei über jedem kompakten Teilintervall integrabel. Existieren für ein c ∈ (a, b) dessen uneigentliche Integrale über (a, c] und [c, b) , so heißt Zb Zc Zb f (t)dt Í f (t) dt + f (t) dt a a c das uneigentliche Integral von f über (a, b) . Ï Die Existenz und der Wert dieses Integrals hängen nicht von der Wahl des Teilungspunktes c ab, wie man sich leicht überlegt. Im Folgenden betrachten wir der Einfachheit halber den Fall, dass die uneigentliche Integrationsgrenze rechts liegt. Der andere Fall wird analog behandelt. Vergleichen wir uneigentliche Integrale mit unendlichen Reihen, so spielen die Integrale über kompakte Teilintervalle die Rolle der Partialsummen – man könnte daher von Partialintegralen sprechen. Dieser Zusammenhang wird auch im folgenden Satz deutlich. 10.4 Satz (i) (ii) (iii) (iv) Es sei a < b à ∞ , und die Funktion f : [a, b) → R sei über jedem kompakten Teilintervall integrabel. Dann sind folgende Aussagen äquivalent. Rb Das uneigentliche Integral a f (t) dt konvergiert. Es gibt eine Stammfunktion F von f , so dass limc b F (c) existiert. Für jede Stammfunktion F von f existiert limc b F (c) . Es gilt das Cauchykriterium: Zu jedem ε > 0 existiert ein c ∈ [a, b) , so dass Z v < ε, f (t) dt u, v ∈ (c, d) . Ï u Y Y Y Y Y (i) a (ii) Das uneigentliche Integral existiert per definitionem genau dann, wenn c Zc lim f (t) dt = lim F = lim F (c) − F (a) c b a c b a c b existiert, wobei F eine beliebige Stammfunktion von f ist. 262 10 6 uneigentliche integrale 10-b (ii) a (iii) Zwei Stammfunktionen von f unterscheiden sich nur durch eine additive Konstante, und diese hat keinen Einfluss auf die Konvergenz. (iii) a (iv) Aussage (iv) bedeutet wegen v Zv f (t) dt = F , u u dass jede Stammfunktion F von f für c → b einer Cauchybedingung genügt. Das wiederum ist äquivalent damit, dass limc b F (c) existiert 6.46 . Y Y Y Y Y 10.5 Uneigentliche Integrale über unbeschränkten Intervallen verhalten sich in vielerlei Hinsicht wie Reihen, wie die folgenden Definitionen und Sätzen zeigen. Rb Definition und Satz Das Integral a f (t) dt heißt absolut konvergent, falls das Absolutintegral Zb |f (t)| dt a existiert. Dies ist genau dann der Fall, wenn es beschränkt ist. In diesem Fall ist es auch konvergent. Ï YYYYY Die durch Zt F (t) = |f (s)| ds a definierte Stammfunktion F des Absolutintegrals ist auf [a, b) monoton steigend. Sie konvergiert somit für t → b genau dann, wenn sie beschränkt ist, also wenn Rb a |f (s)| ds existiert. Absolute Konvergenz impliziert Konvergenz aufgrund der Dreiecksungleichung Z v Zv à f (t) dt |f (t)| dt u u und dem Cauchykriterium. Y Y Y Y Y 10.6 Majorantenkriterium Gilt |f | à g auf [a, b) und existiert das uneigentliche Rb Rb Integral a g(t) dt , so ist a f (t) dt absolut konvergent. Ï Nützliche Majoranten sind zum Beispiel die Funktionen t −α auf (0, ∞) , für die Folgendes gilt. 10.7 Satz Es gilt Z∞ dt < ∞ a α > 1, α 1 t Z1 0 dt < ∞ a α < 1. tα Insbesondere divergieren beide Integrale für α = 1 . Ï 10 7 263 10 ergänzungen YYYYY Für α ≠ 1 ist Zr r dt 1−α = r 1−α − 1. (1 − α) = t α 1 1 t Die rechte Seite konvergiert für r → ∞ genau dann, wenn 1 − α < 0 , und für r → 0 genau dann, wenn 1 − α > 0 . Für α = 1 ist Zr r dt = log t = log r 1 1 t divergiert für r → ∞ und für r → 0 . Y Y Y Y Y Bemerkung In diesem Satz kann man die Integrationsgrenze 1 natürlich durch jede andere positive reelle Zahl ersetzen. Ç ¸ a. Das uneigentliche Integral Z∞ 1 sin t dt tα ist absolut konvergent für α > 1 , denn t −α ist eine konvergente Majorante. b. Das Integral Z∞ sin t dt t 1 ist ebenfalls konvergent, aber nicht absolut konvergent – siehe Aufgabe 5. µ Reihen Jede Reihe lässt sich als ein uneigentliches Integral schreiben, indem man eine passende, stückweise konstante Funktion definiert: Z∞ ∞ ∞ X X ak = a(t) dt, aÍ an χ(n,n+1] . 1 k=1 n=1 Integrale lassen sich jedoch meist leichter handhaben als Reihen. Vor allem sind viele Konvergenzbetrachtungen für Integrale einfacher. 10.8 Integralkriterium Ist die Funktion ϕ : [1, ∞) → (0, ∞) monoton fallend und auf jedem kompakten Teilintervall integrabel, so sind Z∞ ∞ X ϕ(n) und ϕ(t) dt 1 n=1 entweder beide divergent oder beide absolut konvergent, mit Z∞ ∞ X 0à ϕ(n) − ϕ(t) dt à ϕ(1). Ï n=1 264 10 8 1 uneigentliche integrale · 10-1 10-b Zum Integralkriterium ∞ X Z∞ ϕ(n) n=1 ϕ(t) dt 1 ∞ X ϕ(n) ϕ n=2 1 YYYYY 2 3 ··· n Da ϕ positiv ist, sind n X s(n) Í Zt ϕ(k) und S(t) Í ϕ(s) ds 1 k=1 beide monoton steigend. Konvergenz ist also in beiden Fällen gleichbedeutend mit Beschränktheit. Da ϕ nach Voraussetzung monoton fällt, gilt ϕ(k) à ϕ(t) à ϕ(k − 1) auf [k − 1, k] und deshalb Zk ϕ(k) à ϕ(t) dt à ϕ(k − 1), k á 2. k−1 Summieren über k = 2, . . . , n ergibt s(n) − ϕ(1) à S(n) à s(n − 1). Daraus folgen alle Behauptungen. Y Y Y Y Y ¸ a. Es gilt X ná2 Z∞ 2 1 = ∞ , denn n log n ∞ dt = log(log t) = ∞. 2 t log t Für beliebiges ε > 0 gilt andererseits ∞ Z∞ 1 dt 1 = = − < ∞, 1+ε ε logε t 2 ε logε 2 2 t log t und damit auch X 1 1+ε n ná2 n log < ∞. 10 9 265 10 ergänzungen b. Mit diesem Satz können wir die Zetafunktion von Seite 126 grob abschätzen. Mit Z∞ ∞ X dt 1 1 , = ζ(α) = α α n α−1 1 t n=1 für α > 1 erhalten wir 0 à ζ(α) − 1/(α − 1) à 1 , oder 1 α à ζ(α) à . α−1 α−1 Da natürlich auch ζ(α) á 1 , folgt zum Beispiel limα→∞ ζ(α) = 1 . µ Die Gammafunktion Viele wichtige spezielle Funktionen werden durch uneigentliche Integrale definiert. Ein klassisches Beispiel ist die Gammafunktion. Die Gammafunktion Γ : (0, ∞) → R ist definiert durch Z∞ Γ (α) Í t α−1 e−t dt. Ï Definition 0 Y Y Y Y Y Wir müssen zeigen, dass Γ für alle α > 0 existiert. – Für α á 1 ist der Integrand stetig, und da die Exponentialfunktion schneller steigt als jede Potenz 9.9 , konvergiert das uneigentliche Integral. Für 0 < α < 0 ist der Integrand auch an der linken Integrationsgrenze unbeschränkt. Wegen t −α e−t à t −α und Satz 10.7 ist aber auch dieses Integral konvergent. Y Y Y Y Y Offensichtlich ist Γ (1) = 1 , und partielle Integration ergibt Z∞ Γ (α + 1) = t α e−t dt 0 ∞ Z ∞ = − t α e−t + αt α−1 e−t dt 0 0 = αΓ (α). Mit Induktion folgt hieraus Γ (n + 1) = n! , n á 0. Die Gammafunktion interpoliert also die Fakultät, was zum Beispiel in der Statistik Anwendung findet. Ansonsten tritt sie vor allem in der Zahlentheorie auf. 266 10 10 zwei beispiele 10-c 10-c zwei beispiele Es gibt Funktionen auf R , die stetig, aber nirgends differenzierbar sind. Ebenso gibt es Funktionen, deren Taylorreihe zwar überall konvergiert, aber nicht die Funktion darstellt. Hierzu die klassischen Beispiele. Stetig, aber nirgends differenzierbar Sei φ0 die mit der Periode 1 fortgesetzte Betragsfunktion auf [−1/2, 1/2] wie in Abbildung 10-2. Das heißt, es ist φ0 : R → R, φ0 (t) = |t − [t + 1/2]| , (5) wobei [·] die Gaußklammer bezeichnet. Diese Funktion ist stetig, stückweise affin auf Intervallen der Länge 1/2 mit Steigung 1 oder −1 , und periodisch mit Periode 1 . Für n á 1 sei dann φn : R → R, φn (t) = 4−n φ0 (4n t). Auch diese Funktionen sind stetig, periodisch mit Periode 4−n , und stückweise affin auf Intervallen der Länge 4−n /2 mit Steigungen 1 oder −1 . 10.9 Die Funktion Satz φ : R → R, φ(t) = X φn (t) ná1 ist überall stetig, aber in keinem Punkt differenzierbar. Ï YYYYY Wegen X m X m 1 X −k φ kφk kR = 4 < 4−n k à 2 k=n k=n kán R konvergiert die Reihe gleichmäßig auf R . Also ist φ stetig 6.52 . Sei jetzt a ein beliebiger Punkt auf R und n á 1 . Dann können wir hn = ±4−n−1 so wählen, · 10-2 Die Funktion φ0 φ0 1/2 1/2 10 11 267 10 ergänzungen · 10-3 Zum Beweis von φn Satz 10.9 φn+1 a a + hn dass die φk mit 1 à k à n zwischen a und a + hn affin mit derselben Steigung sind und damit φk (a + hn ) − φk (a) = ±1, hn k = 1, . . . , n, gilt – siehe Abbildung 10-3. Dagegen gilt φk (a + hn ) − φk (a) = 0, k > n, da alle φk mit k > n periodisch mit Periode hn sind. Also gilt X φk (a + hn ) − φk (a) φ(a + hn ) − φ(a) = = ±n. hn hn 1àkàn Entlang hn → 0 konvergieren die Differenzenquotienten im Punkt a also nicht.Y Y Y Y Y Glatt, aber nicht analytisch 10.10 Das Beispiel von Cauchy φ : R → R, Die Funktion φ(t) = e−1/t 2 , t ≠ 0, 0, t = 0, ist unendlich oft differenzierbar, und es gilt φ(n) (0) = 0 für alle n á 0 . Insbesondere gilt T0 φ ≡ 0 ≠ φ auf R∗ . Ï Die Taylorreihe dieser Funktion bei 0 verschwindet also identisch und konvergiert trivialerweise auf ganz R . Aber natürlich ist die Funktion φ selbst · 10-4 φ 1 Das Beispiel von Cauchy −1 268 10 12 1 zwei beispiele 10-c nicht die Nullfunktion, wird also nicht von ihrer Taylorreihe dargestellt. Somit ist φ auch nicht reell analytisch. Auf R∗ ist φ beliebig oft differenzierbar. Genauer zeigt man mit Induktion für alle n á 0 , dass YYYYY 2 φ(n) (t) = pn (1/t) e−1/t , t ≠ 0, mit einem Polynom pn vom Grad à 3n . Wegen t m e−t → 0 für t → ∞ für alle m á 0 folgt hieraus 2 lim φ(n) (t) = lim pn (t)e−t = 0, t→0 n á 0. t→∞ Daraus folgt induktiv, dass φ(n) in 0 stetig ist, dort auch differenzierbar ist, und dass φ(n+1) (0) = 0 gilt. Y Y Y Y Y Eine Variante dieses Beispiels ist die Funktion e−t 2 /(1−t 2 ) , |t| < 1, ψ : R → R, ψ(t) = 0, |t| á 1, die ebenfalls unendlich oft differenzierbar ist. Darüberhinaus verschwindet sie außerhalb von [−1, 1] identisch. Man sagt, sie hat kompakten Träger: Definition Der Träger einer Funktion ϕ : R → R ist der Abschluss der Menge, auf der ϕ nicht verschwindet: supp ϕ Í {t ∈ R : ϕ(t) ≠ 0}− . Ï Der Raum aller C ∞-Funktionen auf R mit kompakten Träger wird mit C0∞ (R) bezeichnet und spielt in der Analysis eine wichtige Rolle. Wie die Funktion ψ zeigt, ist er nicht leer. · 10-5 Eine C ∞-Funktion mit kompakten Träger 10 13 269 10 ergänzungen 10-d faltungen Wir betrachten stetige Funktionen auf der reellen Geraden, die beschränkt oder sogar absolut integrabel sind. Für Erstere haben wir bereits den Raum CB(R) Í f ∈ C(R) : kf k∞ < ∞ eingeführt, wobei kf k∞ Í sup |f (t)| −∞<t<∞ die Supremums- oder L∞ -Norm einer Funktion bezeichnet. Für Letztere definieren wir den Raum CI(R) Í f ∈ C(R) : kf k1 < ∞ , wobei Z∞ kf k1 Í |f (t)| dt −∞ als die L1 -Norm einer Funktion bezeichnet wird. Für eine beliebige stetige Funktion können beide Normfunktionen den Wert ∞ annehmen. Da jede stetige integrable Funktion beschränkt, aber nicht jede stetige beschränkte Funktion auch integrabel ist, gilt somit CI(R) ⊊ CB(R) ⊊ C(R). Bemerkung In Abschnitt 6-g haben wir gezeigt, dass CB(R) mit der Supremumsnorm k·k∞ ein vollständiger normierter Raum ist. Der Raum CI(R) mit der L1 -Norm k·k1 ist zwar ebenfalls normiert, aber nicht vollständig. Denn es gibt Folgen in CI(R) , die punktweise und bezüglich k·k1 gegen nichtstetige Funktionen konvergieren – siehe Aufgabe 6. Ç Die Faltungsoperation Definition Seien f , g ∈ CB(R) , und f oder g sei auch in CI(R) . Dann ist die Faltung oder Konvolution von f und g erklärt als die Funktion Z∞ f ∗ g : R → R, (f ∗ g)(x) Í f (x − t)g(t) dt. Ï −∞ Wir müssen zeigen, dass das uneigentliche Integral für jedes x konvergiert. Ist zum Beispiel g ∈ CI(R) , so gilt für alle r > 0 YYYYY 270 10 14 faltungen Zr 0 10-d Zr |f (x − t)g(t)| dt à kf k∞ 0 |g(t)| dt à kf k∞ kgk1 . Daraus folgt die Konvergenz des Integrals für r → ∞ 10.5 . Gleiches gilt für das Integral über [−r , 0] . Für f ∈ CI(R) argumentiert man entsprechend. Somit ist f ∗ g wohldefiniert. Y Y Y Y Y Die Formulierung ›Faltung von f und g ‹ ist symmetrisch in den Funktionen f und g , die Definition jedoch scheinbar nicht. Dies täuscht jedoch. 10.11 Lemma Unter den Voraussetzungen obiger Definition gilt f ∗ g = g ∗ f , oder Z∞ Z∞ f (x − t)g(t) dt = f (t)g(x − t) dt −∞ −∞ für jedes x ∈ R . Ï YYYYY Die Substitution t = x − s ergibt für jedes r > 0 Zr Z x+r f (x − t)g(t) dt = f (s)g(x − s) ds. −r x−r Da die uneigentlichen Integrale für r → ∞ auf beiden Seiten existieren, folgt hieraus durch Grenzübergang die Behauptung. Y Y Y Y Y Der Faltungsoperator Fixieren wir ein ϕ ∈ CI(R) , so können wir jeder Funktion f ∈ CB(R) durch Faltung mit ϕ eine neue Funktion f ∗ ϕ zuordnen. Die Funktion ϕ definiert somit einen Operator Tϕ : f , Tϕ f = f ∗ ϕ. Dieser Operator hat viele interessante und nützliche Eigenschaften, von denen wir hier nur einige erwähnen. 10.12 Jede Funktion ϕ ∈ CI(R) definiert einen linearen Faltungsoperator Satz Tϕ : CB(R) → CB(R), Tϕ f Í f ∗ ϕ. Dieser ist beschränkt, und es gilt kTϕ f k∞ à kϕk1 kf k∞ . Ï Wir zeigen zuerst, dass Tϕ f wieder stetig ist. Fixiere ein beliebiges x , und betrachte dazu Z∞ Tϕ f (x + h) − Tϕ f (x) à |f (x + h − t) − f (x − t)| |ϕ(t)| dt. YYYYY −∞ 10 15 271 10 ergänzungen Dieses Integral zerlegen wir in drei Teilintegrale über (−∞, −r ] , [−r , r ] und [r , ∞) , wobei r noch geeignet zu wählen ist. Das linke und rechte Teilintegrale können wir durch Z −r kf k∞ Z∞ |ϕ(t)| dt + |ϕ(t)| dt r −∞ abschätzen. Da ϕ integrabel ist, konvergiert der Ausdruck in eckigen Klammern für r → ∞ gegen Null. Zu jedem gegebenen ε > 0 existiert daher ein r so, dass [· ·] < ε gilt. Der gesamte Ausdruck ist dann durch kf k∞ ε beschränkt. Bleibt noch das Integral Zr |f (x + h − t) − f (x − t)| |ϕ(t)| dt. −r Für |h| à 1 wird f nur innerhalb eines kompakten Intervalls um x ausgewertet. Dort ist f aber gleichmäßig stetig ?? . Zu dem bereits gegebenen ε existiert daher ein 0 < δ à 1 so, dass f (x + h − t) − f (x − t) < ε, |h| < δ, |t| à r . Das letzte Integral ist dann durch kϕk1 ε beschränkt. Beide Abschätzungen zusammen ergeben Tϕ f (x + h) − Tϕ f (x) à (kf k + kϕk )ε, 1 ∞ |h| < δ. Da für jedes ε und solches δ existiert, ist Tϕ f im Punkt x stetig. Wir zeigen nun, dass Tϕ f auch beschränkt ist. Für jedes x ∈ R gilt Z∞ Tϕ f (x) à |f (x − t)ϕ(t)| dt −∞ Z∞ |ϕ(t)| dt = kf k∞ kϕk1 . à kf k∞ −∞ Also gilt auch kTϕ f k∞ = sup Tϕ f (x) à kf k∞ kϕk1 x∈R für jedes f ∈ CB(R) , das heißt, Tϕ f ist auch beschränkt. – Die Linearität von Tϕ schließlich ist offensichtlich. Y Y Y Y Y Das Interessante am Operator Tϕ ist, dass sich viele Eigenschaften von der Funktion ϕ auf die gefaltete Funktion Tϕ f vererben. Ist zum Beispiel ϕ stetig differenzierbar und die Ableitung ϕ0 ebenfalls auf ganz R integrierbar, so darf man in der folgenden Rechnung Differenziation und Integration vertauschen – 272 10 16 diracfolgen 10-e was wir allerdings erst später beweisen werden – und erhält Z∞ (f ∗ ϕ)0 = ∂x ϕ(x − t)f (t) dt −∞ Z∞ = ∂x ϕ(x − t)f (t) dt = f ∗ ϕ0 , −∞ wobei ∂x die Ableitung nach x bezeichnet. Die Ableitung operiert also auf ϕ , und nicht auf f . Entsprechendes gilt per Induktion auch für höhere Ableitungen. Sei dafür C rB(I) Í ϕ ∈ C r(I) : ϕ(r ) ∈ CB(I) . 10.13 Sei ϕ ∈ C r (R) und ϕ(r ) ∈ CI(R) . Dann gilt Satz Tϕ : CB(R) → C rB(R), und es ist ∂ k Tϕ f = T∂ k ϕ f , k = 0, . . . , r . Ï Die Voraussetzung dieses Satzes ist zum Beispiel für jedes ϕ ∈ C0∞ (R) für alle r á 0 erfüllt. Denn jede Ableitung von ϕ ist stetig, hat denselben kompakten Träger wie ϕ und ist somit integrabel. Wir erhalten damit folgendes 10.14 Korollar Ist ϕ ∈ C0∞ (R) , so gilt Tϕ : CB(R) → C ∞B(R). Ï Wir werden diese beiden Sätze im Folgenden nicht benötigen, da wir mit dem Weierstraßschen Approximationssatz eine noch stärkere Aussage beweisen werden. 10-e diracfolgen Mithilfe von Faltungen lässt sich die Aufgabe elegant lösen, stetige Funktionen durch glatte, das heißt, unendlich oft differenzierbare Funktionen zu approximieren. Benötigt werden dazu Funktionen, die die Faltungsoperation auf immer kleinere Umgebungen eines Punktes konzentrieren. Definition Eine Folge (ϕn ) von Funktionen in CI(R) heißt Diracfolge, wenn (d-1) ϕn á 0 für alle n , R∞ (d-2) −∞ ϕn (t) dt = 1 für alle n , und 10 17 273 10 ergänzungen · 10-6 Eine Diracfolge mit ϕ5 einer Startfunktion ψ mit Träger [−1, 3] ϕ3 1 ϕ1 = ψ 1 (d-3) Rδ −δ ϕn (t) dt → 1 für jedes δ > 0 . Ï Die ersten beiden Bedingungen bewirken, dass die Faltung mit jedem ϕn eine Mittelwertbildung darstellt. Die dritte Bedingung bringt zum Ausdruck, dass diese Mittelwertbildungen gegen eine Punktauswertung konvergieren. Denn aus (d-2) und (d-3) folgt für jedes δ > 0 auch Z −δ Z∞ + −∞ δ ϕn (t) dt → 0. Alles außerhalb von [−δ, δ] wird somit asymptotisch mit 0 gewichtet. Diracfolgen sind leicht zu beschaffen: 10.15 Lemma Ist ψ eine stetige, nichtnegative Funktion mit kompaktem Träger und Z∞ ψ(t) dt = 1, −∞ so definiert ϕn (t) = nψ(nt) für n á 1 eine Diracfolge (ϕn ) . Ï YYYYY Offensichtlich ist ϕn á 0 , und mit der Substitution t = ns erhält man Z∞ Z∞ Z∞ ϕn (t) dt = n ψ(nt) dt = ψ(s) ds = 1. −∞ −∞ −∞ Ist supp ψ ⊂ [−r , r ] , so ist supp ϕn ⊂ [−r /n, r /n] und deshalb Zδ −δ Z∞ ϕn (t) dt = −∞ ϕn (t) dt = 1, n á r /δ. Y Y Y Y Y ¸ a. Ist in diesem Lemma ψ eine glatte Funktion, so sind auch alle ϕn glatt. b. Ein weiteres Beispiel wird in (10) gegeben. µ 274 10 18 diracfolgen 10-e Ein allgemeiner Approximationssatz Faltungen einer gleichmäßig stetigen Funktion f mit den Funktionen einer beliebigen Diracfolge führen zu stetigen Funktionen fn , die gleichmäßig gegen die Ausgangsfunktion f konvergieren. 10.16 Satz Ist f ∈ CB(R) gleichmäßig stetig und (ϕn ) eine Diracfolge, so gilt f ∗ ϕn % f . YYYYY Ï Sei fn = f ∗ ϕn . Wegen (d-2) ist Z∞ Z∞ f (x) = f (x) ϕn (t) dt = f (x)ϕn (t) dt. −∞ −∞ Mit (d-1) ist dann Z∞ |f (x) − fn (x)| à −∞ |f (x) − f (x − t)| ϕn (t) dt. (6) Dieses Integral zerlegen wir in einen Anteil über ein kleines Mittelstück [−δ, δ] und den Rest. Sei ε > 0 . Wegen der gleichmäßigen Stetigkeit von f existiert ein δ > 0 , so dass für alle x gleichmäßig |f (x − t) − f (x)| < ε, |t| < δ. Für das Mittelstück des Integrals erhalten wir damit Zδ −δ Zδ |f (x) − f (x − t)| ϕn (t) dt < ε −δ ϕn (t) dt < ε, (7) denn es wird ja nur über |t| à δ integriert. Den Integralanteil über das Komplement von [−δ, δ] können wir wegen (d-2) beschränken durch "Z # " # Z∞ Zδ −δ 2 kf k∞ + ϕn (t) dt = 2 kf k∞ 1 − ϕn (t) dt . −∞ δ −δ Der letzte Ausdruck konvergiert wegen (d-3) für n → ∞ gegen 0 . Es gibt somit ein N á 1 , so dass Z −δ Z∞ + −∞ δ |f (x) − f (x − t)| ϕn (t) dt < ε, n á N. (8) Die Abschätzungen (6), (7) und (8) ergeben zusammen kfn − f k∞ < 2ε, n á N. Y Y Y Y Y 10 19 275 10 ergänzungen Approximation durch Polynome Von den Funktionen einer beliebigen Diracfolge wird nur verlangt, dass sie stetig sind. Sind sie aber glatt, so sind auch die Faltungen f ∗ ϕn glatt. Eine gleichmäßig stetige Funktionen f ist daher auch gleichmäßiger Limes glatter Funktionen. Die glattesten Funktionen sind die analytischen Funktionen, und unter diesen sind die Polynome die einfachsten. Die Frage ist also, ob man eine beliebige stetige Funktion gleichmäßig durch Polynome approximieren kann. 10.17 Approximationssatz von Weierstraß Sei I ein kompaktes Intervall. Dann ist jede stetige Funktion auf I gleichmässiger Limes von Polynomen. Ï Bemerkung Es ist notwendig, dass das Intervall I kompakt ist. Auf einem unbeschränkten Intervall zum Beispiel kann der Satz nicht gelten, da dort jedes nicht konstante Polynom unbeschränkt ist. Ç Zunächst bemerken wir, dass wir uns auf den Fall YYYYY I = [0, 1] , f (0) = 0 = f (1) (9) zurückziehen können. Denn ist f stetig auf I = [a, b] , so ist g = f ◦ u mit u(t) = (1 − t)a + tb stetig auf [0, 1] , und die Funktion h = g − v mit v(t) = (1 − t)g(0) + tg(1) verschwindet bei 0 und 1 . Existieren nun Polynome qn , die auf [0, 1] gleichmäßig gegen h konvergieren, so sind pn = (qn + v) ◦ u−1 ebenfalls Polynome, die auf I gleichmäßig gegen (h + v) ◦ u−1 = f konvergieren. Somit können wir von (9) ausgehen. Durch f auf [0, 1], FÍ 0 auf R Ø [0, 1], setzen wir zuerst f zu einer gleichmäßig stetigen Funktion F auf R fort. Als Diracfolge wählen wir geeignete Polynome auf [−1, 1] , nämlich 2 n ϕn = λ−1 n (1 − t ) , |t| à 1. (10) Dieses setzen wir ebenfalls durch 0 auf die restliche reelle Gerade stetig fort und bezeichenn sie dort mit Φn . Mit Z1 λn Í (1 − t 2 )n dt > 0 −1 276 10 20 diracfolgen 10-e · 10-7 Polynomiale Diracfunktionen auf [−1, 1] 1 −1 1 sind die Eigenschaften (d-1) und (d-2) offensichtlich erfüllt. Eigenschaft (d-3) zeigen wir im anschließenden Lemma. Betrachte nun die Funktionen pn = F ∗ Φ n . Diese konvergieren gleichmäßig gegen F 10.16 . Also konvergieren sie auf [0, 1] gleichmäßig gegen f . Für x ∈ [0, 1] gilt außerdem Z∞ F ∗ Φn (x) = F (t)Φn (x − t) dt −∞ Z1 = 0 f (t)Φn (x − t) dt = λ−1 n Z1 f (t)(1 − (x − t)2 )n dt, 0 denn im Integral in der zweiten Zeile ist |x − t| à 1 , und dort ist Φn durch (10) gegeben. Aufgrund der binomischen Formel ist (1 − (x − t)2 )n ein Polynom in x mit Koeffizienten, die von t abhängen. Nach Integration bezüglich t bleibt somit ein polynomialer Ausdruck in x . Mit anderen Worten, die pn sind Polynome, und der Satz bis auf das folgende Lemma damit bewiesen. Y Y Y Y Y 10.18 Lemma Für die Polynome (10) gilt Zδ −δ ϕn (t) dt → 1 für jedes δ ∈ (0, 1) . Ï YYYYY Da 1 − t 2 auf [0, 1] monoton fällt, gilt 10 21 277 10 ergänzungen Z1 (1 − t 2 )n dt à (1 − δ2 )n . δ Für den Normierungsfaktor λn haben wir andererseits Z1 Z1 Z1 λn á (1 − t 2 )n dt = (1 − t)n (1 + t)n dt á (1 − t)n dt = 0 0 0 Also gilt, für jedes δ ∈ (0, 1) , Z1 ϕn (t) dt à (n + 1)(1 − δ2 )n → 0, 1 . n+1 n → ∞. δ Dasselbe gilt natürlich für das Integral über [−1, −δ] . Da das Integral über das gesamte Intervall [−1, 1] gleich 1 ist, folgt hieraus die Behauptung. Y Y Y Y Y aufgaben 1 Welche Aussagen sind wahr? Rr a. Existiert limr →∞ −r f (t) dt , so ist f uneigentlich integrierbar. b. Eine C 1-Funktion mit kompakten Träger ist immer integrierbar. c. Eine unbeschränkte Funktion ist nicht integrierbar. d. Eine stetige, beschränkte Funktion hat immer einen kritischen Punkt. 2 Bestimmen Sie die folgenden Grenzwerte. sin t log(1 + t) a. lim b. lim t→0 t→0 t t at − 1 c. lim t α log t, α > 0 d. lim , a>0 t→0 t→0 t 1 1 f. lim − 2 g. lim (1 + 2n)1/3n n→∞ t→0 sin2 t t e. lim x x x→0 3 Bestimmen Sie die folgenden Integrale. Z∞ Z∞ Z1 Z1 n a. t 2 e−t dt b. c. t log t dt d. t α log t dt, α > 0 0 0 0 0 Z∞ Z∞ Z∞ dt −t e. f. e sin t dt g. t n e−at cos ωt dt, ω > 0 3 0 1+t 0 0 Z1 dt √ h. , a>1 −1 (t − a) 1 − t 2 4 Zeigen Sie, dass das uneigentliche Integral Zr lim sin t dt. r →∞ 278 10 22 −r R∞ −∞ sin t dt nicht existiert, wohl aber aufgaben 5 10 Zeigen Sie, dass Z∞ sin t dt t 1 konvergiert, aber nicht absolut konvergiert. 6 Zeigen Sie, dass (CI(R), k·k1 ) ein normierter, aber nicht vollständiger Vektorraum ist. Hinweis: Man betrache beispielsweise fn (t) = (1 − t)n auf [−1, 1] und setze stetig fort. 7 Dirichletsches Konvergenzkriterium: Sei f eine Regelfunktion auf [a, b) mit beschränkter Stammfunktion und g eine monotone C 1-Funktion auf [a, b) mit limt→b g(t) = 0 . Dann existiert das Integral Zb f g dt. a 8 Ist f ∈ C([0, ∞)) integrierbar, so definiert Z∞ F (t) = − f (s) ds, t á 0, t eine Stammfunktion F ∈ C 1 ([0, ∞)) von f . 9 Zeigen Sie, dass für jedes ω > 0 Z∞ sin ωt dt t 0 konvergiert. Welche Werte nimmt das Integral an? 10 Sei f : [0, ∞) → R monoton fallend mit limt→∞ f (t) = 0 . Dann existiert Z∞ f (t) sin t dt. 0 11 Die Funktion f : [0, ∞) → R sei monoton und integrierbar. Dann existiert für jedes P h > 0 die Reihe ná0 f (nh) , und es gilt Z∞ X lim n f (nh) = f (t) dt. h→0 12 ná0 0 Abschneidefunktion: Man konstruiere zu jedem ε > 0 eine C ∞-Funktion ϕε : R → [0, 1] mit 1, |t| à 1, ϕε (t) = 0, |t| á 1 + ε. 13 Zu jeder beliebigen reellen Folge (an )ná0 konstruiere man eine Funktion f ∈ C ∞ (R) mit 1 (n) f (0) = an , n! n á 0. 10 23 279 10 ergänzungen Hinweis: Betrachte 14 P ná0 an t n ϕ((1 + a2n )t) mit einer geeigenten Abschneidefunktion ϕ . Zu jeder Funktion f ∈ C 1 ([a, b]) existiert eine Folge von Polynomen pn , so dass (pn ) 0 gleichmäßig gegen f und (pn ) gleichmäßig gegen f 0 konvergiert. 15 Sei f : [−1, 1] → R eine im Punkt 0 stetige Regelfunktion. Dann gilt lim h0 280 10 24 1 π Z1 −1 h f (t) dt = f (0). t 2 + h2 11 Elementare Differenzialgleichungen Differenzialgleichungen stellen eine Beziehung her zwischen einer oder mehreren Funktionen und ihren Ableitungen. Da Ableitungen Veränderungen beschreiben, modellieren Differenzialgleichungen ganz allgemein das Veränderungsverhalten von Systemen. Wir beschränken uns hier auf den einfachsten Fall einer skalaren Größe x , die nur von einer unabhängigen Variablen abhängt, der Zeit: t , x(t). Eine Differenzialgleichung betrifft in diesem Fall die Größe x und endlich viele ihrer Ableitungen ẋ, ẍ, . . . nach der Zeit t . Beschränken wir uns auch hier auf den einfachsten Fall, so haben wir es mit Differenzialgleichungen erster Ordnung zu tun, die nur t, x, ẋ involvieren und daher von der allgemeinen Form F (t, x, ẋ) = 0 sind. Am einfachsten sind solche Gleichungen in expliziter Form, ẋ = f (t, x), und nur solche wollen wir jetzt betrachten. Die hier verwendete Notation ist die physikalische Notation, wo die unabhängige Variable als Zeit aufgefasst wird. In der mathematischen Notation übernimmt x diese Rolle, und die abhängige Größe wird meist mit y bezeichnet. Die letzte Gleichung lautet dann y 0 = f (x, y). 11 1 281 11 elementare differenzialgleichungen 11-a grundbegriffe Definition Sei I ein Intervall, D eine offene Teilmenge von R , und f : I × D → R stetig. Dann heißt ẋ = f (t, x), (t, x) ∈ I × D, (1) eine Differenzialgleichung erster Ordnung auf I × D . Eine Lösung dieser Differenzialgleichung ist eine differenzierbare Abbildung ϕ : J → D mit einem nichtleeren Intervall J ⊂ I , so dass ϕ̇(t) = f (t, ϕ(t), t ∈ J. Ï (2) Bemerkungen a. Genauer handelt es sich um eine explizite skalare Differenzialgleichung erster Ordnung. Explizit, weil die Gleichung nach ẋ aufgelöst, skalar, weil x eindimensional und reell ist, und erster Ordnung, da nur die erste Ableitung ẋ auftritt. b. Es wäre zu einschränkend zu verlangen, dass eine Lösung ϕ auf ganz I erklärt ist. Sie kann zum Beispiel vorzeitig den Definitionsbereich D verlassen. c. Die Notation in Gleichung (1) ist üblich und bequem, aber streng genommen inkonsistent, denn x ist ja ebenfalls eine Funktion von t . Konsequent wären daher die punktweise Schreibweise ẋ(t) = f (t, x(t)) – was lästig ist – oder die funktionale Schreibweise ẋ = f ( · , x) – was aber zum Beispiel bei linearen Gleichungen verwirrend ist. Ç Geometrisch handelt es sich bei der rechten Seite der Differenzialgleichung (1) um ein sogenanntes Richtungsfeld auf dem Gebiet I × D . In jedem Punkt (t, x) dieses Gebietes schreibt die Funktion f vor, welche Richtung oder Steigung die Tangente einer Lösung einnimmt, wenn sie durch diesen Punkt verläuft. In (2) wird genau dies von einer Lösung ϕ verlangt. · 11-1 Die Differenzialgleichung ẋ = f (t, x) x ϕ̇(t) = f (t, x) t 282 11 2 06.09.2011–09:35 grundbegriffe · 11-2 11-a Ein Richtungsfeld mit fünf Lösungskurven x t Eine Betrachtung des Richtungsfeldes kann oft schon Aufschluss über die Gestalt seiner Lösungskurven geben. ¸ a. Die einfachste Differenzialgleichung ist sicherlich ẋ = 0 auf R × R . Jede Lösung ist konstant, jede Funktion ϕ : t , c somit eine Lösung. b. Die Gleichung ẋ = f (t), mit f stetig auf I , ist keine ›echte‹ Differenzialgleichung, da die rechte Seite nicht von x abhängt. Ihre Lösungen kennen wir bereits, es sind sämtliche Stammfunktionen von f . Aus diesen unendlich vielen Lösungen wird eine Lösung eindeutig bestimmt durch Festlegung eines Anfangswertes x(t0 ) = c an einer beliebigen Stelle t0 ∈ I . Dann ist Zt ϕ(t) = c + f (s) ds. t0 Das zugehörige Richtungsfeld ist invariant unter Translationen in der x-Richtung – siehe Abbildung 11-3. µ 06.09.2011–09:35 11 3 283 11 elementare differenzialgleichungen · 11-3 Ortsunabhängiges Richtungsfeld x t Man spricht von einer autonomen Differenzialgleichung, wenn die Funktion f nicht explizit von t abhängt, also von der Form f: D→R ist. Das zugehörige Richtungsfeld ist dann invariant unter Translationen in der t-Richtung – siehe Abbidlung 11-4. Andernfalls heißt die Gleichung nichtautonom. ¸ Das einfachste und wichtigste Beispiel einer autonomen Differenzialgleichung ist das Wachstumsgesetz ẋ = ax mit einem konstanten Koeffizienten a ≠ 0 , mit dessen Hilfe wir bereits die Exponentialfunktion definiert hatten. Jede Lösung ist von der Form ϕ(t) = eat c, c ∈ R. Eine eindeutige Lösung wird festgelegt durch einen Anfangswert x(t0 ) = x0 . Einsetzen und Auflösen ergibt c = e−at0 x0 und damit ϕ(t) = ea(t−t0 ) x0 . µ Die Beispiele zeigen, dass eine Lösung durch eine Differenzialgleichung allein nicht eindeutig bestimmt wird. Das ist auch nicht überraschend, denn eine solche Gleichung bestimmt ja nur deren Veränderungsverhalten, nicht aber ihre absolute 284 11 4 grundbegriffe 11-a Position. Dazu bedarf es weiterer Daten, eben zum Beispiel eines Anfangswertes. Die Kombination beider Daten bezeichnet man als Anfangswertproblem. Definition Unter einem zur Differenzialgleichung (1) gehörenden Anfangswertproblem versteht man das System ẋ = f (t, x), x(t0 ) = x0 , (3) wobei (t0 , x0 ) ∈ I × D . Eine lokale Lösung ist eine Lösung ϕ : I0 → D dieser Differenzialgleichung mit ϕ(t0 ) = x0 , t0 ∈ I0 ⊂ I. Ï Eine lokale Lösung ist also eine Lösung der Differenzialgleichung, die auf einem beliebig kleinen Intervall I0 um die Anfangszeit t0 definiert ist und zu diesem Zeitpunkt den Anfangswert x0 annimmt. Die allgemeine Theorie – der sogenannte Existenz- und Eindeutigkeitssatz von Picard-Lindelöf – wird später zeigen, dass ein Anfangswertproblem unter sehr allgemeinen Bedingungen an die rechte Seite immer eine eindeutige lokale Lösung besitzt. Dies gilt sogar für vektorielle Gleichungen. In den speziellen Fällen, die wir im Folgenden betrachten werden, werden wir dies von Hand beweisen. Wir können daher auf die große Maschine vorläufig verzichten. · 11-4 Zeitunabhängiges Richtungsfeld x t 11 5 285 11 elementare differenzialgleichungen 11-b l i n e a r e d i f f e r e nzialgleichungen Definition Eine lineare Differenzialgleichung erster Ordnung ist von der Form ẋ = a(t)x + b(t) mit auf einem Intervall I stetigen Funktionen a und b . Sie heißt homogen, falls b = 0 , andernfalls inhomogen. Ï Der homogene Fall Wir lösen zuerst die homogene Gleichung ẋ = a(t)x . Dies ist nichts anderes als ein zeitabhängiges Wachstumsgesetz, dessen Lösungen ebenfalls durch Exponentialfunktionen beschrieben werden. 11.1 Sei a stetig auf dem Intervall I . Dann ist die allgemeine Lösung von Satz ẋ = a(t)x (4) gegeben durch ϕ(t) = eA(t) c, c ∈ R, mit einer beliebigen Stammfunktion A von a . Sie existiert auf ganz I . Ï YYYYY Offensichtlich ist dies für jedes c eine Lösung, denn ϕ̇ = eA Ȧc = eA ac = aϕ. Bleibt zu zeigen, dass jede Lösung von dieser Form ist. Nun, ist ϕ eine beliebige Lösung, dann gilt ∂(e−A ϕ) = e−A ϕ̇ − e−A Ȧϕ = e−A aϕ − e−A aϕ = 0. Also ist e−A ϕ = c eine reelle Konstante, und die Behauptung folgt. Y Y Y Y Y ¸ a. Für konstantes a ist die allgemeine Lösung von ẋ = ax gegeben durch ϕ(t) = eat c, c ∈ R. b. Die allgemeine Lösung der Differenzialgleichung ẋ = − x , t t > 0, ist Zt c ds = c exp (− log t) = . µ ϕ(t) = c exp − t 1 s 286 11 6 lineare differenzialgleichungen 11.2 Korollar 1 Die Gesamtheit aller Lösungen von ẋ = a(t)x bildet einen eindimensionalen reellen Vektorraum L0 = { eA(t) c : c ∈ R} . 11.3 11-b Korollar 2 Ï Das zugehörige Anfangswertproblem ẋ = a(t)x, x(t0 ) = x0 besitzt auf I die eindeutige Lösung Z t a(s) ds x0 . Ï ϕ(t) = exp t0 Da das Integral eine Stammfunktion von a definiert, ist nach dem eben bewiesenen Satz jede Lösung von der Form Z t ϕ(t) = exp a(s) ds c. YYYYY t0 Die Bedingung ϕ(t0 ) = x0 ergibt dann c = x0 . Y Y Y Y Y Bemerkung A posteriori – im Nachhinein – ist es leicht, die Korrektheit einer Lösung zu verifizieren – man muss ja nur differenzieren. Das Problem ist, überhaupt eine zu finden. Im Falle der Gleichung ẋ = a(t)x hilft der Ansatz ϕ(t) = eΦ(t) , denn die Lösung sollte wohl etwas mit der Exponentialfunktion zu tun haben. Dann ist aber notwendigerweise ! ϕ̇ = eΦ Φ̇ = aϕ = aeΦ , und damit Φ̇ = a . Also muss Φ eine Stammfunktion von a sein. Ç Der inhomogene Fall Wir betrachten nun die inhomogene lineare Differenzialgleichung ẋ = a(t)x + b(t). (5) Wie bei inhomogenen linearen Gleichungssystemen auch, kann man diesen Fall auf die allgemeine Lösung der homogenen Gleichung plus einer partikulären Lösung der inhomogenen Gleichung zurückführen. 11.4 Proposition Sei ϕ0 eine partikuläre Lösung der inhomogenen Gleichung (5). Dann ist jede andere Lösung von (5) von der Form ϕ0 + ϕ mit einer Lösung ϕ der homogenen Gleichung (4). Ï 11 7 287 11 elementare differenzialgleichungen YYYYY Offensichtlich ist . (ϕ0 + ϕ) = ϕ̇0 + ϕ̇ = aϕ0 + b + aϕ = a(ϕ0 + ϕ) + b, also ϕ0 + ϕ eine Lösung von (5). Ist umgekehrt ψ irgendeine Lösung von (5), so ist mit derselben Rechnung ψ − ϕ0 = ϕ eine Lösung von (4). Y Y Y Y Y 11.5 Korollar Die Gesamtheit aller Lösungen der inhomogenen Gleichung (5) bildet einen eindimensionalen affinen Raum L = ϕ0 + L0 = {ϕ0 + eA(t) c : c ∈ R} , mit einer partikulären Lösung ϕ0 von (5) und einer beliebigen Stammfunktion A von a . Ï Bemerkung Man überzeuge sich, dass dieser Raum L nicht von der Wahl von ϕ0 und A abhängt. Ç Es bleibt die Frage, wie man eine partikuläre Lösung findet. Hier hilft die Idee der Variation der Konstanten 1 , die bereits auf Lagrange zurückgeht: wenn eA(t) c die homogene Gleichung löst, so löst sie vielleicht auch die inhomogene Gleichung, wenn c nur in geeigneter Weise von t abhängt . . . Dann sollte also gelten ! ∂(eA c) = eA Ȧc + eA ċ = eA ac + eA ċ = aeA c + b, oder ċ = e−A b. Diese Gleichung ist aber durch Integration lösbar, denn die rechte Seite ist bekannt. Ist c0 eine Stammfunktion von e−A b , so ist also eA c0 eine partikuläre Lösung. Insgesamt erhalten wir folgendes Ergebnis. 11.6 Satz Die Funktionen a und b stetig auf I . Dann ist die allgemeine Lösung von ẋ = a(t)x + b(t) auf ganz I erklärt und gegeben durch ϕ(t) = eA(t) (c + c0 (t)), c ∈ R, mit einer Stammfunktion A von a und einer Stammfunktion c0 von e−A b . Ï Schreiben wir dies detailliert aus, so ergibt sich für die Lösung des zugehörigen Anfangswertproblems folgendes Ergebnis. 1 Dieser Begriff ist zwar ein Widerspruch in sich, trifft die Sache aber genau. 288 11 8 separierbare differenzialgleichungen 11.7 11-c Seien a und b stetig auf I . Dann besitzt das Anfangswertproblem Satz ẋ = a(t)x + b(t), x(t0 ) = x0 , auf I die eindeutige Lösung Zt ϕ(t) = eA(t) x0 + e−A(s) b(s) ds , Zt A(t) = a(s) ds. t0 Ï t0 Bemerkung Diese Formel ist von eher theoretischem Interesse. In der Praxis löst man zuerst die homogene Gleichung und konstruiert anschließend per Variation der Konstanten direkt eine partikuläre Lösung. Das ist schneller und einfacher. Ç ¸ Betrachte die Differenzialgleichung ẋ = 2tx + 2t 3 . Eine Stammfunktion von 2t ist t 2 , die allgemeine Lösung lautet deshalb Zt 2 2 ϕ(t) = et c + 2 e−s s 3 ds , 0 wobei wir von der Freiheit Gebrauch machen, eine uns bequeme Stammfunktion zu wählen. Wertet man das Integral mittels Substitution s 2 = u und partieller Integration aus, so erhält man Zt 2 2 e−s s 3 ds = 0 Z t2 2 ue−u du = 1 − (t 2 + 1)e−t . 0 Also ist 2 ϕ(t) = et c − t 2 − 1, c ∈ R. 2 Ist ein Anfangswert ϕ(t0 ) = x0 gegeben, so wird c = e−t0 (x0 + t02 + 1) . µ 11-c s e p a r i e r b a r e d i fferenzialgleichungen Eine separierbare Differenzialgleichung, auch Differenzialgleichung mit getrennten Variablen genannt, ist von der Form ẋ = g(t)h(x) (6) mit stetigen Funktionen g und h auf Intervallen I respektive J . Ihr Definitionsbereich ist das Rechteck I × J ⊂ R × R in der (t, x)-Ebene. 11 9 289 11 elementare differenzialgleichungen Besonders einfach findet man Lösungen, wenn der Faktor h Nullstellen besitzt. Ist h(x0 ) = 0 für ein x0 ∈ J , so ist die konstante Funktion ϕ ≡ x0 eine Lösung, denn es ist ja ϕ̇(t) = 0 = g(t)h(x0 ) = g(t)h(ϕ(t)). Meistens – aber nicht immer – ist dies auch die einzige Lösung mit diesem Anfangswert. 11.8 Satz Die Funktionen g und h seien stetig. Ist x0 eine Nullstelle von h , so ist die konstante Funktion ϕ ≡ x0 Lösung des Anfangswertproblems ẋ = g(t)h(x), x(t0 ) = x0 . Ist h sogar lipschitz, so ist es auch die einzige Lösung. Ï Y Y Y Y Y Die Existenz dieser Lösung haben wir gerade gezeigt. Um ihre Eindeutigkeit zu zeigen, seien ϕ und ψ zwei Lösungen desselben Anfangswertproblems. Dann gilt Zt t (ϕ − ψ)(t) = (ϕ − ψ) = (ϕ̇ − ψ̇)(s) ds t0 t0 Zt g(s) [h(ϕ(s)) − h(ψ(s))] ds. = t0 Auf einem beliebigen kompakten Intervall [t0 , b] ⊂ I ist g beschränkt, also kgk[t0 ,b] à M . Außerdem ist h auf J lipschitz mit L-Konstante L . Für t0 à t à b gilt also Zt |(ϕ − ψ)(t)| à |g(s)| |h(ϕ(s)) − h(ψ(s))| ds t0 Zt à KL |(ϕ − ψ)(s)| ds. t0 Für die stetige Funktion u = |ϕ − ψ| gilt somit Zt 0 à u(t) à M u(s) ds, t0 t0 à t à b. Dann aber muss u für t0 à t à b identisch verschwinden – siehe Aufgabe 2 – und somit ist dort ϕ = ψ . – Für ein beliebiges kompaktes Intervall [a, t0 ] ⊂ I argumentiert man entsprechend. Y Y Y Y Y 290 11 10 separierbare differenzialgleichungen · 11-5 11-c t3 Nichteindeutigkeit des Anfangswertproblems von Beispiel 11.9 a 11.9 b ¸ Die Lipschitzbedingung ist notwendig. Das Standardbeispiel hierfür ist das Anfangswertproblem p 3 ẋ = 3x 2/3 = 3 x 2 , x(0) = 0. Die Wurzelfunktion x , x 2/3 ist nicht lipschitz im Punkt 0 . Und tatsächlich existiert neben der konstanten Lösung ϕ ≡ 0 unter anderem noch die Lösung ϕ(t) = t 3 , oder allgemeiner 3 (t − a) , ϕ(t) = 0, (t − b)3 , t < a à 0, a à t à b, t>bá0 für jede Wahl von a à 0 à b . µ Die zu den Nullstellen von h gehörenden konstanten Lösungen zerlegen das Rechteck I × J in horizontale Streifen. Ist h lipschitz, so können aus Eindeutigkeitsgründen die übrigen Lösungen von (6) diese Streifen nicht verlassen. Indem wir J geeignet einschränken, können wir daher im Folgenden annehmen, dass h auf J nirgends verschwindet. Angenommen, es existiert nun eine Lösung ϕ in einem solchen Streifen. Dann gilt ϕ̇(t) = g(t). h(ϕ(t)) Also gilt dann auch Zt Zt g(s) ds = t0 t0 (7) ϕ̇(s) ds = h(ϕ(s)) Z ϕ(t) ϕ(t0 ) du . h(u) (8) 11 11 291 11 elementare differenzialgleichungen Drehen wir diese Argumentation um, indem wir von der letzten Gleichung ausgehen, so erhalten wir folgenden Satz. 11.10 Satz Die Funktionen g und h seien stetig auf den Intervallen I respektive J , und h habe keine Nullstelle in J . Dann existiert genau eine lokale Lösung ϕ : I0 → J des Anfangswertproblems ẋ = g(t)h(x), x(t0 ) = x0 , mit t0 ∈ I und x0 ∈ J , und diese erfüllt die Gleichung G(t) = H(ϕ(t)), t ∈ I0 , (9) wobei Zt Zx g(s) ds, G(t) Í H(x) Í x0 t0 du . h(u) Ï Notwendigkeit: Das haben wir gerade gezeigt. Ist ϕ eine lokale Lösung, so gilt (7), da h nirgends verschwindet. Integration von t0 nach t ergibt gemäß (8) Zt Zt Z ϕ(t) ϕ̇(s) du G(t) = g(s) ds = ds = = H(ϕ(t)). h(u) t0 t0 h(ϕ(s)) x0 YYYYY Eindeutigkeit: Da H 0 = 1/h nirgends verschwindet, ist H streng monoton und damit umkehrbar. Gleichung (9) ist somit nach ϕ auflösbar, und es ist ϕ(t) = H −1 (G(t)), t ∈ I0 . (10) Somit ist ϕ , wenn es existiert, auch eindeutig bestimmt. Existenz: Wir nehmen (10) als Definition von ϕ in einer Umgebung von t0 . Dann ist ϕ(t0 ) = H −1 (G(t0 )) = H −1 (0) = x0 . Ferner ist ϕ stetig differenzierbar, und Differenzieren der Gleichung G(t) = H(ϕ(t)) ergibt g(t) = H 0 (ϕ(t))ϕ̇(t) = ϕ̇(t) . h(ϕ(t)) Somit erfüllt ϕ die Differenzialgleichung ϕ̇(t)) = g(t)h(ϕ(t)) . Y Y Y Y Y Bemerkungen a. Der Satz beschreibt die Lösung des Anfangswertproblems nur implizit. Weder die Stammfunktionen G oder H müssen explizit bestimmbar sein, noch ist Gleichung (9) immer nach ϕ auflösbar. b. Sind G und H beliebige Stammfunktionen von g und 1/h , so ist Φ : I × J → R, Φ(t, x) = G(t) − H(x) konstant entlang allen Lösungskurven der Differenzialgleichung (6). Denn die entsprechenden Funktionen des Satzes unterscheiden sich von diesen nur durch 292 11 12 separierbare differenzialgleichungen 11-c additive Konstanten. Es gilt also Φ(t, ϕ(t)) = c für jede Lösung ϕ , wobei c durch die Anfangswerte bestimmt wird. Man sagt, Φ ist eine Erhaltungsgröße oder ein Integral der Differenzialgleichung. Ç In der Praxis löst man separierbare Differenzialgleichungen in etwas salopper, aber einprägsamer Weise wie folgt. Man schreibt ẋ = dx = g(t)h(x) dt und separiert die Variablen zu dx = g(t) dt. h(x) Unbestimmte Integration ergibt Z Z dx = g(t) dt. h(x) Gelingt es, diese Integrale zu bestimmen und nach x aufzulösen, erhält man eine allgemeine Lösung ϕ , die noch von einer Integrationskonstante c abhängt. ¸ Beispiel 1 Die homogene lineare Differenzialgleichung ẋ = a(t)x ist separierbar mit g(t) = a(t) und h(x) = x . Die Funktion h hat eine Nullstelle bei 0 , und da h lipschitz ist, ist die Nulllösung auch die einzige, die den Wert 0 annehmen kann. – Sei jetzt x ≠ 0 . Dann ist Z Z G(t) = g(s) ds = a(s) ds = A(t) eine Stammfunktion von a , und Z Z dx dx H(x) = = = log |x| + c. h(x) x Auflösen der Gleichung H(x) = G(t) ergibt zunächst 2 |x(t)| = eA(t)−c = eA(t) ec , c ∈ R. Den Fall positiver, negativer und verschwindender Lösungen kann man dann zusammenfassen zu x(t) = eA(t) c, c ∈ R. µ 2 Wir schreiben jetzt eine Lösung der Einfachheit halber als x(t) statt ϕ(t) . 11 13 293 11 elementare differenzialgleichungen · 11-6 Lösungen zu ẋ = t/x x t ¸ Beispiel 2 ẋ = Betrachte t , x 0 < t, x < ∞. Rechnen wir informell, so ist also x dx = t dt , Zt 1 s ds = (t 2 − t02 ) = 2 t0 Zx u du = x0 1 2 (x − x02 ). 2 Damit wird x 2 = t 2 − t02 + x02 , oder q x(t) = t 2 + x02 − t02 . Der Definitionsbereich dieser Lösung hängt von den Anfangswerten ab. Für x0 á t0 ist er (0, ∞) , andernfalls müssen wir q t0 > x0 , t > t02 − x02 > 0, vorauszusetzen. µ ¸ Beispiel 3 Betrachte ẋ = ex sin t. Das Richtungsfeld ist periodisch in t mit Periode 2π und symmetrisch zur x-Achse, denn im Punkt (−t, x) hat der Richtungsvektor die Steigung −f (t, x) . 294 11 14 separierbare differenzialgleichungen · 11-7 11-c Lösungen zu ẋ = ex sin t x π −π t Ist daher ϕ(t) eine Lösung, so sind es auch ϕ(t + 2π ), ϕ(−t), wie man leicht nachrechnet. Da ex keine Nullstellen besitzt, können wir direkt zur Separation der Variablen übergehen und erhalten Z Z dx = sin t dt, ex also e−x = cos t + c oder x(t) = − log(cos t + c) mit der Nebenbedingung, dass cos t + c > 0 . Aufgrund unseres Satzes 11.10 sind dies alle Lösungen der Gleichung. Es ist auch jedes Anfangswertproblem x(0) = x0 lösbar mit x(t) = − log(cos t + e−x0 − 1). Diese Lösung existiert für x0 < − log 2 für alle t , und für x0 = − log 2 auf (−π , π ) mit x(t) → ∞ für t → ±π . Für größer werdendes x0 wird dieses Intervall immer kleiner und konvergiert für x0 → ∞ gegen 0 . µ 11 15 295 11 elementare differenzialgleichungen 11-d h o m o g e n e d i f f e renzialgleichungen Eine Differenzialgleichung der Form x ẋ = h t heißt homogene Differenzialgleichung 3 – homogen, weil die rechte Seite invariant ist unter Skalierung beider Koordinaten mit demselben Faktor. Für die Funktion f mit f (t, x) = h (x/t) , gilt also f (λt, λx) = f (t, x), λ > 0. (11) Umgekehrt definiert jede solche Funktion eine Funktion von x/t , denn f (t, x) = f (1, x/t) , t > 0. Bemerkung Allgemeiner heißt eine auf einem Vektorraum definierte Funktion f homogen vom Grad α , falls f (λu) = λα f (u), λ > 0. Pn So ist das homogene Polynom k=0 ak x k y n−k homogen vom Grad n . Ç Eine homogene Differenzialgleichung kann auf eine Differenzialgleichung mit getrennten Variablen zurückgeführt werden. 11.11 Satz Sei h stetig auf einem Intervall I und x0 /t0 ∈ I . Dann ist ϕ : I0 → R eine lokale Lösung des Anfangswertproblems x ẋ = h , x(t0 ) = x0 , (12) t genau dann, wenn ψ : I0 → R, ψ(t) = ϕ(t) t eine lokale Lösung des Anfangswertproblems ż = h(z) − z , t z(t0 ) = x0 t0 darstellt. Ï 3 Nicht zu verwechseln mit der homogenen linearen Differenzialgleichung. 296 11 16 (13) homogene differenzialgleichungen YYYYY 11-d Dann sind zwei einfache Rechnungen. Ist ϕ Lösung von (12), so gilt . ϕ̇ ϕ 1 ϕ ϕ ϕ h(ψ) − ψ = − 2 =h − 2 = , ψ̇ = t t t t t t t sowie ψ(t0 ) = ϕ(t0 )/t0 = x0 /t0 . Also ist ψ Lösung von (13). Ist umgekehrt ψ eine solche Lösung, und definieren wir ϕ durch ϕ(t) = tψ(t) , so gilt ϕ . , ϕ̇ = (tψ) = ψ + t ψ̇ = ψ + (h(ψ) − ψ) = h(ψ) = h t sowie ϕ(t0 ) = t0 ψ(t0 ) = x0 . Also ist ϕ Lösung von (12). Y Y Y Y Y In der Praxis substituiert man in der Differenzialgleichung (12) z= x t – was ja auch naheliegt, denn schließlich ist die rechte Seite eine Funktion von z = x/t . Aus x = tz folgt dann ẋ = z + t ż und damit z + t ż = ẋ = h(z), und das ist die Differenzialgleichung (13). Der Satz sagt also aus, dass diese Rechnung korrekt ist. ¸ Beispiel 1 ẋ = 1 + Die Differenzialgleichung x x2 + 2, t t t ≠ 0, geht durch die Substitution z = x/t über in ż = 1 + z2 , t t ≠ 0. Separation der Variablen ergibt Z Z dz dt arctan z = = = log t + c. 1 + z2 t Dies ergibt z = tan(log t + c) , und durch Rücksubstitution die allgemeine Lösung ϕ(t) = t tan(log t + c) der ursprünglichen Differenzialgleichung. µ Homogene Differenzialgleichungen sind gelegentlich nicht sofort als solche zu erkennen. Hier hilft der Test, ob die rechte Seite invariant ist unter gleichzeitiger Skalierung von x und t . 11 17 297 11 elementare differenzialgleichungen ¸ Beispiel 2 Die Differenzialgleichung √ x + t2 + x2 ẋ = , t > 0, t ist ebenfalls homogen, denn für die rechte Seite gilt f (λx, λt) = f (x, t) für λ > 0 . Für z = x/t erhalten wir √ p zt + t 2 + t 2 z2 = z + 1 + z2 , z + t ż = ẋ = t oder p t ż = 1 + z2 , t > 0. Dies löst man nun wieder mit Separation der Variablen. Aus Z Z p dz dt log z + 1 + z2 = √ = = log t + c 2 t 1+z folgt p z + 1 + z2 = pt, Quadrieren von z − pt = damit zur Lösung ϕ(t) = p2 t 2 − 1 , 2p p = ec > 0. √ 1 + z2 führt schließlich zu 2ptz = p 2 t 2 − 1 und p > 0. Diese lösen die Differenzialgleichung für t > 0 , aber man verifiziert leicht, dass sie die Gleichung für alle t erfüllen. Die Lösungen beschreiben eine Familie von zur x-Achse symmetrischen Parabeln mit Tiefpunkt bei −1/2p , Nullstellen bei −1/p und 1/p und Brennpunkt im Koordinatenursprung. Es handelt sich um eine Familie konfokaler Parabeln. µ 298 11 18 aufgaben · 11-8 11 Konfokale Parabeln x t aufgaben 1 Zeigen Sie, dass der Raum L = ϕ0 + L0 = {ϕ0 + eA(t) c : c ∈ R} von Korollar 11.5 unabhängig ist von der Wahl der Stammfunktion A und der partikulären Lösung ϕ0 . 2 Für die stetige Funktion u : [0, T ] → [0, ∞) gebe es eine Konstante M á 0 , so dass Zt u(t) à M u(s) ds, 0 à t à T. 0 Dann ist u ≡ 0 . Hinweis: Zeige, dass v mit v(t) = e−Mt 3 Rt 0 u(s) ds monoton fällt. Bestimmen Sie sämtliche Lösungen der Differenzialgleichung a. ẋ + x sin t = sin 2t , b. ẋ − 3x tan t = 1 . 11 19 299 300 11 20 literatur literatur [ae] H. Amann & J. Escher, Analysis 1. Birkhäuser, 1. Auflage 1998. [bf] M. Barner & F. Flohr, Analysis 1. de Gruyter, 5. Auflage 2000. [hi] S. Hildebrandt, Analysis 1. Springer, 1. Auflage 2002. [kö] K. Königsberger, Analysis 1. Springer, 6. Auflage 2004. [ww] W. Walter, Gewöhnliche Differentialgleichungen. Springer, 7. Auflage 2000. 301 index index Abbildung, 21 konstante, 24 allgemeine leere, 24 Dreiecksungleichung, 62 stetige, 139 Rekursion, 63 Abelsche partielle Summation, 132 Abelscher Grenzwertsatz, 228 Abelsches Konvergenzkriterium, 133 abgeleitete Menge, 154 abgeschlossene Summe, 61 allgemeiner Zwischenwertsatz, 145 allgemeines Kommutativgesetz, 61 Produkt, 61 alternierende harmonische Reihe, 123, 129 Reihe, 128 Kugel, 154 An , 67 Menge, 153 analytisch abgeschlossenes Intervall, 48 Ableitung, 204 reell, 226 Anfangswert, 232, 285 Anfangswerte, 237 erste, 198 Anfangswertproblem, 232, 285 linksseitige, 210 Anfangszeit, 285 rechtsseitige, 210 angeordneter zweite, 217 Körper, 37, 38 Abschluss, 154 Ankathete, 241 absolut Anzahl, 67 konvergent, 263 absolut konvergente Reihe, 122 Absolutintegral, 263 Approximationsfehler, 198, 221 Approximationssatz, 47 erweiterter, 104 von Weierstraß, 276 Absolutreihe, 122 äquivalent, 11 abzählbar unendliche äquivalente Menge, 67 abzählbare Menge, 67 Addition, 34 Axiome der, 34 additiv Inverses, 34 affine Funktion, 199 302 Algebra, 204 Norm, 162 Archimedes Prinzip des, 59 archimedisch angeordneter Körper, 60 Arcuscosinus, 243 Arcussinus, 243 Arcustangens, 243 Areacosinus hyperbolicus, 251 index Areasinus hyperbolicus, 251 Betrag, 40, 80 Areatangens hyperbolicus, 251 Betragsfunktion, 200 Argument, 248 Betragsnorm, 105 assoziative bijektiv, 26 Operation, 25 auf D stetig, 138, 139 auf I differenzierbar, 204 Aussage, 8 Bild, 22 Bildpunkt, 21 bilineare Form, 106 binäre Operation, 25 Aussageform, 16 Binomialkoeffizient, 218, 223 Auswahlfolge, 96 binomische Automorphismus, 79 Formel, 74, 223 autonome Reihe, 225 Differenzialgleichung, 284 axiomatische Methode, 37 Axiome, 10 Axiome der Addition, 34 Multiplikation, 34 binomischer Koeffizient, 73 Bogenmaß, 241 Bolzano, 97 Zwischenwertsatz von, 144 Bolzano-Weierstraß Satz von, 97 Borel, 191 B(D), 174 Bunjakowski, 106 Banachalgebra, 130 Banachraum, 111 C, 78 bedingt konvergente C(D), 141, 176 Reihe, 122 C 1(I), 204 Bernoullische Cantor, 14 Ungleichung, 56 beschränkt Cauchy, 98, 106, 268 Restglied von, 228 nach oben, 43 Cauchyfolge, 98, 110 nach unten, 43 Cauchyintegral, 186, 194 beschränkte Folge, 88 beschränkter Operator, 130 Cauchykriterium, 99, 121, 262 für Funktionsgrenzwerte, 166 Cauchyungleichung, 52, 106 CB(D), 174 Beschränktheitssatz, 88 CB(R), 270 besitzt einseitige Grenzwerte, 190 Charakterisierung bestapproximierende Gerade, 198 bestimmtes Integral, 213 offener Mengen, 156 Charakterisierung von Häufungs- und Grenzwert, 101 charakteristische 303 index Funktion, 24 Reihe, 120 CI(R), 270 Doppelkomplementgesetz, 18 cis, 247 doppelte Cosinus, 237 hyperbolicus, 250 C r (I), 218 C ∞(I), 218 Negation, 11 Dreiecksungleichung, 40, 80, 105, 189 allgemeine, 62 umgekehrte, 41, 105 Durchschnitt, 17 Darstellung kartesische, 248 de Morgan Regeln von, 11, 18, 153 dedekindscher Schnitt, 42 Definitheit, 105, 106 Definition punktweise, 31 komplexe, 78 echte Inklusion, 16 Eigenschaft lokale, 137 Eindeutigkeitssatz, 88, 237 Definitionsbereich, 21 Einheitskugel, 159 dehnungsbeschränkt, 143 Einheitssphäre, 159 δ → Dirichletfunktion, 138 Einheitswurzel, 249 Dickicht, 216 Einschliessungssatz, 115 Differenz, 17 Einschränkung, 24 Differenzialgleichung Element, 14, 15 autonome, 284 erster Ordnung, 282 homogene, 296 nichtautonome, 284 separierbare, 289 differenzierbar, 204 auf I, 204 im Punkt, 198 stetig, 204 maximales, 58 minimales, 58 endliche Menge, 67 Teilüberdeckung, 191 Endpunkt linker, 48 rechter, 48 entwickelbar, 224 Differenzierbarkeitskriterium, 200 Entwicklungskriterium, 225 Differenzierbarkeitssatz, 199 Entwicklungspunkt, 221, 224 Diracfolge, 273 ε-Schlauch, 173 Dirichletfunktion, 138, 167 Erhaltungsgröße, 293 Dirichletsches erste Konvergenzkriterium, 133 Distributivgesetz, 11, 18, 34 divergent, 88 divergente Folge, 88 304 e, 94, 235 Ebene Ableitung, 198 erster Ordnung Differenzialgleichung, 282 lineare Differenzialgleichung, 286 erweiterte index Zahlengerade, 47 erweiterter Approximationssatz, 104 Satz von Bolzano-Weierstraß, 104 Satz von der monotonen Konvergenz, 104 Erweiterungskörper, 75 euklidische Norm, 107 Eulersche Formel, 246 Gleichung, 247 Zahl, 96, 235 Exponenzial, 130 Exponenzialfunktion, 232 vektorwertige, 109 Folgenkriterium, 140 für Grenzwerte, 166 Form bilineare, 106 formale Reihe, 120 Formel binomische, 74, 223 Eulersche, 246 Formeln von Moivre, 247 fortgesetzte Funktion, 170 Fortsetzung stetige, 170 Exponenzialreihe, 128 Fraenkel, 14 Extrema, 205 Fundamentalsatz der Algebra, 81 Extremstellen, 205 Funktion, 21 affine, 199 F, 34 charakteristische, 24 F (D), 172 fortgesetzte, 170 Fakultät, 60 glatte, 273 fallend integrierbare, 188 streng monoton, 146 monoton fallende, 146 falsch, 8 monoton steigende, 146 Faltung, 270 stückweise stetige, 193 Faltungsoperator, 271 stetige, 136 fast alle, 100 Funktional, 186 Fehlerschranke, 86 Funktionalgleichung Fermat Satz von, 205 der Exponenzialfunktion, 233 des Logarithmus, 230 Fibonacchifolge, 64 Funktionsgrenzwert, 165 Folge, 25, 85 Funktionswert, 21 beschränkte, 88 divergente, 88 Gammafunktion, 266 Fibonacchi, 64 ganze komplexe, 110 Zahlen, 64 konvergente, 108 Gaußklammer, 65, 168 monoton fallende, 95 Gegenkathete, 241 monoton steigende, 95 genau-dann-wenn, 9 reelle, 86 geometrische uneigentlich konvergente, 102 Reihe, 123 305 index Summe, 62 geordnetes Paar, 20 Gerade bestapproximierende, 198 glatte Funktion, 273 Polynom, 296 Homogenität positive, 105 Hyperbelfunktion, 250 hyperbolicus Cosinus, 250 Sinus, 250 gleich, 15, 23 Tangens, 251 gleichmäßige Hypotenuse, 241 Konvergenz, 173 gleichmächtig, 66 Identität, 24 Gleichung im Punkt Eulersche, 247 Grad, 141 Graph, 22 Grenzwert, 86, 165 differenzierbar, 198 stetig, 136, 139 unstetig, 137 Imaginärteil, 76 linksseitiger, 168 impliziert, 10 rechtsseitiger, 168 Indexschranke, 86 uneigentlicher, 102, 169 Induktion Grenzwertgleichung, 90 für Linearkombination, 109 Grenzwertsatz, 90 Abelscher, 228 Grenzwertungleichung, 92 vollständige, 54 Induktionsanfang, 55 Induktionsprinzip, 55 variiertes, 57 Induktionsschritt, 55 induktive Häufungs- und Grenzwert Charakterisierung von, 101 Häufungspunkt, 154 Operatornorm, 130 Häufungswert, 100 Infimum, 43 halboffenes inhomogen, 286 Intervall, 48 harmonische Reihe, 122 harmonische Reihe alternierende, 123, 129 Hauptzweig, 243 Heine, 191 homogen, 286 vom Grad α, 296 homogene Differenzialgleichung, 296 homogenes 306 Menge, 54 induzierte injektiv, 26 Inklusion echte, 16 innere Verknüpfung, 25 innerer Punkt, 155 Integral, 185, 188, 293 bestimmtes, 213 unbestimmtes, 213 uneigentliches, 261, 262 Integralnotation index Leibnizsche, 213 Integration partielle, 214 integrierbare Funktion, 188 Intervall, 48 abgeschlossenes, 48 halboffenes, 48 Kommutativgesetz allgemeines, 61 kompakte Menge, 159 Komplement, 18 komplex konjugierte Zahl, 79 komplexe links abgeschlossenes, 48 Ebene, 78 links offenes, 48 Folge, 110 nichtentartetes, 198 offenes, 48 rechts abgeschlossenes, 48 rechts offenes, 48 Konjugation, 78 komplexe Zahlen Körper der, 78 Komponente, 20, 24 Intervalladditivität, 188 Komposition, 26 Intervallschachtelung, 71, 73 konfokale Inverses additiv, 34 multiplikativ, 34 isomorph, 49 Parabeln, 298 Konjugation komplexe, 78 konstant, 86 konstante K, 34 Körper, 34 angeordneter, 37, 38 archimedisch angeordneter, 60 der komplexen Zahlen, 78 vollständiger, 42 Körperaxiome, 34 Kardinalität, 67 kartesische Darstellung, 248 kartesisches Produkt, 20, 25 Kern offener, 156 Abbildung, 24 Kontradiktion, 10 konvergent, 86 absolut, 263 konvergente Folge, 108 Reihe, 120 Konvergenz gleichmäßige, 173 punktweise, 172 Konvergenzkriterium Abelsches, 133 Dirichletsches, 133 Raabesches, 132 Kettenregel, 202 konvex, 116 Koeffizient konvexe binomischer, 73 Komlement relatives, 17 kommutative Operation, 25 Umgebung, 116 Konvolution, 270 Koordinate, 24 kritischer Punkt, 206 307 index Kugel abgeschlossene, 154 offene, 107, 151 Lösung, 285 lokales Maximum, 205 Minimum, 205 l’Hospital Regel von, 258, 259 Länge, 49 Lösung, 282 lokale, 285 Lagrange, 288 Restglied von, 223 leere Majorante, 125 Majorantenkriterium, 89, 125, 263 mathematische Notation, 281 maximales Element, 58 Abbildung, 24 Maximalstelle, 149, 205 Menge, 15 Maximum, 149 Leibnizkriterium, 129 Leibnizsche Integralnotation, 213 Lemma Riemannsches, 193 lokales, 205 Maximumsnorm, 105 Menge, 14 abgeleitete, 154 abgeschlossene, 153 Limes inferior, 117 abzählbar unendliche, 67 Limes superior, 117 abzählbare, 67 lineare Differenzialgleichung endliche, 67 erster Ordnung, 286 induktive, 54 Linearität, 106 kompakte, 159 linker leere, 15 Endpunkt, 48 links abgeschlossenes Intervall, 48 links offenes Intervall, 48 linksseitig stetig, 196 linksseitige Ableitung, 210 linksseitiger Grenzwert, 168 offene, 150 Mengenabbildung, 31 Mengensystem, 19 Mengentafel, 19 Metaausage, 10 Methode axiomatische, 37 minimales Element, 58 Minimalstelle, 149, 205 Minimum, 149 Lipschitzkonstante, 143 lokales, 205 lipschitzstetig, 143 striktes lokales, 205 Logarithmus natürlicher, 230 lokale Eigenschaft, 137 308 M, 35 Minorantenkriterium, 125 Mittelwertsatz, 207, 208 der Integralrechnung, 189 verallgemeinerter, 259 index mittlere Steigung, 207 Moivre Formeln von, 247 monoton steigend, 95 monoton fallende Folge, 95 Funktion, 146 monoton steigende nichtpositiv, 38 Norm, 105 äquivalente, 162 euklidische, 107 natürliche, 107 normierter Raum, 105 Notation mathematische, 281 physikalische, 281 Folge, 95 Nullfolge, 87 Funktion, 146 Nullfolgenkriterium, 121 monotone Konvergenz, 95 Nullfolgensatz, 89 Monotoniesatz, 208 Nullpolynom, 141 Multiplikation, 34 Nullstelle, 144 Axiome der, 34 multiplikativ Inverses, 34 N, 54 nach oben beschränkt, 43 nach unten beschränkt, 43 natürliche Norm, 107 Zahlen, 54 natürlicher Logarithmus, 230 Nebenzweig, 243 Negation doppelte, 11 negativ, 38 neutrales Element der Addition, 34 der Multiplikation, 34 nicht, 9 nichtautonome Differenzialgleichung, 284 nichtentartetes Nullstellenmenge, 159 Nullstellensatz, 144 nullteilerfrei, 36 obere Schranke, 43 oder, 8 offen in E, 152 relativ, 157 offene Kugel, 107, 151 Menge, 150 offener Kern, 156 offenes Intervall, 48 Operation assoziative, 25 binäre, 25 kommutative, 25 Operator, 271 beschränkter, 130 Operatornorm induzierte, 130 Intervall, 198 nichtnegativ, 38 Paar 309 index geordnetes, 20 Parabeln konfokale, 298 R, 43 Raabesches Konvergenzkriterium, 132 Partialsumme, 120 Rand, 156 partielle rationale Integration, 214 Permanenzsatz, 187 physikalische Notation, 281 Zahlen, 65 Raum normierter, 105 reeller, 25 Polardarstellung, 248 Realteil, 76 Polynom, 141 rechter homogenes, 296 positiv, 38 Positivbereich, 37 positive Homogenität, 105 Potenz, 61 Potenzmenge, 19 prim, 8 Primzahlzwilling, 8 Prinzip des Archimedes, 59 Produkt allgemeines, 61 kartesisches, 20, 25 Produktregel, 200 Punkt innerer, 155 kritischer, 206 stationärer, 206 punktierte Umgebung, 165 punktweise Endpunkt, 48 rechts abgeschlossenes Intervall, 48 rechts offenes Intervall, 48 rechtsseitig stetig, 168, 196 rechtsseitige Ableitung, 210 rechtsseitiger Grenzwert, 168 reell analytisch, 226 reelle Folge, 86 Zahlen, 34 reeller Raum, 25 Regel von der doppelten Negation, 11 l’Hospital, 258, 259 Regelfunktion, 187 Definition, 31 Regelintegral, 186, 194 Konvergenz, 172 Regeln von de Morgan, 11, 18, 153 Reihe, 120 Q, 65 im Banachraum, 129 Quadratwurzel, 45 absolut konvergente, 122 Quotientenkriterium, 128 alternierende, 128 verallgemeinertes, 132 Quotientenregel, 200 310 alternierende harmonische, 129 bedingt konvergente, 122 index binomische, 225 Schlömilch divergente, 120 Restglied von, 228 geometrische, 123 Schmiegepolynom, 222 harmonische, 122 Schnecke, 133 konvergente, 120 Schnitt umgeordnete, 124 dedekindscher, 42 Schnittzahl, 42 Rekursion allgemeine, 63 Schranke obere, 43 relativ offen, 157 untere, 43 relative Schrankensatz, 208 Umgebung, 157 verbesserter, 226 relatives Schwarz, 106 Schwingungsgesetz, 229 Komlement, 17 Restglied, 221 Schwingungsgleichung, 237 Restglied von separierbare Cauchy, 228 Differenzialgleichung, 289 Lagrange, 223 Signumfunktion, 138, 173, 212 Schlömilch, 228 Sinus, 237 hyperbolicus, 250 Restgliedformel, 221 Richtungsfeld, 282 Skalarprodukt, 105 Riemannscher Sprunghöhe, 169 Umordnungssatz, 125 stückweise stetige Funktion, 193 Riemannsches Stammfunktion, 210 Lemma, 193 Ring mit Eins, 64, 83 Stammfunktionensatz, 211 Rn , 25 Standardskalarprodukt, 107 Rolle stationärer Punkt, 206 Satz von, 206 Russell, 14 steigend monoton, 95 streng monoton, 95, 146 Satz strikt, 95 über stetige Fortsetzung, 170 über stetige Umkehrfunktionen, 147 Steigung mittlere, 207 vom Maximum, 58 stetig, 138 vom Minimum, 58 vom Minimum und Maximum, 149 auf D, 138, 139 von Bolzano-Weierstraß, 97 differenzierbar, 204 von Bolzano-Weierstraß im R , 110 im Punkt, 136, 139 von der absoluten Konvergenz, 122 linksseitig, 196 von Fermat, 205 rechtsseitig, 168, 196 n von Rolle, 206 stetige 311 index Abbildung, 139 Fortsetzung, 170 Funktion, 136 streng monoton fallend, 146 überabzählbare Menge, 67 Überdeckungslemma, 191 Umgebung, 100, 107 konvexe, 116 fallende Folge, 95 punktierte, 165 steigend, 95, 146 relative, 157 strikt steigend, 95 striktes lokales Minimum, 205 umgekehrte Dreiecksungleichung, 41, 105 umgeordnete Reihe, 124 Substitutionsregel, 215 Umkehrabbildung, 27 Summation Umkehrregel, 202 Abelsche partielle, 132 Summe allgemeine, 61 geometrische, 62 Summennorm, 105 Summenregel, 200 Umkehrsatz, 209 Umordnung, 124 Umordnungssatz, 124 Riemannscher, 125 unbestimmtes Integral, 213 Supremum, 43 und, 8 Supremumsnorm, 112, 174, 270 uneigentlich konvergente surjektiv, 26 Folge, 102 Symmetrie, 106 uneigentlicher Tangens, 242 uneigentliches Grenzwert, 102, 169 hyperbolicus, 251 Integral, 261, 262 Tangente, 198 ∞, 47 τ → Thomaefunktion, 178 unendlich viele, 100 Tautologie, 10 Unfug, 107 Taylorreihe, 224 Ungleichung Teilüberdeckung endliche, 191 Teilfolge, 96 Teilmenge, 16 Thomaefunktion, 178 Bernoullische, 56 unstetig im Punkt, 137 untere Schranke, 43 Träger, 269 Unterkörper, 78 Trennungseigenschaft, 107 Urbild, 21, 31 Treppenfunktion, 184 E-wertige, 194 Trichotomie, 38 Tripel, 20 Tupel, 24 312 Variation der Konstanten, 288 variiertes Induktionsprinzip, 57 Vektorraum index vollständiger, 111 vektorwertige Folge, 109 verallgemeinerter Mittelwertsatz, 259 verallgemeinertes Approximationssatz von, 276 wenn-dann, 9 Wert, 120 Wertebereich, 21 Widerspruch, 10 Wurzel, 45 Quotientenkriterium, 132 Wurzelfunktion, 148, 168, 200 Wurzelkriterium, 132 Wurzelkriterium, 127 verbesserter verallgemeinertes, 132 Schrankensatz, 226 Verdichtungskriterium, 126 Z, 64 Vereinigung, 17 Zahl Verfeinerung, 184 Verknüpfung innere, 25 Verschmelzungsgesetz, 18 Eulersche, 96, 235 komplex konjugierte, 79 Zahlen ganze, 64 Vertauschungsatz, 190 natürliche, 54 vollständige rationale, 65 Induktion, 54 vollständiger Körper, 42 Vektorraum, 111 reelle, 34 Zahlenfolgen, 85 Zahlengerade erweiterte, 47 Vollständigkeitsaxiom, 42 Zahlenreihe, 120 vom Grad α Zerlegung, 42, 184 homogen, 296 Vorzeichenfunktion, 138, 168 Zermelo, 14 Zetafunktion, 126 zweite Wachstumsgesetz, 229, 284 wahr, 8 Ableitung, 217 Zwischenwertsatz, 227 Wahrheitstafel, 8 allgemeiner, 145 Weierstraß, 97 von Bolzano, 144 313 bezeichnungen bezeichnungen Zahlbereiche N = {1, 2, 3, . . .} id Identitätsabbildung P Menge der Primzahlen Re Realteil K Körper Im Imaginärteil R̄ = R ∪ {−∞, ∞} sgn Vorzeichenfunktion K∗ = K Ø {0} [·] Gaussklammer R∗ = R Ø {0} χ charakteristische Funktion C∗ = C Ø {0} σ komplexe Konjugation An = {1, 2, . . . , n} δ Dirichletfunktion A0 = ∅ τ Thomaefunktion Γ Gammafunktion ζ Zetafunktion Mengen (a, b) = {t ∈ R : a < t < b } Br (a) = {x ∈ E : kx − akE < r } B̄r (a) = {x ∈ E : kx − akE à r } |·| Betrag Uδ (a) = Bδ (a) |I| Länge eines Intervalls U̇δ (a) = Uδ (a) Ø {a} |M| Kardinalität von M = {x ∈ E : 0 < kx − akE < r } k·k = (1/ε, ∞) kxk1 Uε (∞) Beträge und Normen Norm S = {a ∈ E : kakE = 1} kxke = x1 + · · · + xn p = |x1 |2 + · · · + |xn |2 B = {a ∈ E : kakE à 1} kxk∞ = max {|x1 | , . . . , |xn |} kf kD = supx∈D kf (x)k kf k∞ = sup−∞<t<∞ |f (t)| R∞ = −∞ |f (t)| dt Topologische Begriffe ∅ leere Menge Ac Komplement von A A0 abgeleitete Menge kf k1 Räume A− Abschluss von A c Folgenraum A◦ offener Kern von A c0 Unterraum von c ∂A Rand von A Etc f+ (a) f– (a) F (D) = {f : D → R } C(D) = {f ∈ F (D) stetig} CB(D) = {f ∈ C(D) beschränkt} = limt a f (a) = limt a f (a) A<c a a < c, a ∈ A A<B a A < b, b ∈ B an c a fast alle an > c 314 Funktionen CI(R) = {f ∈ C(R) integrierbar} C r (I) = {f ∈ C(I) r -mal stetig diff’bar} C ∞ (I) = {f ∈ C(I) unendlich oft diff’bar} C ω (I) = {f ∈ C(I) reell analytisch} bezeichnungen Symbole ∼ gleichmächtig i imaginäre Einheit e Eulersche Zahl z̄ komplex konjugiertes z von links gegen von rechts gegen % gleichmäßig gegen ∗ Faltungsoperator h·, ·i Skalarprodukt P Potenzmenge Bkn Binomialkoeffizient f (r ) r -te Ableitung Tan f n-tes Taylorpolynom in a Ran f Restglied zu Tan f Ta f Taylorreihe in a 315 mehr aufgaben mehr aufgaben 1 Sei f ∈ C ∞(R) , und es gebe entweder (i) ein M á 0 , so dass kf (r ) kR à M, r á 0, oder (ii) ein r > 0 , so dass f (r ) = f , oder (iii) ein r > 0 und reelle Zahlen a0 , . . . , ar −1 , so dass f (r ) = a0 f + a1 f 0 + · · · + ar −1 f (r −1) . Dann gilt T0 f = f auf ganz R . 2 Ist (an )ná0 eine reelle oder komplexe Folge, so heißt X fa (z) = an z n ná0 die zugehörige reelle respektive komplexe Potenzreihe. Beweisen Sie die folgenden Aussagen, die gleichermaßen im Reellen wie im Komplexen gelten. a. Konvergiert fa im Punkt w , so konvergiert fa absolut und gleichmäßig auf jeder abgeschlossenen Kugel B̄ρ (0) mit ρ < |w| . b. Divergiert fa im Punkt w , so divergiert fa außerhalb der Kugel B̄ρ (0) mit ρ = |w| . c. Es gibt genau ein r mit 0 à r à ∞ , so dass fa in Br (0) konvergiert und außerhalb von B̄r (0) divergiert. Dies ist der Konvergenzradius der Potenzreihe fa . d. Für den Konvergenzradius gilt die Formel von Hadamard, r = 1 p . lim supná0 n |an | Hinweis: Zum lim sup siehe Aufgabe 4.28. 3 Sei X eine beliebige Menge und f : X → [0, ∞) eine beliebige Funktion. Gibt es ein M á 0 , so dass X f (x) à M x∈Y für jede endliche Teilmenge Y ⊂ X , so ist {x ∈ X : f (x) > 0} abzählbar. 4 Zeigen Sie, dass P `1 Í a = (an )ná0 : ná0 |an | < ∞ ¯ einen Unterraum des Raumes c0 von Abschnitt 4-h bildet. Auf ihm definiert X kak1 Í |an | ¯ ná0 eine Norm, mit der `1 ein Banachraum wird. 316 mehr aufgaben 5 Beweisen Sie die Ungleichung nn nn+1 < n! < n−1 , n−1 e e Pn indem Sie log n! = k=1 log k durch ein Integral abschätzen. 317