Analysis Carsten Schütt February 1, 2015 2 Contents 1 Einführung . . . . . . . . . . . . . . . . . Mathematische Logik . . . . . . . . . . . . Das Axiomensystem von Zermelo-Fraenkel Relation und Ordnung . . . . . . . . . . . Die natürlichen Zahlen N . . . . . . . . . . Die ganzen Zahlen Z . . . . . . . . . . . . Die rationalen Zahlen Q . . . . . . . . . . Körper . . . . . . . . . . . . . . . . . . . . Supremum und Infimum . . . . . . . . . . Mathematische Induktion . . . . . . . . . Mächtigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 14 19 23 26 31 31 32 36 37 43 reellen Zahlen Dedekind Schnitt . . . . . . . . . . . . Folgen in R . . . . . . . . . . . . . . . R ist vollständig . . . . . . . . . . . . . Differenzengleichungen . . . . . . . . . Limes Superior und Limes Inferior . . . Reihen in R . . . . . . . . . . . . . . . Reihen Produkt Satz von Cauchy . . . Umordnungsatz von Riemann . . . . . Das Problem von Basel . . . . . . . . . p-adische Entwicklungen reeller Zahlen Kettenbrüche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 52 60 68 81 87 92 104 109 112 113 121 3 Funktionen einer reellen Veränderlichen 3.1 Stetigkeit . . . . . . . . . . . . . . . . . . . . 3.2 Gleichmäßige Stetigkeit . . . . . . . . . . . . . 3.3 Monotone Funktionen und Umkehrfunktionen 3.4 Potenz, Exponentialfunktion und Logarithmus 3.5 Differenzierbare Funktionen . . . . . . . . . . 3.6 Der Satz von Rolle und der Mittelwertsatz . . 3.7 Lokale Extrema . . . . . . . . . . . . . . . . . 3.8 Satz von Taylor und Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 129 142 144 146 157 167 177 178 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.10 1.11 2 Die 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 3 . . . . . . . . . . . . . . . . . . . . . . 4 CONTENTS 3.9 3.10 3.11 3.12 3.13 Potenzreihen . . . . . . . . . . . . Die trigonometrischen Funktionen Die Formel von L’Hôpital . . . . Gleichmäßige Konvergenz . . . . Unstetige Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Metrische Räume 4.1 Metrische Räume . . . . . . . . . . . . . 4.2 Vervollständigung metrischer Räume . . 4.3 Normierte Räume . . . . . . . . . . . . . 4.4 Stetige Abbildungen zwischen metrischen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Räumen . . . . . . . . . . . . . . . . . . 5 Integralrechnung 5.1 Integralrechnung . . . . . . . . . . . . . . . . . . . . 5.2 Riemannsche Summen . . . . . . . . . . . . . . . . . 5.3 Riemann-messbare Mengen und die Cantor-Menge . . 5.4 Hauptsatz der Differential- und Integralrechnung . . . 5.5 Substitution und partielle Integration . . . . . . . . . 5.6 Mittelwertsatz der Integralrechnung . . . . . . . . . . 5.7 Uneigentliche Integrale . . . . . . . . . . . . . . . . . 5.8 Gammafunktion . . . . . . . . . . . . . . . . . . . . . 5.9 Bogenlänge . . . . . . . . . . . . . . . . . . . . . . . 5.10 Die trigonometrischen Funktionen . . . . . . . . . . . 5.11 Das Produkt von Wallis . . . . . . . . . . . . . . . . 5.12 Partialbruchzerlegung . . . . . . . . . . . . . . . . . . 5.13 Integralkriterium für Reihen . . . . . . . . . . . . . . 5.14 Unendliche Produkte . . . . . . . . . . . . . . . . . . 5.15 Die Formel von Stirling . . . . . . . . . . . . . . . . . 5.16 Der Satz von Taylor und Taylorreihen . . . . . . . . . 5.17 Gleichmäßige Konvergenz und Integral . . . . . . . . 5.18 Rationale, irrationale, algebraische und transzendente 6 Funktionen mehrerer reeller Variablen 6.1 Zusammenhängende Mengen im Rn . . 6.2 Richtungsstetigkeit, Richtungsableitung 6.3 Differenzierbarkeit im Rn . . . . . . . . 6.4 Partielle Ableitungen höherer Ordnung 6.5 Abbildungen vom Rn in den Rm . . . . 6.6 Kettenregel . . . . . . . . . . . . . . . 6.7 Mittelwertsatz . . . . . . . . . . . . . . 6.8 Der Satz von Taylor . . . . . . . . . . 6.9 Bogenlänge . . . . . . . . . . . . . . . 6.10 Extremwerte . . . . . . . . . . . . . . . 6.11 Umkehrabbildungen . . . . . . . . . . . 6.12 Implizite Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . und Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 194 200 208 217 . . . . 219 . 219 . 226 . 226 . 233 . . . . . . . . . . . . . . . . . . 239 . 239 . 251 . 252 . 264 . 270 . 271 . 272 . 274 . 277 . 281 . 287 . 290 . 290 . 294 . 295 . 301 . 303 . 312 . . . . . . . . . . . . 321 . 321 . 329 . 331 . 339 . 343 . 345 . 347 . 349 . 352 . 357 . 371 . 380 CONTENTS 5 6.13 Lagrangesche Multiplikatoren . . . . . . . . . . . . . . . . . . . . . . 386 6.14 Differentiation in Banachräumen . . . . . . . . . . . . . . . . . . . . . 389 6.15 Equidistribution theorem . . . . . . . . . . . . . . . . . . . . . . . . . 391 7 Integration im Rn 7.1 Iterierte Integrale . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Riemann-Integral auf beschränkten Mengen . . . . . . . . . 7.3 Das Maß von Mengen . . . . . . . . . . . . . . . . . . . . . . 7.4 Berechnung von Integralen . . . . . . . . . . . . . . . . . . . 7.5 Transformationsformel für Integrale . . . . . . . . . . . . . . 7.6 Unstetigkeitsmengen von Funktionen und ihren Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393 396 402 403 409 410 415 6 CONTENTS Chapter 1 1.1 Einführung Wie man studiert Sie sollten nur ein Fach studieren, das Ihnen auch gefällt. Wir wollen in der Vorlesung drei Dinge lernen: 1. Die mathematische Sprache Hier lernen wir, was ein Beweis ist und wie er aufgeschrieben wird. 2. Methoden zur Lösung von Problemen Hier lernen Sie Standardmethoden zum Bearbeiten von mathematischen Problemen kennen. Sie lernen, Probleme zu analysieren. 3. Ergebnisse der Mathematik Sie werden sehr bald feststellen, dass der Arbeitsumfang sehr groß ist. Dies trifft für Ihr Studium im Allgemeinen wie auch insbesondere für diese Vorlesung zu. Sie werden Ihr Studium nur dann bewältigen, wenn Sie kontinuierlich arbeiten. Um sicher zu stellen, dass Sie auch kontinuierlich arbeiten, werden jede Woche Übungsaufgaben ausgeben. Diese Übungsaufgaben werden in den Übungsgruppen besprochen. Im Laufe der Wochen werden Sie so mit einer großen Zahl von Beispielen vertraut. Das Verständnis vom Stoff hängt davon ab, ob man Beispiele kennt. Es ist besser, in kleinen Gruppen zu arbeiten. Ich möchte stark davon abraten, allein zu arbeiten. Wenn Sie mit anderen zusammen arbeiten, werden Sie anderen Ihre Überlegungen und Ideen erläutern. Dies ist ein guter Weg, die die eigenen Gedanken und Argumente zu überprüfen. In der Vorlesung werden Beispiele vorgerechnet. Die Aufgaben sind häufig ähnlich, manchmal dienen sie als Vorlage. Jede Woche werden Übungsaufgaben ausgegeben, die innerhalb einer Woche zu bearbeiten sind. Besprochen werden die Aufgaben in den Übungsgruppen. Sie müssen sich selbst beim Studium einbringen, Sie müssen die Initiative ergreifen. Das Studium der Mathematik ist sicherlich schwer, es bringt aber auch viel Spaß. 7 8 CHAPTER 1. Neben Lehrbüchern steht auch Software zum Erarbeiten des Stoffes zur Verfügung. Mathematica und Maple sind sehr zu empfehlen, wobei ich Mathematica den Vorzug gebe. Es ist aber nicht notwendig, einen Computer und diese Software zur Verfügung zu haben. Sie können den Vorlesungsstoff auch ohne diese Dinge bewältigen. Außerdem möchte ich Sie auf das Textverarbeitungssysten TEX aufmerksam machen. Mit diesem System können Sie mathematische, physikalische und chemische Texte schreiben. Die Software ist frei im Internet erhältlich. Wenn Sie sich mit mir unterhalten wollen, können Sie dies z.B. direkt im Anschluss an die Vorlesung tun, oder aber auch in meiner Sprechstunde. Wir können auch einen Gesprächstermin vereinbaren. Falls Sie meinen, dass Sie im Studium Probleme haben, sollten Sie mit mir sprechen. Literatur • G. Berendt und E. Weimar: Mathematik für Physiker, VCH • J. Dieudonne: Grundlagen der modernen Analysis, • K.Endl und W. Luh: Analysis I,II, Akademische Verlagsgesellschaft, Wiesbaden • F. Erwe: Differential- und Integralrechnung I,II, BI Hochschultaschenbücher • G.M. Fichtenholz: Differential- und Integralrechnung I,II,III, VEB Deutscher Verlag der Wissenschaften, Berlin • H. Fischer und H. Kaul: Mathematik für Physiker, B.G. Teubner, Stuttgart • O. Forster: Analysis 1,2, vieweg studium, Braunschweig/Wiesbaden • W. Grauert und I. Lieb: Differential- und Integralrechnung I, Springer-Verlag • W. Grauert und W. Fischer: Differential- und Integralrechnung II, SpringerVerlag • H. Heuser: Lehrbuch der Analysis, Teil 1 und 2, B.G. Teubner, Stuttgart • S. Lang: Analysis I,II, Addison-Wesley • von Mangoldt und Knopp: Einführung in die höhere Mathematik, S. Hirzel Verlag, Stuttgart • W. Smirnow: Lehrgang der höheren Mathematik, VEB Deutscher Verlag der Wissenschaften, Berlin • M. Spiegel: Advanced Calculus, Schaum’s Outline Series. McGraw Hill • W. Walter: Analysis I,II,Springer-Verlag 1.1. EINFÜHRUNG 9 Prüfungen, Klausuren und Übungen Am Ende des Semesters findet eine Klausur statt. Diese Klausur wird auch am Beginn des darauffolgenden Semesters angeboten. Danach wird diese Klausur erst ein Jahr später angeboten. Sie erhalten die Zulassung zur Klausur, wenn Sie hinreichend viele Aufgaben der Übungen richtig bearbeitet haben. Jede Woche wird ein Übungszettel mit 3-5 Aufgaben herausgegeben. Die letzte Aufgabe ist immer nur von den Studenten des 1-Fach-Bachelorstudiums zu bearbeiten. Die Teilnahme an den Übungen ist Pflicht. Die Aufgaben sollen zu zweit schriftlich bearbeitet werden und am Mittwoch vor der Vorlesung um 8:15 abgegeben werden. Jede zweite Woche findet für eine halbe Stunde eine Korrektur in Anwesenheit statt. Während dieser halben Stunde sollen Sie dem übungsleiter erklären, was Sie aufgeschrieben haben. Während dieser halben Stunde kann man i.A. nicht alle Aufgaben besprechen. Wenn Sie nicht erklären können, was Sie aufgeschrieben haben, gilt dies als falsch. Um zur Klausur zugelassen zu werden, müssen Sie 50% der Aufgaben richtig bearbeitet haben und es müssen 50% der Aufgaben richtig sein, die Sie in der Korrektur in Anwesenheit besprechen. Vorlesungsstoff Ein großer Teil der Vorlesung befasst sich mit dem Aufbau des Zahlsystems. Wir gehen von den natürlichen Zahlen N aus. Die Existenz der natürlichen Zahlen kann man aus dem Axiomensystem von Zermelo-Fraenkel der Mengenlehre herleiten. Aus den natürlichen Zahlen erhält man durch Hinzufügen von 0 und der negativen Zahlen die ganzen Zahlen Z. Durch Quotientenbildung erhält man die rationalen Zahlen Q. Daraus konstruieren wir schließlich die reellen Zahlen R. Diese letzte Konstruktion ist nicht einfach. Anschaulich handelt es sich bei den reellen Zahlen um den unendlichen Zahlenstrahl, so etwas wie ein unendlich langes Lineal. Dies ist sicherlich eine gute Veranschaulichung, wir brauchen aber eine Darstellung der reellen Zahlen, die es uns erlaubt mit ihnen zu rechnen. Zunächst stellt sich die Frage, ob es überhaupt reelle Zahlen gibt, die keine rationalen Zahlen sind. √ Wir betrachten 2, √ um die Probleme zu erklären. Aus der Anschauung sind wir sicher, dass die Zahl 2 existiert: Sie ist die Länge der Diagonale des Quadrates mit der Kantenlänge 1. Was aber ist dann eine reelle Zahl? Jede Länge, die wir in einem geometrischen Objekt wie einem Quadrat messen können? Was ist dann mit der Zahl e? √ Nehmen wir einmal an, dass 2 eine wohldefinierte, reelle Zahl √ ist. Es lässt sich durch ein geschicktes, aber sehr kurzes Argument zeigen, dass 2 keine rationale Zahl ist (Satz 2.0.2). √ Nun eine historische Bemerkung zu der Tatsache, dass 2 irrational ist. Pythagoras war der Führer einer philosophischen Gemeinschaft, der Pythagoräer. Sie glaubten, dass der Natur harmonische Prinzipien zu Grunde liegen. So beobachteten sie, dass zwei Saiten harmonisch klingen, wenn der Quotient ihrer Längen als Quotient zweier 10 CHAPTER 1. kleiner natürlicher Zahlen ausgedrückt werden kann. Sie glaubten, dass die in der Natur vorkommenden Zahlen rationale Zahlen sind. Sie waren erschüttert, als sie √ feststellten, dass 2 eine irrationale Zahl ist. Sie beschlossen, dies geheim zu halten. √ Ein Mitglied ihrer Gemeinde, Hippasus, beschloss, der Welt mitzu teilen, dass 2 eine irrationale Zahl ist. Daraufhin wurde er umgebracht [76, 91]. Außerdem sind π und e keine rationalen Zahlen, dies ist aber deutlich schwieriger nachzuweisen. Weiter ist in diesem Zusammenhang wichtig, eine Darstellung für reelle Zahlen zu finden. Die übliche Darstellung ist die Dezimaldarstellung. Auf Taschenrechnern wird diese Darstellung benutzt, wobei nur ca. 10 Ziffern benutzt werden. Dem unvoreingenommenen Benutzer von Taschenrechnern kommt der Verdacht, dass 10 Ziffern vielleicht nicht ausreichen. Vielleicht kommt man mit 20 Ziffern aus? Vielleicht macht man einen Fehler, aber der ist so klein, dass er in aller Regel keine Rolle spielt? Können wir also unser Zahlsystem so einschränken, dass wir höchstens 20 Ziffern zu verwenden haben? Bei der Umwandlung eines Bruches in eine Dezimalzahl treten Dezimalzahlen mit unendlich vielen Stellen auf. So z.B. 1 = 0, 3333 . . . 3 Ist der rechte Ausdruck aber sinnvoll? Auf einem Taschenrechner haben nicht unendlich viele Zahlen Platz und wir sind auch nicht in der Lage, unendlich viele Ziffern aufzuschreiben. Multiplizieren wir nun beide Seiten mit 3, erhalten wir 1 = 0, 999 . . . Ist das noch vernünftig? Wenn ja, dürfen wir eine Dezimalzahl in dieser Weise multiplizieren? Sind die Zahlen 1 und 0, 9999 . . . tatsächlich gleich? Wenn ja, warum? Eine weitere wichtige Aufgabe ist die Bestimmung des Flächeninhaltes. Hierzu entwickeln wir die Differential- und Integralrechnung. Wir gehen davon aus, dass die Fläche eines Rechteckes das Produkt der Seitenlängen ist. Wir können dann die Fläche zwischen Graphen von Funktionen bestimmen. Es stellt sich die Frage, ob wir jeder Teilmenge des R2 einen Flächeninhalt zuordnen können? Eine weitere Aufgabe ist die Bestimmung der Länge einer Kurve. Beispiele hierfür sind der Umfang eines Rechteckes oder der Umfang eines Kreises. Wir geben hier mathematische Probleme an, die von besonderem Interesse sind. Einige werden wir in der Vorlesung behandeln. Konvergenz von Folgen Konvergieren die Folgen: 1.1. EINFÜHRUNG 11 (i) s r r q q q √ √ √ √ 1, 1 + 2, 1 + 2 + 3, 1 + 2 + 3 + 4, . . . (ii) 2 3 4 1 1 1 (1 + 1) , 1 + , 1+ , 1+ ,... 2 3 4 1 Bewegungsgleichung eines Pendels und eines Doppelpendels Brachistochronen Problem Man konstruiere eine Bahn, auf der sich eine Kugel nur unter Wirkung der Schwerkraft am schnellsten von einem Punkt zu einem anderen bewegt. Schwerkraft eines hohlen Planeten Wir betrachten einen Planeten, der innen hohl ist. Wie groß ist die Schwerkraft innnen und außen? Schwingende Saite Eine Saite wird angezupft. Wie lassen sich die Schwingungen, die die Saite vollführt, ausrechnen? 12 CHAPTER 1. Kann man die Form einer Trommel hören? Kann man nur am Ton der Trommel hören, welche Form ihre Bespannung hat? Temperaturverteilung in einer kreisrunden Metallscheibe Eine kreisrunde Metallscheibe ist zu einem gegebenen Zeitpunkt unterschiedlich erhitzt. Wie entwickelt sich die Temperaturverteilung im Laufe der Zeit? π ist eine irrationale Zahl Wir zeigen, dass sich π nicht als Quotient zweier ganzen Zahlen schreiben lässt. Dreiteilung eines Winkels Kann man nur mit Hilfe von Zirkel und Lineal einen beliebigen Winkel in drei gleiche Teile teilen? Quadratur des Kreises Kann man nur mit Hilfe von Zirkel und Lineal ein Quadrat konstruieren, das dieselbe Fläche wie ein gegebener Kreis hat? Banach-Tarski Paradoxon Man kann eine Kugel so in endlich viele Teile zerlegen, dass man diese wiederum zu zwei Kugeln derselben Größe zusammensetzen kann. Auf diese Weise verdoppelt man das Volumen. Dies kann nicht sein. Wie erklärt sich dieser Widerspruch? Wir zerlegen die Kugel in Teile, denen sämtlich kein Volumen zugeordnet werden kann, also Mengen, die nicht messbar sind. Kakeya Problem (1917) Wir legen eine Nadel auf eine Ebene und bewegen sie nun so, dass sie wieder in derselben Position zu liegen kommt, wobei allerdings die beiden Endpunkte der Nadel vertauscht sind. Wir möchten die Nadel so bewegen, dass eine mglichst kleine Fläche von der Nadel überstrichen wird. Wie klein kann diese Fläche sein? Gibt es ein Minimum? Vermutung von Fermat Es sei n ∈ N. Für n ≥ 3 gibt es keine x, y, z ∈ N mit xn + y n = z n . Für n = 2 erfüllen x = 3, y = 4, z = 5 die Gleichung. 1.1. EINFÜHRUNG 13 Berechnung von Volumina, Schwerpunkten, Kurvenlängen, Oberflächen Peano-Kurve Es gibt eine stetige Kurve, die ein ganzes Quadrat ausfüllt. Wir wollen uns noch ein Beispiel für einen mathematischen Beweis ansehen. Satz 1.1.1 (Pythagoras)[76, 91] Es seien a und b die Längen der Katheten in einem rechtwinkligen Dreieck und c die Länge der Hypothenuse. Dann gilt a2 + b 2 = c 2 . Beweis. b a c Wir betrachten ein Quadrat mit der Kantenlänge a + b. Einbeschrieben ist ein Quadrat der Kantenlänge c. a b c Wir sehen nun, dass sich die Fläche des Quadrates mit der Kantenlänge a + b aus einem Quadrat der Kantenlänge c und vier rechtwinkligen Dreiecken mit Katheten a und b und Hypothenuse c zusammensetzt. Es folgt a·b (a + b)2 = c2 + 4 = c2 + 2ab. 2 Deshalb gilt a2 + 2ab + b2 = c2 + 2ab. 14 CHAPTER 1. Also a2 + b 2 = c 2 . Alternativ können wir den Beweis auch geometrisch beenden. Wir arrangieren die Dreiecke neu in dem Quadrat an. Es folgt, dass die Fläche, die nicht von den Dreiecken überdeckt wird gleich c2 ist. Andererseits setzt sich die Fläche aus zwei Quadraten der Kantenlänge a und b zusammen. a b 2 Pythagoras wurde um 570 v. Chr. auf Samos geboren und starb nach 510 v. Chr. in Metapont in Süditalien. Er war Philosoph und Gründer einer religiösphilosophischen Bewegung. In seiner Jugend reiste er zu Studienzwecken u.a. nach Ägypten und Babylon. Um 530 v. Chr. wanderte er nach Croton in Süditalien aus, weil er sich mit dem Herrscher auf Samos überworfen hatte. Der Satz von Pythagoras war sehr wahrscheinlich schon vor Pythagoras Zeit den Ägyptern, Indern und Chinesen bekannt. In China ist der Satz unter dem Namen GouGu-Dingi bekannt. Gou heißt Breite, Gu heißt Länge und Dingi Lehrsatz. Es gibt sehr viele Beweise des Satzes, die aber im Wesentlichen nicht allzu verschieden sind. Der amerikanische Präsident James A. Garfield (1831-1881) hat auch einen Beweis geliefert. 1.2 Mathematische Logik Die mathematische Logik bietet systematische und formale Entscheidungsmethoden dafür an, ob eine Aussage wahr oder falsch ist (oder auch, ob eine Aussage weder wahr noch falsch ist, also nicht entscheidbar ist). Da diese Methoden formal sind, gehen sie nicht auf die Bedeutung und den Sinn der vorliegenden Aussage ein. Sie liefern objektive Verfahrensweisen zur Entscheidung, ob eine Aussage wahr oder 1.2. MATHEMATISCHE LOGIK 15 falsch ist. Wir können Aussagen zusammensetzen. Dazu stehen uns die folgenden Verknüpfungen zur Verfügung. Aussage Verknüpfung Aussage Bedeutung A ⇒ B A folgt B A ⇔ B A gilt genau dann, wenn B gilt A ∧ B A und B gelten A ∨ B A oder B gelten (einschliessendes ”oder”) Außerdem bedeutet ¬A die Verneinung der Aussage A. Wir ordnen Aussagen A und B die Wahrheitszeichen W und F für wahr und falsch zu. Für zusammengesetzte Aussagen gelten die folgenden Regeln. A ¬A W F F W Wenn A wahr ist, dann ist die Verneinung ¬A natürlich falsch. A ∧ B W W W W F F F F W F F F A und B sind nur dann wahr, wenn beide Aussagen wahr sind. A ∨ B W W W W W F F W W F F F Da das Symbol ∨ das einschließende ”oder” ist, braucht nur eine der beiden 16 CHAPTER 1. Aussagen wahr zu sein, damit die Gesamtaussage richtig ist. Als Beispiel hierfür die Aussage: Das Haus ist rot oder das Haus ist nicht rot. A ⇒ B W W W W F F F W W F W F Falls A und B wahr sind, so ist auch die Gesamtaussage wahr. Falls A wahr ist und B falsch, so ist die Gesamtaussage falsch, da aus einer wahren Aussage keine falsche folgen kann. Andererseits kann aus einer falschen Aussage durchaus eine wahre Aussage folgen. Wenn wir von der falschen Aussage 1 = 2 ausgehen so folgt durch Addition 2+1=1+2 also die wahre Aussage 3 = 3. A ⇔ B W W W W F F F F W F W F A ist genau dann wahr, wenn B wahr ist. Ebenso ist A genau dann falsch, wenn B falsch ist. Dies sind die beiden wahren Implikationen. Wir sagen, dass zwei Aussagen A und B logisch äquivalent oder tautologisch sind, falls A ⇔ B immer wahr ist. Beispiel 1.2.1 (i) (A ⇒ B) und (¬B ⇒ ¬A) sind logisch äquivalent. A ⇒ B ⇔ ¬B ⇒ ¬A W W W W F W F W F F W W F F F W W W F W W F W F W W W W (ii) (A ⇔ B) und ((A ∧ B) ∨ (¬A ∧ ¬B)) sind logisch äquivalent. 1.2. MATHEMATISCHE LOGIK 17 (A ⇐⇒ B) ⇐⇒ ((A ∧ B) W W W W W W W W F F F W F F W W F F F F F W F F W W F F W F W F F W F W F F F W W W F ∨ (¬A W ∧ ¬B)) So lässt sich die Verknüpfung ⇔ durch ∨ und ∧ ausdrücken. (iii) Die Aussagen ¬(A ∨ B) und ¬A ∧ ¬B sind logisch äquivalent. Die Aussagen ¬(A ∧ B) und ¬A ∨ ¬B sind logisch äquivalent. (iv) Die Aussage ”Entweder gilt A oder B” lässt sich formelmäßig durch (A ∧ ¬B) ∨ (¬A ∧ B) erfassen. Entweder gilt A oder B heißt ja gerade, dass A gilt und nicht B oder A gilt nicht und B gilt. Die Wahrheitstafel ist (A ∧ ¬B) ∨ (¬A ∧ B) W F F F F F W W W W W F F F F F F W W W W F F W F W F F Wenn wir die Wahrheitstafeln vergleichen, stellen wir fest, dass die Aussage (A ⇔ B) logisch äquivalent zu ¬((A ∧ ¬B) ∨ (¬A ∧ B)), also der Verneinung der Entweder-Oder Aussage. Die Aussage ¬((A ∧ ¬B) ∨ (¬A ∧ B)) ist logisch q̈uivalent zu (¬A ∨ B) ∧ (A ∨ ¬B). Wir wollen uns nun einem komplizierteren Beispiel zuwenden. Beispiel 1.2.2 Wenn Anton raucht, dann raucht auch Fridolin. Christa oder Dora rauchen. Entweder raucht Fridolin, oder es raucht Emil. Christa und Emil rauchen beide, oder beide rauchen nicht. Wenn Dora raucht, dann rauchen auch Christa und Anton. Bruno raucht nur, wenn Fridolin nicht raucht. Wer raucht und wer raucht nicht? Wir haben die folgenden Aussagen. A = Anton raucht D = Dora raucht B = Bruno raucht E = Emil raucht C = Christa raucht F = Fridolin raucht Wir übersetzen nun die Aussagen. Wenn Anton raucht, dann raucht auch Fridolin : Christa oder Dora rauchen : Entweder raucht Fridolin, oder es raucht Emil : Christa und Emil rauchen beide, oder beide rauchen nicht : Wenn Dora raucht, dann rauchen auch Christa und Anton : Bruno raucht nur, wenn Fridolin nicht raucht : A⇒F C ∨D (E ∧ ¬F ) ∨ (¬E ∧ F ) (C ∧ E) ∨ (¬C ∧ ¬E) D ⇒ (A ∧ C) B ⇔ ¬F 18 CHAPTER 1. A B C D E F W W F W W F F W W W F W F W W W W W F F F W F W F W W W W W F W F W F W W W F F F W F W F F W W W F W F F W F F W F W W W W W F F F W F W F W W W W W F W W F F W F F W F F W W W W W F F F (E∧¬F )∨(¬E∧F ) (E∧C)∨(¬E∧¬C) D ⇒ (A∧C) F F W D∨C W F F W W A⇒F F F W F F W F W W W F F F W F W F W F F F F W F F F W F F Wir erstellen zwei Tabellen, mit der wir sämtliche Möglichkeiten überprüfen. Da wir 6 elementare Aussagen haben, aus denen sich die anderen Aussagen zusammensetzen, ergeben sich insgesamt 26 = 64 Möglichkeiten. Wir stellen fest, dass es nur eine Möglichkeit gibt, in der alle zusammengesetzten Aussagen richtig sind: Anton raucht nicht, Bruno raucht, Christa raucht, Dora raucht nicht, Emil raucht, Fridolin raucht nicht. Darüberhinaus benötigen wir zwei Quantoren. ∀ heißt für alle ∃ heißt es existiert ein Wenn wir eine zusammengesetzte Aussage haben, in der auch Quantoren vorkommen, und wir zur Verneinung dieser Aussage übergehen wollen, dann kehren sich 1.3. DAS AXIOMENSYSTEM VON ZERMELO-FRAENKEL 19 die logischen Symbole um. Es gibt eine Stadt, in der alle Häuser rot oder grün sind. ∃ S ∀ H : (H ist rot) ∨ (H ist grün) Als Verneinung erhalten wir ∀ S ∃ H : (H ist nicht rot) ∧ (H ist nicht grün) In jeder Stadt gibt es ein Haus, das weder rot noch grün ist. Über die Jahrhunderte gab es immer Versuche, die Existenz Gottes mit der Logik nachzuweisen. Hier nun die Argumentation von Anselm von Canterbury (10331109). Er interpretiert Gott als etwas, worüber hinaus nichts Größeres gedacht werden kann. Statt größer kann man auch vollkommener sagen. Er nimmt an, dass es Gott nicht gibt. Es existiert also das, worüber hinaus nichts Größeres gedacht werden kann, nicht in Wirklichkeit, sondern nur in unserer Vorstellung. Hieraus folgt, dass es zu jeder Vorstellung eine größere gibt, die auch existiert. Dies ist ein Widerspruch. Andere Gottesbeweise stammen von René Descartes (1596-1650) und Kurt Gödel (28.4.1906-14.1.1978). 1.3 Das Axiomensystem von Zermelo-Fraenkel Georg Ferdinand Ludwig Philipp Cantor wurde am 19. Februar 1845 in Sankt Petersburg geboren und er starb am 6. Januar 1918 in Halle an der Saale. Er ist der Begründer der Mengenlehre. Er war auch an Philosohie und Literatur interessiert. So versuchte er nachzuweisen, dass die Werke von Shakespeare von Francis Bacon geschrieben worden sind. Seit 1884 war er wegen einer manisch-depressiven Erkrankung in psychiatrischer Behandlung. Auf dem internationalen Mathematiker Kongress 1904 bewies Julius König, dass die Mächtigkeit des Kontinuums nicht unter den von Cantor eingeführten Kardinalzahlen vorkommt, was die Mengenlehre in Frage stellen würde. Cantor fühlte sich gekränkt. Am darauffolgenden Tag zeigte Ernst Zermelo, dass der Beweis von König falsch war. Dies half Cantor nicht, die Kränkung zu vergessen. Ernst Friedrich Ferdinand Zermelo wurde am 27. Juli 1871 in Berlin geboren und starb am 21. Mai 1953 in Freiburg im Breisgau. Adolf Abraham Halevi Fraenkel wurde am 17. Februar 1891 in München geboren und er starb am 15. Oktober 1965 in Jerusalem. Er promovierte und habilitierte sich an der Universität Marburg. Er bekam 1928 eine Ruf an die Universität Kiel. Er war 1929 und 1930 Gastprofessor an der Hebräischen Universität in Jerusalem. 1933 wird er in Kiel beurlaubt, weil er Jude ist. Er kehrt an die Hebräische Universität zurück, an der er 1938 Rektor wird. Georg Cantor (1845-1918) hat Ende des 19. Jahrhunderts die Mengenlehre begründet. Er definiert eine Menge als eine Gesamtheit von wohlunterschiedenen Objekten des Denkens und der Wahrnehmung. Die Objekte werden als Elemente und die Gesamtheit als Menge bezeichnet. Falls x ein Element einer Menge M ist, so schreiben wir x∈M 20 CHAPTER 1. Cantor hat drei Axiome verwendet, ohne diese explizit aufzuführen: Axiomensystem von Cantor (i) Zwei Mengen sind gleich, wenn sie dieselben Elemente besitzen. (ii) Für jede Eigenschaft gibt es eine Menge, deren Elemente genau diese Eigenschaft erfüllen. Unter einer Eigenschaft verstehen wir eine Aussage der mathematischen Logik, die die Elemente betrifft. Wir schreiben auch für die Menge {x|φ(x)} falls φ die fragliche Eigenschaft ist. (iii) Auswahlaxiom (dies wird später definiert.) Die Vereinigung von zwei Mengen A und B ist A ∪ B = {x| x ∈ A ∨ x ∈ B} und von einer Menge von Mengen A [ A = {x|∃A ∈ A : x ∈ A} A∈A Der Durchschnitt von zwei Mengen A und B ist A ∩ B = {x| x ∈ A ∧ x ∈ B} und einer Menge von Mengen A \ A = {x|∀A ∈ A : x ∈ A} A∈A Wir sagen, dass A Teilmenge von B ist, wenn für alle x ∈ A gilt, dass x ∈ B. Wir schreiben dann A ⊆ B. Das Komplement einer Teilmenge A einer Menge M ist Ac = {x ∈ M | ¬(x ∈ A)} = {x ∈ M | x ∈ / A}. Lemma 1.3.1 (Formel von De Morgan) (i) Es sei K eine Menge und M eine Menge von Mengen mit M ⊆ K. Dann gilt !c \ [ M = M c, M ∈M M ∈M c wobei M das Komplement von M in K ist. (ii) Es seien M ∈ M Teilmengen einer Menge K !c [ \ M = Mc M ∈M wobei M c das Komplement von M in K ist. M ∈M 1.3. DAS AXIOMENSYSTEM VON ZERMELO-FRAENKEL 21 Beweis. (i) !c \ M ∈M M = ({x ∈ K|∀M ∈ M : x ∈ M })c = {x ∈ K|¬(∀M ∈ M : x ∈ M )} = {x ∈ K|∃M ∈ M : x ∈ / M} [ [ = {x ∈ K|x ∈ / M} = Mc M ∈M M ∈M 2 Bertrand Russell (1872-1970, mit vollem Namen: Bertrand Arthur William Russell, 3rd Earl Russell of Kingston Russell, Viscount Amberley of Amberley and of Ardsalla) wies mit einem einfachen Beispiel nach, dass das Axiom (ii) zu Widersprüchen führt. Er fand das folgende nach ihm benannte Paradoxon. Als Eigenschaft einer Menge M betrachten wir M ist nicht Element von sich selbst. Gemäß (ii) müsste es also eine Menge A geben, deren Elemente aus denjenigen Mengen M bestehen, die nicht Element von sich selbst sind. Dies führt sofort zu einem Widerspruch: Ist A Element von sich selbst? Falls A nicht Element von sich selbst ist, dann muss A gemäß der Eigenschaft Element von sich selbst sein. Umgekehrt, falls A Element von sich selbst ist, dann muss A die Eigenschaft erfüllen, dass A nicht Element von sich selbst ist. Man kommt in jedem Fall zu einem Widerspruch. Eine vergleichbare Paradoxie ist der folgende Satz: Ich lüge immer. Wenn ich immer lüge, dann ist der Satz gelogen und ich sage manchmal die Wahrheit. Dies widerspricht dem Satz. Das Axiomensystem von Cantor ist weiterentwickelt worden, um solche Widersprüche auszuschließen. Es gibt heute mehrere Systeme, die man als vernünftig erachtet. Wir wollen hier das System von Zermelo-Fraenkel benutzen. Wie von Cantor eingeführt, haben wir zwei binäre Verknüpfungen ∈ und =. x∈M bedeutet, dass x ein Element, M eine Menge und x Element von M ist. Falls M und K zwei Mengen sind, bedeutet M =K dieselbe Menge sind. Es gelten die folgenden Axiome: Axiom 1.3.1 (Axiomensystem von Zermelo-Fraenkel) (i) Falls zwei Mengen dieselben Elemente besitzen, dann sind sie gleich. (∀x : x ∈ M ⇔ x ∈ K) ⇒ M = K 22 CHAPTER 1. (ii) Es gibt eine Menge, die keine Elemente enthält. Wir bezeichnen diese Menge als Nullmenge ∅. (iii) Es gibt eine Menge M , so dass ∅ ∈ M und so dass für alle x ∈ M auch {x} ∈ M gilt. Hierbei bezeichnet {x} die Menge, die nur aus dem Element x besteht. (iv) (Potenzmenge) Für jede Menge M existiert die Menge P(M ), die aus allen Teilmengen von M besteht. Wir nennen P(M ) die Potenzmenge von M . (v) Es sei M eine S Menge, deren Elemente wiederum aus Mengen bestehen. Dann gibt es eine Menge M , die aus allen Elementen der Elemente von M besteht. Wir nennen diese Menge die Vereinigungsmenge. (vi) (Regularität) Falls M eine nichtleere Menge ist, dann gibt es ein x ∈ M , so dass x∩M =∅ In Quantorenschreibweise M 6= ∅ =⇒ ∃x : x ∈ M ∧ (∀y : y ∈ x ⇒ y ∈ / M) (vii) Falls φ eine Eigenschaft ist und M eine Menge, dann gibt es eine Menge, die aus genau den x, x ∈ M , besteht, die die Eigenschaft φ erfüllen. {x|x ∈ M ∧ φ(x)} (viii) (Ersetzung )Es sei φ eine Eigenschaft, die von zwei Mengen M und K abhängt. Wir nehmen an, dass es für jedes x ∈ M genau ein y ∈ K gibt, so dass φ(x, y) gilt. Dann gibt es eine Menge {y|∃x ∈ M : φ(x, y)} (ix) (Auswahlaxiom) Es sei M eine Menge paarweise disjunkter, nichtleerer Mengen. Dann gibt es eine Menge A mit folgender Eigenschaft: Jedes Element von A ist Element einer der Mengen M und für jedes M ∈ M gibt es genau ein x ∈ M mit x ∈ A. Wir nennen A die Auswahlmenge. In (iii) beachte man, dass immer ∅ ⊆ M gilt. Hier wird aber gefordert, dass ∅ ∈ M. Einige Bemerkungen zum Axiom (vi). Die Bedingung x∩M ist nicht mit {x}∩M zu verwechseln. Offenbar haben wir {x} ∩ M = {x}. Der Durchschnitt ist also nie leer. Falls es ein Element x ∈ M gibt, das selbst keine Menge ist, so folgt x ∩ M = ∅. Die Menge M = {1, 2, {1, 2}} liefert ein Beispiel dafür, dass es ein x ∈ M geben kann, so dass x ∩ M 6= ∅. Wir wählen x = {1, 2}. Wir erhalten dann x ∩ M = {1, 2} ∩ {1, 2, {1, 2}} = {1, 2} Mit Hilfe von Axiom (vi) können wir das folgende Lemma beweisen. 1.4. RELATION UND ORDNUNG 23 Lemma 1.3.2 Es sei M eine Menge. Dann gilt M ∈ / M. Beweis. Wir nehmen an, dass M ∈ M gilt. Da M ∈ {M } gilt, folgt, dass M ∈ M ∩ {M } Das Axiom der Regularität besagt, dass es ein x ∈ {M } gibt mit x ∩ {M } = ∅ Da {M } nur ein Element enthält, nämlich M , folgt x = M . Somit gilt M ∩{M } = ∅, was der Aussage M ∈ M ∩ {M } widerspricht. 2 Die Frage, ob man das Auswahlaxiom zum Axiomensystem hinzufügen soll oder nicht, ist sehr kontrovers dikutiert worden. Die Annahme des Auswahlaxioms ist sehr hilfreich und eine große Anzahl von mathematischen Aussagen beruht darauf. Andererseits erzeugt man dadurch auch solche bizarren Resultate wie das BanachTarski Paradoxon. Gödel zeigte 1938, dass das Auswahlaxiom mit dem Axiomensytem von ZermeloFraenkel konsistent ist. Er zeigte, dass man jedes Paradoxon, das man aus dem Auswahlaxiom erhält, so modifizieren kann, dass man es auch ohne das Auswahlaxiom erhält. Cohen zeigte 1963, dass die Verneinung des Auswahlaxiomes ebenso konsistent mit dem Axiomensystem von Zermelo-Fraenkel ist. Um eine Auswahlmenge anzugeben, muss man durch eine Formel oder Vorschrift festlegen, welches Element man aus welcher Menge entnimmt. Dass man aus jeder einzelnen Menge jeweils ein Element auswählen kann, reicht dazu nicht aus. In einigen Fällen braucht man das Auswahlaxiom nicht, um die Existenz einer Auswahlmenge sicherzustellen. (a) Falls jedes M ∈ M nur ein einziges Element enthält. (b) Falls M nur endlich viele M enthält. (c) Falls jedes M ∈ M eine endliche Menge reeller Zahlen ist. Dann wählen wir als x ∈ M das maximale Element. Andererseits kann man zeigen, dass es eine Menge M gibt, so dass alle M ∈ M nur aus zwei Elementen bestehen, und so dass sich ohne das Auswahlaxiom nicht die Existenz einer Auswahlmenge herleiten liesse. 1.4 Relation und Ordnung Es seien M und K Mengen. Dann heißt die Menge der geordneten Paare M × K = {(x, y)|x ∈ M ∧ y ∈ K} das Cartesische Produkt von M und K. 24 CHAPTER 1. Eine Relation R auf M ist eine Teilmenge von M × M . Wir sagen, dass x in Relation zu y steht, wenn (x, y) ∈ R. Ein typisches Beispiel für eine Relation ist die Relation ≤ auf den reellen Zahlen. Die Relation x ≤ y x x=y y Wir sagen, dass (i) R reflexiv ist, falls für alle x ∈ M gilt, dass xRx. (ii) R symmetrisch ist, falls für alle x, y ∈ M mit xRy auch yRx gilt. (iii) R transitiv ist, falls für alle x, y, z ∈ M mit xRy und yRz auch xRz gilt. Eine Relation heißt Äquivalenzrelation, falls sie reflexiv, symmetrisch und transitiv ist. Es sei M eine Menge mit der Äquivalenzrelation ∼. Es sei y ∈ M . Dann heißt [y] = {x|x ∼ y} Äquivalenzklasse. Eine Relation R heißt antisymmetrisch, falls für alle (x, y) mit (x, y) ∈ R und (y, x) ∈ R folgt, dass x = y. Eine Funktion von einer Menge M in eine Menge K ist eine Teilmenge f von M × K, so dass für alle x ∈ M genau ein y ∈ K existiert mit (x, y) ∈ f . Dafür schreiben wir auch f : M → K und f (x) = y. Wir sagen, dass eine Funktion surjektiv ist, falls für alle y ∈ K ein x ∈ M mit f (x) = y existiert. Wir schreiben auch f (M ) = K. f ist injektiv , falls für alle x, y ∈ M mit f (x) = f (y) gilt, dass x = y. f ist bijektiv bzw. eine Bijektion, falls f injektiv und surjektiv ist. Eine Relation R auf M ist eine Halbordnung, falls sie reflexiv, antisymmetrisch und transitiv ist. Eine Halbordnung R ist eine Ordnung, falls für alle x, y ∈ M gilt, dass (x, y) ∈ R oder x=y oder (y, x) ∈ R Wir schreiben für eine Menge mit einer Halbordnung oder Ordnung auch (M, ≤). Wir schreiben x ≤ y, wenn der Gleichheitsfall x = y eingeschlossen ist, und wir schreiben x < y, wenn der Gleichheitsfall ausgeschlossen ist. 1.4. RELATION UND ORDNUNG 25 Als Beispiel für eine Menge mit einer Halbordnung, die keine Ordnung ist, lässt sich das folgende angeben. Wir betrachten die Menge aller Tupel reeller Zahlen {(s, t)|s, t ∈ R} mit der Halbordnung (s, t) ≤ (u, v) falls s ≤ u und t ≤ v Dies ist keine Ordnung, weil (1, 0) und (0, 1) nicht vergleichbar sind, d.h. das eine ist nicht kleiner als das andere und umgekehrt. Eine Wohlordnung ist eine Ordnung mit der Eigenschaft, dass jede nichtleere Teilmenge K von M ein kleinstes Element besitzt, d.h.es gibt ein x ∈ K, so dass für alle y ∈ K gilt, dass x ≤ y. Dieses Element ist eindeutig. Die übliche ≤ Relation auf den reellen Zahlen ist eine Ordnung aber keine Wohlordnung. Dies liegt daran, dass die Menge {x ∈ R|0 < x} kein minimales Element besitzt. K sei eine Teilmenge einer Menge mit einer Halbordnung. Wir sagen, dass x ∈ K ein minimales (maximales) Element von K ist, falls x ∈ K und für alle y ∈ K gilt, dass y ≮ x (x ≮ y). Minimale und maximale Elemente sind nicht notwendig eindeutig. Ausserdem folgt aus x ≮ y nicht notwendig y ≤ x. x ist eine untere (obere) Schranke von K, falls für alle y ∈ K gilt, dass x < y oder x = y x > y oder x = y. Falls M eine Teilmenge K enthält, die mit der Halbordnung von M eine geordnete Menge ist, dann nennen wir K eine Kette. Lemma 1.4.1 Die folgenden Aussagen sind äquivalent. (i) (Auswahlaxiom) Es sei M eine Menge paarweise disjunkter, nichtleerer Mengen. Dann gibt es eine Menge A mit folgender Eigenschaft: Jedes Element von A ist Element einer der Mengen M ∈ M und für jedes M ∈ M gibt es genau ein x ∈ M mit x ∈ A. (ii) (Hausdorffs Maximum Prinzip) Jede Menge mit einer Halbordnung enthält eine maximale Kette (d.h. eine Kette, die in keiner echten Teilmenge einer anderen Kette enthalten ist). (iii) (Zorns Lemma) Jede nichtleere Menge mit einer Halbordnung, in der jede Kette eine obere Schranke hat, hat ein maximales Element. (iv) Man kann jede Menge wohlordnen. Die natürlichen Zahlen sind in ihrer natürlichen Ordnung wohlgeordnet, das gilt jedoch nicht für die reellen Zahlen. Lemma 1.4.1 versichert nur, dass es auf den reellen Zahlen eine Wohlordnung gibt, es liefert kein Konstruktionsverfahren für eine solche Wohlordnung. Eine solche Wohlordnung ist sehr schwer vorstellbar. Beweis. (ii) ⇒ (iii) : Nach (ii) gibt es eine maximale Kette K in M . Nach Annahme von (iii) hat diese Kette eine obere Schranke s. Wir behaupten nun, dass 26 CHAPTER 1. s ein maximales Element von M ist. Falls dem nicht so wäre, so gibt es ein s0 mit s < s0 . Damit ist aber K ∪ {s0 } eine Kette, die K als echte Teilmenge enthält. Also ist K nicht maximal. Dies ist ein Widerspruch. (iv) ⇒ (i) : Wir betrachten die Vereinigungsmenge [ M. M ∈M Diese Menge enthält alle M ∈ M als Teilmengen. Nach (iv) können wir die Menge S M ∈M M wohlordnen. Da jede Teilmenge ein kleinstes Element hat, hat insbesondere auch jedes M ∈ M ein kleinstes Element xM . Als Auswahlmenge nehmen wir nun {xM |M ∈ M}. 2 1.5 Die natürlichen Zahlen N Giuseppe Peano wurde am 27. August 1858 in Spinetta geboren und er starb am 20. April 1932 in Turin. Wir wollen nun die natürlichen Zahlen so einführen, wie Zermelo dies getan hat. Aus Axiom (ii) folgt, dass die leere Menge ∅ existiert und aus Axiom (iii) folgt, dass es eine Menge M gibt, so dass ∅ ∈ M und so dass {x} ∈ M , falls x ∈ M . Dies bedeutet, dass (1.1) ∅, {∅}, {{∅}}, {{{∅}}}, . . . Elemente von M sind. Diese Elemente kann man zur Definition der natürlichen Zahlen N benutzen. Hierbei bezeichnen wir das Element ∅ mit 0, das Element {∅} nennen wir 1, etc. Dann definieren wir N = {1, 2, 3, · · · } N0 = {0, 1, 2, 3, · · · }. Wir sagen, dass n der unmittelbare Nachfolger von m ist, falls {m} = n. John von Neumann hat vorgeschlagen, die Mengen (1.2) {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}, . . . zur Einführung der natürlichen Zahlen zu benutzen. In diesem Fall bezeichnen wir {∅} mit 1, {∅, {∅}} mit 2, {∅, {∅}, {{∅}}} mit 3 u.s.w.. Die Menge ∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}, . . . 1.5. DIE NATÜRLICHEN ZAHLEN N 27 bezeichnen wir als die um die 0 erweiterten natürlichen Zahlen N0 . Hierbei bezeichnen wir ∅ mit 0. Wir sagen, dass m ∈ N0 unmittelbarer Nachfolger von n ∈ N0 ist, wenn m = {0, . . . , n}. 1 ist der unmittelbare Nachfolger von 0, 2 von 1, 3 von 2, u.s.w.. Peano hatte ein Axiomensystem für die natürlichen Zahlen vorgeschlagen. Dieses Axiomensystem sichert Existenz und elementare Eigenschaften der natürlichen Zahlen. Diese Eigenschaften lassen sich auch aus dem Axiomensystem von Zermelo-Fraenkel herleiten. Lemma 1.5.1 (Axiomensystem von Peano) Die erweiterten, natürlichen Zahlen haben die folgenden Eigenschaften. (i) 0 ∈ N0 (ii) Jedes n ∈ N0 hat einen genau einen unmittelbaren Nachfolger n0 . (iii) 0 ist kein unmittelbarer Nachfolger einer natürlichen Zahl. (iv) Natürliche Zahlen mit demselben unmittelbaren Nachfolger sind gleich. (v) Falls M eine Teilmenge von N0 ist, so dass 0 ∈ M und falls mit jedem m ∈ M auch der unmittelbare Nachfolger in M ist, dann gilt M = N0 . Hieraus lässt sich herleiten: Lemma 1.5.2 Die erweiterten, natürlichen Zahlen haben die folgenden Eigenschaften. (i) Jedes n ∈ N0 hat genau einen unmittelbaren Nachfolger. (ii) Jedes n ∈ N ist unmittelbarer Nachfolger von genau einem m ∈ N0 . (iii) Für alle m, n ∈ N0 , deren unmittelbare Nachfolger gleich sind, gilt n = m. (iv) Für alle n ∈ N0 gilt, dass 0 nicht unmittelbarer Nachfolger von n ist. (v) Falls M eine Teilmenge von N0 ist, so dass 0 ∈ M und falls mit jedem m ∈ M auch der unmittelbare Nachfolger in M ist, dann gilt M = N0 . Wir definieren Addition und Multiplikation natürlicher Zahlen. Es sei k ∈ N0 . Dann bezeichnet k 0 den unmittelbaren Nachfolger von k. Wir setzen für alle n, m ∈ N0 0+n m0 + n =n = (n + m)0 0·n=0 m0 · n = m · n + n Es seien n, m ∈ N0 . Wir sagen, dass n ≤ m gilt, wenn ein k ∈ N0 mit n + k = m existiert. Lemma 1.5.3 (N0 , ≤) ist eine wohlgeordnete Menge. Lemma 1.5.4 Die Addition in N0 erfüllt folgende Eigenschaften. (i) (Assoziativität) Für alle m, n, p ∈ N0 gilt m + (n + p) = (m + n) + p 28 CHAPTER 1. (ii) (Kommutativität) Für alle m, n ∈ N0 gilt m+n=n+m (iii) Für alle m, n, p ∈ N0 gilt p+m=p+n ⇔ m=n ⇔ m≤n (iv) Für alle m, n, p ∈ N0 gilt p+m≤p+n (v) Für alle m, n ∈ N0 mit m ≤ n gibt es ein p ∈ N0 mit m+p=n (vi) Für alle m, n ∈ N0 mit m + n = 0 gilt m = 0 = n. Beweis. (i) Es seien n, p ∈ N und M = {m ∈ N0 |m + (n + p) = (m + n) + p} Offensichtlich gilt, dass 0 ∈ M . Nun prüfen wir nach, dass mit m ∈ M auch der Nachfolger m0 von m in M liegt. Da m ∈ M , folgt m0 +(n+p) = (m+(n+p))0 = ((m+n)+p)0 = (m+n)0 +p = (m+n)0 +p = (m0 +n)+p Nun wenden wir Lemma 1.5.1 auf M an und erhalten M = N0 . (v) Es seien m, n ∈ N0 mit m ≤ n. Wir betrachten M = {k ∈ N0 |k + m ≥ n} M ist nicht leer, weil n ∈ M . Da N0 wohlgeordnet ist, hat M ein kleinstes Element p. Falls p + m = n gilt, ist der Beweis beendet. Falls nicht, so gilt p+m>n Es folgt, dass p 6= 0. Nach Lemma 1.5.1 ist p Nachfolger eines Elementes q. Es gilt also q 0 = p und n < q 0 + m = (q + m)0 Hieraus folgt n≤q+m Somit gilt q < p und deshalb q ∈ M . Dies ist ein Widerspruch, also ist unsere Annahme, dass p + m 6= n gilt, falsch. 2 1.5. DIE NATÜRLICHEN ZAHLEN N 29 Lemma 1.5.5 Die Multiplikation in N0 erfüllt die folgenden Eigenschaften. (i) (Assoziativität) Für alle m, n, p ∈ N0 gilt m(np) = (mn)p (ii) (Kommutativität) Für alle m, n ∈ N0 gilt mn = nm (iii) (Distributivität) Für alle m, n, p ∈ N0 gilt m(n + p) = mn + mp und (n + p)m = nm + pm (iv) Für alle m, n, p ∈ N0 mit p 6= 0 gilt ⇐⇒ m<n pm < pn (vi) Für alle m, n ∈ N0 mit mn = 0 gilt m=0 oder n=0 Definition 1.5.1 Eine natürliche Zahl heißt Primzahl, wenn sie größer oder gleich 2 ist und nur durch 1 oder sich selbst ganzzahlig teilbar ist. Beispiel 1.5.1 Es gibt unendlich viele Primzahlen. Beweis. Wir nehmen an, es gäbe nur endlich viele Primzahlen p1 , . . . , p n Wir behaupten nun, dass n Y ! pi +1 i=1 auch eine Primzahl ist. Wenn dem so ist, dann sind wir fertig. Wir nehmen nun an, das es keine Primzahl ist. Dann gibt es zwei Zahlen k und p mit ! ! n n Y Y 1 < k, p < pi + 1 und kp = pi + 1 i=1 Wir betrachten die Menge ( k 1 < k, p < n Y i=1 i=1 ! pi + 1 ∧ ∃p : kp = n Y ! pi ) +1 i=1 Diese Menge hat ein kleinstes Element k0 . k0 ist eine Primzahl, anderfalls wäre sie nicht das kleinste Element. Also gilt k0 = pi0 für ein i0 mit 1 ≤ i0 ≤ n und ! n Y pi0 p = pi + 1 i=1 30 CHAPTER 1. Wir setzen nun p̃ = n Y pi i=1 i6=i0 Dann gilt p̃ < p und pi0 p = pi0 p̃ + 1 Da p̃ < p gibt es ein p̃˜ ≥ 1 mit ˜ = pi0 p̃ + 1 pi0 (p̃ + p̃) Es folgt, dass pi0 p̃˜ = 1 und damit pi0 = 1 Dies ist ein Widerspruch. Satz 1.5.1 Es sei n ∈ N. Dann gibt es m ∈ N, paarweise verschiedene Primzahlen p1 , . . . , pm und k1 , . . . , km ∈ N mit n= m Y k pj j j=1 Beispiel 1.5.2 Die Zahlen 2n − 1, n ∈ N, werden Marsenne-Zahlen genannt. Es ist eine offenes Problem, ob es unendlich viele Marsenne-Primzahlen gibt. Man weiss, dass n eine Primzahl sein muss, falls 2n − 1 eine Primzahl ist. Man weiss nicht, ob es unendlich viele Primzahlen n gibt, so dass 2n − 1 keine Primzahl ist. Wir definieren 0! = 1 n! = n · (n − 1)! und n n! = k k!(n − k)! Falls n ∈ N0 und k ∈ N, dannn schreiben wir nk := |n · n{z· · · n} k Für n ∈ N0 setzen wir n0 = 1. Es gilt also insbesondere 00 = 1. Gegen Ende der der 1630er Jahre notierte Pierre de Fermat auf dem Rand einer Buchseite, dass er einen wunderbaren Beweis für die folgende Behauptung gefunden habe: Es sei n ∈ N mit n ≥ 3. Dann gilt für alle x, y, z ∈ N xn + y n 6= z n Mitte der 90er Jahre wurde dies von Andrew Wiles bewiesen. 1.6. DIE GANZEN ZAHLEN Z 1.6 31 Die ganzen Zahlen Z Wir erhalten die ganzen Zahlen, wenn wir zu N0 die negativen Zahlen hinzunehmen. 1.7 Die rationalen Zahlen Q Wir betrachten das Cartesische Produkt Z × {Z \ {0}}. Für (p, q) schreiben wir auch pq . Wir führen auf dieser Menge eine Äquivalenzrelation ein. Wir sagen, dass t p ∼ q r gilt, wenn pr = qt gilt. Die rationalen Zahlen Q ist die Menge der Äquivalenzklassen p p r r = . ∼ q t t q Hiermit stellen 21 und 24 dieselbe rationale Zahl dar. Wir definieren zwei Verknüpfungen, Addition und Multiplikation auf den rationalen Zahlen: h i u pw + qu p + = q w qw h i pu p u = q w qw Lemma 1.7.1 (i) Addition und Multiplikation auf den rationalen Zahlen sind wohldefiniert. (ii) Addition und Multiplikation sind kommutativ. Beweis. (i) Wir zeigen, dass die Addition wohldefiniert ist. Dazu müssen wir zeigen, dass die Addition nicht von der Wahl des Repräsentanten abhängt. Es seien x, y ∈ Q und pq11 , rt11 ∈ x und pq22 , rt22 ∈ y jeweils zwei Repräsentanten. Wir müssen zeigen, dass p1 q2 + p2 q 1 r1 t2 + r2 t1 ∼ , q1 q2 t1 t2 bzw. (1.3) (p1 q2 + p2 q1 )t1 t2 = (r1 t2 + r2 t1 )q1 q2 . Da r1 q1 = t1 p1 r2 q2 = t2 p2 folgt aus p1 q2 t1 t2 + p2 q1 t1 t2 = p1 q2 t1 t2 + p2 q1 t1 t2 32 CHAPTER 1. die Gleichung p1 q2 t1 t2 + p2 q1 t1 t2 = r1 t2 q1 q2 + r2 t1 q1 q2 . und damit (1.3). (ii) Wir zeigen, dass die Addition kommutativ ist. h i h i p u pw + qu wp + uq u p + = = = + q w qw wq w q 2 Wir führen auf Q eine Ordnung ein. Wir sagen, dass x ∈ Q die Ungleichung 0 ≤ x erfüllt, wenn es n ∈ N0 und m ∈ N mit hni x= m gibt. Wir sagen, dass x, y ∈ Q die Ungleichung x ≤ y erfüllen, wenn 0 ≤ y − x. Lemma 1.7.2 Für alle rationalen Zahlen x, y ∈ Q mit x < y gibt es eine rationale Zahl z ∈ Q mit x < z < y. Beweis. Wir wählen z = 21 (x + y). Dann gilt 1 1 1 x = (x + x) < (x + y) < (y + y) = y. 2 2 2 2 1.8 Körper Definition 1.8.1 Eine Menge K mit zwei Verknüpfungen +, · und mit mindestens zwei Elementen bildet einen Körper (K, +, ·), wenn für alle x, y ∈ K die Verknüpfungen x+y ∈K x·y ∈K eindeutig definiert sind und wenn für alle x, y, z ∈ K die folgenden Eigenschaften gelten. (i) x + y = y + x (ii) (x + y) + z = x + (y + z) (iii) Es gibt ein Element 0 ∈ K, so dass für alle x ∈ K die Gleichung x + 0 = x gilt. (iv) Zu jedem Element x ∈ K gibt es ein Element −x ∈ K, so dass x + (−x) = 0 gilt. (v) xy = yx (vi) (xy)z = x(yz) 1.8. KÖRPER 33 (vii) Es gibt ein Element 1 ∈ K, so dass 1 6= 0 und so dass für alle x ∈ K gilt, dass 1 · x = x. (viii) Für alle x ∈ K mit x 6= 0 gibt es ein Element 1 x ∈ K mit x · 1 x = 1. (ix) (x + y)z = xz + yz Beispiel 1.8.1 (i) N und Z bilden mit der üblichen Addition und Multiplikation keinen Körper. Es gibt i.A. keine multiplikativen inversen Elemente. (ii) (Q, +, ·) ist ein geordneter Körper. (iii) K = {0, 1} ist mit den folgenden Verknüpfungen ein Körper. 0+0=0 0+1=1 1+1=0 0·0=0 0·1=0 1·1=1 Beweis. (ii) Die Addition ist kommutativ. h i h i p ps + qr sp + rq p r r = + + = = q s qs sq s q Die Addition ist assoziativ. h i r t p + + q s u ps + qr t (ps + qr)u + qst + = qs u qsu h i psu + q(ru + st) t p r = + = + qsu q s u 0 Als das neutrale additive Element wählen wir 1 . Es gilt p 0 p + = q 1 q h i h i Als das inverse additive Element zu pq wählen wir −p q . Dann gilt = −p 0 p + = q q q·q Die Multiplikation ist kommutativ. h i h i p r pr rp r p = = = q s qs sq s q Das neutrale, multiplikative Element ist [ 11 ]. 2 Lemma 1.8.1 Es sei (K, +, ·) ein Körper und x ∈ K. Dann sind die additiven und multiplikativen, inversen Elemente zu x eindeutig. Weiter gelten x = −(−x) und x = (x−1 )−1 . Beweis. Wir nehmen an, dass es ein x ∈ K gibt, das zwei verschiedene, additive Inverse y und z besitzt. Dann gilt x + y = 0 = x + z. 34 CHAPTER 1. Nun addieren wir y auf beiden Seiten der Gleichung y+x+y =y+x+z also y = z. Die Gleichung x = −(−x) folgt aus der Eindeutigkeit der additiven Inversen. 2 Wir erinnern daran, dass x < y bedeutet, dass x ≤ y und x 6= y gelten. Definition 1.8.2 Ein Körper (K, +, ·) mit einer Ordnung ≤ heißt geordneter Körper, falls gelten: (i) Für alle x, y, z ∈ K mit x < y gilt x + z < y + z. (ii) Für alle x, y, z ∈ K mit x < y und 0 < z gilt, dass x · z < y · z. (Q, +, ·) ist mit der üblichen ≤-Ordnung ein geordneter Körper. Der Absolutbetrag von x ∈ K ist durch falls x > 0 x 0 falls x = 0 |x| = −x falls x < 0 definiert. Lemma 1.8.2 Es sei (K, +, ·, ≤) eine geordneter Körper mit Ordnung ≤. (i) Es gilt genau dann x > 0, wenn −x < 0. (ii) Für alle x ∈ K gilt |x| = | − x|. Beweis. (i) Es sei x > 0. Es folgt aus 0 < x −x < (−x) + x = 0 Also gilt −x < 0. (ii) Es gilt −x 0 | − x| = −(−x) Wegen x = −(−x) 2 −x 0 | − x| = x falls − x > 0 falls x = 0 falls − x < 0 falls − x > 0 falls x = 0 falls − x < 0 1.8. KÖRPER 35 Lemma 1.8.3 Es sei (K, +, ·, ≤) ein geordneter Körper. Für alle x, y ∈ K gelten (i) x ≤ |x| (ii) |x| = 0 genau dann, wenn x = 0. (iii) (Dreiecksungleichung) |x + y| ≤ |x| + |y| (iv) 0 · x = 0 (v) (Inverse Dreiecksungleichung) ||x| − |y|| ≤ |x + y| Beweis. (i) Wir haben drei Fälle. Falls x > 0, dann gilt nach Definition x = |x|. Falls x = 0, dann folgt |x| = 0 = x. Falls x < 0, dann gilt |x| = −x. Im letzten Fall müssen wir zeigen, dass 0 < −x, falls x < 0. Dies gilt wegen Lemma 1.8.2. (ii) folgt direkt aus der Definition des Absolutbetrages. (iii) Wir haben wiederum drei Fälle. Falls x + y > 0, dann gilt |x + y| = x + y Wegen (i) folgt nun |x + y| = x + y ≤ |x| + |y| Falls x + y = 0, dann folgt wieder wegen (i) |x + y| = 0 = x + y ≤ |x| + |y| Falls x + y < 0, dann gilt |x + y| = −(x + y) = (−x) + (−y) ≤ | − x| + | − y| = |x| + |y| (iv) Mit −(x · 0) bezeichnen wir das additive inverse Element zu x · 0. Dann gilt 0 = x · 0 + (−(x · 0)) = x(0 + 0) + (−(x · 0)) = x · 0 + x · 0 + (−(x · 0)) = x · 0. (v) Mit der Dreiecksungleichung folgt |(x + y) − y| ≤ |x + y| + |y|. Also gilt |x| − |y| ≤ |x + y|. Nun vertauschen wir die Rollen von x und y und erhalten |y| − |x| ≤ |x + y|. Aus beiden Ungleichungen folgt ||x| − |y|| ≤ |x + y|. 2 36 CHAPTER 1. Definition 1.8.3 Ein geordneter Körper (K, +, ·, ≤) heißt archimedisch, wenn für alle x, y ∈ K mit 0 < x < y ein n ∈ N existiert, so dass y≤x · · · + x} . | + x{z n Lemma 1.8.4 (Archimedes, 287-212 v. Chr.) (Q, +, ·, ≤) ist ein archimedischer Körper. Beweis. Es seien x, y ∈ Q mit 0 < x < y. Dann gibt es p, q, k, ` ∈ N mit p k x= und y= . q ` Wegen x < y gilt pl < kq. Wir wählen n = kq. Dann gilt p kp x | +x+ {z· · · + x} = kq q = 1 . n Wegen kp` ≥ k folgt x | +x+ {z· · · + x} ≥ y. n 2 1.9 Supremum und Infimum Definition 1.9.1 Es sei X eine Menge mit einer Ordnung ≤ und A sei eine Teilmenge von X. Ein Element x ∈ A heißt Maximum von A, falls x ∈ A und falls für alle y ∈ A gilt y ≤ x. Ein Element x ∈ A heißt Minimum von A, falls x ∈ A und falls für alle y ∈ A gilt y ≥ x. Definition 1.9.2 Es sei X eine Menge mit einer Ordnung ≤. Eine Teilmenge A von X heißt nach oben beschränkt, wenn es ein c ∈ X gibt, so dass für alle x ∈ A gilt x ≤ c. c heißt obere Schranke von A. Eine Teilmenge A heißt nach unten beschränkt, wenn es ein c ∈ X gibt, so dass für alle x ∈ A gilt c ≤ x. c heißt untere Schranke von A. Das Supremum c einer Teilmenge A ist die kleinste, obere Schranke dieser Menge, d.h. c ist obere Schranke von A und für alle oberen Schranken c0 von A gilt c ≤ c0 . Das Infimum c einer Teilmenge A ist die größte, untere Schranke dieser Menge, d.h. c ist untere Schranke von A und für alle unteren Schranken c0 von A gilt c ≥ c0 . Falls eine Menge ein Maximum besitzt, dann ist das Maximum auch Supremum dieser Menge. Ebenso ist das Infimum gleich dem Minimum, falls es existiert. 1.10. MATHEMATISCHE INDUKTION 37 Beispiel 1.9.1 Im folgenden betrachten wir Teilmengen von Q mit der üblichen Ordnung ≤. (i) Die Teilmenge A = {q ∈ Q|q ≤ 1} von Q hat 1 als Maximum und Supremum. (ii) Die Menge B = {q ∈ Q|q < 1} besitzt die kleinste obere Schranke 1. Die Menge B besitzt kein Maximum. (iii) Die Teilmenge C = {q ∈ Q|q 2 < 2} von Q besitzt weder Maximum noch Supremum in Q. Beweis. (i) 1 ist Maximum, weil 1 ∈ A und weil für alle x ∈ A gilt x ≤ 1. (ii) 1 ist obere Schranke von B. Wir müssen noch zeigen, dass es die kleinste, obere Schranke ist. Wir nehmen an, dass 1 nicht die kleinste, obere Schranke ist. Dann gibt es ein q ∈ Q mit q < 1, so dass für alle s ∈ B gilt s ≤ q. Nach Lemma 1.7.2 gibt es zu q und 1 ein r ∈ Q mit q < r < 1. Dies kann nicht sein. √ (iii) Anschaulich ist die Aussage klar: Falls C ein Supremum besitzt, dann müsste dies 2 √ sein. 2 ist aber keine rationale Zahl. Der vollständige Beweis ist unter Beispiel 2.10.3 geführt. 2 1.10 Mathematische Induktion Die vollständige Induktion ist ein Beweisverfahren. Wir nehmen an, dass wir für jedes n ∈ N eine Aussage A(n) haben, und wir wollen zeigen, dass alle diese Aussagen richtig sind. Es reicht nicht aus, ein paar Fälle, z.B. für n = 1, . . . , 10 die Aussagen A(n) nachzuweisen. Hierzu das folgende Beispiel, das bereits von Leonhard Euler betrachtet wurde. Beispiel 1.10.1 (i) Ist für alle n ∈ N die Zahl n2 − n + 41 eine Primzahl? Für n = 1, . . . , 11 erhalten wir die Zahlen 41, 43, 47, 53, 61, 71, 83, 97, 113, 131, 151. Dies sind alles Primzahlen. Allerdings erhalten wir für n = 41 die Zahl 412 , was keine Primzahl ist. (ii) Ist die Zahl nk − n für alle n ∈ N und alle ungeraden k ∈ N durch k ganzzahlig teilbar? Man weiss, dass n3 − n durch 3 teilbar ist, n5 − n durch 5 und n7 − n durch 7. Man könnte nun schließen bzw. vermuten, dass dies für alle ungeraden natürlichen Zahlen gilt. Dies ist nicht der Fall, weil 29 − 2 = 510 und diese Zahl ist nicht durch 9 teilbar. (Kleiner Satz von Fermat: Dies gilt, falls k eine Primzahl ist.) Mathematische Induktion (i) (Induktionsanfang) Wir beweisen, dass A(1) gilt. (ii) (Induktionsschritt) Wir beweisen, dass unter der Annahme, dass A(n) gilt, auch A(n + 1) gilt. Nach Lemma 1.5.1 (v) haben wir dann für alle n ∈ N die Aussagen gezeigt. Dieses Beweisprinzip gleicht Dominosteinen, die wir in einer Reihe aufstellen. Wenn wir den ersten Dominostein anstoßen, kippt er gegen den nächsten, der dann umkippt. In einer Welle fällt die gesamte Reihe. Beispiel 1.10.2 Für alle n ∈ N ist die Zahl 23n − 1 durch 11 teilbar. 38 CHAPTER 1. Beweis. Für n = 1 erhalten wir die Zahl 231 − 1 = 22, die durch 11 teilbar ist. Falls 23k − 1 durch 11 teilbar ist, dann ist auch 23k+1 − 1 = 23 · 23k − 1 = 22 · 23k + (23k − 1) durch 11 teilbar. 2 Beispiel 1.10.3 Für alle k, ` ∈ N mit k < ` und für alle n ∈ N gilt k n < `n . Beweis. Der Induktionsanfang n = 1: k < `. Nun der Induktionsschritt. Wir nehmen an, dass k n < `n . Mit den Rechenregeln für die natürlichen Zahlen folgt k n+1 < k · `n < `n+1 . 2 Beispiel 1.10.4 (i) Für alle n ∈ N gilt n X k= k=1 (ii) Für alle n ∈ N gilt n X k2 = k=1 (iii) Für alle n ∈ N gilt n(n + 1) . 2 1 n(n + 1)(2n + 1). 6 n X 1 1 =1− n j 2 2 j=1 Beweis. (i) Wir überprüfen A(1). 1= 1(1 + 1) 2 Wir nehmen an, dass A(n) wahr ist, also n X k=1 k= n(n + 1) 2 Nun zeigen wir, dass dann auch A(n + 1) wahr ist. n+1 X k=1 k= n X k + (n + 1) = k=1 n(n + 1) (n + 1)(n + 2) + (n + 1) = 2 2 (ii) Der Induktionsanfang: 1 X k=1 k2 = 1 = 1 1 · 2 · 3. 6 1.10. MATHEMATISCHE INDUKTION 39 Der Induktionsschritt n+1 X k 2 n X = k=1 ! k 2 + (n + 1)2 = k=1 1 n(n + 1)(2n + 1) + (n + 1)2 6 1 1 (n + 1) {n(2n + 1) + 6n + 6} = (n + 1) 2n2 + 7n + 6 . 6 6 = Wir beobachten 2n2 + 7n + 6 = (n + 2)(2n + 3) = (n + 2)(2(n + 1) + 1). Es folgt n+1 X k2 = k=1 1 (n + 1)(n + 2)(2(n + 1) + 1). 6 2 Beispiel 1.10.5 Für alle n ∈ N gilt n X 1 1 ≤2− 2 k n (1.4) k=1 Beweis. Wir zeigen den Induktionsanfang. 1 X 1 1 =1≤2− . k2 1 k=1 Nun der Induktionsschritt. Mit der Induktionsannahme folgt ! n+1 n X 1 X 1 1 1 1 = + ≤2− + . 2 2 2 k k (n + 1) n (n + 1)2 k=1 k=1 Weiter gilt für alle n ∈ N 1 (n + 1)2 − n n2 + n + 1 1 n2 + n + 1 1 1 − = = = · < . n (n + 1)2 n(n + 1)2 n(n + 1)2 n+1 n2 + n n+1 Es folgt (2.18). 2 Beispiel 1.10.6 Für alle n ∈ N gilt 2n n X1 ≤ . 2 k k=1 Beweis. Die Ungleichung ist für n = 1 erfüllt: 2 1 3 X1 ≤ = 2 2 k k=1 Nun der Induktionsschritt n+1 2X k=1 2 n n+1 2 2X 1 X1 = + k k n k=1 k=2 +1 1 n 1 n+1 ≥ + 2n n+1 = k 2 2 2 40 CHAPTER 1. Beispiel 1.10.7 (Bernoulli Ungleichung) Für alle x ∈ Q mit 1 + x > 0 und x 6= 0 und für alle n = 2, 3, . . . gilt 1 + nx < (1 + x)n . Wie man nachträglich verifizieren kann, gilt die Bernoulli Ungleichung auch für reelle Zahlen. Beweis. Wir benutzen Induktion. Da x2 > 0 gilt, folgt (1 + x)2 = 1 + 2x + x2 > 1 + 2x. Wir nehmen an, diese Aussage sei für n richtig und schließen auf n + 1. (1 + x)n+1 = (1 + x)n (1 + x) > (1 + nx)(1 + x) = 1 + (n + 1)x + nx2 > 1 + (n + 1)x. 2 Beispiel 1.10.8 (Binomische Formel) Für alle x, y ∈ Q und alle n ∈ N gilt n X n n−k k n (x + y) = y , x k k=0 wobei die Binomialkoeffizienten durch n n! = k!(n − k)! k (1.5) gegeben sind. Insbesondere erhält man die Bernoulli Ungleichung n 1 + nx ≤ (1 + x) . Die binomische Formel wird hier für rationale Zahlen bewiesen, weil wir die reellen Zahlen noch nicht eingeführt haben. Sie gilt natürlich auch für alle reellen Zahlen. Der Beweis für reelle Zahlen ist derselbe. Beweis. Wir benutzen Induktion. Für n = 1 ist die Aussage offensichtlich richtig. Nun machen wir den Induktionsschritt von n auf n + 1. Es gilt n X n n−k k x y (x + y)n = k k=0 Hieraus folgt (x + y)n+1 (x + y)(a + y)n n n X n n+1−k k X n n−k k+1 = x y + x y k k k=0 k=0 n n n n+1 X n n−k+1 k X n n n+1 = x + x y + xn+1−k y k + y 0 k k−1 n k=1 k=1 n n n+1 X n n n n+1 = x + + xn+1−k y k + y . 0 k k−1 n = k=1 Weiter gilt n n n+1 + = k k−1 k 1.10. MATHEMATISCHE INDUKTION 41 weil n n + = k k−1 = n! n! + k!(n − k)! (k − 1)!(n − k + 1)! n!((n − k + 1) + k) n+1 = . k!(n − k + 1)! k Somit (x + y)n+1 = n+1 X k=0 Aus der binomischen Formel mit x = 1 und y = 1 1+ n n = n X n k=0 k n −k n + 1 n+1−k k x y . k 1 n folgt 1 X n −k ≥ n =1+1=2 k k=0 2 Mathematische Induktion, 1. Variation (i) Wir beweisen, dass A(k0 ) gilt. (ii) Wir beweisen, dass unter der Annahme, dass A(n) gilt, auch A(n+1) für k0 ≤ n gilt. Nach Lemma 1.5.1 (v) haben wir dann alle Aussagen gezeigt. Beispiel 1.10.9 (i) Für alle n ∈ N gilt (ii) Für alle n ∈ N mit 5 ≤ n gilt n < 2n . n2 < 2n Beweis. (i) Für den Induktionsanfang n = 1 erhalten wir 1 < 2. Nun der Induktionsschritt. 2n+1 = 2 · 2n > 2 · n ≥ n + 1. Die letzte Ungleichung gilt, weil 2n ≥ n + 1 äquivalent zu n≥1 ist. (ii) Für n = 5 erhalten wir 25 < 32. Nun der Induktionsschritt 2n+1 = 2 · 2n > 2 · n2 . Für alle n ≥ 5 gilt (n + 1)2 ≤ 2n2 . In der Tat, 2n2 − (n + 1)2 = n2 − 2n − 1 = (n − 1)2 − 2 Der letzte Ausdruck ist für n ≥ 3 strikt positiv. 2 Beispiel 1.10.10 Für alle n ≥ 4 gilt 2n ≤ n! 42 CHAPTER 1. Beweis. A(4) ist wahr: 24 = 16 < 24 = 4! Wir nehmen an, dass 2n ≤ n! gilt. Mit dieser Ungleichung und der Ungleichung 2 < n + 1 folgt 2n+1 = 2 · 2n ≤ 2n! ≤ (n + 1)n! = (n + 1)! 2 Beispiel 1.10.11 Für alle n ∈ N mit n ≥ 6 gilt 2n ≤ nn n! Beweis. Wir sollen also 2n n! ≤ nn nachweisen. Für n = 6 erhalten wir 66 = 363 = 46656 und 26 · 6! = 64 · 720 = 46080 Nun der Induktionsschritt (n + 1)!2n+1 (n + 1)n!2 · 2n ≤ 2(n + 1)nn n n (n + 1)n+1 = 2(n + 1)( ) (n + 1)n = 2 n+1 (1 + n1 )n = Mit der Bernoulli Ungleichung (Beispiel 1.10.7) (1 + 1 n ) ≥ 2. n Weiter folgt 2 (n + 1)!2n+1 ≤ (n + 1)n+1 . Mathematische Induktion, 2. Variation (i) Wir beweisen, dass A(1) gilt. (ii) Wir beweisen, dass unter der Annahme, dass A(1), . . . , A(n) gelten, auch A(n + 1) gilt. Wiederum nach Lemma 1.5.1 (v) haben wir dann alle Aussagen gezeigt. Das nächste Beispiel benutzt im Induktionsschritt nicht nur die Annahme A(n), sondern A(1), . . . , A(n). Beispiel 1.10.12 Jede natürliche Zahl n mit n ≥ 2 ist ein Produkt von Primzahlen. Beweis. Der Induktionsanfang: n = 2. In diesem Fall ist 2 Primzahl und damit Produkt von Primzahlen. Es sei n ∈ N und es gelte für alle k ∈ N mit 2 ≤ k ≤ n, dass k ein Produkt von Primzahlen ist. Wir betrachten nun n + 1. Falls n + 1 eine Primzahl ist, sind wir fertig. Falls n + 1 keine Primzahl ist, dann gibt es k1 , k2 ∈ N mit k1 · k2 = n. Nach Induktionsannahme sind k1 und k2 Produkte von Primzahlen. 2 Beispiel 1.10.13 Alle Katzen haben dieselbe Augenfarbe. Das folgende Argument ist falsch, wo liegt der Fehler? Eine Katze allein hat dieselbe Augenfarbe. Nun der Schritt von n auf n + 1. Es seien n + 1 Katzen gegeben. Nach Induktionsannahme haben jeweils n davon dieselbe Augenfarbe, damit auch n + 1. Der Fehler liegt beim Schluss von 1 auf 2. 1.11. MÄCHTIGKEIT 1.11 43 Mächtigkeit Felix Bernstein wurde am 14. Februar 1878 in Halle an der Saale geboren, er starb am 3. Dezember 1956 in Zürich. Er lehrte in Göttingen. Er gründete 1918 in Göttingen das Institut für mathematische Statistik. 1919 wurde er zum Reichskommissar für Anleihen ernannt.1924 klärte er mittels statistischer Analyse den AB0-Blutgruppen Erbgang. 1934 wurde ihm von den Nazis der Lehrstuhl entzogen und er emigrierte in die USA. Ernst Schröder wurde am 25. November 1841 in Mannheim geboren und er starb am 16. Juni 1902 in Karlsruhe. Er lehrte in Darmstadt und Karlsruhe. Wir wollen den Begriff der Anzahl für endliche und unendliche Mengen definieren. Definition 1.11.1 Es seien K und M zwei Mengen. Wir sagen, dass K eine kleinere oder gleiche Mächtigkeit oder Kardinalität als M besitzt, wenn es eine injektive Abbildung von K nach M gibt. Symbolisch schreiben wir dies als card(K) ≤ card(M ). Falls sowohl card(K) ≤ card(M ) als auch card(M ) ≤ card(K) gelten, dann sagen wir, dass K und M dieselbe Mächtigkeit besitzen und schreiben dafür card(K) = card(M ). Zwei endliche Mengen M und K haben genau dann dieselbe Kardinalität oder Mächtigkeit, wenn sie dieselbe Anzahl von Elementen besitzen. Man beachte, dass aus den Ungleichungen card(K) ≤ card(M ) und card(M ) ≤ card(K) nicht unmittelbar folgt, dass es eine Bijektion zwischen K und M gibt. Aus den beiden Ungleichungen folgt nur, dass es eine injektive Abbildung von K nach M und eine injektive Abbildung von M nach K gibt. Diese beiden müssen nichts miteinander zu tun haben. Der Satz von Cantor-Bernstein-Schröder stellt allerdings genau dies sicher. Satz 1.11.1 (Cantor-Bernstein-Schröder) Es seien K und M Mengen. Dann gelten (i) Es gibt eine injektive Abbildung von K nach M oder von M nach K. (ii) Es gibt genau dann eine injektive Abbildung von K nach M , wenn es eine surjektive Abbildung von M nach K gibt. (iii) Falls es eine injektive Abbildung von K nach M und eine surjektive Abbildung von K nach M gibt, dann gibt es eine Bijektion zwischen K und M . Korollar 1.11.1 Es seien K und M Mengen. Dann gelten (i) Es gelten card(K) ≤ card(M ) oder card(M ) ≤ card(K). (ii) Es gilt genau dann card(K) ≤ card(M ), wenn es eine surjektive Abbildung von M nach K gibt. (iii) Es gilt genau dann card(K) = card(M ), wenn es eine bijektive Abbildung von K nach M gibt. 44 CHAPTER 1. Wir sagen, dass eine Menge M abzählbar ist, falls card(M ) ≤ card(N). Falls eine Menge nicht abzählbar ist, dann nennen wir sie überabzählbar. Der Äquivalenzsatz wurde 1887 von Cantor formuliert. 1897 bewies der 19jährige Bernstein diesen Satz. Schröder bewies unabhängig ebenfalls diesen Satz. Dedekind bewies diesen Satz bereits 1887, veröffentlichte den Beweis aber nicht. Der Beweis wurde nach seinem Tod in seinen Aufzeichnungen gefunden. Wir beweisen den Satz hier mit Hilfe des Auswahlaxioms. Man kann ihn auch ohne das Auswahlaxiom beweisen. Beweis. (i) Es sei I die Menge aller Injektionen von einer Teilmenge von X in eine Teilmenge von Y . Wir führen auf I eine Halbordnung ein: Wir setzen I ≤ J, falls Def(I) ⊆Def(J) und J|Def(I) = I. Wir wenden das S Lemma von Zorn an (Lemma 1.4.1). Jede Kette K in I hat eine obere Schranke I0 : I∈K Def(I) → Y I0 (x) = I(x) falls x ∈ Def(I) Deshalb gibt es ein maximales Element Imax . Der Definitionsbereich Def(Imax ) ist gleich X oder der Bildbereich Bild(Imax ) ist gleich Y . Falls nicht, so gibt es x0 ∈ X \ Def(Imax ) y0 ∈ Y \ Bild(Imax ) Nun definieren wir ( I˜max (x) = Imax y0 x ∈ Def(Imax ) x = x0 Also ist Imax kein maximales Element. (ii) Es sei I : X → Y eine Injektion und x0 ∈ X. Dann ist S : Y → X mit ( x I(x) = y S(y) = x0 y∈ / Bild(I) eine Surjektion. Es sei S : Y → X eine Surjektion. Wir betrachten das Mengensystem {y|S(y) = x} x∈X Nach dem Auswahlaxiom gibt es eine Auswahlmenge A = {yx |x ∈ X} Wir definieren nun die Injektion I : X → Y durch I(x) = yx . (iii) Es gibt zwei injektive Abbildungen φ : K → M und ψ : M → K. Wir betrachten x0 ∈ K. Falls x ∈ {ψ(y)|y ∈ M }, dann existiert ψ −1 (x0 ). Falls ψ −1 (x0 ) ∈ {φ(x)|x ∈ K}, dann existiert φ−1 (ψ −1 (x0 )). Diesen Prozess können wir so fortsetzen. Entweder der Prozess bricht nach endlich vielen Schritten ab, oder er lässt sich unendlich oft wiederholen. Falls er nach endlich vielen Schritten abbricht, ergeben 1.11. MÄCHTIGKEIT 45 sich zwei Fälle: der Prozess endet mit einem Element aus K \ {ψ(y)|y ∈ M } oder mit einem Element aus M \ {φ(x)|x ∈ K}. Damit zerlegt sich K in drei Mengen K∞ , KK und KM . Ebenso zerlegt sich M in drei Mengen M∞ , MM und MK . Nun konstruieren wir die Bijektion.φ bildet K∞ bijektiv auf M∞ und MM auf KM ab. ψ bildet KK bijektiv auf XK . Nun setzen wir die beiden Abbildungen zusammen. 2 Die Potenzmenge P(M ) einer Menge M ist die Menge aller Teilmengen von M (Axiom 1.3.1). Lemma 1.11.1 (Cantor) Es sei M eine Menge. Dann gilt card(M ) < card(P(M )). Die Potenzmenge der leeren Menge hat genau ein Element, nämlich die leere Menge. Die Potenzmenge einer Menge mit n Elementen besitzt 2n Elemente. Beweis. Wir zeigen zunächst card(M ) ≤ card(P(M )). Wir geben dazu eine Injektion von M nach P(M ) an. Die Abbildung j : M → P(M ) sei durch j(x) = {x} gegeben. Sie ist offensichtlich eine Injektion. Wir zeigen nun, dass card(M ) 6= card(P(M )). Wir nehmen an, dass es eine Bijektion i : M → P(M ) gibt. Wir betrachten die Menge f = {x ∈ M |x ∈ M / i(x)}. f kann durchaus die leere Menge sein.) Da i eine Bijektion ist, gibt es ein x0 mit (M f. Dazu betrachten wir zwei Fälle. Falls x0 ∈ M̃ , dann i(x0 ) = M f = {x ∈ M |x ∈ x0 ∈ M / i(x)}. f, was ein Widerspruch ist. Falls x0 ∈ f, dann Es folgt, dass x0 ∈ / i(x0 ) = M /M f = {x ∈ M |x ∈ x0 ∈ /M / i(x)}. f erfüllt, also x0 ∈ M f, Dies bedeutet, dass x0 nicht die Bedingung x0 ∈ / i(x0 ) = M was wiederum ein Widerspruch ist. Also gibt es keine Bijektion. 2 Beispiel 1.11.1 (i) card(N) = card(N0 ). (ii) card(N) = card(Z) (iii) card(N × N) = card(N) (iv) card(N) < card(P(N)) (v) card(N) = card(Q) 46 CHAPTER 1. Wir geben eine geometrische Abzählung der Menge N × N an. Wir beginnen im Punkt (1, 1), gehen dann zum Punkt (2, 1) und danach zum Punkt (1, 2). (3,1) (2,1) (1,1) (2,2) (1,2) (1,1) (1,3) Beweis. (i) Es sei ψ : N0 → N durch ψ(n) = n + 1 gegeben. Dann ist ψ bijektiv. (ii) Es gibt eine bijektive Abbildung zwischen Z und N0 . Eine bijektive Abbildung ist φ : N0 → Z mit n n ∈ {2m|m ∈ N0 } 2 φ(n) = n+1 − 2 n ∈ {2m + 1|m ∈ N0 } (iii) Wir betrachten die Abbildung φ : N × N → N mit φ(k, `) = 2`−1 (2k − 1). Die Abbildung ist eine Bijektion. Wir zeigen, dass sie injektiv ist. Es seien `, `0 , k, k 0 ∈ N mit ` 6= `0 . Wir nehmen an, dass φ(k, `) = φ(k 0 , `0 ), d.h. 0 2`−1 (2k − 1) = 2` −1 (2k 0 − 1) Wir können annehmen, dass ` > `0 . Dann folgt 0 2`−` (2k − 1) = (2k 0 − 1) Dann ist die Zahl auf der linken Seite gerade und die auf der rechten Seite ungerade. Also sind sie nicht gleich. Es bleibt der Fall ` = `0 und k 6= k 0 . Dann folgt aus 0 2`−1 (2k − 1) = 2` −1 (2k 0 − 1) die Gleichung 2k − 1 = 2k 0 − 1 und damit k = k 0 . Damit ist die Abbildung injektiv. Wir zeigen nun, dass die Abbildung surjektiv ist. Falls n eine ungerade Zahl ist, dann gilt für k = n+1 2 und ` = 1 n = 2`−1 (2k − 1) und s gilt φ(k, `) = n. Nun der Fall, dass n eine gerade Zahl ist. Man kann jede natürliche Zahl als ein Produkt einer ungeraden Zahl p und einer Potenz von 2 schreiben n = 2m−1 p m ∈ N. Dies kann man direkt einsehen oder aus dem Primzahlzerlegungsatz herleiten (Satz 1.5.1). Entspechend wählen wir ` = m und k = p+1 2 . (iv) folgt aus Lemma 1.11.1. (v) Es reicht zu zeigen, dass eine eine injektive Abbildung von N nach Q gibt und eine injektive von Q nach N. Wir wenden dann (i) an. 2 1.11. MÄCHTIGKEIT 47 Wir bezeichnen card(N) auch mit ℵ0 . Falls eine Menge dieselbe Mächtigkeit wie N hat, sagen wir, dass die Menge abzählbar ist. Wenn die Mächtigkeit der Menge strikt größer als die von N ist, dann sagen wir, dass sie überabzählbar ist. Axiom 1.11.1 (Kontinuumshypothese) Es gibt keine Menge M mit card(N) < card(M ) < card(P(N)). Der Name Kontinuumshypothese rührt daher, dass die Menge P(N) dieselbe Mächtigkeit hat wie die reellen Zahlen R. Da man die reellen Zahlen mit der Zahlengeraden identifiziert spricht man hier vom Kontinuum. Die Kontinuumshypothese kann als weiteres Axiom dem Zermelo-Fraenkel Axiomensystem hinzugefügt werden. Gödel zeigte, dass die Kontinuumshypothese konsistent mit den Axiomen der Mengenlehre ist. Cohen zeigte, dass auch die Verneinung der Kontinuumshypothese konsistent mit den Axiomen der Mengenlehre ist. Als Kardinalzahl einer Menge führt man die Äquivalenzklasse aller Mengen ein, die dieselbe Mächtigkeit haben. Hierbei legen wir eine Universalmenge zugrunde. Anderenfalls wäre dies Funktion auf der Menge aller Mengen definiert, also auf einer Menge, die es nicht gibt. Wenn wir überdies noch vorziehen, Kardinalzahlen als Mengen zu definieren, so müssen die Äquivalenzklassen durch einen jeweiligen Repräsentanten ersetzen. Beispiel 1.11.2 Die Dimension des Vektorraumes R über dem Körper Q ist unendlich. Beweis. Falls der Raum keine Basis aus endlich vielen Vektoren besitzt, sagt man dass die Dimension unendlich ist. Wir nehmen an, dass die Dimension endlich ist. Dann gibt es eine Basis x1 , . . . , xn . Deshalb gilt ( n ) X R=M = ai xi |∀i = 1, . . . , n : ai ∈ Q i=1 n Es gibt eine surjektive Abbildung i : Q → M mit i(a) = n X a i xi i=1 Wir wissen aber, dass Qn dieselbe Mächtigkeit wie N hat. Das kann nicht sein, weil die Mächtigkeit von R strikt größer als die von N ist. 2 48 CHAPTER 1. Chapter 2 Die reellen Zahlen Mit Hilfe der Mengenlehre haben wir die natürlichen Zahlen N eingeführt. Hieraus bilden wir die ganzen Zahlen Z durch Hinzunahme der negativen, ganzen Zahlen. Dann erhalten wir die rationalen Zahlen Q durch Quotientenbildung. Jede Messung und insbesondere Längenmessung verbinden wir mit einer reellen Zahl. Dabei stellen wir fest, dass sich nicht jede Zahl durch einen Quotienten ganzer Zahlen darstellen lässt. So ordnen wir dem Umfang eines Kreises mit Radius 1 die Länge 2π zu und in einem Quadrat mit Seitenlänge 1 √ √ die Länge der Diagonalen ergibt sich zu 2. Beide Zahlen, π und 2, können wir nicht mit rationalen Zahlen identifizieren. Diese Zahlen sind nicht rational oder, wie wir sagen irrational. Die Forderung, dass wir jeder Messung eine Zahl zuordnen wollen, führt zu der Anschauung, dass alle reelle Zahlen eine Zahlengerade bilden. Diese erhalten wir, wenn wir eine Gerade mit einem Lineal zeichnen und uns diese Gerade bis ins Unendliche fortgesetzt vorstellen. Wir stellen uns vor, dass sich die Zahlengerade aus unendlich kleinen Partikeln zusammensetzt, nämlich den Zahlen. Von einer mathematischen Definition sind wir hiermit aber weit entfernt. Es könnte ja sein, dass die Gerade an einigen Stellen Lücken aufweist, die allerdings so klein sind, dass sie mit bloßem Auge nicht zu sehen sind. Dass alle diese Überlegungen problematisch sind, wird durch einen Beschluss der katholischen Kirche vom 10. August 1632 belegt. An diesem Tag legte die Kirche fest, dass eine Gerade nicht aus verschiedenen, unendlich kleinen Partikeln besteht. Eine solche These war damit Gotteslästerung und durfte nicht gelehrt werden [1]. Die Grundlage der Infinitesimalrechnung wurde damit zur Gotteslästerung. Es gibt zwei verschiedene Zugänge, die reellen Zahlen mit Hilfe der rationalen Zahlen zu definieren. Der eine Weg benutzt Cauchy Folgen rationaler Zahlen [108], der andere Dedekind Schnitte [65]. Der Weg über die Cauchy Folgen orientiert sich an der Dezimalbruchentwicklung der reellen Zahlen. Die Dezimalbruchdarstellung einer reellen Zahl ist eine unendliche Folge von Ziffern zwischen 0 und 9. Wenn wir die Dezimalbruchdarstellung an einer Stelle abbrechen, erhalten wir eine rationale Zahl. Diese rationale Zahl stellt die reelle Zahl bis auf einen Fehler dar. Diesen Fehler können wir so klein wie möglich halten, wenn wir die Folge entsprechend spät abbrechen. 49 50 CHAPTER 2. DIE REELLEN ZAHLEN Der Dedekind Schnitt orientiert sich an dem geometrischen Bild der reellen Zahlen als Gerade. Wir wollen hier den zweiten Zugang benutzen. Dabei werden wir von unserer Intuition geleitet, dass die reellen Zahlen durch eine Gerade unendlicher Länge dargestellt werden können. √ Wir wollen hier den eleganten und alten Beweis für die Irrationalität von 2 angeben. Satz 2.0.2 Es gibt keine rationale Zahl q mit q 2 = 2. Der Satz kann auch so formuliert werden: Dazu benötigen wir das folgende Lemma. √ 2 ist eine irrationale Zahl. Lemma 2.0.2 Eine natürliche Zahl n ist genau dann gerade, wenn deren Quadrat n2 gerade ist. Beweis. Es sei n eine gerade Zahl, dann gilt n = 2m. Also gilt n2 = 2(2m2 ). Dies ist eine gerade Zahl. Falls n eine ungerade Zahl ist, dann gibt es ein m ∈ N0 mit n = 2m + 1. Deshalb ist n2 = (2m + 1)2 = 4m2 + 4m + 1 = 2(2m2 + 2m) + 1. Dies ist eine ungerade Zahl. 2 √ Beweis von Satz 2.0.2. Falls 2 = pq gilt, wobei p, q ∈ N und p und q keine gemeinsamen Teiler besitzen, dann gelten p2 2= 2 q oder 2q 2 = p2 . Deshalb ist p2 eine gerade Zahl und somit auch p. Also gilt p = 2k und 2q 2 = 4k 2 oder q 2 = 2k 2 . Damit sind auch q 2 und q gerade Zahlen. Somit gelten p = 2k und q = 2l. Also sind p und q nicht teilerfremd. Dies steht im Widerspruch zu unserer Wahl von p und q. 2 Wir geben auch noch ein geometrisches Argument an [Apo]. Beweis von Satz 2.0.2. Wir betrachten ein rechtwinkliges Dreieck ABC, dessen Seiten AC und BC die √ Länge 1 haben. Nach dem √ Satz von Pythagoras hat die Seite AB die Länge 2. Wir nehmen an, dass 2 eine rationale Zahl ist. Dann finden wir ein Dreieck derselben Form, dessen Seiten alle ganzzahlige Längen haben (wir multiplizieren jede Seite mit einem entsprechenden Faktor). Unter allen solchen Dreiecken gibt es ein kleinstes. Wir zeigen nun, dass auch das Dreieck ADE von derselben Form ist und ganzzahlige Seitenlänge hat, im Widerspruch zu unser Wahl. 51 B B √ 2 1 D A 1 C A E C Die Länge der Seite AD ist gleich der Differenz der Seitenlängen von AB und CB, also ganzzahlig. AD und DE haben dieselbe Länge. Außerdem sind DE und CE gleich lang. 2 Dieser Beweis ist elementar und einfach. Um zu zeigen, dass π und die Eulersche Zahl e irrational sind, muss man einige Hilfsmittel zur Verfügung stellen. Von der Zahl γ, die auch nach Euler benannt ist, ist nicht bekannt, ob sie irrational ist. Sie ist durch den Grenzwert ! n X 1 − ln n γ = lim n→∞ k k=1 definiert. Wir sagen, dass eine Zahl algebraisch ist, wenn sie Nullstelle eines Polynoms mit ganzzahligen Koeffizienten ist. Offensichtlich sind alle rationalen Zahlen algebraisch. Eine Zahl, die nicht algebraisch ist, heisst transzendent. e und π sind Beispiele für transzendente Zahlen [EyL]. Auch die Zahl 0, 11000100 . . . bei der an der k! Stelle hinter dem Komma eine 1 steht, ist transzendent (Liouville). √ Beispiel 2.0.3 Es sei n ∈ N und n ≥ 2. n ist genau dann rational, wenn n eine Quadratzahl ist, d.h. wenn es ein m ∈ N mit n = m2 gibt. Beweis. Wir benutzen den Satz über die Eindeutigkeit der Primzahlzerlegungen. Dieser besagt, dass es für jede natürliche Zahl n paarweise verschiedene Primzahlen ni , i = 1 . . . , k und natürliche Zahlen si , i = 1, . . . , k, gibt, so dass k Y n= nsi i . i=1 Diese Darstellung ist eindeutig bis auf die Reihenfolge der ni , si , i = 1, . . . , k. Falls alle si , i = 1, . . . , k, gerade Zahlen sind, dann ist n eine Quadratzahl. Wir √ betrachten nun den Fall, dass es ein i0 gibt, so dass si0 ungerade ist. Wir nehmen nun an, dass n eine rationale Zahl ist, d.h. √ p n= p, q ∈ N q Es seien ` m Y Y p= ptii und q= qiri i=1 i=1 52 CHAPTER 2. DIE REELLEN ZAHLEN die Primzahlzerlegungen von p und q. Also gilt n= p2 q2 bzw. k Y i=1 nsi i m Y i=1 qi2ri = ` Y i p2t i . i=1 Falls für alle i = 1, . . . , m gilt, dass qi 6= ni0 , dann gibt es wegen der Eindeutigkeit der Primzahlzerlegung ein i1 , so dass ni0 = pi1 und si0 = 2ti1 . Dies kann nicht sein, da si0 ungerade ist. Falls es ein i1 mit ni0 = qi1 gibt, dann gibt es ein i2 , so dass ni0 = qi1 = pi2 und si0 + 2ri1 = 2ti2 Auch dies kann nicht sein, da si0 eine ungerade Zahl ist. Damit haben wir einen Widerspruch und √ n ist keine rationale Zahl. 2.1 Dedekind Schnitt Julius Wilhelm Richard Dedekind wurde am 6. Oktober 1831 in Braunschweig geboren. Er starb am 12. Februar 1916 in Braunschweig. Er studierte in Berlin. Er lehrte in Göttingen, Zürich und Braunschweig. Er arbeitete auf dem Gebiet der Algebra. Dedekind spielte sehr gut Cello und Klavier und komponierte eine Kammeroper, zu der sein Bruder das Libretto schrieb. Wir folgen hier der Darstellung in [65]. Wir konstruieren mit Hilfe der rationalen Zahlen Q die reellen Zahlen R. [1],[108] Definition 2.1.1 Eine Teilmenge M einer geordneten Menge X heißt Dedekind Schnitt von X, wenn (i) Sie nicht leer ist und nicht gleich X ist. (ii) Jedes Element von M kleiner als jedes Element vom Komplement von M ist. (iii) M besitzt kein Maximum, d.h. es gibt kein Element von M , das größer oder gleich als alle Elemente in M ist Wenn wir (ii) nachprüfen, werden wir zeigen, dass für alle ξ ∈ M und alle η < ξ gilt η ∈ M . Beispiel 2.1.1 (i) Es sei q eine rationale Zahl. Dann ist (2.1) Sq = {p ∈ Q|p < q} ein Dedekind Schnitt in Q. (ii) Die Menge S√2 = {q ∈ Q|q 2 < 2} ∪ {q ∈ Q|q ≤ 0} ist ein Dedekind Schnitt. 2.1. DEDEKIND SCHNITT 53 Beweis. (i) Es gelten q + 1 ∈ / Sq und q − 1 ∈ Sq . Falls p ∈ Sq und r ≤ p, dann gilt r ≤ p < q und damit r ∈ Sq . Es bleibt zu zeigen, dass Sq kein Maximum besitzt. Wir nehmen an, dass Sq ein Maximum q0 besitzt. Dann gilt q0 < q und es gibt ein r ∈ Q mit q0 < r < q. Dann gilt aber r ∈ Sq und q0 ist kein Maximum. (ii) Wird in Beispiel 2.10.3 bewiesen. 2 Definition 2.1.2 Einen Dedekind Schnitt von Q bezeichnen wir als reelle Zahl. Die Menge der reellen Zahlen bezeichnen wir mit R. Definition 2.1.3 Es seien x, y ∈ R. Es gilt x < y, falls x ⊂ y. Mit der Forderung, dass ein Dedekind Schnitt kein größtes Element enthält, verhindern wir, dass zwei verschiedene Dedekind Schnitte dieselbe reelle Zahl darstellen. Falls sowohl {q ∈ Q|q < 1} als auch {q ∈ Q|q ≤ 1} Dedekind Schnitte wären, dann würden beide die Zahl 1 darstellen. Der Dedekind Schnitt M = {q ∈ Q|q 2 < 2} ∪ {q ∈ Q|q ≤ 0} √ stellt, wie wir sehen werden, die Zahl 2 dar. Wir führen auf der Menge der Dedekind Schnitte von Q zwei Verknüpfungen ein, Addition und Multiplikation. Zunächst die Addition. Für x, y ∈ R setzen wir x + y = {ξ + η|ξ ∈ x, η ∈ y}. Lemma 2.1.1 Es seien x und y Dedekind Schnitte in Q. Dann ist auch x + y = {ξ + η|ξ ∈ x, η ∈ y} ein Dedekind Schnitt in Q. Beweis. Es seien x, y ∈ R. Wir zeigen, dass x + y nicht leer ist. Da x und y Dedekind Schnitte sind, sind sie nicht leer, also gibt es ξ0 ∈ x und η0 ∈ y. Dann gilt aber ξ0 + η0 ∈ x + y. Nun zeigen wir, dass x + y 6= Q. Da x und y Dedekind Schnitte sind, sind beide von Q verschieden. Es gibt also ξ1 , η1 ∈ Q mit ξ1 ∈ / x und η1 ∈ / y. Dann gilt ξ1 + η1 ∈ / x + y. In der Tat, nehmen wir an, dass ξ1 + η1 ∈ x + y. Dann gibt es ξ2 ∈ x und η2 ∈ y mit ξ1 + η1 = ξ2 + η2 . Da aber ξ1 ∈ / x und η1 ∈ / y, folgt ξ2 + η2 < ξ1 + η1 , 54 CHAPTER 2. DIE REELLEN ZAHLEN was nicht sein kann, da beide Zahlen gleich sind. Es seien ξ ∈ x und η ∈ y. Wir zeigen, dass für alle ζ < ξ + η gilt ζ ∈ x + y. Es gilt ξ + η − ζ > 0. Dann gelten ξ− ξ+η−ζ ∈x 2 η− ξ+η−ζ ∈ y. 2 Außerdem gilt ξ+η−ζ ξ+η−ζ ξ− + η− = ζ. 2 2 Es folgt ζ ∈ x + y. Nun zeigen wir, dass x + y kein Maximum enthält. Wir nehmen an, dass x + y ein Maximum besitzt. Es gibt also γ ∈ x und δ ∈ y, so dass für alle ξ ∈ x und alle η∈y ξ+η ≤γ+δ gilt. Da x und y kein Maximum enthalten, gibt es ρ ∈ x und σ ∈ y mit γ<ρ δ < σ. Es folgt γ + δ < ρ + σ. Dies ist ein Widerspruch. 2 Beispiel 2.1.2 Es seien p, q ∈ Q. Dann gilt für die Dedekind Schnitte (2.1) Sp + Sq = Sp+q . Beweis. Sp + Sq = = ⊆ ⊆ {r ∈ Q|r < p} + {s ∈ Q|s < q} {r + s|r, s ∈ Q ∧ r < p ∧ s < q} {r + s|r, s ∈ Q ∧ r + s < p + q} {t ∈ Q|t < p + q} = Sp+q Nun die inverse Inklusion. Es sei t ∈ Q mit t < p + q. Dann gelten p + q − t > 0 und p+q−t ∈ Sq 2 p− p+q−t ∈ Sp 2 t= p+q−t p+q−t + q− ∈ Sp + Sq p− 2 2 q− Weiter gilt 2 Definition 2.1.4 Es sei x ∈ R. Falls die Menge (2.2) {ξ ∈ Q|∀η ∈ x : ξ + η < 0} kein Maximum besitzt, dann setzen wir −x = {ξ ∈ Q|∀η ∈ x : ξ + η < 0}. 2.1. DEDEKIND SCHNITT 55 Falls die Menge (2.2) ein Maximum besitzt, dann definieren wir −x als diese Menge ohne ihr Maximum. Wir definieren 0 = {ξ ∈ Q|ξ < 0}. Lemma 2.1.2 (i) 0 ist ein Dedekind Schnitt in Q. (ii) Für alle x ∈ R gilt x + 0 = x. (iii) Für alle x ∈ R gilt −x ∈ R. Weiter gilt für alle x ∈ R (2.3) x + (−x) = 0. Beweis. (i) Nach Beispiel 2.1.1 ist 0 ein Dedekind Schnitt von Q. (ii) x + 0 = {ξ + η|ξ ∈ x, η < 0} Es gilt für alle ξ ∈ x und η < 0 ξ + η < ξ ∈ x. Da x ein Schnitt ist, gilt ξ + η ∈ x. Es folgt x + 0 ⊆ x. Nun die inverse Inklusion. Es sei ξ ∈ x. Dann gibt es ein η ∈ x mit ξ < η. Nun wählen wir ζ = ξ − η ∈ 0 und erhalten ξ = η + ζ ∈ x + 0. Also gilt x ⊆ x + 0. (iii) Wir zeigen, dass es ein ξ ∈ / −x gibt. Es gilt −x ⊆ {ξ ∈ Q|∀η ∈ x : ξ + η < 0}. Es gibt ein ζ ∈ x, weil x ein Dedekind Schnitt ist. Dann gilt −ζ ∈ / {ξ ∈ Q|∀η ∈ x : ξ + η < 0}. In der Tat, falls −ζ ∈ −x, dann gilt 0 = ζ + (−ζ) < 0. Das ist ein Widerspruch. Insbesondere gilt −ζ ∈ / −x. Also können wir ξ = −ζ wählen. Wir zeigen nun, dass es ein ξ ∈ −x gibt. Wir wählen ein η ∈ / x. Ein solches η existiert, weil x ein Dedekind Schnitt ist. Dann gilt (2.4) −η − 1 ∈ {ξ ∈ Q|∀η ∈ x : ξ + η < 0}. 56 CHAPTER 2. DIE REELLEN ZAHLEN Wir weisen dies nach. Es gilt η + (−η − 1) = −1 < 0 und damit für alle ζ < η Insbesondere gilt für alle ζ ∈ x ζ + (−η − 1) < 0. ζ + (−η − 1) < 0. Also gilt (2.4). Falls −η − 1 nicht das Maximum von {ξ ∈ Q|∀η ∈ x : ξ + η < 0} ist, gilt −η − 1 ∈ −x. Falls −η − 1 das Maximum dieser Menge ist, dann wählen wir −η − 2. Es sei nun ξ ∈ −x und η < ξ. Dann gilt für alle ζ ∈ x ζ + η < ζ + ξ < 0. Es folgt η ∈ −x. Nach Definition enthält −x kein Maximum. Damit ist −x ein Dedekind Schnitt. Wir zeigen nun die Gleichung (2.3). x + (−x) = {ξ + η|ξ ∈ x ∧ η ∈ −x} = {ξ + η|ξ ∈ x ∧ ∀ρ ∈ x : η + ρ < 0} ⊆ {ξ + η|ξ ∈ x ∧ η + ξ < 0} ⊆ {ζ ∈ Q|ζ < 0} = 0. Wir zeigen nun die inverse Inklusion. Es sei nun ζ ∈ Q mit ζ < 0. Wir nehmen an, dass (2.5) ζ∈ / x + (−x). Wir können annehmen, dass (2.6) 2ζ ∈ x + (−x). Wir überlegen uns dies. Nach (iii) ist x + (−x) ein Schnitt, also gibt es ein η ∈ x + (−x) mit η < 0. Nach Lemma 1.8.4 ist Q ein archimedischer Körper. Deshalb gibt es ein n ∈ N mit nζ ≤ η. Da N wohlgeordnet ist, gibt es eine kleinste Zahl n0 ∈ N mit n0 ζ ∈ x + (−x). Dann gilt (n0 − 1)ζ ∈ / x + (−x). Wir nehmen nun (n0 − 1)ζ als unser neues ζ. Dann gilt für alle ρ ∈ −x ρ − ζ ∈ −x. Dies gilt, weil für alle ξ ∈ x und alle ρ ∈ −x nach (2.5) ξ+ρ<ζ und damit für alle ξ ∈ x ξ + (ρ − ζ) < 0 2.1. DEDEKIND SCHNITT 57 gilt. Andererseits gibt es wegen (2.6) σ ∈ x und τ ∈ −x mit σ + τ = 2ζ. Es folgt mit σ ∈ x und τ ∈ −x σ + (τ − ζ) = ζ. Da aber τ − ζ ∈ −x, gilt Das ist ein Widerspruch. 2 ζ ∈ x + (−x). Beispiel 2.1.3 Es sei p ∈ Q. Sp = {q ∈ Q|q < p} ist ein Dedekind Schnitt in Q und für sein additives Inverses gilt −Sp = S−p . Beweis. Wir zeigen {ξ ∈ Q|∀η ∈ Sp : ξ + η < 0} = {ξ ∈ Q|ξ ≤ −p}. Wir zeigen, dass die rechte Menge in der linken enthalten ist. Es sei ξ ≤ −p und η ∈ Sp , d.h. η < p. Dann folgt ξ + η < −p + p = 0. Nun die inverse Inklusion. Dazu nehmen wir an, dass es ein ξ > −p mit ξ ∈ {ξ ∈ Q|∀η ∈ Sp : ξ + η < 0} gibt. Dann gilt ξ + p > 0 und p− ξ+p ∈ Sp . 2 Weiter gilt ξ+p ξ+p = >0 2 2 Also gilt ξ ∈ / {ξ ∈ Q|∀η ∈ Sp : ξ + η < 0}. 2 ξ+p− Korollar 2.1.1 R mit der Verknüpfung + ist eine abelsche Gruppe. Definition 2.1.5 Es seien x, y ∈ R. Wir setzen x x≥0 |x| = −x x < 0 Da x und −x Schnitte sind, ist auch |x| ein Schnitt. Wir definieren nun die Multiplikation für die reellen Zahlen. Definition 2.1.6 Es seien x, y ∈ R mit x, y > 0. Wir setzen x · y = {ξ · η|ξ ∈ x, ξ > 0, η ∈ y, η > 0} ∪ {τ ∈ Q|τ ≤ 0}. Für alle x ∈ R definieren wir x·0=0·x=0 Für x < 0 und y < 0 definieren wir x · y = |x| · |y| Für x < 0 und y > 0 definieren wir x · y = y · x = −(|x| · y). 58 CHAPTER 2. DIE REELLEN ZAHLEN Lemma 2.1.3 Es seien x und y Dedekind Schnitte in Q. Dann ist auch x · y ein Dedekind Schnitt. Beweis. Falls y = 0, dann gilt x · y = 0 und x · y ist nach Beispiel 2.1.1 ein Schnitt. Wir betrachten den Fall x > 0 und y > 0. Wir zeigen zuerst, dass für alle τ ∈ x · y und alle ρ < τ gilt ρ ∈ x · y. Gemäß Definition 2.1.6 müssen wir nur zeigen, dass für alle ζ mit 0 < ζ < ξ · η und ξ ∈ x und η ∈ y gilt ζ ∈ x · y. Es sei ξ · η ∈ x · y und ζ ∈ Q mit ζ < ξ · η. Wir zeigen, dass ζ ∈ x · y. Es gilt ζ < η. ξ Da y ein Schnitt und η ∈ y, folgt ζ ξ ∈ y. Damit ist ξ ζ ∈ x · y. ξ Wir zeigen nun, dass x · y kein Maximum enthält. Wir nehmen an, x · y enthält ein Maximum. Dann gibt es also Elemente ξ0 ∈ x und η0 ∈ y, so dass für alle ξ ∈ x und alle η ∈ y ξ · η ≤ ξ0 · η0 gilt. Andererseits enthalten x und y keine Maxima. Also gibt es ρ ∈ x mit ξ < ρ und τ ∈ y mit η < τ . Dann gilt ξ · η < ρ · τ. Wir müssen noch zeigen, dass x · y nicht leer ist und dass auch das Komplement nicht leer ist. x · y ist nicht leer, weil {q ∈ Q|q ≤ 0} ⊆ x · y. Es seien ξ ∈ / x und η∈ / y. Dann gilt ξ · η ∈ / x · y. In der Tat, falls ξ · η ∈ x · y, dann gibt es ρ ∈ x und τ ∈ y mit ξ · η = ρ · τ < ξ · η. Dies ist ein Widerspruch. Damit haben wir den Fall x > 0 und y > 0 gezeigt. Falls x < 0 und y < 0, dann gelten |x| > 0 und |y| > 0. Mit dem obigen Fall folgt nun auch dieser. 2 Beispiel 2.1.4 (i) Es seien r, s ∈ Q. Dann gilt für das Produkt der Dedekind Schnitte {p|p < r} und {q|q < s} {p|p < r} · {q|q < s} = {w|w < r · s}. (ii) Es sei Dann gilt S√2 = {q ∈ Q|q 2 < 2} ∪ {q ∈ Q|q ≤ 0}. S√2 · S√2 = S2 = {q ∈ Q|q < 2}. Wir wollen nun das multiplikative inverse Element für x ∈ R mit x 6= 0 definieren. Definition 2.1.7 Es sei x > 0. Dann setzen wir 1 1 c c = ξ ∈ x ∧ ξ ist nicht Minimum von x ∪ {q ∈ Q|q ≤ 0}. x ξ Falls x < 0, dann setzen wir 1 x 1 = − |x| . Wir schreiben auch x−1 für x1 . 2.1. DEDEKIND SCHNITT 59 Lemma 2.1.4 Es sei x ∈ R mit x 6= 0. Dann ist auch dann gilt auch x1 > 0. Außerdem gilt x· 1 x ein Schnitt. Falls x > 0, 1 = {q ∈ Q|q < 1} = 1. x Beweis. Wir nehmen zunächst an, dass x > 0. Wir zeigen, dass x1 nicht leer ist. Es gibt eine Zahl in xc , die nicht die kleinste in xc ist. Es gibt ein ξ ∈ xc mit ξ > 0. 1 Dann gilt auch ξ + ξ ∈ xc und ξ + ξ ist nicht die kleinste in xc . Also gilt ξ+ξ ∈ x1 und x1 ist nicht leer. Wir zeigen nun, dass ( x1 )c nicht leer ist. Es gilt 1 1 c c = ξ ∈ x , x ist nicht die kleinste Zahl in x ∪ {q ∈ Q|q ≤ 0}. x ξ Also gilt ζ ∈ / x1 für 0 < ζ, falls ζ1 ∈ x. Nun zeigen wir, dass für alle ξ ∈ x1 und alle η < ξ gilt η ∈ x1 . Der Fall η ≤ 0 ist klar. Deshalb können wir annehmen, dass ξ > 0. Es gilt ξ ∈ x1 , falls 1ξ ∈ xc und falls 1ξ nicht das Minimum von xc ist. Aus η < ξ folgt 1ξ < η1 . Damit gilt η1 ∈ xc Schließlich zeigen wir noch, dass x1 kein Maximum enthält. Wir zeigen nun, dass x · x−1 = 1. Zunächst der Fall x > 0. 2 Satz 2.1.1 (R, +, ·, ≤) ist ein geordneter, archimedischer Körper. Beweis. Ein Körper mit einer Ordnung heißt geordneter Körper, falls gelten: (i) Für alle x, y, z ∈ K mit x < y gilt x + z < y + z. (ii) Für alle x, y, z ∈ K mit x < y und 0 < z gilt, dass xz < yz. Es gelte A < C, d.h. A ⊂ C. Es folgt A + B = {x + y|x ∈ A, y ∈ B} ⊂ {x + y|x ∈ C, y ∈ B} = A + C. Ein geordneter Körper K heißt archimedisch, wenn für alle x, y ∈ K mit 0 < x < y ein n ∈ N existiert, so dass y≤x · · · + x} . | + x{z n 2 Definition 2.1.8 Ein geordneter Körper, in dem jede nach oben beschränkte, nicht leere Teilmenge ein Supremum besitzt, heißt Dedekind vollständig. Man sagt auch, dass er die Supremumseigenschaft besitzt. Satz 2.1.2 (i) Jede nach oben beschränkte, nicht leere Teilmenge von (R, +, ·, ≤) besitzt ein Supremum. (ii) Jede nach unten beschränkte, nicht leere Teilmenge von (R, +, ·, ≤) besitzt ein Infimum. 60 CHAPTER 2. DIE REELLEN ZAHLEN Die leere Menge besitzt in R kein Supremum, weil jede reelle Zahl obere Schranke der leeren Menge ist. Beweis. Es sei A ⊆ R und A sei nach oben beschränkt. Dann ist [ y= x x∈A ein Dedekind Schnitt in Q, also eine reelle Zahl, und y ist das Supremum von A. Wir weisen dies nach. Zuerst zeigen wir, dass y ein Dedekind Schnitt ist. Es gilt y 6= ∅, da A nicht leer ist und alle x ∈ A nicht leere Teilmengen von Q sind. Wir zeigen, dass y 6= Q. Nach Annahme ist A beschränkt. Es gibt also ein z ∈ R, so dass für alle x ∈ A gilt x ≤ z. Das bedeutet, dass für alle x ∈ A gilt x ⊆ z. Hieraus folgt [ [ y= x⊆ z = z. x∈A c x∈A c Aus y ⊆ z folgt z ⊆ y . Da z ein Dedekind Schnitt ist, ist z c nichtleer und damit ebenfalls y c . Es sei ξ ∈ y und η < ξ. Wir wollen nun zeigen, dass η ∈ y. Aus ξ ∈ y folgt, dass es ein x ∈ A mit ξ ∈ x gibt. Da x ein Schnitt ist und ξ ∈ x, so folgt η ∈ x und damit η ∈ y. Wir zeigen nun, dass y kein Maximum besitzt. Wir nehmen an, dass y ein Maximum η0 enthält. Da η0 größtes Element von y ist, gilt [ ∀η ∈ x : η ≤ η0 . x∈A Es gibt ein x0 ∈ A mit η0 ∈ x0 . Es folgt ∀η ∈ x0 : η ≤ η0 . Also besitzt x0 ein Maximum, was nicht sein kann, weil x0 ein Dedekind Schnitt ist. Deshalb hat y kein Maximum. Wir zeigen nun, dass y Supremum von A ist. Es gilt für alle x ∈ A, dass x ⊆ y. Somit ist y eine obere Schranke von A. Wir zeigen nun, dass y die kleinste, obere Schranke von A ist. Es sei z eine obere Schranke von A Dann gilt für alle x ∈ A, dass x ⊆ z und damit [ y= x ⊆ z. x∈A 2 2.2 Folgen in R Augustin-Louis Cauchy wurde am 21 August 1789 in Paris geboren, er starb am 23. Mai 1857 in Sceaux. 2.2. FOLGEN IN R 61 Als Mitglied der Académie war eine von Cauchys Pflichten die Begutachtung von eingesandten wissenschaftlichen Artikeln. Dieser Arbeit widmete er viel seiner Zeit, allerdings nicht unbedingt zur Freude der Autoren. So schrieb Niels Henrik Abel: ”Cauchy ist verrückt, und man kann nichts dagegen tun. Allerdings ist er zur Zeit der einzige, der weiß, wie man Mathematik machen sollte.” Ähnliche schlechte Erfahrungen machten Galois und Poncelet. Es schien auch, dass Cauchy teilweise die Papiere der jungen Wissenschaftler verloren hatte, was ihm heftig vorgeworfen wurde. Michail Ostrogradski dagegen fand nur warme Worte für Cauchy, der den jungen Russen sogar mehrmals aus dem Schuldturm freikaufte, wenn er mal wieder seine Miete nicht bezahlen konnte. Definition 2.2.1 Es sei M eine Menge. Eine Folge in M ist eine Abbildung I : N → M . Wir schreiben auch {xn }∞ n=1 oder {xn }n∈N . Wir ordnen also jedem n ∈ N ein Element xn ∈ M zu: x1 , x2 , x3 , . . . Es kann vorkommen, dass die Indexmenge nicht N sondern N0 oder {n ∈ N|n ≥ n0 } für ein geeignetes n0 ∈ N ist. Dann schreiben wir {xn }n∈N0 bzw. {xn }∞ n=n0 . Definition 2.2.2 (i) Eine Folge {xn }n∈N in dem geordneten Körper (R, +, ·, ≤) heißt konvergent zum Grenzwert x ∈ R, wenn für alle ∈ R mit > 0 ein N ∈ N existiert, so dass für alle n > N |xn − x| < gilt. (Quantorenschreibweise: ∀ > 0 ∃N ∈ N ∀n > N : |xn − x| < .) Wir schreiben hierfür auch x = lim xn . n→∞ (ii) Eine Folge {xn }n∈N in dem geordneten Körper (R, +, ·, ≤) heißt konvergent, wenn es einen Grenzwert gibt, gegen den sie konvergiert. (Quantorenschreibweise: ∃x ∀ > 0 ∃N ∈ N ∀n > N : |xn − x| < .) Falls eine Folge nicht konvergiert, sagen wir auch, dass sie divergiert. Dies bedeutet anschaulich, dass sich die Folge der Zahl a annähert. Wenn wir N nur hinreichend groß wählen, dann haben sämtliche Folgenglieder an mit n > N einen Abstand zu a, der kleiner als ist. Wenn man eine konkrete Folge vorliegen hat und will deren Konvergenz beweisen, dann wird man N als Funktion von bestimmen. 62 CHAPTER 2. DIE REELLEN ZAHLEN Beispiel 2.2.1 (i) Es gilt lim n→∞ 1 =0 n (ii) Es sei 1 xn = n 1000 für n ∈ N und n 6= 1000 für n = 1000 Dann gilt lim xn = 0 n→∞ (iii) Es gilt lim n→∞ 1 =0 n2 (iv) Es gilt lim n→∞ 1 1+ n =1 (v) Die Folge {(−1)n }n∈N konvergiert nicht. Beweis. (i) Es sei ∈ R, > 0. Da R archimedisch ist, gilt: ∃N ∈ N : N > 1. Hieraus folgt 1 . N ∃N ∈ N : > Damit folgt ∃N ∈ N∀n > N : 1 < . n Hieraus ergibt sich 1 ∃N ∈ N∀n > N : − 0 < . n (ii) wird genauso bewiesen. Wir nehmen das N von (i) und setzen Ñ = max{1000, N }. (iii) Dies ist offensichtlich, weil n12 ≤ n1 gilt und limn→∞ n1 = 0. Wir wollen aber noch einmal durch die Argumente durchgehen. Es sei ∈ R, > 0. Da R archimedisch ist, gilt: ∃N ∈ N : N > 1. Hieraus folgt 1 . N ∃N ∈ N : > Damit folgt ∃N ∈ N∀n > N : Es folgt ∃N ∈ N∀n > N : Da n ≥ 1 gilt, folgt Und schließlich 1 < . n 1 1 < . n2 n 1 < . n2 1 ∃N ∈ N∀n > N >: 2 − 0 < . n ∃N ∈ N∀n > N : 2.2. FOLGEN IN R 63 (iv) Da R Archimedisch ist, gilt ∀ > 0∃N ∈ N∀n > N : 1 < . n Es folgt 1 ∀ > 0∃N ∈ N∀n > N : 1 + − 1 < . n Also 1 = 1. n konvergiert, bedeutet lim 1 + n→∞ (v) Die Aussage, dass eine Folge {xn }n∈N ∃x ∈ R∀ > 0 ∃N ∈ N ∀n > N : |xn − x| < . Die Verneinung dieser Aussage ist ∀x ∈ R ∃ > 0 ∀N ∈ N ∃n > N : |xn − x| ≥ . x ist gegeben. Wir unterscheiden zwei Fälle x ≥ 0 und x < 0. Es sei zunächst x ≥ 0. Wir wählen = 21 . N ist gegeben. Wir wählen n = 2N + 1. Dann gilt |xn − x| = |(−1)n − x| = | − 1 − x| = 1 + x ≥ 1 > 1 . 2 Falls x < 0, dann wählen wir = 12 . N ist gegeben. Wir wählen n = 2N . Dann folgt |xn − x| = |(−1)n − x| = |1 − x| = 1 + |x| ≥ 1 > 1 . 2 2 In der Definition der Konvergenz treten verschiedene Ungleichungen auf. Es stellt sich die Frage, ob die strikte Ungleichung notwendig ist oder der Gleichheitsfall auch zugelassen werden kann. Bemerkung 2.2.1 Es sei {xn }n∈N eine Folge reeller Zahlen und x0 ∈ R. Die folgenden Aussagen sind äquivalent: (i) ∀ > 0 ∃N ∈ N ∀n > N : |xn − x0 | < (ii) ∀ > 0 ∃N ∈ N ∀n ≥ N : |xn − x0 | < (iii) ∀ > 0 ∃N ∈ N ∀n ≥ N : |xn − x0 | ≤ (iv) ∃c > 0∀ > 0 ∃N ∈ N ∀n ≥ N : |xn − x0 | ≤ c · Beweis. Es gelten offensichtlich (ii) ⇒ (iii) ⇒ (iv). Wir zeigen (i) ⇒ (ii). Aus (i) folgt ∀ > 0 ∃N ∈ N ∀n ≥ N + 1 : |xn − x0 | < . Wir zeigen nun (iv) ⇒ (i). Zu δ > 0 wählen wir = ein N δ , so dass für alle n ≥ N δ 2c 2c |xn − x0 | ≤ δ <δ 2c δ . 2c Dann gibt es nach (iv) 64 CHAPTER 2. DIE REELLEN ZAHLEN gilt. Wir setzen nun Ñδ = N δ . Dann gilt 2c ∀δ > 0∃Ñδ ∈ N∀n ≥ Ñδ : 2 |xn − x0 | < δ. Definition 2.2.3 Eine Folge {xn }n∈N in dem geordneten Körper (R, +, ·, ≤) heißt Cauchy Folge, falls für alle ∈ R mit > 0 ein N ∈ N existiert, so dass für alle n, m > N |xm − xn | < gilt. (Quantorenschreibweise: ∀ > 0 ∃N ∀n, m > N : |xn − xm | < .) Bemerkung 2.2.2 Jede konvergente Folge in R ist eine Cauchy Folge. Beweis. (i) Es sei {xn }n∈N eine konvergente Folge. Ihren Grenzwert bezeichnen wir mit x. Also gilt ∀ > 0 ∃N ∈ N ∀n > N : |xn − x| < . Es folgt ∀ > 0 ∃N ∈ N ∀m, n > N : ∀ > 0 ∃N ∈ N ∀m, n > N : Mit der Dreiecksungleichung folgt |xn − x| < und |xm − x| < |xn − x| + |xm − x| < 2 ∀ > 0 ∃N ∈ N ∀m, n > N : 2 |xn − xm | < 2. Bemerkung 2.2.3 (i) Es sei {xn }n∈N eine reelle, konvergente Folge. Dann konvergiert {xn+1 }n∈N und die Grenzwerte sind gleich. (ii) Es sei {xn }n∈N0 eine reelle, konvergente Folge. Dann konvergiert {xn−1 }n∈N und die Grenzwerte sind gleich. Beweis. (i) Die Folge konvergiere gegen x ∀ > 0∃N ∈ N∀n ≥ N : |xn − x| < . Es folgt sofort ∀ > 0∃N ∈ N∀n ≥ N : |xn+1 − x| < . (ii) Die Folge konvergiere gegen x ∀ > 0∃N ∈ N∀n ≥ N : |xn − x| < . Damit folgt ∀ > 0∃N ∈ N∀n ≥ N + 1 : |xn−1 − x| < . Wir wählen als Ñ = N + 1. Dann gilt 2 ∀ > 0∃Ñ ∈ N∀n ≥ Ñ : |xn−1 − x| < . 2.2. FOLGEN IN R 65 Definition 2.2.4 Eine Folge {xn }n∈N heißt nach oben (unten) beschränkt, wenn es eine Konstante C ∈ R gibt, so dass für alle n ∈ N xn ≤ C (xn ≥ C) gilt. Die Folge heißt beschränkt, wenn sie sowohl nach unten als auch nach oben beschränkt ist. Lemma 2.2.1 Eine Cauchy Folge in R ist beschränkt. Insbesondere ist eine konvergente Folge beschränkt. Beweis. Es sei {xn }n∈N eine Cauchy Folge. Dann ∀ > 0∃N ∈ N∀n, m ≥ N : |xm − xn | < . Wir wählen = 1. Dann ∃N1 ∈ N∀n, m ≥ N1 : |xm − xn | < 1. Insbesondere gilt ∃N1 ∈ N∀n ≥ N1 : |xN1 − xn | < 1. Mit der inversen Dreiecksungleichung folgt für alle n ≥ N1 |xn | < 1 + |xN1 |. Es folgt, dass für alle n ∈ N 2 |xn | ≤ max{1 + |xN1 |, max{|x1 |, . . . , |xN1 |}}. Lemma 2.2.2 Eine konvergente Folge in R hat genau einen Grenzwert. Beweis. Wir nehmen an, dass es eine Folge {xn }n∈N gibt, die zwei verschiedene Grenzwerte x und x0 hat. Dann gilt ∀ > 0∃N ∈ N∀n > N : ∀ > 0∃N0 ∈ N∀n > N0 : |xn − x| < |xn − x0 | < . Es sei Ñ = max{N , N0 }. Dann folgt ∀ > 0∃Ñ ∈ N∀n > Ñ : |xn − x| + |xn − x0 | < 2. Mit der Dreiecksungleichung folgt ∀ > 0∃Ñ ∈ N∀n > Ñ : |x − x0 | < 2 und schließlich ∀ > 0 : |x − x0 | < 2. Es folgt x = x0 . Wir überprüfen dies. Falls x 6= x0 , dann gilt |x − x0 | > 0. Wir können dann = 14 |x − x0 | wählen und erhalten einen Widerspruch. 2 66 CHAPTER 2. DIE REELLEN ZAHLEN Lemma 2.2.3 Die rellen Folgen {xn }n∈N und {yn }n∈N konvergieren in R gegen die Grenzwerte x und y. Dann gelten: (i) {xn + yn }n∈N konvergiert gegen den Grenzwert x + y. (ii) {xn · yn }n∈N konvergiert gegen den Grenzwert x · y. (iii) Falls für alle n ∈ N gilt, dass yn 6= 0, und falls y 6= 0, dann konvergiert { xynn }n∈N gegen xy . Beweis. (i) Da die Folge {xn }n∈N gegen x konvergiert, gibt es für alle > 0 ein N ∈ N, so dass für alle n > N die Ungleichung |xn − x| < gilt. Ebenso gibt es für alle > 0 ein N0 ∈ N, so dass für alle n > N0 die Ungleichung |yn − y| < gilt. Also gelten ∀ > 0 ∃N ∈ N ∀n > N : ∀ > 0 ∃N0 ∈ N ∀n > N0 : |xn − x| < |yn − y| < . Wir gehen wieder zu Ñ = max{N , N0 } über. Damit gilt ∀ > 0 ∃Ñ ∈ N ∀n > Ñ : ∀ > 0 ∃Ñ ∈ N ∀n > Ñ : |xn − x| < |yn − y| < . Wir addieren die beiden Ungleichungen ∀ > 0 ∃Ñ ∈ N ∀n > Ñ : |xn − x| + |yn − y| < 2. Mit der Dreiecksungleichung folgt ∀ > 0 ∃Ñ ∈ N ∀n > Ñ : |(xn + yn ) − (x + y)| < 2. (ii) Nach Lemma 2.2.1 gilt ∃C∀n ∈ N : |yn | < C. Wir nehmen zunächst an, dass x 6= 0. Außerdem gilt ∀ > 0∃N ∈ N∀n > N : |xn − x| < 2C ∀ > 0∃N0 ∈ N∀n > N0 : |yn − y| < 2|x| Wir setzen nun Ñ = max{N , N0 } und erhalten |xn · yn − x · y| = |xn · yn − x · yn + x · yn − x · y| = |(xn − x)yn + x(yn − y)| ≤ |(xn − x)yn | + |x(yn − y)| = |yn ||xn − x| + |x||yn − y| < C + = . 2C 2 Nun der Fall x = 0. Dann gilt |xn · yn − x · y| = |xn · yn | ≤ C|xn |. (iii) Wir setzen z = 1 y und zn = 1 yn und wenden (ii) an. 2 2.2. FOLGEN IN R 67 Lemma 2.2.4 (i) Es seien {xn }n∈N und {yn }n∈N zwei reelle, konvergente Folgen. Weiter gelte für alle n ∈ N die Ungleichung xn ≤ yn . Dann lim xn ≤ lim yn . n→∞ n→∞ (ii) Es seien {xn }n∈N und {zn }n∈N zwei reelle, konvergente Folgen mit limn→∞ xn = limn→∞ zn . Weiter sei {yn }n∈N eine reelle Folge und es gelte für alle n ∈ N xn ≤ yn ≤ zn . Dann konvergiert die Folge {yn }n∈N und lim xn = lim yn = lim zn . n→∞ n→∞ n→∞ Beweis. (i) Die Folge {xn }n∈N konvergiere gegen x und die Folge {yn }n∈N konvergiere gegen y. Dann konvergiert die Folge {yn − xn }n∈N konvergiert gegen y − x. ∀ > 0∃N ∈ N∀n ≥ N : |(yn − xn ) − (y − x)| < . ∀ > 0∃N ∈ N∀n ≥ N : (yn − xn ) − (y − x) < . Es folgt Hiermit folgt ∀ > 0∃N ∈ N∀n ≥ N : 0 ≤ (yn − xn ) < + (y − x). Also gilt für alle > 0 − < y − x. Somit gilt x ≤ y. (ii) Die Folge {zn − xn }n∈N ist eine Nullfolge. Also gilt ∀ > 0∃N ∈ N∀n ≥ N : |zn − xn | < . Wegen xn ≤ yn ≤ zn folgt für alle n ≥ N |zn − yn | ≤ |zn − xn | < . Also gilt ∀ > 0∃N ∈ N∀n ≥ N : |zn − yn | < . Dies bedeutet, dass die Folge {yn − zn }n∈N eine Nullfolge ist. Da die Folge {zn }n∈N eine konvergente Folge ist, so ist die Folge {yn − zn + zn }n∈N = {yn }n∈N ebenfalls konvergent. 2 68 2.3 CHAPTER 2. DIE REELLEN ZAHLEN R ist vollständig Karl Theodor Wilhelm Weierstraß wurde am 31. Oktober 1815 in Ostenfelde im Münsterland geboren und starb am 19. Februar 1897 in Berlin. Er unterrichtete als Lehrer an verschiedenen Gymnasien. Eine dieser Stellen erhielt er, weil er auch Turnen unterrichten konnte. Nebenher forschte er in der Mathematik und erhielt 1856 auf Grund seiner Forschungen eine Professur an der Universität Berlin. Einer seiner Verdienste ist es, dass er eine Strenge im mathematischen Argumentieren einführte. Georg Cantor und Sofia Kowalewskaja waren Studenten von ihm. Er unterrichtete Sofia Kowalewskaja privat, weil sie als Frau nicht an einer Universität studieren durfte. Der Mondkrater Weierstraß ist nach ihm benannt. Bernardus Placidus Johann Nepomuk Bolzano wurde am 5. Oktober 1781 in Prag geboren und starb dort am 18. Dezember 1848. Er studierte und lehrte an der Prager Karls Universität. Er arbeitete an den Grundlagen der Analysis. Er war vermutlich der erste, der eine überall stetige, aber nirgends differenzierbare Funktion konstruierte. Er arbeitete auch auf dem Gebiet der Philosophie. Sein philosophisches Werk hat große Bedeutung. Er wurde am 24. Dezember 1891 von Kaiser Franz I. seines Amtes enthoben, weil er in seinen Vorlesungen pazifistische und sozialistische Ansichten vertrat. Wir wollen in diesem Abschnitt zeigen, dass in (R, +, ·, ≤) jede Cauchy Folge konvergiert. Wir sagen dazu auch: R ist vollständig. Definition 2.3.1 Eine Folge {xn }n∈N heißt monoton wachsend (fallend), falls für alle n ∈ N xn ≤ xn+1 (xn+1 ≤ xn ) gilt. Beispiel 2.3.1 (i) Die Folge { n1 }n∈N ist monoton fallend. (ii) Die Folge {1 − 1 n2 }n∈N ist monoton wachsend. (iii) Die Folge {xn }n∈N mit xn = 1 für alle n ∈ N ist monoton wachsend und fallend. Satz 2.3.1 Es sei {xi }i∈N eine monoton wachsende, nach oben beschränkte Folge reeller Zahlen. Dann existiert das Supremum dieser Folge und lim xi = sup xn . i→∞ n∈N Die entsprechende Aussage für monoton fallende Folgen, die nach unten beschränkt sind, gilt auch: lim xi = inf xn i→∞ n∈N Beweis. Nach Satz 2.1.2 besitzt die Menge {xi |i ∈ N} ein Supremum in R. Wir bezeichnen x0 = supn∈N xn . Dann gibt es zu jedem > 0 ein N ∈ N mit x0 − < xN . 2.3. R IST VOLLSTÄNDIG 69 Falls dem nicht so wäre, dann gäbe es ein > 0, so dass für alle n ∈ N xn ≤ x0 − gilt. Damit wäre dann x0 − eine obere Schranke und x0 wäre nicht die kleinste, obere Schranke. Da die Folge monoton wächst, folgt für alle n mit n ≥ N x0 − < x N ≤ xn und damit 2 |x0 − xn | = x0 − xn < . Definition 2.3.2 Es sei I : N → R eine reelle Folge und J : N → N eine strikt wachsende Abbildung, d.h. für alle i ∈ N gilt J(i) < J(i + 1). Dann sagen wir, dass die Folge I ◦ J eine Teilfolge der Folge I ist. Wie üblich bezeichnen wir auch das Bild von I, also {xn }n∈N als Folge. Entsprechend bezeichnen wir {xJ(i) }i∈N als Teilfolge. Wir schreiben dafür auch {xni }i∈N , wobei für alle i ∈ N die Gleichung J(i) = ni gilt. Anschaulich erhalten wir aus einer Folge eine Teilfolge, wenn wir Folgenglieder streichen. 1 }n∈N , { n12 }n∈N und { 21n }n∈N Beispiel 2.3.2 Wir betrachten die Folge { n1 }n∈N . Dann sind { 2n Teilfolgen. Lemma 2.3.1 Es sei J : N → N eine strikt wachsende Abbildung, d.h. für alle k ∈ N gilt J(k) < J(k + 1). Dann gilt für alle k ∈ N, dass k ≤ J(k). Beweis. Wir zeigen dies mit Induktion. Offensichtlich gilt J(1) ≥ 1. Falls k ≤ J(k) gilt, dann gilt k ≤ J(k) < J(k + 1). Also k + 1 ≤ J(k + 1). 2 Lemma 2.3.2 Es sei {xn }n∈N eine reelle, konvergente Folge und {xki }i∈N sei eine Teilfolge von {xn }n∈N . Dann konvergiert die Teilfolge und sie konvergiert gegen den Grenzwert von {xn }n∈N . Beweis. Nach Lemma 2.3.1 gilt für alle n ∈ N kn ≥ n. Der Grenzwert der Folge {xn }n∈N sei x, d.h. ∀ > 0∃N ∀n ≥ N : |xn − x| < . Da aber für alle n ∈ N die Ungleichung n ≤ kn gilt, folgt aus N ≤ n die Ungleichung N ≤ kn . Somit ∀ > 0∃N ∈ N∀n ≥ N : |xkn − x| < . 2 70 CHAPTER 2. DIE REELLEN ZAHLEN Lemma 2.3.3 Es sei {xn }n∈N eine reelle Cauchy Folge, die eine konvergente Teilfolge {xnk }k∈N besitzt. Dann konvergiert auch die Folge {xn }n∈N und die Grenzwerte sind gleich. Beweis. Es sei {xn }n∈N eine reelle Cauchy Folge und {xnk }k∈N eine Teilfolge mit Grenzwert x0 . Dann gilt ∀ > 0∃N ∈ N∀n, m ≥ N : |xn − xm | < . Wegen |x0 − xn | = |x0 − xm + xm − xn | ≤ |x0 − xm | + |xm − xn | folgt (2.7) ∀ > 0∃N ∈ N∀n, m ≥ N : |x0 − xn | < |x0 − xm | + . Da die Teilfolge {xnk }k∈N gegen den Grenzwert x0 konvergiert ∀ > 0∃K ∈ N∀k ≥ K : |x0 − xnk | < Wir wählen nun m = nk0 , wobei k0 ≥ K und nk0 ≥ N . Dann folgt aus (2.7) ∀ > 0∃N ∈ N∀n ≥ N : |x0 − xn | < 2. 2 Lemma 2.3.4 Es sei {xn }n∈N eine Folge reeller Zahlen. Dann besitzt diese Folge eine Teilfolge, die monoton wachsend oder monoton fallend ist. Beweis. Wir zeigen, dass es eine Teilfolge gibt, die entweder monoton fallend oder monoton wachsend ist. Es sei (2.8) M = {n ∈ N|∀` ≥ n : x` ≤ xn }. Wir betrachten den Fall, dass M eine unendliche Menge ist. Wir definieren J : N → N induktiv. Wir setzen J(1) = min M . Das Minimum existiert, weil N wohlgeordnet ist. Wenn wir J(1), . . . , J(k) definiert haben, setzen wir J(k + 1) = min (M \ {J(1), . . . , J(k)}) . Das Minimum existiert wiederum, weil N wohlgeordnet ist. Es gilt für alle k ∈ N, dass J(k) ∈ M und J(k) < J(k+1). Wir wollen uns überlegen, dass J(k) < J(k+1). Wir nehmen an, dies sei nicht so. Dann gilt J(k) ≥ J(k + 1). Es kann nicht J(k) = J(k + 1) gelten, weil J(k) nicht in der Menge ist. Also muss J(k) > J(k + 1) gelten. Es gilt aber J(k) = min (M \ {J(1), . . . , J(k − 1)}) 2.3. R IST VOLLSTÄNDIG 71 und J(k + 1) wäre ein Element der Menge (M \ {J(1), . . . , J(k − 1)}) . Dies widerspricht aber der Definition von J(k). Aus J(k) < J(k + 1) folgt, dass die Teilfolge {xJ(k) }k∈N monoton fallend ist. Wir nehmen nun an, dass M eine endliche Menge ist. Wir konstruieren nun durch Induktion eine monoton strikt wachsende Teilfolge bzw. eine strikt wachsende Funktion J : N → N, so dass für alle i ∈ N die Ungleichung xJ(i) < xJ(i+1) gilt. Es sei m0 das Maximum von M . (Falls M die leere Menge ist, dann gibt es natürlich kein Maximum, wir haben im Folgenden keinerlei Einschränkungen.) Als m1 wählen wir eine natürliche Zahl, die strikt größer als m0 ist und setzen J(1) = m1 . Wir nehmen an, dass wir bereits J(1), . . . , J(k) gewählt haben. Da J(k) > m0 , so gilt J(k) ∈ / {n ∈ N|∀` ≥ n : x` ≤ xn } bzw. J(k) ∈ {n ∈ N|∃` ≥ n : x` > xn }. Also gibt es ein J(k + 1) mit xJ(k) < xJ(k+1) . 2 Wir wollen hier noch einmal das Argument vom Beweis beschreiben. Im Beweis ordnen wir die Menge (2.8) der Größe nach an n1 < n2 < n3 < · · · und erhalten so unsere monoton fallende Teilfolge xn1 ≥ xn2 ≥ xn3 ≥ · · · Beispiel 2.3.3 (i) Die Folge {(−1)n }n∈N hat die konstanten Folgen {1}n∈N und {−1}n∈N als Teilfolgen. Beide sind sowohl monoton fallend als auch monoton wachsend. (ii) Jede Teilfolge der Folge { n1 }n∈N ist monoton fallend. Satz 2.3.2 In (R, +, ·, ≤) konvergiert jede Cauchy Folge. Wir sagen dazu auch, dass R vollständig ist. Beweis. Es sei {xn }n∈N eine Cauchy Folge. Nach Lemma 2.2.1 ist eine Cauchy Folge beschränkt. Nach Lemma 2.3.4 besitzt diese Cauchy Folge eine Teilfolge, die entweder monoton wachsend oder monoton fallend ist. Nach Satz 2.3.1 konvergiert diese Teilfolge. Mit Lemma 2.3.3 folgt, dass dann auch die Cauchy Folge konvergiert. 2 72 CHAPTER 2. DIE REELLEN ZAHLEN Bemerkung 2.3.1 Man kann aus der Vollständigkeit von R folgern, dass R Dedekind vollständig ist. Der Beweis von Bemerkung 2.3.1 benutzt das Prinzip der Intervallschachtelung: Ein Intervall wird in zwei gleiche Teilintervalle unterteilt. Je nachdem in welchem Teilintervall sich noch ein Punkt der Menge befindet, wird mit dem entsprechenden Teilintervall fortgefahren. Man teilt dieses wieder in zwei gleiche Intervalle. Auf diese Weise wird ein gesuchter Punkt ”eingeschachtelt.” Beweis. Es sei M eine nach oben beschränkte Menge. Es gibt also ein b1 ∈ R, so dass für alle x ∈ M gilt, dass x ≤ b1 . Wir wählen nun a1 ∈ M und betrachten a1 + b1 a1 + b 1 und , b1 a1 , 2 2 Wir setzen a2 = a1 a1 + b 1 falls M ∩ , b1 = ∅ 2 a1 + b 1 2 a1 + b 1 2 b2 = b1 sonst a1 + b 1 falls M ∩ , b1 = ∅ 2 sonst Für n = 2, 3, . . . definieren wir an an+1 = an + b n 2 bn+1 an + bn 2 = bn an + bn , bn = ∅ falls M ∩ 2 sonst an + b n falls M ∩ , bn = ∅ 2 sonst Wir erhalten: (i) Für alle n ∈ N a1 ≤ a2 ≤ · · · ≤ an ≤ bn ≤ · · · ≤ b2 ≤ b1 (ii) b n − an = b 1 − a1 2n−1 (iii) bn , n ∈ N, sind obere Schranken von M . (iv) Für alle n ∈ N gilt: Es gibt ein xn ∈ M mit an ≤ xn ≤ bn . 2.3. R IST VOLLSTÄNDIG 73 Da {an }n∈N eine beschränkte, monoton wachsende Folge und {bn }n∈N eine beschränkte, monoton fallende Folge ist, so konvergieren diese Folgen (Satz 2.3.1). Wegen (ii) gilt b 1 − a1 = 0. n→∞ 2n−1 lim bn − lim an = lim (bn − an ) = lim n→∞ n→∞ n→∞ Also sind beide Grenzwerte gleich. b = limn→∞ bn ist eine obere Schranke von M , weil alle bn , n ∈ N, obere Schranken von M sind: Falls es ein x0 ∈ M mit b < x0 gäbe, dann gibt es ein N mit x0 − b ∀n > N : |bn − b| < . 2 Wegen bn ≥ x0 folgt x0 − b x 0 − b ≤ bn − b < . 2 Also x0 < b Falls b keine kleinste, obere Schranke ist, dann gibt es ein c mit c < b, so dass für alle x ∈ M gilt x ≤ c. Wegen (iv) gibt es ein n ∈ N mit c < xn ≤ bn . Also ist c keine obere Schranke. 2 Satz 2.3.3 (Bolzano-Weierstraß) Jede beschränkte Folge in R hat eine konvergente Teilfolge. Die Folge xn = (−1)n , n ∈ N, konvergiert nicht, aber die Teilfolge x2k , k ∈ N, konvergiert. Beweis. Wir geben hier zwei Beweise an, die formal etwas verschieden aussehen, inhaltlich aber sehr ähnlich sind. (i) Es sei {xn }n∈N eine Folge, die in einem Intervall [a, b] enthalten ist. Wir betrachten S = {s ∈ [a, b]|s ≤ xn für unendlich viele n} S hat b als obere Schranke. Da a ∈ S, so ist S nicht leer. Also hat S ein Supremum c. c ist Limes einer Teilfolge. Wir weisen dies nach. Für alle ξ < c gibt es unendlich viele n ∈ N mit ξ ≤ xn und für alle η > c gibt es nur endlich viele n ∈ N (oder keines) mit η ≤ xn . Somit gibt es für alle k ∈ N ein xnk mit c − k1 ≤ xnk ≤ c + k1 bzw. |c − xnk | ≤ 1 . k (ii) Es sei {xn }n∈N eine beschränkte Folge. Nach Lemma 2.3.4 besitzt diese Folge eine Teilfolge, die entweder monoton wächst oder monoton fällt. Nach Lemma 2.3.1 konvergiert diese Teilfolge. 2 74 CHAPTER 2. DIE REELLEN ZAHLEN Beispiel 2.3.4 (i) (1 + n1 )n , n ∈ N, ist eine monoton wachsende Folge. (ii) (1 + n1 )n+1 , n ∈ N, ist eine monoton fallende Folge. (iii) Beide Folgen konvergieren gegen denselben Grenzwert. Wir nennen diesen Grenzwert die Eulersche Zahl e. Die Zahl e ist von großer Bedeutung in der Mathematik. Wir werden später eine Reihe von Ergebnissen kennenlernen, die diese Zahl betreffen. Beweis. (i) Mit der Bernoulli Ungleichung (Beispiel 1.10.7) folgt n n n 1 1 1 1 >1− . = 1− 2 1− 1+ n n n n Also gilt 1+ 1 n n n 1 1 >1− 1− n n bzw. 1 1+ n n 1 1− n n−1 > 1. Es folgt 1+ 1 n n > 1 1− = 1 n−1 n n n−1 n−1 = 1+ 1 n−1 n−1 . (ii) Es folgt mit der Bernoulli-Ungleichung 1 1+ 1 n n 1− 1 n 1 − n12 n n 1 1 1 1+ 2 > 1+ 2 >1+ . n −1 n n = 1 n n = Weiter folgt n n−1 n und schließlich 1 1+ n−1 n+1 1 > 1+ n n n+1 1 > 1+ n (iii) Die beiden Folgen (i) und (ii) sind beschränkt. Man sieht sofort, dass beide Folgen von unten durch 1 beschränkt sind. Andererseits ist (1 + n1 )n+1 eine monoton fallende Folge. Deshalb gilt für alle n ∈ N n+1 n 1 1 4≥ 1+ ≥ 1+ n n Nach Lemma ?? konvergieren sie beide. Wir definieren n 1 e = lim 1 + n→∞ n Nach Lemma 2.2.3 konvergiert die Folge 1+ 1 n n+1 n 1 − 1+ n n∈N 2.3. R IST VOLLSTÄNDIG 75 Wegen n+1 n n 1 1 1 1 − 1+ = 1+ 1+ n n n n gilt lim n→∞ 1 1+ n Die letzte Gleichung gilt, weil n1 Wir wenden Lemma 2.2.3 an. 2 n ! n 1 1 1 − 1+ 1+ =0 = lim n→∞ n n n n 1 + n1 , n ∈ N, das Produkt von zwei konvergenten Folgen ist. n+1 Mit Beispiel 2.3.4 können wir für die Zahl e folgende Abschätzungen bekommen. n=1: n=2: n=3: n = 1000 : 2≤ 2, 25 ≤ 3 4 ≤ 2, 37... = 3 2, 716923... ≤ e ≤4 e ≤ 3, 375 4 4 e ≤ = 3, 16... 3 e ≤ 2, 71964... Die Zahl e spielt in der Zinsrechnung eine Rolle. Ein Geldbetrag G sei pro Jahr mit r Prozent verzinst. Nach einem Jahr erhält man also G(1 + r). Werden die Zinsen r 12 jedoch monatlich ausgezahlt, so erhält man G(1 + 12 ) am Ende des Jahres. Falls r 365 eine Bank bereit ist, die Zinsen täglich auszuzahlen, so erhält man G(1 + 365 ) am Ende des Jahres. Werden also die Zinsen k mal im Jahr ausgezahlt, so erhält man G(1 + kr )k am Ende des Jahres. Offensichtlich erhält man desto mehr Geld, je häufiger die Zinsen während des Jahres ausgezahlt werden. Eine Verallgemeinerung von Beispiel 2.3.4 besagt, dass man nie mehr als Ger am Ende des Jahres erhält. Der Betrag Ger würde ausgezahlt, wenn die Zinsen stetig ausgezahlt würden. √ Die Quadratwurzel x einer reellen, positiven Zahl x soll genau diejenige positive Zahl sein, die, wenn man sie mit sich selbst multipliziert, x liefert. Die Existenz einer solchen Zahl wird durch das nächste Beispiel geliefert. Die Eindeutigkeit ist offensichtlich. Beispiel 2.3.5 (Heron von Alexandrien) Es seien x, x1 ∈ R mit x, x1 > 0. Für n ∈ N setzen wir x 1 xn + . (2.9) xn+1 = 2 xn Dann gilt lim xn = n→∞ √ x und für alle n = 2, 3, . . . gilt (2.10) √ x ≤ x ≤ xn . xn Insbesondere existiert die Quadratwurzelfunktion, d.h. es gibt eine Funktion w : [0, ∞) → [0, ∞), so dass für alle x ∈ [0, ∞) (w(x))2 = x gilt. Die Funktion w ist monoton wachsend. 76 CHAPTER 2. DIE REELLEN ZAHLEN Die im Beispiel angegebene Folge stellt ein Iterationsverfahren dar, mit dem man die Wurzel einer Zahl berechnen kann. Es stammt von dem griechischen Mathematiker Heron von Alexandrien (ca. 60 n. Chr.). Das Iterationsverfahren besteht darin, dass der Mittelwert von zwei Zahlen gebildet wird, deren Produkt x ist. Das Verfahren konvergiert schnell, wenn man mit einem guten Anfangswert x1 beginnt. Dann erhält man bei jeder Iteration zwei genaue Dezimalstellen. Wenn der Anfangswert nicht gut gewählt wird, konvergiert das Verfahren langsam. Die Iteration von Heron ist ein Spezialfall des Verfahrens von Newton zum Auffinden einer n) Nullstelle einer Funktion. Hierbei setzt man xn+1 = xn − ff0(x (xn ) . In dem vorliegenden Beispiel wählt man f (t) = t2 − x. Bevor wir die Behauptungen beweisen, √ wollen wir eine einfache Überlegung anstellen, die sofort zeigt, warum der Grenzwert der Folge x ist. Wir nehmen an, dass der Grenzwert existiert und verschieden von 0 ist. Dann folgt (2.11) lim xn+1 = n→∞ 1 x 1 lim xn + · n→∞ 2 2 limn→∞ xn Wir bezeichnen den Grenzwert der Folge mit x0 und erhalten x0 = x 1 1 x0 + · . 2 2 x0 Also gilt x20 = x Für den Beweis des Beispiels benötigen wir die folgende Abschätzung. Lemma 2.3.5 Für alle s, t ∈ R gilt Für s 6= t gilt 4st ≤ (s + t)2 . 4st < (s + t)2 . Dies ist eigentlich die Abschätzung zwischen dem geometrischen und arithmetischen Mittel für nichtnegative, reelle Zahlen s und t √ s+t st ≤ . 2 Da wir hier erst die Existenz der Wurzel nachweisen, haben wir die Ungleichung ohne die Wurzel formuliert. Beweis. Es gilt 0 ≤ (s − t)2 = s2 − 2st + t2 . Es folgt 4st ≤ s2 + 2st + t2 = (s + t)2 . 2 Beweis von Beispiel 2.3.5. Wir überlegen uns zuerst, dass die Folge wohldefiniert ist. Dazu müssen wir zeigen, dass kein xn , n ∈ N, gleich 0 ist. Wir zeigen, dass für alle n ∈ N die Ungleichung 0 < xn gilt. Dies zeigen wir durch Induktion. Der Induktionsanfang liefert x1 = 1. Im Induktionsschritt nehmen wir an, dass xn > 0 und erhalten xn+1 = 1 x 1 xn + · > 0. 2 2 xn 2.3. R IST VOLLSTÄNDIG 77 Wir zeigen, dass {xn }∞ n=2 eine monoton fallende Folge ist. Da wir bereits wissen, dass die Folge nach unten beschränkt ist, konvergiert sie (Satz 2.3.1). Dazu zeigen wir, dass für alle n ∈ N mit n≥2 x ≤ x2n (2.12) gilt. Mit Lemma 2.3.5 folgt für n ∈ N x2n+1 = x 1 1 xn + · 2 2 xn 2 1 x 1 ≥ 4 xn · = x. 2 2 xn Wir zeigen nun, dass die Folge monoton fallend ist. Aus x2n ≥ 2 und xn > 0 folgt, dass für alle n≥2 x ≤ xn . xn Wir addieren auf beiden Seiten xn xn + x ≤ 2xn . xn Also gilt für alle n = 2, 3, . . . xn+1 ≤ xn . Da wir bereits wissen, dass die Folge nach unten beschränkt ist, konvergiert sie (Satz 2.3.1). Wir wollen nun zeigen, dass der Grenzwert verschieden von 0 ist. Falls x ≥ 1, dann gilt limn→∞ xn ≥ 1. Wir zeigen dies. Falls limn→∞ xn < 1, dann folgt mit (2.12) 1 > ( lim xn )2 = lim x2n ≥ x ≥ 1. n→∞ n→∞ Falls 0 < x < 1, dann gilt limn→∞ xn ≥ x. Wir zeigen dies. Falls limn→∞ xn < x, dann folgt mit (2.12) x2 > ( lim xn )n = lim x2n ≥ x. n→∞ n→∞ 2 Also x > x bzw. x > 1. x ∞ {xn }∞ n=2 ist eine monoton fallende Folge und somit { xn }n=2 eine monoton wachsende Folge. √ Beide Folgen konvergieren gegen x. Somit folgt (2.10). Es bleibt noch zu zeigen, strikt √ dass√die Wurzelfunktion √ monoton wachsend ist, d.h. für alle √ x, y ∈ R mit 0 < x < y gilt x < y. Falls nämlich y ≤ x, dann √ √ √ √ y = y · y ≤ x · x = x. 2 Für √ 2 wollen wir noch die numerischen Werte der ersten Folgenglieder festhalten. √ 4 2 = ≤ 2 3 x2 √ 24 2 1, 41176... = = ≤ 2 17 x3 √ 816 2 1, 41421... = = ≤ 2 577 x4 1, 333... = Für √ 3 = 1, 5 2 17 ≤ a3 = = 1, 41666... 12 577 ≤ x4 = = 1, 41421... 408 ≤ a2 = 7 erhalten wir mit dem Heron Verfahren für x1 = 2. x2 = 1 2 x1 + 7 x1 = 11 4 78 CHAPTER 2. DIE REELLEN ZAHLEN 1 x3 = 2 x4 = = 7 x2 + x2 1 = 2 11 4 · 7 + 4 11 = 233 88 1 7 1 233 7 · 88 x3 + = + 2 x3 2 88 233 2 2 233 + 7 · 88 54289 + 54208 108497 = = ∼ 2, 64575205.... 176 · 233 41008 41008 7 287056 = = 2, 64575057... x4 108497 Das Heron Verfahren lässt sich auf allgemeine, ganzzahlige Wurzeln verallgemeinern. Beispiel 2.3.6 Es sei x eine positive, reelle Zahl und k ∈ N mit 2 ≤ k. Weiter seien a1 = 1 und für n ≥ 1 (k − 1)(an )k + x . an+1 = k(an )k−1 Dann gilt lim (an )k = x. n→∞ Der Grenzwert der Folge ist also die k-te Wurzel von x. Beweis. Es gilt an+1 k(an )k−1 = (k − 1)(an )k + x. Deshalb lim an+1 k(an )k−1 = lim (k − 1)(an )k + x. n→∞ n→∞ und somit k lim an k n→∞ = (k − 1) lim an n→∞ k + x. Wir erhalten schließlich lim an n→∞ k = x. 2 Beispiel 2.3.7 (Schriftliches Wurzelziehen) Wir beschreiben hier ein Verfahren, um die Quadratwurzel aus einer natürlichen Zahl zu ziehen. Der Radikand wird in Gruppen von zwei Ziffern unterteilt, wobei wir rechts beginnen. Nun betrachten wir die erste Zahlengruppe, die Gruppe, die ganz links steht. Sie kann aus einer oder zwei Ziffern bestehen. Zu dieser ein- oder zweistelligen Zahle suchen wir die größte (einstellige) Zahl, deren Quadrat kleiner oder gleich dieser Zahl ist. Diese Zahl ist die erste Ziffer der Quadrat wurzel. Nun ziehen wir die Quadratzahl von der ersten Gruppe ab und ergänzen die Differenz mit den folgenden beiden Ziffern. Beispiel 2.3.8 Es sei a1 ∈ R und an+1 = an + a2n n∈N Dann konvergiert diese Folge für alle a1 mit −1 ≤ a1 ≤ 0 gegen 0. Für alle anderen Werte divergiert die Folge. 2.3. R IST VOLLSTÄNDIG 79 Beweis. Die Folge ist monoton wachsend an+1 = an + a2n ≥ an und für alle n ∈ N gilt −1 ≤ an ≤ 0, falls −1 ≤ a1 ≤ 0. Wir weisen dies mit Induktion nach. Es gilt nach Voraussetzung −1 ≤ a1 ≤ 0. Wir nehmen nun an, dass −1 ≤ an ≤ 0. Dann gelten 0 ≤ 1 + an ≤ 1, an+1 = an + a2n = an (1 + an ) ≤ 0 und an+1 = an + a2n = an (1 + an ) ≥ −1. Damit ist die Folge für −1 ≤ a1 ≤ 0 monoton wachsend und beschränkt und nach Lemma ?? konvergent. In diesem Fall folgt für den Grenzwert 2 lim an = lim an+1 = lim an + lim an n→∞ n→∞ n→∞ n→∞ also lim an = 0. n→∞ Wir betrachten nun die anderen Fälle. Es sei 0 < a1 . Dann gilt für alle an , n ∈ N, an ≥ a1 . Falls die Folge konvergiert, dann gilt also 0 < a1 ≤ lim an . n→∞ Wir hatten uns aber bereits überlegt, dass der Grenzwert 0 sein muss. Falls a1 < −1, dann a2 = a1 + a21 = a1 (1 + a1 ) > 0. Nun verfahren wir wie im Fall a1 > 0. 2 Beispiel 2.3.9 [51, 74] (i) Es sei {an }n∈N eine Folge positiver, reeller Zahlen. Die Folge s r q √ a1 + a2 + · · · + an−1 + an n∈N konvergiert genau dann, wenn es eine Zahl c > 0 gibt, so dass für alle n ∈ N die Ungleichung n an ≤ c(2 ) gilt. (ii) Insbesondere konvergiert s r q √ x + x + ··· + x + x für x > 0 und der Grenzwert ist 1 2 + q x + 14 . Beweis. (i) Wir überlegen uns zunächst, dass für alle Folgen {an }n∈N und {bn }n∈N , so dass für alle n ∈ N die Ungleichungen 0 ≤ an ≤ bn gelten, s s r r q q p √ a1 + a2 + · · · + an−1 + an ≤ b1 + b2 + · · · + bn−1 + bn für alle n ∈ N gelten. Wir zeigen dies mit Induktion. Der Induktionsanfang folgt, weil die Wurzelfunktion monoton wachsend ist (Beispiel 2.3.5(ii)). Nun der Induktionsschritt. Die Aussage gilt für alle Folgen der Länge n. Wir wenden diese Aussage auf die Folgen p √ a1 , . . . , an−1 , ãn = an + an+1 und b1 , . . . , bn−1 , b̃n = bn + bn+1 80 CHAPTER 2. DIE REELLEN ZAHLEN an. Wir zeigen, dass die Bedingung notwendig ist. Wenn wir a1 , . . . , an−1 durch 0 ersetzen, erhalten wir für alle n ∈ N r q q √ √ a1 + a2 + · · · + an ≥ · · · an . n Falls es zu jedem c > 0 ein n ∈ N mit an > c(2 ) gibt, dann gilt r q √ c ≤ a1 + a2 + · · · + an und die Folge ist unbeschränkt, kann also nicht konvergieren. Wir zeigen nun, dass die Bedingung hinreichend ist. Falls es eine Zahl c gibt, so dass für alle n n ∈ N die Ungleichung an ≤ c(2 ) gilt, dann folgt für alle n ∈ N r r r q q q p √ √ n) 2 4 (2 a1 + a2 + · · · + an ≤ c + c + · · · + c = c 1 + 1 + · · · + 1. Weiter gilt 2 = = √ 2+ q √ 2 + 2 = ··· r q √ √ 2 + · · · + 2 + 2 > 1 + 1 + · · · + 1. 2+2= r q 2+ Damit ist die Folge nach oben beschränkt. Außerdem ist sie monoton wachsend. s r r q q √ √ a1 + a2 + · · · + an < a1 + a2 + · · · + an + an+1 Mit Lemma ?? folgt, dass die Folge konvergiert. (ii) Wir wenden (i) an, um festzustellen, dass die Folge konvergiert. Die Folge lässt sich auch so schreiben: p √ b1 = x bn+1 = x + bn . Dies bedeutet, dass für alle n ∈ N b2n+1 = x + bn gilt. Mit Lemma 2.2.3 folgt lim bn 2 n→∞ = lim b2n+1 = x + lim bn . n→∞ n→∞ Es folgt für den Grenzwert b der Folge also b = 1 2 b2 = x + b, q ± x + 14 . Da der Grenzwert positiv sein muss, folgt b = Beispiel 2.3.10 (i) Für alle x ∈ R mit |x| < 1 gilt lim xn = 0. n→∞ (ii) lim n→∞ (iii) Für alle x ∈ R gilt n! =0 nn xn = 0. n→∞ n! lim 1 2 + q x + 41 . 2 2.4. DIFFERENZENGLEICHUNGEN 81 Beweis. (i) Gegeben sei > 0. Nun wählen wir N , so dass für alle n > N gilt 1 1 <n −1 |x| 1 Dies ist möglich, weil R Archimedisch ist und 1 < |x| . Damit und mit der Bernoulli-Ungleichung folgt, dass n 1 1 1 1 1 = 1+ −1 ≥1+n −1 >n −1 > n |x| |x| |x| |x| Also gilt für alle n > N |xn − 0| < Wir geben noch einen alternativen Beweis an. Die Folge {xn }n∈N ist für x mit 0 ≤ x < 1 monoton fallend und beschränkt. Es gilt für alle n ∈ N 0 ≤ xn < 1. Da die Folge monoton fallend und beschränkt ist, konvergiert sie nach Lemma ??. Weiter gilt lim xn = lim xn+1 = x lim xn . n→∞ n→∞ n→∞ Es folgt lim xn = 0. n→∞ (ii) Es gilt 0≤ (iii) Die Folge xn n! , 1 n! ≤ n n n n ∈ N, ist für n > x monoton fallend: Es gilt für n > x xn+1 xn ≥ n! (n + 1)! weil dies zu n+1≥x äquivalent ist. Damit ist die Folge nach oben beschränkt. Außerdem ist die Folge nach unten durch 0 beschränkt. Mit Lemma ?? folgt, dass die Folge konvergiert. Da limn→∞ n1 = 0 folgt xn x x xn−1 xn lim = lim lim = lim lim = 0. n→∞ n! n→∞ n n→∞ (n − 1)! n→∞ n n→∞ n! 2 2.4 Differenzengleichungen Wir bezeichnen den Vektorraum aller reellen Folgen mit R∞ . Es seien a1 , . . . , ak ∈ R und {xn }∞ n=0 eine reelle Folge. Falls für alle n mit n ≥ k die Gleichungen xn + a1 xn−1 + · · · + ak xn−k = 0 gelten, dann sagen wir, dass die Folge die Differenzengleichung mit den Koeffizienten a1 , . . . , ak erfüllt. Man überlegt sich leicht, dass die Menge aller Lösungen ein linearer Teilraum des Vektorraumes aller unendlichen Folgen ist. 82 CHAPTER 2. DIE REELLEN ZAHLEN Differenzengleichungen liefern interessante Beispiele von Folgen, für die wir Konvergenz untersuchen. Das bekannteste Beispiel sind die Fibonacci Zahlen (Beispiel 2.4.2), die die Entwicklung einer Kaninchenpopulation beschreiben. Interessant ist bei diesem Beispiel, dass der Goldene Schnitt auftaucht. Darüber hinaus gibt es viele Beispiele aus Wirtschaftswissenschaften, Psychologie und Soziologie in der der Goldene Schnitt erscheint. Satz 2.4.1 (Differenzengleichung) Es seien a1 , . . . , ak ∈ R und wir nehmen an, dass λ1 , . . . , λk ∈ R paarweise verschiedene Nullstellen des Polynoms (2.13) tk + a1 tk−1 + · · · + ak−1 t + ak = 0 sind. Dann ist {(λni )∞ n=0 |i = 1, . . . , k} eine Basis des Lösungsraumes der Differenzengleichung xn + a1 xn−1 + · · · + ak xn−k = 0 n ≥ k. Das Polynom tk + a1 tk−1 + · · · + ak−1 t + ak heißt das charakteristische Polynom der Differenzengleichung. Beweis. Falls λ eine Nullstelle des Polynoms tk + a1 tk−1 + · · · + ak−1 t + ak ist, so ist (λn )∞ n=0 eine Lösung. Dies ist offensichtlich: Aus λk + a1 λk−1 + · · · + ak−1 λ + ak = 0 folgt für alle n ∈ N mit n ≥ k λn−k (λk + a1 λk−1 + · · · + ak−1 λ + ak ) = 0 also für alle n ∈ N mit n ≥ k λn + a1 λn−1 + · · · + ak−1 λn−k+1 + ak λn−k = 0. Daraus folgt, dass das Erzeugnis von {((λi )n )∞ n=0 |i = 1, . . . , k} im Lösungsraum enthalten ist. Außerdem sind die Vektoren ((λi )ni )∞ n=0 i = 1, . . . , k im Raum R∞ linear unabhängig. Dazu müssen wir zeigen, dass aus der Gleichung k X i=1 ci ((λi )ni )∞ n=0 = 0 2.4. DIFFERENZENGLEICHUNGEN 83 folgt c1 = c2 = · · · = ck = 0. Es reicht also zu zeigen, dass aus k X ci ((λi )ni )k−1 n=0 = 0 i=1 folgt c1 = c2 = · · · = ck = 0. Deshalb 1 λ1 λ2 1 , .. . λk−1 1 reicht es aus nachzuweisen, dass die Vektoren 1 1 λk λ2 2 2 λ2 , . . . , λk .. .. . . k−1 λ2 λkk−1 im Raum Rk linear unabhängig sind. Dazu zeigen wir, dass die Determinante dieser Matrix von 0 verschieden ist. Es handelt sich um die Vandermondesche Determinante, die sich zu Y (λi − λj ) i>j berechnet. Da alle λi paarweise verschieden sind, ist die Determinante von 0 verschieden. Es bleibt noch zu zeigen, dass die Dimension des Raumes aller Lösungen kleiner oder gleich k ist. Jede Lösung ist durch die ersten k Koordinaten x0 , . . . , xk−1 bestimmt. Dies folgt aus der Rekursionsformel. Also ist die Dimension des Raumes gleich k. 2 Lemma 2.4.1 Es seien a1 , . . . , ak ∈ R und wir nehmen an, dass λ ∈ R eine reelle Nullstelle der Vielfachheit ` des charakteristischen Polynoms (2.14) tk + a1 tk−1 + · · · + ak−1 t + ak = 0 ist. Dann sind (nj λn )∞ n=0 |j = 0, . . . , ` − 1 Lösungen der Differenzengleichung xn + a1 xn−1 + · · · + ak xn−k = 0 n ≥ k. Lemma 2.4.2 Es seien a1 , . . . , ak ∈ R und wir nehmen an, dass r(cos θ + i sin θ) eine komplexe Nullstelle der Vielfachheit ` des charakteristischen Polynoms (2.15) tk + a1 tk−1 + · · · + ak−1 t + ak = 0 ist. Dann sind für alle b ∈ R {(rn cos(nθ + b))∞ n=0 |j = 0, . . . , ` − 1} Lösungen der Differenzengleichung xn + a1 xn−1 + · · · + ak xn−k = 0 n ≥ k. 84 CHAPTER 2. DIE REELLEN ZAHLEN Man beachte, dass mit r(cos θ+i sin θ) auch r(cos θ−i sin θ) Nullstelle des charakteristischen Polynoms ist. Beispiel 2.4.1 Es seien a, b ∈ R. Wir setzen x0 = a, x1 = b und für n = 2, 3, . . . xn = 1 (xn−1 + xn−2 ) 2 dann gilt lim xn = n→∞ 2 1 a+ b 3 3 Beweis. Wir wenden Satz 2.4.1 an. Das charakteristische Polynom der Differenzengleichung ist t2 − 21 t − 12 . Die Nullstellen sind 1 und − 12 . Deshalb ist (1)∞ n=0 − 12 n ∞ n=0 eine Basis des Lösungsraumes. Wir bestimmen nun die Koeffizienten c1 und c2 , so dass a = x0 = c1 + c2 b = x1 = c1 − 21 c2 Also b = a − c2 − 12 c2 c2 = 23 (a − b) c1 = a − c2 = a − 23 (a − b) = 31 a + 23 b. Damit ist die Folge 2 1 n ( 13 a + 23 b)(1)∞ n=0 + 3 (a − b) (− 2 ) ∞ n=0 die Lösung und lim ( 31 a + 23 b) + 23 (a − b)(− 21 )n = 31 a + 23 b. n→∞ 2 Beispiel 2.4.2 Die Fibonacci Zahlen sind durch die Rekursion xn+2 = xn+1 + xn mit x0 = 0 und x1 = 1 gegeben. Dann gilt √ xn+1 1+ 5 lim = = 1, 6180... n→∞ xn 2 (2.16) √ Die Zahl 1+2 5 bezeichnet man als den Goldenen Schnitt. Zwei Strecken a und b mit a < b stehen im Verhältnis des Goldenen Schnittes, wenn sich die größere zur kleineren Strecke verhält wie die Summe aus beiden zur größeren a b = . b a+b Der Goldene Schnitt spielt in der Architektur eine Rolle. 2.4. DIFFERENZENGLEICHUNGEN 85 Mit Hilfe dieser Zahlenfolge hat Leonardo Fibonacci (1180-1241) das Wachstum einer Kaninchenpopulation beschrieben. Hierbei hat er folgende Annahmen gemacht: (i) Jedes Paar Kaninchen wirft pro Monat ein weiteres Paar Kaninchen. (ii) Ein neugeborenes Paar bekommt erst im zweiten Lebensmonat Nachwuchs. (iii) Die Tiere sind isoliert. Die Zahl der Kaninchen Paare in einem gegebenen Monat setzt aus den Paaren zusammen, die im Vormonat gelebt haben und den neugeborenen Paaren. Die Anzahl der neugeborenen Paare ist gleich der Anzahl der Paare, die im Vorvormonat gelebt haben. Beweis. Wir benutzen den Satz über die Lösungen der Differenzengleichungen. Wir müssen die Nullstellen des Polynoms t2 − t − 1 = 0 bestimmen. Die Nullstellen sind √ 1+ 5 2 Somit ist √ 1− 5 . 2 und √ !n !∞ 1− 5 2 √ !n !∞ 1+ 5 2 n=0 n=0 eine Basis des Lösungsraumes. Nun wählen wir die Koeffizienten c1 und c2 , so dass √ √ 1+ 5 1− 5 c1 + c2 = 0 und c1 + c2 = 1. 2 2 Es folgt c2 = −c1 und damit √ √ 1+ 5 1− 5 c1 − c1 = 1. 2 2 Also 1 c1 = √ . 5 Als Lösung erhalten wir √ !n !∞ 1+ 5 − 2 1 √ 5 n=0 Damit erhalten wir lim n→∞ xn+1 = lim n→∞ xn √ n+1 1+ 5 2 √ n 1+ 5 2 Wegen − − √ n+1 1− 5 2 √ n 1− 5 2 = − − √ n+1 1− 5 2 √ n . 1− 5 2 √ n+1 1+ 5 2 √ n 1+ 5 2 1− n 1− 1 − √5 1 √ ≤ . 1 + 5 2 gilt lim n→∞ Hiermit folgt nun (2.16). 2 n=0 √ n+1 1+ 5 2 √ n 1+ 5 2 Es gilt √ !n !∞ ! 1− 5 2 √ !n 1− 5 √ = 0. 1+ 5 √ n+1 1−√5 1+ 5 √ n o 1−√5 1+ 5 . 86 CHAPTER 2. DIE REELLEN ZAHLEN Beispiel 2.4.3 ([45], S. 156) Wir betrachten ein Nachrichtenübertragungssysten, dem zwei Signale S1 und S2 zur Verfügung stehen. Die Nachrichten werden zunächst zu Folgen von S1 und S2 codiert. Das Signal S1 benötigt die Zeit t1 , um übertragen zu werden, und S2 die Zeit t2 . Es sei Nt die Anzahl aller möglichen Nachrichten, die man in einer Zeit t übertragen kann. Wir wollen nun die Zahl Nt bestimmen. Dazu stellen wir eine Differenzengleichung auf. Wir betrachten alle jene Nachrichten, die mit einem S1 enden. Für alle jene Nachrichten, die mit S1 enden gibt es Nt−t1 Möglichkeiten, entsprechend Nt−t2 , wenn die Nachricht mit S2 endet. Wir erhalten also Nt = Nt−t1 + Nt−t2 Falls t1 = t2 = 1, dann handelt es sich um die Fibonacci Zahlen (Beispiel 2.4.2) und wir erhalten Nt = C1 √ !t 1− 5 . 2 √ !t 1+ 5 + C2 2 Die Konstanten C1 und C2 sind durch N0 und N1 festgelegt. Berücksichtigen wir die Bedeutung von Nt wählen wir N0 = 0 und N1 = 1. Wir erhalten 1 C1 = √ 5 1 C2 = − √ . 5 und Die Kapazität eines Nachrichtenkanals wir von Shannon durch C = lim t→∞ log2 Nt t definiert. Wir wollen etwas auf diese Definition eingehen: Um ein Wort besteht aus einer Folge von S1 und S2 . Jede Wahl von S1 oder S2 liefert die Information 2 insgesamt also Nt = 2k . Wir erhalten √ 1+ 5 C = log2 ∼ 0, 7. 2 Beispiel 2.4.4 Es sei die Differenzengleichung xn − 23 xn−1 + 12 xn−2 = 0 n≥2 mit x0 = a und x1 = b gegeben. Die Folge konvergiert und der Grenzwert ist 2b − a. Beweis. Die charakteristische Gleichung ist t2 − 23 t + 1 2 =0 Die Nullstellen sind 1 und 21 . Damit ist {1}∞ n=0 1 2n ∞ n=0 eine Basis des Lösungsraumes. a = x0 = c1 + c2 1 b = x1 = c1 + c2 2 Also Der Grenzwert ist 2b − a. 2 1 b = a − c2 + c2 2 c2 = 2(a − b) c1 = 2b − a 2.5. LIMES SUPERIOR UND LIMES INFERIOR 2.5 87 Limes Superior und Limes Inferior Definition 2.5.1 Es sei {xn }n∈N eine reelle Folge. Eine Zahl x0 ∈ R heißt Häufungswert der Folge, falls für jedes > 0 die Menge {n ∈ N||xn − x0 | < } unendlich viele Elemente enthält. In Quantorenschreibweise: ∀ > 0∀N ∈ N∃n ≥ N : |x0 − xn | < . Lemma 2.5.1 Es sei {xn }n∈N eine reelle Folge. x0 ist genau dann Häufungswert dieser Folge, wenn {xn }n∈N eine Teilfolge hat, die gegen x0 konvergiert. Beweis. Wir nehmen an, dass x0 der Grenzwert einer Teilfolge {xnk }k∈N von {xn }n∈N ist. Dann ∀ > 0∃K ∈ N∀k ≥ K : |x0 − xnk | < Zu gegebenen > 0 und K ∈ N wählen wir nun k = max{K, K }. Es folgt ∀ > 0∀K ∈ N∃k ≥ K : |x0 − xnk | < . Wir nehmen nun an, dass x0 ein Häufungswert der Folge {xn }n∈N ist. Dann ∀ > 0∀N ∈ N∃n ≥ N : |x0 − xn | < . Es folgt ∀m ∈ N∀N ∈ N∃n ≥ N : |x0 − xn | < 1 . m Wähle xn1 mit |x0 − xn1 | < 1. Nachdem wir xn1 , . . . , xnk gewählt haben, wählen wir nk+1 = min n n > nk ∧ |x0 − xn | < 1 k+1 Dieses Minimum existiert, da N wohlgeordnet ist. Die Folge {xnk }k∈N erfüllt also ∀k ∈ N : Also konvergiert sie gegen x0 . 2 |x0 − xnk | < 1 . k 88 CHAPTER 2. DIE REELLEN ZAHLEN Definition 2.5.2 Es sei {xn }n∈N eine Folge reeller Zahlen. Wir setzen für k ∈ N yk = sup{xn |k ≤ n} = sup{xk , xk+1 , xk+2 , . . . }. Der Limes Superior der Folge {xn }n∈N ist lim sup xn = lim yk . n→∞ k→∞ Analog setzen wir für k ∈ N zk = inf{xn |k ≤ n} = inf{xk , xk+1 , xk+2 , . . . }. Der Limes Inferior der Folge {xn }n∈N ist lim inf xn = lim zk . n→∞ k→∞ Lemma 2.5.2 Für jede beschränkte, reelle Folge existieren Limes Inferior und Limes Superior. Beweis. Nach Satz 2.1.2 besitzt jede nach oben beschränkte Menge in R ein Supremum. Die Folge {xn }n∈N ist nach oben beschränkt. Deshalb ist die Folge yk = sup{xn |k ≤ n} k∈N wohldefiniert. Außerdem ist die Folge {yk }k∈N monoton fallend, weil für alle k ∈ N {xn |k + 1 ≤ n} ⊆ {xn |k ≤ n}. Da die Folge {xn }n∈N nach unten durch eine Konstante C beschränkt ist, gilt für alle k ∈ N yk = sup{xn |k ≤ n} ≥ C. Also ist die Folge {yk }k∈N monoton fallend und nach unten beschränkt. Nach Satz 2.3.1 ist sie damit konvergent. Also existiert der Limes Superior. 2 Lemma 2.5.3 Limes Superior und Limes Inferior einer reellen Folge sind Häufungswerte dieser Folge. Beweis. Wir betrachten die Folge {xn }n∈N . Wir nehmen an, dass der Limes Superior existiert. Wir zeigen, dass es eine Teilfolge gibt, die gegen den Limes Superior konvergiert. Wir setzen für alle n ∈ N yn = sup{xk |k ≥ n}. Dann gibt es für alle n ∈ N ein xkn mit kn ≥ n und y n ≤ xk n + 1 . n 2.5. LIMES SUPERIOR UND LIMES INFERIOR 89 Dies folgt aus der Definition des Supremums. Mit Lemma 2.2.4 folgt, dass {yn − xkn }n∈N eine Nullfolge ist. Deshalb konvergiert die Folge {xkn }n∈N gegen denselben Grenzwert wie die Folge {yn }n∈N . Die Folge {yn }n∈N konvergiert aber gegen den Limes Superior der Folge {xn }n∈N . 2 Lemma 2.5.4 (i) Der Limes Superior einer beschränkten, reellen Folge ist der größte Häufungswert dieser Folge. (ii) Der Limes Inferior einer beschränkten, reellen Folge ist der kleinste Häufungswert der Folge. Beweis. (ii) Es sei x0 ein Häufungswert von {xn }n∈N . Dann gibt es eine Teilfolge {xnk }k∈N , die gegen x0 konvergiert. Wegen Lemma 2.3.1 gilt k ≤ nk und somit zk = inf{xn |k ≤ n} ≤ xnk . Mit Lemma 2.2.4 folgt lim inf xn = lim zk ≤ lim xnk = x0 . n→∞ k→∞ k→∞ 2 Lemma 2.5.5 Eine Folge konvergiert genau dann, wenn Limes Inferior und Limes Superior existieren und gleich sind. Beweis. Wir nehmen an, dass die Folge {xn }n∈N gegen den Grenzwert x0 konvergiert. Nach Lemma 2.2.1 ist die Folge dann beschränkt. Wegen Lemma 2.5.2 existieren dann Limes Superior und Limes Inferior. Limes Superior und Inferior sind Häufungswerte der Folge. Nach Lemma 2.5.1 gibt es Teilfolgen, die gegen Limes Superior und Limes Inferior konvergieren. Nach Lemma 2.3.2 konvergieren alle Teilfolgen einer konvergenten Folge gegen den Grenzwert der Folge. Damit sind Limes Superior und Limes Inferior gleich. Wir nehmen nun an, dass Limes Superior und Limes Inferior existieren und gleich sind. Wir bezeichnen den Limes Superior und Limes Inferior mit x0 . Dann gilt ∀ > 0∃N ∈ N∀n ≥ N : sup xk − x0 < k≥n ∀ > 0∃N ∈ N∀n ≥ N : Ebenso ∀ > 0∃M ∈ N∀n ≥ M : ∀ > 0∃M ∈ N∀n ≥ M : xn ≤ sup xk < + x0 k≥n x0 − inf xk < k≥n xn ≥ inf xk > − + x0 k≥n 90 CHAPTER 2. DIE REELLEN ZAHLEN Wir setzen Ñ = max{N, M }. Dann gilt ∀ > 0∃Ñ ∈ N∀n ≥ Ñ : x0 − < xn < x0 + . Somit ∀ > 0∃Ñ ∈ N∀n ≥ Ñ : |x0 − xn | < . Korollar 2.5.1 Eine reelle, beschränkte Folge konvergiert genau dann, wenn sie genau einen Häufungswert besitzt. Beweis. Falls eine Folge konvergiert, dann sind nach Lemma 2.5.5 Limes Superior und Limes Inferior gleich. Nach Lemma 2.5.4 gibt es dann nur einen Häufungswert. 2 Lemma 2.5.6 Es sei {xn }n∈N eine beschränkte Folge reeller Zahlen, die nicht konvergiert. Dann gibt es zwei konvergente Teilfolgen, die gegen verschiedene Grenzwerte konvergieren. Beweis. Da die Folge beschränkt ist, existieren nach Lemma 2.5.2 Limes Inferior und Limes Superior. Nach Lemma 2.5.5 konvergiert eine Folge genau dann, wenn Limes Inferior und Limes Superior gleich sind. 2 Beispiel 2.5.1 (i) xn = (−1)n , n ∈ N. Dann gelten lim sup xn = 1 und n→∞ lim inf xn = −1. n→∞ (ii) xn = n, n ∈ N. Dann existieren lim sup xn und n→∞ lim inf xn n→∞ nicht. (iii) xn = n + (−1)n n, n ∈ N. Dann gilt lim inf xn = 0 n→∞ und lim sup xn existiert nicht. n→∞ (iv) Es sei die Funktion φ : N → N durch n 2 φ(n) = n+1 2 falls n gerade ist falls n ungerade ist gegeben. Dann sind −2, 0, 2 die Häufungswerte der Folge {(−1)n + (−1)φ(n) }n∈N . Limes Superior dieser Folge ist 2 und Limes Inferior ist −2. (v) Es sei I : N → Q eine bijektive Abbildung. I ist eine Folge, die wir auch durch {xn }n∈N notieren. Jede reelle Zahl ist Häufungswert dieser Folge. 2.5. LIMES SUPERIOR UND LIMES INFERIOR 91 Beweis. (iv) Die Folge nimmt nur die Werte −2, 0, 2 an. Da es nur endlich viele Zahlen sind, kommen nur diese Zahlen als Häufungswerte in Frage. Tatsächlich sind alle drei Zahlen Häufungswerte der Folge, der Limes Inferior ist −2 und der Limes Superior ist 2. Wir weisen dies nach. Es gilt für alle k ∈ N (−1)4k + (−1)φ(4k) = 2 (−1)4k+1 + (−1)φ(4k+1) = −2 (−1)4k+2 + (−1)φ(4k+2) = 0. (v) Es sei x0 ∈ R. Wir zeigen, dass x0 Häufungswert ist. Wir definieren die Teilfolge induktiv. Nach Korollar 2.10.1 gibt es zwischen x0 und x0 + 1 eine rationale Zahl qn1 . Wir nehmen an, dass wir qn1 , . . . , qnk bereits gewählt haben. Nun wählen wir qnk+1 . Es gibt nach Korollar 2.10.1 eine rationale Zahl qnk+1 mit x0 < qnk+1 < min{qi |x0 < qi und 1 ≤ i ≤ nk } und x0 < qnk+1 < x0 + k1 . Diese Folge konvergiert gegen x0 . Sie ist eine Teilfolge von {xn }n∈N . 2 Beispiel 2.5.2 Limes Inferior und Limes Superior der Folge {sin n}n∈N sind −1 und 1. Alle Punkte [−1, 1] sind Häufungswerte. Equidistribution theorem Wir werden dieses Beispiel später behandeln, wenn wir alle notwendigen Begriffe und Hilfsmittel eingführt haben. Lemma 2.5.7 Es seien {an }n∈N und {bn }n∈N beschränkte Folgen. Dann gilt lim sup(an + bn ) ≤ lim sup an + lim sup bn . n→∞ n→∞ n→∞ Es seien {an }n∈N und {bn }n∈N beschränkte Folgen. Dann gilt lim inf (an + bn ) ≥ lim inf an + lim inf bn . n→∞ n→∞ n→∞ Beweis. lim sup(an + bn ) = lim sup{ak + bk |n ≤ k} n→∞ n→∞ Weiter gilt sup{ak + bk |n ≤ k} ≤ sup{ak |n ≤ k} + sup{bk |n ≤ k} Wir überlegen uns dies. Es seien ξ das Supremum von sup{ak |n ≤ k} und η das Supremum von sup{kk |n ≤ k}. Dann gelten für alle k mit n ≤ k ak ≤ ξ Also gilt für alle k mit n ≤ k 2 und bk ≤ η. ak + bk ≤ ξ + η. Beispiel 2.5.3 Für die Folgen an = 1 + (−1)n , n ∈ N und bn = 1 + (−1)n+1 , n ∈ N gilt 2 = lim sup(an + bn ) < lim sup an + lim sup bn = 4 n→∞ n→∞ n→∞ 92 CHAPTER 2. DIE REELLEN ZAHLEN Lemma 2.5.8 Seien {an }n∈N und {bn }n∈N nach oben beschränkte Folgen in [0, ∞). Dann gilt lim sup(an · bn ) ≤ (lim sup an ) · (lim sup bn ). n→∞ n→∞ n→∞ Beweis. Es gilt für alle n ∈ N sup{ak bk |n ≤ k} ≤ sup{ak |n ≤ k} sup{bk |n ≤ k}. (2.17) Wir weisen dies nach. Es gelten für alle j mit n ≤ j aj ≤ sup{ak |n ≤ k} und bj ≤ sup{bk |n ≤ k}. Da für alle j ∈ N die Ungleichungen 0 ≤ aj und 0 ≤ bj gelten, folgt für alle j ≥ n aj bj ≤ sup{ak |n ≤ k} sup{bk |n ≤ k} Hiermit folgt (2.17). Weiter folgt lim sup{ak bk |n ≤ k} ≤ n→∞ lim (sup{ak |n ≤ k} sup{bk |n ≤ k}) = lim sup{ak |n ≤ k} lim sup{bk |n ≤ k} . n→∞ n→∞ n→∞ 2 Beispiel 2.5.4 Wir betrachten die Folgen an = 1 + (−1)n , n ∈ N, und bn = 1 + (−1)n+1 , n ∈ N. Dann gilt (1 + (−1)n ) · (1 + (−1)n+1 ) = 0 und damit lim sup an bn = 0. n→∞ Andererseits gilt (lim sup an )(lim sup bn ) = 1. n→∞ 2.6 n→∞ Reihen in R Wir stellen hier einige Kriterien zur Konvergenz von Reihen zusammen: Verdichtungssatz von Cauchy, Quotientenkriterium, Kriterium von Raabe und Majoranten Kriterium. Ein weiteres Kriterium, das Wurzelkriterium, führen wir im Zusammenhang mit Potenzreihen ein. Es stellt sich heraus, dass der Verdichtungssatz von Cauchy für positive Reihen das stärkste Hilfsmittel ist. Wir erklären P die An1 wendung der Kriterien an einigen Beispielen, wie die harmonische Reihe n∈N n , P P 1 n1 n∈N n2 und n∈N (−1) n . 2.6. REIHEN IN R 93 Definition 2.6.1 Es sei {xk }k∈N eine Folge in R. Wir bezeichnen die von {xk }k∈N erzeugte Folge {sn }n∈N n X sn = xk n∈N k=1 als die unendliche Reihe von {xk }k∈N . Wir bezeichnen sn als die n-te Partialsumme der Reihe. Die Reihe von {xk }k∈N heißt konvergent, falls die Folge {sn }n∈N konvergiert. Wir schreiben dann für den Grenzwert ∞ X xk . k=1 Wir sagen, dass die Reihe divergiert, wenn sie nicht konvergiert. Eine Folge konvergiert genau P dann in R, falls sie eine Cauchy-Folge ist. Für Reihen bedeutet dies: Eine Reihe ∞ n=1 xn konvergiert genau dann, wenn zu jedem > 0 ein N ∈ N existiert, so dass für alle n, m ≥ N , n < m, die Ungleichung m X xk < k=n gilt. P −n ist ein klassisches Beispiel. Man kann sich mit Hilfe der Die Reihe ∞ n=0 2 folgenden Anekdote überlegen, dass diese Reihe konvergiert und der Grenzwert 2 ist. Herkules und eine Schildkröte laufen um die Wette. Die Schildkröte erhält einen Vorsprung von 1 Kilometer. Herkules läuft doppelt so schnell wie die Schildkröte. Offensichtlich wird die Schildkröte bei Kilometer 2 von Herkules eingeholt. Andererseits hat die Schildkröte 1 + 21 Kilometer zurückgelegt, wenn Herkules 1 Kilometer gelaufen ist. Wenn Herkules 1 + 21 Kilometer gelaufen ist, dann ist die Schildkröte 1 + 12 + 14 Kilometer gelaufen. Dieses setzt sich entsprechend fort und man schließt, dass Herkules die Schildkröte einholt. P∞ nie −n 2 gelaufen ist, so ist auch Herkules Wenn die Schildkröte die Strecke n=0P −n diese Strecke gelaufen und man sieht, dass ∞ = 2. n=0 2 Beispiel 2.6.1 (Geometrische Reihe) Eine Folge positiver reeller Zahlen {xn }n∈N heißt geometrische Folge Wenn der Quotient zweier aufeinander folgender Folgenglieder konstant ist, d.h. es gibt ein x > 0, so dass für alle n ∈ N gilt xxn+1 = x. Man nennt sie geometrisch, weil jedes Folgenglied das n geometrische Mittel seiner beiden Nachbarn ist, d.h. für alle n ∈ N mit n ≥ 2 √ xn = xn−1 xn+1 . Für alle x ∈ R mit |x| < 1 gilt ∞ X n=0 Diese Reihe heißt geometrische Reihe. xn = 1 . 1−x 94 CHAPTER 2. DIE REELLEN ZAHLEN Lemma 2.6.1 Für alle x ∈ R mit x 6= −1 und für alle n ∈ N gilt n X xk = k=0 Beweis. (1 − x) n X xk = k=0 n X 1 − xn+1 . 1−x xk − k=0 n X k=0 xk+1 = 1 − xn+1 2 Beweis von Beispiel 2.6.1. Nach Lemma 2.6.1 gilt n X xk = k=0 1 − xn+1 . 1−x Nach Beispiel 2.3.10 gilt 1 − xn+1 1 1 1 = − lim xn+1 = . n→∞ 1−x 1 − x 1 − x n→∞ 1−x lim 2 Lemma 2.6.2 (Verdichtungskriterium von Cauchy) Es sei {x Pn }n∈N eine monoton fallende Folge positiver Zahlen. Dann konvergiert die Reihe ∞ n=1 xn genau dann, wenn ∞ X 2k x2k k=0 konvergiert. Außerdem gilt ∞ X k=0 k 2 x2k+1 ≤ ∞ X n=1 xn ≤ ∞ X 2k x2k , k=0 falls eine der beiden Reihen konvergiert. Man nennt dieses Lemma Verdichtungskriterium, weil in der zweiten Reihe sehr viel weniger Summanden der ersten Reihe auftreten. P Beweis. Die Reihe ∞ n=1 xn konvergiert genau dann, wenn es ein C gibt, so dass für alle N ∈ N N X xn ≤ C n=1 gilt. Dies gilt, weil die Folge der Partialsummen monoton und beschränkt P∞ wachsend k ist (Satz 2.3.1). Dieselbe Aussage gilt für die Reihe k=0 2 x2k . Da die Folge monoton fallend ist, gelten für alle k = 0, 1, 2, . . . und alle n mit 2k ≤ n ≤ 2k+1 − 1 die Ungleichungen x2k+1 ≤ xn ≤ x2k . Deshalb gilt für alle k = 0, 1, . . . 2k+1 X−1 k 2 x2k+1 ≤ xn ≤ 2k x2k . n=2k 2.6. REIHEN IN R 95 Hieraus folgt N X k=0 k+1 k 2 x2k+1 ≤ N 2X −1 X k=0 n=2k xn ≤ N X 2k x2k . k=0 Wir überlegen uns jetzt, dass für alle N ∈ N0 k+1 N 2X −1 X k=0 +1 −1 2NX xn = xn n=1 n=2k gilt. Wri zeigen dies durch Induktion. Für N = 0 sind beide Seiten der Gleichung gleich x1 . Nun der Induktionsschritt N +1 2k+1 X X−1 k+1 xn = k=0 n=2k N 2X −1 X xn + +2 −1 2NX Somit erhalten wir k=0 Falls P∞ k=0 k 2 x2k+1 ≤ xn + n=1 n=2N +1 k=0 n=2k N X xn = +1 −1 2NX +1 −1 2NX n=1 xn ≤ N X +2 −1 2NX n=2N +1 xn = +1 −1 2NX xn . n=1 2k x2k . k=0 2k x2k konvergiert, dann folgt mit Lemma ?? ∞ X n=1 xn ≤ ∞ X 2k x2k . k=0 Die andere Ungleichung folgt genauso. 2 Beispiel 2.6.2 Die Reihe ∞ X 1 n n=1 heißt harmonische Reihe. Sie konvergiert nicht. Die Reihe heißt harmonisch, weil die Wellenlängen der Obertöne einer schwingenden Saite jeweils 12 , 31 , 14 ... der Wellenlänge des Grundtons sind. Es wurde zuerst im 14.ten Jahrhundert von Nicole Oresme beobachtet, dass die harmonische Reihe divergiert. Dies geriet aber in Vergessenheit. Im 17.ten Jahrhundert wurde dies von Pietro Mengoli, Johann und Jacob Bernoulli bewiesen. Beweis. Wir geben hier mehrere Beweise. (i) Wir erhalten das Ergebnis unmittelbar aus Lemma 2.6.2. Die Reihe ∞ X k=0 ∞ 2k X 1 = 1 k 2 k=0 konvergiert nicht. (ii) Wir geben auch noch einen Beweis an, der nicht Lemma 2.6.2 benutzt. Wir zeigen, dass die Folge der Partialsummen n X 1 n∈N k k=1 96 CHAPTER 2. DIE REELLEN ZAHLEN keine Cauchy-Folge ist, d.h. n X 1 ≥ . k ∃∀N ∈ N∃n, m ≥ N : Wir wählen = 1 2, k=m+1 m = N und n = 2N . Dann gilt 2N X 1 1 1 >N· = = . k 2N 2 k=N +1 (iii) In Beispiel 1.10.6 hatten wir gezeigt: Für alle n ∈ N gilt 2n n X1 ≤ . 2 k k=1 Also ist die Folge der Partialsummen unbeschränkt und damit nicht konvergent (Lemma 2.2.1). 2 Beispiel 2.6.3 Man stapelt Dominosteine übereinander und bildet einen halben Torbogen. Alle Steine werden durch die Schwerkraft im Gleichgewicht gehalten. Welche Strecke kann dieser halbe Torbogen maximal überspannen, ohne dass Steine aus dem Gleichgewicht geraten? Tatsächlich kann der Torbogen eine beliebig große Strecke überspannen. Beweis. Wir benutzen hier eine Formel der Physik. Der Schwerpunkt eines Objektes K wird mit g(K) bezeichnet. Das Gewicht von K bezeichnen wir mit G(K). Der gemeinsame Schwerpunkt von n Objekten K1 , . . . , Kn ist n X 1 G(Ki )g(Ki ). i=1 G(Ki ) i=1 Pn Wir nehmen an, dass das Gewicht eines Dominosteines 1 ist und seine Länge ebenfalls 1. Der Schwerpunkt hat 3 Koordinaten, uns interessiert hier aber nur die Koordinate parallel zur Erdoberfläche und in Richtung des Torbogens. Bei der Konstruktion des Torbogens können wir den obersten Stein so positionieren, dass sich der Mittelpunkt des obersten Steins direkt über dem Endpunkt des darunterliegenden Steins befindet. Entsprechend soll sich der gemeinsame Schwerpunkt der n obersten Steine direkt über dem Endpunkt des darunteliegenden Steins befinden. Wir berechnen nun die Länge der überspannten Strecke vom gemeinsamen Schwerpunkt aller Steine bis zum Endpunkt des obersten Steines. Wir werden zeigen, dass diese Länge für n Steine gleich 1 1 1 1 1 + + + ··· + 2 2 3 n ist. Wir zeigen dies durch Induktion. Der Induktionsanfang: Der oberste Stein kann zur Hälfte über den darunterliegenden Stein herausragen, ohne das Gleichgewicht zu verlieren. Man gewinnt also 21 . Der gemeinsame Schwerpunkt der n obersten Steine liegt nach Induktionsannahme bei 1 1 1 1 1 + + + ··· + 2 2 3 n Das der n obersten Steine ist n. Der Schwerpunkt des n + 1-ten Steins liegt bei PnGewicht 1 1 . Der gemeinsame Schwerpunkt der n + 1 obersten Steine liegt bei k=1 k 2 !! n n n+1 1 nX1 1 1X1 1X1 + + = . n+1 2 k 2 2 k 2 k k=1 k=1 k=1 1 2 + 2.6. REIHEN IN R 97 Beispiel 2.6.4 Die Reihe ∞ X 1 n2 n=1 konvergiert. Der Grenzwert liegt zwischen 1 und 2. Das Beispiel wird ausführlicher behandelt (Satz 2.3.4). Beweis. Wir geben hier zwei Beweise an. Der erste Beweis benutzt das Verdichtungskriterium von Cauchy (Lemma 2.6.2). Die Reihe ∞ X 2−k = 2 k=0 konvergiert nach Beispiel 2.6.1. Nach Lemma 2.6.2 gilt ∞ ∞ ∞ X X X 1 k 1 ≤ = 2 2−k = 2. 2 2k n 2 n=1 k=0 Andererseits gilt 1≤ k=0 ∞ X 1 . n2 n=1 Nun der zweite Beweis. Nach Beispiel 1.10.5 gilt für alle n ∈ N (2.18) n X 1 1 ≤2− 2 k n k=1 Deshalb ist die Folge der Partialsummen monoton wachsend und nach oben durch 2 beschränkt. Nach Satz 2.3.1 konvergiert eine solche Folge. 2 Lemma 2.6.3 Es sei {xn }n∈N eine Folge reeller Zahlen. Falls die Reihe konvergiert, dann gilt lim xn = 0. n→∞ Beweis. Die Folge ( n X k=1 ) xk n∈N ist konvergent, also insbesondere eine Cauchy-Folge. Es gilt also n X ∀ > 0 ∃N ∈ N∀n, m > N : xk < . k=m+1 Insbesondere können wir n = m + 1 wählen. Damit erhalten wir ∀ > 0 ∃N ∈ N∀m > N : 2 |xm+1 | < . P∞ n=1 xn 98 CHAPTER 2. DIE REELLEN ZAHLEN Lemma 2.6.4 Es seien r ∈ R. Dann gelten (i) P∞ n=1 ∞ X xn und xn + n=1 ∞ X P∞ n=1 yn = n=1 yn Reihen, die in R konvergieren, und ∞ X (xn + yn ) n=1 (ii) r ∞ X xn = n=1 ∞ X rxn . n=1 Beweis. (i) ∞ X xn + n=1 ∞ X yn = lim N X N →∞ n=1 xn + lim N →∞ n=1 N X yn n=1 Mit Lemma 2.2.3 folgt ∞ X xn + ∞ X yn = lim N →∞ n=1 n=1 N X (xn + yn ) = ∞ X (xn + yn ). n=1 n=1 Lemma 2.6.5 (Leibniz) Es sei {xn }n∈N eine Folge positiver, reeller Zahlen, die monton fallend ist und gegen 0 konvergiert, d.h. lim xn = 0 xn ≥ xn+1 für n ∈ N. und n→∞ Dann konvergiert ∞ X (−1)n xn . n=1 Beweis. Wir zeigen, dass (2n−1 ) X (−1)k xk k=1 n∈N eine monoton wachsende, beschränkte Folge ist und ( 2n ) X (−1)k xk k=1 n∈N eine monoton fallende, beschränkte Folge ist. Wir prüfen nach, dass die erste Folge monoton wachsend ist. Da x2k ≥ x2k+1 gilt, folgt für alle n = 0, 1, . . . 2n−1 X k=1 k (−1) xk ≤ 2n−1 X k=1 k (−1) xk + (x2k − x2k+1 ) = 2n+1 X (−1)k xk . k=1 2.6. REIHEN IN R 99 Genauso überprüft man, dass die zweite Folge monoton fallend ist. Außerdem gilt für alle n, m = 1, 2, . . . 2n−1 2m X X k (−1) xk ≤ (−1)k xk . k=1 k=1 Dazu wählen wir N = max{n, m}. Es gilt 2N −1 X k (−1) xk ≤ k=1 2N X (−1)k xk . k=1 Da die eine Folge monoton wächst und die andere monoton fällt, gelten 2n−1 X k=1 k (−1) xk ≤ 2N −1 X k (−1) xk 2N X und k=1 k=1 k (−1) xk ≤ 2m X (−1)k xk . k=1 Also gilt für alle n, m ∈ N 2n−1 X k=1 k (−1) xk ≤ 2m X (−1)k xk . k=1 Hieraus folgt −x1 ≤ 2n−1 X 2m X k=1 k=1 (−1)k xk ≤ (−1)k xk ≤ −x1 + x2 . Also sind beide Folgen beschränkt. Damit sind beide Folgen konvergent. Es bleibt zu zeigen, dass sie gegen denselben Grenzwert konvergieren. Mit Lemma 2.6.4 folgt lim 2n X n→∞ k=1 k (−1) xk − lim n→∞ 2n−1 X (−1)k xk = lim x2n = 0. k=1 n→∞ Es sei s der Grenzwert der Folge der Partialsummen {s2` }`∈N bzw. {s2`−1 }`∈N mit 2` X s2` = (−1)k xk bzw. k=1 s2`−1 = 2`−1 X (−1)k xk . k=1 Wir haben also die Folge der Partialsummen in zwei Teilfolgen zerlegt, die Teilfolge mit den geraden Indices und die Teilfolge mit den ungeraden Indices. Wir haben festgestellt, dass beide gegen denselben Grenzwert konvergieren. Es scheint offensichtlich, dass damit die Folge der Partialsummen auch gegen diesen Grenzwert konvergiert. Wir weisen dies noch formal nach. Es gelten (2.19) ∀ > 0∃N1 ∈ N∀` ≥ N1 : |s − s2` | < und (2.20) ∀ > 0∃N2 ∈ N∀` ≥ N2 : |s − s2`−1 | < . 100 CHAPTER 2. DIE REELLEN ZAHLEN Wir wählen nun N = max{2N1 , 2N2 − 1} und erhalten ∀ > 0∃N ∈ N∀n ≥ N : |s − sn | < . In der Tat, falls n ≥ N und n gerade ist, dann gibt es ein ` ∈ N mit n = 2`. Weiter gilt 2` = n ≥ N ≥ 2N1 und damit ` ≥ N1 . Nach (2.19) gilt nun |s − sn | < . Falls n ungerade ist, dann folgt diese Ungleichung genauso mit (2.20). 2 Beispiel 2.6.5 Die Reihen ∞ X (−1)n n n=1 ∞ X (−1)n √ n n=1 und sind konvergent. Die erste Reihe heißt alternierende, harmonische Reihe. Man kann sogar ihren Grenzwert bestimmen, es gilt ∞ X (−1)n = ln 2. n n=1 Dies kann man aus der Taylorreihe des Logarithmus herleiten (Beispiel 5.16.1). Definition 2.6.2 Wir sagen, dass eine Reihe P∞ |x | konvergiert. n n=1 P∞ n=1 xn absolut konvergiert, falls Es gibt Reihen, die konvergieren und die nicht absolut konvergieren. Ein Beispiel dafür ist ∞ X (−1)n n=1 n Lemma 2.6.6 Falls eine reelle Reihe absolut konvergent ist, so ist sie auch konvergent. Beweis. Es sei P∞ k=1 xk eine absolut konvergente Reihe. Wir zeigen, dass die Folge ( n )∞ X xk k=1 n=1 eine Cauchy-Folge ist. Da die Reihe absolut konvergent ist, ist ( n )∞ X |xk | k=1 n=1 eine Cauchy-Folge. Also ∀ > 0∃N ∈ N∀n, m > N : n X k=m+1 |xk | < . 2.6. REIHEN IN R 101 Mit der Dreiecksungleichung folgt n X xk < . ∀ > 0∃N ∈ N∀n, m > N : k=m+1 2 Beispiel 2.6.6 Es gibt eine Reihe in Q, die nicht in Q konvergiert, aber absolut in Q konvergiert. Beweis. Wir betrachten die Folge x2n = 1 n! 1 2n + ∞ X und x2n+1 = 1 n! − 1 2n . Dann gilt xk = e k=0 Aber für n ≥ 4 gilt n! ≥ 2n und somit 1 − 1 = 1 − 1 n! 2n 2n n! Deshalb ∞ X k=8 |xk | = ∞ X 1 2n n=8 2 Lemma 2.6.7 (Majorantenkriterium) P Es seien {xn }n∈N und {yn }n∈N zwei Folgen nichtnegativer Zahlen. Es konvergiere ∞ n=1 xn und für alle n ∈ N gelte yn ≤ xn . Dann konvergiert auch ∞ X yn . n=1 Beweis. Wir zeigen, dass ( n X )∞ yk k=1 n=1 P∞ xn konvergiert, gilt n X ∀ > 0∃N ∈ N∀n, m > N : xk < . eine Cauchy-Folge ist. Da n=1 k=m+1 Wegen 0≤ n X k=m+1 yk ≤ n X xk k=m+1 folgt ∀ > 0∃N ∈ N∀n, m > N : 2 n X yk < . k=m+1 102 CHAPTER 2. DIE REELLEN ZAHLEN Lemma 2.6.8 (Quotientenkriterium) Es sei θ ∈ R mit 0 < θ < 1 und es sei {xn }n∈N eine Folge reeller Zahlen, so dass für alle n ∈ N die Ungleichungen xn 6= 0 und xn+1 xn ≤ θ gelten. Dann konvergiert ∞ X xn . n=1 Man beachte, dass die Zahl θ nicht von n abhängt. Siehe dazu das Beispiel 2.6.7. P Beweis. Wegen Lemma 2.6.6 reicht es zu zeigen, dass ∞ n=1 |xn | konvergiert. Wir zeigen durch Induktion, dass für alle n ∈ N |xn | ≤ |x1 |θn−1 gilt. Es gilt |x2 | ≤ |x1 |θ. Wir führen nun den Induktionsschritt durch. Falls |xn | ≤ |x1 |θn−1 , so folgt |xn+1 | ≤ |xn |θ ≤ |x1 |θn Damit istP{|x1 |θn−1 }n∈N eine Majorante von {|xn |}n∈N . Wegen Beispiel P 2.6.1 kon∞ n−1 |x |θ und damit nach dem Majorantenkriterium auch vergiert ∞ 1 n=1 |xn |. n=1 2 Beispiel 2.6.7 Man beachte, dass man das Quotientenkriterium nicht auf die Reihe wenden kann. Zwar gilt für alle n ∈ N 1 n+1 1 n = P∞ 1 n=1 n n < 1, n+1 aber es gibt kein θ < 1, so dass für alle n ∈ N n ≤θ n+1 gilt. Ebenso kann man das Quotientenkriterium nicht auf die Reihe P∞ 1 n=1 n2 anwenden. Beispiel 2.6.8 Die beiden Folgen (i) X 1 n! (ii) n∈N X n! nn n∈N konvergieren. Beweis. (i) Wir verwenden das Quotientenkriterium. 1/(n + 1)! 1 = 1/n! n+1 an- 2.6. REIHEN IN R 103 (ii) Wir verwenden das Quotientenkriterium. n n (n + 1)!/(n + 1)n+1 =( ) n!/nn n+1 Weiter gilt lim ( n→∞ 1 n n ) = n+1 e 2 Joseph Ludwig Raabe (15.5.1801-22.1.1859) war schweizer Mathematiker. Lemma 2.6.9 (Raabe-Kriterium) (i) Es sei {xn }n∈N eine Folge strikt positiver, reeller Zahlen. Es gebe ein c > 1 und ein n0 ∈ N, so dass für alle n ≥ n0 c xn+1 ≤1− (2.21) xn n gilt. Dann konvergiert die Reihe ∞ X xn . n=1 (ii) Es sei {xn }n∈N eine Folge strikt positiver, reeller Zahlen. Falls es ein n0 gibt, so dass für alle n ≥ n0 xn+1 1 ≥1− xn n (2.22) gilt, dann divergiert die Reihe. Beweis. (i) Aus (2.21) folgt sofort, dass für all n ≥ n0 (c − 1)xn ≤ (n − 1)xn − nxn+1 (2.23) gilt. Da c > 1 gilt, so folgt 0 < (n − 1)xn − nxn+1 und damit {nxn+1 }∞ n=n0 (n − 1)xn < nxn+1 . Also ist die Folge monoton fallend. Außerdem ist sie nach unten durch 0 beschränkt. Deshalb konvergiert die Folge {nxn+1 }∞ n=n0 . Wir bezeichnen den Grenzwert mit α. Wir zeigen nun, dass die Reihe ∞ X (2.24) n=n0 ((n − 1)xn − nxn+1 ) kovergiert. Wir betrachten die Partialsummen sN = N X n=n0 ((n − 1)xn − nxn+1 ) = (n0 − 1)xn0 − N xN +1 104 CHAPTER 2. DIE REELLEN ZAHLEN Die letzte Gleichung gilt, weil die Partialsummen Teleskopsummen sind. Es folgt ∞ X n=n0 ((n − 1)xn − nxn+1 ) = lim sN = (n0 − 1)xn0 − α. N →∞ Wegen (2.23) ist die Reihe (2.24) eine Majorante für die Reihe (ii) Aus (2.22) folgt sofort für alle n ≥ n0 P∞ n=n0 (c − 1)xn . (n − 1)xn ≤ nxn+1 . Deshalb ist die Folge {nxn+1 }∞ n=n0 monoton wachsend und für alle n mit n ≥ n0 gilt n0 xn0 +1 ≤ nxn+1 und somit Die Reihe P∞ 1 n=1 n n0 xn0 +1 ≤ xn+1 . n P konvergiert nicht, also konvergiert die Reihe ∞ n=1 xn nicht. 2 Beispiel P∞ 1 2.6.9 Man kann mit dem Raabe-Kriterium nachweisen, dass n=1 n2 konvergiert. Beweis. Statt der Reihe P∞ 1 n=1 n betrachten wir die Reihe 1 n 1 n−1 und 1 (n+1)2 1 n2 = 1 n=2 n−1 . divergiert und Es gelten 3 3 3 2n + 1 n2 2n + 2 2 = 1 − ≤ 1 − = 1 − . (n + 1)2 (n + 1)2 (n + 1)2 n+1 3 2 n+1 Also gilt für alle n ≥ 5 1 (n+1)2 1 n2 2 ≥ 5 4 . n ≤1− 5 4 n . Reihen Produkt Satz von Cauchy Lemma 2.7.1 (Cauchy-Produkt) Es seien vergente Reihen. Dann konvergiert auch ∞ n−1 X X (2.25) n=2 k=1 ∞ X ! P∞ n=1 xn und P∞ n=1 ! xk yn−k und es gilt (2.26) 1 n=1 n n−1 1 =1− n n = Für n ≥ 5 gilt 2.7 P∞ P∞ ∞ X n=1 ! xn n=1 yn = ∞ n−1 X X n=2 k=1 ! xk yn−k . yn zwei absolut kon- 2.7. REIHEN PRODUKT SATZ VON CAUCHY 105 Dieser Satz gilt auch schon für den Fall, dass eine der Reihen absolut konvergiert und die andere konvergiert, also nicht notwendig absolut konvergiert. Diese Verallgemeinerung geht auf Mertens zurück. Den Ausdruck (2.25) bezeichnet man als Cauchy-Produkt. Man beachte, dass sowohl auf der linken als auch auf der rechten Seite der Gleichung (2.26) sämtliche Produkte xi yj , i, j ∈ N aufsummiert werden. Sie sind auf den verschiedenen Seiten in verschiedener Reihenfolge aufsummiert. P P∞ Wenn man Reihen ∞ n=0 xn und n=0 yn betrachtet, dann nimmt die Gleichung (2.26) die Form ∞ X (2.27) ! xn n=0 ∞ X ! yn = n=0 ∞ n X X n=o ! xk yn−k k=0 an. Mit Lemma 2.7.1 kann man die Gleichung ex+y = ex ey beweisen. Beweis. Wir zeigen, dass ( n X ! xk k=1 n X ! yk k=1 − n k−1 X X k=2 !) x` yk−` `=1 n∈N eine Nullfolge ist. Es gilt n ! ! ! n k−1 n X X X X x` yk−` xi yk − i=1 k=2 `=1 k=1 ! n k−1 n n X X X X xi yj x` yk−` = = xi y j − i,j=1 k=2 `=1 (i,j)∈I wobei I = {(i, j)|0 ≤ i, j ≤ n und n < i + j}. Pn Die letzte Gleichung ergibt sich wie folgt. In der Summe i,j=1 xi yj treten alle Produkte xi yj mit 1 ≤ i, j ≤ n auf. Von diesen müssen alle jene eliminiert werden, die in der zweiten Summe auftreten. Dies sind alle Produkte xi yj mit i + j = k und 1 ≤ k ≤ n. Es gilt o n o n n n ≤ j ≤ n ∪ (i, j) 1 ≤ j ≤ n und ≤i≤n . I ⊆ (i, j) 1 ≤ i ≤ n und 2 2 106 CHAPTER 2. DIE REELLEN ZAHLEN Dies ist richtig, weil aus i + j ≥ n folgt, dass i ≥ n2 oder j ≥ weiter n ! ! ! n n k−1 X X X X xk yk − x` yk−` k=1 k=1 k=2 `=1 X X X |xk yj | + |xk yj | ≤ |xk yj | ≤ = n X k=1 ! |xk | X n ≤j≤n 2 gilt. Hiermit folgt 1≤j≤n n ≤k≤n 2 1≤k≤n n ≤j≤n 2 (k,j)∈I n 2 |yj | + n X j=1 ! |yj | X n ≤k≤n 2 |xk | Da die beiden Reihen absolut konvergieren, folgt ! ! ! n n n k−1 X X X X xk yk − x` yk−` k=1 k=1 k=2 `=1 ! ! ∞ ∞ X X X X |yj | + |xk | |yj | ≤ |xk | n ≤j≤n 2 k=1 n ≤k≤n 2 j=1 Außerdem gibt es zu jedem ein N , so dass für alle n, m ≥ N n X k=m+1 |xk | < n X und k=m+1 |xk | < gelten. Also gibt es ein N , so dass für alle n ≥ N n ! ! ! n k−1 n X X X X x` yk−` yk − xk k=2 `=1 k=1 k=1 ! ! ∞ ∞ X X ≤ |xk | + |yj | j=1 k=1 gilt. Also lim n→∞ n X ! xk k=1 n X ! yk k=1 − n k−1 X X k=2 !! x` yk−` `=1 Hiermit folgt nun (2.26). 2 Beispiel 2.7.1 Es sei Dann konvergiert divergiert. P∞ n=1 (−1)n xn = √ n n∈N xn , aber das Cauchy-Produkt ∞ X n−1 X n=2 k=1 ! xk xn−k = 0. 2.7. REIHEN PRODUKT SATZ VON CAUCHY 107 Beweis. Es gilt n−1 X xk xn−k = k=1 n−1 X k=1 (−1)n √ √ . k n−k Für alle k mit 1 ≤ k ≤ n − 1 gilt √ √ √ √ √ √ k n − k ≤ n − 1 n − k ≤ n − 1 n − 1 = n − 1. Daher folgt n−1 n−1 n−1 X X X 1 1 √ = ≥ x x = 1. √ k n−k n−1 k n−k k=1 k=1 k=1 Nach Lemma 2.6.3 konvergieren die Summanden einer konvergenten Reihe gegen 0. Dies liegt hier nicht vor. 2 Beispiel 2.7.2 Es gelten ∞ X 1 = nxn−1 (1 − x)2 n=1 ∞ X 1 (n + 1)(n + 2) n = x . (1 − x)3 2 n=0 und Weiter gilt ∞ X n2 = 6. 2n n=1 Wir wollen hier das Cauchy-Produkt verwenden, um die Reihen zu berechnen. Man kann dies natürlich auch machen, indem man die Reihen differenziert. Beweis. Es gilt nach Vorlesung ∞ X 1 = xn 1 − x n=0 Es folgt 1 = (1 − x)2 ∞ X !2 x n n=0 Wir setzen ak = xk und bn−k = xn−k . Mit dem Cauchy-Produkt folgt n X k=0 ak bn−k = n X xk xn−k = (n + 1)xn k=0 Weiter folgt ∞ n X X 1 = ak bn−k (1 − x)2 n=0 ! k=0 Für x = 1 2 (n + 1)xn n=0 ergibt sich 4= ∞ ∞ ∞ X X X n+1 n+1 n = 4 = 4 n n+2 n+1 2 2 2 n=0 n=0 n=1 Also (2.28) = ∞ X 1= ∞ X n . n+1 2 n=1 108 CHAPTER 2. DIE REELLEN ZAHLEN ∞ X ! (k + 1)x k k=0 ∞ X ∞ X n X ! x k = n=0 k=0 ∞ n X X n k=0 = x n=0 Für x = 1 2 ((k + 1)xk xn−k ) (k + 1) = k=0 ∞ X (n + 1)(n + 2) n x 2 n=0 folgt 8 = ∞ ∞ X 1 (n + 1)(n + 2) X n2 + 3n + 2 = = 2n+1 2n+1 (1 − 12 )3 n=0 n=0 = ∞ ∞ ∞ X X X n2 3n 2 + + n+1 n+1 n+1 2 2 2 n=0 n=0 n=0 = ∞ X n2 +3+2 n+1 2 n=0 Es folgt ∞ X n2 = 3. 2n+1 n=0 Es folgt weiter ∞ X n2 = 6. 2n n=0 2 Wir haben bereits in Beispiel 1.5.1 gezeigt, dass es unendlich viele Primzahlen gibt. Das P folgende Beispiel liefert einen weiteren Beweis hierfür. Wir nutzen dabei 1 aus, dass ∞ n=1 n divergiert. Beispiel 2.7.3 Es gibt unendlich viele Primzahlen Beweis. Es gibt P∞verschiedene Beweise, wir stellen hier einen Beweis von [98] dar, der benutzt, dass die Reihe n=1 n1 nicht konvergiert. Wir nehmen an, dass es nur endlich viele Primzahlen p1 , . . . , pk gibt. Dann gibt es zu jedem n ∈ N natürliche Zahlen `1 , . . . , `k mit n = p`11 · · · p`kk Somit folgt ∞ ∞ X X 1 = n m=1 n=1 Da 2 ≤ pi Damit würde ∞ ∞ X X 1 ≤ n m=1 n=1 P∞ 1 n=1 n X 1 p`1 · · · p`kk `1 +···+`k =m 1 X `1 +···+`k =m ∞ X 1 mk = <∞ 2m 2m m=1 konvergieren, was nicht richtig ist. 2 Beispiel 2.7.4 [67] X p Primzahl 1 =∞ p Aus diesem Ergebnis folgt auch, dass es unendlich viele Primzahlen gibt. Wir werden dieses Beispiel später behandeln, wenn wir die notwendigen Hilfsmittel wie Logarithmus und Integral bereit gestellt haben (Beispiel 3.6.4). 2.8. UMORDNUNGSATZ VON RIEMANN 2.8 109 Umordnungsatz von Riemann In diesem Abschnitt geht es darum, den Umordnungssatz von Riemann zu beweisen. Der Umordnungssatz von Riemann ist spektakulär: Zu jeder reellen Zahl und jeder bedingt konvergenten Reihe findet man eine neue Anordnung der Summanden, so dass die Reihe gegen die vorgegebene Zahl konvergiert. Eine Permutation von N ist eine bijektive Abbildung von N auf sich. P Satz 2.8.1 (Riemann) Es sei n∈N xn eine konvergente Reihe, die nicht absolut konvergiert. Dann existiert für jedes x ∈ R eine Permutation π, so dass X x= xπ(n) . n∈N Definition 2.8.1 Wir sagen, dass eine Reihe für jede Permutation π von N die Reihe ∞ X P∞ n=1 xn unbedingt konvergiert, falls xπ(n) n=1 konvergiert. P Lemma 2.8.1 Es sei n∈N xn eine konvergente, aber nicht absolut konvergente Reihe. {pk }k∈N sei die Folge natürlicher Zahlen, so dass xpk die k-te nichtnegative Zahl der Folge {xn }n∈N ist. Entsprechend seien {nk }k∈N die Indices der negativen Folgenglieder: xnk ist die k-te negative Zahl. Dann divergieren die Reihen X X xnk und xp k . k∈N k∈N Beweis. Wir zeigen, dass die Reihe absolut konvergiert, falls eine der beiden Reihen P P x und x konvergiert. Dazu überlegt man sich zunächst, dass beide k k k∈N nP k∈N pP ReihenP k∈N xnk und k∈N xpk konvergieren, wenn nur eine konvergiert, weil die Reihe n∈N xn konvergiert. P P Wir können also annehmen, dass beide Reihen k∈N xnk und k∈N xpk konvergieren. Nun betrachten wir die Reihen X X x0n und x00n , n∈N die durch x0n = xn xn ≥ 0 0 xn < 0 n∈N x00n = xn xn < 0 0 x≥0 110 CHAPTER 2. DIE REELLEN ZAHLEN gegeben sind. Falls diese beiden Reihen konvergieren, dann konvergiert auch X X X X xn = x0n − x00n = |xn |. n∈N n∈N n∈N n∈N P P Wir zeigen nun, dass n∈N x0n und n∈N x00n konvergieren, falls x und n k k∈N k∈N xpk P 0 konvergieren. Die Folge der Partialsummen m x , m ∈ N, ist monoton wachsend n=1 n und es gilt für alle m ∈ N m X X x0n ≤ xp k . P P n=1 k∈N Damit ist diePFolge der Partialsummen auch beschränkt und somit konvergent. Also P 0 00 konvergiert n∈N xn . Für n∈N xn wird der Beweis genauso geführt. 2 Lemma 2.8.2 Eine Reihe ist genau dann unbedingt konvergent, wenn sie absolut konvergent ist. P Falls eine Reihe ∞ n=1 xn unbedingt konvergiert, dann gilt für alle Permutationen π ∞ ∞ X X xπ(n) . xn = n=1 n=1 Beweis. Wir nehmen an, dass die Reihe absolut konvergiert, also ∀ > 0∃N ∀n, m > N : n X k=m |xk | < . Wir wählen nun N 0 so groß, dass {k|1 ≤ k ≤ N } ⊆ {π(k)|1 ≤ k ≤ N 0 }. Dann folgt ∀ > 0∃N 0 ∈ N∀n, m > N 0 : n n X X xπ(k) ≤ |xπ(k) | < . k=m k=m Also konvergiert die Reihe unbedingt. Wir zeigen nun, dass die Reihe nicht unbedingt konvergiert, wenn sie nicht absolut konvergiert. Falls die Reihe nicht dann divergieren nach P absolut konvergiert, P Lemma 2.8.1 die beiden Teilreihen k∈N xnk und k∈N xpk . Wir wählen mj ∈ N mit 1 = m1 < m2 < · · · und mj+1 −1 X i=mj xpi ≥ 1. Für j = 1, 2, 3, . . . wählen wir π(mj +j −1) = nj und für i = mj +j, . . . , mj+1 +j −1 (2.29) π(i) = pi−j . 2.8. UMORDNUNGSATZ VON RIEMANN 111 Wir überzeugen uns davon, dass π eine Permutation ist. Wir zeigen, dass π surjektiv ist. Dazu beachten wir, dass N = {nk |k ∈ N}∪{pk |k ∈ N}. Wegen π(mj +j−1) = nj für j ∈ N werden alle Elemente in {nk |k ∈ N} getroffen. Wegen (2.29) werden für festes j die Indices pmj , . . . , pmj+1 −1 getroffen. Dann gilt mj+1 +j−1 mj+1 +j−1 mj+1 −1 X X X = xpi ≥ 1. x = x p π(i) i−j i=mj +j i=mj i=mj +j P Somit konvergiert die Reihe n∈N xπ(n) nicht. Wir zeigen nun, dass für alle Permutationen π ∞ ∞ X X xn = xπ(n) n=1 n=1 P∞ gilt. Wir überlegen uns, dass für alle π die Reihe n=1 xπ(n) absolut konvergiert, P∞ P∞ wenn n=1 xn absolut konvergiert. n=1 Pxπ(n) konvergiert genau dann absolut, wenn für alle Permutationen σ die Reihe ∞ n=1 xσ◦π(n) konvergiert. Dies gilt aber, weil σ ◦ π eine Permutation ist. Wir zeigen, dass ∞ X (xn − xπ(n) ) = 0 n=1 gilt. Für alle > 0 existiert ein N , so dass für alle k ≥ N ∞ X |xn | < n=k 0 gilt. Nun wählen wir N so groß, dass {1, . . . , N } ⊆ {π(1), . . . , π(N 0 )}. N0 N 0 X X X xn − xπ(n) (xn − xπ(n) ) = 0 n=1 ≤ N0 X n=N +1 n=N +1 |xn | + X {n|1≤n≤N 0 ,π(n)>N } {n|1≤n≤N ,π(n)>N } |xπ(n) | ≤ ∞ X n=N +1 |xn | + ∞ X n=N +1 |xn | ≤ 2. 2 Beweis von Satz 2.8.1. Wir betrachten zuerst den Fall, dass x ≥ 0. Wir benutzen Lemma 2.8.1. Wir wählen m1 , so dass m 1 −1 X k=1 xp k ≤ x < m1 X xp k . k=1 Entsprechend sind die ersten m1 Indices unserer Folge p1 , . . . , pm1 . Nun wählen wir `1 , so dass m1 `1 m1 `1 X X X X xp k + xn k < x ≤ xpk + xnk −1 . k=1 k=1 k=1 k=1 Die nächsten Indices `1 unserer Folge sind n1 , . . . , n`1 2 112 2.9 CHAPTER 2. DIE REELLEN ZAHLEN Das Problem von Basel ”Ich wollte in meinem Garten einen Springbrunnen anlegen”, schrieb Friedrich der Große am 25. Januar 1778 an Voltaire. Das Projekt endete jedoch in einem Fiasko. Der Preußenkönig blickte von seinem Schloss Sanssouci auf Brunnenanlagen, aus denen keine Fontänen in die Höhe schossen. Dabei sollte die Wasserkunst nach den neuesten Erkenntnissen der Hydraulik ausgeführt werden und selbst Versailles an Pracht übertreffen. ”Euler berechnete die Leistung des Räderwerks, damit das Wasser in ein Bassin hinaufgelänge, über Kanäle wieder abfließe, um in Sans-Souci aufzusteigen. Meine Mühle wurde nach allen Regeln der Mathematik gebaut, und sie konnte keinen einzigen Wassertropfen weiter als fünfzig Schritt unter das Bassin hinaufpumpen. Eitelkeit der Eitelkeiten! Eitelkeit der Mathematik!” Nach allem was man über diesen Vorfall weiß, ist es nicht Eulers Schuld gewesen [32]. Das Verhältnis von Friedrich dem Großen und Euler war kein gutes. Friedrich der Große nannte Euler, der zur Zeit am Berliner Hof nur noch ein Auge besaß, charmanterweise meinen Zyklopen. Pietro Mengoli (1625-1686) stellte das Problem im Jahr 1644, den Grenzwert der Reihe ∞ X 1 n2 n=1 zu finden. Das Problem wurde bekannt, als Jakob Bernoulli im Jahr 1689 darüber berichtete. Es stellte sich heraus, dass es ein sehr schwieriges Problem ist. Bis in die 1730er Jahre hatten die besten Mathematiker der Zeit versucht, es zu lösen. Euler hat zunächst den Grenzwert der Reihe auf 6 Stellen hinter dem Komma genau berechnet. Später war erin der Lage, die Zahl auf 17 Stellen genau zu berechnen. Da Euler sehr gut rechnen konnte, vermutet man, dass er erkannt hat, dass die 2 Zahl π6 sein sollte. Im Jahr 1735 fand er einen Beweis dafür. Satz 2.9.1 [37] ∞ X 1 π2 = n2 6 n=1 Beweise hierfür findet man in [20], [22], [56], [50], [60], [92] [111], [116] und [38], p.87. Man kann dieses Ergebnis mit Hilfe des Residuenkalküls beweisen. Jakob Bernoulli (1654- 1705) leitete im Jahr 1689 die Aufmerksamkeit auf dieses Problem. Leibniz behauptete bei einem Besuch in London, dass er den Grenzwert jeder Reihe berechnen könne. Daraufhin zeigte man ihm diese Reihe und er konnte den Grenzwert nicht berechnen. Euler löste das Problem im Jahr 1735 [Dun]. Eulers Methode funktioniert für geradzahlige Exponenten. So lässt sich zeigen, dass ∞ ∞ X X 1 π4 1 π6 = und = . 4 6 n 90 n 945 n=1 n=1 Der Grenzwert der Reihe ∞ X 1 n3 n=1 ist nicht bekannt. 1978 zeigte Roger Apéry, dass der Grenzwert eine irrationale Zahl ist [30]. 2.10. P-ADISCHE ENTWICKLUNGEN REELLER ZAHLEN 2.10 113 p-adische Entwicklungen reeller Zahlen Unter der Dezimalbruchdarstellung einer reellen Zahl versteht man eine Folge von natürlichen Zahlen zwischen 0 und 9, z.B. 154, 14879... Diese Folge kann abbrechen. Wir wollen hier eine Definition für diese Dezimalbruchdarstellung geben. Die Dezimalbruchdarstellung entspricht der unendlichen Reihe 4 8 1 + + + ··· 1 · 100 + 5 · 10 + 4 + 10 100 1000 Allgemein entspricht der Zahl nk nk+1 . . . n0 , n1 n2 n3 . . . mit ni ∈ {0, 1, . . . , 9} für alle i = k, k + 1, . . . die Reihe ∞ X ni 10i i=k wobei k ∈ Z gilt. k kann also durchaus negative Werte annehmen, wie dies bei dem Beispiel der Fall ist. Zunächst ist nicht klar, dass jede reelle Zahl eine Dezimalbruchdarstellung besitzt. Das wird in diesem Abschnitt bewiesen. Wir beschränken uns allerdings nicht nur auf Dezimalbruchdarstellungen, sondern wir behandeln hier allgemeine p-adische Darstellungen. Satz 2.10.1 Es sei p ∈ N mit p ≥ 2 und k ∈ Z. {xn }∞ n=k sei eine Folge von natürlichen Zahlen zwischen 0 und p − 1. Dann konvergiert ∞ X xn n=k pn in R. Umgekehrt gibt es für jede reelle, positive Zahl x eine solche Folge {xn }∞ n=k , so dass ∞ X xn x= pn n=k p bezeichnen wir als Basis oder Grundzahl der Entwicklung. P∞ ` Beweis. Nach Beispiel 2.6.1 (geometrische Reihe) wissen wir, dass die Reihe `=0 p P∞ ` konvergiert. Deshalb konvergiert für alle k ∈ Z die Reihe `=k p . Also gilt n X −`+1 ∀ > 0∃N ∈ N ∀n, m ≥ N : p < . `=m+1 114 CHAPTER 2. DIE REELLEN ZAHLEN Somit folgt wegen x` < p für alle n, m ≥ N n n m n n X X X x` X x` X x` x` 1 − < < . = = ` ` ` ` `−1 p p p p p `=m+1 `=k `=k `=m+1 `=m+1 Damit ist ) ( n X x` `=k p` n∈N eine Cauchy-Folge und konvergent. Wir zeigen nun, dass jede positive, reelle Zahl eine solche Darstellung besitzt. Mit [x] bezeichnen wir die größte ganze Zahl, die kleiner oder gleich x ist. Falls x = 0, dann können wir als Darstellung die Nullfolge wählen. Wir nehmen nun an, dass 0 < x gilt. Wir bestimmen k ∈ Z, so dass 1 1 ≤ x < k−1 k p p (2.30) gilt und setzen xk = [x · pk ] (2.31) Restk (x) = x − xk . pk Eine solche Zahl k existiert: Da die Folge p1j , j ∈ N, gegen 0 konvergiert, gibt es ein j mit p1j ≤ x. Nun nehmen wir als k das Minimum von allen Zahlen j ∈ Z mit 1 ≤ x. pj Weiter setzen wir für n = k, k + 1, . . . xn+1 = [Restn (x) · pn+1 ] Restn+1 (x) = Restn (x) − Wir zeigen nun, dass x= ∞ X x` `=k p` xn+1 . pn+1 . Wir stellen fest, dass für alle n = k, k + 1, k + 2, . . . (2.32) (2.33) 0 ≤ Restn (x) < 1 pn xn ∈ {0, 1, . . . , p − 1} gelten. Tatsächlich folgt (2.33) aus (2.30) und (2.32): Aus (2.30) folgt 0 ≤ x · pk < p und damit 0 ≤ [x · pk ] < p. 2.10. P-ADISCHE ENTWICKLUNGEN REELLER ZAHLEN 115 Da aber xk = [x · pk ], folgt (2.33) für n = k. Nun die anderen Fälle. Aus (2.32) folgt 0 ≤ Restn (x) · pn+1 < p und damit 0 ≤ [Restn (x) · pn+1 ] < p. Wir weisen nun (2.32) nach. Wir zeigen dies für n = k. Es gilt Restk (x) = x − [x · pk ] 1 xk = x − = k x · pk − [x · pk ] . k k p p p Da 0 ≤ x · pk − [x · pk ] < 1, folgt 0 ≤ Restk (x) < 1 . pk Nun für n > k. Es gilt xn+1 [Restn (x) · pn+1 ] = Rest (x) − n pn+1 pn+1 Restn (x) · pn+1 − [Restn (x) · pn+1 ] . Restn+1 (x) = Restn (x) − = 1 pn+1 Da 0 ≤ Restn (x) · pn+1 − [Restn (x) · pn+1 ] < 1, folgt 0 ≤ Restn+1 (x) < 1 pn+1 . Wir zeigen nun mit Induktion, dass für alle n ∈ Z mit n ≥ k x= n X x` `=k p` + Restn (x) gilt. Wegen (2.31) xk + Restk (x). pk Wir führen nun den Induktionsschritt durch. x= x= n X x` `=k p` + Restn (x) = n X x` `=k p` + xn+1 + Restn+1 (x) pn+1 Hieraus folgt nun mit (2.32) n X x` 1 x − = |Restn (x)| < n . ` p p `=k Deshalb gilt n X x` lim x − =0 n→∞ p` `=k 116 CHAPTER 2. DIE REELLEN ZAHLEN und schließlich x= ∞ X x` `=k 2 p` . Für p = 10 ist die unendliche Summe gerade die Dezimalbruchdarstellung von x. Für p = 2 erhält man die dyadische Darstellung. Man beachte, dass diese Darstellungen nicht eindeutig sind. ∞ X p−1 pn n=0 = (p − 1) ∞ X 1 1 = (p − 1) n p 1− n=0 1 p =p Wir erhalten z.B. für p = 10, dass 9, 999 · · · = 10, und für p = 2, dass 1, 111 · · · = 10. 2 in der dyadischen Darstellung geschrieben ist 10. Allgemeiner lässt sich sagen, dass sich eine reelle Zahl durch genau eine p-adischen Entwicklung darstellen lässt, bei der nicht fast alle Ziffern gleich p − 1 sind. ”Fast alle” bedeutet ”bis auf endlich viele”. Bemerkung 2.10.1 (i) Jede reelle Zahl lässt sich durch genau einen p-adischen Bruch darstellen, bei dem nicht fast alle Ziffern gleich p − 1 sind. (ii) Eine reelle Zahl ist genau dann rational, wenn ihre p-adische Entwicklung periodisch ist, d.h. es gibt ein m ∈ N und ein `0 ∈ N, so dass für alle ` ≥ `0 xm+` = x` gilt. Beispiel hierfür sind die folgenden Dezimalbruchdarstellungen: 31 = .3, 61 = .16, = .142857. Der Strich über den Ziffern legt die Periode fest. Wenn eine reelle Zahl in der Dezimalbruchdarstellung gegeben ist und die Dezimalbruchdarstellung ist periodisch, dann kann man auf die folgende Weise die rationale Zahl finden, die dargestellt wird. Wir benutzen dazu, dass 1 7 0.1 = 1 9 0.01 = 1 99 Für 0.5 und 0.736 erhalten wir dann 5 0.5 = 5 × 0.1 = 9 0.001 = 1 999 u.s.w. 0.736 = 736 × 0.001 = 736 . 999 Beweis. (i) Wir überlegen uns zuerst, dass es eine solche Darstellung gibt. Wir können eine Darstellung, bei der fast alle Koeffizienten gleich p − 1, in eine Darstellung verwandeln, bei der fast alle Koeffizienten 0 sind. Wir nehmen dazu an, es gäbe eine reelle Zahl x, die sich durch zwei verschiedene p-adische Brüche darstellen lässt, deren Koeffizienten nicht bis auf endlich viele gleich p − 1 sind. Es seien also x= ∞ X v` `=k p` und x= ∞ X w` `=k p` . 2.10. P-ADISCHE ENTWICKLUNGEN REELLER ZAHLEN 117 Es sei `0 die kleinste Zahl, so dass v`0 6= w`0 . Wir können annehmen, dass v`0 > w`0 . Dann gilt `X ∞ ∞ 0 −1 X X w` w`0 w` w` = + `0 + x= ` ` p p p p` `=k `=` +1 `=k 0 Nach Voraussetzung gibt es ein ` > `0 mit w` < p − 1. Deshalb folgt x `X 0 −1 < `=k `X 0 −1 = `=k `0 −1 ∞ X w` w`0 p−1 X 1 w` w`0 + + + = + p` p`0 `=` +1 p` p` p`0 p`0 `=k 0 ∞ w` w`0 + 1 X v` ≤ + = x. p` p`0 p` `=k Dies ist ein Widerspruch. (ii) Wir überprüfen nun,S dass x rational ist, falls die p-adische Entwicklung von x periodisch ist. Weil N0 = ∞ j=0 {jm, jm + 1, . . . , (j + 1)m − 1}, gilt x= ∞ X x` `=k p` = `X 0 −1 `=k `X ∞ ∞ (j+1)m−1 0 −1 x` X x` x` X X x`0 +` + = + . p` `=` p` p` j=0 `=jm p`0 +` `=k 0 Hieraus folgt x= `X 0 −1 `=k `X ∞ m−1 m−1 ∞ 0 −1 x` X X x`0 +jm+` x` X X x`0 +jm+` + = + . ` `0 +jm+` p` j=0 `=0 p`0 +jm+` p p `=k `=0 j=0 Weil die p-adische Entwicklung periodisch mit der Periode m für ` ≥ `0 ist, erhalten wir x = `X 0 −1 `=k = `X 0 −1 `=k m−1 ∞ x` X X x`0 +` + p` p`0 +jm+` `=0 j=0 `X m−1 m ∞ 0 −1 x` X x`0 +` X 1 x` X x`0 +` pm + = + . p` p`0 +` j=0 pjm p` p`0 +` pm − 1 `=0 `=k `=1 Der letzte Ausdruck ist eine endliche Summe rationaler Zahlen, also wiederum eine rationale Zahl. Umgekehrt, falls x rational ist, dann ist die p-adische Entwicklung periodisch: Dies gilt, weil als Rest bei der Division nur endlich viele verschiedene Zahlen auftreten können. 2 Beispiel 2.10.1 Die folgende Zahl ist in Dezimalbruchdarstellung. 0, n1 n2 n3 . . . wobei ni = 1 gilt, wenn i eine Quadratzahl ist, für alle anderen i gilt ni = 0. Diese Zahl ist irrational. 118 CHAPTER 2. DIE REELLEN ZAHLEN Beweis. Diese Zahl ist nicht rational, weil ihre Dezimalbruchentwicklung nicht periodisch ist. Wir weisen nach, dass sie nicht periodisch ist. Dazu nehmen wir an, dass sie periodisch ist. Also gibt es ein m ∈ N und ein `0 , so dass für alle ` ≥ `0 n` = n`+m gilt. Zu `0 gibt es eine Quadratzahl j mit j ≥ `0 und m2 < j. Es folgt nj = nj+m = 1 und damit, dass j + m eine Quadratzahl ist. Es gibt also ein k ∈ N mit k 2 = j und (k + 1)2 ≤ j + m. Es folgt k 2 + 2k + 1 ≤ j + m. Wegen k 2 = j 2 2k + 1 ≤ m und wegen m < j Wegen k 2 = j 4k 2 + 4k + 1 ≤ m2 < j. 3j + 4k + 1 < 0. Das kann nicht sein. Also ist j + m keine Quadratzahl. 2 Satz 2.10.2 Es gilt card(R) = card(P(N)). Insbesondere gilt card(Q) < card(R). Lemma 2.10.1 Die reellen Zahlen R und das Intervall (0, 1) = {x ∈ R|0 < x < 1} haben dieselbe Mächtigkeit. Beweis. Wir zeigen zuerst, dass das Intervall (−1, 1) = {x ∈ R||x| < 1} und R dieselbe Mächtigkeit haben. Die Abbildung f : (−1, 1) → R mit x 1+x x ∈ (−1, 0] f (x) = x x ∈ (0, 1) 1−x ist bijektiv. Wir überlegen uns, dass die Abbildung f surjektiv ist. Wir zeigen, dass es für x alle y > 0 ein x ∈ (0, 1) mit y = 1−x gibt. In der Tat, diese Gleichung ist äquivalent y zu x = 1+y . Ebenso verfahren wir für y < 0. Nun zeigen wir, dass die Abildung f injektiv ist. Der erste Fall ist 0 ≤ x, y < 1 y x und f (x) = f (y). Dann gilt 1−x = 1−y , woraus x = y folgt. Der Fall 1− < x, y < 0 wird genauso behandelt. Falls −1 < x < 0 < y < 1, dann folgt x y <0< . 1+x 1−y Nun zeigen wir, dass (−1, 1) und (0, 1) dieselbe Mächtigkeit haben. Die Abbildung g : (−1, 1) → (0, 1) mit x+1 g(x) = 2 2.10. P-ADISCHE ENTWICKLUNGEN REELLER ZAHLEN 119 ist bijektiv. 2 Beweis von Satz 2.10.2. Wir zeigen zuerst, dass card(R) ≥ card(P(N)). Nach Definition 1.11.1 müssen wir zeigen, dass es eine injektive Abbildung von P(N) nach R gibt. Es sei I : P(N) → {{xi }i∈N |xi ∈ {0, 1}} durch ( 1 falls i ∈ M I(M ) = {xi }i∈N mit xi = 0 falls i ∈ /M definiert. Offensichtlich ist I eine bijektive Abbildung. Nun betrachten wir die Abbildung J : {{xi }i∈N |xi ∈ {0, 1}} → R, die durch ∞ X xi J({xi }i∈N ) = 10i i=1 gegeben ist. Nach Bemerkung 2.10.1 ist die Abbildung J injektiv, weil hier kein Dezimalbruch auftritt, in dem fast alle Koeffizienten gleich 9 sind. Die Zahl 9 tritt überhaupt nicht auf, es treten nur 0 und 1 auf. J ist natürlich nicht surjektiv, dies ist für das Argument unerheblich. Die Abbildung J ◦ I ist eine injektive Abbildung von P(N) nach R, also gilt card(P(N)) ≤ card(R). Wir zeigen die Umkehrung. Nach Lemma 2.10.1 haben (0, 1) und R dieselbe Mächtigkeit. Wir zeigen card((0, 1)) ≤ card(P(N)). Nach Definition 1.11.1 müssen wir zeigen, dass es eine injektive Abbildung von (0, 1) nach P(N). Wir definieren h : (0, 1) → P(N) auf die folgende Weise. Es sei x ∈ (0, 1). Dann hat x genau eine dyadische Darstellung, in der nicht fast alle Koeffizienten gleich 1 sind x= ∞ X xn n=1 2n . Wir setzen h(x) = {n ∈ N|xn = 1}. Die Abbildung h ist injektiv. 2 Korollar 2.10.1 Zwischen je zwei reellen, verschiedenen Zahlen gibt es sowohl eine rationale als auch eine irrationale Zahl, d.h. für alle reellen Zahlen x und y mit x < y gibt es eine rationale Zahl q mit x < q < y und eine irrationale Zahl w mit x < w < y. Die Aussage dieses Korollars mag dazu verleiten anzunehmen, dass es genauso viele rationale Zahlen wie irrationale Zahlen gibt, bzw. etwas formaler, dass die Menge der rationalen Zahlen und die der irrationalen Zahlen dieselbe Mächtigkeit 120 CHAPTER 2. DIE REELLEN ZAHLEN besitzen. Dies ist nach Satz 2.10.2 falsch. Tatsächlich ist die Mächtigkeit der rationalen Zahlen gleich der von den natürlichen Zahlen und die der irrationalen Zahlen gleich der der reellen Zahlen. Die Menge der rationalen Zahlen ist also abzählbar und die der irrationalen Zahlen überabzählbar. Es gibt sehr viel mehr irrationale Zahlen als rationale. Beweis. Wir zeigen, dass zwischen zwei reellen Zahlen x und y mit x < y immer eine rationale Zahl liegt. Dabei können wir annehmen, dass 0 ≤ x < y. Falls nämlich x < 0, dann gibt es ein n ∈ N mit x + n > 0 und wir betrachten die Zahlen x + n < y + n. Man beachte, dass x + n genau dann rational ist, wenn x rational ist. Dasselbe gilt für y. . Falls x rational ist und y Falls beide Zahlen rational sind, dann wählen wir x+y 2 1 irrational, dann gibt es ein n ∈ N mit x+ n < y und wir wählen x+ n1 . Entsprechend falls x irrational und y rational. Wir nehmen nun an, dass beide Zahlen irrational sind. O.E.d.A. gilt 0 < x < y. Wir betrachten die Dezimalbruchentwicklungen von y ∞ X yi , y= i 10 i=n 0 wobei n0 ∈ Z. Es gibt ein n1 ∈ Z mit ∞ X i=n1 yi y−x < . i 10 2 +1 Es folgt, dass n1 X yi ∈Q 10i i=n 0 und n1 X x+y yi x< < < y. 2 10i i=n 0 Wir zeigen nun, dass zwischen zwei reellen Zahlen x und y mit x < y eine irrationale Zahl liegt. √ Wir betrachten den Fall, dass x ∈ Q und y ∈ R. Die Zahl 2 ist irrational und somit sind für alle n ∈ N √ 2 x+ n irrational. Wegen √ 2 lim =0 n→∞ n gibt es ein n0 mit √ 2 x<x+ < y. n0 Falls x ∈ R und y ∈ Q, verfahren wir entsprechend. Falls beide Zahlen x und y irrational sind, dann finden wir zunächst eine rationale Zahl q mit x < q < y und verfahren, wie bereits dargelegt. 2 2.11. KETTENBRÜCHE 121 Beispiel 2.10.2 Die Mengen R und R \ Q haben dieselbe Mächtigkeit. Beweis. Da R \ Q ⊆ R, so gilt card(R \ Q) ≤ card(R). Wir geben nun eine injektive Abbildung von R nach R \ Q an. Wir wissen, dass (0, 1) dieselbe Mächtigkeit wie R besitzt. Also gibt es eine bijektive Abbildung g von R nach (0, 1). Wir definieren f : (0, 1) → R \ Q durch x√ x ∈ (0, 1) \ Q f (x) = (0, 1) ∩ Q x+ 2 f ist injektiv und bildet in die irrationalen Zahlen ab. Damit ist f ◦ g eine injektive Abbildung von R nach R \ Q. 2 Beispiel 2.10.3 (i) Die √ Teilmenge M = {q ∈ Q|q 2 < 2} von Q hat in Q kein Supremum. Als Teilmenge von R hat sie 2 als Supremum. (ii) Die Teilmenge M√2 = {q ∈ Q|q 2 < 2} ∪ {q ∈ Q|q ≤ 0} von Q ist ein Dedekind Schnitt in Q. Beweis. (i) Wir√nehmen an, dass M ein Supremum √ in Q besitzt. Wir nennen es s. Wir wollen zeigen, dass s = 2 gilt, was nicht sein kann, weil 2 nach Satz 2.0.2 irrational ist. √ √ Wir nehmen an, dass s > 2 gilt. Nach Satz ?? gibt es eine rationale Zahl q1 mit 2 < q1 < s und damit 2 < q12 < s2 . Damit ist s aber √ nicht die kleinste, obere Schranke von M . Nun √ nehmen wir an, dass s < 2 gilt. Dann gibt es aber nach Satz ?? ein q2 ∈ Q mit s < q2 < 2. Also ist s nicht das Supremum von M . Insgesamt erhalten wir s2 = 2. Dies kann nicht sein, da s eine rationale Zahl ist und nach Satz 2.0.2 keine rationale Zahl sein kann. √ Wir zeigen nun, dass M als Teilmenge von R 2 als Supremum hat. Es gilt √ √ M = {q ∈ Q| − 2 < q < 2}. √ Also√ist 2 eine obere Schranke von M in R. Wir nehmen an, dass das Supremum √ s strikt kleiner als 2 ist. Dann gibt es aber nach Satz eine rationale√ Zahl q3 mit s < q3 < 2 und damit s2 < q32 < 2. Deshalb gilt q3 ∈ M und s < q3 . Somit ist 2 die kleinste obere Schranke von M in R. (ii) 0 ∈ M√2 und 2 ∈ / M √2 . Es sei ξ ∈ M√2 und η ≤ ξ. Dann gilt auch η ∈ M√2 . In der Tat, falls η ≤ 0, dann gilt η ∈ M√2 . Falls 0 < η ≤ ξ, dann gilt η 2 ≤ ξ 2 < 2 und η ∈ M√2 . Wir zeigen nun, dass M√2 kein Maximum besitzt. Es sei q0 ∈ M√2 und und wir zeigen, dass es eine größere, rationale Zahl gibt, die Element von M√2 ist. Falls q0 ≤ 0 gilt, dann können wir 1 √ als das größere Element wählen. Es sei nun 0 < q0 . Da q0 ∈ M√2 , gilt q0 < 2. Es gibt ein n ∈ N √ mit q0 + n1 < 2. Damit gilt (q0 + n1 )2 < 2 und q0 + n1 ∈ M√2 . 2 2.11 Kettenbrüche Es sei x1 eine ganze Zahl und x2 , x3 , . . . seien positive, ganze Zahlen. Dann bezeichnen wir die Folge 1 x1 + 1 x2 + 1 x3 + .. . + x1 n 122 CHAPTER 2. DIE REELLEN ZAHLEN als Kettenbruch. Dies führt auf eine weitere Darstellung der reellen Zahlen durch natürliche Zahlen. Häufig wird der Begriff eines Kettenbruches etwas allgemeiner gefasst, man lässt nicht nur positive, ganze Zahlen zu. Der holländische Astronom und Physiker Christian Huygens hat Kettenbrüche dazu benutzt reelle Zahlen durch rationale Zahlen möglichst gut zu approximieren. Er hat ca. 1680 ein Modell des Sonnensystems gebaut, das durch Zahnräder angetrieben 35 Tagen besteht und berechnete wurde. Er legte zu Grunde, dass das Jahr aus 365 144 die Umlaufperioden der Planeten bezogen auf ein Erdjahr: Merkur 25335 105190 Venus 64725 105190 Erde 1 Mars Jupiter 197836 105190 1247057 105190 Saturn 3095277 105190 Er entwickelte diese Zahlen in Kettenbrüche und benutzte diese dann, um die Zahnradverhältnisse zu bestimmen. Lemma 2.11.1 Es seien x1 eine ganze Zahl und xn , n ≥ 2, natürliche Zahlen und es seien p−1 = 0, p0 = 1, q−1 = 1, q0 = 0 und pn = xn pn−1 + pn−2 qn = xn qn−1 + qn−2 n∈N Dann gelten für alle n ∈ N und alle (2.34) 1 cn = x 1 + 1 x2 + x3 + dass (i) cn = 1 .. . + x1 n pn qn (ii) pn+1 qn − pn qn+1 pn+2 qn − pn qn+2 = (−1)n+1 = xn+2 (−1)n+1 (iii) (−1)n+1 cn+1 − cn = qn+1 qn und xn+2 (−1)n+1 cn+2 − cn = qn+2 qn (iv) c1 < c3 < · · · < c2n−1 < c2n < c2n−2 < · · · < c4 < c2 (v) Die Folge {cn }n∈N konvergiert. 2.11. KETTENBRÜCHE 123 Die Zahlen qn sind für n ≥ 1 positiv, die Zahlen pn können jedoch negativ sein. Wenn auch x1 positiv ist, dann sind auch die pn positiv. Beweis. Wir benutzen vollständige Induktion. (i) Wir zeigen hier, dass die Behauptung nicht nur für positive, ganze Zahlen xn , n ≥ 2, sondern für positive, reelle Zahlen gilt. (Der Induktionsschritt verlangt auch, dass wir den Beweis für den allgemeineren Fall führen.) Es gilt c1 = x 1 p1 = x1 p0 + p−1 = a1 q1 = x1 q0 + q−1 = 1 Also gilt p1 q1 Wir nehmen an, dass die Aussage für n richtig ist. Wir wenden dies auf die Folge k = 1, . . . , n − 1 xk x̃k = 1 xn + k=n xn+1 c1 = an. Es seien p̃k und q̃k die zu x̃ gehörigen Koeffizienten. Dann gilt für k = 1, . . . , n − 1, dass p̃k = pk . Außerdem gilt nach Induktionsannahme, dass cn+1 1 (xn + xn+1 )pn−1 + pn−2 x̃n p̃n−1 + p̃n−2 p̃n = = = c̃n = 1 q̃n x̃n q̃n−1 + q̃n−2 (xn + xn+1 )qn−1 + qn−2 = xn+1 (xn pn−1 + pn−2 ) + pn−1 xn+1 pn + pn−1 pn+1 = = xn+1 (xn qn−1 + qn−2 ) + qn−1 xn+1 qn + qn−1 qn+1 (ii) Es gilt p1 = x1 , p0 = 1, q0 = 0 und q1 = 1. Hieraus ergibt sich sofort p1 q0 − p0 q1 = −1 Wir nehmen an, dass die Behauptung für n richtig ist und schließen auf n + 1. pn+1 qn − pn qn+1 = (xn+1 pn + pn−1 )qn − pn (xn+1 qn + qn−1 ) = pn−1 qn − pn qn−1 = (−1)n+1 Nun leiten wir die zweite Gleichung her. Es gilt p2 q0 − p0 q2 = −q2 = −x2 pn+2 qn − pn qn+2 = (xn+2 pn+1 + pn )qn − pn (xn+2 qn+1 + qn ) = xn+2 (pn+1 qn − qn+1 pn ) = xn+2 (−1)n+1 (iii) Wir benutzen (ii). cn+1 − cn = pn+1 pn qn pn+1 − pn qn+1 (−1)n+1 − = = qn+1 qn qn+1 qn qn+1 qn 124 CHAPTER 2. DIE REELLEN ZAHLEN qn pn+2 − pn qn+2 xn+2 (−1)n+1 pn+2 pn − = = qn+2 qn qn+2 qn qn+2 qn (iv) Wir stellen fest, dass alle qn , n ∈ N, positive, ganze Zahlen sind. Wir überprüfen dies. Es gilt q−1 = 1, q0 = 0 und q1 = 1. Weiter gilt cn+2 − cn = q 2 = x2 q 1 + q 0 = x2 Nun machen wir den Induktionsschritt qn+1 = xn+1 qn + qn−1 Da xn+1 , qn und qn−1 positive, ganze Zahlen sind, so ist auch qn+1 eine positive, ganze Zahl. Für n = 2k folgt aus (iii) c2k+2 − c2k = x2k+2 (−1)2k−1 <0 q2k+2 q2k Also gilt c2k+2 < c2k . Genauso verfahren wir für c2k+1 > c2k−1 . (v) Nach (iv) sind {c2k }k∈N und {c2k+1 }k∈N zwei monotone, beschränkte Folgen. Somit sind es konvergente Folgen. Es gilt für alle n ∈ N qn ≥ n − 1 Wir haben q−1 = 1, q0 = 0, q1 = x1 q0 + q1 = q−1 = 1. Da xn natürliche Zahlen sind, gilt insbesondere, dass 1 ≤ xn , und es folgt für n = 2, 3, . . . qn = xn qn−1 + qn−2 ≥ qn−1 + qn−2 ≥ n − 1 Aus qn ≥ n − 1, n ∈ N, folgt 1 =0 n→∞ qn lim Deshalb gilt wegen (iii) lim c2k = lim c2k+1 k→∞ 2 k→∞ Falls eine reelle Zahl x gegeben ist, dann berechnen wir die Kettenbruchentwicklung von x so: Zu x wählen wir x1 als die größte, ganze Zahl, die kleiner oder gleich x ist. Falls x = x1 , dann bricht der Kettenbruch ab. Falls x > x1 , dann setzen wir x = x1 + 1 r2 wobei 0< 1 <1 r2 (r1 tritt nicht auf, wir beginnen mit r2 .) Allgemein wählen wir xn als die größte, ganze Zahl, die kleiner als rn ist, und definieren rn+1 durch r n = xn + 1 rn+1 wobei 0< 1 rn+1 <1 Also gilt für alle n = 2, 3, . . . , dass 1 < rn und 1 ≤ xn . Falls x eine rationale Zahl ist, so bricht die Kettenbruchentwicklung ab. Der nächste Satz stellt die Konvergenz dieses Verfahrens für irrationale Zahlen sicher. 2.11. KETTENBRÜCHE 125 Satz 2.11.1 Es sei x eine irrationale Zahl und pn , qn , n ∈ N, wie in Lemma 2.11.1 definiert. Dann gilt für alle n ∈ N pn 1 1 < x − < 2qn qn+1 qn qn qn+1 und die Kettenbruchentwicklung von x konvergiert gegen x. Man kann auch zeigen, dass die Kettenbruchentwicklung eindeutig ist. Beweis. Es gilt für alle n ∈ N 1 x = x1 + 1 x2 + x3 + 1 ... + r1n Außerdem folgt aus der Iteration r n = xn + dass 1 1 < rn xn Hieraus erhalten wir 1 rn+1 und xn < rn rn ≤ xn + und 1 xn+1 1 1 1 > ≥ 1 xn rn xn + xn+1 Es folgt xn−1 + 1 1 > xn−1 + ≥ xn−1 + xn rn 1 1 xn + xn+1 Hiervon bilden wir nun die Kehrwerte 1 xn−1 + 1 xn < 1 xn−1 + 1 rn ≤ 1 xn−1 + 1 xn + 1 xn+1 Dieses Argument kann so oft wiederholen, bis wir x1 erreicht haben. Man beachte, dass sich beim Anwenden des Argumentes die Ungleichheitszeichen umkehren. Wir setzen 1 cn = x 1 + 1 x2 + 1 x3 + .. . + x1 n 126 CHAPTER 2. DIE REELLEN ZAHLEN und erhalten für ungerades n cn ≤ x ≤ cn+1 . (Für gerades n gelten die umgekehrten Ungleichungen.) Mit Lemma (iii) folgt |x − cn | ≤ 1 |x − oder qn+1 qn pn 1 |≤ . qn qn+1 qn 2 Lemma 2.11.2 ([4] p.47) Es sei Θ eine irrationale Zahl und pn und qn seien die ganzen Zahlen wie in Satz 2.11.1 gegeben. Dann sind die Zahlen pn und qn beste Approximationen in dem folgenden Sinne: Es seien p, q ganze Zahlen mit 0 < q < qn+1 . Dann gilt |qn Θ − pn | ≤ |qΘ − p|. Beweis. Es seien u, v ganze Zahlen mit p = upn + vpn+1 q = uqn + vqn+1 Dann gilt u 6= 0. Außerdem haben u und v verschiedene Vorzeichen, falls v 6= 0. Da qn Θ − pn qn+1 Θ − pn+1 verschiedene Vorzeichen haben, folgt |qΘ − p| = |u(qn Θ − pn ) + v(qn+1 Θ − pn+1 )| ≥ |qn Θ − pn | 2 Beispiel 2.11.1 Es gilt (i) √ 1 2=1+ 1 2+ 1 2+ 2+ (ii) bzw. 1 . 2 + .. √ 1 1 2 − 47321 ≤ = 33461 33461 · 80782 2703046502 √ 2 = 1, 41421356237 ± 10−9 Beweis. (i) Wir berechnen x1 und r2 : √ 2 = x1 + wobei x1 die größte, ganze Zahl kleiner oder gleich √ 1 = 2−1 r1 oder √ 1 r2 2 ist. Also gilt x1 = 1. Daraus ergibt sich r2 = √ √ 1 = 2+1 2−1 2.11. KETTENBRÜCHE 127 √ x2 ist die größte, ganze Zahl, die kleiner oder gleich r2 = 2 + 1 ist, also x2 = 2. r3 wird aus der Gleichung 1 r2 = x2 + r3 √ Wir erhalten wieder r3 = 2 + 1. Mit Induktion erhalten wir, dass für alle n ≥ 2 gilt √ xn = 2 und rn = 2 + 1 (ii) Es gilt p−1 = 0, p0 = 1, q−1 = 1, q0 = 0 und für n = 2, 3 . . . pn = xn pn−1 + pn−2 qn = xn qn−1 + qn−2 n pn qn −1 0 1 0 1 2 3 1 1 3 7 0 1 2 5 4 17 12 5 41 29 6 99 70 7 239 169 8 577 408 9 1393 985 10 11 12 13 14 3363 8119 19601 47321 114243 2378 5741 13860 33461 80782 Damit erhalten wir 47321 : 33461 = 1, 414213562 33461 13860 133844 4756 33461 14099 133844 7146 66922 4538 33461 11919 100383 18807 167305 20765 200766 6884 66922 1918 2 Satz 2.11.2 ([10],p. 399 ) Falls p und q positive, ganze Zahlen mit q ≥ 2 sind, dann gilt p −42 q < π − q 128 CHAPTER 2. DIE REELLEN ZAHLEN Kettenbruchentwicklungen haben Anwendungen in der Elektrotechnik. Die Impedanzfunktion Z(s), s ∈ C, des Netzwerkes lässt sich als Kettenbruch schreiben 1 Z(s) = L1 + 1 C2 + 1 L3 + 1 C4 + .. . + 1 Ln Der Vorteil eines solchen Leiternetzwerkes ist seine große Stabilität. So kann man Kosten sparen, indem man billigere Bauteile mit größeren Toleranzen verwendet. Ebenso kann man solche Netzwerke in Apparaten verwenden, in denen große Hitze entsteht. Beispiel 2.11.2 1 e=2+ 1 1+ 1 2+ 1 1+ 1 1+ 1 4+ 1 1+ 1+ 1 6 + ··· Die Folge der Koeffizienten weist eine gewisse Regelmäßigkeit auf. 2, 1, 2, 1, 1, 4, 1, 1, 6, 1, 1, 8, 1, 1, 10, . . . Beweis.[24, 85] 2 Satz 2.11.3 (Euler) Ein periodischer, regelmäßiger Kettenbruch stellt eine irrationale Zahl dar, die einer quadratischen Gleichung mit rationalen Koeffizienten genügt. Chapter 3 Funktionen einer reellen Veränderlichen 3.1 Stetigkeit Johann Peter Gustav Lejeune Dirichlet wurde am 13. Februar 1805 in Düren geboren und starb am 5. Mai 1859 in Göttingen. Er studierte in Paris. Seine erste wissenschaftliche Arbeit betraf die Vermutung von Fermat. Er wurde als 20jähriger Student eingeladen, an der Französischen Akademie der Wissenschaften über diese Arbeit einen Vortrag zu halten. Er lehrte in Berlin und Göttingen. Vereinfachend lässt sich sagen, dass eine Funktion stetig ist, wenn sie sich nicht sprunghaft ändert. Dies lässt sich auch so formulieren: Man kann den Graphen einer stetigen Funktion zeichnen, ohne den Bleistift vom Blatt abzuheben. Wenn man im Argumentbereich kleine Ausschläge um einen Wert betrachtet, so kann man die Ausschläge im Bildbereich kontrollieren. Wir beweisen hier die grundlegenden Eigenschaften von stetigen Funktionen, wie den Zwischenwertsatz Wir geben hier verschiedene Beispiele stetiger bzw. unstetiger Funktionen an. Definition 3.1.1 Es sei X eine Teilmenge von R und f : X → R eine Funktion von X nach R. f heißt stetig in x0 ∈ X, wenn es zu jedem > 0 ein δ > 0 gibt, so dass für alle x ∈ X mit |x − x0 | < δ |f (x) − f (x0 )| < gilt. In Quantorenschreibweise sieht das so aus: ∀ > 0 ∃δ > 0 ∀x ∈ X, |x − x0 | < δ : |f (x) − f (x0 )| < . f heißt stetig auf X, wenn f in allen Punkten von X stetig ist. 129 130 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Beispiel 3.1.1 (i) f : R → R, f (x) = c, ist auf R stetig. (ii) f : R → R, f (x) = x, ist auf R stetig. (iii) f : (0, ∞) → R, f (x) = x1 , ist auf (0, ∞) stetig. (iv) f : R → R ( f (x) = für x ≤ 0 0 1 für x > 0 ist nicht in 0 stetig, aber in allen anderen reellen Punkten stetig. (v) f : R \ {0} → R ( f (x) = 0 für x < 0 1 für x > 0 ist eine stetige Funktion. (vi) (Dirichlet) D : R → R ( D(x) = 0 falls x irrational ist 1 falls x rational ist ist in allen Punkten unstetig. Wir werden später (Beispiel 5.1.1) feststellen, dass die Einschränkung dieser Funktion auf das Intervall [0, 1] nicht Riemann integrierbar ist. Diese Funktion wurde von Peter Gustav Lejeune Dirichlet eingeführt. (vii) Die Funktion f : R → R mit f (x) = x2 ist in allen Punkten stetig. (Den Graphen dieser Funktion bezeichnet man als Parabel. Ein springender Ball beschreibt eine Parabel, ebenso das Wasser in einem Springbrunnen.) √ (viii) f : [0, ∞) → R mit f (x) = x ist in allen Punkten stetig. Beweis. (i) Zu gegebenem x0 und müssen wir ein entsprechendes δ angeben. Da f konstant ist, ist dies besonders einfach. Wir können irgendeine Zahl für δ wählen, z.B. 100. Für alle x ∈ R mit |x − x0 | < 100 gilt |f (x) − f (x0 )| = 0 < . In diesem Beispiel hängt δ weder von noch von x0 ab. (ii) Zu gegebenen x0 und wählen wir δ = . Für alle x mit |x − x0 | < δ gilt |f (x) − f (x0 )| = |x − x0 | < δ = . In diesem Beispiel hängt δ zwar nicht von x0 , aber von ab. (iii) Zu gegebenen x0 und wählen wir x0 x20 δ = min , . 2 2 Für alle x mit |x − x0 | < δ gilt 1 1 |x − x0 | δ x2 x0 |f (x) − f (x0 )| = − = < ≤ 0 = . x x0 xx0 xx0 2xx0 2x Wegen |x − x0 | < δ ≤ x0 2 gilt x0 − x < x0 2 und deshalb x0 2 < x. Damit folgt nun |f (x) − f (x0 )| < . 3.1. STETIGKEIT 131 (iv) Die Stetigkeit in einem Punkt x0 bedeutet ∀ > 0∃δ > 0∀x ∈ X, |x − x0 | < δ : |f (x) − f (x0 )| < . Die Negation dieser Aussage ist ∃ > 0∀δ > 0∃x ∈ X, |x − x0 | < δ : |f (x) − f (x0 )| ≥ . In diesem Beispiel ist x0 = 0. Wir wählen = 12 . Die Zahl δ ist gegeben. Wir wählen x = 12 δ. Es gilt |x − x0 | = |x| = 12 δ < δ. Weiter gilt |f (x) − f (0)| = |f ( 12 δ) − f (0)| = 1 − 0 > 1 2 = . (vi) Wir verwenden hier, dass es zwischen zwei reellen Zahlen sowohl eine rationale, als auch eine irrationale Zahl gibt. Wir wählen in jedem Fall = 12 . Falls x0 rational ist, dann wählen wir ein irrationales x mit |x − x0 | < δ. Dann gilt |D(x) − D(x0 )| = 1 > 1 = . 2 Falls x0 irrational ist, wählen wir ein rationales x. (vii) Wir wählen p δ = + |x0 |2 − |x0 | . Man beachte, dass δ > 0. Dann gilt = δ 2 + 2δ|x0 | und wir erhalten |f (x) − f (x0 )| = |x2 − x20 | = |x − x0 ||x + x0 | = |x − x0 ||x − x0 + 2x0 |. Mit der Dreiecksungleichung folgt |f (x) − f (x0 )| ≤ |x − x0 |(|x − x0 | + 2|x0 |) < δ(2|x0 | + δ) = . (viii) Wir hatten in Beispiel 2.3.5 nachgewiesen, dass die Quadratwurzelfunktion existiert und monoton wachsend ist. Wir weisen zuerst nach, dass f in x0 mit x0 > 0 stetig ist. Wir wählen nx √ o 0 δ = min , · x0 . 2 Dann gilt für alle x mit |x − x0 | < δ √ √ √ √ √ | x − x0 || x + x0 | √ |x − x0 | δ √ |f (x) − f (x0 )| = | x − x0 | = = √ < √ √ √ √ . | x + x0 | | x + x0 | | x + x0 | Aus |x − x0 | < δ ≤ x0 2 folgt x0 2 < x und damit p x0 2 < √ x. Weiter folgt δ δ δ |f (x) − f (x0 )| < p x0 √ = < √ ≤ . √ 1 | x0 | |(1 + √2 ) x0 | | 2 + x0 | Nun der Fall x0 = 0. Wir wählen δ = 2 . Dann gilt für alle x mit |x − x0 | < δ bzw. x < δ √ √ |f (x) − f (x0 )| = x < δ = . 2 132 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Satz 3.1.1 Es sei X eine Teilmenge von R und f : X → R eine Funktion. f ist genau dann in x0 ∈ X stetig, wenn für jede Folge {xn }n∈N ⊆ X mit limn→∞ xn = x0 lim f (xn ) = f (x0 ) n→∞ gilt. Beweis. f sei stetig in x0 , d.h. (3.1) ∀ > 0 ∃δ > 0 ∀x, |x − x0 | < δ : |f (x) − f (x0 )| < . Weiter gelte limn→∞ xn = x0 , also (3.2) ∀δ > 0 ∃N ∈ N ∀n ≥ N : |xn − x0 | < δ . Aus (3.1) und (3.2) folgt ∃N ∈ N ∀n > N : |f (xn ) − f (x0 )| < . Also lim f (xn ) = f (x0 ) . n→∞ Wir zeigen nun die Umkehrung, d.h. ∀{xn }n∈N , lim xn = x0 : lim f (xn ) = f (x0 ) =⇒ f ist in x0 stetig. n→∞ n→∞ Wir zeigen die äquivalente Implikation: f ist nicht in x0 stetig =⇒ ∃{xn }n∈N , lim xn = x0 : n→∞ f (x0 ) ist nicht Grenzwert der Folge {f (xn )}n∈N f ist nicht in x0 stetig: ∃ > 0 ∀δ > 0 ∃x, |x − x0 | < δ : |f (x) − f (x0 )| ≥ . Wir wählen nun für δ die Werte n1 , n ∈ N. Damit erhalten wir ∃ > 0 ∀n ∈ N ∃xn , |xn − x0 | < 1 : n |f (xn ) − f (x0 )| ≥ . Also gilt lim xn = x0 n→∞ und f (x0 ) ist nicht Grenzwert der Folge {f (xn )}n∈N . 2 3.1. STETIGKEIT 133 Bemerkung 3.1.1 Es sei X eine Teilmenge von R, es sei x0 ∈ X und f : X → R. Wir sagen, dass f in x0 linksseitig stetig ist, wenn g : X ∩ (−∞, x0 ] → R mit g(x) = f (x) in x0 stetig ist. Entsprechend definiert man die rechtsseitige Stetigkeit. (i) f ist genau dann in x0 linksseitig stetig ist, wenn für alle Folgen {xn }n∈N mit {xn }n∈N ⊆ X ∩ (−∞, x0 ] und limn→∞ xn = x0 lim f (xn ) = f (x0 ) n→∞ gilt. (ii) f ist genau dann stetig in x0 , wenn sie links- und rechtsseitig stetig in x0 ist. Lemma 3.1.1 Es seien X und Y Teilmengen von R und f : X → Y und g : Y → R seien Funktionen, die in x0 bzw. f (x0 ) stetig sind. Dann ist auch g ◦ f : X → R mit (g ◦ f )(x) = g(f (x)) in x0 stetig. Beweis. Nach Satz 3.1.1 gelten f ist in x0 stetig ⇐⇒ ∀{xn }n∈N , lim xn = x0 : n→∞ lim f (xn ) = f (x0 ) n→∞ und g ist in f (x0 ) stetig ⇐⇒ ∀{yn }n∈N , lim yn = f (x0 ) : n→∞ lim g(yn ) = g(f (x0 )) . n→∞ Wir setzen nun yn = f (xn ) und erhalten ∀{xn }n∈N , lim xn = x0 : n→∞ lim g(f (xn )) = g(f (x0 )) n→∞ Damit ist g ◦ f in x0 stetig. 2 Lemma 3.1.2 Es seien X eine Teilmenge von R und f, g : X → R Funktionen, die in x0 stetig sind. Dann gelten (i) f + g ist in x0 stetig. (ii) f · g ist in x0 stetig. (iii) Wenn überdies g 6= 0 auf X gilt, dann ist f g in x0 stetig. Beweis. Wir benutzen wieder Satz 3.1.1 und Lemma 2.2.3. Wir zeigen (i). Es gelten ∀{xn }n∈N , lim xn = x0 : n→∞ ∀{xn }n∈N , lim xn = x0 : n→∞ n→∞ n→∞ lim f (xn ) = f (x0 ) lim g(xn ) = g(x0 ) Es folgt ∀{xn }n∈N , lim xn = x0 : n→∞ 2 lim (f (xn ) + g(xn )) = f (x0 ) + g(x0 ). n→∞ 134 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Beispiel 3.1.2 (i) Es sei n ∈ N und f : R → R mit f (x) = xn . f ist auf R stetig. (ii) Alle Polynome p : R → R p(x) = n X ak xk k=0 sind auf R stetig. (iii) Alle rationalen Funktionen p q sind auf R \ {x|q(x) = 0} stetig. Beweis. (i) folgt, weil f (x) = x nach Beispiel 3.1.1 stetig ist und weil Produkte von stetigen Funktionen nach Lemma 3.1.2 stetig sind. (ii) folgt aus (i) und Lemma 3.1.2 (i). (iii) folgt aus (ii) und Lemma 3.1.2 (iii). Definition 3.1.2 Wenn es ein ξ ∈ R gibt, so dass für alle Folgen {xn }n∈N mit limn→∞ xn = x0 der Grenzwert lim f (xn ) = ξ. n→∞ angenommen wird, so schreiben wir auch dafür lim f (x) = ξ. x→x0 Dies ist äquivalent zu (3.3) ∀ > 0 ∃δ > 0 ∀x, |x − x0 | < δ : |f (x) − ξ| < . Hierbei muss es nicht so sein, dass x0 im Definitionsgebiet von f liegt. Obwohl man i.A. ∞ bzw. −∞ nicht als Grenzwerte zulässt, schreibt man symbolisch (3.4) lim f (x) = ∞ x→x0 und lim f (xn ) = ∞, n→∞ falls ∀K > 0 ∃N ∈ N ∀n > N : f (xn ) > K. Entsprechend für −∞. Satz 3.1.2 Es seien a, b ∈ R mit a < b und f : [a, b] → R eine stetige Funktion. Dann hat f auf [a, b] ein Minimum und ein Maximum, d.h. es gibt xmin , xmax ∈ [a, b], so dass für alle x ∈ [a, b] f (xmin ) ≤ f (x) ≤ f (xmax ) gilt. Wichtig bei diesem Satz ist neben der Stetigkeit der Funktion, dass das Intervall beschränkt und abgeschlossen ist, d.h. die Endpunkte gehören zum Intervall. 3.1. STETIGKEIT 135 Beispiel 3.1.3 (i) f : (0, 1] → R mit f (x) = x1 ist in allen Punkten stetig, besitzt aber kein Maximum. Man beachte, dass die Voraussetzung, dass [a, b] ein abgeschlossenes Intervall sein soll, nicht gegeben ist. (ii) f : [−1, 1] → R mit f (x) = x2 ist stetig und hat Minimum und Maximum. Das Minimum ist gleich 0 und wird in 0 angenommen. Das Maximum ist gleich 1 und wird in −1 und 1 angenommen. Beweis von Satz 3.1.2. Wir beweisen, dass f auf [a, b] sein Maximum annimmt. Der Beweis für das Minimum wird genauso geführt. Wir zeigen, dass die Menge {f (x)|x ∈ [a, b]} nach oben beschränkt ist, also nach Satz 2.1.2 ein Supremum besitzt. Dann zeigen wir, dass das Supremum angenommen wird, also tatsächlich ein Maximum ist. Wir nehmen an, dass f nicht nach oben beschränkt ist: (3.5) ∀n ∈ N ∃xn : n ≤ f (xn ) . Da die Folge {xn }n∈N in [a, b] enthalten ist, ist sie beschränkt. Nach Satz 2.3.3 besitzt sie deshalb eine konvergente Teilfolge {xnk }k∈N . Wir bezeichnen diesen Grenzwert mit x0 . Nach Lemma 2.2.4 (i) gilt x0 ∈ [a, b]. Also gelten x0 ∈ [a, b] und lim xnk = x0 . k→∞ Da f stetig ist, folgt lim f (xnk ) = f (x0 ) . k→∞ Hieraus folgt ∃K ∈ N ∀k > K : |f (xnk ) − f (x0 )| < 1 ∃K ∈ N ∀k > K : f (xnk ) < 1 + f (x0 ) . und damit Mit (3.5) folgt ∃K ∈ N ∀k > K : nk < 1 + f (x0 ) . Da n1 < n2 < · · · , kann dies nicht sein. Also ist die Menge {f (x)|x ∈ [a, b]} nach oben beschränkt und hat nach Satz 2.1.2 ein Supremum, das wir mit ξ bezeichnen. Nun wählen wir eine neue Folge {xn }n∈N : Da ξ das Supremum der Menge {f (x)|x ∈ [a, b]} ist, gibt es zu jedem > 0 ein x mit ξ ≤ f (x) + . Wäre dies nicht so, dann würde es ein > 0 geben, so dass für alle x ∈ [a, b] die Abschätzung ξ > f (x) + gilt. Dann wäre aber ξ − eine obere Schranke der Menge {f (x)|x ∈ [a, b]}. 136 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Also gilt 1 . n Wiederum folgt mit Satz 2.3.3, dass {xn }n∈N eine konvergente Teilfolge {xnk }k∈N besitzt. Wiederum mit Lemma 2.2.4 folgt, dass es ein x0 ∈ [a, b] mit ∀n ∈ N ∃xn ∈ [a, b] : ξ ≤ f (xn ) + lim xnk = x0 k→∞ gibt. Da f stetig ist, folgt lim f (xnk ) = f (x0 ) . k→∞ Da für alle k ∈ N gilt, dass ξ ≤ f (xnk ) + 1 , nk folgt 1 ξ ≤ lim f (xnk ) + = f (x0 ) ≤ ξ . k→∞ nk Also erhalten wir f (x0 ) = ξ. 2 Lemma 3.1.3 Es seien a, b ∈ R mit a < b und f : [a, b] → R sei eine stetige Funktion. Es gelte f (a) < 0 < f (b) oder f (b) < 0 < f (a). Dann gibt es mindestens ein x0 ∈ (a, b) mit f (x0 ) = 0. Da f stetig ist, kann man den Graphen von f zeichnen, ohne den Bleistift vom Papier zu heben. Der Punkt (a, f (a)) befindet sich unter der x-Achse, weil f (a) < 0, und der Punkt (b, f (b)) befindet sich über der x-Achse, weil f (b) > 0. Wenn man also den Graphen zeichnet, muss an zumindest an einer Stelle die x-Achse kreuzen. Beispiel 3.1.4 Die Funktion f (x) = x3 ist auf [−1, 1] stetig und es gilt f (−1)f (1) = −1. An der Stelle θ = 0 gilt f (0) = 0. Beweis von Lemma 3.1.3. Wir können annehmen, dass f (a) < 0 und f (b) > 0. Wir betrachten die Menge A = {x|x ∈ [a, b] und f (x) ≤ 0}. A ist nicht leer, weil a ∈ A und A hat ein Supremum, weil A nach oben durch b beschränkt ist. Wir setzen ξ = sup A und behaupten, dass f (ξ) = 0. Es gibt eine Folge {xn }n∈N ⊆ A mit lim xn = ξ, n→∞ weil ξ das Supremum von A ist. Wegen der Stetigkeit von f folgt lim f (xn ) = f (ξ). n→∞ Wegen {xn }n∈N ⊆ A gilt für alle n ∈ N, dass f (xn ) ≤ 0. Also folgt f (ξ) ≤ 0. 3.1. STETIGKEIT 137 Wir zeigen nun, dass auch f (ξ) ≥ 0 gilt. Wir nehmen an, dass f (ξ) < 0 gilt. Da f stetig ist, gilt ∀ > 0 ∃δ > 0 ∀x, |x − ξ| < δ : |f (x) − f (ξ)| < . Wir wählen = 12 |f (ξ)|. Es folgt ∃δ > 0∀x, |x − ξ| < δ : |f (x) − f (ξ)| < 12 |f (ξ)|. Da f (ξ) < 0, folgt ∃δ > 0∀x, |x − ξ| < δ : f (x) − f (ξ) < − 21 f (ξ) und ∃δ > 0∀x, |x − ξ| < δ : f (x) < 12 f (ξ) < 0. Nun wählen wir x = ξ + 12 δ und erhalten f (ξ + 21 δ) < 0. Damit folgt ξ + 12 δ ≤ sup A = ξ. Dies ist ein Widerspruch. Also gilt f (ξ) = 0. 2 Satz 3.1.3 (Zwischenwertsatz) Es seien a, b ∈ R mit a < b und f : [a, b] → R eine stetige Funktion. Dann existiert für alle η mit inf{f (x)|x ∈ [a, b]} ≤ η ≤ sup{f (x)|x ∈ [a, b]} mindestens ein ξ ∈ [a, b] mit f (ξ) = η. Beweis. Nach Satz 3.1.2 gibt es xmin und xmax mit f (xmin ) = inf{f (x)|x ∈ [a, b]} f (xmax ) = sup{f (x)|x ∈ [a, b]} Wir können also annehmen, dass f (xmin ) < η < f (xmax ). Wir setzen F (x) = f (x) − η. Dann gelten F (xmin ) < 0 und F (xmax ) > 0. Nach Lemma 3.1.3 gibt es ein ξ ∈ (xmin , xmax ) mit F (ξ) = 0. Also gilt f (ξ) = η. 2 138 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Beispiel 3.1.5 Es sei p : R → R ein Polynom p(x) = n X ak xk , k=0 bei dem der höchste Exponent n ungerade ist und der Koeffizient an 6= 0. Dann hat p mindestens eine reelle Nullstelle. Beweis. Es gibt zwei Punkte x1 und x2 mit p(x1 ) < 0 und p(x2 ) > 0. Mit dem Zwischenwertsatz folgt dann, dass es ein ξ ∈ (x1 , x2 ) mit p(ξ) = 0 gibt. Wir zeigen nun, dass es solche Punkte x1 und x2 gibt. n n−1 X X p(x) = ak xk ≥ xn − |ak ||x|k k=0 Für x ≥ 1 folgt p(x) ≥ xn − xn−1 k=0 n−1 X k=0 |ak | = xn−1 x− n−1 X k=0 ! |ak | Pn−1 Für x ≥ 1 und x > k=0 |ak | gilt p(x) > 0. Umgekehrt gilt für alle x mit x ≤ −1 p(x) = n X k=0 = ak xk ≤ xn + −|x|n + |x|n−1 Somit gilt für x mit x ≤ −1 und |x| > n−1 X k=0 n−1 X k=0 Pn−1 k=0 |ak ||x|k ≤ xn + |x|n−1 |ak | = −|x|n−1 |x| − n−1 X k=0 n−1 X k=0 |ak | ! |ak | |ak | p(x) < 0. 2 Beispiel 3.1.6 (i) Es sei f : [0, 1] → [0, 1] eine stetige Abbildung. Dann hat f einen Fixpunkt, d.h. es gibt ein x ∈ [0, 1] mit f (x) = x. (ii) Es sei f : [0, 2] → R eine stetige Funktion derart, dass f (0) = f (2) ist. Dann existiert ein x ∈ [0, 1], für das f (x) = f (x + 1) gilt. Beweis. (i) Wir betrachten die Funktion g : [0, 1] → R mit g(x) = f (x) − x. Es gelten g(0) = f (0) − 0 ≥ 0 und g(1) = f (1) − 1 ≤ 0. Nach dem Zwischenwertsatz nimmt die stetige Funktion g alle Werte zwischen g(0) und g(1) an, also auch 0. (ii) Wir betrachten die Funktion g : [0, 1] → R mit g(x) = f (x) − f (x + 1). Dann gelten g(0) = f (0) − f (1) g(1) = f (1) − f (2) = f (1) − f (0) Also g(0) = −g(1) Nun wenden wir den Zwischenwertsatz an. 2 Beispiel 3.1.7 Es sei f : (0, ∞) → R falls x irrational 0 f (x) = m 1 falls x = und m und n teilerfremd sind n n Dann ist f in allen irrationalen Punkten stetig und in allen rationalen Punkten unstetig. 3.1. STETIGKEIT 139 Beweis. Wir zeigen, dass f in allen rationalen Punkten, die von 0 verschieden sind, unstetig ist. 1 m Es gilt f ( m n ) = n , aber in jeder Umgebung von n findet man einen irrationalen Punkt. Wir zeigen nun, dass f in allen irrationalen Punkten x stetig ist. Wir nehmen an, dass es einen irrationalen Punkt x0 gibt, in dem f nicht stetig ist Dann gibt es eine Folge {xn }n∈N mit limn→∞ xn = x0 , so dass die Folge {f (xn )}n∈N nicht gegen f (x0 ) = 0 konvergiert. Dies bedeutet, dass es eine Teilfolge {xnk }k∈N rationaler Zahlen gibt, die gegen x0 konvergiert. n Wir können also annehmen, dass es eine Folge rationaler Zahlen { m kn }n∈N gibt, so dass lim n→∞ mn = x0 kn und so dass die Folge { k1n }n∈N nicht gegen 0 konvergiert. Dann gibt es eine Teilfolge knj , j ∈ N, die beschränkt ist: Da die Folge { k1n }n∈N nicht gegen 0 konvergiert, gilt 1 ∃ > 0∀N ∃n ≥ N : ≥ kn Wir wählen zu N = 1 ein n1 mit 1 ≤ n1 und 1 ≥ . k n1 Nachdem wir n1 < · · · < nj gewählt haben, wählen wir nj+1 . Zu N = nj + 1 gibt es ein nj+1 ≥ N mit 1 ≥ . knj+1 Damit gilt für alle j ∈ N 1 mn und die Folge ist beschränkt. Insgesamt erhalten wir also eine Folge { kn j }j∈N mit knj ≤ j mnj lim = x0 n→∞ knj und so dass die Folge {knj }j∈N beschränkt ist. Dann gibt es in der Menge {knj |j ∈ N} nur endlich viele verschiedene Zahlen. Außerdem ist die Folge mnj , j ∈ N, beschränkt, weil anderenfalls die mn konvergente Folge kn j , j ∈ N, nicht beschränkt wäre, was nach Lemma 2.2.1 nicht sein kann. j Somit nimmt auch die Folge {mnj }j∈N nur endlich viele Werte an. Somit nimmt mnj knj j∈N nur endlich viele Werte {α1 , . . . , αr } an. Dann gilt mnj ∈ {α1 , . . . , αr } lim j∈N knj und damit rational. Der Grenzwert ist aber gleich der irrationalen Zahl x0 . 2 P Beispiel 3.1.8 Es sei {an }n∈N eine Folge positiver, reeller Zahlen, so dass n∈N an konvergiert. Außerdem sei q : N → Q eine Bijektion. Für x ∈ R definieren wir ( an falls q(n) ≤ x x an = 0 falls q(n) > x und f (x) = X axn n∈N f ist eine positive, beschränkte, strikt monoton wachsende Funktion, die in den rationalen Punkten unstetig und in den irrationalen Punkten stetig ist. 140 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Beweis. Etwas kürzer und prägnanter lässt sich f so definieren X aq f (x) = q≤x Wir zeigen (i) Für alle x, y ∈ R mit x < y gilt f (x) < f (y). P (ii) Für alle x ∈ R gilt 0 < f (x) < n∈N an . (iii) f ist in allen rationalen Punkten unstetig. (iv) f ist in allen irrationalen Punkten stetig. (i) Für alle x, y ∈ R mitx < y existiert ein z ∈ Q mit x < z < y. Für alle n ∈ N gilt axn ≤ ayn und f (y) − f (x) = X n∈N ayn − X axn = n∈N X n∈N (ayn − axn ) ≥ ayq−1 (z) − ayq−1 (z) = aq−1 (z) > 0 (iii) Es sei x0 ∈ Q. Wir haben zu zeigen ∃ > 0∀δ > 0∃x, |x − x0 | < δ : |f (x) − f (x0 )| ≥ . Wir wählen = aq−1 (x0 ) und x < x0 . Dann gilt X x0 x 0 f (x0 ) − f (x) = (axn0 − axn ) ≥ axq−1 (x0 ) − aq −1 (x0 ) = aq −1 (x0 ) = . n∈N (iv) Wir zeigen ∀x0 ∀ > 0∃δ > 0∀x, |x − x0 | < δ : |f (x) − f (x0 )| < Wir wählen zu gegebenen x0 und das δ. Es gilt ∀ > 0∃N ∀n > N : ∞ X ak < k=n 2 Wir setzen δ = min{|x0 − q(n)| |n = 1, 2, . . . , N } Dann gilt für alle x mit |x − x0 | < δ und alle n = 1, 2, . . . , N , dass axn = axn0 . Wir prüfen dies nach. Falls x0 < q(n), dann gilt axn0 = 0. Es gilt für alle n = 1, . . . , N δ ≤ q(n) − x0 oder x0 + δ ≤ q n . Also gilt für alle n = 1, . . . , N und alle x mit |x − x0 | < δ x < q(n). Damit gilt für alle n = 1, . . . , N und alle x mit |x − x0 | < δ axn = 0. Nun betrachten wir den Fall q(n) < x0 . Es gilt axn0 = an . Es gilt für alle n = 1, . . . , N δ ≤ x0 − q(n) oder qn ≤ x0 − δ. Deshalb folgt für alle n = 1, . . . , N und alle x mit |x − x0 | < δ q(n) < x. 3.1. STETIGKEIT 141 Also gilt für alle n = 1, . . . , N und alle x mit |x − x0 | < δ axn = an . Damit folgt für alle x mit |x − x0 | < δ |f (x) − f (x0 )| = ≤ ∞ X X x x0 x x0 an − an an − an = n∈N ∞ X n=N n=N |axn | + ∞ X n=N |axn0 | ≤ 2 ∞ X n=N |an | < . 2 Beispiel 3.1.9 (i) Eine Funktion f : R → R heißt Lipschitz stetig, falls es eine Konstante L gibt, so dass für alle x, y ∈ R |f (x) − f (y)| ≤ L|x − y| gilt. Jede Lipschitz stetige Funktion ist stetig. (ii) Eine Funktion f : R → R heißt konvex, falls für alle x, y ∈ R und alle t mit 0 ≤ t ≤ 1 f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y) gilt. Dann ist f in allen reellen Punkten stetig. Beweis. (ii) Wir zeigen, dass f Lipschitz stetig ist. Es seien x1 < x0 < x2 . Wir betrachten die beiden Geraden f (x2 ) − f (x0 ) (x − x0 ) + f (x0 ) x2 − x0 und Es gilt für alle x mit x0 ≤ x ≤ x2 f (x0 ) − f (x1 ) (x − x0 ) + f (x0 ). x0 − x1 f (x0 ) − f (x1 ) f (x2 ) − f (x0 ) (x − x0 ) + f (x0 ) ≤ f (x) ≤ (x − x0 ) + f (x0 ) x0 − x1 x2 − x0 und für alle x mit x1 ≤ x ≤ x0 f (x0 ) − f (x1 ) f (x2 ) − f (x0 ) (x − x0 ) + f (x0 ) ≤ f (x) ≤ (x − x0 ) + f (x0 ). x2 − x0 x0 − x1 Es folgt für alle x mit x0 ≤ x ≤ x2 f (x0 ) − f (x1 ) f (x2 ) − f (x0 ) (x − x0 ) ≤ f (x) − f (x0 ) ≤ (x − x0 ) x0 − x1 x2 − x0 und für alle x mit x1 ≤ x ≤ x0 f (x2 ) − f (x0 ) f (x0 ) − f (x1 ) (x − x0 ) ≤ f (x) − f (x0 ) ≤ (x − x0 ) x2 − x0 x0 − x1 Es folgt für alle x mit x0 ≤ x ≤ x2 |f (x) − f (x0 )| ≤ (x − x0 ) max 2 |f (x2 ) − f (x0 )| |f (x0 ) − f (x1 )| , x2 − x0 x0 − x1 . 142 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN 3.2 Gleichmäßige Stetigkeit Definition 3.2.1 Es sei X eine Teilmenge von R. Eine Funktion f : X → R heißt gleichmäßig stetig auf X, wenn es zu jedem > 0 ein δ > 0 gibt, so dass für alle x1 , x2 ∈ X mit |x1 − x2 | < δ |f (x1 ) − f (x2 )| < gilt. In Quantorenschreibweise ∀ > 0 ∃δ > 0 ∀x1 , x2 ∈ X, |x1 − x2 | < δ : |f (x1 ) − f (x2 )| < . Mit dieser Eigenschaft werden wir zeigen, dass jede stetige Funktion Riemann integrierbar ist. dem Riemann-Integral. Beispiel 3.2.1 (i) Es sei f : X → R gleichmäßig stetig ist. Dann ist f auf X stetig. (ii) f : R → R mit f (x) = x ist gleichmäßig stetig. (iii) f : (0, ∞) → R mit f (x) = (iv) f : [0, ∞) → R mit f (x) = 1 x √ ist nicht gleichmäßig stetig. x ist gleichmäßig stetig. 2 (v) f : R → R mit f (x) = x ist nicht gleichmäßig stetig. Beweis. (i) Da f gleichmäßig stetig ist, gilt ∀ > 0∃δ > 0∀x1 , x2 ∈ X, |x1 − x2 | < δ : |f (x1 ) − f (x2 )| < . Für festes x0 = x1 gilt damit ∀ > 0∃δ > 0∀x2 ∈ X, |x0 − x2 | < δ : |f (x0 ) − f (x2 )| < . (ii) ist gegeben. Wir wählen δ = . Dann gilt für alle x1 , x2 ∈ R mit |x1 − x2 | < δ |f (x1 ) − f (x2 )| = |x1 − x2 | < δ = . (iii) Die Verneinung der gleichmäßigen Stetigkeit bedeutet ∃ > 0∀δ > 0 ∃x1 , x2 ∈ X, |x1 − x2 | < δ : Wir wählen = 1. δ ist gegeben. Wir wählen 1 x1 = min δ, 2 |f (x1 ) − f (x2 )| ≥ . und x2 = 1 x1 . 2 Dann gelten |x1 − x2 | = |x1 − 21 x1 | = | 21 x1 | < δ und 1 1 1 2 1 |f (x1 ) − f (x2 )| = − = − = ≥ 2 > 1 = . x1 x2 x1 x1 x1 (iv) Wir benötigen die folgende Abschätzung. Für alle x, y ∈ [0, ∞) mit y ≤ x gilt √ √ √ x − y ≤ x − y. 3.2. GLEICHMÄSSIGE STETIGKEIT 143 Wir nehmen an, dass dies falsch ist. Dann gibt es x, y mit y ≤ x, so dass Dann gilt √ √ √ √ √ x − y = ( x − y)2 < ( x − y)2 = x − 2 x y + y. Hieraus folgt √ √ 2 x y < 2y und somit √ x− √ y > √ x − y. x < y. Dies ist ein Widerspruch, da y < x. Zu gegebenem wählen wir δ = 2 . Dann gilt für alle x, y ∈ [0, ∞) mit y < x und |x − y| < δ √ √ √ √ |f (x) − f (y)| = | x − y| ≤ x − y < δ = . (v) Wir müssen zeigen ∃ > 0∀δ > 0∃x1 , x2 , |x1 − x2 | < δ : 1 δ |f (x1 ) − f (x2 )| ≥ . 1 δ + 2δ . Dann gelten |x1 − x2 | = 2δ < δ und δ2 δ 2 δ + =2+ > 2 > 1 = . |f (x1 ) − f (x2 )| = |x21 − x22 | = |x1 − x2 ||x1 + x2 | = 2 δ 2 4 Wir wählen = 1 und x1 = und x2 = 2 Satz 3.2.1 Es seien a, b ∈ R mit a < b und f : [a, b] → R sei eine stetige Funktion. Dann ist f auf [a, b] gleichmäßig stetig. Beweis. Wir nehmen an, dass f nicht gleichmäßig stetig ist. Dann existiert ein > 0, so dass für alle δ > 0 Punkte x und y mit |x − y| ≤ δ und |f (x) − f (y)| ≥ existieren. Somit gibt es ein > 0, so dass für alle n ∈ N Punkte xn und yn mit |xn − yn | ≤ n1 und |f (xn ) − f (yn )| ≥ existieren. Nach dem Satz von Bolzano-Weierstraß (Satz 2.3.3) besitzt die Folge xn , n ∈ N, eine konvergente Teilfolge xnk , k ∈ N. Wir setzen ξ = lim xnk . k→∞ Es gilt ξ ∈ [a, b], weil xnk ∈ [a, b] für alle k ∈ N. Wegen |xnk − ynk | ≤ −xnk + ynk , k ∈ N, eine Nullfolge und somit konvergiert ynk , k ∈ N, gegen ξ. ξ = lim ynk . k→∞ Da f stetig ist, folgt lim (f (xnk ) − f (ynk )) = f (ξ) − f (ξ) = 0. k→∞ Dies steht aber im Widerspruch zu ∀k ∈ N : 2 |f (xnk ) − f (ynk )| ≥ . 1 nk ist 144 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN 3.3 Monotone Funktionen und Umkehrfunktionen Definition 3.3.1 Es sei X eine Teilmenge von R. Eine Funktion f : X → R heißt (streng) monoton wachsend, falls für alle x, y ∈ X mit x < y f (x) ≤ f (y) (f (x) < f (y)) gilt. Eine Funktion f : X → R heißt (streng) monoton fallend, falls für alle x, y ∈ X mit x < y f (x) ≥ f (y) (f (x) > f (y)) gilt. Definition 3.3.2 Es sei X eine Teilmenge von R und f : X → R. Wir bezeichnen die Menge f (X) = {f (x)|x ∈ X} als Bild von f . Wir sagen, dass f eine Umkehrabbildung oder Inverse f −1 besitzt, falls es eine Funktion f −1 : f (X) → X gibt, so dass für alle x ∈ X f −1 (f (x)) = x . Man erhält den Graphen von f −1 , indem man den Graphen von f an der Geraden y = x spiegelt. Lemma 3.3.1 Es sei X eine Teilmenge von R und f : X → R sei streng monoton wachsend oder streng monoton fallend. Dann gelten (i) Die Umkehrabbildung f −1 : f (X) → R existiert. (ii) f −1 ist auf f (X) streng monoton wachsend, falls f streng monoton wachsend ist. (iii) f −1 ist auf f (X) streng monoton fallend, falls f streng monoton fallend ist. Beweis. Es reicht zu zeigen, dass die Abbildung f injektiv ist. Dazu ist zu zeigen: Falls x 6= y, dann gilt f (x) 6= f (y). Falls x 6= y, dann gilt x < y oder y < x. Also gilt f (x) < f (y) oder f (y) < f (x) und damit f (x) 6= f (y). 2 Satz 3.3.1 Es seien a, b ∈ R mit a < b und f : [a, b] → R sei eine stetige, streng monoton wachsende Funktion. Dann gilt f ([a, b]) = [f (a), f (b)] und f −1 : [f (a), f (b)] → [a, b] existiert, ist stetig und streng monoton wachsend. Für stetige, streng monoton fallende Funktionen gilt eine entsprechende Aussage. 3.3. MONOTONE FUNKTIONEN UND UMKEHRFUNKTIONEN 145 Beweis. Da f streng monoton wachsend ist, gilt für alle x ∈ [a, b] f (a) ≤ f (x) ≤ f (b) und somit gilt f ([a, b]) ⊆ [f (a), f (b)]. Mit dem Zwischenwertsatz (Satz 3.1.3) folgt " f ([a, b]) = # inf f (x), sup f (x) ⊇ [f (a), f (b)]. x∈[a,b] x∈[a,b] Insgesamt erhalten wir f ([a, b]) = [f (a), f (b)]. Mit Lemma 3.3.1 folgt, dass f −1 existiert und streng monoton wächst. Es bleibt zu zeigen, dass f −1 stetig ist. Es sei {yn }n∈N eine Folge in [f (a), f (b)] mit limn→∞ yn = y0 . Wir müssen zeigen, dass lim f −1 (yn ) = f −1 (y0 ) . n→∞ Wir zeigen zunächst, dass {f −1 (yn )}n∈N konvergiert. Falls die Folge nicht konvergiert, so gibt es nach Lemma 2.5.6 zwei konvergente Teilfolgen {f −1 (ynk )}k∈N und {f −1 (ymj )}j∈N , deren Grenzwerte x0 und x̄0 verschieden sind. Da f stetig ist, folgen lim f (f −1 (ynk )) = f (x0 ) und k→∞ lim f (f −1 (ymj )) = f (x̄0 ). j→∞ Hieraus folgen f (x0 ) = lim f (f −1 (ynk )) = lim ynk = y0 k→∞ k→∞ f (x̄0 ) = lim f (f −1 j→∞ (ymj )) = lim ymj = y0 . j→∞ Also gilt f (x0 ) = f (x̄0 ). Da f streng monoton wachsend ist, so ist f injektiv und es folgt x0 = x̄0 im Widerspruch zu unserer Annahme. Also konvergiert {f −1 (yn )}n∈N . Wir bezeichnen den Grenzwert mit x0 . Es folgt wegen der Stetigkeit von f y0 = lim yn = lim f (f −1 (yn )) = f (x0 ) . n→∞ n→∞ Also gilt x0 = f −1 (y0 ). Nun folgt f −1 (y0 ) = x0 = lim f −1 (yn ) . n→∞ 2 146 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN 3.4 Potenz, Exponentialfunktion und Logarithmus Wir führen hier die Potenzfunktion, Exponentialfunktion und Logarithmus ein. Wir definieren für alle x ∈ R und alle n ∈ N xn = x | · x{z· · · x} n und x0 = 1. Dies bedeutet, dass wir auch 00 = 1 setzen. Dies ist eine willkürliche Definition. Ein Argument dafür ist, dass limx→0 xx = 1 gilt (Beispiel 3.11.5). Andererseits gilt für alle x 6= 0, dass 0x = 0. Dies könnte man als ein Argument gegen diese Definition ansehen. Falls x 6= 0, dann setzen wir 1 x−n = n . x Definition 3.4.1 (i) Für n ∈ N nennen wir pn : R → R mit pn (x) = xn die n-te Potenzfunktion. xn heißt die n-te Potenz von x. (ii) Die n-te Wurzel oder die n1 -te Potenzfunktion p 1 : (0, ∞) → R definieren wir n 1 als die Umkehrfunktion der n-ten Potenzfunktion. p 1 (x) = x n nennen wir die n-te n Wurzel von x. n (iii) Für m , m, n ∈ N und n und m teilerfremd, definieren wir die m -te Potenzfunkn m tion p n : (0, ∞) → R durch 1 p mn (x) = (x n )m . (iv) Für m , n, m ∈ N und n und m teilerfremd, definieren wir die − m -te Potenzn n funktion p− mn : (0, ∞) → R durch p− mn (x) = 1 n1 !m 1 . x m Wir schreiben für (x n )m auch x n . Man beachte, dass p und q eindeutig sind, weil sie als teilerfremd angenommen werden. Dies folgt aus der Eindeutigkeit der Primzahlzerlegung. Damit haben wir die Potenz xs für strikt positive, reelle Zahlen x und rationale Zahlen s definiert. Tatsächlich werden wir zeigen, dass für alle k, `, m, n ∈ N mit k` = m n 1 1 1 1 (xk ) ` = (x ` )k = (x n )m = (xm ) n gilt. Also müssen wir nicht fordern, dass m und n teilerfremd sind. Außerdem wollen wir zeigen, dass wir mit dieser Definition gut rechnen können. Lemma 3.4.1 Es seien p, q ∈ N teilerfremd. Dann gilt für alle x ∈ (0, ∞) 1 1 (x q )p = (xp ) q . 3.4. POTENZ, EXPONENTIALFUNKTION UND LOGARITHMUS 147 Beweis. Es gilt 1 1 xp = ((x q )q )p = ((x q )p )q . Deshalb 1 1 (xp ) q = (x q )p . 2 Lemma 3.4.2 (i) Es seien n, m ∈ N und x ∈ (0, ∞). Dann gilt 1 1 1 x n·m = (x m ) n . (ii) Es sei x ∈ (0, ∞). Es seien n, m, p, q ∈ N mit pq = Dann gilt 1 1 1 (xn ) m = (x q )p = (x m )n . n m und p und q teilerfremd. Aus Lemma 3.4.2 (ii) folgt, dass für alle x > 0 und alle p, q ∈ N gilt p 1 1 x q = (x q )p = (xp ) q . p und q müssen nicht teilerfremd sein. Beweis. (i) Es gilt 1 y = x n·m genau dann, wenn y n·m = x. Weiter gilt x = y n·m = (y n )m . Hieraus folgt 1 1 (x m ) n = y. (ii) Es gibt ein k ∈ N mit kp = n und kq = m. Dann gelten wegen (i) 1 1 1 1 (x kq )kp = (((x q ) k )k )p = (x q )p und 1 1 1 (xkp ) kq = (((xp )k ) k ) q . 2 Lemma 3.4.3 Es sei s ∈ Q und s 6= 0. Die Potenzfunktion ps : (0, ∞) → R mit ps (x) = xs ist auf (0, ∞) stetig. Die Funktion ist streng monoton wachsend für s > 0 und sie ist streng monoton fallend für s < 0. Beweis. Für jedes n ∈ N ist die Potenzfunktion pn stetig und streng monoton wachsend. Mit Satz 3.3.1 folgt, dass für jedes m ∈ N die Potenzfunktion p 1 stetig m und streng monoton wachsend ist. Damit ist für alle n, m ∈ N die Potenzfunktion p mn = pn ◦ p 1 stetig und streng monoton wachsend. 2 m 148 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Lemma 3.4.4 Es seien p, q, n, m ∈ N und x, y ∈ (0, ∞). Dann gelten (i) p p n n xq · xm = xq+m . (ii) p p p x q · y q = (x · y) q . (iii) p p n n (x q ) m = x q · m . Beweis. (i) Wegen Lemma 3.4.2 (ii) gilt p n pm nq 1 1 1 p n x q x m = x qm x mq = (x qm )pm (x mq )nq = (x qm )pm+nq = x q + m . 2 Lemma 3.4.5 Es seien r, s ∈ Q und x, y ∈ (0, ∞). Dann gelten (i) xr · xs = xr+s (ii) xr · y r = (x · y)r (iii) (xr )s = xr·s Beweis. (i) Für r, s ≥ 0 folgt die Gleichung aus Lemma 3.4.4. Es sei nun r < 0 < s. Wir betrachten zuerst den Fall |r| ≤ s −r 1 r s · xs+r · x−r = xs+r . x ·x = x Falls |r| > s −r −s 1 1 x ·x = x x r s Nun verfahren wir wie im Fall |r| ≤ s. Falls r, s < 0, dann −r −s −r−s 1 1 1 r s x ·x = = = xr+s . x x x (ii) Falls r < 0 −r −r −r −r 1 1 1 1 1 x ·y = = · = = (x · y)r . x y x y x·y r 2 r 3.4. POTENZ, EXPONENTIALFUNKTION UND LOGARITHMUS 149 Lemma 3.4.6 (i) Es seien x ∈ R mit x > 1 und r, s ∈ Q mit r < s. Dann gilt xr < xs . (ii) Es seien x ∈ R mit 0 < x < 1 und r, s ∈ Q mit r < s. Dann gilt xs < xr . Beweis. (i) Es seien r, s ∈ Q mit r < s und x > 1. Mit Lemma 3.4.3 folgt aus 1<x 1 = 1s−r < xs−r = xs · x−r . Es folgt xr < xs . 2 Beispiel 3.4.1 (i) Für alle x ∈ R mit x > 0 gilt 1 lim x n = 1. n→∞ (ii) Für alle x ∈ R mit x > 0 und alle Folgen rationaler Zahlen {rn }n∈N mit limn→∞ rn = 0 gilt lim xrn = 1. n→∞ Beweis. (i) Wir betrachten den Fall x > 1. Mit der Bernoulli-Ungleichung (Lemma 1.10.7) x n ≥ 1 + x > x. 1+ n Es folgt 1 x ≥ xn n und damit x 1 n x − 1 ≤ . n 1 −n Falls x < 1, dann betrachten wir die Folge {x }n∈N . (ii) Wegen (i) gilt 1+ ∀ > 0∃N ∈ N∀n ≥ N : 1 |x n − 1| < Wegen limn→∞ rn = 0 ∀n ∈ N∃K ∈ N∀k ≥ K : Es folgt für alle k ≥ K und damit Insgesamt erhalten wir 2 1 − und 1 |x− n − 1| < . 1 1 ≤ rk ≤ . n n 1 x − n ≤ x rk ≤ x n 1 1 x− n − 1 ≤ xrk − 1 ≤ x n − 1. |xrk − 1| < . Definition 3.4.2 Es seien x ∈ R mit x > 0, r ∈ R und rn ∈ Q, n ∈ N, mit r = limn→∞ rn . Dann definieren wir (3.6) xr = lim xrn . n→∞ Die Potenzfunktion pr : (0, ∞) → R ist durch pr (x) = xr definiert. Weiter gilt p−r (x) = x1r . 150 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Man muss die Wohldefiniertheit überprüfen. Hierzu müssen wir zeigen: Der Grenzwert lim xrn n→∞ existiert und er hängt nur von r, aber nicht von der speziellen Folge {rn }n∈N ab. Wir bemerken auch noch, dass es zu jeder reellen Zahl r eine Folge rationaler Zahlen {rn }n∈N mit r = lim rn n→∞ gibt. Lemma 3.4.7 (i) Es sei x ∈ (0, ∞) und {rn }n∈N eine konvergente Folge rationaler Zahlen. Dann konvergiert die Folge {xrn }n∈N . (ii) Es sei x ∈ (0, ∞) und {rn }n∈N und {tn }n∈N seien zwei Folgen rationaler Zahlen mit lim rn = lim tn . n→∞ n→∞ Dann gilt lim xrn = lim xtn . n→∞ n→∞ Beweis. (i) Der Fall x = 1 ist uninteressant. Nun der Fall x > 1. Da die Folge {rn }n∈N konvergiert, ist sie nach Lemma ?? beschränkt. Deshalb gibt es ein C ∈ Q, so dass für alle n ∈ N rn ≤ C gilt. Wegen Lemma 3.4.6 gilt für alle n ∈ N xr n ≤ xC . Wir zeigen, dass die Folge {xrn }n∈N eine Cauchy Folge ist. O.E.d.A. sei rn ≥ rm . Es gilt |xrn − xrm | = |xrm ||xrn −rm − 1| ≤ xC |xrn −rm − 1|. Zu jedem k ∈ N gibt es ein N ∈ N, so dass für alle n, m ≥ N gilt |rn − rm | < k1 . Es folgt für alle n, m ≥ N 1 n |xr − xrm | ≤ xC |x k − 1|. Mit Beispiel 3.4.1 folgt, dass {xrn }n∈N eine Cauchy Folge ist. Der Fall 0 < x < 1 wird ähnlich behandelt. (ii) Wegen (i) wissen wir, dass lim xrn und n→∞ existieren. Außerdem gilt lim (rn − tn ) = 0. n→∞ Nach Beispiel 3.4.1 gilt lim x(rn −tn ) = 1. n→∞ lim xtn n→∞ 3.4. POTENZ, EXPONENTIALFUNKTION UND LOGARITHMUS 151 Mit Lemma 3.4.5 1 = lim (xrn · x−tn ) = lim xrn · lim x−tn . n→∞ n→∞ Also lim xrn = n→∞ 2 1 limn→∞ x−tn n→∞ 1 = lim n→∞ x−tn = lim xtn . n→∞ Lemma 3.4.8 Es seien x ∈ R mit x > 0 und tn , t ∈ Q, n ∈ N, mit limn→∞ tn = t. Dann gilt lim xtn = xt . n→∞ Beweis. Mit Beispiel 3.4.1 folgt der Fall t = 0. Es sei nun t beliebig. Dann gilt limn→∞ (tn − t) = 0. Mit Lemma 3.4.4 xtn = x(tn −t)+t = xtn −t · xt und somit 2 lim xtn = lim (xtn −t · xt ) = xt lim xtn −t = xt . n→∞ n→∞ n→∞ Satz 3.4.1 (i) Es seien x > 0 und r, s ∈ R. Dann gilt xr · xs = xr+s . (ii) Es seien r ∈ R und x, y > 0. Dann gilt xr · y r = (x · y)r . (iii) Es seien r, s ∈ R und x > 0. Dann gilt (xr )s = xr·s . Beweis. (i) Es seien {rn }n∈N und {sn }n∈N Folgen rationaler Zahlen mit r = lim rn s = lim sn . n→∞ n→∞ Nach Definition 3.4.2 gilt xr · xs = lim xrn lim xsn . n→∞ n→∞ Nach Lemma 2.2.3 gilt xr · xs = lim (xrn · xsn ). n→∞ Da die Zahlen rn , sn rational sind, folgt mit Lemma 3.4.4 xr · xs = lim xrn +sn . n→∞ Die Folge {rn + sn }n∈N konvergiert gegen r + s. Deshalb 2 xr · xs = xr+s . 152 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Lemma 3.4.9 (i) Es seien x ∈ R mit x > 1 und r, s ∈ R mit r < s. Dann gilt xr < xs . (ii) Es seien x ∈ R mit 0 < x < 1 und r, s ∈ R mit r < s. Dann gilt xs < xr . (iii) Es seien x, y ∈ R mit 0 < x < y und r ∈ R mit r > 0. Dann gilt xr < y r . (iv) Es seien x, y ∈ R mit 0 < x < y und r ∈ R mit r < 0. Dann gilt xr > y r . Beweis. (i) Es gibt zwei Folgen rationaler Zahlen {rn }n∈N und {sn }n∈N mit r = lim rn s = lim sn . n→∞ n→∞ Außerdem gibt es rationale Zahlen c1 , c2 mit r < c1 < c2 < s. Es gibt ein N ∈ N, so dass für alle n ≥ N rn < c1 sn > c2 Mit Lemma 3.4.6 folgt für alle n ∈ N mit n ≥ N xrn < xc1 < xc2 < xsn . Somit xr = lim xrn ≤ xc1 < xc2 ≤ lim xsn = xs . n→∞ (iii) Es gilt 1 < y . x n→∞ Mit (i) folgt für die Exponenten 0 und r y 0 y r < , 1= x x also xr < y r . 2 Lemma 3.4.10 Es sei x ∈ R mit x > 0 und {rn }n∈N reeller Zahlen mit limn→∞ rn = 0. Dann gilt lim xrn = 1. n→∞ Beweis. Wegen Beispiel 3.4.1 (i) gilt 1 ∀ > 0∃N ∈ N∀n ≥ N : |x n − 1| < und 1 |x− n − 1| < . Wegen limn→∞ rn = 0 ∀n ∈ N∃K ∈ N∀k ≥ K : Mit Lemma 3.4.9 folgt für alle k ≥ K 1 − 1 1 ≤ rk ≤ . n n 1 x− n ≤ xrk ≤ x n und damit Insgesamt erhalten wir 2 1 1 x− n − 1 ≤ xrk − 1 ≤ x n − 1. |xrk − 1| < . 3.4. POTENZ, EXPONENTIALFUNKTION UND LOGARITHMUS 153 Definition 3.4.3 Es sei a > 0. Die Exponentialfunktion expa : R → R zur Basis a ist durch expa (x) = ax definiert. Lemma 3.4.11 (i) Es sei a ∈ R mit a > 0 und a 6= 1. Die Exponentialfunktion expa : R → R mit expa (x) = ax ist auf R streng monoton und stetig. (ii) Es sei r ∈ R mit r 6= 0. Die Potenzfunktion pr : (0, ∞) → R mit pr (x) = xr ist auf (0, ∞) streng monoton und stetig. Beweis. (i) Wir weisen die Stetigkeit nach. Mit Lemma 3.4.10 folgt der Fall t = 0. Es sei nun t beliebig. Dann gilt limn→∞ (tn − t) = 0. Mit Satz 3.4.1 atn = a(tn −t)+t = atn −t · at und somit lim atn = lim (atn −t · at ) = at lim xtn −t = at . n→∞ n→∞ n→∞ Die strenge Monotonie der Exponentialfunktion folgt aus Lemma 3.4.9. (ii) Die strikte Monotonie folgt aus Lemma 3.4.9. Weiter gilt xr = er ln x . Da die Exponentialfunktion und Logarithmus stetig sind, ist auch eine Zusammensetzung dieser Funktionen stetig. 2 Lemma 3.4.12 Die Umkehrfunktion von expa existiert und ist auf (0, ∞) definiert und stetig. Wir nennen die Umkehrfunktion den Logarithmus zur Basis a und schreiben loga . Wir nennen den Logarithmus zur Basis e = limn→∞ (1 + n1 )n den natürlichen Logarithmus und schreiben für loge den Ausdruck ln. Korollar 3.4.1 (i) Für alle x, y > 0 gilt loga (x · y) = loga x + loga y. (ii) Für alle x > 0 und alle y ∈ R gilt loga xy = y loga x. (iii) loga (a) = 1. 154 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Beweis. (i) Wir setzen x = av und y = aw . Dann gilt loga (x · y) = loga (av · aw ) = loga (av+w ) = v + w = loga x + loga y. 2 Lemma 3.4.13 Es sei {xn }n∈N eine Folge mit limn→∞ xn = 0 und 1 + xn > 0, xn 6= 0 für alle n ∈ N. Dann gilt 1 lim (1 + xn ) xn = e n→∞ Beweis. Wir benutzen die Definition n 1 e = lim 1 + n→∞ n und 1 . N O.E.d.A. können wir annehmen, dass für alle n ∈ N die Ungleichung 0 < |xn | < 1 gilt. Dann gibt es zu jedem n ∈ N ein kn ∈ N mit ∀N ∈ N ∃M ∈ N ∀n ≥ M : |xn | < 1 1 ≤ |xn | < . kn + 1 kn Dann gilt für xn > 0 1+ 1 kn + 1 kn ≤ (1 + xn ) 1 xn k +1 1 n ≤ 1+ . kn 2 Korollar 3.4.2 Für alle x ∈ R gilt lim n→∞ 1+ x n = ex n Beweis. Falls x = 0, dann gelten n 0 1+ =1 n Falls x 6= 0, so gilt für fast alle n x <1 n 1 = e0 . und bzw. 1+ x > 0. n Außerdem ist xn = nx , n ∈ N, eine gegen 0 konvergente Folge. Mit Lemma 3.4.13 folgt 1 x nx x n x e = lim 1 + = lim 1 + . n→∞ n→∞ n n 2 3.4. POTENZ, EXPONENTIALFUNKTION UND LOGARITHMUS 155 Beispiel 3.4.2 (i) (iv) 1 lim n n = 1 n→∞ lim n 1 ln n n→∞ n1 1 =1 n→∞ n (ii) =e (iii) lim n o 1 n (ln n)2 (v) 1 lim (n2 ) n = 1 n→∞ (vi) n∈N ln n n Beweis. (i) Es gilt wegen Beispiel 1.10.8 n X k n 2 2 n 2 n(n − 1) 4 √ √ 1+ = > 1 + n√ + > 2 + 2(n − 1) = 2n. k 2 n n n n k=0 Somit gilt für alle n ∈ N Also gilt für alle n ∈ N 1 2 nn ≤ 1 + √ . n 1 1 2 |n n − 1| = n n − 1 ≤ √ n Es folgt 1 lim n n = 1. n→∞ (ii) und (iii) folgen aus (i). (iv) gilt, weil für alle n ∈ N gilt n = eln n . (v) Es gilt 1 1 n (ln n)2 = e ln n . Weiter gilt limn→∞ 1 ln n = 0. Mit der Stetigkeit der e-Funktion folgt 1 lim n (ln n)2 = 1. n→∞ (vi) Es gilt für alle n ∈ N 1 nn = e ln n n und somit wegen (i) 1 1 = lim n n = lim e n→∞ ln n n n→∞ . Da der Logarithmus eine stetige Funktion ist, folgt ln n ln n 0 = ln 1 = ln lim e n = lim . n→∞ n→∞ n 2 Beispiel 3.4.3 (i) Die Reihe ∞ X 1 n(ln n) n=2 divergiert. (ii) Die Reihe ∞ X 1 n(ln n)2 n=2 konvergiert. (iii) Die Reihe ∞ X 1 n(ln n)(ln(ln n)) n=3 n∈N 156 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN divergiert. (iv) Die Reihe ∞ X 1 n(ln n)(ln(ln n))2 n=3 konvergiert. Beweis. (i) Nach dem Verdichtungskriterium von Cauchy (Lemma 2.6.2) konvergiert die Reihe P∞ 1 n=2 n ln(n) genau dann, wenn die Reihe ∞ X k=1 ∞ ∞ k=1 k=1 X 1 1 X1 2k = = 2k ln(2k ) k ln 2 ln 2 k P∞ konvergiert. Die Reihe k=1 k1 divergiert. P∞ 1 (ii) Nach dem Verdichtungssatz konvergiert die Reihe n=2 n(ln n)2 genau dann, wenn die Reihe ∞ ∞ ∞ X X 1 X 1 1 2k = = 2k (ln(2k ))2 k 2 (ln 2)2 (ln 2)2 k2 k=1 k=1 k=1 P∞ 1 k=1 k2 konvergiert. Die Reihe konvergiert. P∞ (iii) Nach dem Verdichtungssatz konvergiert die Reihe n=3 die Reihe ∞ X k=2 1 n(ln n)(ln(ln n)) ∞ ∞ k=2 k=2 genau dann, wenn X 1 1 X 2k 1 = = k k k 2 (ln 2 )(ln(ln 2 )) k(ln 2)(ln k(ln 2)) ln 2 k(ln k + ln(ln 2)) konvergiert. Die letzte Reihe konvergiert genau dann, wenn die Reihe ∞ X k=2 1 k(ln k) konvergiert. Nach (i) divergiert diese Reihe. (iv) ∞ X k=3 ∞ ∞ k=3 k=3 2k 1 X 1 1 X 1 = = k k k 2 2 2 (ln 2 )(ln(ln 2 )) (ln 2) k(ln k(ln 2)) (ln 2) k(ln k + ln(ln 2))2 Diese Reihe konvergiert genau dann, wenn die Reihe ∞ X k=3 1 k(ln k)2 konvergiert. Nach (ii) konvergiert diese Reihe. 2 Beispiel 3.4.4 Die Folge s r q √ xn = 1! 2! 3! · · · n! konvergiert. n∈N 3.5. DIFFERENZIERBARE FUNKTIONEN 157 Beweis. Wir zeigen, dass die Folge {xn }n∈N monoton wachsend und nach oben beschränkt ist. xn = n Y 1 (k!) 2k < n+1 Y 1 (k!) 2k = xn+1 k=1 k=1 Damit ist die Folge monoton wachsend. xn = n Y (k!) 1 2k k=1 ≤ n Y (k) k=1 k 2k = n Y k=1 ! n X k ln k k exp (ln k) k = exp 2 2k k=1 Es bleibt zu zeigen, dass ∞ X k ln k k=1 2k konvergiert. Dazu verwenden wir das Quotientenkriterium. (k+1) ln(k+1) 2k+1 k ln k 2k 1 (k + 1) ln(k + 1) 1 = = 2 k ln k 2 ln(1 + k1 ) 1 1+ 1+ k ln k Für hinreichend großes k gilt (k+1) ln(k+1) 2k+1 k ln k 2k ≤ 3 . 4 2 3.5 Differenzierbare Funktionen Wir wollen hier Funktionen betrachten, deren Graph eindeutige Tangenten besitzen. Wir wollen die Steigung dieser Tangente berechnen, d.h. die Steigung der Kurve in dem Punkt der Tangente berechnen. Diese Steigung werden wir als Ableitung der Funktion bezeichnen. Anschaulich ist eine Funktion in einem Punkt differenzierbar, wenn ihr Graph eine eindeutige Tangente besitzt. So ist eine Funktion, deren Graph eine Ecke besitzt, nicht differenzierbar. Ebenso ist eine Funktion nicht differenzierbar, wenn sie einen Sprung besitzt. Intuitiv mag man annehmen, dass jede stetige Funktion ”fast überall” differenzierbar ist. Dazu lassen sich aber Beispiel konstruieren, die dies widerlegen. Zuallererst eine stetige Funktion, die in keinem Punkt differenzierbar ist (Beispiel 3.12.3, Beispiel 5.10.1). Darüber hinaus kann man sich die Frage stellen, inwieweit man vorschreiben kann, wo eine stetige Funktion differenzierbar ist und wo nicht? Dazu das Beispiel einer stetigen Funktion, die in allen irrationalen Punkten differenzierbar ist und in allen rationalen Punkten nicht differenzierbar ist (Beispiel 5.4.2). Die Cantor Funktion (Beispiel 5.3.2) ist eine wachsende, stetige Funktion, die in allen Punkten der Cantor Menge nicht differenzierbar ist und in allen anderen Punkten differenzierbar. 158 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Definition 3.5.1 Es sei I ein Intervall in R und f : I → R eine Funktion. f heißt in x0 ∈ I differenzierbar, falls der Grenzwert (3.7) lim x→x0 existiert. f (x) − f (x0 ) x − x0 In dieser Form erscheint die Definition durchgängig in der Literatur. Wir wollen noch limx→x0 entsprechend interpretieren und die Definition genauer aufschreiben. Definition 3.5.2 Es sei I ein Intervall in R und f : I → R eine Funktion. f heißt in x0 ∈ I differenzierbar, falls ein η ∈ R existiert, so dass für alle Folgen {xn }n∈N ⊂ I mit limn→∞ xn = x0 und xn 6= x0 für alle n ∈ N f (xn ) − f (x0 ) =η n→∞ xn − x0 (3.8) lim gilt. Die Differenzierbarkeit von f in x0 in Quantorenschreibweise ist f (xn ) − f (x0 ) lim ∃η ∈ R∀{xn }n∈N , lim xn = x0 ∧ ∀n ∈ N : xn 6= x0 : =η n→∞ n→∞ xn − x0 bzw. ∃η ∈ R∀{hn }n∈N , lim hn = 0 ∧ ∀n ∈ N : hn 6= 0 : n→∞ f (x0 + hn ) − f (x0 ) = η. n→∞ hn lim Bemerkung 3.5.1 (i) Es sei I ein Intervall und f : I → R eine Funktion. f ist genau dann in x0 ∈ I differenzierbar, wenn es ein η ∈ R gibt, so dass die Funktion g : I → R mit f (x)−f (x0 ) x 6= x0 x−x0 (3.9) g(x) = η x = x0 in x0 stetig ist. (ii) Es sei I ein Intervall und f : I → R eine Funktion. f ist genau dann in x0 ∈ I differenzierbar, wenn es ein η ∈ R gibt, so dass für alle > 0 ein δ > 0 gibt, so dass für alle x mit |x − x0 | < δ gilt f (x) − f (x0 ) < . − η x − x0 In Quantorenschreibweise: ∃η ∈ R∀ > 0∃δ > 0∀x, |x − x0 | < δ : f (x) − f (x0 ) < . − η x − x0 (iii) Es sei I ein Intervall, x0 ∈ I, und δ > 0 mit (x0 − δ, x0 + δ) ⊆ I. Eine Funktion f : I → R ist genau dann in x0 differenzierbar, wenn die Einschränkung f|(x0 −δ,x0 +δ) : (x0 − δ, x0 + δ) → R von f in x0 differenzierbar ist. Wenn die beiden Ableitungen existieren, dann sind sie gleich. 3.5. DIFFERENZIERBARE FUNKTIONEN 159 Beweis. (i) Falls f in x0 differenzierbar ist, dann gibt es ein η ∈ R mit lim x→x0 f (x) − f (x0 ) = η. x − x0 Damit ist g in x0 stetig. Wenn andererseits g in x0 stetig ist, dann gilt (3.8) und f ist differenzierbar. (ii) Nach (i) ist die Stetigkeit von g in x0 äquivalent zur Differenzierbarkeit von f in x0 . Die Stetigkeit von g in x0 ist die Annahme in (ii). (iii) Falls f in x0 differenzierbar ist, dann gibt es ein η ∈ R, so dass für alle Folgen {xn }n∈N ⊂ I mit limn→∞ xn = x0 und xn 6= x0 für alle n ∈ N f (xn ) − f (x0 ) =η n→∞ xn − x0 lim gilt. Insbesondere gilt dies für alle Folgen, die in (x0 − δ, x0 + δ) enthalten sind. Damit ist f|(x0 −δ,x0 +δ) in x0 differenzierbar und die Ableitung gleich η. Falls f|(x0 −δ,x0 +δ) in x0 differenzierbar ist, dann gibt es ein η ∈ R, so dass für alle Folgen {xn }n∈N ⊂ (x0 − δ, x0 + δ) mit limn→∞ xn = x0 und xn 6= x0 für alle n ∈ N f (xn ) − f (x0 ) =η n→∞ xn − x0 lim gilt. Wenn wir nun eine Folge {xn }n∈N ⊂ I mit limn→∞ xn = x0 und xn 6= x0 für alle n ∈ N betrachten, dann gibt es ein n0 ∈ N, so dass {xn }∞ n=n0 ⊂ (x0 − δ, x0 + δ). Nach Annahme gilt f (xn ) − f (x0 ) = η. lim n→∞ xn − x0 2 Wir bezeichnen den Grenzwert (3.7) mit df (x0 ) dx und f 0 (x0 ). Wir nennen diesen Grenzwert die Ableitung von f im Punkt x0 . Falls x0 linker bzw. rechter Endpunkt von I ist, so heißt f in x0 rechtsseitig bzw. linksseitig differenzierbar. Falls f auf I differenzierbar ist, so heißt die Funktion f 0 : I → R, die jedem x ∈ I die Ableitung von f in diesem Punkt zuordnet die Ableitung von f . Falls f 0 auf I stetig ist, so heißt f auf I stetig differenzierbar. Die höheren Ableitungen sind durch f 00 = (f 0 )0 und f (n) = (f (n−1) )0 n ∈ N definiert. Beispiel 3.5.1 (i) f : R → R, f (x) = c. Dann gilt f 0 (x) = 0. (ii) f : R → R, f (x) = xm , m ∈ N. Dann gilt f 0 (x) = mxm−1 . 160 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN (iii) f : (0, ∞) → R, f (x) = ln x. Dann gilt f 0 (x) = 1 . x (iv) f : (0, ∞) → R, f (x) = loga x. Dann gilt f 0 (x) = 1 1 = loga e . x ln a x (v) f : R → R, f (x) = |x|. Dann ist f nicht in 0 differenzierbar. Beweis. (i) f 0 (x0 ) = lim x→x0 f (x) − f (x0 ) 0 = lim =0 x→x0 x − x0 x − x0 (ii) Wir setzen x = x0 + h. Mit der binomischen Formel (Beispiel 1.10.8) folgt f 0 (x0 ) = = = f (x0 + h) − f (x0 ) f (x) − f (x0 ) = lim h→0 x − x0 h (m ) 1 X m m−k k 1 m m m x0 h − x0 lim {(x0 + h) − x0 } = lim h→0 h h→0 h k k=0 m m X 1 X m m−k k m m−k k−1 lim x0 h = lim x0 h = mxm−1 0 h→0 h h→0 k k lim x→x0 k=1 k=1 (iii) Wir setzen x = x0 + h. f 0 (x0 ) f (x) − f (x0 ) f (x0 + h) − f (x0 ) = lim h→0 x − x0 h 1 = lim {ln(x0 + h) − ln x0 } h→0 h = lim x→x0 D.h. dass für alle Folgen {hn }n∈N mit limn→∞ hn = 0 und mit hn 6= 0 für alle n ∈ N f 0 (x0 ) = lim n→∞ 1 {ln(x0 + hn ) − ln x0 } hn gelten muss. Wir führen die Rechnung fort 0 f (x0 ) = lim n→∞ ln(1 + hn hn x0 ) x0 ! 1 x0 hn 1 hn hn = lim ln 1 + = lim ln 1+ . n→∞ x0 hn n→∞ x0 x0 x0 Da der Logarithmus eine stetige Funktion ist, gilt weiter 1 f (x0 ) = ln x0 0 x0 ! hn hn lim 1 + . n→∞ x0 Nach Lemma 3.4.13 und Korollar 3.4.1 f 0 (x0 ) = Insgesamt erhalten wir ln0 (x0 ) = (iv) Wir benutzen 1 1 ln e = . x0 x0 1 x0 . loga x = ln x . ln a 3.5. DIFFERENZIERBARE FUNKTIONEN 161 Diese Gleichung folgt aus x = aloga x . (v) f differenzierbar in x0 bedeutet ∃η ∈ R ∀{hn }n∈N , lim hn = 0 : n→∞ f (x0 + hn ) − f (x0 ) = η. n→∞ hn lim f ist nicht in x0 differenzierbar heißt ∀η ∈ R ∃{hn }n∈N , lim hn = 0 : n→∞ lim n→∞ f (x0 + hn ) − f (x0 ) 6= η. hn In dem vorliegenden Beispiel ist x0 = 0. Wir betrachten zuerst den Fall, dass η ≤ 0. Wir wählen hn = n1 , n ∈ N. Dann gilt 1 −0 f (x0 + n1 ) − f (x0 ) = n 1 = 1. 1 n n Für η ≥ 0 wählen wir hn = − n1 . Dann erhalten wir 1 f (x0 − n1 ) − f (x0 ) n −0 = = −1. − n1 − n1 2 Satz 3.5.1 Es sei I ein Intervall und f : I → R sei differenzierbar in x0 . Dann ist f stetig in x0 . Beweis. Es sei {xn }n∈N eine Folge mit limn→∞ xn = x0 und mit xn 6= x0 für fast alle n ∈ N. Da f in x0 differenzierbar ist, folgt f (xn ) − f (x0 ) = f 0 (x0 ). n→∞ xn − x0 lim Hieraus folgt lim (xn − x0 ) n→∞ Es folgt f (xn ) − f (x0 ) = lim f 0 (x0 )(xn − x0 ) = 0. n→∞ xn − x0 lim (f (xn ) − f (x0 )) = 0. n→∞ und damit lim f (xn ) = f (x0 ). n→∞ für alle Folgen mit limn→∞ xn = x0 und mit xn 6= x0 für alle n ∈ N. Es bleibt zu zeigen, dass wir auf die Einschränkung xn 6= x0 für fast alle n ∈ N verzichten können. Falls für fast alle n ∈ N die Gleichung xn = x0 gilt, gilt offensichtlich limn→∞ f (xn ) = f (x0 ). Wir betrachten nun die Teilfolge {xnk }k∈N mit xnk 6= x0 für alle k ∈ N (für alle anderen xn gelte xn = x0 ). Nach obigem Argument gilt lim f (xnk ) = f (x0 ). k→∞ Deshalb hat die Folge {f (xnk )}k∈N genau einen Häufungswert, nämlich f (x0 ). Folglich hat die Folge {f (xn )}n∈N auch nur den Häufungswert f (x0 ) Nach Lemma 2.5.1 konvergiert die Folge gegen f (x0 ). 2 162 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Bemerkung 3.5.2 (i) Aus der Stetigkeit folgt nicht die Differenzierbarkeit. Ein Beispiel dafür ist die Funktion f (x) = |x| im Punkt 0 (Beispiel 3.5.1). (ii) Es gibt Funktionen, die auf einem Intervall stetig sind, aber in keinem Punkt differenzierbar (Beispiel 5.10.1). (iii) Falls eine Funktion auf einem Intervall differenzierbar ist, so muss die Ableitung nicht stetig sein (Beispiel 3.5.3). Lemma 3.5.1 Es seien f, g : I → R Funktionen, die in x0 differenzierbar sind. Dann gelten (i) f + g ist in x0 differenzierbar und (f + g)0 (x0 ) = f 0 (x0 ) + g 0 (x0 ). (ii) (Produktregel) f · g ist in x0 differenzierbar und (f · g)0 (x0 ) = f 0 (x0 ) · g(x0 ) + f (x0 ) · g 0 (x0 ). (iii) (Quotientenregel) Ist g 6= 0 auf dem Intervall I, so existiert in x0 differenzierbar. Es gilt 0 f 0 (x0 ) · g(x0 ) − f (x0 ) · g 0 (x0 ) f (x0 ) = . g (g(x0 ))2 f g auf I und f g ist Beweis. (ii) Es sei {xn }n∈R eine reelle Folge mit limn→∞ xn = x0 und xn 6= x0 für alle n ∈ N. Es gilt f (xn ) · g(xn ) − f (x0 ) · g(x0 ) xn − x0 f (xn ) · g(xn ) − f (xn ) · g(x0 ) f (xn ) · g(x0 ) − f (x0 ) · g(x0 ) = + xn − x0 x n − x0 f (xn ) − f (x0 ) g(xn ) − g(x0 ) + g(x0 ) . = f (xn ) xn − x0 xn − x 0 Da f differenzierbar ist, ist f insbesondere stetig (Satz 3.5.1). Somit folgt aus der Differenzierbarkeit von f und g lim f (xn ) n→∞ lim g(x0 ) n→∞ Also gilt lim n→∞ 2 g(xn ) − g(x0 ) = f (x0 )g 0 (x0 ) xn − x0 f (xn ) − f (x0 ) = f 0 (x0 )g(x0 ) xn − x0 f (xn ) · g(xn ) − f (x0 ) · g(x0 ) = f (x0 ) · g 0 (x0 ) + f 0 (x0 ) · g(x0 ). xn − x0 3.5. DIFFERENZIERBARE FUNKTIONEN 163 Beispiel 3.5.2 (i) Es sei pn : R → R die n-te Potenzfunktion, die durch pn (x) = xn definiert ist. Dann gilt (pn )0 (x) = nxn−1 . (ii) Alle Polynome p : R → R mit p(x) = n X ak xk k=0 sind auf R differenzierbar. (iii) Alle rationalen Funktionen p q sind auf R \ {x|q(x) = 0} differenzierbar. Beweis. (i) Wir haben diese Aussage in Beispiel 3.5.1 bereits bewiesen. Dabei haben wir die binomische Formel benutzt. Wir wollen hier die Aussage beweisen, ohne die binomische Formel zu benutzen. Wir verwenden Induktion. Wir zeigen die Aussage für n = 1: lim x→x0 p1 (x) − p1 (x0 ) x − x0 = lim = 1. x→x0 x − x0 x − x0 Wir nehmen an, wir haben bereits (pn )0 (x) = nxn−1 gezeigt. Mit der Produktregel (Lemma 3.5.1) folgt (pn+1 )0 (x) = (pn · p1 )0 (x) = (pn )0 (x)p1 (x) + pn (x)(p1 )0 (x) = nxn−1 · x + xn = (n + 1)xn . (ii) Nach (i) sind alle Monome bzw. Potenzfunktionen auf R differenzierbar. Nach Lemma 3.5.1 auch Summen von Monomen. (iii) Es sei x0 ein Punkt mit q(x0 ) 6= 0. Da q stetig ist, gibt es ein Intervall [x0 − , x0 + ] auf dem q von 0 verschieden ist. Nun wenden wir (ii) und die Quotientenregel an (Lemma 3.5.1). 2 Satz 3.5.2 (Kettenregel) Es seien I und J Intervalle und f : I → J und g : J → R Funktionen, die in x0 bzw. f (x0 ) differenzierbar sind. Dann ist g ◦ f in x0 differenzierbar und es gilt (g ◦ f )0 (x0 ) = g 0 (f (x0 )) · f 0 (x0 ). Beweis. Es sei {xn }n∈R eine reelle Folge mit limn→∞ xn = x0 und mit xn = 6 x0 für alle n ∈ N. Da f in x0 differenzierbar ist, so ist f auch in x0 stetig und es gilt lim f (xn ) = f (x0 ). n→∞ Wir betrachten drei Fälle. Falls für fast alle n ∈ N gilt, dass f (xn ) 6= f (x0 ), dann gibt es ein N , so dass für alle n > N g(f (xn )) − g(f (x0 )) f (xn ) − f (x0 ) (g ◦ f )(xn ) − (g ◦ f )x0 = xn − x0 f (xn ) − f (x0 ) xn − x0 gilt. Da g differenzierbar und f stetig ist, gilt g(f (xn )) − g(f (x0 )) = g 0 (f (x0 )). n→∞ f (xn ) − f (x0 ) lim 164 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Insgesamt erhalten wir (g ◦ f )(xn ) − (g ◦ f )(x0 ) = g 0 (f (x0 ))f 0 (x0 ) . n→∞ xn − x0 lim Der zweite Fall ist, dass für fast alle n ∈ N gilt f (xn ) = f (x0 ). Dann gibt es ein N ∈ N, so dass für alle n ≥ N gilt f (xn ) = f (x0 ). Deshalb (g ◦ f )(xn ) − (g ◦ f )(x0 ) = 0. n→∞ xn − x0 lim Andererseits gilt auch f (xn ) − f (x0 ) = 0. n→∞ xn − x0 f 0 (x0 ) = lim Es folgt (g ◦ f )(xn ) − (g ◦ f )(x0 ) = 0 = g 0 (f (x0 ))f 0 (x0 ) . n→∞ x n − x0 Nun der dritte Fall: Es gibt unendlich viele n ∈ N mit f (xn ) = f (x0 ) und unendlich viele n ∈ N mit f (xn ) 6= f (x0 ). Also gibt es eine Teilfolge {xnk }k∈N mit f (xnk ) = f (x0 ) für alle k ∈ N. Es folgt lim f (xnk ) − f (x0 ) = 0. k→∞ xnk − x0 f 0 (x0 ) = lim (3.10) Ebenso erhalten wir (3.11) lim k→∞ (g ◦ f )(xnk ) − (g ◦ f )(x0 ) = 0. xnk − x0 Wir wollen uns nun überlegen, dass (g ◦ f )(xn ) − (g ◦ f )(x0 ) n→∞ xn − x0 lim existiert. Wir nehmen dazu an, dass die Folge (g ◦ f )(xn ) − (g ◦ f )(x0 ) (3.12) xn − x0 n∈N nicht konvergiert. Falls sie beschränkt ist, dann hat sie nach Lemma 2.5.6 zwei Häufungswerte. Wegen (3.11) ist einer der Häufungswerte 0. Also gibt es wegen Lemma 2.5.1 eine Teilfolge (g ◦ f )(xmj ) − (g ◦ f )(x0 ) xmj − x0 j∈N die gegen eine Häufungswert η konvergiert, der verschieden von 0 ist. Dies bedeutet aber, dass fast alle Folgenglieder verschieden von 0 sind und wir können wie im ersten Fall schließen, dass (g ◦ f )(xmj ) − (g ◦ f )(x0 ) = g 0 (f (x0 ))f 0 (x0 ) . j→∞ xmj − x0 lim 3.5. DIFFERENZIERBARE FUNKTIONEN 165 Wegen (3.10) folgt (g ◦ f )(xmj ) − (g ◦ f )(x0 ) = 0, j→∞ xm j − x0 lim was nicht sein kann, da der Grenzwert nicht 0 ist. Es bleibt der Fall, dass die Folge (3.12) unbeschränkt ist. Dann gibt es eine Teilfolge (g ◦ f )(xk` ) − (g ◦ f )(x0 ) , xk ` − x0 `∈N so dass für alle ` ∈ N 1≤ (g ◦ f )(xk` ) − (g ◦ f )(x0 ) xk` − x0 `∈N gilt. Nun können wir wieder wie im ersten Fall argumentieren und erhalten (g ◦ f )(xk` ) − (g ◦ f )(x0 ) = g 0 (f (x0 ))f 0 (x0 ) . `→∞ xk ` − x0 lim Damit konvergiert diese Teilfolge und ist nicht unbeschränkt. 2 Satz 3.5.3 Es seien I und J Intervalle und f : I → J sei eine Funktion, die in x0 differenzierbar sei und für die f (I) = J gilt. Es gelte f 0 (x0 ) 6= 0 und es existiere die Umkehrfunktion f −1 : J → I. Dann ist f −1 in f (x0 ) differenzierbar und es gilt (f −1 )0 (f (x0 )) = 1 f 0 (x 0) . Beweis. Es sei {yn }n∈N eine Folge in J mit limn→∞ yn = y0 und yn 6= y0 für n ∈ N. Wir setzen xn = f −1 (yn ) für n = 0, 1, 2, . . . . Dann gilt für alle n ∈ N mit xn 6= x0 , weil f und f −1 injektiv sind. Weiter gilt f −1 (yn ) − f −1 (y0 ) f −1 (f (xn )) − f −1 (f (x0 )) xn − x0 = = = yn − y0 f (xn ) − f (x0 ) f (xn ) − f (x0 ) 1 f (xn )−f (x0 ) xn −x0 . Deswegen erhalten wir f −1 (yn ) − f −1 (y0 ) = lim n→∞ n→∞ yn − y0 lim 2 1 f (xn )−f (x0 ) xn −x0 = 1 . f 0 (x0 ) Bemerkung 3.5.3 Es sei I ein Intervall R, es sei x0 ∈ I, wobei x0 kein Randpunkt des Intervalls sei, und f : I → R. Wir sagen, dass f in x0 linksseitig differenzierbar ist, wenn g : I ∩ (−∞, x0 ] → R mit g(x) = f (x) in x0 differenzierbar ist. Wir bezeichnen die Ableitung von g in x0 als die linksseitige Ableitung von f . Entsprechend definiert man die rechtsseitige Differenzierbarkeitkeit . Eine Funktion ist genau dann in x0 differenzierbar ist, wenn sie in x0 links- und rechtsseitig differenzierbar ist und die linksseitige Ableitung gleich der rechtsseitigen ist. 166 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Beweis. Es sei f in x0 differenzierbar. Dann gilt für alle Folgen {xn }n∈N ⊂ I f (xn ) − f (x0 ) = f 0 (x0 ). n→∞ xn − x0 lim Insbesondere gilt diese Gleichung für alle Folgen {xn }n∈N ⊂ I ∩ (−∞, x0 ]. Deshalb existiert die linksseitige Ableitung von f in x0 und ist gleich f 0 (x0 ). Genauso verfahren wir bei der rechtsseitigen Ableitung. Wir nehmen nun an, dass f links- und rechtsseitig in x0 differenzierbar ist und die Ableitungen gleich sind. Wir bezeichnen die links- bzw. rechtsseitige Ableitung in x0 mit η. Deshalb ist die Funktion g : I → R mit (3.13) g(x) = f (x)−f (x0 ) x−x0 η x 6= x0 x = x0 sowohl links- wie auch rechtsseitig stetig. Nach Aufgabe ist die Funktion dann in x0 stetig. Damit ist f in x0 differenzierbar. 2 Das nächste Beispiel zeigt, dass die Ableitung einer differenzierbaren Funktion nicht stetig sein muss. Beispiel 3.5.3 Es sei f : [−1, 1] → R durch f (x) = x2 cos π x2 falls x ∈ [−1, 1] und x 6= 0 0 falls x = 0 gegeben. Dann ist f auf [−1, 1] differenzierbar und f 0 ist in 0 unstetig. Wir werden dieses Beispiel beweisen, wenn wir Sinus und Cosinus eingeführt haben. Dies geschieht als Beispiel 3.10.2. Beispiel 3.5.4 (i) exp : R → R mit exp(x) = ex ist auf R differenzierbar und exp0 = exp. (ii) Es sei a > 0. Dann ist expa : R → R mit expa (x) = ax auf R differenzierbar und exp0a = (ln a) expa . (iii) Es seien α ∈ R und f : (0, ∞) → R, f (x) = xα . Die Funktion f ist auf (0, ∞) differenzierbar und es gilt (xα )0 = αxα−1 . (iv) Es sei f : [0, ∞) → R ( f (x) = 1 x falls x = 0 x falls x > 0 f ist differenzierbar auf (0, ∞) und f 0 (x) = xx (1 + ln x). 3.6. DER SATZ VON ROLLE UND DER MITTELWERTSATZ 167 2 1.8 1.6 1.4 1.2 0.5 1 1.5 2 0.8 Beweis. (i) ln ist auf (0, ∞) differenzierbar und exp ist die Umkehrfunktion. Nach Satz 3.5.3 gilt (f −1 )0 (f (x)) = 1 . f 0 (x) Also gilt für f mit f (x) = ln x (f −1 )0 (ln x) = 1 = x. f 0 (x) Mit y = ln x folgt (f −1 )0 (y) = ey . (ii) Es gilt x ax = eln(a ) = ex ln a . (iii) Da der Logarithmus ln und die e-Funktion differenzierbar sind, ist auch die zusammengesetzte Funktion α xα = eln(x ) = eα ln x nach der Kettenregel differenzierbar und es gilt (xα )0 = (eα ln x )0 = eα ln x (α ln x)0 = α α ln x xe = α α xx = αxα−1 . (iv) Wir verwenden die Gleichung x xx = eln x = ex ln x . 2 3.6 Der Satz von Rolle und der Mittelwertsatz Michel Rolle (ausgesprochen: Roll) wurde am 21.4.1652 in Ambert in der Auvergne geboren. Er war Sohn eines Krämers und erhielt nur eine elementare Ausbildung und arbeitete zunächst als Schreiber. Er ging 1675 nach Paris und wurde Hauslehrer. Ab 1699 erhielt er als Mitglied der Pariser Akademie ein reguläres Gehalt. Er arbeitete vorwiegend auf dem Gebiet der Algebra. Er starb am 8.11.1719 in Paris. 168 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Definition 3.6.1 Es sei X ⊆ R und f : X → R. Wir sagen, dass f in x0 ein lokales Maximum (Minimum) hat, wenn es ein δ > 0 gibt, so dass für alle x ∈ X mit |x − x0 | < δ f (x) ≤ f (x0 ) (f (x) ≥ f (x0 )) gilt. Wir sagen, dass f ein lokales Extremum besitzt, falls es ein lokales Minimum oder Maximum besitzt. Wir bezeichnen ein lokales Extremum auch als relatives Extremum. Lemma 3.6.1 Es sei f : [a, b] → R in x0 ∈ (a, b) differenzierbar. Hat f in x0 ein lokales Extremum, so gilt f 0 (x0 ) = 0 . Beweis. f habe in x0 ein lokales Maximum. Dann gilt ∃N ∈ N ∀n > N : f (x0 + n1 ) ≤ f (x0 ) und f (x0 − n1 ) ≤ f (x0 ). Hieraus folgen 0 f (x0 ) = f 0 (x0 ) = lim n→∞ f (x0 + n1 ) − f (x0 )) 1 n ≤0 f (x0 − n1 ) − f (x0 )) ≥ 0. n→∞ − n1 lim Also gilt f 0 (x0 ) = 0. Für ein lokales Minimum wird genauso argumentiert. 2 Satz 3.6.1 (Rolle) Es sei f : [a, b] → R auf [a, b] stetig und auf (a, b) differenzierbar. Es gelte f (a) = f (b). Dann gibt es mindestens ein ξ ∈ (a, b) mit f 0 (ξ) = 0. Ein Beispiel für den Satz von Rolle ist f : [−1, 1] → R mit f (x) = x2 . Es gilt f (−1) = f (1) = 1 und f 0 (0) = 0. Beweis. Falls f auf [a, b] konstant ist, dann gilt für alle x ∈ (a, b), dass f 0 (x) = 0. Wir können also annehmen, dass es mindestens einen Punkt gibt, an dem der Wert von f nicht gleich f (a) = f (b) ist. Da f stetig ist, nimmt f auf [a, b] das Minimum in xmin und das Maximum in xmax an. Da f nicht konstant ist, gilt f (xmin ) < f (a) = f (b) oder f (xmax ) > f (a) = f (b). Also gilt xmin ∈ (a, b) oder xmax ∈ (a, b) und wir können Lemma 3.6.1 anwenden. 2 3.6. DER SATZ VON ROLLE UND DER MITTELWERTSATZ 169 Satz 3.6.2 (Mittelwertsatz) Es sei f : [a, b] → R auf [a, b] stetig und auf (a, b) differenzierbar. Dann gibt es mindestens ein ξ ∈ (a, b) mit f 0 (ξ) = f (b) − f (a) . b−a Beweis. Wir definieren F : [a, b] → R durch F (x) = f (x) − f (a) − f (b) − f (a) (x − a). b−a Dann ist F auf [a, b] stetig, auf (a, b) differenzierbar und es gilt F (a) = F (b) = 0. Damit können wir den Satz von Rolle anwenden und es gibt ein ξ ∈ (a, b) mit F 0 (ξ) = 0. Also gilt f (b) − f (a) 0 = F 0 (ξ) = f 0 (ξ) − . b−a 2 0.6 0.4 0.2 -2 -1 1 2 -0.2 -0.4 -0.6 Beispiel 3.6.1 Es sei f : [−1, 1] → R mit f (x) = x3 . Es gilt f (1) − f (−1) = 1. 1 − (−1) Es gibt zwei Punkte ξ = √1 3 und ξ = − √13 mit f 0 (ξ) = 1. Satz 3.6.3 Es sei f : [a, b] → R auf [a, b] stetig und auf (a, b) differenzierbar. Es gelte für alle x ∈ (a, b), dass f 0 (x) = 0. Dann ist f eine konstante Funktion. Beweis. Es sei x ∈ (a, b]. Nach dem Mittelwertsatz (Satz 3.6.2) gibt es ein ξ ∈ (a, x) mit f (x) − f (a) f 0 (ξ) = . x−a Da f 0 (ξ) = 0 gilt, folgt f (x) = f (a). 2 170 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Korollar 3.6.1 Es seien f, g : [a, b] → R auf [a, b] stetig und auf (a, b) differenzierbar. Außerdem gelte für alle x ∈ (a, b), dass f 0 (x) = g 0 (x). Dann gibt es eine Konstante c ∈ R, so dass für alle x ∈ [a, b] f (x) − g(x) = c gilt. Beweis. Wir wenden Satz 3.6.3 auf die Funktion f − g an. 2 Satz 3.6.4 (Verallgemeinerter Mittelwertsatz) Es seien f, g : [a, b] → R auf [a, b] stetig und auf (a, b) differenzierbar. Außerdem gelte für alle x ∈ (a, b), dass g 0 (x) 6= 0. Dann gelten (i) g(a) 6= g(b) (ii) Es gibt ein ξ ∈ (a, b) mit f (b) − f (a) f 0 (ξ) = . 0 g (ξ) g(b) − g(a) Dieser verallgemeinerte Mittelwersatz hat auch eine geometrische Interpretation. Die Kurve φ : [a, b] → R2 mit φ(t) = (f (t), g(t)) besitzt eine Tangente, die parallel zu der Geraden durch die Punkte φ(a) und φ(b) ist. Beweis. (i) Falls g(a) = g(b), dann gibt es nach dem Mittelwertsatz (Satz 3.6.2) ein ξ ∈ (a, b) mit g(b) − g(a) g 0 (ξ) = = 0. b−a (ii) Wir wenden den Satz von Rolle auf die Funktion F : [a, b] → R mit F (x) = f (x) − f (a) − f (b) − f (a) (g(x) − g(a)) g(b) − g(a) an. Die Voraussetzungen des Satzes von Rolle sind erfüllt, weil F (a) = F (b) = 0 gilt. Also gibt es ein ξ ∈ (a, b) mit F 0 (ξ) = 0. Hiermit folgt 0 = F 0 (ξ) = f 0 (ξ) − und damit 2 f (b) − f (a) 0 g (ξ) g(b) − g(a) f 0 (ξ) f (b) − f (a) = . 0 g (ξ) g(b) − g(a) 3.6. DER SATZ VON ROLLE UND DER MITTELWERTSATZ 171 Lemma 3.6.2 Die Funktion f : [a, b] → R sei auf [a, b] stetig und auf (a, b) differenzierbar. (i) Gilt für alle x ∈ (a, b), dass f 0 (x) ≥ 0 (f (x) > 0), dann ist f (strikt) monoton wachsend auf [a, b]. (ii) Gilt für alle x ∈ (a, b), dass f 0 (x) ≤ 0 (f (x) < 0), dann ist f (strikt) monoton fallend auf [a, b]. Beweis. (i) Es sei a ≤ x < y ≤ b. Wir zeigen nun, dass f (x) ≤ f (y). Nach dem Mittelwertsatz gibt es ein ξ ∈ (x, y) mit Also gilt f (y) − f (x) ≥ 0. 2 f (y) − f (x) = f 0 (ξ) ≥ 0. y−x Beispiel 3.6.2 (i) Die Funktion f : [0, 1] → R, f (x) = x2 , ist auf [0, 1] strikt monoton wachsend. (ii) Die Funktion f : [−1, 1] → R, f (x) = x3 , ist auf [−1, 1] strikt monoton wachsend. (iii) exp ist auf R strikt monoton wachsend. (iv) ln ist auf (0, ∞) strikt monoton wachsend. Beweis. (i), (iii) und (iv) folgen unmittelbar aus Lemma 3.6.2. (ii) können wir nicht unmittelbar aus Lemma 3.6.2 folgern, weil f 0 (0) = 0 gilt. Wenn wir jedoch, das Intervall [−1, 1] in zwei Teilintervalle [−1, 0] und [0, 1] zerlegen, können wir Lemma 3.6.2 anwenden. 2 Lemma 3.6.3 (i) Für alle x mit x ∈ (0, 1) gilt ex < 1 . 1−x (ii) Für alle x mit x ∈ (0, ∞) gilt 1 + x < ex . (iii) Für alle x ∈ (0, ∞) gilt x < ln(1 + x) < x. 1+x Beweis. (i) Wir wenden den Mittelwertsatz auf die Funktion f : [0, x] → R, f (t) = et an. Dann gibt es ein ξ ∈ (0, x), so dass f (x) − f (0) = f 0 (ξ) x bzw. ex − 1 = eξ x gilt. Nach Beispiel 3.6.2 ist die e-Funktion streng monoton wachsend. Also gilt eξ < ex . Wir erhalten ex − 1 = eξ < ex . x 172 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Hieraus folgt für alle x ∈ (0, 1) 1 . 1−x (ii) Wir wenden den Mittelwertsatz auf die Funktion f : [0, x] → R, f (t) = et an. Dann gibt es ein ξ ∈ (0, x), so dass ex < f (x) − f (0) = f 0 (ξ) x bzw. ex − 1 = eξ x gilt. Nach Beispiel 3.6.2 ist die e-Funktion streng monoton wachsend. Deshalb gilt eξ > e0 . Wir erhalten ex − 1 = eξ > e0 = 1. x x Es folgt 1 + x < e . (iii) Nach (ii) gilt 1 + x < ex . Wir nehmen auf beiden Seiten den Logarithmus und erhalten ln(1 + x) < x. y 1 . Wir setzen x = 1+y und erhalten Nach (i) gilt ex < 1−x y e 1+y < 1 + y. Nun nehmen wir auf beiden Seiten den Logarithmus. Da der Logarithmus streng monoton wachsend ist, bleibt die Ungleichung erhalten. 2 Beispiel 3.6.3 (Euler-Mascheroni Konstante) [101] Die Folge ( n ) X1 − ln n k k=1 n∈N konvergiert. (Der Grenzwert wird als Euler-Mascheroni Konstante γ bezeichnet und ist verschieden von der Zahl e.) Insbesondere gilt n X 1 1 − ln 2 + ln n ≤ ≤ 1 + ln(n + 1). k k=1 Pn Wir erhalten hier die Größenordnung der Partialsumme k=1 k1 . Dies kann man auch mit Hilfe des Integralkriteriums bekommen (Beispiel 5.13.1). Es ist nicht bekannt, ob die Euler-Mascheroni Konstante rational oder irrational ist. Die Dezimalbruchentwicklung ist γ = 0, 577215664901532...... Lorenzo Mascheroni (Sein Name spricht sich Maskeroni aus) wurde am 13. Mai 1750 bei Bergamo geboren und er starb am 14. Juli 1800 in Paris. Er war Professor an der Universität Pavia und wurde dort Rektor der Universität. Beweis. Wir setzen xn = yn = n X 1 − ln(n + 1) k k=1 n X k=1 1 − ln n k n∈N 3.6. DER SATZ VON ROLLE UND DER MITTELWERTSATZ 173 Wir zeigen, dass die Folge {xn }n∈N monoton wachsend und nach oben beschränkt ist, die Folge {yn }n∈N monoton fallend und nach unten beschränkt ist. Wir zeigen, dass {xn }n∈N monoton wächst. Es gilt genau dann xn ≤ xn+1 , wenn n+1 n X1 X 1 − ln(n + 1) ≤ − ln(n + 2). k k k=1 k=1 Dies äquivalent zu ln(n + 2) − ln(n + 1) ≤ 1 . n+1 Dies wiederum ist äquivalent zu ln n+2 n+1 ≤ 1 . n+1 Wegen Lemma 3.6.3 (iii) gilt aber ln(1 + n1 ) ≤ n1 und die letzte Ungleichung ist wahr. Wir zeigen nun, dass {yn }n∈N monoton fallend ist. Es gilt genau dann yn ≥ yn+1 , wenn n n+1 X X1 1 − ln(n) ≥ − ln(n + 1). k k k=1 k=1 Dies ist äquivalent zu ln n+1 n ≥ 1 . n+1 Diese Ungleichung gilt aber nach Lemma 3.6.3 (iii). Wir zeigen, dass {xn }n∈N nach oben beschränkt ist. Für alle n ∈ N gilt xn < yn . Hiermit folgt für alle n ∈ N, dass xn < yn ≤ y1 = 1. Genauso zeigt man, dass {yn }n∈N nach unten beschränkt ist. Nach Satz 2.3.1 konvergiert eine reelle, nach oben beschränkte, monoton wachsende Folge in R. Wir wollen noch anmerken, dass die beiden Folgen {xn }n∈N und {yn }n∈N gegen denselben Grenzwert konvergieren. Dazu zeigen wir, dass die Folge {xn − yn }n∈N eine Nullfolge ist. Es gilt xn − yn = ln n − ln(n + 1) = − ln(1 + n1 ). Mit Lemma 3.6.3 (iii) folgt 1 1 ≤ ln(1 + n1 ) ≤ . n+1 n Damit ist {ln(1 + n1 )}n∈N eine Nullfolge. 2 Beispiel 3.6.4 [67] Es sei P die Menge der Primzahlen und für alle n ∈ N sei Pn die Menge aller Primzahlen, die kleiner oder gleich n sind. Dann gilt X 1 n ln 1 + ln <2 . 2 p p∈Pn Insbesondere divergiert die Reihe X1 p∈P p . Aus diesem Ergebnis folgt auch, dass es unendlich viele Primzahlen gibt. Beachte auch den Primzahlsatz [102]. Beweis. Mit Beispiel 2.6.1 Y p∈Pn Y p 1 = p−1 1− p∈P n 1 p = ∞ Y X 1 . pk p∈Pn k=0 174 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Wir wollen nun einsehen, dass n ∞ X Y X 1 1 ≥ . k p k p∈Pn k=0 k=1 Dazu schreiben wir die Primzahlen, die kleiner oder gleich n sind, als Produkt von allen Primzahlen p1 , . . . , pjn , die kleiner oder gleich n sind. Es sei k ∈ N mit 1 ≤ k ≤ n. Nach dem Primzahlzerlegungssatz lässt sich k als Produkt von Primzahlen schreiben. Keine dieser Primzahlen kann strikt größer als k sein. Also gibt es Zahlen k1 , . . . , kjn ∈ N0 mit k= jn Y pki i i=1 Wir beobachten, dass alle Zahlen k1 , . . . , kjn kleiner oder gleich n sind. Dies gilt, weil 2 die kleinste Primzahl ist und k ≤ n < 2n gilt. Also gilt jn Y k {1, . . . , n} ⊆ pj j 0 ≤ k1 , . . . , kjn ≤ n j=1 Hiermit folgt −1 jn jn X jn X ∞ ∞ n n Y X Y Y Y X 1 1 1 k pj j . = ≥ = kj kj pk p p j=1 kj =0 j j=1 kj =0 j p∈Pn k=0 k1 ,...,kjn =0 j=1 Also n Y p∈Pn X1 p > . p−1 k k=1 Weiter folgt ln Y p∈Pn ! n X 1 p > ln . p−1 k k=1 Mit Lemma 3.6.3 folgt ! n X X p X 2 X X 1 1 1 ln < ln = ln 1 + ≤ ≤ . k p−1 p−1 p−1 p k=1 p∈Pn Mit Beispiel 3.6.3 p∈Pn p∈Pn X 2 n ln 1 + ln . < 2 p p∈Pn 2 π(n) ist die Anzahl der Primzahlen, die kleiner oder gleich n sind. Beispiel 3.6.5 [117] Es gibt ein n0 ∈ N, so dass für alle n ≥ n0 2 n n ≤ π(n) ≤ 1, 7 3 ln n ln n gilt. Tatsächlich kann man zeigen, dass lim n π(n) n ln n = 1. p∈Pn 3.6. DER SATZ VON ROLLE UND DER MITTELWERTSATZ 175 2n n Beweis. Wir zeigen die rechte Ungleichung durch Induktion. Wir betrachten . Wegen 2n 2n 2n 2n 2n = (1 + 1)2n = + + ··· + ··· + n 0 1 n 2n gilt 2n n ≤ 22n . Weiter gilt Es folgt, dass 2n n 2n n = (2n) · (2n − 1) · · · 2 · 1 (2n)! = (n!)2 n · (n − 1) · · · 2 · 1 durch jede Primzahl teilbar ist, die zwischen n und 2n liegt. Y nπ(2n)−π(n) < n<p≤2n p≤ 2n n < 22n Es folgt (π(2n) − π(n)) ln n < 2n ln 2 < 1, 39n. Nach Induktionsannahme gilt π(n) < 1, 7 lnnn . Es folgt für alle n > 1200 π(2n) = (π(2n) − π(n)) + π(n) ≤ 1, 39 n n n 2n + 1, 7 = 3, 09 ≤ 1, 7 . ln n ln n ln n ln 2n Damit gilt der Satz auch für 2n. Wegen π(2n + 1) ≤ π(2n) + 1 < 3, 09 n 2n + 1 + 1 < 1, 7 ln n ln(2n + 1) Nun die linke Ungleichung. Lemma 3.6.4 Es sei p eine Primzahl und pνp die größte Potenz von p, die pνp ≤ n. Beweis. Die größte Potenz von p, die n! teilt, ist p n [n p ]+[ p2 ]+··· , wobei [x] der ganzzahlige Teil von x ist. Deshalb ist X n k n − k νp = − r − pr p pr r≥1 In dieser Summe ist jeder Summand gleich 0 oder 1, und gleich 0 für r> weil dann ln n , ln p n = 0. pr Es folgt νp ≤ und damit die Behauptung. 2 ln n ln p n k teilt. Dann gilt 176 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Korollar 3.6.2 Für jeden Binomialkoeffizienten nk gilt Y n ≤ pνp ≤ nπ(n) . k p≤n Mit dem Korollar folgt n n X n n 2 = (1 + 1) = k k=0 ≤ (n + 1)nπ(n) Deshalb n ln 2 ≤ ln(n + 1) + π(n) ln n n ln 2 ln(n + 1) − ≤ π(n) ln n ln n Für n > 200 folgt 2 n ≤ π(n) 3 ln n 2 Beispiel 3.6.6 (i) Die Folge 1 1+ √ n n divergiert. (ii) Es gilt lim n→∞ 1+ 1 n2 n∈N n = 1. (iii) Es gilt lim n→∞ 1 0.999 + n n = 0. Um einen Eindruck zu erhalten, um welche Größenordnungen es sich handelt, macht man in (i) die folgende Beobachtung (3.14) √n 1 lim 1 + √ = e. n→∞ n Hieraus folgt heuristisch mit etwas Mut und Vertrauen n √ 1 1+ √ ∼ e n. n Dieser Schluss führt hier zu einem richtigen Ergebnis, obwohl man i.A. durch einen solchen Schluss auch falsche Ergebnisse bekommen kann. Für (ii) kann man ähnlich argumentieren. Beweis. (i) Mit der Bernoulli Ungleichung (Lemma 1.10.7) n √ 1 1+ √ ≥ 1 + n. n Die Folge ist unbeschränkt und divergiert deshalb. Wir wollen noch einen Beweis liefern, der unsere Beobachtung (3.14) benutzt. Da e > 2, so gibt es ein N ∈ N, so dass für alle n ≥ N 2< 1 1+ √ n √n . 3.7. LOKALE EXTREMA 177 Somit √ (ii) Mit 1 + x ≤ ex < 1+ 1 n2 1≤ n 2 Da die e-Funktion stetig ist, gilt 1 1+ √ n n n . 1 1 ≤ (e n2 )n = e n . 1 lim e n = e0 = 1. n→∞ Auch hier finden wir ein alternatives Argument mit der Beobachtung n2 1 lim 1 + 2 = e. n→∞ n Wegen e < 3 gibt es ein N ∈ N, so dass für alle n ≥ N n2 1 3> 1+ 2 n gilt. Es folgt 3 1 n > 1 1+ 2 n n . Da 3x eine stetige Funktion ist, folgt 1 lim 3 n = 30 = 1. n→∞ (iii) Für alle n ≥ 104 gilt 0.999 + 1 n ≤ 0.9991 < 1. Also gilt für alle n ≥ 104 n 1 ≤ 0.9991n . 0.999 + n Weiter gilt lim 0.9991n = 0. n→∞ 2 3.7 Lokale Extrema Satz 3.7.1 (i) Es sei f : (a, b) → R eine differenzierbare Funktion mit einem lokalen Extremum in x0 . Dann gilt f 0 (x0 ) = 0. (ii) Es gebe ein δ > 0 mit (x0 − δ, x0 + δ) ⊆ (a, b), so dass für alle x ∈ (x0 − δ, x0 ) gilt f 0 (x) ≥ 0 und für alle x ∈ (x0 , x0 + δ) gilt f 0 (x) ≤ 0. Dann besitzt f in x0 ein lokales Maximum. Falls entsprechend f 0 (x) ≤ 0 auf (x0 − δ, x0 ) und f 0 (x) ≥ 0 auf (x0 , x0 + δ) gelten, dann besitzt f in x0 ein lokales Minimum. (iii) Es sei f : (a, b) → R eine zweimal differenzierbare Funktion. Es sei x0 ∈ (a, b) mit f 0 (x0 ) = 0 und f 00 (x0 ) > 0. Dann besitzt f in x0 ein lokales Minimum. Falls f 0 (x0 ) = 0 und f 00 (x0 ) < 0 gelten, dann hat f in x0 ein lokales Maximum. 178 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Beweis. (i) wurde bereits als Lemma 3.6.1 bewiesen. (ii) Lemma 3.6.2 (iii) Wir nehmen an, dass f 00 (x0 ) > 0. f 0 (x0 + h) f 0 (x0 + h) − f 0 (x0 ) = lim h→∞ h→∞ h h 0 < f 00 (x0 ) = lim Da f 0 differenzierbar ist, ist f 0 auch stetig. Deshalb gilt für hinreichend kleines h f 0 (x0 + h) > 0. h Deshalb gilt f 0 (x0 + h) < 0 für h < 0 und f 0 (x0 + h) > 0 für h > 0. 2 Beispiel 3.7.1 (i) Welches Rechteck mit dem Flächeninhalt 1 besitzt den kleinsten Umfang? Das Quadrat. (ii) Es sei f : R → R durch f (x) = x4 gegeben. Dann hat f in 0 ein relatives und globales Minimum. Man kann die zweite Ableitung aber nicht benutzen, um dies zu entscheiden. Beweis. (i) Die Länge einer Seite des Rechtecks sei x. Dann ist die Länge der anderen Seite Der Umfang ist x + x1 . Dann 1 1 (x + )0 = 1 − 2 x x Also gilt für den Extremalwert 1 = x2 . 1 x. 2 3.8 Satz von Taylor und Taylorreihen Brook Taylor (18.8.1685-29.12.1731) studierte in Cambridge. Er arbeitete auf dem Gebiet der Differentialgleichungen. Auf dem Gebiet der Kunst schrieb er über die Grundlagen der Perspektive und beschrieb als erster das Prinzip des Fluchtpunktes [39]. Satz 3.8.1 Es sei f : (a, b) → R (n + 1)-mal stetig differenzierbar und x0 ∈ (a, b). Dann gilt für alle x, x0 ∈ (a, b) f (x) = n X f (k) (x0 ) k=0 k! (x − x0 )k + Rn (x, x0 ) , wobei es ein ξ ∈ (x, x0 ) mit Rn (x, x0 ) = f (n+1) (ξ) (x − x0 )n+1 (n + 1)! gibt. Man nennt dieses die Lagrangesche Form des Restglieds Rn . Weiter gibt es ein η ∈ (x, x0 ) mit f (n+1) (η) (x − η)n (x − x0 ) . n! Dies nennen wir die Cauchy Form des Restglieds . Rn (x, x0 ) = 3.8. SATZ VON TAYLOR UND TAYLORREIHEN 179 Es gibt Beispiele, bei denen man erfolgreich mit der einen Form des Restgliedes rechnen kann, aber nicht mit der anderen (Beispiel 5.16.1 iv). Beweis. Es sei F : (a, b) → R durch n X f (k) (t) f (n) (t) f 0 (t) (x − t) + · · · + (x − t)n = (x − t)k F (t) = f (t) + 1! n! k! k=0 gegeben. Man beachte, dass Rn (x, x0 ) = F (x) − F (x0 ). Es sei G : (a, b) → R eine Funktion, die auf [x0 , x] stetig und auf (x0 , x) differenzierbar ist. Die Ableitung G0 sei nicht 0 auf (x0 , x). Die Funktion G werden wir später spezifizieren. Nach dem Mittelwertsatz (Satz 3.6.4) gibt es ein ξ ∈ (x0 , x) mit F 0 (ξ) F (x) − F (x0 ) = . 0 G (ξ) G(x) − G(x0 ) Weiter gilt für alle t ∈ (a, b) n X f (k) (t) d F 0 (t) = dt = = n X k=0 n X k=0 k=0 k! ! (x − t)k n X f (k+1) (t) f (k) (t) k (x − t) − (x − t)k−1 k! (k − 1)! k=1 n−1 (k+1) X f (t) f (n+1) (t) f (k+1) (t) k (x − t) − (x − t)k = (x − t)n . k! k! n! k=0 Also gilt F 0 (t) = f (n+1) (t) (x − t)n . n! Es folgt Rn (x, x0 ) = F 0 (ξ) f (n+1) (ξ) G(x) − G(x0 ) (G(x) − G(x )) = (x − ξ)n 0 0 G (ξ) n! G0 (ξ) Wenn wir G(t) = (x − t)n+1 wählen erhalten wir die Lagrange Form des Restgliedes Rn (x, x0 ) = f (n+1) (ξ) (x − x0 )n+1 f (n+1) (ξ) (x − ξ)n = (x − x0 )n+1 . n! (n + 1)(x − ξ)n (n + 1)! Wenn wir G(t) = t − x0 wählen, erhalten wir die Cauchy Form des Restgliedes f (n+1) (η) G(x) − G(x0 ) (x − η)n n! G0 (η) f (n+1) (ξ) f (n+1) (η) n x − x0 = (x − η) = (x − η)n (x − x0 ). n! 1 n! Rn (x, x0 ) = 180 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN 2 Falls das Restglied Rn (x, x0 ) für n gegen ∞ gegen 0 konvergiert, so gilt f (x) = ∞ X f (k) (x0 ) k=0 k! (x − x0 )k Man nennt diese Reihe die Taylorrreihe von f . Für eine reelle Zahl r und 0 wird der Binomialkoeffizient durch und für k ∈ N durch als r r(r − 1) · · · (r − k + 1) . = k! k r 0 = 1 definiert Beispiel 3.8.1 (i) Für alle x ∈ R gilt ex = Insbesondere gilt e= ∞ X xn . n! n=0 ∞ X 1 n! n=0 und wir erhalten e = 2, 71828182846..... (ii) Für alle x ∈ R gilt ∞ X e e = (x − 1)n . n! n=0 x (iii) Es sei a > 0. Für alle x ∈ R gilt ax = ∞ X (x · ln a)n . n! n=0 (iv) Für alle x mit |x| < 1 gilt ln(1 − x) = − ∞ X xn . n n=1 Hier ist interessant, dass wir mit der Cauchy Form des Restgliedes rechnen müssen, während wir mit der Lagrange Form nicht zum Ziel kommen. Für x = −1 erhält man mit dem Grenzwertsatz von Abel (Lemma 3.9.3) ∞ X (−1)n = ln 2. n n=1 (v) Für alle x mit |x| < 1 gilt ∞ X 1 = xn . 1 − x n=0 (vi) Für alle x mit |x| ≤ 1 gilt √ 1+x 1 1·1 2 1·1·3 3 1·1·3·5 4 1+ x− x + x − x + ··· 2 2·4 2·4·6 2·4·6·8 ∞ ∞ X 2n X 1 (−1)n 2 xn . xn = = n n (1 − 2n)4 n n=0 n=0 = 3.8. SATZ VON TAYLOR UND TAYLORREIHEN 181 (vii) Für alle r ∈ R und x mit |x| < 1 gilt r (1 + x) = ∞ X r n=0 n xn (viii) Um eine Funktion in eine Taylorreihe entwickeln zu können, muss sie unendlich oft differenzierbar sein. Andererseits gibt es Funktionen, die auf ganz R unendlich oft differenzierbar sind, aber in einem bestimmten Punkt nicht in eine Taylorreihe zu entwickeln sind. Das klassische Beispiel hierzu ist die folgende Funktion, die man in 0 nicht in eine Taylorreihe entwickeln kann. Es sei f : R → R durch exp − 1 falls x 6= 0 x2 f (x) = 0 falls x = 0 gegeben. Dann gilt für alle n = 0, 1, 2, . . . f (n) (0) = 0 Rn (x, 0) = f (x) und Es gibt auch Funktionen, die auf einem Intervall unendlich oft differenzierbar sind, aber in keinem Punkt in eine Taylorreihe zu entwickeln (Beispiel 5.17.3). Beweis. (i) Es gilt für alle n ∈ N, dass f (n) (x) = ex . Deshalb gilt für alle n ∈ N, dass f (n) (0) = 1. Das Restglied konvergiert gegen 0. Es gibt ein ξ ∈ (0, x) mit Rn (x, 0) = f (n+1) (ξ) n+1 ex x = xn+1 (n + 1)! (n + 1)! Wegen ξ ∈ (0, x) folgt |Rn (x, 0)| = Wegen 0 < ex ≤ e|x| ≤ e|x| folgt eξ e|x| |x|n+1 ≤ |x|n+1 . (n + 1)! (n + 1)! |Rn (x, 0)| ≤ e|x| |x|n+1 . n! Mit Beispiel (2.3.10) folgt |x|n+1 = 0. n→∞ n! lim Deshalb gilt lim |Rn (x, 0)| = 0. n→∞ f (n) (ii) Für alle n = 0, 1, 2, . . . gilt, dass f (n) (x) = ex . Also gilt für alle n = 0, 1, 2, . . . , dass (1) = e. (iii) Dies ergibt sich sofort aus ax = ex ln a . (iv) Für f (x) = ln(1 − x) gilt f 0 (x) = − Allgemein gilt für n ≥ 1 1 1−x f 00 (x) = − 1 (1 − x)2 f (n) (x) = − (n − 1)! . (1 − x)n f 000 (x) = − 2 (1 − x)3 182 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Wir zeigen dies durch Induktion. f (n+1) (x) = n! d (n − 1)! d (n) =− f (x) = − dx dx (1 − x)n (1 − x)n+1 Wir schätzen das Restglied ab. Wir benutzen dazu die Cauchy Form des Restglieds. Die Lagrange Form ist hier nur für x < 0 erfolgreich zu verwenden. (n+1) f (x − ξ)n (ξ) n |Rn (x, 0)| = (x − ξ) x = x n! (1 − ξ)n+1 Falls x > 0, dann 0 < ξ < x < 1 und damit x − ξ < 1 − ξ. Deshalb x − ξ 1 − ξ < 1 und lim |Rn (x, 0)| = 0. n→∞ Falls x < 0, dann −1 < x < ξ < 0 und 0 < ξ − x < ξ − 1 und damit |x − ξ| < |1 − ξ. Also gilt auch hier x − ξ 1 − ξ < 1. Wir erhalten ebenfalls lim |Rn (x, 0)| = 0. n→∞ (viii) Wir zeigen zunächst, dass für jedes n ∈ N ein Polynom pn existiert, so dass für alle x mit x 6= 0 1 1 f (n) (x) = exp − 2 pn x x gilt. Wir zeigen dies mit Induktion. Für n = 0 gilt 1 f (0) (x) = f (x) = exp − 2 . x Wir machen nun den Induktionsschritt. Wir nehmen an, dass die Aussage für n − 1 wahr ist, es gilt also 1 1 f (n−1) (x) = exp − 2 pn−1 . x x Es folgt f (n) 1 (x) = exp − 2 x 2 pn−1 x3 1 −1 1 1 0 + exp − 2 pn−1 . x x x x2 Wir setzen pn (t) = 2t3 pn−1 (t) − t2 p0n−1 (t). Nun zeigen wir, dass für alle Polynome p 1 1 lim p exp − 2 = 0 x→0 x x gilt. Es reicht zu zeigen, dass für alle n = 0, 1, 2, . . . 1 1 lim n exp − 2 = 0 x→0 x x gilt. Wir zeigen dies durch Induktion. Es gelten 1 lim exp − 2 = 0 und x→0 x 1 lim x exp − 2 = 0. x→0 x 3.9. POTENZREIHEN 183 Wir wenden die Formel von L’Hôpital an 1 x−n 1 = lim lim n exp − 2 x→0 exp 12 x→0 x x x −nx−n−1 1 n 1 = lim exp − 2 . = lim x→0 − 23 exp 12 x→0 2 xn−2 x x x Nun zeigen wir, dass für alle n = 0, 1, 2, . . . gilt, dass f (n) (0) = 0. Wir wenden Induktion an. Es gilt f (0) = 0 und damit f 0 (0) = 0. Nun der Induktionsschritt. f (n) (0) f (n−1) (x) − f (n−1) (0) x→0 x f (n−1) (x) 1 1 1 = lim = lim pn−1 exp − 2 = 0 x→0 x→0 x x x x = lim 2 Beispiel 3.8.2 [12] Zu jeder Folge reeller Zahlen {an }n∈N gibt es eine unendlich oft differenzierbare Funktion f : R → R, so dass für alle n = 0, 1, 2, . . . f (n) (0) = an gilt. Wir werden dieses als Beispiel 5.17.5 beweisen. 3.9 Potenzreihen Es sei an , n = 0, 1, 2 . . . , eine Folge reeller Zahlen und x0 ∈ R. Die Reihe ∞ X n=0 an (x − x0 )n heißt Potenzreihe in x ∈ R mit Entwicklungsmitte oder Mittelpunkt x0 . Wir lernen hier, dass man eine Potenzreihe und damit jede Taylorreihe summandenwiese differenzieren kann. Außerdem stellen wir fest, dass die Taylorreihe einer Potenzreihe die Potenzreihe selbst ist. Es gibt unendlich oft differenzierbare Funktionen, die in keinem Punkt durch ihre Taylorreihe darstellbar sind. Wir sagen, dass eine Funktion in einem Punkt analytisch ist, wenn sie in einer Umgebung dieses Punktes durch ihre Taylorreihe darstellbar ist. Lemma 3.9.1 Es sei an , n = 0, 1, 2 . . . , eine Folge reeller Zahlen und x0 ∈ R. Falls die Potenzreihe ∞ X an (x − x0 )n n=0 184 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN für ein x1 mit x1 6= x0 konvergiert, so konvergiert sie für alle x mit |x−x0 | < |x1 −x0 | absolut, d.h. ∞ X |an ||x − x0 |n n=0 konvergiert. Divergiert die Reihe an einer Stelle x2 , so divergiert sie für alle x mit |x − x0 | > |x2 − x0 |. Beweis. Da ∞ X n=0 an (x1 − x0 )n konvergiert, gilt nach Lemma 2.6.3 lim an (x1 − x0 )n = 0. n→∞ Nach Lemma 2.2.1 ist eine konvergente Folge beschränkt. Deshalb gibt es ein C > 0, so dass für alle n ∈ N |an (x1 − x0 )n | ≤ C gilt. Hiermit folgt ∞ X x − x0 n x − x0 n . ≤C |an (x − x0 ) | = |an (x1 − x0 ) | x − x x − x 1 0 1 0 n=0 n=0 n=0 ∞ X Da n ∞ X n x − x0 x1 − x0 < 1 gilt, konvergiert die Reihe. P∞ n Wir betrachten nun den Fall, n=0 an (x2 − x0 ) divergiert. Wir P∞ dass die Reihe n nehmen an, dass die Reihe n=0 an (x − x0 ) für ein x mit |x − x0 | > |x2 − x0 | konvergiert. Dies kann aus dem ersten Teil dieses Lemmas folgt, P∞nicht sein, weil n dass dann die Reihe n=0 an (x2 − x0 ) konvergiert. 2 Aus Lemma 3.9.1 ergibt sich, dass es drei Fälle geben kann. Der erste Fall ist, dass die Potenzreihe nur für x = x0 konvergiert. Dann sagen wir, dass der Konvergenzradius der Potenzreihe 0 ist. Der zweite Fall ist, dass die Potenzreihe für alle x ∈ R konvergiert. Dann sagen wir, dass der Konvergenzradius unendlich ist. Der dritte Fall ist, dass es ein R > 0 gibt, so dass die Potenzreihe für alle x mit |x| < R konvergiert und für alle x mit |x| > R divergiert. Dann sagen wir, dass der Konvergenzradius R ist. Das Konvergenzgebiet ist also immer ein Intervall. Im Komplexen stellt man fest, dass das Konvergenzgebiet ein Kreis ist. Deswegen spricht man auch vom Konvergenzradius. Ob auf dem Rand des Konvergenzgebietes Konvergenz oder Divergenz vorliegt, interessiert uns hier nicht. 3.9. POTENZREIHEN 185 P Lemma 3.9.2 (Wurzelkriterium) Die Reihe ∞ n=1 xn konvergiert absolut, falls der 1 Limes Superior der Folge {|xn | n }n∈N existiert und 1 lim sup |xn | n < 1. n→∞ 1 Die Reihe divergiert, falls der Limes Superior der Folge {|xn | n }n∈N nicht existiert oder falls er existiert und 1 lim sup |xn | n > 1 n→∞ gilt. (Falls der Limes Superior gleich 1 ist, so können beide Fälle auftreten.) P n Das Wurzelkriterium ist eine Verallgemeinerung der Aussage, dass ∞ n=1 q konvergiert, falls |q| < 1 gilt, und die Reihe divergiert, falls |q| > 1. Falls nämlich 1 |xn | < q n bzw. |xn | n < q gilt, so erhalten wir ∞ X |xn | ≤ n=1 ∞ X n=1 q n < ∞. Das Wurzelkriterium ist ein relativ grobes Kriterium, das in komplizierteren Fällen wie z.B. ∞ X 1 n(ln n)2 n=2 versagt. Das Integralkriterium ist ein feineres Mittel. Für die Zwecke, die wir hier betrachten, reicht uns das Wurzelkriterium. Beweis. Wir betrachten den Fall 1 k lim sup |xn | = lim sup |xk | = c < 1. 1 n n→∞ n→∞ n≤k Dann gilt ∀ > 0 ∃N ∈ N ∀n > N : Wir wählen nun = 1 (1 2 1 |c − sup |xk | k | < . k≥n − c) und setzen q = c + = ∃N ∈ N ∀n > N : 1+c 2 < 1. Es folgt 1 |c − sup |xk | k | < = 21 (1 − c). k≥n Hieraus folgt ∃N ∈ N ∀n > N : Somit erhalten wir 1 sup |xk | k < c + 12 (1 − c) = k≥n 1 ∃N ∈ N ∀n > N : |xn | n ≤ q und somit ∃N ∈ N ∀n > N : |xn | ≤ q n . 1+c = q. 2 186 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN P P n Also ist die Reihe ∞ für die Reihe ∞ n=1 q eine MajoranteP n=1 |xn |. Nach Beispiel ∞ n 2.6.1 konvergiert die geometrische Reihe n=1 q . Es bleibt das Majorantenkriterium anzuwenden (Lemma 2.6.7). 1 Falls der Limes Superior der Folge {|xn | n }n∈N nicht existiert, dann ist die Folge unbeschränkt und es gibt eine Teilfolge von {xn }n∈N , die nicht gegen 0 konvergiert. Nach Lemma 2.6.3 divergiert die Reihe. 1 Wir betrachten nun den Fall, dass der Limes Superior der Folge {|xn | n }n∈N existiert und dass 1 lim sup |xn | n = c > 1. n→∞ Dann gilt c − sup |xk | k1 < . k≥n ∀ > 0 ∃N ∈ N ∀n > N : Wir wählen = 21 (c − 1) und q = c − = 12 c + 12 > 1. Damit gilt 1 ∃N ∈ N ∀n > N : c − sup |xk | k < 12 (c − 1) k≥n und ∃N ∈ N ∀n > N : 1 1 < q < sup |xk | k . k≥n Weiter folgt ∃N ∈ N ∀n > N ∃k > n : 1 1 < q ≤ |xk | k . Deshalb gibt es eine Teilfolge von xn , n ∈ N, die nicht gegen 0 konvergiert. P∞ Somit konvergiert die Folge xn , n ∈ N, selbst nicht gegen 0 und die Reihe n=1 xn divergiert. 2 Wir sagen, dass eine reelle Folge {xn }n∈N gegen ∞ konvergiert, wenn ∀C ∈ R∃N ∈ N∀n ≥ N : C ≤ xn . Satz 3.9.1 (Formel von Cauchy-Hadamard) Für den Konvergenzradius R einer P∞ Potenzreihe n=0 an (x − x0 )n gilt 1 0 falls lim sup |an | n = ∞ n→∞ 1 falls lim sup |an | n = 0 R= ∞ n→∞ 1 sonst 1 lim supn→∞ |an | n Beweis. Mit Lemma 3.9.2 folgt, dass die Reihe ∞ X n=0 an (x − x0 )n 3.9. POTENZREIHEN 187 absolut konvergiert, falls 1 1 1 > lim sup(|an ||x − x0 |n ) n = |x − x0 | lim sup |an | n . n→∞ n→∞ Also konvergiert die Reihe absolut, falls |x − x0 | < 1 1 lim supn→∞ |an | n . Also gilt 1 R≥ 1 lim supn→∞ |an | n Mit Lemma 3.9.2 folgt, dass die Reihe ∞ X n=0 . an (x − x0 )n nicht konvergiert, falls 1 1 1 < lim sup(|an ||x − x0 |n ) n = |x − x0 | lim sup |an | n . n→∞ n→∞ Also divergiert die Reihe, falls 1 1 2 lim supn→∞ (|an ||x − x0 |n ) n < |x − x0 |. P∞ Beispiel 3.9.1 (i) Der Konvergenzradius der Reihe n=0 xn ist 1. P∞ (ii) Der Konvergenzradius der Reihe n=0 nxn ist 1. P∞ (iii) Der Konvergenzradius der Reihe n=0 n2 xn ist 1. P∞ 1 n (iv) Der Konvergenzradius der Reihe n=0 n2 x ist 1. P∞ (v) Der Konvergenzradius der Reihe n=0 21n xn ist 2. P∞ (vi) Der Konvergenzradius der Reihe n=0 x2n ist 1. P∞ (vi) Der Konvergenzradius der Reihe n=0 xn! ist 1. Beweis. (i) 1 lim sup |an | n = lim 1 = 1 n→∞ n→∞ (ii) Mit Beispiel 3.4.2 1 1 lim sup n n = lim n n = 1 n→∞ n→∞ (iii) Mit Beispiel 3.4.2 1 1 1 lim sup(n2 ) n = lim (n2 ) n = ( lim n n )2 = 1 n→∞ n→∞ n→∞ (v) 1 lim sup(2−n ) n = lim n→∞ 1 n→∞ 2 = 1 2 2 In dem folgenden Beispiel ist es nicht einfach, den Konvergenzradius zu berechnen. Man braucht hier das richtige Hilfsmittel. 188 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Beispiel 3.9.2 (i) Der Konvergenzradius von ∞ X 1 n x sin n n=1 ist 1. (ii) Der Konvergenzradius von ∞ X tan(n)xn n=1 ist Wir werden dieses Beispiel später als Beispiel 3.10.4 behandeln. P n Satz 3.9.2 Es sei f (x) = ∞ n=0 an (x − x0 ) eine Potenzreihe mit Konvergenzradius R (Wir lassen auch R = ∞ zu). Die Potenzreihe f ist unendlich oft differenzierbar und für alle k ∈ N gilt f (k) ∞ ∞ X X n n−k (x) = k! an (x − x0 ) = n · (n − 1) · · · (n − k + 1)an (x − x0 )n−k . k n=k n=k Diese Potenzreihen haben denselben Konvergenzradius wie f . Dieser Satz stellt sicher, dass wir eine Potenzreihe summandenweise differenzieren können. Beweis. Wir zeigen zuerst, dass für alle k = 0, 1, 2, . . . die Reihen ∞ X n k! an (x − x0 )n−k k n=k denselben Konvergenzradius haben wie sind R= Die Reihe 1 lim supn→∞ p n |an | P∞ k=0 ak (x − x0 )k . Die Konvergenzradien 1 Rk = lim supn→∞ ∞ X n k! an (x − x0 )n−k k n=k konvergiert genau dann, wenn die Reihe (3.15) ∞ X n k! an (x − x0 )n k n=k q . k! nk |an | n−k 3.9. POTENZREIHEN 189 konvergiert, weil sich beide Reihen nur um den Faktor (x − x0 )k unterscheiden. Wir bezeichnen den Konvergenzradius von (3.15) mit R̃k . Also gilt Rk = R̃k . Wir zeigen nun, dass R = R̃k gilt. Es gilt k−1 Y n 1 ≤ k! = n(n − 1)(n − 2) . . . (n − k + 1) = (n − j) ≤ nk . k j=0 k 1 Wegen limn→∞ n n = 1 folgt für alle k ∈ N, dass limn→∞ n n = 1. Somit n1 n lim k! = 1. n→∞ k Mit Lemma 2.5.8 1 n1 n 1 1 n n lim sup k! an ≤ lim k! lim sup |an | n = lim sup |an | n . n→∞ k k n→∞ n→∞ n→∞ Weiter gilt 1 n n an . lim sup |an | ≤ lim sup k! k n→∞ n→∞ 1 n Damit erhalten wir 1 n1 n 1 1 n n lim sup |an | n = lim sup |an | n . lim sup k! an = lim k! n→∞ k k n→∞ n→∞ n→∞ Also gilt R = Rk . Wir zeigen nun, dass f in dem Konvergenzintervall differenzierbar ist. O.E.d.A. können wir annehmen, dass x0 = 0. Der Konvergenzradius ist R. Weiter nehmen wir zunächst an, dass x 6= 0. f (x + h) − f (x) = ∞ X n=0 n an (x + h) − Da (x + h)0 − x0 = 0 und (x + h)n − xn = ∞ X n an x = n=0 Pn ∞ X n=0 an ((x + h)n − xn ) n k=1 k xn−k hk für n ≥ 1, folgt n ∞ X X n n−k k f (x + h) − f (x) = an x h . k n=1 k=1 Damit erhalten wir für den Differenzenquotienten ∞ n f (x + h) − f (x) X X n n−k k−1 = an x h h k n=1 k=1 und damit ∞ ∞ n ∞ X X n n−k k−1 X f (x + h) − f (x) X n−1 − nan x = an x h − nan xn−1 h k n=1 n=1 n=1 k=1 ! ∞ n X n X = an xn−k hk−1 − nxn−1 k n=1 k=1 190 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Da 1 X 1 k=1 k x 1−k k−1 h n X n 0 −nx = 0 k=1 k x n−k k−1 h n−1 −nx n X n n−k k−1 = x h k k=2 für n ≥ 2, folgt (3.16) ∞ ∞ n X X n n−k k−1 f (x + h) − f (x) X n−1 − nan x = an x h . h k n=1 n=2 k=2 Weiter gilt n n X n X n n−k k−1 n−k k−1 x h ≤ x h k k k=2 k=2 n−1 n−1 X n−k k n−k−1 k n n 1 X x h . = x h = |x| k + 1 k + 1 k=1 k=1 Mit n k+1 n−k n n = ≤n k+1 k k folgt (3.17) n−1 n X n n n−k k−1 n X n n−k k (|x| + |h|)n . x h ≤ x h ≤ |x| |x| k k k=1 k=2 Wir können h0 so klein wählen, dass |x| + |h0 | < R. Deshalb konvergiert ∞ X n=0 an (|x| + |h0 |)n absolut und damit auch, wie wir oben gezeigt haben, ∞ 1 X nan (|x| + |h0 |)n . |x| n=0 Deshalb gibt es zu jedem > 0 ein n0 ∈ N, so dass ∞ 1 X n|an |(|x| + |h0 |)n < . |x| n=n 0 Es folgt, dass es zu jedem > 0 ein n0 ∈ N gibt, so dass für alle h mit |h| ≤ |h0 | ∞ 1 X n|an |(|x| + |h|)n < . |x| n=n 0 3.9. POTENZREIHEN 191 Also gibt wegen (3.17) es zu jedem > 0 ein n0 ∈ N, so dass für alle h ∈ R mit |h| ≤ |h0 | gilt ∞ n X X n an xn−k hk−1 < . (3.18) n=n k 0 Der Ausdruck k=2 n0 X n X n n−k k−1 an x h k n=2 k=2 ist als Funktion von h stetig und nimmt für h = 0 den Wert 0 an. Deshalb gibt es zu jedem > 0 ein δ > 0, so dass für alle h mit |h| < δ ∞ n X X n n−k k−1 an x h < n=2 k k=2 gilt. Mit (3.16) erhalten wir, dass zu jedem > 0 ein δ > 0 existiert, so dass für alle h mit |h| < δ ∞ n ∞ X X f (x + h) − f (x) X n nan xn = an xn−k hk−1 − k h n=1 n=2 k=2 n n n ∞ 0 X X X n n−k k−1 X n n−k k−1 ≤ an x h + an x h < 2. k k n=2 n=n0 +1 k=2 k=2 gilt. Es bleibt noch der Fall x = 0. In diesem Fall gilt ∞ ∞ X f (x + h) − f (x) f (h) − f (0) 1X = = an hn = an hn−1 . h h h n=1 n=1 Somit f (x + h) − f (x) = a1 . h Damit haben wir gezeigt, dass f differenzeirbar ist. Die Aussagen für die höheren Ableitungen folgen mit Induktion. 2 P n Satz 3.9.3 (i) Es sei f (x) = ∞ n=0 an (x − x0 ) eine Potenzreihe mit einem Konvergenzradius R, 0 < R ≤ ∞. Dann gilt für alle n = 0, 1, 2, . . . lim h→0 an = f (n) (x0 ) . n! P P∞ n n (ii) Es seien f (x) = ∞ a (x − x ) und g(x) = n 0 n=0 n=0 bn (x − x0 ) Potenzreihen, deren Konvergenzradien strikt größer als 0 sind. Es gebe ein r > 0, so dass für alle x ∈ (x0 − r, x0 + r) ∞ ∞ X X n an (x − x0 ) = bn (x − x0 )n , n=0 n=0 192 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN gilt. Dann gilt für alle n = 0, 1, 2, . . . an = b n . Der Satz sagt aus, dass die Taylorreihe einer Potenzreihe die Potenzreihe selbst ist. Beweis. (i) folgt sofort aus Satz 3.9.2: Für alle x ∈ (x0 − R, x0 + R) gilt f (k) ∞ X n (x) = k! an (x − x0 )n−k . k n=k Deshalb erhalten wir f (k) k (x0 ) = k! ak = k!ak . k (ii) Für alle x ∈ (x0 − r, x0 + r) gilt f (x) = g(x). Nach Satz 3.9.2 sind f und g unendlich oft differenzierbar. Es folgt für alle x ∈ (x0 − r, x0 + r) und alle n ∈ N0 f (n) (x) = g (n) (x) Nach (i) gilt g (n) (x0 ) f (n) (x0 ) = = bn . an = n! n! 2 P∞ n Lemma 3.9.3 (Grenzwertsatz von Abel) Die Potenzreihe n=0 an x besitze den P∞ Konvergenzradius R mit R < ∞ und n=0 an Rn konvergiere. Dann gilt lim x→R ∞ X n an x = ∞ X an R n . n=0 n=0 Beweis. Wir können annehmen, dass R = 1. Mit dem Produktsatz von Cauchy (Lemma 2.7.1) folgt ∞ ∞ ∞ ∞ X X X 1 X n n n an x = x an x = (a0 + · · · + an )xn . 1 − x n=0 n=0 n=0 n=0 Also gilt ∞ X n=0 n an x = (1 − x) ∞ X n=0 (a0 + · · · + an )xn . 3.9. POTENZREIHEN 193 Hiermit folgt für alle x mit |x| < 1 ∞ X n=0 an − ∞ X n=0 an x n = ∞ X n=0 an − (1 − x) = (1 − x) = (1 − x) = (1 − x) ∞ X n=0 ∞ X ∞ X n=0 ∞ X k=0 ∞ X n=0 ∞ X k=0 ∞ X n=0 k=n+1 (a0 + · · · + an )xn ! ak ∞ X xn − (1 − x) (a0 + · · · + an )xn n=0 ! ! − (a0 + · · · + an ) xn ak ! ak xn . P Wir wählen N so groß, dass für alle n ≥ N die Ungleichung | ∞ k=n+1 ak | < gilt. Es gilt ! ! ∞ ∞ N ∞ ∞ ∞ X X X X X X an − an xn = (1 − x) ak xn + (1 − x) ak x n n=0 n=0 n=0 n=N +1 k=n+1 k=n+1 Es folgt für alle x mit 0 < x < 1 ∞ ∞ ∞ N X ∞ X X X X n n ak x + (1 − x) xn an x ≤ (1 − x) an − n=0 k=n+1 n=0 n=0 n=N +1 N ∞ X X = (1 − x) ak xn + xN +1 n=0 k=n+1 Wegen |x| < 1 folgt weiter ∞ ∞ N X ∞ X X X n an − an x ≤ (1 − x) ak + . n=0 n=0 n=0 k=n+1 P∞ P Da die Reihe ∞ n=k an }k∈N beschränkt. Also gibt n=0 an konvergiert, ist die Folge { es eine Konstante C mit ∞ ∞ X X n a − a x ≤ (1 − x)C + . n n n=0 n=0 Deshalb gilt für alle x mit x > 1 − C ∞ ∞ X X n an − an x ≤ 2. n=0 n=0 2 Beispiel 3.9.3 Für x = −1 erhält man mit dem Grenzwertsatz von Abel (Lemma 3.9.3) ∞ X (−1)n = ln 2. n n=1 194 3.10 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Die trigonometrischen Funktionen Mit trigonometrischen Funktionen bezeichnet man Funktionen, die Zusammenhänge von Winkeln und Seitenlängen in Dreiecken beschreiben. Der Sinus eines Winkels α, der kleiner als 90◦ ist, wird mit Hilfe eines rechtwinkligen Dreiecks definiert, in dem α als Winkel vertreten ist. Die Hypotenuse ist die längste Seite in einem Dreieck, in dem ein Winkel ein rechter Winkel ist, also ein Winkel von 90◦ . Die Hypotenuse liegt dem rechten Winkel gegenüber. Die anderen beiden Seiten werden als Katheten bezeichnet. Es sei α ein weiterer Winkel in diesem Dreieck. Dann bezeichnet man die Kathete, die diesem Winkel gegenüber liegt, als Gegenkathete, die andere als Ankathete. Der Sinus von α ist der Quotient der Längen von Hypotenuse und Gegenkathete. Der Cosinus ist der Quotient der Längen von Hypotenuse und Ankathete. Wir messen den Winkel im Bogenmaß, d.h. Länge des zum Winkel gehörigen Kreisbogens dividiert durch den Radius des Kreises. Hypotenuse Gegenkathete Ankathete Der Cosinus des Winkels, der durch den Kreisbogen über dem Intervall [t, 1] gegeben ist, ist t. Wir führen hier die trigonometrischen Funktionen durch Potenzreihen ein. Das hat den Vorteil, dass wir nicht auf die Bogenlänge eines Kreisstückes zurückgreifen müssen. Die Bogenlänge führen wir später mit Hilfe des Integrals ein und klären dann den Zusammenhang mit den trigonometrischen Funktionen. Die Zahl π ist der halbe Umfang eines Kreises mit Radius 1. Euler gab der Zahl den Namen π in Anlehnung an das griechische Wort peripheria. In der Bibel wird die Zahl π als 3 angegeben: König Salomon ließ durch den Kupferschmied Hiram von Tyrus für den Tempel in Jerusalem ein rundes Wasserbecken herstellen. Dann machte er das Meer. Es wurde aus Bronze gegossen und maß 10 Ellen von einem Rand zum anderen. Es war völlig rund und 5 Ellen hoch. Eine Schnur von 30 Ellen konnte es rings umspannen. (1. Könige 7,23) Es ist möglich, dass in der Dezimalbruchentwicklung jede endliche Folge von natürlichen Zahlen zwischen 0 und 9 auftritt (man weiss es nicht). Wenn das so ist, dann findet man alles, was es im Universum gibt und geben wird, codiert in der Zahl π. Insbesondere ist jedes Buch, das jemals geschrieben wurde, und jedes Buch, 3.10. DIE TRIGONOMETRISCHEN FUNKTIONEN 195 das jemals geschrieben wird, bereits in der Zahl π codiert. Formal nennt man eine Zahl normal zur Basis 10, wenn jede endliche Ziffernfolge von Ziffern zwischen 0 und 9 in der Dezimalbruchentwicklung dieser Zahl auftritt und mit derselben Häufigkeit auftritt. Definition 3.10.1 (i) Der Sinus sin : R → R ist durch ∞ X (−1)n 2n+1 x sin x = (2n + 1)! n=0 gegeben. (ii) Der Cosinus cos : R → R ist durch cos x = ∞ X (−1)n n=0 (2n)! x2n gegeben. 4 x − 16 x3 + 1 5 120 x 2 1 2 3 4 5 6 sin x -2 x − 16 x3 -4 Bemerkung 3.10.1 Die Konvergenzradien der Sinusreihe und der Cosinusreihe sind ∞. Beweis. Wir zeigen, dass die Sinusreihe für alle x ∈ R absolut konvergiert. ∞ ∞ ∞ X X (−1)n 2n+1 X 1 1 n 2n+1 = x |x| ≤ x = e|x| (2n + 1)! (2n + 1)! n! n=0 n=0 n=0 2 Die Kreiszahl π können wir als die kleinste Zahl definieren, die strikt größer als 0 ist und die sin π = 0 erfüllt. Dies verstellt allerdings den Blick auf den geometrischen Charakter der Zahl π. Später werden wir π als den halben Umfang eines Kreises mit Radius 1 einführen. 196 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Lemma 3.10.1 Die Funktionen sin und cos sind unendlich oft differenzierbar. Weiter gelten sin0 = cos cos0 = − sin . Beweis. Nach Satz 3.9.2 sind Potenzreihen unendlich oft differenzierbar und wir können summandenweise differenzieren ∞ ∞ X (−1)n 2n X (−1)n 2n x = x = cos x. sin x = (2n + 1) (2n + 1)! (2n)! n=0 n=0 0 2 Lemma 3.10.2 (i) Für alle x ∈ R gelten sin(−x) = − sin x cos(−x) = cos x. (ii) sin 0 = 0 cos 0 = 1 Beweis. Für alle x ∈ R gilt ∞ ∞ X X (−1)n (−1)n 2n+1 2n+1 sin(−x) = (−x) =− x = − sin x. (2n + 1)! (2n + 1)! n=0 n=0 2 Lemma 3.10.3 Für alle x, y ∈ R gelten sin(x + y) cos(x + y) 2 sin x + cos2 x sin2 x cos2 x sin(2x) = = = = = = sin x cos y + cos x sin y cos x cos y − sin x sin y 1 1 (1 − cos 2x) 2 1 (1 + cos 2x) 2 2 sin x cos x Beweis. Wir definieren die Funktionen f, g : R → R durch f (x) = sin(x + y) − sin x cos y − cos x sin y g(x) = cos(x + y) − cos x cos y + sin x sin y. Man beachte, dass zu jedem y Funktionen f und g erhält. Wir werden zeigen, dass f und g die Nullfunktion sind. Es gilt f (0) = g(0) = 0. Weiter gilt f 0 = g und g 0 = −f . Wir erhalten (f 2 + g 2 )0 = 2f f 0 + 2gg 0 = 2f g − 2gf = 0 3.10. DIE TRIGONOMETRISCHEN FUNKTIONEN 197 Nach Satz 3.6.3 ist die Funktion f 2 + g 2 konstant. Also gibt es ein c ≥ 0, so dass für alle x ∈ R f 2 (x) + g 2 (x) = c Die Konstante c könnte von y abhängen. Da aber f (0) = g(0) = 0, gilt c = 0. Damit gelten f = g = 0 und wir haben wir die ersten beiden Gleichungen bewiesen. Nun die dritte Formel. Wir setzen y = −x in der Formel cos(x + y) = cos x cos y − sin x sin y und erhalten 1 = cos2 x + sin2 x. Nun die vierte Formel. Mit y = x folgt aus Formel zwei cos 2x = cos2 x − sin2 x = 1 − 2 sin2 x Die fünfte Formel folgt aus der dritten und vierten Formel. Die sechste Formel folgt aus der ersten Formel mit y = x. 2 Definition 3.10.2 π = inf{x|x > 0 und cos x = 0} 2 Wir überlegen uns, dass π wohldefiniert ist. Es gilt cos 0 = 1 und 1 3 Nach dem Zwischenwertsatz gibt es eine Nullstelle des Cosinus zwischen 0 und 2. Da der Cosinus stetig ist, ist auch das Infimum eine Nullstelle. cos 2 < − Lemma 3.10.4 (i) sin π2 = 1 (ii) Für alle x ∈ R gilt sin π = 0 sin(x + π2 ) = cos x (iii) Für alle x ∈ R gelten sin(x + 2π) = sin x cos(x + 2π) = cos x Beweis. (i) Wegen cos 0 = 1 und sin2 0 + cos2 0 = 1 gilt sin2 0 = 1. Also gelten sin 0 = 1 oder sin 0 = −1. Da cos 0 = 1, so gilt für alle x ∈ [0, π2 ), dass cos x > 0. Mit sin0 = cos folgt, dass sin auf [0, π2 ] strikt monoton wachsend ist. Also sin π2 > 0 und wir können auf sin π2 = 1 schließen. Mit sin(2x) = 2 sin x cos x 198 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN folgt für x = π 2 π π cos = 0. 2 2 (ii) Nach Lemma 3.10.3 gilt für alle x, y ∈ R sin π = 2 sin sin(x + y) = sin x cos y + cos x sin y. Für y = π 2 erhalten wir sin(x + π2 ) = sin x cos π2 + cos x sin π2 . Wegen sin π2 = 1 und cos π2 = 0 folgt sin(x + π2 ) = cos x. (iii) Aus sin x + π 2 = cos x. erhalten wir für x = −t sin −t + Für t = y + π 2 π 2 = cos(−t) = cos t = sin t + π 2 . erhalten wir sin(−y) = sin(y + π) und für y = z + π sin(z + 2π) = sin(−z − π) = − sin(z + π) = sin z. 2 Wir setzen sin t cos t cos t cot t = sin t für cos t 6= 0 tan t = Beispiel 3.10.1 Für alle x ∈ R mit |x| < für sin t 6= 0 π 2 gilt ∞ X 1 2 17 7 (−1)n−1 22n (22n − 1)B2n 2n−1 tan x = x + x3 + x5 + x + ··· = x 3 15 315 (2n)! n=1 wobei Bm die Bernoulli Zahlen sind, die durch B1 = − 12 und rekursiv für m = 2, 3, . . . Bm m−1 1 X m+1 =− Bk m+1 k k=0 definiert sind. 3.10. DIE TRIGONOMETRISCHEN FUNKTIONEN Beispiel 3.10.2 Es sei f : R → R durch x2 cos xπ2 f (x) = 0 199 falls x ∈ [−1, 1] und x 6= 0 falls x = 0 gegeben. Dann ist f auf R differenzierbar und f 0 ist in 0 unstetig. Beweis. Falls 0 6= x gilt, dann kann man die Kettenregel anwenden und erhält π 2π π f 0 (x) = 2x cos 2 + sin 2 . x x x Für x = 0 rechnet man aus π x2 cos xπ2 0 f (0) = lim = lim x cos 2 = 0 x→0 x→0 x x f ist also auf ganz R differenzierbar. Wir weisen nun nach, dass f 0 in 0 nicht stetig ist. Wir betrachten die Punkte 1 n ∈ N. xn = q 2n + 12 Dann gelten lim xn = 0 n→∞ und 0 1 f (xn ) = 2 q 2n + 1 2 r r 1 1 1 1 cos π 2n + + 2π 2n + sin π 2n + = 2π 2n + . 2 2 2 2 Also konvergiert die Folge {f 0 (xn )}n∈N nicht. 2 Beispiel 3.10.3 Für alle x mit x ≥ 0 sin x ≤ x Beispiel 3.10.4 (i) Der Konvergenzradius von ∞ X 1 n x sin n n=1 ist 1. (ii) Der Konvergenzradius von ∞ X tan(n)xn n=1 ist Beweis. (i) Für t mit 0 ≤ t ≤ Ungleichung sin t ≥ 12 t. π 3 gilt 1 2 ≤ cos t ≤ 1. Deshalb gilt für alle t mit 0 ≤ t ≤ 1 m n |n − mπ| = − π . 2 2 m Mit Satz 2.11.2 erhalten wir für alle m mit m ≥ 2 n m−42 < | − π|. m n Außerdem gilt m ∼ π. Damit folgt 1 | sin n| ≥ 42 . n 2 | sin n| = | sin(n − mπ)| ≥ π 3 die 200 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN 3.11 Die Formel von L’Hôpital Guillaume Francois Antoine Hôpital, Marquis de Sainte-Mesme wurde 1661 in Paris geboren. 1696 veröffentlichte L’Hôpital das erste französische Lehrbuch der Analysis überhaupt Analyse des infiniment petits. Tatsächlich geht es auf Johann I. Bernoulli zurück. L’Hôpital bezahlte Bernoulli für wissenschaftliche Ergebnisse und deren Publikationsrechte. So stammt die Formel bzw. Regel von L’Hôpital tatsächlich von Bernoulli. L’Hôpital starb am 3.2.1704 in Paris. Nach dem Tod von L’Hôpital ging Bernoulli damit an die Öffentlichkeit. Satz 3.11.1 (L’Hôpital) Es seien f, g : (a, b) → R stetig differenzierbare Funktionen. Es sei x0 ∈ (a, b) und g und g 0 seien für alle x ∈ (a, b) mit x 6= x0 von 0 verschieden. Es gelte f (x0 ) = g(x0 ) = 0 und Dann gilt lim x→x0 lim x→x0 f 0 (x) g 0 (x) existiere. f (x) f 0 (x) = lim 0 . g(x) x→x0 g (x) Insbesondere gilt lim x→x0 f 0 (x0 ) f (x) = 0 , g(x) g (x0 ) falls g 0 (x0 ) 6= 0. Beweis. Es sei {xn }n∈N eine Folge mit limn→∞ xn = x0 . Nach Satz 3.6.4 gibt es dann zu jedem n ∈ N ein ξn mit ξn ∈ (xn , x0 ) oder ξn ∈ (x0 , xn ), so dass f 0 (ξn ) f (xn ) − f (x0 ) = . 0 g (ξn ) g(xn ) − g(x0 ) Wegen f (x0 ) = g(x0 ) = 0 folgt f 0 (ξn ) f (xn ) = . 0 g (ξn ) g(xn ) Da ξn ∈ (xn , x0 ) bzw. ξn ∈ (x0 , xn ) gilt, folgt limn→∞ ξn = x0 . Nach Voraussetzung existiert f 0 (x) lim 0 . x→x0 g (x) Deshalb folgt f 0 (x) f 0 (ξn ) f (xn ) = lim 0 = lim . lim 0 x→x0 g (x) n→∞ g (ξn ) n→∞ g(xn ) Wir betrachten nun den Fall, dass g 0 (x0 ) 6= 0. Da f 0 und g 0 nach Voraussetzung stetig sind, gilt f 0 (x) limx→x0 f 0 (x) f 0 (x0 ) lim 0 = = . x→x0 g (x) limx→x0 g 0 (x) g 0 (x0 ) 2 3.11. DIE FORMEL VON L’HÔPITAL Beispiel 3.11.1 201 1 ex − 1 − x = 2 x→0 x 2 lim Beweis. Wir müssen zweimal differenzieren. Es gilt ex 1 = . x→0 2 2 lim Deshalb gilt 1 ex − 1 = . x→0 2x 2 lim Hieraus folgt 1 ex − 1 − x = . 2 x→0 x 2 lim Satz 3.11.1 kann dahingehend verallgemeinert werden, dass auch x0 = a oder x0 = b zugelassen wird. Wir hatten bereits in (3.4) definiert, wann eine Folge gegen ∞ konvergiert. Eine Folge xn , n ∈ N, konvergiert gegen ∞, wenn ∀C > 0∃N ∀n ≥ N : xn ≥ C. Satz 3.11.2 Es seien f, g : (a, b) → R stetig differenzierbar. Es sei g(x) 6= 0 für alle x ∈ (a, b). (i) Es gelte lim f (x) = lim g(x) = 0 x→a x→a Dann gilt f 0 (x) x→a g 0 (x) und lim existiere. f (x) f 0 (x) = lim 0 . x→a g(x) x→a g (x) lim (ii) Es gelte lim g(x) = ∞ und x→a Dann gilt f 0 (x) x→a g 0 (x) lim existiere. f (x) f 0 (x) = lim 0 . x→a g(x) x→a g (x) lim Beweis. Es sei > 0. Wir bestimmen ein δ > 0, so dass für alle y ∈ (a, a + δ) f 0 (y) f 0 (x) < lim + g 0 (y) x→a g 0 (x) gilt. Nach dem Mittelwertsatz (Satz 3.6.4) gibt es für alle v, w ∈ (a, a+δ) mit v < w ein ξ ∈ (v, w) mit f 0 (ξ) f (w) − f (v) = . 0 g (ξ) g(w) − g(v) 202 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN existiert. Es folgt f 0 (x) f (w) − f (v) < lim 0 + . x→a g (x) g(w) − g(v) Wir können v so nahe bei a wählen, dass f 0 (x) f (w) < lim 0 + 2. g(w) x→a g (x) 2 Satz 3.11.3 Es seien f, g : [a, ∞) → R differenzierbare Funktionen mit limx→∞ f (x) = 0 und limx→∞ g(x) = 0. Weiter existiere f 0 (x) . x→∞ g 0 (x) lim Dann gilt f (x) f 0 (x) = lim 0 . x→∞ g(x) x→∞ g (x) lim Beispiel 3.11.2 (i) Es gilt lim x→0 ln(1 + x) = 1. x (ii) Es gilt lim x ln x = 0. x→0 (iii) Es sei α > 0. Dann lim xα ln x = 0. x→0 (iv) Es sei α > 0. Dann gilt lim x→∞ ln x = 0. xα Beweis. Mit der Formel von L’Hospital folgt (i) Mit Satz 3.11.1 1 ln(1 + x) = lim = 1. lim x→0 1 + x x→0 x (ii) Mit Satz 3.11.2 ln x lim x ln x = lim 1 = lim (−x) = 0. x→0 x→0 x x→0 (iii) Mit Satz 3.11.2 1 ln x 1 x = lim = lim = 0. x→0 x−α x→0 (−α)x−α−1 x→0 (−α)x−α lim xα ln x = lim x→0 (iv) 1 ln x 1 x = lim = lim = 0. x→∞ xα x→∞ αxα−1 x→∞ αxα lim 2 Manchmal kann die Regel von L’Hôpital nicht erfolgreich angewendet werden, weil sich die Ausdrücke nicht entscheidend ändern. In dem Fall muss eine geschickte Substitution durchgeführt werden. 3.11. DIE FORMEL VON L’HÔPITAL 203 Beispiel 3.11.3 (i) ex + e−x =1 x→∞ ex − e−x lim Beweis. Wenn wir L’Hôpital zweimal anwenden erhalten wir ex + e−x ex − e−x ex + e−x = lim x = lim x . x −x −x x→∞ e − e x→∞ e + e x→∞ e − e−x lim Wir erhalten also immer dieselben Ausdrücke, was zu keiner Lösung führt. Wir substituieren y = ex . y + y1 1 + y12 ex + e−x = lim = lim =1 lim x x→∞ y − 1 x→∞ 1 − 12 x→∞ e − e−x y y 2 Beispiel 3.11.4 (i) ln(1 + x) √ lim =0 5 x→0 x (ii) x − ln(1 + x) 1 = lim 2 x→0 x 2 (iii) √ lim x→0 1 − x − 1 + 21 x 1 =− 2 x 8 Beweis. (i) 1 4 ln(1 + x) 5x 5 √ = lim 11+x =0 4 = lim 5 x→0 x→0 x− 5 x→0 1 + x x 5 lim (ii) 1 1 − 1+x x − ln(1 + x) = lim = lim x→0 x→0 x→0 x2 2x lim (iii) lim x→0 √ 1+x−1 1+x 2x 1 = lim x→0 − 1 (1 − x)− 2 + 1 − x − 1 + 12 x = lim 2 2 x→0 x 2x 1 2 x 1+x 2x = lim x→0 1 1 = 2(1 + x) 2 3 − 41 (1 − x)− 2 1 =− x→0 2 8 = lim 2 Beispiel 3.11.5 Es sei f : [0, ∞) → R ( f (x) = 1 falls x = 0 xx falls x > 0 (i) f ist differenzierbar auf (0, ∞) und f 0 (x) = xx (1 + ln x). (ii) f ist auf [0, ∞) stetig. (iii) Die rechtseitige Ableitung von f in 0 existiert nicht (sie ist −∞). (iv) f besitzt in 0 ein lokales Maximum und in ist. 1 e ein lokales Minimum, das auch globales Minimum (v) Man kann die obigen Ergebnisse benutzen, um zu entscheiden, welche der beiden Zahlen 100101 und 101100 die größere ist. Beweis. (i) Da ln und e-Funktion differenzierbare Funktionen sind, ist auch die zusammengesetzte Funktion xx = ex ln x differenzierbar. 204 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN 2 1.8 1.6 1.4 1.2 0.5 1 1.5 2 0.8 (ii) f ist in 0 stetig. Mit der Formel von L‘Hôpital folgt lim (x ln x) = 0. x→0 Also gilt lim xx = lim ex ln x = exp( lim x ln x) = e0 = 1. x→0 t (iii) Für alle t ∈ (0, 1) gilt e ≤ x→0 1 1−t . x→0 Hiermit erhalten wir xx − 1 ex ln x − 1 = ≤ x x Falls 1 1−x ln x x −1 = ln x . 1 − x ln x xx − 1 x→0 x lim existieren würde, so wäre die Folge ln n1 1 − n1 ln n1 n∈N nach unten beschränkt. Dies ist nicht der Fall, da lim x ln x = 0 x→0 und ln n1 , n ∈ N, nicht nach unten beschränkt ist. (iv) Die lokalen Extrema sind in 0 und 1e . (xx )0 = (ex ln x )0 = ex ln x (1 + ln x) = xx (1 + ln x) Wir erhalten, dass genau dann (xx )0 = 0 gilt, wenn 1 + ln x = 0 bzw. x = 1e . Genauer gilt (xx )0 < 0 ⇔ 0<x< (xx )0 = 0 ⇔ x= (xx )0 > 0 ⇔ 1 e 1 e 1 x> e Deshalb ist xx nach Lemma 3.6.2 auf [0, 1e ] streng monoton fallend und auf [ 1e , ∞) streng monoton wachsend. Also hat xx in 0 ein lokales Maximum und in 1e ein lokales Minimum, das tatsächlich ein globales Minimum ist. 3.11. DIE FORMEL VON L’HÔPITAL 205 (v) Da xx auf [0, 1e ] streng monoton fallend ist, gilt 1 100 1 100 Es folgen 1 100 < 101 1 101 < 1 101 1 101 . 100 und 101100 < 100101 . 2 Wir wollen nun die Folge betrachten, die durch iteriertes Potenzieren entsteht. Es sei x eine positive Zahl. Wir betrachten die Folge xx x x(x x ) x(x (xx ) ) ...... Beispiel 3.11.6 [2] Es sei x eine positive, reelle Zahl. Wir setzen xn+1 = xxn x1 = x n∈N Die Folge {xn }n∈N , konvergiert genau dann, wenn e−e ≤ x ≤ e1/e . 1 Falls die Folge konvergiert, dann ist der Grenzwert gleich y mit x = y y . Falls x ≥ 1, dann ist die Folge {xn }n∈N monoton wachsend. Falls x < 1, dann ist die Folge {x2n−1 }n∈N monoton wachsend und die Folge {x2n }n∈N monoton fallend. Für x = e1/e konvergiert die Folge gegen e und für x = e−e gegen 1e . 1 Beweis. Wir überlegen uns, dass der Grenzwert der Folge {xn }n∈N gleich y mit x = y y ist, falls sie konvergiert. In der Tat, y = lim xn = lim xn+1 = lim xxn = xlimn→∞ xn = xy . n→∞ n→∞ n→∞ Wir betrachten den Fall 1 ≤ x. Dann gilt für alle n ∈ N xn ≤ xn+1 . Wir zeigen dies durch Induktion. Wegen ln x < x ln x gilt x < xx . xn−1 ≤ xn folgt mit Lemma 3.4.11, dass xxn−1 ≤ xxn also xn ≤ xn+1 . wachsend. Wir zeigen, dass die Folge für x mit 1 ≤ x ≤ e1/e beschränkt ist. dass für alle n ∈ N gilt xn < e. Offensichtlich gilt x1 = x ≤ e1/e < e. Hieraus folgt x1 ≤ x2 . Aus Damit ist die Folge monoton Wir zeigen durch Induktion, Nun der Induktionsschritt. xn+1 = xxn ≤ (e1/e )xn ≤ (e1/e )e = e. 1 Somit haben wir gezeigt, dass die Folge {xn }n∈N für 1 ≤ x ≤ e1/e gegen y mit x = y y konvergiert. Wir wollen nun einsehen, dass die Folge nicht für x > e1/e konvergiert. Falls die Folge nämlich 1 konvergiert, dann muss x im Bild der Funktion y y liegen. Das Bild dieser Funktion ist aber 1 (0, e1/e ]. Dies folgt aus Beispiel 3.11.5: Das Bild von xx ist [e− e , ∞). Deshalb ist das Bild von 1 1 x−x gleich (0, e e ] und somit auch das Bild von y y (wir substituieren x = y1 ). Nun der Fall 0 < x < 1. Es gilt für alle n ∈ N (3.19) x1 < x3 < x5 < · · · < x2n−1 < x2n < · · · < x4 < x2 . Wir weisen dies nach. Nach Lemma 3.4.11 gilt für x mit 0 < x < 1 und 0 < s < t die Ungleichung xt < xs . Deshalb gilt x1 = x < xx = x2 . 206 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Nun der Induktionsschritt. Es gelte (3.19). Dann gelten x2n−1 < x2n < x2n−2 und 0 < x < 1. Deshalb xx2n−2 < xx2n < xx2n−1 , d.h. x2n−1 < x2n+1 < x2n . Hieraus folgt wiederum xx2n < xx2n+1 < xx2n−1 , d.h. x2n+1 < x2n+2 < x2n . Insgesamt haben wir x2n−1 < x2n+1 < x2n+2 < x2n und haben damit (3.19) für alle n ∈ N gezeigt. Somit ist die Folge {x2n }n∈N monoton fallend und beschränkt und die Folge {x2n−1 }n∈N monoton wachsend und beschränkt. Nach Satz 2.3.1 konvergieren beide Folge. Die Folge {xn }n∈N , konvergiert demnach genau dann, wenn wenn die Grenzwerte von {x2n }n∈N und {x2n−1 }n∈N gleich sind. Es bezeichne nun u = lim x2n−1 und n→∞ g = lim x2n . n→∞ Also konvergiert {xn }n∈N , genau dann, wenn u = g gilt. Es gelten xu = g xg = u. und In der Tat, es gilt g = lim x2n = lim xx2n−1 = xlimn→∞ x2n−1 = xu . n→∞ n→∞ g Ebenso folgt u = x . Somit gelten 1 1 x = gu = ug und x(x g ) u xx = u. =g Wir zeigen nun, dass u = g, wenn x ∈ [e−e , 1). Dazu reicht es zu zeigen, dass es genau ein t t t mit x(x ) = t gibt. Die Gleichung x(x ) = t ist äquivalent zu xt ln x = ln t und weiter äquivalent zu t ln x + ln ln 1 1 = ln ln . x t Wir betrachten zunächst den Fall x ∈ (e−e , 1). Falls es zwei Punkte t1 und t2 gibt, die die Gleichung lösen, dann muss es nach dem Mittelwertsatz einen Punkt t0 geben, in dem die Funktion ln ln 1t dieselbe Steigung wie die Gerade t ln x+ln ln x1 besitzt, nämlich ln x. Wegen e−e < x gilt −e < ln x. Andererseits werden wir zeigen, dass die Ableitung von ln ln 1t immer kleiner oder gleich −e ist. d 1 1 ln ln =− dt t t ln 1t Wir bestimmen die Extrema von der Ableitung. d dt 1 − t ln 1t =− ln 1t − 1 (t ln 1t )2 3.11. DIE FORMEL VON L’HÔPITAL 207 Es liegt also für t = 1e ein Maximum vor. Damit ist die Ableitung von ln ln 1t immer kleiner oder gleich −e. Nun der Fall x = e−e . Damit ist die Gleichung 1 t −et + 1 = ln ln Der Punkt t = 1/e ist eine Lösung. Wir zeigen nun, dass es keine weiteren Lösungen gibt. Falls es eine weitere Lösung gibt, dann muss es nach dem Mittelwertsatz neben t = 1/e einen weiteren Punkt geben, in dem die Ableitung von ln ln 1t gleich −e ist. Dies ist aber nicht der Fall. Nun zeigen wir, dass für 0 < x < e−e die Ungleichung g 6= u gilt. Dazu zeigen wir zunächst, dass es zu x zwei Zahlen c und d mit 0 < c < 1e < d < 1, cc = dd und 1 1 x = cd = dc (3.20) c = xd bzw. d = xc und gibt. Zwei Zahlen c und d mit cc = dd heißen Euler Paar und zwei Zahlen a und b heißen Bernoulli Paar, falls ab = ba . Wir benutzen nun Goldbachs Parametrisierung von Bernoulli Paaren. Wir setzen für s ∈ (1, ∞) s 1 1 c(s) = s 1−s x(s) = c(s) d(s) . d(s) = s 1−s Dann ist das Bild von x(s) gleich (0, e−e ) und c(s)c(s) = d(s)d(s) und c(s) < lim c(s) = lim d(s) = s→1 s→1 1 e lim c(s) = 0 1 e < d(s). Es gelten lim d(s) = 1. s→∞ s→∞ Hieraus folgen 1 1 lim x(s) = lim c(s) d(s) = e−e s→1 lim x(s) = lim c(s) d(s) = 0. s→∞ s→1 s→∞ Mit dem Zwischenwertsatz für stetige Funktionen folgt, dass das Bild von x(s) gleich (0, e−e ) ist. s c(s)c(s) = (s 1−s )(s s 1−s 1 ) 1 = s( 1−s s d(s)d(s) = (s 1−s )(s 1 1−s 1 1−s ) ) Wir zeigen nun, dass aus (3.20) für alle n ∈ N x2n−1 < c < 1 < d < x2n e folgt. Dies ergibt sich durch Induktion. Wir überlegen uns zunächst, dass x < c gilt. Wenn dem 1 1 nicht so wäre, dann gilt x ≥ c und somit x1 = x = c d ≤ x d < x, weil d < 1. Somit folgt auch d = xc < xx = x2 . Damit haben wir den Induktionsanfang x1 = x < c < 1 < d < x x = x2 e gezeigt. Nun kommen wir zum Induktionsschritt. Wir nehmen an, dass wir x2n−1 < c < 1 < d < x2n e gezeigt haben. Es gilt x2n+1 = xx2n < xd = c und deshalb x2n+2 = xx2n+1 > xc = d. 2 208 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN 3.12 Gleichmäßige Konvergenz Die gleichmäßige Konvergenz ist ein wichtiger Begriff der Analysis. Wir beweisen hier, dass die Grenzfunktion einer Folge stetiger Funktion, die gleichmäßig konvergiert, wieder stetig ist. In Satz 5.17.1 zeigen wir, dass die Integrale einer Folge von gleichmäßig konvergierenden Funktionen gegen das Integral der Grenzfunktion konvergiert. Definition 3.12.1 Es sei I ein Intervall in R und fn : I → R, n ∈ N, sei eine Folge von Funktionen und f : I → R sei eine Funktion. (i) Die Folge {fn }n∈N konvergiert punktweise gegen f , wenn für alle x ∈ I lim fn (x) = f (x) n→∞ gilt. (ii) Die Folge fn , n ∈ N, konvergiert gleichmäßig gegen f , falls für alle > 0 ein N ∈ N existiert, so dass für alle n > N und alle x ∈ I |fn (x) − f (x)| < gilt. In Quantorenschreibweise nimmt die gleichmäßige Konvergenz die folgende Form an: ∀ > 0 ∃N ∈ N ∀n > N ∀x ∈ I : |fn (x) − f (x)| < oder auch ∀ > 0 ∃N ∈ N ∀n > N : sup |fn (x) − f (x)| < . x∈I Offensichtlich konvergiert eine Folge punktweise, falls sie gleichmäßig konvergiert. Die Umkehrung gilt nicht, wie Beispiele zeigen werden. Formal besteht der Unterschied zwischen punktweiser und gleichmäßiger Konvergenz im Vertauschen von Quantoren Punktweise: Gleichmäßig: ∀x ∈ I ∀ > 0 ∃N ∈ N ∀n > N : ∀ > 0 ∃N ∈ N ∀n > N ∀x ∈ I : |fn (x) − f (x)| < |fn (x) − f (x)| < Bei der punktweisen Konvergenz kann N von x und abhängen, bei der gleichmäßigen Konvergenz hängt N nur von ab, N kann also gleichmäßig für alle x ∈ I gewählt werden. Falls eine Folge punktweise und gleichmäßig konvergiert, dann sind offensichtlich die Grenzfunktionen für die punktweise und gleichmäßige Konvergenz gleich. Dies kann man sich zu Nutze machen, wenn man nachweisen will, dass eine Folge, die punktweise konvergiert, nicht gleichmäßig konvergiert. Man nimmt an, dass sie auch gleichmäßig konvergiert. Unter dieser Annahme kennt man auch die Grenzfunktion, dies ist nämlich der punktweise Grenzwert. 3.12. GLEICHMÄSSIGE KONVERGENZ Die Reihe Teilsummen P∞ n=1 209 fn heißt gleichmäßig konvergent, falls die zugeordnete Folge der ( n ) X fk k=1 n∈N gleichmäßig konvergiert. Man kann die gleichmäßige Konvergenz gut veranschaulichen. Man legt um die Grenzfunktion f einen -Schlauch. Ab einem N müssen alle fn innerhalb dieses Schlauches liegen. f+ f f- f+ fn f f- Lemma 3.12.1 (Cauchy-Kriterium) Es sei I ein Intervall in R und fn : I → R, n ∈ N, sei eine Folge von Funktionen. Die Funktionenfolge {fn }n∈N , konvergiert genau dann gleichmäßig auf einem Intervall I, falls es zu jedem > 0 ein N ∈ N gibt, so dass für alle n, m ∈ N mit n, m > N und alle x ∈ I |fn (x) − fm (x)| < gilt. Beweis. Die Folge {fn }n∈N konvergiere gleichmäßig gegen eine Funktion f . ∀ > 0 ∃N ∈ N ∀n > N ∀x ∈ I : |fn (x) − f (x)| < 2 210 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Hieraus folgt ∀ > 0 ∃N ∈ N ∀n, m > N ∀x ∈ I : und |fn (x) − f (x)| < 2 |fm (x) − f (x)| < . 2 Weiter folgt ∀ > 0 ∃N ∈ N ∀n, m > N ∀x ∈ I : |fn (x) − f (x)| + |fm (x) − f (x)| < . Mit der Dreiecksungleichung folgt ∀ > 0 ∃N ∈ N ∀n, m > N ∀x ∈ I : |fn (x) − fm (x)| < . Nun die andere Richtung. Wir nehmen nun an, dass ∀ > 0 ∃N ∈ N ∀n, m > N ∀x ∈ I : |fn (x) − fm (x)| < . Dann gilt für alle x ∈ I, dass {fn (x)}n∈N , eine Cauchy-Folge ist. Da R vollständig ist, konvergiert diese Cauchy-Folge gegen einen Grenzwert, den wir mit f (x) bezeichnen wollen. Hierdurch definieren wir eine Funktion f : I → R mit f (x) = lim fn (x) = f (x). n→∞ Es gilt also ∀x ∈ I ∀ > 0 ∃Mx, ∈ N ∀m > Mx, : |fm (x) − f (x)| < . Wir zeigen nun, dass die Folge fn , n ∈ N, gleichmäßig gegen die Funktion f konvergiert. Es gilt ∀ > 0 ∃N ∈ N ∀n, m > N ∀x ∈ I : |fn (x) − fm (x)| < . Hieraus folgt mit der Dreiecksungleichung ∀ > 0 ∃N ∈ N ∀n > N ∀x ∈ I ∀m > N : ||fn (x) − f (x)| − |fm (x) − f (x)|| < und somit ∀ > 0 ∃N ∈ N ∀n > N ∀x ∈ I ∀m > N : |fn (x) − f (x)| < + |fm (x) − f (x)|. Zu jedem x ∈ I gibt es ein mx , so dass |fmx (x) − f (x)| < . Es folgt 2 ∀ > 0 ∃N ∈ N ∀n > N ∀x ∈ I : |fn (x) − f (x)| < 2. Man kann sich leicht von dem folgenden überzeugen: Falls fn : I → R, n ∈ N, beschränkte Funktionen sind, die gleichmäßig gegen eine Funktion f konvergieren, dann ist auch f beschränkt. 3.12. GLEICHMÄSSIGE KONVERGENZ 211 Satz 3.12.1 Es sei I ein Intervall und fn : I → R, n ∈ N, sei eine Folge stetiger Funktionen, die gleichmäßig gegen eine Funktion f konvergiert. Dann ist f eine stetige Funktion. Beweis. Da {fn }n∈N , gleichmäßig gegen f konvergiert, gilt ∀ > 0 ∃N ∈ N ∀n > N ∀x ∈ I : |fn (x) − f (x)| < . Da fN +1 stetig ist, gilt ∀x0 ∈ I ∀ > 0 ∃δ > 0 ∀x, |x − x0 | < δ : |fN +1 (x) − fN +1 (x0 )| < . Mit der Dreiecksungleichung folgt ∀x0 ∈ I ∀ > 0 ∃δ > 0 ∀x, |x − x0 | < δ : |f (x) − f (x0 )| ≤ |f (x) − fN +1 (x)| + |fN +1 (x) − fN +1 (x0 )| + |fN +1 (x0 ) − f (x0 )| < 3. Damit ist f stetig. 2 P n Lemma 3.12.2 Es sei f (x) = ∞ n=0 an (x − x0 ) eine Potenzreihe mit Konvergenzradius R (Wir lassen auch R = ∞ zu). Die Potenzreihe ist auf jedem beschränkten, abgeschlossenen Intervall [a, b] mit [a, b] ⊂ (x0 − R, x0 + R) gleichmäßig konvergent. Beweis. Wir zeigen, dass ∀ > 0∃N ∈ N∀n > N ∀x ∈ [a, b] : n ∞ X X k k ak (x − x0 ) − ak (x − x0 ) < . k=0 k=0 Wir wählen r = max{b − x0 , x0 − a}. Dann gelten 0 < r < R und [a, b] ⊂ [x0 − r, x0 + r]. Die Potenzreihe konvergiert absolut in x0 + r. Es gilt also ∀ > 0∃N ∀n > N : ∞ X k=n |ak |rk < . Hiermit folgt für alle x mit |x − x0 | ≤ r n ∞ ∞ ∞ X X X X k k k ak (x − x0 ) − ak (x − x0 ) = ak (x − x0 ) ≤ |ak |rk < . k=0 2 k=0 k=n+1 k=n+1 212 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Beispiel 3.12.1 (i) Für n ∈ N sei fn : R → R durch fn (x) = n1 gegeben. Die Folge {fn }n∈N konvergiert gleichmäßig gegen die Funktion f = 0. (ii) Für n ∈ N sei fn : [0, 1] → R durch fn (x) = xn gegeben. Die Folge {fn }n∈N konvergiert punktweise gegen die Funktion f mit ( 0 für x ∈ [0, 1) f (x) = 1 für x = 1 Die Folge konvergiert aber nicht gleichmäßig gegen f . (iii) Für n ∈ N sei fn : [0, 1] → R durch 2 n x fn (x) = − n2 x + 2n 0 x ∈ [0, n1 ) x ∈ [ n1 , n2 ) x ∈ [ n2 , 1] Die Funktionen fn , n ∈ N, sind stetig. Die Folge konvergiert punktweise gegen f = 0, aber die Folge konvergiert nicht gleichmäßig. Beweis. (i) Wir wählen N so groß, dass N > 1 , bzw. N1 < . Dann gilt für alle n mit n > N und alle x ∈ R 1 |fn (x) − f (x)| = |fn (x)| = < . n (ii) Für x = 0 gilt limn→∞ fn (x) = 0 und für x = 1 gilt limn→∞ fn (x) = 1. Wir betrachten nun x mit 0 < x < 1. Die Folge xn , n ∈ N, ist eine positive, monoton fallende Folge. Somit ist sie konvergent. Es folgt lim xn = x lim xn−1 = x lim xn . n→∞ n→∞ n→∞ n Mit Beispiel 2.3.10 folgt limn→∞ x = 0. Wir nehmen an, dass die Folge {fn }n∈N gleichmäßig gegen eine Funktion f konvergiert. Diese Funktion muss gleich der Funktion sein, gegen die diese Folge punktweise konvergiert. Diese Funktion ist im Punkt x = 1 nicht stetig. Dies widerspricht dem Satz 3.12.1. Wir wollen hier auch den Nachweis führen, ohne Satz 3.12.1 zu benutzen. Wir benutzen nun das Cauchy-Kriterium (Lemma 3.12.1). Die Negation des Cauchy-Kriteriums für die gleichmäßige Konvergenz ist ∃ > 0∀N ∃m, n > N ∃x ∈ [0, 1] : |fn (x) − fm (x)| ≥ . 1 Wir wählen = 41 . Zu gegebenem N wählen wir n > N , m = 2n und x = 2− n . Dann gilt |fn (x) − fm (x)| = |xn − xm | = |xn − x2n | = | 21 − 41 | = 1 4 = . (iii) Die Folge fn , n ∈ N, konvergiert punktweise gegen f = 0. Wir benutzen nun das CauchyKriterium (Lemma 3.12.1). Die Negation des Cauchy-Kriteriums für die gleichmäßige Konvergenz ist ∃ > 0 ∀N ∈ N ∃m, n > N ∃x ∈ [0, 1] : |fn (x) − fm (x)| ≥ . Wir wählen = 1. Zu gegebenem N wählen wir n > N , m = 2n und x = n1 . Dann gilt |fn (x) − fm (x)| = fn ( n1 ) − f2n ( n1 ) = |n − 0| = n ≥ 1 = . 2 Beispiel 3.12.2 (i) Die Folge fn : [0, ∞) → R, n ∈ N, mit fn (x) = x −x e n n2 3.12. GLEICHMÄSSIGE KONVERGENZ 213 konvergiert gleichmäßig gegen 0. (ii) Die Folge gn : [0, ∞) → R, n ∈ N mit gn (x) = x −x e n n konvergiert punktweise gegen 0, aber nicht gleichmäßig gegen 0. Beweis. (i) Die Ableitung von fn ist fn0 (x) = x x 1 −x e n − 3 e− n . n2 n Deshalb gilt genau dann fn0 (x) > 0, wenn x < n und fn0 (x) < 0, wenn x > n. Nach Lemma 3.6.2 ist fn auf [0, n] monoton wachsend und auf [n, ∞) monoton fallend. Deshalb hat fn in x = n ein absolutes Maximum und es gilt 1 0 ≤ fn (x) ≤ fn (n) = . en (ii) Wir zeigen, dass die Folge {gn }n∈N punktweise gegen 0 konvergiert. x x x −x e n = ( lim )( lim e− n ) = 0 n→∞ n n→∞ n→∞ n lim gn (x) = lim n→∞ Wir beobachten, dass für alle n ∈ N die Gleichung gn (n) = Kriterium (Lemma 3.12.1). Wir zeigen, dass ∃ > 0 ∀N ∈ N ∃m, n > N ∃x ∈ [0, 1] : 1 e gilt. Wir benutzen nun das Cauchy- |gn (x) − gm (x)| ≥ . Wir wählen = 19 , n > N , m = 9n und x = n. Dann gilt 1 1 1 1 1 1 1 1 2 1 1 1 |gn (x) − gm (x)| = − e− 9 ≥ − e− 9 ≥ − ≥ − = > = . e 9 e 9 e 9 3 9 9 9 2 Im Teil (ii) findet man wie im Teil (i) das absolute Maximum. Für unser Argument brauchen wir aber nicht zu wissen, dass es sich um ein absolutes Maximum handelt. Beispiel 3.12.3 [107] Die Funktion von Takagi T : R → R ist durch T (x) = ∞ ∞ X X 1 1 k d(2 x, Z) = inf |2k x − m| 2k 2k m∈Z k=0 k=0 gegeben. T ist stetig, aber nirgendwo differenzierbar. Wir beschreiben, weshalb das Ergebnis wahr ist. Die Funktionen x 7→ 2−k inf m∈Z |2k x − m| ist eine Sägezahnfunktion mit Amplitude 2−k−1 und Periode 2−k . Da die einzelnen Funktionen stetig sind und die Reihe wegen der rasch fallenden Amplituden gleichmäßig konvergiert, ist die Grenzfunktion stetig. Andererseits ist die Ableitung der Funktionen in einem gegebenem Punkt entweder 1 oder −1. Die Summe dieser Ableitungen konvergiert nicht. Lemma 3.12.3 Es seien a, b, x, an , bn reelle Zahlen, n ∈ N, so dass für alle n ∈ N die Ungleichungen a < an < x < bn < b gelten, limn→∞ an = x und limn→∞ bn = x. Es sei f : [a, b] → R eine stetige Funktion, die in x differenzierbar ist. Dann gilt lim n→∞ f (bn ) − f (an ) = f 0 (x). bn − a n 214 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Beweis. Mit bn − x bn − an bn − an ≤ bn − an = 1 folgt f (bn ) − f (an ) 0 − f (x) bn − a n bn − x f (bn ) − f (x) x − an f (an ) − f (x) 0 0 = − f (x) + − f (x) bn − an bn − x bn − an an − x bn − x f (bn ) − f (x) x − a f (a n n ) − f (x) 0 0 ≤ − f (x) + − f (x) bn − an bn − x bn − an an − x f (bn ) − f (x) f (a ) − f (x) n ≤ − f 0 (x) + − f 0 (x) . bn − x an − x Wegen f (bn ) − f (x) f (an ) − f (x) lim − f 0 (x) + − f 0 (x) = 0 n→∞ bn − x an − x folgt f (bn ) − f (an ) 0 lim − f (x) = 0. n→∞ bn − an 2 Beweis von Beispiel 3.12.3. Wir zeigen, dass T stetig ist. Die Funktion φ : R → R mit φ(x) = inf m∈Z |x − m| ist stetig. Wir weisen dies nach. Wir zeigen, dass für alle x ∈ R und alle x0 ∈ R (3.21) |φ(x + x0 ) − φ(x0 )| = inf |x + x0 − m| − inf |x0 − m| ≤ |x| m∈Z m∈Z gilt. Wir unterscheiden zwei Fälle: Der erste Fall ist inf |x + x0 − m| − inf |x0 − m| ≥ 0. m∈Z m∈Z Dann gilt inf |x + x0 − m| − inf |x0 − m| m∈Z m∈Z = ≤ inf |x + x0 − m| − inf |x0 − m| m∈Z m∈Z inf (|x| + |x0 − m|) − inf |x0 − m| m∈Z m∈Z = |x| + inf |x0 − m| − inf |x0 − m| = |x|. m∈Z m∈Z Der zweite Fall ist inf |x + x0 − m| − inf |x0 − m| < 0. m∈Z m∈Z Dann gilt inf |x + x0 − m| − inf |x0 − m| = − inf |x + x0 − m| + inf |x0 − m|. m∈Z m∈Z m∈Z m∈Z Wegen inf |x + x0 − m| ≥ inf (|x0 − m| − |x|) = −|x| + inf |x0 − m| m∈Z m∈Z m∈Z gilt − inf |x + x0 − m| ≤ |x| − inf |x0 − m|. m∈Z m∈Z 3.12. GLEICHMÄSSIGE KONVERGENZ 215 Hiermit folgt inf |x + x0 − m| − inf |x0 − m| ≤ |x|. m∈Z m∈Z Damit sind auch die Funktionen φk : R → R mit φk (x) = 2−k φ(2k x) stetig. Mit dem Cauchy Kriterium für gleichmäßige Konvergenz von Reihen (Lemma 3.12.1) folgt, dass die Reihe der stetigen P∞ Funktionen k=0 φk gleichmäßig konvergiert. n n n m n X X X X X ≤ φ (x) − = φ (x) |φ (x)| ≤ φ (x) 2−k ≤ 2−m k k k k k=0 k=m+1 k=0 k=m+1 k=m+1 Mit Satz 3.12.1 folgt, dass die Grenzfunktion stetig ist. Wir zeigen, dass T nirgendwo differenzierbar ist. Es sei x ∈ R und wir nehmen an, dass T in x differenzierbar ist. Zuerst betrachten wir den Fall, dass x kein Element der Menge der dyadischen Brüche D = {i2−n |i, n ∈ Z} ist. Dazu zählen alle irrationalen Zahlen, aber auch rationale wie 13 . Nach Lemma 3.12.3 folgt für alle Folgen un , vn , n ∈ N, mit un < x < vn und limn→∞ vn −un = 0 T (vn ) − T (un ) lim = T 0 (x). n→∞ vn − un Mit φ(x) = inf m∈Z |x − m| folgt T (x) = ∞ ∞ X X 1 1 k inf |2 x − m| = φ(2k x). k 2 m∈Z 2k k=0 k=0 Falls u ∈ D von der Ordnung n ist, d.h. u = 2in , dann gilt für alle k ≥ n, dass 2k u ∈ Z. Da φ(p) = 0 für p ∈ Z gilt, folgt n−1 X 1 T (u) = φ(2k u). 2k k=0 Es seien un , vn aufeinander folgende Zahlen der Ordnung n in D mit un ≤ x < vn , also un = 2inn und vn = in2+1 n . Da x nicht Element von D ist, gilt sogar un < x < vn . Weiter gelten vn − un = (in + 1)2−n − in 2−n = 2−n und n−1 n−1 T (vn ) − T (un ) X 1 φ(2k vn ) − φ(2k un ) X n−k 2 (φ(2k vn ) − φ(2k un )). = = vn − un 2k vn − u n k=0 k=0 Wir zeigen nun, dass für alle 0 ≤ k < n 1 φ(2k vn ) − φ(2k un ) ±2k−n = 2n−k (φ(2k vn ) − φ(2k un )) = k−n = ±1 k 2 vn − un 2 gilt. Es gibt ein kn ∈ Z mit (3.22) in in + 1 , ∈ [kn , kn + 1]. 2n−k 2n−k in Wir überlegen uns dies. Es sei kn die größte, ganze Zahl, die kleiner oder gleich 2n−k ist. Falls in in +1 in 1 1 ≤ (k +1)− gilt, dann gilt ≤ (k +1) und es gilt (3.22). Falls > (k +1)− n n n 2n−k 2n−k 2n−k 2n−k 2n−k gelten würde, dann in + 1 in < kn + 1 < n−k . 2n−k 2 Hieraus folgt in < 2n−k (kn + 1) < in + 1 bzw. 0 < 2n−k (kn + 1) − in < 1. 216 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Dies kann nicht sein, weil 2n−k (kn + 1) − in ∈ N. Deshalb gibt es ein jn mit 0 ≤ jn < 2n−k und jn in = kn + n−k 2n−k 2 in + 1 jn + 1 = kn + n−k . 2n−k 2 Hiermit folgen jn + 1 jn + 1 φ(2k vn ) = φ kn + n−k = φ 2 2n−k und k φ(2 un ) = φ kn + jn 2n−k jn =φ 2n−k . Es ergeben sich drei Fälle: 0≤ jn + 1 1 jn < n−k ≤ 2n−k 2 2 jn + 1 1 jn ≤ n−k < n−k ≤ 1 2 2 2 0≤ jn 1 jn + 1 < < n−k ≤ 1 2n−k 2 2 Im ersten Fall erhalten wir φ jn 2n−k = jn φ 2n−k und damit = jn + 1 2n−k jn 1 jn + 1 − n−k = n−k . n−k 2 2 2 φ(2k vn ) − φ(2k un ) = Im zweiten Fall jn jn = 1 − n−k φ 2n−k 2 jn + 1 2n−k und und damit φ(2k vn ) − φ(2k un ) = − φ jn + 1 2n−k =1− jn + 1 2n−k jn + 1 jn 1 + n−k = − n−k . n−k 2 2 2 Der dritte Fall kann nicht eintreten: Es würde jn < 2n−k−1 < jn + 1 0 < 2n−k−1 − jn < 1 bzw. folgen. Dies kann nicht sein, weil k ≤ n − 1 und damit 2n−k−1 − jn ∈ N. Somit gilt für alle n ∈ N n−1 T (vn ) − T (un ) X = ±1. vn − un k=0 Wir zeigen nun, Pn−1dass dieser Ausdruck nicht für n → ∞ konvergiert. Dazu beobachten wir, dass die Summe k=0 ±1 für gerades n eine gerade Zahl ist und für ungerades n eine ungerade Zahl. Es sei p die Anzahl der Summanden, die gleich 1 sind. Dann sind n − p Summanden gleich -1 und es gilt n−1 X ±1 = p − (n − p) = 2p − n. k=0 Falls also n gerade ist, so ist auch 2p − n gerade und 2p − n ist ungerade, falls n ungerade ist. Nun betrachten wir den Fall, dass x ∈ D, also x = 2jm . Wir wählen vn = x + 21n . Dann gilt für alle n ≥ m T (vn ) − T (x) vn − x = n−1 X k=0 = m−1 X k=0 n−1 1 φ(2k vn ) − φ(2k x) X n−k = 2 (φ(2k vn ) − φ(2k x)) 2k vn − x k=0 2n−k (φ(2k vn ) − φ(2k x)) + n−1 X k=m 2n−k (φ(2k vn ) − φ(2k x)). 3.13. UNSTETIGE ABLEITUNGEN 217 Es gelten für alle k mit m ≤ k ≤ n − 1, dass φ(2k x) = 0 und 1 = φ 2k−n = 2k−n . φ(2k vn ) = φ 2k x + n 2 Hiermit folgt m−1 X T (vn ) − T (x) = 2n−k (φ(2k vn ) − φ(2k x)) + (n − m). vn − x k=0 Wegen (3.21) gilt |φ(2k vn ) − φ(2k x)| ≤ 2k−n . Hiermit und der Dreiecksungleichung folgt T (vn ) − T (x) ≥ (n − m) − m = n − 2m. vn − x Damit konvergiert der Differenzenquotient nicht für n gegen ∞. 2 3.13 Unstetige Ableitungen Satz 3.13.1 Es sei f : R → R eine differenzierbare Funktion. Dann ist die Menge der Punkte, in denen f 0 stetig ist, nicht leer. Die Menge ist eine dichte Gδ -Teilmenge von R. siehe Munkres, Topology. Satz 3.13.2 Eine Funktion g : R → R hat genau dann eine Stammfunktion, wenn die Menge ihrer Unstetigkeitsstellen eine magere Fσ -Teilmenge von R ist. Beispiel 3.13.1 (Volterra Funktion) 218 CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN Chapter 4 Metrische Räume Wir führen hier metrische Räume ein und besprechen deren elementare Eigenschaften. Wir untersuchen ofene, abgechlossene und kompakte Mengen. Weiter betrachten wir stetige Abbildungen zwischen metrischen Räumen. Normierte Räume können als metrische Räume aufgefasst werden. Insbesondere ist der Rn mit der Euklidischen Norm für uns von Bedeutung. 4.1 Metrische Räume Definition 4.1.1 Es sei M eine Menge. Eine Funktion d : M × M → R heißt Metrik auf M , falls (i) ∀x, y ∈ M : d(x, y) ≥ 0 (ii) ∀x, y ∈ M : d(x, y) = 0 ⇔ x = y (iii) ∀x, y ∈ M : d(x, y) = d(y, x) (iv) ∀x, y, z ∈ M : d(x, z) ≤ d(x, y) + d(y, z) Eine Menge mit einer Metrik (M, d) heißt metrischer Raum. Die Abschätzung (iv) nennt man Dreiecksungleichung. In einem metrischen Raum gilt die inverse Dreiecksungleichung, d.h. für alle x, y, z ∈ M gilt d(x, y) ≥ |d(x, z) − d(z, y)|. Definition 4.1.2 Es sei (M, d) ein metrischer Raum, x0 ∈ M und r ≥ 0. Die Teilmenge B(x0 , r) = {x ∈ M |d(x, x0 ) ≤ r} heißt (abgeschlossene) Kugel um x0 mit Radius r. Die Menge {x ∈ M |d(x, x0 ) < r} 219 220 CHAPTER 4. METRISCHE RÄUME nennen wir die offene Kugel um x0 mit Radius r. Eine Teilmenge U (x0 ) von M heißt Umgebung von x0 , falls es ein r > 0 gibt, so dass B(x0 , r) ⊆ U (x0 ). Definition 4.1.3 Ein Punkt x einer Menge A heißt innerer Punkt von A, wenn es eine Umgebung U (x) gibt, so dass U (x) ⊆ A. Eine Menge A heißt offen, wenn alle Punkte von A innere Punkte von A sind. Eine Menge A heißt abgeschlossen, falls das Komplement Ac offen ist. Definition 4.1.4 Der offene Kern einer Menge A ist ◦ A= {x ∈ A|x ist innerer Punkt von A}. Definition 4.1.5 (i) Ein Punkt x0 ∈ M heißt Häufungspunkt der Menge A, falls in jeder Umgebung U (x0 ) ein Punkt x ∈ A mit x 6= x0 liegt. (ii) Ein Punkt x0 ∈ M heißt Häufungspunkt der Folge xn , n ∈ N, falls in jeder Umgebung U (x0 ) unendlich viele Elemente der Folge liegen. Beispiel 4.1.1 Es sei (M, d) ein metrischer Raum. Dann gelten (i) ∅ und M sind offene Mengen. (ii) ∅ und M sind abgeschlossene Mengen. (iii) Für alle r > 0 und alle x0 ∈ M ist B(x0 , r) = {x|d(x0 , x) ≤ r} eine abgeschlossene Menge. (iv) Für alle r > 0 und alle x0 ∈ M ist {x|d(x0 , x) < r} eine offene Menge. Beweis. (i) Die leere Menge besitzt keine Punkte. Deshalb ist jeder Punkt der leeren Menge ein innerer Punkt. M ist Umgebung aller ihrer Punkte und damit offen. (ii) Da ∅ und M offen sind, sind deren Komplemente abgeschlossen. (iii) Wir müssen zeigen, dass B(x0 , r)c = {x|d(x0 , x) > r} eine offene Menge ist. Es sei y ∈ B(x0 , r)c , also d(y, x0 ) > r. Wir zeigen, dass y innerer Punkt der Menge B(x0 , r)c ist. Dazu weisen wir nach, dass d(y, x0 ) − r ⊆ B(x0 , r)c B y, 2 gilt. Es sei d(y, x0 ) − r x ∈ B y, . 2 Falls x = y, dann gilt y ∈ B(x0 , r)c . Nun der Fall x 6= y. Dann gelten 0 < d(x, y) und d(x, y) ≤ d(y, x0 ) − r . 2 Somit r < r + d(x, y) ≤ d(y, x0 ) − d(x, y) ≤ d(x0 , x). 2 4.1. METRISCHE RÄUME 221 Beispiel 4.1.2 (i) (R, d) mit d(x, y) = |x − y| ist ein metrischer Raum. (ii) Es sei M eine Menge und ( d(x, y) = 0 falls x = y 1 falls x 6= y Dann ist (M, d) ein metrischer Raum. Weiter gelten ◦ B(x0 , 1) = R B (x0 , 1) = R {x|d(x0 , x) < 1} = {x0 } Die Metrik (ii) heißt diskrete Metrik. Sie wird manchmal auch als Metrik des öffentlichen Nahverkehrs bezeichnet. Als Abstand zwischen zwei Punkten wird der Fahrpreis genommen. In manchen Städten wird ein Einheitspreis erhoben. Man könnte vermuten, dass ◦ B (x0 , r) = {x|d(x0 , x) < r} gilt. Dies ist i.A. falsch. Dazu das nächste Beispiel. Offene Kugeln sind offene Mengen und abgeschlossene Kugeln sind abgeschlossene Mengen. Man beachte, dass der Abschluss einer offenen Kugel {x|d(x, y) < r} in der abgeschlossenen Kugel {x|d(x, y) ≤ r} enthalten ist, i.A. aber keine Gleichheit herrscht. Wir geben dazu ein Beispiel an. Beispiel 4.1.3 Es sei M = {−1, 0} ∪ (−∞, −2] ∪ ( 12 , 1) ∪ (1, ∞) und d sei die Metrik, die durch d(x, y) = |x − y| definiert ist. Dann gelten (i) {x|d(0, x) < 1} = 6 {x|d(0, x) ≤ 1}. (ii) {x|d(0, x) < 1} ist offen. Diese Menge ist keine offene Kugel, d.h. für alle y und r > 0 gilt {x|d(0, x) < 1} = 6 {x|d(y, x) ≤ r}. (iii) {x|d(0, x) < 1} ist abgeschlossen, aber keine abgeschlossene Kugel, d.h. für alle y and r > 0 gilt {x|d(0, x) < 1} = 6 {x|d(y, x) ≤ r}. Beweis. Es gelten {x|d(0, x) < 1} = {0} ∪ ( 12 , 1), 1 {x|d(0, x) < 1} = {−1, 0} ∪ ( , 1) 2 und {x|d(0, x) < 1} = B(0, 1). Beispiel 4.1.4 Die reellen Zahlen R seien mit den Metriken d1 (s, t) = |s − t| und s t d2 (s, t) = − . 1 + |s| 1 + |t| ausgestattet. Die offenen Mengen in (R, d1 ) und (R, d2 ) sind dieselben, (R, d1 ) ist vollständig, aber (R, d2 ) ist nicht vollständig. Die Folge n, n ∈ N, ist eine Cauchy Folge in (R, d2 ), die nicht konvergiert. 222 CHAPTER 4. METRISCHE RÄUME Lemma 4.1.1 Es sei (M, d) ein metrischer Raum. (i) Die Vereinigung von offenen Mengen ist offen. (ii) Der Durchschnitt abgeschlossener Mengen ist abgeschlossen. (iii) Der Durchschnitt endlich vieler offener Mengen ist offen. (iv) Die Vereinigung endlich vieler abgeschlossener Mengen ist abgeschlossen. Beweis. (i) Oι , ι ∈ I, seien offene Mengen. Wir zeigen, dass auch [ Oι ι∈I S offen ist. Es sei x ∈ ι∈I Oι . Dann gibt es ein ι0 mit x ∈ Oι0 . Da Oι0 eine offene Menge S ist, gibt es eine Umgebung U (x) mit U (x) ⊆ Oι0 . Also ist x innerer Punkt von ι∈I Oι . T (ii) Aι , ι ∈ I seien abgeschlossene Mengen. Wir zeigen, dass ι∈I Aι abgeschlossen ist. Da Aι abgeschlossen ist, ist Acι offen. Nach (i) ist [ Acι ι∈I offen. Mit der Regel von deMorgan folgt !c [ \ c Aι = Aι ι∈I ι∈I abgeschlossen. 2 Definition 4.1.6 Der Abschluss Ā einer Teilmenge A eines metrischen Raumes ist der Durchschnitt aller abgeschlossenen Mengen, die A enthalten. Nach Lemma ?? ist der Abschluss einer Menge abgeschlossen. Der Abschluss einer Menge A ist die kleinste abgeschlossene Menge, die die Menge A umfasst. Definition 4.1.7 Es sei (M, d) ein metrischer Raum. Eine Teilmenge A von M heißt dicht in M , wenn Ā = M . Der Rand einer Menge A ist ◦ ∂A = A\ A . Lemma 4.1.2 Es sei A eine Teilmenge eines metrischen Raumes (M, d). Dann sind äquivalent: (i) A ist abgeschlossen. (ii) A = Ā (iii) A enthält alle ihre Häufungspunkte. 4.1. METRISCHE RÄUME 223 Beweis. (i) ⇒ (ii) Offenbar gilt immer A ⊆ Ā. Der Abschluss der Menge A ist der Durchschnitt aller abgeschlossenen Mengen, die A als Teilmenge enthalten. Da aber A selbst abgeschlossen ist und sich als Teilmenge enthält ist sie selbst eine solche Menge, über die der Durchschnitt gebildet wird. Also gilt Ā = A. (ii) ⇒ (i) Ā ist der Durchschnitt aller abgeschlossenen Mengen, die A enthalten. Nach Lemma 4.1.1 ist der Durchschnitt abgeschlossener Mengen abgeschlossen, also ist Ā abgeschlossen. Da A = Ā gilt, ist also A abgeschlossen. (i) ⇒ (iii) Wir zeigen, dass x ∈ A, falls x Häufungspunkt von A ist, bzw. dass x kein Häufungspunkt von A ist, falls x ∈ / A. c c Falls x ∈ / A, dann x ∈ A . A ist eine offene Menge, weil A eine abgeschlossene Menge ist. Also gibt es eine Umgebung U (x) mit U (x) ⊆ Ac und x ist kein Häufungspunkt von A. (iii) ⇒ (i) Wir zeigen, dass A nicht alle ihre Häufungspunkte enthält, falls A nicht abgeschlossen ist. Es sei also A nicht abgeschlossen. Dann ist Ac nicht offen. Dann gibt es einen Punkt x ∈ Ac , der nicht innerer Punkt von Ac ist. Somit gilt ∀U (x) : U (x) * Ac . Also ∃x ∈ Ac ∀U (x) : U (x) ∩ A 6= ∅ Also ist x ein Häufungspunkt von A, der nicht in A enthalten ist. 2 Beispiel 4.1.5 Es seien die reellen Zahlen R mit der Metrik d(x, y) = |x − y| ausgestattet. Dann gilt Q = R. Definition 4.1.8 (i) Eine Folge {xn }n∈N in einem metrischen Raum (M, d) heißt konvergent gegen x, falls es für alle > 0 ein N ∈ N gibt, so dass für alle n > N d(x, xn ) < gilt. (ii) Eine Folge {xn }n∈N in einem metrischen Raum (M, d) heißt Cauchy Folge, falls es für alle > 0 ein N ∈ N existiert, so dass für alle n, m > N d(xn , xm ) < gilt. (iii) Eine Teilmenge eines metrischen Raumes heißt vollständig, falls jede Cauchy Folge dieser Menge in ihr konvergiert. Lemma 4.1.3 (i) Eine vollständige Teilmenge eines metrischen Raumes ist abgeschlossen. (ii) Eine abgeschlossene Teilmenge eines vollständigen, metrischen Raumes ist vollständig. 224 CHAPTER 4. METRISCHE RÄUME Beweis. (i) Es sei (M, d) ein metrischer Raum. Wir zeigen, dass eine Teilmenge A nicht vollständig ist, wenn sie nicht abgeschlossen ist. Wir nehmen also an, dass die Menge A nicht abgeschlossen ist. Dann gilt A 6= M und Ac ist nicht offen. Es gibt folglich ein x ∈ Ac , das nicht innerer Punkt von Ac ist. Deshalb gilt für alle n ∈ N B(x, n1 ) ∩ A 6= ∅. Also gibt es für jedes n ∈ N ein xn ∈ B(x, n1 ) ∩ A. Somit lim xn = x, n→∞ aber der (eindeutige) Grenzwert liegt nicht in A. (ii) Es sei (M, d) ein vollständiger, metrischer Raum und A eine abgeschlossene Teilmenge. Weiter sei {xn }n∈N eine Cauchy Folge in A. Da (M, d) vollständig ist, konvergiert die Folge in M . x0 = lim xn n→∞ Wir zeigen nun, dass x0 ∈ A. Falls x0 ∈ Ac , dann gibt es eine Umgebung U (x0 ) von x0 mit U (x0 ) ⊆ Ac und die Folge kann nicht gegen x0 konvergieren. 2 Definition 4.1.9 Eine Familie von offenen Mengen Oi , i ∈ I, heißt offene Überdeckung einer Menge K, falls [ K⊆ Oi . i∈I Eine endliche Teilüberdeckung einer offenen Überdeckung Oi , i ∈ I, von K ist eine endliche Teilfamilie Oi1 , . . . , Oin mit K ⊆ Oi1 ∪ · · · ∪ Oin . Eine Teilmenge K eines metrischen Raumes heißt kompakt, falls jede offene Überdeckung eine endliche Teilüberdeckung besitzt, d.h. [ K⊆ Oi =⇒ ∃n ∈ N∃i1 , . . . , in : K ⊆ Oi1 ∪ Oi2 ∪ · · · ∪ Oin . i∈I Beispiel 4.1.6 (i) Die Teilmenge { n1 |n ∈ N} von R ist nicht kompakt. (ii) Die Teilmenge {0} ∪ { n1 |n ∈ N} von R ist kompakt. Beweis. (i) Wir wählen 1 1 Mn = x d x, < 2 n 4n Dann ist Mn , n ∈ N, eine offene Überdeckung, aber es gibt keine endliche Teilüberdeckung. Dies gilt, weil für alle m 6= n m∈ / Mn 4.1. METRISCHE RÄUME 225 gilt. Wir prüfen dies nach. d 1 1 , n m 1 1 = − n m Das Minimum wird hier für m = n + 1 angenommen. Also gilt 1 1 1 1 d , ≥ > 2 n m n(n + 1) 4n (ii) Es sei Oi , i ∈ I, eine offene Überdeckung. Dann gibt es ein Oi0 mit 0 ∈ Oi0 . Dann gibt es ein > 0 mit B(0, ) ⊆ Oi0 Dann gilt weiter Weiter gibt es für n ∈ N mit 1 n 1 1 < ⊆ Oi0 n n ≥ eine Menge Oin mit 1 ∈ Oin n Damit ist die Familie Oi0 , Oi1 , . . . , Oi[ 1 ] eine endliche Teilüberdeckung. 2 Definition 4.1.10 Eine Teilmenge K eines metrischen Raumes heißt total beschränkt, falls es zu jedem > 0 endlich viele Kugeln B(x1 , ), . . . , B(xn , ) mit demselben Radius gibt, so dass n [ K⊆ B(xi , ) i=1 gilt. Man beachte, dass wir in der Definition der totalen Beschränktheit nicht gefordert wird, dass die Mittelpunkte der Kugeln Elemente der Menge K sind. In der Literatur findet man auch diese Definition. Tatsächlich sind beide Definitionen äquivalent. Satz 4.1.1 Es sei (M, d) ein metrischer Raum und K eine Teilmenge dieses metrischen Raumes. Dann sind äquivalent: (i) K ist kompakt. (ii) (Bolzano-Weierstraß) Jede Folge in K hat eine Teilfolge, die in K konvergiert. (iii) K ist vollständig und total beschränkt. Beweis. (i) ⇒ (ii). Tatsächlich zeigen wir ¬(ii) ⇒ ¬(i). Es sei {xn }n∈N eine Folge in K, die keine Teilfolge hat, die in K konvergiert. Dann gibt es zu jedem x ∈ K eine Kugel B(x, x ), in der höchstens endlich viele Elemente der Folge {xn }n∈N liegen. Wir prüfen dies nach. Dazu nehmen wir an, dass es ein x ∈ K gibt, so dass für alle > 0 unendlich viele Elemente der Folge in B(x, ) liegen. Wir konstruieren nun eine Teilfolge, die gegen x konvergiert. Wir finden eine Teilfolge xnk , k ∈ N, mit d(x, xnk ) < k1 . Wir wählen 226 CHAPTER 4. METRISCHE RÄUME als xn1 ein Element der Folge, das in B(x, 1) liegt. Wenn die ersten k Elemente 1 ) mit xn1 , . . . , xnk der Teilfolge gewählt sind, dann wählen wir ein xnk+1 ∈ B(x, k+1 1 nk < nk+1 . Dies ist möglich, weil in B(x, k+1 ) unendlich viele Elemente der Folge liegen. Die so konstruierte Teilfolge konvergiert gegen x. Dies ist ein Widerspruch. Die Familie ◦ x∈K B (x, x ) ist eine offene Überdeckung von K. Sie besitzt keine endliche Teilüberdeckung, weil in jeder der Mengen nur endlich viele Elemente der Folge enthalten sind. (ii) ⇒ (iii) Wir zeigen: Falls K nicht vollständig ist oder nicht total beschränkt ist, dann gibt es in K eine Folge, die keine in K konvergente Teilfolge besitzt. Wir nehmen zunächst an, dass K nicht vollständig ist. Dann gibt es eine CauchyFolge in K, die nicht in K konvergiert. Diese Cauchy-Folge besitzt auch keine Teilfolge, die in K konvergiert, weil sonst bereits die Cauchy-Folge selbst in K konvergieren würde. Wir nehmen nun an, dass K nicht total beschränkt ist. Dann gibt es ein > 0, so dass für alle k ∈ N und alle xn1 , . . . , xnk ∈ K K* k [ B(xni , ) i=1 gilt. Nun wählen wir eine Folge xn ∈ K, n ∈ N, so dass für alle n, m ∈ N d(xn , xm ) > gilt. Wir wählen x1 ∈ K. Wenn x1 , . . . , xn gewählt sind, dann wählen wir xn+1 in der Menge n [ K\ B(xj , ) j=1 Diese Menge ist nicht leer. 2 Korollar 4.1.1 Eine kompakte Menge ist abgeschlossen. Beweis. Wegen Satz 4.1.1 ist eine kompakte Menge vollständig. Nach Lemma 4.1.3 ist eine vollständige Menge abgeschlossen. 2 4.2 Vervollständigung metrischer Räume 4.3 Normierte Räume Definition 4.3.1 Es sei X ein Vektorraum über R oder C. Eine Norm auf X ist eine Funktion k k : X → [0, ∞) 4.3. NORMIERTE RÄUME 227 so dass (i) für alle x ∈ X und alle t ∈ K (R, C) ktxk = |t| kxk (ii) x = 0 genau dann, wenn kxk = 0. (iii) für alle x, y ∈ X kx + yk ≤ kxk + kyk gilt. (X, k k) heißt normierter Raum. In normierten Räumen gilt die umgekehrte Dreiecksungleichung ∀x, y ∈ X : |kxk − kyk| ≤ kxk + kyk. Wir beobachten, dass d : X × X → [0, ∞) d(x, y) = kx − yk eine Metrik auf X ist. Damit übertragen sich Begriffe und Eigenschaften metrischer Vektorräume auf normierte Vektorräume. Ein normierter Raum ist vollständig, wenn jede Cauchy Folge konvergiert. Ein vollständiger, normierter Raum heißt Banachraum. Die Kugel um x0 ∈ X mit Radius r ≥ 0 ist die Menge B(x0 , r) = {x|kx − x0 k ≤ r}. Eine Menge A in einem normierten Raum heißt beschränkt, wenn es ein r > 0 mit A ⊆ B(0, r) gibt. Lemma 4.3.1 Es sei X ein normierter Raum und es gelte x = lim xn . n→∞ Dann gilt kxk = lim kxn k. n→∞ Beweis. Es gilt ∀ > 0∃N ∈ N∀n > N : kx − xn k < . Hieraus folgt sofort mit der umgekehrten Dreiecksungleichung ∀ > 0∃N ∈ N∀n > N : |kxk − kxn k| < . Auf dem Rn betrachten wir die Norm kxk = n X i=1 ! 21 |xi |2 = √ < x, x >. Diese Norm bezeichnet man als Euklidische Norm . 228 CHAPTER 4. METRISCHE RÄUME Lemma 4.3.2 k · k ist eine Norm auf dem Rn und es gilt für alle x, y ∈ Rn | < x, y > | ≤ kxkkyk. Die Ungleichung wird als Ungleichung von Cauchy-Schwarz bezeichnet. Beweis. Offensichtlich gilt kxk ≥ 0 und falls x 6= 0, dann gilt kxk > 0. Für alle t ∈ R und alle x ∈ Rn gilt ktxk = n X i=1 ! 12 |txi |2 = |t| n X i=1 ! 12 |xi |2 = |t|kxk. Wir zeigen nun, dass für alle x, y ∈ Rn die Ungleichung | < x, y > | ≤ kxkkyk gilt. Die Behauptung ist offensichtlich, falls y = 0. Wir können also annehmen, dass y 6= 0. < x, y > < x, y > y, x − y 0 ≤ x− < y, y > < y, y > < x, y >2 < x, y >2 < x, y >2 =< x, x > −2 + =< x, x > − < y, y > < y, y > < y, y > Damit folgt für alle x, y ∈ Rn < x, y >2 ≤< x, >< y, y >= kxk2 kyk2 . Nun weisen wir die Dreiecksungleichung nach. Für alle x, y ∈ Rn gilt kx + yk2 =< x + y, x + y >=< x, x > +2 < x, y > + < y, y > . Mit der Cauchy-Schwarz Ungleichung folgt kx + yk2 ≤ kxk2 + 2kxkyk + kyk2 = (kxk + kyk)2 . 2 Beispiel 4.3.1 Es werden auch durch kxk1 = n X i=1 |xi | kxk∞ = max |xi | 1≤i≤n Normen auf dem Rn definiert. Lemma 4.3.3 Eine Folge {xk }k∈N im Rn ist genau dann konvergent, wenn alle Folgen der Koordinaten {xk (i)}k∈N , i = 1, . . . , n, konvergieren. Außerdem ist eine Folge {xk }k∈N im Rn ist genau dann eine Cauchy Folge, wenn alle Folgen der Koordinaten {xk (i)}k∈N , i = 1, . . . , n, Cauchy Folgen sind. 4.3. NORMIERTE RÄUME 229 Beweis. Wir nehmen an, dass die Folge {xk }k∈N konvergiert. Also gibt es ein x0 , so dass für alle ein N existiert, so dass für alle k mit k > N gilt kx0 − xk k < . Also gilt für alle i = 1, . . . , n > kx0 − xk k = n X i=1 ! 21 |x0 (i) − xk (i)|2 ≥ |x0 (i) − xk (i)|. Wir nehmen nun umgekehrt an, dass für alle i = 1, . . . , n gilt: ∀∃Ni ∈ N∀k > Ni : |x0 (i) − xk (i)| < . Wir wählen nun N = max1≤i≤n Ni . Dann gilt ∀∃N ∈ N∀k > N : n X i=1 |x0 (i) − xk (i)|2 < n2 . Hieraus folgt ∀∃N ∈ N∀k > N : v u n uX √ t |x0 (i) − xk (i)|2 < n. i=1 2 Korollar 4.3.1 Der Rn mit der Euklidischen Norm ist vollständig. Beweis. Nach Lemma 4.3.3 reicht es zu zeigen, dass die Koordinatenfolgen konvergieren. Dies gilt aber, weil R vollständig ist (Satz 2.3.2). 2 Definition 4.3.2 Wir sagen, dass zwei Normen k k1 und k k2 auf einem Vektorraum X äquivalent sind, wenn es Konstanten c1 und c2 gibt, sa dass für alle x ∈ X c1 kxk1 ≤ kxk2 ≤ c2 kxk1 gilt. Beispiel 4.3.2 Wir betrachten auf dem Rn die Normen kxk1 = n X i=1 |xi | Dann gilt für alle x ∈ Rn kx||2 = n X i=1 ! 21 |xi | 2 1 √ kxk1 ≤ kxk2 ≤ kxk1 n √ kxk∞ ≤ kxk2 ≤ nkxk∞ kxk∞ = max |xi |. 1≤i≤n 230 CHAPTER 4. METRISCHE RÄUME Beweis. Es sei ei = (0, . . . , 0, 1, 0, . . . , 0) i = 1, 2, . . . , n n die Standardbasis im R . Dann folgt mit der Dreieckungleichung n n X X kxk = xi ei ≤ |xi |kei k = kxk1 . i=1 i=1 Mit der Cauchy-Schwarz Ungleichung n X i=1 |xi | ≤ k(1, . . . , 1)k2 kxk2 = √ nkxk2 . Für alle x ∈ Rn und j = 1, . . . , n gilt n X kxk2 = i=1 ! 21 |xi | 2 ≥ |xj |. Also kxk2 ≥ kxk∞ . Weiter kxk2 = n X i=1 ! 21 |xi |2 ≤ n X i=1 ! 12 | max |xj ||2 ≤ 1≤j≤n √ nkxk∞ . 2 Lemma 4.3.4 Eine Teilmenge des Rn mit der Euklidischen Norm ist genau dann beschränkt, wenn sie total beschränkt ist. Satz 4.3.1 Eine Teilmenge des Rn mit der Euklidischen Norm ist genau dann kompakt, wenn sie abgeschlossen und beschränkt ist. Beweis. Nach Satz 4.1.1 ist eine kompakte Menge vollständig und total beschränkt. Wegen Korollar 4.1.1 ist sie also abgeschlossen. Außerdem ist eine total beschränkte Menge nach Lemma 4.3.4 beschränkt. Nach Lemma 4.3.4 ist eine beschränkte Menge total beschränkt. Nach Lemma 4.1.3 ist eine abgeschlossene Teilmenge eines vollständigen, metrischen Raumes vollständig. Nun wenden wir wieder Satz 4.1.1 an. 2 Beispiel 4.3.3 Es sei der Rn ausgestattet mit der Euklidischen Norm. Dann ist die abgeschlossene Einheitskugel kompakt. Beispiel 4.3.4 Wir bezeichnen ( `2 = x= {x(i)}∞ i=1 ) ∞ X 2 |x(i)| < ∞ ∀i ∈ N : x(i) ∈ R ∧ i=1 Dann gelten (i) `2 ist ein Vektorraum über dem Körper R. (ii) Es sei die Abbildung k k2 : `2 → R für x ∈ `2 durch kxk2 = ∞ X i=1 ! 21 2 |x(i)| 4.3. NORMIERTE RÄUME 231 definiert. k k2 ist eine Norm auf `2 . (iii) Die Einheitskugel in `2 B2 (0, 1) = {x ∈ `2 |kxk2 ≤ 1} ist beschränkt, nicht total beschränkt und nicht kompakt. Beweis. (i) Wir zeigen, dass mit x, y ∈ `2 auch x + y ∈ `2 : Für alle n ∈ N gilt ! 12 ! 12 ! 21 n n n X X X 2 2 2 ≤ + |x(i) + y(i)| |x(i)| |y(i)| i=1 i=1 ∞ X ≤ i=1 i=1 ! 21 |x(i)|2 ∞ X + i=1 ! 21 |y(i)|2 <∞ Es folgt ∞ X i=1 ! 21 2 <∞ |x(i) + y(i)| (ii) Wir zeigen die Dreiecksungleichung. Für alle n ∈ N gilt ! 12 ! 12 n n X X 2 2 ≤ |x(i)| + |x(i) + y(i)| n X i=1 i=1 ∞ X ≤ i=1 i=1 ! 12 |x(i)| 2 ∞ X + i=1 ! 21 2 |y(i)| ! 12 |y(i)| 2 Es folgt ∞ X i=1 ! 12 |x(i) + y(i)| 2 ≤ (iii) Wir betrachten die Folge {en }n∈N mit ∞ X i=1 en (i) = Dann gilt für n 6= m ! 21 |x(i)| 0 1 2 + ∞ X i=1 ! 21 |y(i)| 2 i 6= n i=n ken − em k2 = √ 2. Wir nehmen an, dass die abgeschlossene Einheitskugel total beschränkt ist. Dann gibt es endlich viele Kugeln B(x1 , 14 ), . . . , B(xN , 14 ) mit B(0, 1) ⊆ N [ B(xi , 41 ) i=1 1 4 ), Also gibt es eine Kugel B(xi0 , die mindestens zwei verschiedene Vektoren en und em enthält. Mit der Dreiecksungleichung folgt √ 1 2 = ken − em k ≤ ken − xi0 k + kxi0 − em k ≤ 2 Dies ist ein Widerspruch. 2 Wir sagen, dass die Menge M die Konvergenzmenge der Reihe ( ) ∞ X M = x ∈ Rn ∃π : x = xπ(k) . k=1 Einen Beweis für den folgenden Satz findet man in [48]. P∞ k=1 xk ist, wobei 232 CHAPTER 4. METRISCHE RÄUME Satz 4.3.2 (E. Steinitz) Die Konvergenzmenge einer Reihe ist die leere Menge oder sie ist von der Form x0 + L, wobei x0 ∈ Rn und L ein Teilraum von Rn ist. Dies ist eine Verallgemeinerung des Umordnungssatzes von Riemann. Beispiel 4.3.5 (i) Der Raum der stetigen Funktionen C[a, b] mit der Norm kf k = max |f (x)| x∈[a,b] ist ein Banachraum. Die abgeschlossene Einheitskugel ist nicht kompakt. (ii) Der Raum der beschränkten Folgen ∞ `∞ = (x(i))i=1 sup |x(i)| < ∞ i∈N mit der Norm kxk∞ = sup |x(i)| i∈N ist ein Banachraum. (iii) Der Raum aller konvergenten Folgen n o c = (x(i))∞ i=1 lim xi existiert i→∞ mit der Norm kxk∞ = sup |x(i)| i∈N ist ein Banachraum. c ist ein abgeschlossener Teilraum von `∞ . (iv) Der Raum aller gegen 0 konvergenten Folgen o n c0 = (x(i))∞ lim x(i) = 0 i=1 i→∞ mit der Norm kxk∞ = sup |x(i)| i∈N ist ein Banachraum. c0 ist ein abgeschlossener Teilraum von c und `∞ . Beweis. (i) Wir zeigen, dass die abgeschlossene Einheitskugel von C[a, b] nicht kompakt ist. Dazu geben wir eine Folge {hn }n∈N in C[a, b] an, die keine Teilfolge besitzt, die konvergiert. Um die Notationen einfacher zu halten, machen wir dies für a = 0 und b = 1. Wir definieren hn , 1 so dass hn auf den Intervallen [0, n+1 ] und [ n1 , 1] den Wert 0 annimmt. Außerdem setzen wir 1 1 1 hn ( 2 ( n+1 + n )) = 1 und alle übrigen Funktionswerte sind zwischen 0 und 1. Dann gilt für alle n ∈ N, dass khn k∞ = 1 und für alle n 6= m khn − hm k∞ = 1. Wir weisen die Vollständigkeit nach. Es sei {fn }n∈N eine Cauchy Folge in C[a, b]. Dann gilt ∀ > 0∃N ∈ N∀n, m ≥ N : sup |fn (x) − fm (x)| < x∈[a,b] Es folgt ∀ > 0∃N ∈ N∀n, m ≥ N ∀x ∈ [a, b] : |fn (x) − fm (x)| < 4.4. STETIGE ABBILDUNGEN ZWISCHEN METRISCHEN RÄUMEN 233 Insbesondere ist für alle x ∈ [a, b] die Folge {fn (x)}n∈N eine Cauchy Folge. Da R vollständig ist, konvergiert diese Folge. Wir setzen f (x) = lim fn (x). n→∞ Wir zeigen, dass die Folge {fn }n∈N gleichmässig gegen f konvergiert. Es gilt ∀ > 0∃N ∈ N∀n ≥ N ∀x ∈ [a, b]∀m ∈ N : |fn (x) − fm (x)| < Es folgt ∀ > 0∃N ∈ N∀n ≥ N ∀x ∈ [a, b] : |fn (x) − f (x)| < . Nach Analysis I ist die Grenzfunktion einer Folge von stetigen Funktionen, die gleichmässig konvergiert, stetig. (ii) Es sei xn , n ∈ N, eine Cauchy Folge in `∞ . Dann ist für jedes i ∈ N die Folge der Koordinaten xn (i), n ∈ N, eine Cauchy Folge in R. Somit existieren x(i) = lim xn (i). n→∞ Weil xn , n ∈ N, eine Cauchy Folge ist, ist x eine beschränkte Folge, also in `∞ . Wir zeigen nun, dass xn , n ∈ N, in `∞ gegen x konvergiert. Für alle > 0 existiert ein N , so dass für alle n, m mit n, m ≥ n kxn − xm k∞ < Somit gibt es zu jedem > 0 ein N , so dass für alle n, m ≥ N und alle i ∈ N |xn (i) − xm (i)| < gilt, bzw. zu jedem > 0 ein N , so dass für alle n ≥ N , alle i ∈ N und alle m ≥ N |xn (i) − xm (i)| < gilt. Nun können wir zu jedem i die Zahl m so groß wählen, dass |xm (i) − xi | < . (Die Zahl m hängt also von i ab.) Es folgt, dass zu jedem > 0 ein N existiert, so dass für alle n ≥ N und alle i∈N |xn (i) − x(i)| < 2. 4.4 Stetige Abbildungen zwischen metrischen Räumen Definition 4.4.1 Es seien (X, dX ) und (Y, dY ) zwei metrische Räume. Eine Funktion f : X → Y ist in einem Punkt x0 ∈ X stetig, falls ∀ > 0∃δ > 0∀x ∈ X, dX (x, x0 ) < δ : dY (f (x), f (x0 ) < . Wir sagen, dass die Funktion stetig ist, wenn sie in allen Punkten stetig ist. Satz 4.4.1 Es seien (X, dX ) und (Y, dY ) zwei metrische Räume. Eine Funktion f : X → Y ist genau dann in einem Punkt x0 ∈ X stetig, falls für alle Folgen {xn }n∈N , mit limn→∞ xn = x0 lim f (xn ) = f (x0 ) n→∞ gilt. 234 CHAPTER 4. METRISCHE RÄUME Lemma 4.4.1 (i) Es sei (X, d) ein metrischer Raum und x0 ∈ X. Es seien f, g : X → R Funktionen, die in x0 stetig sind. Dann sind auch f + g und f · g in x0 stetig. (ii) Es seien (X, dX ), (Y, dY ) und (Z, dZ ) metrische Räume. Die Funktion f : X → Y, d sei in x0 stetig und g : Y → Z sei in f (x0 ) stetig. Dann ist g ◦ f in x0 stetig. Das Urbild f −1 (U ) einer Menge U ist {x|f (x) ∈ U }. Satz 4.4.2 Es seien (X, dX ) und (Y, dY ) zwei metrische Räume und f : X → Y . Dann sind äquivalent. (i) f ist stetig. (ii) Das Urbild jeder offenen Menge ist eine offene Menge. (iii) Das Urbild jeder abgeschlossenen Menge ist abgeschlossen. Beweis. (i) ⇒ (ii). Es sei U eine offene Teilmenge von Y . Falls f −1 (U ) die leere Menge ist, so ist f −1 (U ) = ∅ auch offen. Wir können also annehmen, dass f −1 (U ) nicht die leere Menge ist. Wir zeigen nun, dass f −1 (U ) offen ist. Es sei x0 ∈ f −1 (U ). Dann gilt f (x0 ) ∈ U . Da U offen ist, existiert ein > 0, so dass {y|dY (y, f (x0 )) < } ⊆ U. Weil f stetig ist, existiert ein δ > 0, so dass {f (x)|dX (x, x0 ) < δ} ⊆ {y|dY (y, f (x0 )) < }. Also gilt {x|dX (x, x0 ) < δ} ⊆ f −1 ({f (x)|dX (x, x0 ) < δ}) ⊆ f −1 ({y|dY (y, f (x0 )) < }) ⊆ f −1 (U ) und x0 ist ein innerer Punkt. Also ist f −1 (U ) eine offene Menge. (i) ⇐ (ii). Es sei x0 ∈ X und > 0. Die Menge {y|d2 (y, f (x0 )) < } ist offen. Da das Urbild einer offenen Menge offen ist, so ist auch f −1 ({y|d2 (y, f (x0 )) < }) offen. Insbesondere ist x0 innerer Punkt dieser Menge. Also gibt es ein δ > 0, so dass {x|d1 (x, x0 ) < δ} ⊆ f −1 ({y|d2 (y, f (x0 )) < }). Hieraus folgt {f (x)|d1 (x, x0 ) < δ} ⊆ {y|d2 (y, f (x0 )) < }. Damit ist f in x0 stetig. 4.4. STETIGE ABBILDUNGEN ZWISCHEN METRISCHEN RÄUMEN 235 (ii) ⇒ (iii). Es sei A eine abgeschlossene Teilmenge von Y . Dann ist Ac offen und somit ist auch f −1 (Ac ) auch offen. Weiter gilt (f −1 (Ac ))c = ({x|f (x) ∈ / A})c = {x|f (x) ∈ A} = f −1 ({y|y ∈ A}). Damit ist (f −1 (Ac ))c = f −1 (A) abgeschlossen. (iii) ⇒ (ii) wird genauso gezeigt. 2 Satz 4.4.3 Es seien (X, dX ) und (Y, dY ) zwei metrische Räume und f : X → Y eine stetige Funktion. Dann ist das Bild einer kompakten Menge kompakt. Beweis. Es sei K eine kompakte Menge in X . Es sei weiter Oι , ι ∈ I, eine offene Überdeckung von f (K). Wegen der Stetigkeit von f sind die Mengen f −1 (Oι ) ι∈I offen. Wegen ! K ⊆ f −1 [ ι∈I Oι = [ f −1 (Oι ) ι∈I ist diese Familie von Mengen eine offene Überdeckung von K. Da K aber kompakt ist, gibt es eine endliche Teilüberdeckung f −1 (Oι1 ), . . . , f −1 (Oιn ) K⊆ n [ f −1 (Oιk ) k=1 Hieraus folgt f (K) ⊆ f n [ ! f −1 k=1 (Oιk ) ⊆ n [ k=1 Oιk Also ist Oι1 , . . . , Oιn eine endliche Teilüberdeckung für f (K). 2 Satz 4.4.4 Es sei (X, d) ein metrischer Raum und K ein kompakte Teilmenge von X. R sei mit der Standardmetrik d ausgestattet. Eine stetige Funktion f : X → R nimmt auf K Minimum und Maximum an. Umgekehrt kann man sich fragen, ob eine Menge, auf der jede stetige Funktion sowohl Minimum und Maximum annimmt, kompakt sein muss. Für Teilmengen vom Rn lässt sich dies leicht nachweisen. Wir zeigen, dass es zu jeder nicht kompakten Menge, eine Funktion gibt, die auf dieser Menge unbeschränkt ist. Falls die Menge unbeschränkt ist, so ist die Funktion f (x) = x21 + · · · + x2n stetig und unbeschränkt. Falls die Menge nicht abgeschlossen ist, dann gibt es einen Punkt z, der im Abschluss dieser Menge liegt, aber nicht in dieser Menge. Dann ist f (x) = |z1 − x1 |2 1 + · · · + |zn − xn |2 236 CHAPTER 4. METRISCHE RÄUME stetig und unbeschränkt. Beweis. Nach Satz 4.4.3 ist f (K) eine kompakte Menge von R. Nach Satz 4.3.1 ist f (K) beschränkt und abgeschlossen. Da f (K) beschränkt ist, existieren Infimum und Supremum von f (K). Wir zeigen, dass das Supremum von f (K) angenommen wird. Es gilt ∀ > 0∃y ∈ f (K) : sup f (K) ≤ y + . Wenn sup f (K) nicht angenommen wird, d.h. sup f (K) ∈ / f (K), dann ist sup f (K) ein Häufungspunkt von f (K). Da aber f (K) abgeschlossen ist, muss dann sup f (K) ∈ f (K). Genauso wird gezeigt, dass inf f (K) ∈ f (K). 2 Korollar 4.4.1 Es seien a, b ∈ R mit a < b und f : [a, b] → R eine stetige Funktion. Dann nimmt f auf [a, b] Minimum und Maximum an. Beweis. [a, b] ist eine kompakte Menge. Wir wenden Satz 4.4.4 an. 2 Lemma 4.4.2 Auf einem endlich-dimensionalen, reellen oder komplexen, normierten Raum sind alle Normen äquivalent. Beweis. Es reicht, Rn und Cn zu betrachten. Mit k k2 bezeichnen wir die Euklidische Norm. Wir zeigen, dass alle Normen auf Rn stetige Abbildungen bzgl. der Euklidischen Norm sind. Es seien ei = (0, . . . , 0, 1, 0, . . . , 0) i = 1, 2, . . . , n die Standardbasis des Rn . Es gilt X n n n X X kxk = xi ei ≤ |xi |kei k ≤ max kei k |xi |. 1≤i≤n i=1 i=1 i=1 Wegen Beispiel 4.3.2 gilt n X i=1 |xi | ≤ √ nkxk2 . Deshalb (4.1) kxk ≤ ! 12 n X √ √ 2 max kei k n |xi | ≤ max kei k n kxk2 . 1≤i≤n i=1 1≤i≤n Stetigkeit in x0 bedeutet ∀ > 0∃δ > 0∀x, kx − x0 k2 < δ : Wir wählen δ = c |kxk − kx0 k| < . und erhalten |kxk − kx0 k| ≤ kx − x0 k ≤ ckx − x0 k2 < cδ = . 4.4. STETIGE ABBILDUNGEN ZWISCHEN METRISCHEN RÄUMEN 237 Damit ist die Norm eine stetige Abbildung. Die Menge ∂B2n = {x| kxk2 = 1} ist kompakt. Deshalb wird inf kxk kxk2 =1 angenommen. Es gilt c1 = min kxk > 0, (4.2) kxk2 =1 weil das Minimum nicht in x = 0 angenommen wird. Aus (4.1) und (4.2) folgt für alle x mit kxk2 = 1 √ nkxk2 . c1 ≤ kxk ≤ max kei k 1≤i≤n Es folgt für alle x mit x 6= 0 x c1 ≤ kxk2 ≤ c2 . Deshalb gilt für alle x c1 kxk2 ≤ kxk ≤ c2 kxk2 . 2 Lemma 4.4.3 Es sei (M, d) ein metrischer Raum und K eine kompakte Teilmenge. Es sei f : K → R eine stetige Abbildung. Dann ist f auf K gleichmäßig stetig, d.h. ∀ > 0∃δ > 0∀x, y ∈ K, d(x, y) < δ : |f (x) − f (y)| < . Beweis. Da f stetig ist, gilt: ∀ > 0∀x ∈ K∃δ = δ(x, )∀y ∈ K, d(x, y) < δ : Die Familie ◦ B (x, δ(x, )) ist eine offene Überdeckung von K. 2 Es seien πj : Rk → R durch |f (x) − f (y)| < . x∈K πj (x) = xj gegeben. Diese Abbildungen sind stetig. Wir bezeichnen πj ◦ f , j = 1, . . . , k als die Koordinatenabbildungen. Lemma 4.4.4 Es sei U eine offene Teilmenge des Rn und f : U → Rk . Die Funktion f ist genau dann stetig, wenn alle Koordinatenfunktionen fi , i = 1, . . . , k stetig sind. 238 CHAPTER 4. METRISCHE RÄUME Beweis. Wir zeigen zunächst, dass die Abbildungen πj stetig sind. |πj (x0 ) − πj (x)| = |x0 (j) − xj | ≤ kx0 − xk Damit sind f und πj stetige Funktionen. Hintereinanderausführungen von stetigen Funktionen sind auch stetig. Also ist πj ◦ f stetig. Beispiel 4.4.1 Es sei U eine offene Teilmenge des Rn und f : U → R. f heißt in x0 Lipschitzstetig, falls es eine Umgebung V(x0 ) und ein L > 0 gibt, so dass für alle x ∈ V(x0 ) d(f (x), f (x0 )) ≤ Ld(x, x0 ) bzw. |f (x) − f (x0 )| ≤ Lkx − x0 k gilt. Chapter 5 Integralrechnung Georg Friedrich Bernhard Riemann wurde am 17. September 1826 in Breselenz bei Dannenberg geboren und er starb am 20. Juli 1866 in Selasca bei Verbania am Lago Maggiore. Er starb an Tuberkulose. Riemann war introvertiert und sehr schüchtern. Er hatte Schwierigkeiten im Umgang mit Menschen, insbesondere hatte er Schwierigkeiten, Vorträge zu halten. Viele seiner Mitmenschen hielten ihn für einen Hypochonder. Er promovierte 1851 bei Gauß in Göttingen. Zu Riemanns Zeiten verdienten Dozenten sehr wenig, sie erhielten nur Kolleggelder, also die Gelder, die Studenten für die Vorlesung zahlten. Erst eine Professur war mit einem wesentlichen Gehalt verbunden. Es gab auch keine Altersversorgung, so dass Professoren bis zu ihrem Lebensende unterrichteten. Riemann wurde 1857 in Göttingen zum außerordentlichen Professor ernannt. Der Zeitpunkt war insofern glücklich, als er seit 1857 für drei Schwestern sorgen musste. 1859 wurde er zum ordentlichen Professor ernannt. Wegen seiner angegriffenen Gesundheit reiste er nach er Italien. Das wohl berühmteste, offene, mathematische Problem ist die Riemannsche Vermutung: Liegen alle nichttrivialen Nullstellen der Riemannschen Zetafunktion ζ(s) = ∞ X 1 s n n=1 auf der Geraden <s = 21 ? Man beachte, dass die Zetafunktion für alle komplexen Zahlen erklärt ist. 5.1 Integralrechnung In diesem Abschnitt beginnen wir mit der Integralrechnung. Sie wird uns in die Lage versetzen, einen Flächeninhalt oder die Länge einer Kurve zu berechnen. Ebenso die Arbeit, die verrichtet wird, wenn sich ein Partikel durch ein Kraftfeld bewegt. Mittels der Kurvenlänge werden wir dann die trigonometrischen Funktionen einführen. Wir stellen fest, dass alle stetigen Funktionen, wie auch alle monotonen Funktionen Riemann-integrierbar sind. Wir geben Beispiele von Funktionen an, die nicht Riemann integrierbar sind. Auch geben wir Beispiele an, die an sehr vielen Stellen unstetig sind, aber trotzdem Riemann integrierbar. 239 240 CHAPTER 5. INTEGRALRECHNUNG Das Hauptergebnis der Integralrechnung ist der Hauptsatz der Differential- und Integralrechnung. Er besagt, dass die Integration die inverse Operation zur Differentiation ist. Hiermit lassen sich dann viele Integrale einfach berechnen. Riemann integrierbare Funktionen sind beschränkt. Wir erweitern den Begriff der Riemann Integrierbarkeit auf unbeschränkte Funktionen und sprechen dann von Funktionen, die uneigentlich Riemann integrierbar sind. In diesem Zusammenhang führen wir die Gamma Funktion ein. Eine Partition eines Intervalls [a, b] ist eine endliche Teilmenge P = {x0 , x1 , . . . , xn } mit a = x0 < x1 < · · · < xn = b. Ik = [xk−1 , xk ] heißt das k-te Teilintervall und ∆k = xk − xk−1 ist die Länge des Intervalls Ik . Die Feinheit der Partition ist durch kPk = max ∆k 1≤k≤n gegeben. Es sei f : [a, b] → R beschränkt auf [a, b] und P = {x0 , x1 , . . . , xn } sei eine Partition von [a, b]. Wir setzen mk (f ) = inf{f (x)|x ∈ Ik } Mk (f ) = sup{f (x)|x ∈ Ik } Die Untersumme von f bzgl. P ist US P (f ) = Die Obersumme von f bzgl. P ist OS P (f ) = m(f ) = inf{f (x)|x ∈ [a, b]} M (f ) = sup{f (x)|x ∈ [a, b]} n X mk (f )∆k . k=1 n X Mk (f )∆k . k=1 Lemma 5.1.1 Es sei f : [a, b] → R eine beschränkte Funktion. Dann gilt für alle Partitionen P m(f )(b − a) ≤ US P (f ) ≤ OS P (f ) ≤ M (f )(b − a). Beweis. US P (f ) = 2 n X k=1 mk (f )∆k ≤ n X k=1 Mk (f )∆k = OS P (f ) Eine Partition P 0 = {x00 , . . . , x0n } eines Intervalls [a, b] heißt Verfeinerung der Partition P = {x0 , . . . , xm } von [a, b], falls P = {x0 , . . . , xm } ⊆ {x00 , . . . , x0n } = P 0 . 5.1. INTEGRALRECHNUNG 241 Lemma 5.1.2 Es sei f : [a, b] → R eine beschränkte Funktion. Es sei P 0 eine Verfeinerung der Partition P. Dann gelten (i) US P (f ) ≤ US P 0 (f ) (ii) OS P (f ) ≥ OS P 0 (f ) Insbesondere gilt, dass sup{US P (f )|P ist Partition} ≤ inf{OS P (f )|P ist Partition} Beweis. (i) Falls P 0 = {x00 , . . . , x0n } Verfeinerung von P = {x0 , . . . , xm } ist. Wir setzen für k = 1, . . . , m und j = 1, . . . , n Ij0 = [x0j−1 , x0j ] Ik = [xk−1 , xk ] ∆0j = x0j − x0j−1 ∆k = xk − xk−1 und mk (f ) = inf{f (x)|x ∈ Ik } Mk (f ) = sup{f (x)|x ∈ Ik } m0j (f ) = inf{f (x)|x ∈ Ij0 } Mj0 (f ) = sup{f (x)|x ∈ Ij0 }. Es gibt es j1 , . . . , jm , so dass für alle i = 1, . . . , m gilt xi = x0ji . Dann gilt für alle i = 1, . . . , m ji [ 0 0 [x0`−1 , x0` ]. [xi−1 , xi ] = [xji−1 , xji ] = `=ji−1 +1 Hiermit folgt US P (f ) = = n X m X i=1 ≤ = = ji ji X [ 0 0 inf f (x) x ∈ [xk−1 , xk ] (x0` − x0`−1 ) `=ji−1 +1 k=ji−1 +1 i=1 `=ji−1 +1 n X `=1 k=1 inf{f (x)|x ∈ [xi−1 , xi ]}(xi − xi−1 ) inf{f (x)|x ∈ [x0ji−1 , x0ji ]}(x0ji − x0ji−1 ) ji m X X n X m X i=1 k=1 m X i=1 = mk (f )∆k = inf f (x) x ∈ [x0`−1 , x0` ] (x0` − x0`−1 ) inf f (x) x ∈ [x0`−1 , x0` ] (x0` − x0`−1 ) m0k (f )∆0k = US P 0 (f ). (ii) wird genauso gezeigt. 242 Q CHAPTER 5. INTEGRALRECHNUNG Wir zeigen nun den Zusatz. Zunächst zeigen wir, dass für alle Partitionen P und US P (f ) ≤ OS Q (f ) gilt. P ∪ Q ist Verfeinerung von P und Q. Deshalb gilt nach Lemma 5.1.2 für alle P und Q US P (f ) ≤ US P∪Q (f ) ≤ OS P∪Q (f ) ≤ OS Q (f ). Hieraus folgt für all Q sup US P (f ) ≤ OS Q (f ) P und schließlich sup US P (f ) ≤ inf OS Q (f ). Q P 2 Definition 5.1.1 Es sei f : [a, b] → R eine beschränkte Funktion. Es gelte sup US P (f ) = inf OS P (f ). P P Dann heißt f Riemann integrierbar und das Integral von f ist Z a b f (x)dx = sup US P (f ) = inf OS P (f ). P P Um nachzu weisen, dass eine Funktion f Riemann integrierbar ist, reicht es zu zeigen, dass es für alle > 0 Partitionen P, Q mit OS P (f ) ≤ US P (f ) + gibt. Wir setzen Z a b f (x)dx = − Z a f (x)dx. b Beispiel 5.1.1 (i) Es sei f : [a, b] → R durch f (x) = c definiert. f ist integrierbar und Z a b f (x)dx = c(b − a). (ii) Es sei f : [0, 1] → R durch f (x) = x definiert. f ist integrierbar und Z 1 f (x)dx = 0 (iii) (Dirichlet) Es sei D : [0, 1] → R durch ( 0 D(x) = 1 1 . 2 falls x irrational falls x rational 5.1. INTEGRALRECHNUNG 243 definiert. f ist nicht Riemann integrierbar (f ist aber Lebesgue integrierbar). Weiter gilt D(x) = lim lim cos2n (m!πx). m→∞ n→∞ (iv) (Thomae) Es sei f : [0, 1] → R durch falls x irrational ist oder x = 0 0 f (x) = m 1 falls x = und m und n teilerfremd sind n n definiert. f ist in allen irrationalen Punkten stetig und unstetig in allen rationalen Punkten. f ist in keinem Punkt differenzierbar. f ist Riemann integrierbar und Z 1 f (x)dx = 0. 0 Diese Funktion wurde 1875 von C.J. Thomae eingeführt. Sie hat viele Spitznamen: Popcorn Funktion, Regentropfen Funktion, Lineal Funktion, Sterne über Babylon. Carl Johannes Tomae wurde am 11.12.1840 in Laucha an der Unstrut geboren. Er promovierte 1864 in Göttingen bei Ernst Schering. 1879 wurde er Professor in Jena. An der Graphik erkennt man, warum die Funktion auch Lineal Funktion genannt wird: Die Striche, die die Funktionswerte angeben, sehen aus wie die Markierungen auf einem Lineal. Auch der Ausdruck Regentropfen Funktion ist klar. Sie heißt auch Popcorn Funktion, weil die Striche Popcorn andeuten, das aus einer heissen Pfanne aufspringt. Beweis. (i) m(f ) = inf{f (x)|x ∈ [a, b]} = c M (f ) = sup{f (x)|x ∈ [a, b]} = c Wir wählen als Partition P = {a, b}. Dann erhalten wir US P (f ) = m(f )(b − a) OS P (f ) = m(f )(b − a) (ii) Wir wählen als Partitionen Pn = {0, n1 , n2 , . . . , 1} Es gelten ∆k = 1 n n∈N und mk (f ) = inf f (x) = x∈Ik k−1 n Mk (f ) = sup f (x) = x∈Ik k n 244 CHAPTER 5. INTEGRALRECHNUNG Hiermit erhalten wir US Pn (f ) n X = mk (f )∆k = k=1 n X k−1 1 n k=1 n n 1 X 1 n(n − 1) 1 1 (k − 1) = = 1 − n2 n2 2 2 n = k=1 und OS Pn (f ) = n X Mk (f )∆k = k=1 = n X k1 nn k=1 n 1 X 1 n(n + 1) 1 1 k= 2 = 1+ . n2 n 2 2 n k=1 Deshalb gilt für alle n ∈ N 1 1 1 1 1− ≤ sup US P (f ) ≤ inf OS P (f ) ≤ 1+ . P 2 n 2 n P Also gilt 1 = sup US P (f ) = inf OS P (f ). P 2 P (iii) Wir zeigen, dass für alle Partitionen P US P (D) = 0 OS P (D) = 1 gilt. Hierzu benutzen wir, dass es zwischen je zwei reellen Zahlen sowohl eine rationale als auch eine irrationale Zahl gibt (Korollar 2.10.1). Es folgen mk (D) = Mk (D) = inf{D(x)|x ∈ Ik } = 0 sup{D(x)|x ∈ Ik } = 1. Es folgt US P (D) = OS P (D) = n X k=1 n X mk (D)∆k = 0 Mk (D)∆k = k=1 n X ∆k = 1. k=1 (iv) Wir zeigen, dass f in allen rationalen Punkten, die von 0 verschieden sind, unstetig ist. 1 m Es gilt f ( m n ) = n , aber in jeder Umgebung von n findet man einen irrationalen Punkt. Wir zeigen nun, dass f in allen irrationalen Punkten x stetig ist. Wir zeigen, dass für alle Folgen {xn }n∈N mit limn→∞ xn = x lim f (xn ) 6= f (x) = 0 n→∞ gilt. Wir können annehmen, dass alle xn , n ∈ N, rationale Zahlen sind, weil f auf irrationalen n Zahlen den Wert 0 annimmt. Es sei { m kn }n∈N eine Folge rationaler Zahlen mit mn = x. n→∞ kn lim Wir müssen zeigen, dass lim n→∞ 1 = 0. kn 5.1. INTEGRALRECHNUNG 245 Wir nehmen an, dies sei nicht so. Dann gibt es eine Teilfolge {knj }j∈N , die beschränkt ist. Deshalb ist auch {mnj }j∈N beschränkt. Somit nimmt nur endlich viele Werte an. Deshalb ist mnj k nj j∈N mnj j∈N knj lim rational. Der Grenzwert ist aber gleich der irrationalen Zahl x. Wir zeigen nun, dass f Riemann integrierbar ist und dass das Integral von f gleich 0 ist. Dazu zeigen wir dass für alle Partitionen P gilt, dass US P (f ) = 0. Ausserdem zeigen wir, dass es Partitionen Pn , n ∈ N, gibt, so dass r 2 OS P (f ) ≤ n gilt. Hieraus ergibt sich unmittelbar die Behauptung. Es gilt n X US P (f ) = mk (f )∆k = 0. k=1 Wir beweisen nun die Abschätzung für die Obersummen. Als Partitionen wählen wir Pn = {0, 1 2 , , . . . , 1} n n n ∈ N. k Es gelten ∆k = n1 und Ik = [ k−1 n , n ]. Um OS P (f ) zu bestimmen, müssten wir nun Mk (f ) berechnen. Dies kann sich wegen der Funktion f kompliziert gestalten. Deshalb gehen wir einer anderen Frage nach, die leichter zu beantworten ist: Die Funktion f nimmt die Werte 1q , q ∈ N, an. Wir fragen, auf wievielen Intervallen Ik der Wert von Mk (f ) gleich 1q ist? Es gilt OS Pn (f ) = wobei n X k=1 n ∞ 1 1X1 1X Mk (f ) = card k Mk (f ) = , Mk (f )∆k = n n q=1 q q k=1 ∞ X 1 card k Mk (f ) = = n. q q=1 k Da in jedem Intervall Ik = [ k−1 n , n ] eine Zahl k n enthalten ist, gilt Mk (f ) = sup f (x) ≥ f ( nk ) ≥ x∈Ik 1 . n Deshalb gilt n X 1 card k Mk (f ) = = n. q q=1 Weiter gilt 1 card k Mk (f ) = ≤ q. q Dies gilt, weil es q + 1 rationale Zahlen in [0, 1] gibt, deren Nenner q ist: 0 1 2 q−1 q , , ,..., , . q q q q q 246 CHAPTER 5. INTEGRALRECHNUNG Diese q + 1 Zahlen können in höchstens q + 1 verschiedenen Intervallen Ik auftreten. Also gilt Mk (f ) = 1q in höchstens q + 1 verschiedenen Intervallen. Da qq = 1, haben wir es tatsächlich höchstens mit q Intervallen zu tun. Somit erhalten wir n 1X1 N (q), OS Pn (f ) = n q=1 q wobei N (q) ganze Zahlen mit 0 ≤ N (q) ≤ q und n X N (q) = n q=1 ist (Es kann sein, dass einige der N (q) gleich 0 sind.). Wir behaupten, dass n 1X1 N (q) n q=1 q für die folgende Wahl der Zahlen N (q) maximal ist. Es sei ` ∈ N die kleinste Zahl, so dass ` X q=1 q ≥ n. Wir setzen N (q) = falls q = 1, 2, . . . , ` − 1 q n− P`−1 p=1 p falls q = ` Wir nehmen an, dies sei nicht so. Dann gibt es eine Zahl q0 ∈ N mit q0 ≤ ` − 1 und N (q0 ) < q0 oder `−1 X N (`) < n − p. p=1 Wir betrachten den ersten Fall. Wir beobachten, dass es ein q1 > q0 mit N (q1 ) ≥ 1 gibt. Dann gilt n 1X1 N (q) n q=1 q (q −1 0 1 X 1 = N (q) + n q=1 q (q −1 0 1 X 1 < N (q) + n q=1 q qX n 1 −1 X 1 1 1 1 N (q0 ) + N (q) + N (q1 ) + N (q) q0 q q1 q q=q +1 q=q +1 0 ) 1 qX 1 −1 1 (N (q0 ) + 1) + q0 q=q 0 n X 1 1 1 N (q) + (N (q1 ) − 1) + N (q) q q1 q +1 q=q +1 1 Der zweite Fall wird genauso behandelt. Damit folgt ` OS Pn (f ) ≤ ` 1X1 q= , n q=1 q n wobei ` die kleinste Zahl ist, für die ` X q=1 q≥n ) 5.1. INTEGRALRECHNUNG gilt. Wir behaupten, dass ` ≤ √ 247 2n gilt. Es gilt n≤ ` X q= q=1 Also gilt √ 1 `(` + 1) ≤ (` + 1)2 . 2 2 2n ≤ ` + 1. Da ` die kleinste ganze Zahl ist, die diese Ungleichung erfüllt, gilt ` ≤ r √ 2n 2 = . OS Pn (f ) ≤ n n √ 2n. Damit erhalten wir 2 Wir definieren Z a f (x)dx = 0 Z a f (x)dx = − und b a b Z f (x)dx. a Lemma 5.1.3 Es seien f, g : [a, b] → R integrierbare Funktionen und c ∈ R. Dann gelten (i) f + g ist integrierbar und Z b Z b Z b gdx f dx + f + gdx = a a a (ii) f g ist integrierbar. (iii) cf ist integrierbar und Z b Z b f dx cf dx = c a a Lemma 5.1.4 Es seien f, g : [a, b] → R integrierbare Funktionen und es gelte f (x) ≤ g(x) für alle x ∈ [a, b]. Dann gilt Z b Z b gdx. f dx ≤ a Beweis. OS P (f ) = n X k=1 Mk (f )∆k ≤ a n X k=1 Mk (g)∆k = OS P (g) Also gilt für alle Partitionen P OS P (f ) ≤ OS P (g). Hieraus folgt Z a 2 b f (x)dx = inf OS P (f ) ≤ inf OS P (g) = P P Z b g(x)dx. a 248 CHAPTER 5. INTEGRALRECHNUNG Lemma 5.1.5 Es sei f : [a, b] → R eine integrierbare Funktion. Dann ist auch |f | eine integrierbare Funktion und es gilt Z b Z b f (x)dx ≤ |f (x)|dx. a a Beweis. Wir zeigen, dass |f | integrierbar ist. Dazu zeigen wir, dass die Funktionen f + und f − mit f − (x) = max{−f (x), 0} f + (x) = max{f (x), 0} integrierbar sind. Es folgt dann, dass |f | = f + + f − integrierbar ist. Weiter gilt f = f + − f − . Wir zeigen hier, dass f + integrierbar ist. Es sei P = {x0 , . . . , xn } eine Partition. Dann gilt für alle k = 1, . . . , n Mk (f + ) − mk (f + ) ≤ Mk (f ) − mk (f ). (5.1) Wir prüfen dies nach. Da f ≤ f + gilt, folgen Mk (f ) = sup f (x) ≤ sup f + (x) = Mk (f + ) (5.2) x∈Ik x∈Ik mk (f ) = inf f (x) ≤ inf f + (x) = mk (f + ) (5.3) x∈Ik x∈Ik Wir betrachten nun zwei Fälle. Der erste Fall ist: Es gibt ein x0 ∈ Ik mit f (x0 ) ≥ 0. Wir zeigen, dass in diesem Fall Mk (f ) = Mk (f + ). Es gilt für alle y ∈ Ik f (y) ≤ sup f (x). x∈Ik Da f (x0 ) ≥ 0, so 0 ≤ f (x0 ) ≤ sup f (x). x∈Ik Deshalb gilt für alle y ∈ Ik f + (y) = max{f (y), 0} ≤ sup f (x). x∈Ik Es folgt Mk (f + ) = sup f + (x) ≤ sup f (x) = Mk (f ) x∈Ik x∈Ik + und damit Mk (f ) = Mk (f ). Hiermit und mit (5.3) folgt (5.1) in diesem Fall. Der zweite Fall ist: Für alle x ∈ Ik gilt f (x) < 0. In diesem Fall gilt f + = 0 und (5.1) folgt sofort. Aus (5.1) folgt + + OS P (f ) − US P (f ) = ≤ n X k=1 n X k=1 Mk (f + ) − mk (f + ) ∆k (Mk (f ) − mk (f )) ∆k = OS P (f ) − US P (f ). 5.1. INTEGRALRECHNUNG 249 Für jedes > 0 existieren Partitionen P0 und P1 , so dass OS P0 (f ) ≤ inf OS P (f ) + US P1 (f ) ≥ sup US P (f ) − und P P gelten. Somit folgt für P = P0 ∪ P1 OS P (f + ) − US P (f + ) ≤ 2. Wegen US P (f + ) ≤ sup US Q (f + ) ≤ inf OS Q (f + ) ≤ OS P (f + ) Q Q folgt sup US Q (f + ) = inf OS Q (f + ). Q Q Damit ist f + integrierbar. Ebenso zeigen wir, dass f − integrierbar ist. Z a b Z b Z b Z b f − (x)dx f (x)dx + f (x) + f (x)dx = a a a Z b Z b Z b Z b + − + − ≥ f (x)dx − f (x)dx = f (x) − f (x)dx = f (x)dx |f (x)|dx = − + a + a a a Genauso zeigen wir, dass b Z |f (x)|dx ≥ − a Z b f (x)dx. a Insgesamt erhalten wir also Z a b Z b |f (x)|dx ≥ f (x)dx . a 2 Lemma 5.1.6 Es sei f : [a, b] → R integrierbar und c ∈ [a, b]. Dann gilt Z b Z f (x)dx = a c Z f (x)dx + a b f (x)dx c Satz 5.1.1 Die Funktion f : [a, b] → R sei auf [a, b] monoton fallend oder monoton wachsend. Dann ist f Riemann integrierbar. Beweis. Es sei f monoton wachsend. Wir wählen als Partitionen b−a b−a b−a Pn = a, a + ,a + 2 , . . . , a + (n − 1) ,b n n n n ∈ N. 250 CHAPTER 5. INTEGRALRECHNUNG Weil f monoton wachsend ist, gelten für k = 1, 2, . . . , n b−a b−a und Mk (f ) = f a + k . mk (f ) = f a + (k − 1) n n Damit folgt OS Pn (f ) − US Pn (f ) n n X X = Mk (f )∆k − mk (f )∆k k=1 k=1 n n X b−a b−a b−a b−a X − f a + (k − 1) = f a+k n n n n k=1 k=1 n−1 n X b−a b−a b−a b−a X f a+k = − f a+k n n n n k=0 k=1 = b−a (f (b) − f (a)). n Es gilt also OS Pn (f ) − US Pn (f ) ≤ b−a (f (b) − f (a)). n Wegen US Pn (f ) ≤ sup US P (f ) ≤ inf OS P (f ) ≤ OS Pn (f ) P P folgt inf OS P (f ) = sup US P (f ). P P Damit ist f integrierbar. 2 Satz 5.1.2 Es sei f : [a, b] → R stetig. Dann ist f Riemann integrierbar. Beweis. Wir benutzen den Satz 3.2.1: Falls f auf [a, b] stetig ist, dann ist f auf [a, b] auch gleichmäßig stetig. Es gilt also ∀ > 0∃δ > 0∀x, y ∈ [a, b], |x − y| < δ : |f (x) − f (y)| < . Als Partition wählen wir b−a b−a b−a Pn = a, a + ,a + 2 , . . . , a + (n − 1) ,b n n n wobei wir n so groß wählen, dass ∆k = b−a n ∀k = 1, . . . , n ∀x, y ∈ Ik : n ∈ N, < δ gilt und damit |f (x) − f (y)| < . Hieraus folgt Mk (f ) − mk (f ) = sup f (x) − inf f (x) = max f (x) − min f (x) < . x∈Ik x∈Ik x∈Ik x∈Ik 5.2. RIEMANNSCHE SUMMEN 251 Damit erhalten wir OS Pn (f ) − US Pn (f ) = n X k=1 Mk (f )∆k − n X k=1 mk (f )∆k < (b − a). Wegen US Pn (f ) ≤ sup US P (f ) ≤ inf OS P (f ) ≤ OS Pn (f ) P P folgt inf OS P (f ) = sup US P (f ). P P Damit ist f integrierbar. 2 5.2 Riemannsche Summen Die Funktion f : [a, b] → R sei beschränkt. P = {x0 , . . . , xn } sei eine Partition von [a, b]. Es sei ξ = {ξk }nk=1 mit ξk ∈ Ik , k = 1, . . . , n. Dann heisst SP = n X f (ξk )∆k k=1 Riemannsche Summe zur Partition P. Insbesondere gilt für jede Partition P und alle ξ US P (f ) ≤ SP (f, ξ) ≤ OS P (f ) Wir setzen lim SP (f, ξ) = I kPk→0 falls für alle > 0 ein δ > 0 existiert, so dass für alle Partitionen P mit kPk < δ und alle ξ |SP (f, ξ) − I| < gilt. Lemma 5.2.1 (i) Falls f : [a, b] → R Riemann integrierbar ist, so existiert lim SP (f, ξ) kPk→0 und es gilt lim SP (f, ξ) = kPk→0 Z b f (x)dx a (ii) Existiert lim SP (f, ξ) kPk→0 so ist f Riemann integrierbar und es gilt lim SP (f, ξ) = kPk→0 Z b f (x)dx a 252 CHAPTER 5. INTEGRALRECHNUNG Satz 5.2.1 (i) Es sei f : [a, b] → R eine zweimal stetig differenzierbare Funktion, a0 < · · · < an sei eine Partition des Intervalls [a, b] in Teilintervalle gleicher Länge und x1 , . . . , xn seien die Mittelpunkte dieser Teilintervalle. Dann gilt Z b (b − a)3 ≤ f (x)dx − (f (x ) + · · · + f (x ))∆x max |f 00 (x)| 1 n 2 x∈[a,b] 24n a Z b (b − a)3 ≤ f (x)dx − (f (a ) + 2f (a ) · · · + 2f (a ) + f (a ))∆x max |f 00 (x)| 0 1 n−1 n 2 x∈[a,b] 12n a (ii) Z b f (x)dx − (f (a0 ) + 4f (x1 ) + 2f (a1 ) · · · + 2f (an−1 ) + 4f (xn ) + f (an ))∆x a ≤ (b − a)5 max |f 0000 (x)| 2880n4 x∈[a,b] Die erste Approximation bezeichnet man als Mittelpunktsregel, die zweite als Trapezregel und die dritte als Simpsonregel. Bei der Simpsonregel approximiert man die Funktion durch Parabeln. 5.3 Riemann-messbare Mengen und die CantorMenge Wir sagen, dass eine Teilmenge A der reellen Zahlen R Riemann-messbar ist, falls sie beschränkt ist und die charakteristische Funktion 1 falls x ∈ A χA = 0 falls x ∈ /A integrierbar ist. Das Maß µ(A) der Menge A ist durch Z b χA dx µ(A) = a definiert, wobei [a, b] ein Intervall ist, das die Menge A enthält. Lemma 5.3.1 Es sei A eine Riemann messbare Teilmenge von R und s, t ∈ R. Dann ist auch s + tA Riemann messbar und µ(s + tA) = tµ(A) Beweis. Es seien a, b ∈ R mit A ⊆ [a, b] und P = {x0 , x1 , . . . , xn } eine Partition mit OS P (χA ) ≤ + US P (χA ) 5.3. RIEMANN-MESSBARE MENGEN UND DIE CANTOR-MENGE 253 Dann gilt s + tA ⊆ [s + ta, s + tb] und s + tP = {s + tx0 , . . . , s + txn } ist eine Partition mit OS s+tP (χs+tA ) ≤ t + US s+tP (χs+tA ) Wir prüfen dies nach. Es gilt ( mk (χA ) = inf χA (x) = x∈Ik falls Ik ⊆ A falls Ik ∩ Ac 6= ∅ 1 0 ( Mk (χA ) = sup χA (x) = x∈Ik falls Ik ∩ A 6= ∅ falls Ik ∩ A = ∅ 1 0 Ebenso gilt ( mk (χs+tA ) = inf χs+tA (x) = x∈Ik 1 0 ( Mk (χs+tA ) = sup χs+tA (x) = x∈s+tIk 1 0 falls s + tIk ⊆ s + tA falls s + tIk ∩ (s + tA)c 6= ∅ falls (s + tIk ) ∩ (s + tA) 6= ∅ falls (s + tIk ) ∩ (s + tA) = ∅ Es folgt mk (χs+tA ) = mk (χA ) und Mk (χs+tA ) = Mk (χA ). Damit folgt US s+tP (χs+tA ) = n X mk (χs+tA )∆s+tP k k=1 = n X k=1 mk (χA )t∆Pk = t US P (χA ) Dasselbe Ergebnis erhalten wir für die Obersummen. 2 Beispiel 5.3.1 (Cantor Menge) Die Cantor Menge C ist die Menge aller Zahlen ∞ X aj j=1 3j aj ∈ {0, 2} Es gelten (i) C ⊂ [0, 1] (ii) C ist eine kompakte Menge. (iii) Es gilt C = 31 C ∪ ( 23 + 12 C) (iv) Wir setzen C1 = [0, 1] und für n ∈ N Cn+1 = 13 Cn ∪ ( 32 + 12 Cn ) 254 CHAPTER 5. INTEGRALRECHNUNG Dann gilt C= ∞ \ Cn n=1 (v) Das Riemannsche Mass von C ist 0. (vi) Die Mächtigkeit der Cantor Menge ist gleich der des Kontinuums. (vii) C hat keine isolierten Punkte. (viii) Für alle x, y ∈ C existiert ein z ∈ / C, so dass x < z < y. (ix) Für die Menge C + C = {x + y|x, y ∈ C} gilt C + C = [0, 2] (x) Für die Differenzmenge C − C = {x − y|x, y ∈ C} gilt C − C = [−1, 1] Wir sagen, dass eine Menge nirgends dicht ist, falls das Innere des Abschlusses die leere Menge ist. Die Cantor Menge ist nirgends dicht. Eigenschaft (ix) zeigt, dass das Mass einer Differenzmenge von Nullmengen nicht notwendig 0 ist. Geometrisch lässt sich die Cantor Menge wie folgt veranschaulichen. Das Intervall [0, 1] wird gedrittelt und das mittlere Drittel ( 13 , 23 ) entfernt. Die verbleibenden Intervalle [0, 13 ] und [ 32 , 1] werden wiederum gedrittelt und die mittleren Intervalle ( 19 , 91 ) und ( 79 , 89 ) werden entfernt. Dieses Verfahren wird so fortgesetzt. So entsteht bei jedem Schritt eine Menge Cn , n = 1, . . . , die Vereinigung von 2n−1 abgeschlosse−n+1 nen Intervallen der Länge ist. Die Cantor Menge ist dann der Durchschnitt T∞ 3 dieser Mengen C = n=1 Cn . 0 1 1 3 0 0 1 9 2 9 1 3 2 3 2 3 1 7 9 8 9 1 Konstruktion der Cantor Menge Der Q zweielementige Raum {0, 1} sei mit der diskreten Topologie ausgestattet und n∈N {0, 1} = {0, 1}N mit der Produkttopologie. Dann sind C und {0, 1}N homöomorph. Ein Satz von Alexandrov und Hausdorff besagt, dass jeder kompakte, metrische Raum stetiges Bild der Cantor-Menge ist [Ben]. Dieser Satz hat eine Reihe von überraschenden Anwendungen. 5.3. RIEMANN-MESSBARE MENGEN UND DIE CANTOR-MENGE 255 Beweis. (i) Offensichtlich sind alle Zahlen in der Cantor Menge grösser oder gleich 0. Ausserdem sind alle Zahlen kleiner als ∞ X 1 2 =1 =2 1 −1 j 3 1 − 3 j=1 (ii) Wir müssen zeigen, dass die Cantor Menge abgeschlossen ist. Es sei xk = ∞ X j=1 akj 3−j akj ∈ {0, 2} k = 1, 2, . . . eine Folge in C, die in R konvergiert. (Da alle xk ∈ [0, 1], gilt dasselbe für den Grenzwert x.) Dann gibt es Zahlen aj , so dass für alle j ∈ N lim akj = aj k→∞ Deshalb gilt für alle j ∈ N, dass aj ∈ {0, 2}. Damit ist die Zahl ∞ X aj 3−j j=1 ein Element der Cantor Menge. Wir zeigen nun, dass für alle j ∈ N die Folge {akj }k∈N eine Cauchy Folge ist. Wir nehmen an, dass es ein j gibt, so dass {akj }k∈N keine Cauchy Folge ist. Es sei j0 die kleinste Zahl, für die dies nicht wahr ist. Dann gibt es ein N , so dass für alle k, m > N ∞ ∞ X ak − am ak − am m k X − a a j j j j j j |xk − xm | = ≥ 0 j 0− j j 3 3 3 j=j0 j=j0 +1 ∞ ak − am ak − am X 2 1 j0 j0 j0 j0 ≥ = − − j0 j j j 3 3 3 3 j=j +1 0 Da {a`j0 }`∈N keine Cauchy Folge ist, gibt es zu jedem N Zahlen k, m ∈ N mit k, m > N und |akj0 − am j0 | = 2 Damit folgt aber |xk − xm | ≥ 3−j0 und die Folge {xn }n∈N ist keine Cauchy Folge. Damit folgt, dass für alle j ∈ N die Folge {akj }k∈N eine Cauchy Folge ist und damit eine konvergente Folge. Es gibt also Zahlen aj ∈ {0, 2}, so dass lim akj = aj k→∞ Wir behaupten, dass die Folge xk gegen das Element x= ∞ X aj j=1 3j 256 CHAPTER 5. INTEGRALRECHNUNG konvergiert. Es gibt zu jedem J ∈ N ein kJ , so dass für alle j mit 1 ≤ j ≤ J und alle k mit k ≥ kJ gilt, dass akj = aj . Weiter folgt für alle k mit k ≥ kJ ∞ ∞ ∞ X X k k X a − a a − a 2 j j j j |x − xk | = = ≤ = 3−J j j 3 3 3j j=1 j=J j=J (iii) Wir zeigen zuerst, dass C ⊇ 31 C ∪ Es sei x ∈ C, also x = P∞ aj j=1 3j 2 3 + 12 C mit aj ∈ {0, 2}. Dann gilt ∞ x X aj = 3 3j+1 j=1 Also gilt x 3 ∈ C. Weiter gilt ∞ ∞ X bj 2 X aj 2 x + = + = 3 3 3 j=1 3j+1 3j j=1 mit b1 = 2 und bj = aj−1 für j = 2, 3, . . . . Also gilt auch 32 + x3 ∈ C. Wir zeigen nun, dass C ⊆ 31 C ∪ 23 + 12 C P aj Es sei x ∈ C, also x = ∞ j=1 3j mit aj ∈ {0, 2}. Falls a1 = 0, dann x= ∞ X aj j=2 ∞ 1 X aj 1 = ∈ C j j−1 3 3 j=2 3 3 Falls a1 = 2, dann gilt x= ∞ X aj j=1 ∞ ∞ 2 X aj 2 1 X aj 2 1 = + = + ∈ + C j j j−1 3 3 j=2 3 3 3 j=2 3 3 3 (iv) Wir zeigen hier zunächst, dass Cn+1 ⊆ Cn . Dies zeigen wir durch Induktion. Für n = 1 gilt C1 = [0, 1] ⊃ [0, 13 ] ∪ [ 32 , 1] = 13 C1 ∪ ( 32 + 13 C1 ) = C2 Wir nehmen nun an, dass Cn−1 ⊃ Cn . Nach Definition gilt Cn+1 = 31 Cn ∪ ( 23 + 31 Cn ) Aus der Induktionsannahme Cn−1 ⊃ Cn folgt 1 C 3 n−1 ⊃ 13 Cn 2 3 + 13 Cn−1 ⊃ 2 3 + 13 Cn 5.3. RIEMANN-MESSBARE MENGEN UND DIE CANTOR-MENGE 257 Hieraus folgt Cn = 13 Cn−1 ∪ ( 23 + 13 Cn−1 ) ⊃ 31 Cn ∪ ( 23 + 13 Cn ) = Cn+1 Nun zeigen wir, dass ∞ \ C⊆ Cn n=1 Hierzu zeigen wir durch Induktion, dass für alle n ∈ N gilt, dass C ⊆ Cn . Es gilt C1 = [0, 1] ⊃ C Wir nehmen nun an, dass C ⊂ Cn . Dann folgt Cn+1 = 13 Cn ∪ ( 23 + 13 Cn ) ⊃ 31 C ∪ ( 23 + 31 C) = C Wir zeigen, dass ∞ \ C⊇ Cn n=1 Dazu zeigen wir zuerst, dass ∞ \ Cn = 1 3 n=1 ∞ \ n=1 Cn ∪ 2 3 + 1 3 ∞ \ ! Cn n=1 Es gilt ∞ \ Cn ∞ \ = n=1 ⊇ ∞ \ Cn+1 = n=1 ∞ \ 1 C 3 n n=1 ∪ ( 32 + 13 Cn ) 1 C ∪ ( 32 + 13 Cj ) = 3 i i,j=1 1 3 ∞ \ ! Ci i=1 ∪ 2 3 + 1 3 ∞ \ ! Cj j=1 Andererseits gilt 1 3 ∞ \ ! ∪ Ci i=1 ⊇ = Es sei nun x ∈ Darstellung ∞ \ 2 3 + 1 3 ∞ \ 1 C 3 max{i,j} ∞ \ n=1 n=1 Cn+1 = n=1 Cj = j=1 i,j=1 ∞ \ T∞ ! ∪ ∞ \ ∪ ( 23 + 13 Cj ) 1 C 3 i i,j=1 ( 32 + 1 C ) 3 max{i,j} = ∞ \ n=1 1 C 3 n ∪ ( 32 + 13 Cn ) Cn Cn aber x ∈ / C. Da x ∈ [0, 1] gilt, gibt es eine 3-adische x= ∞ X aj j=1 3j aj ∈ {0, 1, 2} 258 CHAPTER 5. INTEGRALRECHNUNG wobei es i0 , j0 ∈ N mit i0 < j0 und ai0 = 1 und aj0 6= 2 gibt. Wir wollen uns dies überlegen. Falls es mindestens zwei i mit ai = 1 gibt, dann können wir ai0 = aj0 = 1 mit i0 < j0 wählen. Wenn es nur ein einziges i0 mit ai0 = 1 gibt und es gibt ein j0 mit i0 < j0 und aj0 = 0, dann sind wir auch fertig. Falls es aber nur ein i0 mit ai0 = 1 gibt und für alle i > i0 gilt, dass ai = 2, dann gilt weiter x= ∞ X aj j=1 3j = iX 0 −1 j=1 iX ∞ 0 −1 X aj aj 1 2 2 + i0 + = + i0 ∈ C j j j 3 3 3 3 3 j=1 j=i +1 0 Wir betrachten der kleinste Index i0 , für den der Koeffizient gleich 1 ist. Wir betrachten den Fall, dass i0 = 1, also a1 = 1. Dann folgt x ∈ [ 13 , 23 ]. Es kann nicht sein, dass x = 32 , weil 23 ∈ C. Es kann auch nicht sein, dass x = 31 , weil ∞ 1 X 2 x= = ∈C 3 3j j=2 Wir hatten aber angenommen, dass x ∈ / C. Insgesamt erhalten wir, dass x ∈ ( 31 , 32 ). Damit gilt x ∈ / C2 , im Widerspruch zu unserer Annahme. Nun betrachten wir den Fall, dass i0 > 1. Wir konstuieren ein ∞ ∞ \ X bj ∈ Cn y= 3j n=1 j=1 y∈ /C und mit bi0 −1 = 1. Wir können also i0 um 1 reduzieren. Dasselbe Argument wenden wir i0 − 1 mal an, so dass wir den Fall i0 = 1 erhalten Wegen ! ! ∞ ∞ ∞ \ \ \ 1 2 1 Cn = 3 Cn ∪ 2 + 3 Cn n=1 gilt x∈ 1 3 bzw. 3x ∈ n=1 ∞ \ Cn oder n=1 ∞ \ n=1 Cn oder n=1 x∈ 2 3 + 1 3 3x − 2 ∈ ∞ \ Cn n=1 ∞ \ Cn n=1 Wir betrachten den ersten Fall. Dann gilt 3x ∈ / C, weil sonst x ∈ C folgen würde, im Gegensatz zu unserer Annahme. Dann wählen wir y = 3x und es gilt bi0 −1 = 1. (v) Da χC eine nichtnegative Funktion ist, gilt für alle Partitionen P und alle Untersummen US P (χC ) 0 ≤ US P (χC ) Die Menge Cn ist eine disjunkte Vereinigung von 2n−1 abgeschlossenen Intervallen der Länge 3n−1 , die alle in [0, 1] enthalten sind. Dies folgt mit Induktion aus (iv). C1 = [0, 1] erfüllt die Aussage. Falls Cn die Aussage erfüllt, dann ist 31 Cn 5.3. RIEMANN-MESSBARE MENGEN UND DIE CANTOR-MENGE 259 eine disjunkte Vereinigung von 2n−1 abgeschlossenen Intervallen der Länge 3n , die in [0, 13 ] enthalten sind. Ausserdem ist 23 + 13 Cn eine disjunkte Vereinigung von 2n−1 abgeschlossenen Intervallen der Länge 3n , die in [ 23 , 1] enthalten sind. Deshalb besteht Cn+1 = ( 13 Cn ) ∪ ( 23 + 31 Cn ) aus 2n disjunkten, abgeschlossenen Intervallen der Länge 3n . Somit gibt es Zahlen ak , bk , k = 1, . . . , 2n−1 , mit 0 = a1 < b1 < a2 < b2 < a3 < · · · < a2n−1 < b2n−1 = 1 und n−1 2[ Cn = [ak , bk ] k=1 Nun wählen wir als Partition P = {a1 , b1 + , a2 − , b2 + , a3 − , . . . , b2n−1 −1 + , a2n−1 − , b2n−1 } Weil C ⊆ Cn gilt, folgt sup x∈[ak −,bk +] χC (x) ≤ 1 sup χC (x) = 0 x∈[bk +,ak −] Damit folgt für die Obersumme OS P (χC ) ≤ 2n−1 (3−n+1 + 2) Da wir < 12 3−n+1 wählen können, folgt n−1 2 OS P (χC ) ≤ 2 3 (vi) Die Abbildung f : C → [0, 1] f ∞ X aj j=1 3j ! = ∞ X j=1 aj 2 2j ist surjektiv. Wir überlegen uns zuerst, dass diese Abbildung wohldefiniert ist. Ein Element x ∈ R hat entweder genau eine 3-adische Darstellung oder genau zwei 3-adische Darstellungen. Wir müssen den Fall betrachten, dass x genau zwei 3-adische Darstellungen hat. Falls x genau zwei 3-adische Darstellungen hat und x ist ein Element der Cantor Menge, dann hat nur eine Darstellung die Eigenschaft, dass die Koeffizienten entweder 0 oder 2 sind. Wir überlegen uns dies. Wenn eine Zahl zwei 3-adische Darstellungen besitzt, dann sind in einer der Darstellungen fast alle Koeffizienten gleich 2. Wenn sämtliche Koeffizienten gleich 2 sind, dann handelt es sich um die Zahl 1, deren andere 3-adische Darstellung 310 ist. Falls es einen Koeffizienten gibt, der von 2 verschieden ist, so muss es 0 sein. Deshalb hat die andere 3-adische Darstellung dieser Zahl eine 1 als Koeffizienten. Nun überlegen wir uns, dass die Abbildung surjektiv ist. Da wir sämtliche Koa effizientenfolgen {aj }j∈N mit aj ∈ {0, 2} zulassen, handelt es sich bei { 2j }j∈N um 260 CHAPTER 5. INTEGRALRECHNUNG sämtliche Folgen, der Glieder aus 0 oder 1 bestehen. Deshalb erhalten wir im Bild alle dyadischen Darstellungen von Zahlen aus dem Intervall [0, 1]. (ix) [Nym] Wir verwenden die Darstellung ( C= ) ∞ X 2cn cn ∈ {0, 1} 3n n=1 Die Gleichung C + C= [0, 2] ist äquivalent zu 21 C + 12 C = [0, 1]. Es gilt 12 C = P∞ cn n=1 3n cn ∈ {0, 1} . Deshalb ) ∞ X cn + dn = cn , dn ∈ {0, 1} 3n n=1 ( ∞ ) X bn = bn ∈ {0, 1, 2} = [0, 1] 3n n=1 ( 1 C 2 + 21 C In [87] wird eine geometrische Konstruktion verwendet, um dieses Ergebnis zu erzielen. Außerdem wird sowohl in [83] als auch [87] berechnet, auf wie viele verschiedene Weisen man ein Element aus dem Intervall [0, 2] als Summe von zwei Elementen aus C darstellen kann. Die Formel in [87] ist leider falsch, sie wurde in [83] korrigiert. (x) Man kann das Ergebnis (ix) benutzen, um (x) P zu beweisen. Es gilt C = 2 1 − C = {1 − x|x ∈ C}. Hierzu beachte man, dass 1 = ∞ n=1 3n . Somit gilt ) ∞ X an = 1− a ∈ {0, 2} n n 3 ) ( ∞ ) ( ∞ n=1 X an X 2 − an = an ∈ {0, 2} = a ∈ {0, 2} n n n 3 3 n=1 n=1 ( 1−C Deshalb gilt weiter C + C = C + (1 − C) = 1 + (C − C), also C − C = 1 − (C + C) = [−1, 1]. Wir wollen aber noch ein geometrische Argument angeben. Wir wollen zeigen, dass es zu jedem a ∈ [−1, 1] Elemente x, y ∈ C gibt so dass a = y − x. Dies kann man auch so formulieren: Hat die Gerade y = x + a mit C × C einen nichtleeren Schnitt. Wir wollen hier die T∞Darstellung der Cantor Menge als Schnitt der Mengen Cn verwenden, also C = n=1 Cn . Deshalb C ×C = ∞ \ n=1 ! Cn × ∞ \ n=1 ! Cn = ∞ \ n,k=1 Cn × Ck = In den Skizzen sind zwei dieser Mengen dargestellt. ∞ \ n=1 Cn × Cn 5.3. RIEMANN-MESSBARE MENGEN UND DIE CANTOR-MENGE Konstruktion des Produktes der Cantor Menge mit sich selbst 261 Konstruktion des Produktes der Cantor Menge mit sich selbst Wir betrachten nun den Schnitt einer Geraden y = x + a, a ∈ [−1, 1], mit den Mengen Cn × Cn , n = 0, 1, . . . . Eine solche Gerade hat mit jeder Menge Cn × Cn einen nichtleeren Schnitt. Wegen Kompaktheit hat damit auch C × C mit einer solchen Geraden einen nichtleeren Schnitt. y=x+a 2 Die Cantor Menge ist ein Fraktal. Benoit Mandelbrot hat 1975 den Begriff ”Fraktal” eingeführt. Er schrieb dazu:”Wolken sind keine Kugeln, Berge keine Kegel, Küsten keine Kreise und die Baumrinde ist nicht glatt, noch wählt der Blitz eine gerade Linie.”[Man, p.1] Fraktale haben im Vergleich zu Flächen und Körpern der klassischen Geometrie eine irreguläre Struktur.Und wenn man diese Mengen durch ein Vergrößerungsglas ansieht, dann treten weitere Irregularitäten hervor. Mandelbrot hat folgende Definition gegeben: Ein Fraktal ist eine Menge, deren Hausdorff-Besicovitch Dimension strikt größer als die topologische Dimension ist 262 CHAPTER 5. INTEGRALRECHNUNG [Man, p.15]. Man kann zeigen, dass die Hausdorff-Besicovitch Dimension der Cantor 2 ist. Die topologische Dimension ist 0 [Edg]. Menge gleich ln ln 3 Beispiel 5.3.2 Die Cantor Funktion φ : [0, 1] → [0, 1] ist durch (∞ a ) ∞ X j X a j 2 φ(x) = sup und für alle j ∈ N gilt aj ∈ {0, 2} x≥ j j 2 3 j=1 j=1 definiert. Es gelten (i) Die Cantor Funktion ist eine stetige, wachsende Funktion. (ii) Die Cantor Funktion ist in allen Punkten von C nicht differenzierbar und sie ist in allen Punkten, die nicht in C liegen differenzierbar. Die Ableitung ist in allen diesen Punkten gleich 0. (iii) Für alle x, y ∈ [0, 1] gilt ln 2 |φ(x) − φ(y)| ≤ 2|x − y| ln 3 . Die Cantor Funktion wird auch Teufelstreppe genannt. Beweis. (i) Es ist offensichtlich, dass φ wachsend ist. Wir weisen die Stetigkeit von φ nach. Wir betrachten zwei Fälle, x ∈ C und x∈ / C. Zunächst der Fall x ∈ / C. Da C kompakt ist ist das Komplement von C offen. Also gibt es ein Intervall (x − , x + ), das im Komplement von C enthalten ist. Da in diesem Intervall kein Element aus C enthalten ist, folgt ) ( ∞ a ∞ X X j aj 2 und für alle j ∈ N gilt aj ∈ {0, 2} φ(x + ) = sup x+≥ j 2 3j j=1 j=1 ( ∞ a ) ∞ X j X a j 2 = sup und für alle j ∈ N gilt aj ∈ {0, 2} x−≥ j 2 3j j=1 j=1 = φ(x − ) Damit ist φ in einer Umgebung von x konstant, also stetig. Wir nehmen nun an, dass x ∈ C. Damit gibt es Koeffizienten aj , so dass x= ∞ X aj j=1 3j mit aj ∈ {0, 2}. Zu gegebenen wählen wir j0 so groß, dass 2−j0 +1 < und wir wählen δ < 3−j0 . Für ein y ∈ C mit |x − y| < δ gibt es eine Darstellung y= ∞ X bj 3j j=1 mit bj ∈ {0, 2} 5.3. RIEMANN-MESSBARE MENGEN UND DIE CANTOR-MENGE 263 und es gilt ∞ X a − b j j < δ. j 3 j=1 Es sei j1 die kleinste Zahl, so dass aj 6= bj . Dann gilt |aj1 − bj1 | und somit δ> ∞ ∞ X X |aj − bj | 2 |aj1 − bj1 | − ≥ − 2 3−j = 3−j1 . j j1 3j1 3 3 j=j +1 j=j +1 1 1 Deshalb gilt j0 ≤ j1 und für alle z mit |z − x| < δ gilt (∞ b ) ∞ X j X b j 2 φ(z) = sup und für alle j ∈ N gilt bj ∈ {0, 2} z≥ 2j 3j j=1 j0 ≤ j=1 ∞ X X aj + 2j+1 j=j j=1 0 +1 2−j ≤ φ(x) + 2−j0 < φ(x) + . Die Ungleichung φ(x) ≤ φ(z) + wird ähnlich bewiesen. (ii) Die Differenzierbarkeit in den Punkten x ∈ / C wird genauso wie die Stetigkeit nachgewiesen: f ist auf einer Umgebung konstant. Damit ist die Ableitung dort 0. Nun zeigen wir, dass φ in den Punkten x ∈ C nicht differenzierbar ist. Es sei also x ∈ C ∞ X ai x= ai ∈ {0, 2} i 3 i=1 und wir betrachten zuerst den Fall, dass die 3-adische Entwicklung von x unendlich viele Koeffizienten besitzt, die gleich 2 sind. Es sei io so gewählt, dass ai0 = 2 gilt. Dann wählen wir ( ∞ X ai falls i 6= i0 bi mit b = y= i 3i 0 falls i = i0 i=1 Für den Differenzenquotienten erhalten wir φ(x) − φ(y) = x−y 1 2i0 2 3i0 = 3i0 . 2i0 +1 Da wir i0 beliebig großwählen können, ist der Differenzquotient nicht beschränkt. (Die linksseitige Steigung in x ist unendlich.) Nun betrachten wir den Fall, dass die 3-adische Entwicklung von x unendlich viele Koeffizienten besitzt, die gleich 0 sind. Es sei i0 so gewählt, dass ai0 = 0. Nun wählen wir ( ∞ X ai falls i 6= i0 ci z= mit ci = . i 3 2 falls i = i0 i=1 Wir erhalten hier das analoge Ergebnis, die rechtsseitige Steigung ist unendlich. 2 264 CHAPTER 5. INTEGRALRECHNUNG Beispiel 5.3.3 Es gibt halbstetige, beschränkte Funktionen auf [0, 1], die nicht Riemann integrierbar sind. Tatsächlich gibt es eine charakteristische Funktion auf einer abgeschlossenen Menge, die nicht Riemann integrierbar ist. Beweis. Wir konstruieren eine Menge vom Cantortyp. Wir entnehmen dem Intervall [0, 1] das Intervall ( 21 −q, 12 +q). Den beiden übriggebliebenen Intervallen entnehmen wir wieder entsprechende Intervalle. Die Vereinigung A über alle entnommenen Intervalle ist eine offene, dichte Menge in [0, 1]. Die Funktion χAc ist nach oben halbstetig, aber nicht Riemann integrierbar. 2 5.4 Hauptsatz der Differential- und Integralrechnung Es sei I ein Intervall und f : I → R eine Funktion, die auf jedem abgeschlossenen Teilintervall von I Riemann integrierbar ist. Die Funktion F : I → R Z x F (x) = f (t)dt x0 heißt Integral von f . Lemma 5.4.1 Es sei I ein Intervall und f : I → R eine Funktion, die auf jedem abgeschlossenen Teilintervall von I Riemann integrierbar ist. Dann ist jedes Integral F : I → R von f eine stetige Funktion. Beweis. Es sei x ∈ I. Wir wollen die Stetigkeit von F in x nachprüfen. Es sei {xn }n∈N eine Folge mit limn→∞ xn = x. Dann gibt es ein Intervall [a, b] ⊆ I mit {xn }n∈N ⊂ [a, b]. Da f auf [a, b] Riemann integrierbar ist, ist f auf [a, b] beschränkt. Damit gilt Z xn Z x |F (xn ) − F (x)| = f (t)dt − f (t)dt Zx0x Zx0 x = f (t)dt ≤ |f (t)|dt ≤ |x − xn | sup |f (t)|. xn xn t∈[a,b] 2 Lemma 5.4.2 Es sei I ein Intervall und f : I → R eine Funktion, die auf jedem abgeschlossenen Teilintervall von I Riemann integrierbar ist. Außerdem sei f in x ∈ I stetig. Dann ist jedes Integral F von f in x differenzierbar und es gilt F 0 (x) = f (x). 5.4. HAUPTSATZ DER DIFFERENTIAL- UND INTEGRALRECHNUNG 265 Beweis. Es sei {xn }n∈N eine Folge, die gegen x konvergiert. Wir zeigen, dass F (xn ) − F (x) = f (x). n→∞ xn − x lim Es gilt Z xn Z x 1 F (xn ) − F (x) f (t)dt − f (x) − f (x) = f (t)dt − xn − x x −x x0 x n Z xn0 1 = f (t)dt − f (x) xn − x x Z xn 1 = f (t)dt − (x − x)f (x) n |xn − x| x Z xn Z xn 1 f (x)dt f (t)dt − = |xn − x| x x Z xn 1 = f (t) − f (x)dt |xn − x| x Z xn 1 ≤ |f (t) − f (x)|dt |xn − x| x ≤ sup |f (x) − f (t)|. t∈[x,xn ] Also gilt (5.4) F (xn ) − F (x) − f (x) ≤ sup |f (x) − f (t)|. xn − x t∈[x,xn ] Wir zeigen nun, das man zu jedem > 0 ein N findet, so dass für alle n mit n > N sup |f (x) − f (t)| < (5.5) t∈[x,xn ] gilt. Da f in x stetig ist ∀ > 0∃δ > 0∀t, |x − t| < δ : |f (x) − f (t)| < . Wegen limn→∞ xn = x ∀δ > 0∃N ∈ N∀n ≥ N : |xn − x| < δ Insgesamt erhalten wir ∀ > 0∃N ∈ N∀n ≥ N ∀t ∈ [x, xn ] : |f (x) − f (t)| < . Damit haben wir (5.5) gezeigt. Aus (5.4) und (5.5) folgt nun die Differenzierbarkeit in x 2 Definition 5.4.1 Es sei I ein Intervall, f : I → R und F : I → R eine differenzierbare Funktion mit F 0 = f . Dann heißt F Stammfunktion von f . 266 CHAPTER 5. INTEGRALRECHNUNG Da mit F auch F + c eine Stammfunktion ist, gibt es zu einer Funktion f , die eine Stammfunktion besitzt, immer unendlich viele Stammfunktionen. Andererseits unterscheiden sich zwei Stammfunktionen F1 und F2 immer nur um eine Konstante. Dies gilt, weil (F1 − F2 )0 = 0 Wir müssen Satz 3.6.3 anwenden. Satz 5.4.1 (Hauptsatz der Differential- und Integralrechnung) Es sei f : [a, b] → R eine stetige Funktion. Dann besitzt f eine Stammfunktion und für alle Stammfunktionen F gilt Z b a f (x)dx = F (b) − F (a). Obwohl der Satz sicherstellt, dass es zu einer stetigen Funktion immer eine Stammfunktion gibt, kann es sehr schwierig sein, eine solche Stammfunktion als Zusammensetzung elementarer Funktionen explizit anzugeben. 2 Für die Funktion e−x lässt sich zeigen, dass dies unmöglich ist. Beweis. Wir betrachten das Integral Z x f (t)dt. F (x) = a Nach Lemma 5.4.2 gilt F 0 (x) = f (x). Weiter gilt Z b f (x)dx = F (b) = F (b) − F (a). a Da sich zwei Stammfunktionen nur bis auf eine Konstante unterscheiden, folgt die Gleichung auch für beliebige Stammfunktionen. 2 Wir wollen nun eine etwas allgemeinere Version vom Hauptsatz der Differentialund Integralrechnung angeben. Satz 5.4.2 Es sei f : [a, b] → R Riemann integrierbar und F : [a, b] → R eine Stammfunktion von f . Dann gilt Z b f (t)dt = F (b) − F (a). a Die Voraussetzung, dass f Riemann-integrierbar ist und eine Stammfunktion besitzt ist etwas schwächer als die Stetigkeit, weil es differenzierbare Funktionen gibt, deren Ableitung nicht stetig ist. Es gibt unbeschränkte Funktionen f , die eine Stammfunktion besitzen. Umgekehrt gibt es Riemann-integrierbare Funktionen, die keine Stammfunktion besitzen. 5.4. HAUPTSATZ DER DIFFERENTIAL- UND INTEGRALRECHNUNG 267 Beweis. Es sei P = {x0 , x1 , . . . , xn } eine Partition von [a, b]. Dann gilt F (b) − F (a) = n X k=1 (F (xk ) − F (xk−1 )). Mit dem Mittelwertsatz folgt, dass es ξk ∈ (xk−1 , xk ) gibt, so dass F (b) − F (a) = n X k=1 0 F (ξk )(xk − xk−1 ) = n X k=1 f (ξk )(xk − xk−1 ). Außerdem gilt n X k=1 mk (f )(xk − xk−1 ) ≤ n X k=1 f (ξk )(xk − xk−1 ) ≤ n X k=1 Mk (f )(xk − xk−1 ). Hieraus folgt US P (f ) ≤ F (b) − F (a) ≤ OS P (f ). Da f integrierbar ist, folgt F (b) − F (a) = inf OS P (f ) = sup US P (f ) = P P Z b f (t)dt. a 2 Falls eine Funktion f : I → R eine Stammfunktion besitzt, so bezeichnen wir die Menge {F | F ist Stammfunktion von f } mit Z f (x)dx und nennen dies das unbestimmte Integral von f . Falls f Riemann integrierbar ist, so muss f nicht notwendig eine Stammfunktion besitzen. Umgekehrt muss eine Funktion, die eine Stammfunktion besitzt, nicht notwendig Riemann integrierbar sein. Beispiel 5.4.1 (i) Die Funktion f : [−1, 1] → R ( −1 falls x ∈ [−1, 0] f (x) = 1 falls x ∈ (0, 1] ist Riemann integrierbar, sie besitzt aber keine Stammfunktion. (ii) Die Funktion f : [0, 1] → R falls x irrational ist oder x = 0 0 f (x) = m 1 falls x = und m und n teilerfremd sind n n ist Riemann integrierbar, besitzt aber keine Stammfunktion. (iii) Es sei 2 falls x ∈ [−1, 1] und x 6= 0 x cos xπ2 f (x) = 0 falls x = 0 Dann ist f 0 unbeschränkt, also insbesondere nicht Riemann-integrierbar. 268 CHAPTER 5. INTEGRALRECHNUNG Beweis. (i) Wir betrachten die Partition Pn = −1, 0, Wir erhalten US Pn (f ) = 0 · 1 + 0 · 1 ,1 n 1 1 1 +1· 1− =1− . n n n Es folgt sup US Pn (f ) = 1. n Es gilt OS Pn (f ) = 0 · 1 + 1 · 1 1 +1· 1− = 1. n n Also ist f Riemann integrierbar. Wir nehmen an, dass f eine Stammfunktion F hat. Dann gilt nach Satz 5.4.2 für alle x ∈ [−1, 1] Z x f (t)dt = F (x) − F (−1) −1 Wir berechnen das Integral und erhalten |x| − 1 = F (x) − F (−1) oder F (x) = |x| − 1 + F (−1) Dies kann nicht sein, weil die linke Seite in 0 differenzierbar ist, die rechte Seite jedoch nicht. (ii) Wir hatten in Beispiel ?? bereits gezeigt, dass f eine integrierbare Funktion ist, und dass Z 1 f (t)dt = 0 0 gilt. Hieraus kann man folgern, dass für alle x ∈ [0, 1] Z x f (t)dt = 0 0 gilt. Wenn es also eine Stammfunktion geben würde, dann müsste diese eine konstante Funktion sein. Diese ist aber sicherlich nicht die Stammfunktion von f . (iii) Falls 0 6= x gilt, dann kann man die Kettenregel anwenden und erhält π 2π π sin 2 f 0 (x) = 2x cos 2 + x x x Für x = 0 rechnet man aus π x2 cos xπ2 f 0 (0) = lim = lim x cos 2 = 0 x→0 x→0 x x f ist also auf ganz [−1, 1] differenzierbar. Wir weisen nun nach, dass f 0 unbeschränkt ist. Eine unbeschränkte Funktion ist nicht Riemann integrierbar. Wir betrachten die Punkte 1 xn = q n∈N 2n + 12 Dann gilt 0 f (xn ) = 2 q 2 r 1 2n + 1 2 cos π(2n + 1 2) + 2π 1 2n + sin π(2n + 12 ) = 2π 2 r 1 2n + . 2 5.4. HAUPTSATZ DER DIFFERENTIAL- UND INTEGRALRECHNUNG Beispiel 5.4.2 Es seien aq , q ∈ Q, positive reelle Zahlen, so dass durch X f (x) = aq P q∈Q 269 aq < ∞. Es sei f : R → R q<x gegeben. Dann ist f Riemann integrierbar und F : R → R Z x f (t)dt F (x) = 0 ist auf R stetig, in allen irrationalen Punkten differenzierbar und in allen rationalen Punkten nicht differenzierbar. Beweis. In Satz 5.1.1 hatten wir gezeigt, dass eine monoton wachsende Funktion integrierbar ist. Lemma 5.4.1 sagte aus, dass F auf R stetig ist. In Beispiel 3.1.8 hatten wir gezeigt, dass f in den irrationalen Punkten stetig und in den rationalen Punkten unstetig ist. Mit Lemma 5.4.2 folgt, dass F in den irrationalen Punkten differenzierbar ist. Es bleibt zu zeigen, dass F in den rationalen Punkten nicht differenzierbar ist. Es sei x0 ∈ Q. Dann gilt X f (x) ≤ aq für alle x ≤ x0 q<x0 X f (x) ≥ aq für alle x > x0 q≤x0 Wir nehmen an, F sei differenzierbar in x0 . Z x Z x Z x0 1 1 F (x) − F (x0 ) = f (t)dt f (t)dt − f (t)dt = x − x0 x − x0 x − x0 x0 0 0 Für x < x0 erhalten wir F (x) − F (x0 ) 1 = x − x0 x0 − x Es folgt, dass F 0 (x0 ) ≤ P q<x0 P q≤x0 x 1 f (t)dt ≤ x0 − x Z x0 x X aq dt = X q<x0 q<x0 X X aq aq . Andererseits gilt für x > x0 1 F (x) − F (x0 ) = x − x0 x − x0 Es folgt, dass F 0 (x0 ) ≥ x0 Z Z x x0 f (t)dt ≥ 1 x − x0 Z x aq dt = x0 q≤x 0 aq q≤x0 aq . Dies kann nicht sein, weil ax0 > 0. 2 Beispiel 5.4.3 Es seien f, g : [a, b] → R zwei Riemann-integrierbare Funktionen, die auf einer dichten Menge übereinstimmen. Zeigen Sie, dass die Integrale gleich sind. Beweis. Wir zeigen zuerst: Es sei h : [a, b] → R eine Riemann-integrierbare Funktion, die auf Rb einer dichten Menge 0 ist. Dann gilt a hdx = 0. Da h Riemann-integrierbar ist, gilt Z a b h(x)dx = sup US P (h) = inf OS P (h). P P Da h auf einer dichten Menge 0 ist, gilt für alle Partitionen P US P (h) ≤ 0 ≤ OS P (h) 270 CHAPTER 5. INTEGRALRECHNUNG und somit sup US P (h) ≤ 0 ≤ inf OS P (h). P P Wegen supP US P (h) = inf P OS P (h) folgt b Z h(x)dx = 0. a Wenn nun zwei Riemann-integrierbare Funkktionen f und g auf einer dichten Menge übereinstimmen, dann ist h = f − g auf einer dichten Menge 0. 2 5.5 Substitution und partielle Integration Satz 5.5.1 Es sei φ : [α, β] → [a, b] stetig differenzierbar und es gelte φ([α, β]) = [a, b]. Die Funktion f : [a, b] → R sei stetig auf [a, b]. Dann gilt Z φ(β) Z β f (φ(ξ))φ0 (ξ)dξ. f (x)dx = φ(α) α Beweis. f hat eine Stammfunktion F , weil f stetig ist. Somit gilt Z φ(β) φ(α) f (x)dx = F (φ(β)) − F (φ(α)). Andererseits folgt mit der Kettenregel, dass F ◦ φ eine Stammfunktion von (f ◦ φ)φ0 ist. Deshalb gilt Z β f (φ(ξ))φ0 (ξ)dξ = F (φ(β)) − F (φ(α)). α 2 Satz 5.5.2 Es seien f, g : [a, b] → R stetig differenzierbare Funktionen. Dann gilt Z a b 0 f (x)g (x)dx = [f (b)g(b) − f (a)g(a)] − b Z f 0 (x)g(x)dx. a Beweis. Die Produktregel besagt (f g)0 = f g 0 + f 0 g. Es folgt Z b 0 Z (f g) (x)dx = a b Z 0 b f (x)g (x)dx + a f 0 (x)g(x)dx. a Hieraus folgt f (b)g(b) − f (a)g(a) = 2 Z b 0 Z f (x)g (x)dx + a a b f 0 (x)g(x)dx. 5.6. MITTELWERTSATZ DER INTEGRALRECHNUNG 271 Beispiel 5.5.1 Man benutze partielle Integration, um eine Stammfunktion von ln zu finden. Lösung. Wir setzen f = ln und g(x) = x. Dann folgt mit partieller Integration Z x Z x Z x ln(t)dt = f (t)g 0 (t)dt = [f (x)g(x) − f (1)g(1)] − f 0 (t)g(t)dt 1 1 1 Z x dt = x ln x − (x − 1) = [x ln x − ln 1] − 1 Also ist x ln x − x eine Stammfunktion von ln. 2 5.6 Mittelwertsatz der Integralrechnung Satz 5.6.1 (Mittelwertsatz der Integralrechnung) Es sei f : [a, b] → R eine stetige Funktion. Dann existiert ein ξ ∈ (a, b) mit Z a b f (x)dx = f (ξ)(b − a). Beweis. Da f stetig ist besitzt f eine Stammfunktion F . Nach dem Mittelwertsatz gibt es ein ξ ∈ (a, b) mit F (b) − F (a) = F 0 (ξ) = f (ξ) b−a Das bedeutet f (ξ)(b − a) = F (b) − F (a) = Z b f (x)dx a 2 Satz 5.6.2 Es seien f, g : [a, b] → R stetige Funktionen und g ≥ 0. Dann existiert ein ξ ∈ (a, b) mit Z b Z b f (x)g(x)dx = f (ξ) g(x)dx a a Beweis. Da f stetig ist, nimmt f auf [a, b] Minimum und Maximum an. Es gilt für alle x ∈ [a, b] min f (t) g(x) ≤ f (x)g(x) ≤ max f (t) g(x). t∈[a,b] t∈[a,b] Damit folgt Z b Z b Z b (5.6) min f (t) g(x)dx ≤ f (x)g(x)dx ≤ max f (t) g(x)dx. t∈[a,b] a a t∈[a,b] a 272 CHAPTER 5. INTEGRALRECHNUNG Deshalb gibt es ein c mit min f (t) ≤ c ≤ max f (t) t∈[a,b] und t∈[a,b] b Z b Z f (x)g(x)dx = c g(x)dx a Falls Rb a a gdx > 0, dann wählen wir Rb f (x)g(x)dx . Rb gdx a Rb Rb Falls a gdx = 0, dann gilt wegen (5.6) auch a f (x)g(x)dx = 0. Dann können wir ein beliebiges c wählen. Da f aber stetig ist gibt es nach dem Zwischenwertsatz ein ξ ∈ [a, b] mit c = f (ξ). 2 c= 5.7 a Uneigentliche Integrale Es sei f : [a, ∞) → R eine Funktion, die auf jedem Intervall [a, b] mit b > a Riemann integrierbar ist und für die der Grenzwert Z b f (x)dx lim b→∞ a existiert. Dann heißt f uneigentlich Riemann integrierbar auf [a, ∞) und wir schreiben Z b Z ∞ f (x)dx. f (x)dx = lim b→∞ a a Ebenso wird für f : (−∞, b] → R das uneigentliche Integral Z b Z b f (x)dx = lim f (x)dx a→−∞ −∞ a definiert. Eine Funktion f : (a, b] → R heißt uneigentlich Riemann integrierbar auf (a, b], falls für alle mit 0 < < b − a die Funktion f auf [a + , b] integrierbar ist und der Grenzwert Z b lim →0 f (x)dx a+ existiert. Wir setzen dann Z b Z b f (x)dx = lim a Ebenso für Funktionen f : [a, b) → R. →0 f (x)dx. a+ 5.7. UNEIGENTLICHE INTEGRALE 273 Beispiel 5.7.1 (i) Es sei −1 < α < 0. Dann gilt 1 Z 1 α+1 xα dx = 0 (ii) Es sei β < −1. Dann gilt ∞ Z xβ dx = − 1 1 β+1 (iii) ∞ Z e−x dx = 1 0 (iv) 1 Z 0 (v) 1 x ln xdx = −1 ist weder auf [0, 1] noch auf [1, ∞) uneigentlich Riemann integrierbar. Beweis. (i) 1 Z 1 Z α xα dx = lim h xβ dx = lim h x dx = lim →0 0 →0 α+1 1 α+1 x i1 = lim →0 1 α+1 − α+1 1 α+1 = 1 α+1 (ii) Z ∞ Z β x dx = lim b→∞ 1 b b→∞ 1 β+1 1 β+1 x ib 1 = lim b→∞ β+1 1 β+1 b − 1 β+1 1 = − β+1 (iii) Z ∞ −x e b Z dx = lim b→∞ 0 b e−x dx = lim −e−x 0 = lim −e−b + 1 = 1 b→∞ 0 b→∞ (iv) Z 1 1 Z ln xdx = 0 = →0 1 ln xdx = lim [x ln x − x] lim →0 lim (−1 − ( ln − )) = −1 − lim ( ln − ) = −1 →0 →0 (v) 1 Z 0 Z 1 ∞ 1 dx = lim →0 x Z 1 1 dx = lim b→∞ x 1 1 dx = lim [ln x] = lim (− ln ) = ∞ →0 →0 x b Z 1 1 1 dx = lim [ln x] = lim (ln b) = ∞ b→∞ b→∞ x 2 Lemma 5.7.1 Die Funktion g : [a, ∞) → R sei uneigentlich Riemann integrierbar und f : [a, ∞) → R sei für alle b mit a < b auf [a, b] Riemann integrierbar. Für alle x ∈ [a, ∞) gelte 0 ≤ f (x) ≤ g(x). Dann ist auch f auf [a, ∞) uneigentlich Riemann integrierbar und es gilt Z Z ∞ a ∞ f (x)dx ≤ g(x)dx a Dasselbe Ergebnis gilt auch für uneigentliche Integrale auf (a, b]. 274 CHAPTER 5. INTEGRALRECHNUNG Beweis. Wegen Lemma 5.1.4 gilt für alle b und c mit b < c Z c Z b Z b g(x)dx. g(x)dx ≤ f (x)dx ≤ a a a Es folgt, dass Z a b f (x)dx ≤ Z ∞ g(x)dx. a Somit ist das linke Integral eine beschränkte Funktion in b. Außerdem ist dieses Integral eine monoton wachsende Funktion in b, weil f (x) ≥ 0. Damit existiert Z b lim f (x)dx. b→∞ a 2 5.8 Gammafunktion Die Fakultätsfunktion bildet eine natürliche Zahl n auf n! ab. Die Gammafunktion Γ erweitert die Fakultätsfunktion auf reelle und schließlich komplexe Zahlen. Sie erfüllt die Funktionalgleichung (Satz 5.8.2) ∀x > 0 : Γ(x + 1) = xΓ(x), woraus mit Γ(1) = 1 Γ(n + 1) = n! folgt. Tatsächlich legt diese Funktionalgleichung die Gammafunktion im Wesentlichen fest. Wenn man zusätzlich fordert, dass Γ logarithmisch konvex ist, d.h. dass ln Γ konvex ist, dann gibt es nur eine solche Funktion. Satz 5.8.1 Für alle x > 0 existiert das Integral Z ∞ e−t tx−1 dt. Γ(x) = 0 Wir bezeichnen die durch das Integral definierte Funktion Γ : (0, ∞) → R als Eulersche Gammafunktion. Beweis. Es sei x > 0 gegeben. Wir zeigen zunächst, dass es eine Konstante b ∈ R gibt, so dass für alle t ∈ [b, ∞) (5.7) e−t tx−1 ≤ 1 t2 gilt. Um dies zu zeigen, reicht es nachzuweisen, dass für alle x > 0 (5.8) lim e−t tx+1 = 0 t→∞ 5.8. GAMMAFUNKTION 275 gilt. In der Tat, falls (5.8) gilt, dann gilt für alle x > 0 ∀ > 0∃b ∈ R∀t ≥ b : e−t tx+1 < . Wir wählen = 1 und erhalten (5.7). Wir zeigen nun (5.8). Diese Gleichung folgt mit der Formel von L’Hôpital (Satz 3.11.3). Wir wählen n ∈ N mit x−n ≤ 0 < x−n+1. Es folgt für alle x > 0 lim e−t tx−n = 0 t→∞ und damit (x + 1)tx tx−n tx+1 = lim = · · · = (x + 1)x(x − 1) · · · (x − n + 1) lim = 0. t→∞ t→∞ et t→∞ et et lim Die Funktion t−2 ist auf [b, ∞) nach Beispiel 5.7.1 uneigentlich Riemann integrierbar, also ist mit Lemma 5.7.1 und (5.7) auch e−t tx−1 auf [b, ∞) uneigentlich Riemann integrierbar. Für x ≥ 1 ist die Funktion e−t tx−1 auf [0, b] stetig und damit Riemann integrierbar. Falls 0 < x < 1 dann gilt auf (0, b] 0 ≤ e−t tx−1 ≤ tx−1 . Nach Beispiel 5.7.1 ist die Funktion tx−1 auf (0, 1] uneigentlich Riemann integrierbar. Deshalb gilt Z b Z b Z b x−1 −t x−1 t dt = lim tx−1 dt = lim( x1 bx − x1 x ) = x1 bx . e t dt ≤ →0 0 0 →0 Satz 5.8.2 (i) Für alle x > 0 gilt Γ(x + 1) = xΓ(x). (ii) Für alle n = 0, 1, 2, . . . gilt Γ(n + 1) = n! . Beweis. (i) Wir verwenden partielle Integration mit f (t) = −e−t und g(t) = tx . Z b Z b Z b −t x −t x b −t x−1 −b x −1 e t dt = [−e t ]1 + e xt dt = (−e b + e ) + e−t xtx−1 dt 1 1 Z 1 ∞ 1 Z b −b x −1 −t x−1 e t dt = lim (−e b + e ) + e xt dt −t x b→∞ 1 Mit (5.8) folgt lim −e−b bx = 0. b→∞ 276 CHAPTER 5. INTEGRALRECHNUNG Also ∞ Z 1 e t dt = + x e −t x 1 Genauso erhalten wir Z 1 Z −t x −t x 1 e t dt = [−e t ]a + ∞ Z e−t tx−1 dt. 1 1 −t e xt x−1 dt = (−e −1 −a x 1 +e a )+ a a Z e−t xtx−1 dt a Wegen Stetigkeit und x > 0 gilt lim e−a ax = 0. a→0 Also 1 Z 1 e t dt = − + x e −t x 0 Insgesamt Z ∞ Z −t x e t dt = x 0 1 Z e−t tx−1 dt. 0 ∞ e−t tx−1 dt. 0 (ii) Wir zeigen die Aussage mit Induktion. Wegen Beispiel 5.7.1 gilt Z ∞ Γ(1) = e−t dt = 1. 0 Mit (i) und der Induktionsannahme folgt Γ(n + 1) = nΓ(n) = n(n − 1)! = n!. 2 Satz 5.8.3 (Betafunktion) Für alle x, y ∈ R mit x, y > 0 gilt Z 1 Γ(x)Γ(y) tx−1 (1 − t)y−1 = B(x, y) = Γ(x + y) 0 Lemma 5.8.1 dΓ = dx Z ∞ tx−1 (ln t)e−t dt 0 Satz 5.8.4 (Bohr-Mollerup) Eine Funktion G : (0, ∞) → (0, ∞) ist auf (0, ∞) genau dann gleich der Gammafunktion, wenn G(1) = 1, für alle x > 0 G(x + 1) = xG(x) gilt und G logarithmisch konvex ist, d.h. ln G konvex ist. Für x < 0 und x ∈ / Z definieren wir Γ(x) = Γ(x + n) x(x + 1) . . . (x + n − 1) wobei 0 < x + n < 1. Die Gammafunktion tritt z.B. bei der Berechnung des Volumens der n-dimensionalen Euklidischen Kugel auf: n π2 n R . Γ( n2 + 1) 5.9. BOGENLÄNGE 5.9 277 Bogenlänge Es sei f : [a, b] → R. Wir bezeichnen Graph(f ) = {(x, f (x))|x ∈ [a, b]} als den Graphen der Funktion f . Der Abstand von zwei Punkten (x0 , y0 ) und (x1 , y1 ) in R2 ist p |x0 − x1 |2 + |y0 − y1 |2 . (Dies folgt aus dem Satz von Pythagoras.) Deshalb sagen wir auch, dass dies die Länge der Verbindungsgeraden zwischen diesen Punkten ist. Deshalb setzen wir die Kurvenlänge für eine Funktion f (x) = cx + d von (x0 , f (x0 )) bis (x1 , f (x1 )) als p |x0 − x1 |2 + |f (x0 ) − f (x1 )|2 fest. Für einen Polygonzug f , d.h. f : [a, b] → R, a = x0 < x1 < · · · < xn = b und für alle i = 1, . . . , n für x ∈ [xi−1 , xi ] f (x) = ci x + di und für alle i = 1, . . . , n − 1 ci xi + di = ci+1 xi + di+1 Als Länge eines Polygonzuges definieren wir L(Graph(f )) = n X p |xi−1 − xi |2 + |f (xi−1 ) − f (xi )|2 . i=1 Wir wollen nun den Graphen einer beliebigen Funktion f durch Polygonzüge approximieren und die Länge des Graphen von f als den Grenzwert der Längen der Polygonzüge definieren. Für eine beliebige Funktion f und eine Partition P von [a, b] setzen wir LP (Graph(f )) = n X p i=1 |xi−1 − xi |2 + |f (xi−1 ) − f (xi )|2 . Lemma 5.9.1 Es sei f : [a, b] → R eine Funktion. Falls P 0 eine Verfeinerung von P ist, so gilt LP (Graph(f )) ≤ LP 0 (Graph(f )). Definition 5.9.1 Wir sagen, dass der Graph der Funktion f rektifizierbar ist, wenn sup LP (Graph(f )) < ∞ P und wir setzen dann L(Graph(f )) = sup LP (Graph(f )). P 278 CHAPTER 5. INTEGRALRECHNUNG Satz 5.9.1 Falls f : [a, b] → R stetig differenzierbar ist, so ist Graph(f ) rektifizierbar und es gilt Z bp 1 + |f 0 (x)|2 dx. L(Graph(f )) = a Man beachte, dass in der Voraussetzung gefordert wird, dass f auf dem abgeschlossenen Intervall [a, b] stetig differenzierbar ist, es reicht nicht zu fordern, dass f auf dem abgeschlossenen Intervall [a, b] differenzierbar und auf dem offenen (a, b) stetig differenzierbar ist (Beispiel 5.9.2). In den Punkten a und b ist f einseitig differenzierbar. Beweis. Es sei P eine Partition von [a, b]. n X p |xi−1 − xi |2 + |f (xi−1 ) − f (xi )|2 LP (Graph(f )) = i=1 s n X f (xi−1 ) − f (xi ) 2 = (xi − xi−1 ) 1 + x − x i−1 i i=1 Nach dem Mittelwertsatz gibt es zu jedem i = 1, . . . , n ein ξi ∈ (xi−1 , xi ) mit f 0 (ξi ) = f (xi ) − f (xi−1 ) xi − xi−1 Damit erhalten wir LP (Graph(f )) = n X p i=1 1 + |f 0 (ξi )|2 (xi − xi−1 ). Da f stetig differenzierbar ist, ist die Funktion integrierbar. Deshalb gilt n X p sup US P ( 1 + |f 0 |2 ) = sup P P = inf P n X sup i=1 t∈[xi−1 ,xi ] i=1 p 1 + |f 0 |2 stetig und damit Riemann- inf t∈[xi−1 ,xi ] p 1 + |f 0 (t)|2 (xi − xi−1 ) p p 1 + |f 0 (t)|2 (xi − xi−1 ) = inf OS P ( 1 + |f 0 |2 ). P Nach Definition des Integrals sind alle diese Ausdrücke gleich dem Integral Z bp a 1 + |f 0 (x)|2 dx. 5.9. BOGENLÄNGE 279 Weiter gilt für alle P n X p 0 2 US P ( 1 + |f | ) = ≤ i=1 n X i=1 inf t∈[xi−1 ,xi ] p 1 + |f 0 (t)|2 (xi − xi−1 ) p 1 + |f 0 (ξi )|2 (xi − xi−1 ) = LP (Graph(f )) n X p sup 1 + |f 0 (t)|2 (xi − xi−1 ) ≤ i=1 t∈[xi−1 ,xi ] p = OS P ( 1 + |f 0 |2 ). Wir erhalten also p p US P ( 1 + |f 0 |2 ) ≤ LP (Graph(f )) ≤ OS P ( 1 + |f 0 |2 ). Es folgt für alle Partitionen P und Q LP (Graph(f )) ≤ LP∪Q (Graph(f )) p p ≤ OS P∪Q ( 1 + |f 0 |2 ) ≤ OS Q ( 1 + |f 0 |2 ). Hieraus folgt für alle Partitionen P LP (Graph(f )) ≤ inf OS Q ( Q p 1 + |f 0 |2 ) und weiter p sup LP (Graph(f )) ≤ inf OS Q ( 1 + |f 0 |2 ). Q P Es folgt Z bp L(Graph(f )) ≤ 1 + |f 0 (x)|2 dx. a Andererseits folgt sofort, dass Z bp p 1 + |f 0 (x)|2 dx = sup US P ( 1 + |f 0 |2 ) ≤ sup LP (Graph(f )) = L(Graph(f )). a P P 2 Beispiel 5.9.1 (i) (Kettenlinie) Es sei f : [a, b] → R mit f (x) = cosh(x) = 21 (ex + e−x ). Dann gilt L(Graph(f )) = sinh(b) − sinh(a) 3 (ii) Es sei f : [0, 1] → R mit f (x) = x 2 . Dann gilt L(Graph(f )) = 8 13 23 27 (( 4 ) − 1) = 1.44 . . . 280 CHAPTER 5. INTEGRALRECHNUNG Beweis. (i) Wir benutzen cosh0 = sinh, sinh0 = cosh und 1 + sinh2 x = cosh2 x. b Z L(Graph(f )) = Z a b = a Z q 1 + | cosh0 (x)|2 dx = b p 1 + | sinh(x)|2 dx a cosh(x)dx = sinh(b) − sinh(a) (ii) 1 Z L(Graph(f )) = p 0 1 + |f 0 (x)|2 dx = Z 0 1 q 1 + 94 xdx Wir führen nun die Substitution t = 1 + 49 x bzw. x = 49 (t − 1) durch. Z 13 4 L(Graph(f )) = 1 4 9 √ tdt = 4 9 h 2 32 3t i 13 4 1 = 8 13 23 27 (( 4 ) − 1) = 1.44 . . . 2 Lemma 5.9.2 Es sei f : [a, b] → R eine stetige, wachsende oder fallende Funktion. Dann ist der Graph von f rektifizierbar und es gilt p |b − a|2 + |f (b) − f (a)|2 ≤ L(Graph(f )) ≤ |b − a| + |f (b) − f (a)|. Beweis. Wir nehmen an, dass f monoton wachsend ist. Wir zeigen die linke Ungleichung. Wir wählen als Partition P = {a, b}. Dann erhalten wir p |b − a|2 + |f (b) − f (a)|2 = LP (Graph(f )) ≤ L(Graph(f )) Nun die rechte Abschätzung. Es sei P = {x0 , . . . , xn }. Es gilt LP (Graph(f )) = n X p |xi−1 − xi |2 + |f (xi−1 ) − f (xi )|2 i=1 n X ≤ (|xi−1 − xi | + |f (xi−1 ) − f (xi )|) i=1 Da f monoton wachsend ist LP (Graph(f )) ≤ n X i=1 (xi − xi−1 ) + n X i=1 (f (xi ) − f (xi−1 )) = b − a + f (b) − f (a). 2 Beispiel 5.9.2 Es sei f : [0, 1] → R durch 2 x cos xπ2 f (x) = 0 falls x ∈ [−1, 1] und x 6= 0 falls x = 0 f ist differenzierbar auf [0, 1] und auf (0, 1) stetig differenzierbar. Der Graph von f ist nicht rektifizierbar. 5.10. DIE TRIGONOMETRISCHEN FUNKTIONEN 281 Beweis. 1 Z p 1 + |f 0 (x)|2 dx Wir substituieren t = Z 1 p 1+ π x2 ≥ 1 Z Z 0 1 2x cos π + 2π sin π dx x2 x x2 |f (x)|dx = Z 1 π 2π ≥ x sin x2 dx − 2. . Wir erhalten für alle n mit 2πn + π ≤ |f 0 (x)|2 dx π 2 π 2 Z 2πn+π √ √ t |sin t| dt ≥ 2 π t |sin t| dt π 2πn Z π √ √ √ √ sin tdt = 4 π 2πn. ≥ 2 π 2πn √ ≥ 2 π Z √ 0 2 Beispiel 5.9.3 Es sei φ : [0, 1] → [0, 1] die Cantorfunktion. Dann gilt L(Graph(f )) = 2 Beweis. Aus Lemma 5.9.2 folgt sofort, dass L(Graph(f )) ≤ 2 2 5.10 Die trigonometrischen Funktionen √ 1 − t2 t Der Cosinus des Winkels, der durch den Kreisbogen über dem Intervall [t, 1] gegeben ist, ist t. Wir werden zeigen, dass die Länge dieses Kreisbogens gleich Z 1 1 √ dx 1 − x2 t 282 CHAPTER 5. INTEGRALRECHNUNG ist. Damit erhalten wir 1 1 √ dx = t cos 1 − x2 t bzw. wenn arccos die zu cos inverse Funktion bezeichnet Z 1 1 √ arccos t = dx. 1 − x2 t Z Diese Formel ermöglicht es uns, Ableitungen und weitere Formeln trigonometrischer Funktionen zu berechnen. Lemma 5.10.1 (i) Das uneigentliche Riemann Integral Z 1 1 √ dx 1 − x2 0 existiert. √ (ii) Es sei x ∈ [0, 1] und f : [0, x] → R mit f (t) = 1 − t2 . Dann gilt Z x 1 √ dt. L(Graph(f )) = 1 − t2 0 Beweis. (i) Es gilt für alle x ∈ [0, 1) √ Hieraus folgt Z 1− 0 √ 1 1 1 √ ≤√ =√ . 2 1−x 1−x 1+x 1−x 1 dx ≤ 1 − x2 Z 1− 0 und damit Z √ √ 1 √ dx = [−2 1 − t]01− = 2 − 2 1−x 1 1 dx ≤ 2. 1 − x2 0 (ii) Wir betrachten zuerst den Fall x < 1. Mit Satz 5.9.1 Z xp Z xr Z x 2 t 1 √ L(Graph(f )) = 1 + |f 0 (t)|2 dt = 1+ dt = dt. 1 − t2 1 − t2 0 0 0 √ Nun der Fall x = 1. Mit Lemma 5.9.2 folgt, dass der Graph von f rektifizierbar ist. Wir setzen fn1 : [0, 1 − n1 ] → R mit fn1 (x) = f (x) und fn2 : [1 − n1 , 1] → R mit fn2 (x) = f (x). Dann gilt für alle n ∈ N L(Graph(f )) = L(Graph(fn1 )) + L(Graph(fn2 )). Nach Satz 5.9.1 gilt L(Graph(fn1 )) Z = 0 1 1− n 1 √ dt. 1 − t2 5.10. DIE TRIGONOMETRISCHEN FUNKTIONEN 283 Deshalb gilt für alle n ∈ N L(Graph(f )) ≥ 1 1− n Z 0 und somit L(Graph(f )) ≥ √ 1 Z √ 0 Wegen Lemma ?? gilt 1 L(Graph(fn2 )) ≤ + n s 1 dt 1 − t2 1 dt. 1 − t2 1 1− 1− n 2 1 ≤ + n r 2 . n Hiermit folgt für alle n ∈ N L(Graph(f )) ≤ 1 Z 0 √ 1 dt. 1 − t2 Also gilt L(Graph(f )) ≤ 2 Z 0 1 1− n 1 1 √ dt + + n 1 − t2 r 2 ≤ n Z 0 1 1 1 √ dt + + n 1 − t2 r 2 . n Definition 5.10.1 Die Zahl π ist der halbe Umfang eines Kreises mit Radius 1. Da der Graph der Funktion f : [0, 1] → R mit f (t) = beschreibt, gilt Z 1 1 π √ = dx. 2 1 − x2 0 √ 1 − t2 einen Viertelkreis Weiter definieren wir ` : [−1, 1] → R Z 1 1 √ dt `(x) = 1 − t2 x √ Anschaulich ist `(x) die Länge des Kreisbogens zwischen den Punkten (x, 1 − x2 ) und (1, 0). Lemma 5.10.2 (i) `(1) = 0 und `(−1) = π. (ii) ` ist eine stetige, strikt fallende, beschränkte Funktion. (iii) ` ist auf (−1, 1) differenzierbar und es gilt `0 (x) = − √ Beweis. 2 1 . 1 − x2 284 CHAPTER 5. INTEGRALRECHNUNG Definition 5.10.2 Wir definieren nun arccos s = `(s) cos t = `−1 (t) √ sin t = 1 − cos2 t s ∈ [−1, 1] t ∈ [0, π] t ∈ [0, π] Lemma 5.10.3 (i) arccos ist auf [−1, 1] stetig und auf (−1, 1) differenzierbar. Es gilt 1 arccos0 s = − √ 1 − s2 (ii) sin und cos sind auf [0, π] stetig. (iii) sin und cos sind auf (0, π) differenzierbar und es gilt sin0 = cos cos0 = − sin Beweis. (i) Nach Lemma ?? ist ` auf [−1, 1] stetig und auf (−1, 1) differenzierbar. (ii) ` ist auf [−1, 1] stetig und strikt monoton fallend. Deshalb existiert die Umkehrfunktion `−1 und sie ist stetig. (iii) Da ` differenzierbar auf (−1, 1) ist, so ist `−1 auf (0, π) differenzierbar. Außerdem gilt d −1 1 1 d cos t = ` (t) = d` −1 = dt dt − √ 1−1 2 (` (t)) ds 1−|` (t)| p p −1 2 = − 1 − |` (t)| = − 1 − cos2 (t) = − sin t. Mit der Kettenregel folgt d dp cos t sin t sin t = 1 − cos2 (t) = √ = cos t dt dt 1 − cos2 2 Nun definieren wir die Funktionen für alle reellen Zahlen. cos t = cos(−t) sin t = − sin(−t) t ∈ [−π, 0) und cos(2π + t) = cos t sin(2π + t) = sin t t∈R Auch die fortgesetzten Funktionen sin und cos sind auf ganz R differenzierbar und es gilt sin0 = cos und cos0 = − sin. 5.10. DIE TRIGONOMETRISCHEN FUNKTIONEN 285 Wir setzen arcsin t = sin−1 t arctan t = tan−1 t π π < arcsin t < 2 2 π π t ∈ (−∞, ∞) und − < arctan t < 2 2 t ∈ (−∞, ∞) und − Es gelten 1 arcsin0 (t) = √ 1 − t2 und arctan0 (t) = 1 . 1 + t2 Beispiel 5.10.1 (Weierstraß) [31, 49, 114] Es seien 0 < a < 1 und 1 ≤ a · b. Dann ist die Funktion f : R → R mit ∞ X f (x) = an cos(bn πx) n=0 überall stetig und nirgendwo differenzierbar Weierstraß zeigte die Aussage in seiner Arbeit [114] für alle a mit 0 < a < 1 und alle ungeraden, natürlichen Zahlen b mit 1 + 23 π < a · b. Hardy verbesserte dies Ergebnis [49] zu der obigen Formulierung. Lemma 5.10.4 Für alle s ∈ R und alle t > 0 gilt 1 | cos(π(s + t) − cos(πs))| ≤ π. t Beweis. Wir betrachten die Funktion g : [s, s + t] → R mit g(x) = cos(πx). Nach dem Mittelwertsatz gibt es ein x0 ∈ (s, s + t), so dass g 0 (x0 ) = Also −π sin(πx0 ) = 1 (cos(π(s + t) − cos(πs))) t Es folgt π ≥ |π sin(πx0 )| = 2 g(s + t) − g(s) . t 1 | cos(π(s + t) − cos(πs))|. t Beweis von Beispiel 5.10.1. Die Stetigkeit von f folgt mit dem Satz 3.12.1. In der Tat, die Reihe konvergiert gleichmäßig. Für alle m ∈ N existiert ein `m ∈ N, so dass `m − 1 1 < bm r ≤ `m + 2 2 Wir setzen `m + m = bm r Es folgt 0< Für hm = (5.9) 1−m bm 1 −m 1 − m 3 b ≤ < b−m m 2 b 2 erhalten wir 0< 3 1 −m b ≤ hm < b−m 2 2 286 CHAPTER 5. INTEGRALRECHNUNG und es gilt lim hm = 0. m→∞ Es gilt 1 f (r + hm ) − f (r) = hm hm = m−1 X n=0 ∞ X n=0 n n a cos(b π(r + hm )) − ∞ X ! n n b cos(b πr) n=0 ∞ X an an (cos(bn π(r + hm )) − cos(bn πr)) + (cos(bn π(r + hm )) − cos(bn πr)) hm h n=m m Wir schätzen den ersten Summanden ab. Wegen Lemma 5.10.4 gilt | cos(bn π(r + hm )) − cos(bn πr)| ≤ πhm bn Hiermit folgt (5.10) m−1 m−1 X an X am bm − 1 n n (cos(b π(r + hm )) − cos(b πr)) ≤ π an bn = π hm ab − 1 n=0 k=0 Nun schätzen wir den zweiten Summanden nach unten ab. Dazu zeigen wir, dass für alle n mit n≥m (5.11) cos(bn π(r + hm )) = (−1)`m +1 Es gilt bn π(r + hm ) = bn−m π(bm r + bm hm ) = bn−m π(`m + m + 1 − m ) = bn−m π(`m + 1) Da bn−m ∈ N und ungerade und `m + 1 ∈ N, so ist bn−m (`m + 1) gerade, wenn `m ungerade ist, und umgekehrt. Es folgt (5.11). Es gilt für alle n mit n ≥ m cos(bn πr) = (−1)`m cos(bn−m πm ). Wir zeigen dies. Wegen bn πr = bn−m πbm r = bn−m π(`m + m ) cos(bn πr) = cos(bn−m π(`m + m )) = cos(bn−m π`m ) cos(bn−m πm ) − sin(bn−m π`m ) sin(bn−m πm ) Da bn−m `m ∈ N, gilt sin(bn−m π`m ) = 0. bn−m ist eine ungerade, natürliche Zahl. Deshalb ist bn−m `m eine gerade Zahl, wenn `m gerade ist, und eine ungerade Zahl, wenn `m ungerade ist. Es folgt cos(bn πr) = (−1)`m cos(bn−m πm ). Es gilt ∞ X an n n (cos(b π(r + hm )) − cos(b πr)) h m n=m ∞ X an `m +1 `m n−m = (−1) − (−1) cos(b πm ) h n=m m ∞ X an = (−1)`m +1 1 + cos(bn−m πm ) n=m hm ∞ (−1)`m +1 X an n−m 1 + cos(b πm ) = hm h n=m m 5.11. DAS PRODUKT VON WALLIS 287 Da 1 + cos(bn−m πm ) ≥ 0, an > 0 und hm > 0 ∞ ∞ X am an 1 X n n n = (cos(b π(r + h )) − cos(b πr)) (1 + cos(πm )) a 1 + cos(bn−m πm ) ≥ m n=m hm hm n=m hm Da − 12 ≤ m ≤ 12 , so gilt − π2 ≤ πm ≤ π2 . Mit (5.9) ∞ X am an 2 (cos(bn π(r + hm )) − cos(bn πr)) ≥ = am bm n=m hm hm 3 Hiermit folgt 2 m m a b 3 ∞ X an n n ≤ (cos(b π(r + hm )) − cos(b πr)) n=m hm ! m−1 f (r + h ) − f (r) X 1 m = an cos(bn π(r + hm )) − hm hm n=0 ! X f (r + hm ) − f (r) 1 m−1 n n + ≤ a cos(b π(r + h )) . m hm hm n=0 Mit (5.10) 2 m m am bm − 1 f (r + hm ) − f (r) a b −π ≤ . 3 ab − 1 hm 2 5.11 Das Produkt von Wallis John Wallis (1616-1703) studierte in Cambridge Theologie und war als Kaplan tätig. Nachdem es ihm im Bürgerkrieg gelungen war, verschlüsselte Botschaften zu entschlüsseln, wurde er von Cromwell auf den Savilian Chair of Geometry in Oxford berufen. Wallis konnte umfangreiche Rechnungen im Kopf ausführen, wie z.B. die Berechnung der Wurzel einer 50-stelligen Zahl. Satz 5.11.1 n ∞ Y Y 4k 2 4k 2 π = lim = 2 n→∞ k=1 4k 2 − 1 k=1 4k 2 − 1 Eine weitere Schreibweise für die Formel von Wallis ist π 2 2 4 4 6 6 = · · · · · ··· 2 1 3 3 5 5 7 (5.12) Beweis. Wir setzen für m = 0, 1, 2, . . . Z Am = π 2 sinm xdx 0 Es gilt Z A0 = 0 π 2 π dx = 2 Z A1 = π 2 sin xdx = 1 0 288 CHAPTER 5. INTEGRALRECHNUNG Wir erhalten für m ≥ 2 die folgende Rekursionsformel Am = m−1 Am−2 m Wir weisen dies nach. Dazu benutzen wir partielle Integration. Z Z m m−1 sin xdx = − cos x sin x + (m − 1) cos2 x sinm−2 xdx Wir nutzen aus, dass cos2 x = 1 − sin2 x. Z Z m m−1 sin xdx = − cos x sin x + (m − 1) sinm−2 x − sinm xdx Hieraus erhalten wir Z Z m m−1 m sin xdx = − cos x sin x + (m − 1) sinm−2 xdx Wir setzen nun Integrationsgrenzen ein. Z π Z π 2 m m−1 2 m sin xdx = [− cos x sin x]0 + (m − 1) 0 π 2 sinm−2 xdx 0 Es ergibt sich Z π 2 m 0 m sin xdx = (m − 1) Z π 2 sinm−2 xdx 0 Wir erhalten weiter n (2n − 1)(2n − 3) · · · 3 · 1 π π Y 2k − 1 = = 2n(2n − 2) · · · 4 · 2 2 2 k=1 2k A2n n Y 2k 2n(2n − 2) · · · 4 · 2 = = (2n + 1)(2n − 1) · · · 5 · 3 k=1 2k + 1 A2n+1 Hieraus erhalten wir n n A2n+1 2Y (2k)2 2 Y 4k 2 = = A2n π k=1 (2k + 1)(2k − 1) π k=1 4k 2 − 1 Wir zeigen nun, dass A2n+1 =1 n→∞ A2n Für alle x ∈ [0, π2 ] gilt 0 ≤ sin x ≤ 1. Deshalb gilt für alle x ∈ [0, π2 ] lim sin2n+2 x ≤ sin2n+1 x ≤ sin2n x Hieraus folgt Z π 2 2n+2 sin 0 xdx ≤ Z π 2 sin 0 2n+1 xdx ≤ Z 0 π 2 sin2n xdx. 5.11. DAS PRODUKT VON WALLIS 289 Also gilt A2n+2 ≤ A2n+1 ≤ A2n . Mit A2n+2 = 2n+1 A 2n+2 2n erhalten wir A2n+2 A2n+1 2n + 1 = ≤ ≤ 1. 2n + 2 A2n A2n Somit bekommen wir 2n + 1 A2n+2 A2n+1 = lim = lim . n→∞ 2n + 2 n→∞ A2n n→∞ A2n 1 = lim Wir erhalten n 2 Y 4k 2 . 2−1 n→∞ π 4k k=1 1 = lim 2 Beispiel 5.11.1 (Formel von Vieta) v s r s r u r u 2 1 1 1 1t1 1 1 1 1 = + + + ······ π 2 2 2 2 2 2 2 2 2 Beweis. Es sei Pm ein regelmäßiges Polygon mit m Ecken auf dem Kreis mit Radius 1. Mit Am bezeichnen wir die Fäche des Polygons Pm . Das Polygon ist Vereinigung von m gleichschenkligen Dreiecken, deren Ecken jeweils der Mittelpunkt des Kreises und zwei nebeneinanderliegende Ecken des Polygons sind. Die Höhe eines solchen Dreiecks vom Mittelpunkt zu der Seite, die die beiden Ecken enthält, die auf dem Kreis liegen, bezeichnen wir mit hm . Dann gilt für alle m = 3, 4, . . . Am = hm . A2m Es gilt k−1 Y 2 = h2j A2k j=2 und lim Am = π. m→∞ Außerdem gilt hm = cos Wir zeigen nun, dass h4 = q 1 2 h2k = Wir benutzen die Formel cos x2 = 2 m . und für alle k = 3, 4, . . . r h2k π q 1 1 + h k−1 2 2 2 1+cos x 2 π = cos k = 2 r π 1 1 + cos k−1 = 2 2 2 r 1 1 + h k−1 2 2 2 290 CHAPTER 5. INTEGRALRECHNUNG 5.12 Partialbruchzerlegung 5.13 Integralkriterium für Reihen Satz 5.13.1 Es sei f : [1, ∞) → R eine stetige, positive, monoton fallende Funktion. Dann gelten Z n+1 Z n n n X X f (x)dx ≤ f (k) und f (k) ≤ f (x)dx. 1 k=1 1 k=2 P∞ Insbesondere n=1 an genau dann, wenn das uneigentliche RiemannR ∞ konvergiert Integral 1 f (x)dx existiert und Z ∞ ∞ ∞ X X f (n). f (x)dx ≤ f (n) ≤ 1 n=2 n=1 Beweis. Wir definieren g : [1, n + 1) → R durch für x ∈ [k, k + 1) und k = 1, . . . , n g(x) = f (k) Dann gilt 0 ≤ f ≤ g und f und g sind auf [1, n + 1) Riemann-integrierbar. Es folgt Z n+1 Z n+1 n n Z k+1 X X f (k) g(x)dx = f (x)dx ≤ g(x)dx = 1 1 k=1 k k=1 Für die Abschätzung von unten setzen wir h : [0, n) → R für x ∈ [k, k + 1) und k = 1, . . . , n h(x) = f (k + 1). Dann gilt auf [1, n + 1), dass 0 ≤ h ≤ f und f und h sind Riemann integrierbar. Also Z n+1 Z n+1 n Z k+1 n n+1 X X X h(x)dx = f (k + 1) = f (k). f (x)dx ≥ h(x)dx = 1 Falls 1 R∞ 1 k=1 k=1 f (x)dx < ∞, dann Z 1 ∞ f (x)dx ≥ und somit Z 1 2 k Z 1 n+1 f (x)dx ≥ ∞ f (x)dx ≥ ∞ X k=2 n+1 X k=2 f (k). f (k) k=2 5.13. INTEGRALKRITERIUM FÜR REIHEN Beispiel 5.13.1 (i) Falls 1 < p < ∞, dann konvergiert die Reihe ∞ X n−p n=1 und es gilt ∞ X p 1 ≤ . n−p ≤ p − 1 n=1 p−1 (ii) Es gilt für alle n ∈ N ln(n + 1) ≤ Die Reihe n X 1 ≤ 1 + ln n k k=1 ∞ X 1 n n=1 divergiert. (iii) Für alle n ∈ N mit n ≥ 2 gilt ln ln(n + 1) − ln ln 2 ≤ Die Reihe n X 1 1 ≤ ln ln n − ln ln 2 + . k ln k 2 ln 2 n=2 ∞ X 1 n ln n n=2 divergiert. (iv) Die Reihe ∞ X 1 n(ln n)2 n=2 konvergiert und 1.442 · · · = ∞ X 1 1 1 1 ≤ ≤ + = 2.48 . . . 2 2 ln 2 n=2 n(ln n) 2(ln 2) ln 2 (v) Die Reihe ∞ X 1 n ln(n) ln(ln(n)) n=3 divergiert. (vi) Die Reihe ∞ X 1 n ln(n)(ln(ln(n)))2 n=3 konvergiert. Beweis. (i) Es sei f : [1, ∞) → R durch f (x) = x−p gegeben. Z ∞ Z ∞ 1 f (x)dx = x−p dx = p−1 1 1 Es folgt ∞ X n=2 n−p ≤ ∞ X 1 ≤ n−p p − 1 n=1 291 292 CHAPTER 5. INTEGRALRECHNUNG und somit ∞ X 1 p 1 ≤ n−p ≤ 1 + = . p − 1 n=1 p−1 p−1 (ii) Es gilt für alle n ∈ N n+1 Z ln(n + 1) = 1 n X1 1 dx ≤ ≤1+ x k k=1 Z n 1 1 dx = 1 + ln n. x Wir nehmen an, dass die Reihe konvergiert. Dann existiert das uneigentliche Riemann Integral. Z ∞ Z n 1 1 dx = lim dx = lim [ln x]n1 = lim ln n = ∞ n→∞ n→∞ n→∞ x x 1 1 P∞ Also existiert das uneigentliche Integral nicht und die Reihe n=1 n1 divergiert. 1 (iii) Es sei f : [1, ∞) durch f (x) = x ln x gegeben. Eine Stammfunktion von f ist F : [1, ∞) → R mit F (x) = ln ln x. Es folgt Z n n X 1 1 ≤ dx = [ln(ln x)]n2 = ln(ln n) − ln(ln 2) k ln k x ln x 2 k=3 und damit n X k=2 1 1 ≤ ln(ln n) − ln(ln 2) + . k ln k 2 ln 2 Ebenso ln ln(n + 1) − ln ln 2 ≤ Z n+1 2 n X 1 1 dx ≤ x ln x k ln k k=2 (iv) Es sei f : [1, ∞) durch f (x) = x(ln1x)2 gegeben. Eine Stammfunktion von f ist F : [1, ∞) → R mit F (x) = − ln1x . Es folgt n Z n 1 1 1 1 dx = − = − . 2 x(ln x) ln x ln 2 ln n 2 2 Wir erhalten ∞ X 1 1 1 1 ≤ ≤ + . 2 ln 2 n=2 n(ln n) ln 2 2(ln 2)2 (v) Die Stammfunktion von f (x) = 1 x(ln x)(ln ln x) ist F (x) = ln ln ln x. Falls die Reihe konvergiert, dann existiert das uneigentliche Integral Z ∞ Z ∞ 1 1 dx = lim dx = lim (ln ln ln n − ln ln ln 3). n→n 3 n→∞ x(ln x)(ln ln x) x(ln x)(ln ln x) 3 Der letzte Ausdruck divergiert. Die Reihe konvergiert also nicht. (vi) Die Stammfunktion von 1 f (x) = x(ln x)(ln ln x)2 ist F (x) = − Es folgen ∞ X 1 ≤ n(ln n)(ln ln n)2 n=4 Z 3 1 . ln ln x ∞ f (x)dx ≤ ∞ X 1 n(ln n)(ln ln n)2 n=3 5.13. INTEGRALKRITERIUM FÜR REIHEN und 293 ∞ X 1 1 1 1 ≤ . ≤ + ln ln 3 n=3 n(ln n)(ln ln n)2 ln ln 3 3(ln 3)(ln ln 3)2 2 Beispiel 5.13.2 Entscheiden Sie, welche der folgenden Reihen konvergieren und welche divergieren. Benutzen Sie dazu das Integralkriterium für Reihen. Es sei j ∈ N und {aj }j∈N mit a1 = e und aj+1 = eaj . (i) X 1 n(ln n)(ln ln n)(ln ln ln n) · · · (ln · · ln} n) | ·{z n≥aj j (ii) ∞ X n≥aj 1 n(ln n)(ln ln n)(ln ln ln n) · · · (ln · · ln} n)2 | ·{z j (iii) Zeigen Sie mit (iv), dass die Reihe ∞ X n≥aj 1 n(ln n)(ln ln n)(ln ln ln n) · · · (ln · · ln} n)p | ·{z j für alle p > 1 konvergiert. Beweis. (i) Eine Stammfunktion von f (x) = 1 x(ln x)(ln ln x)(ln ln ln x) · · · (ln · · ln} x) | ·{z j ist F (x) = ln · · ln} x | ·{z j+1 (ii) Eine Stammfunktion von f (x) = 1 x(ln x)(ln ln x)(ln ln ln x) · · · (ln · · ln} x)2 | ·{z j ist F (x) = − 1 ln · · ln} x | ·{z j (iii) Wegen (ii) wissen wir, dass ∞ X n≥aj 1 n(ln n)(ln ln n)(ln ln ln n) · · · (ln · · ln} n)2 | ·{z j+1 konvergiert. Wir zeigen nun, dass es zu jedem r > 0 ein nr ∈ N gibt, so dass für alle n ∈ N mit n ≥ nr (ln · · ln} n)2 ≤ (ln · · ln} n)r | ·{z | ·{z j+1 j 294 CHAPTER 5. INTEGRALRECHNUNG gilt. Dazu reicht es zu zeigen, dass es zu jedem r > 0 ein x0 gibt, so dass für alle x ≥ x0 (ln x)2 ≤ xr gilt. Dies ist aber äquivalent dazu, dass es zu jedem s > 0 ein x0 gibt, so dass für alle x ≥ x0 ln x ≤ xs gilt. Dies gilt, da wir r = 2s setzen können. Die letztere Ungleichung folgt aber z.B. aus der Formel von L’Hopital. 1 1 ln x x = lim = 0. lim s = lim s−1 x→∞ sx x→∞ sxs x→∞ x 2 5.14 Unendliche Produkte Es sei an , n ∈ N, eine Folge reeller Zahlen. Als das unendliche Produkt bezeichnen wir den Grenzwert ∞ n Y Y (1 + an ) = lim (1 + ak ). n→∞ n=1 k=1 Wir sagen, dass das unendliche Produkt konvergiert, falls der Grenzwert existiert und von 0 verschieden ist. Satz 5.14.1 Es sei an , n ∈ N, eine Folge positiver, reeller Zahlen. Das Produkt P∞ Q ∞ n=1 an konvergiert und es gilt n=1 (1 + an ) konvergiert genau dann, wenn ! ∞ ∞ ∞ X Y X an . (1 + an ) ≤ exp an ≤ 1+ n=1 n=1 n=1 Beweis. Nach Satz gilt für alle t > 0, dass 1 + t ≤ et . Deshalb gilt ! n n n Y Y X (1 + ak ) ≤ eak = exp ak . k=1 k=1 k=1 Da die Zahlen ak positiv sind und die Exponentialfunktion stetig ist, erhalten wir ! ! n n n Y X X (1 + ak ) ≤ lim exp ak = exp lim ak . k=1 n→∞ n→∞ k=1 k=1 Q Deshalb ist die Folge nk=1 (1 + ak ), n ∈ N, monoton wachsend und beschränkt. Also konvergiert diese Folge und es gilt ! ∞ ∞ Y X (1 + an ) ≤ exp an n=1 n=1 5.15. DIE FORMEL VON STIRLING 295 Für alle s, t > 0 gilt (1 + s)(1 + t) ≥ 1 + s + t. Hieraus erhalten wir n Y (1 + ak ) ≥ 1 + n X k=1 k=1 ∞ Y n X ak Es folgt (1 + ak ) ≥ 1 + k=1 ak k=1 2 Beispiel 5.14.1 (i) ∞ Y 1+ n=1 konvergiert, weil (ii) P∞ 1 n=1 n2 1 n2 konvergiert. ∞ Y 1 1+ n n=1 divergiert, weil 5.15 P∞ 1 n=1 n divergiert. Die Formel von Stirling Satz 5.15.1 Für alle n ∈ N mit n ≥ 2 gilt √ √ 1 2πn nn e−n < n! < 2πn nn e−n e 12(n−1) . Insbesondere gilt lim n→∞ √ 2πn nn e−n = 1. n! Lemma 5.15.1 (Trapez-Regel) Es sei f : [0, 1] → R eine zweimal stetig differenzierbare Funktion. Dann existiert ein ξ ∈ [0, 1] mit Z 0 1 1 1 f (x)dx = (f (0) + f (1)) − f 00 (ξ). 2 12 Diese Formel heißt Trapez-Regel, weil die schraffierte Fläche den Flächeninhalt + f (1)) besitzt. 1 (f (0) 2 296 CHAPTER 5. INTEGRALRECHNUNG Beweis. Wir benutzen partielle Integration. Z 1 Z 1 1 1 (x − 12 )f 0 (x)dx f (x)dx = [(x − 2 )f (x)]0 − 0 Z0 1 (x − 21 )f 0 (x)dx = 21 (f (0) + f (1)) − 0 Z 1 0 1 00 1 2 1 1 2 1 1 ( 2 x − 2 x)f (x)dx = 2 (f (0) + f (1)) − [( 2 x − 2 x)f (x)]0 − 0 Z 1 1 = 2 (f (0) + f (1)) + ( 12 x2 − 12 x)f 00 (x)dx 0 Mit dem Mittelwertsatz der Integralrechnung folgt für ein ξ ∈ (0, 1) Z 1 R1 f (x)dx = 21 (f (0) + f (1)) + f 00 (ξ) 0 21 x2 − 12 xdx 0 = 12 (f (0) + f (1)) + f 00 (ξ)[ 16 x3 − 41 x2 ]10 1 00 = 12 (f (0) + f (1)) − 12 f (ξ). 2 Beweis. Wir zeigen zunächst, dass es zu jedem k ∈ N, eine Zahl ξk ∈ [k, k + 1] gibt, so dass für alle n ∈ N ! n−1 n X X 1 1 ln k = (n + 21 ) ln n − n + 1 − 12 ξ2 k=1 k k=1 gilt. Mit der Trapez-Regel folgt: Es gibt ein ξk ∈ [k, k + 1], so dass k+1 Z k ln xdx = 12 (ln k + ln(k + 1)) + 1 . 12ξk2 Hieraus folgt n−1 Z X k=1 k+1 ln xdx = k 1 2 n−1 X (ln k + ln(k + 1)) + k=1 1 12 n−1 X 1 . ξ2 k=1 k Da ln 1 = 0 gilt, erhalten wir Z n ln xdx = 1 − 12 ln n + n X ln k + 1 12 k=1 n−1 X 1 . ξ2 k=1 k Die Stammfunktion von ln x ist x ln x − x. n ln n − n + 1 = − 21 ln n + n X k=1 ln k + 1 12 n−1 X 1 . ξ2 k=1 k 5.15. DIE FORMEL VON STIRLING 297 Somit erhalten wir n X ln k = (n + 1 ) ln n 2 −n+1− k=1 1 12 n−1 X 1 . 2 ξ k k=1 Wir wenden auf beiden Seiten die Exponentialfunktion an. ! ! n n−1 X X 1 1 exp ln k = exp (n + 21 ) ln n − n + 1 − 12 ξ2 k=1 k=1 k Es folgt weiter exp (ln(n!)) = exp (n + 1 ) ln n 2 exp (−n) exp 1 − 1 12 n−1 X 1 ξ2 k=1 k ! . Also gilt n! = 1 nn+ 2 e−n n−1 X 1 1 exp 1 − 12 ξ2 k=1 k ! . Wir zeigen jetzt, dass √ 2π < exp 1 − n−1 X 1 1 12 ξ2 k=1 k ! √ < 2π exp 1 12(n − 1) . Hiermit folgt dann das Ergebnis. Da ξk ∈ [k, k + 1] gilt, haben wir ξ12 ≤ k12 . Außerk P P∞ 1 1 konvergent. Damit existiert dem ist ∞ konvergent. Also ist auch 2 k=1 k2 k=1 ξ k lim exp 1 − n→∞ Wir zeigen, dass dieser Limes gleich 1 12 n−1 X 1 ξ2 k=1 k ! = c. √ 2π ist. Wir setzen ! n−1 X 1 1 cn = exp 1 − 12 . ξ2 k=1 k Man erkennt hieraus sofort, dass cn , n ∈ N, eine monoton fallende Folge ist. Weiter gilt n! cn = n −n √ . n e n Außerdem gelten c2 limn→∞ c2n c2 lim n = = =c n→∞ c2n limn→∞ c2n c und 2 √ √ n! √ 2 nn e−n n cn (n!)2 22n n2n e−2n 2n (n!)2 22n 2 √ . = = = (2n)! 2n e−2n n(2n)! c2n n (2n)! n √ 2n −2n (2n) e 2n 298 CHAPTER 5. INTEGRALRECHNUNG Das Produkt von Wallis liefert n Y 4k 2 π = lim 2 n→∞ k=1 4k 2 − 1 und r ! 21 (2k)(2k) = lim lim n→∞ n→∞ (2k − 1)(2k + 1) k=1 12 (2 · 2)(4 · 4)(6 · 6)(8 · 8) · · · (2n)(2n) = lim n→∞ (1 · 3)(3 · 5)(5 · 7)(7 · 9) · · · (2n − 1)(2n + 1) 2n n! √ = lim n→∞ 1 · 3 · 5 · 7 · · · (2n − 1) 2n + 1 (2n n!)2 (2n n!)2 √ √ . = lim = lim n→∞ (2n)! 2n + 1 n→∞ (2n)! 2n π = 2 n Y 4k 2 4k 2 − 1 k=1 ! 12 n Y √ √ Es folgt c = 2π. Da cn , n ∈ N, eine monoton fallende Folge ist, die gegen 2π konvergiert, gilt für alle n ∈ N mit n ≥ 2 ! n−1 X √ 1 1 . 2π < cn = exp 1 − 12 ξ2 k=1 k Andererseits gilt ∞ X 1 1 c = exp 1 − 12 ξ2 k=1 k ! n−1 X 1 1 = exp 1 − 12 ξ2 k=1 k ! ∞ X 1 1 exp − 12 ξ2 k=n k Mit dem Integralkriterium für Reihen folgt 1 12 ∞ X 1 ≤ 2 ξ k k=n 1 12 ∞ X 1 ≤ 2 k k=n 1 12 Z ∞ n−1 1 1 dx = . 2 x 12(n − 1) Deshalb gilt c ≥ cn exp − Es folgt cn ≤ √ 1 12(n − 1) 2π exp 1 12(n − 1) . . Beispiel 5.15.1 (i) Für n ∈ N mit n ≥ 2 gilt 2n 2n 2 2n 1 2 1 √ √ . ≤ ≤ exp exp − 6(n − 1) n 12(2n − 1) πn πn ! . 5.15. DIE FORMEL VON STIRLING Insbesondere gilt lim 299 √ 2n n n→∞ n 22n 1 =√ . π (ii) √ en 2πn e 1 12(n−1) ≤ nn en ≤√ n! 2πn In der Wahrscheinlichkeitstheorie und Kombinatorik muss man die Größenordnung von Binomialkoeffizienten kennen. Insbesondere ist der größte Binomialkoeffizient von Interesse. Das 2n 2 √ ist. Wegen Beispiel stellt sicher, dass 2n n von der Größenordnung n n n 2 = (1 + 1) = n X n k=0 ist der größte Summand kleiner als 2n und größer als 2n Binomialkoeffizient von der Größenordnung √ ist. n k 2n n+1 . Das Beispiel zeigt, dass der größte Beweis. Die Formel von Stirling liefert √ 2πn nn e−n < n! < √ 1 2πn nn e−n e 12(n−1) . Damit folgt √ 1 1 √ 1 4πn (2n)2n e−2n e 12(2n−1) 2 πn22n n2n e−2n e 12(2n−1) 22n 2n (2n)! √ ≤ = = √ e 12(2n−1) . = 2 2n −2n (n!) 2π n n e n πn ( 2πn nn e−n )2 Damit haben wir die rechte Ungleichung bewiesen. Die linke Ungleichung wird genauso bewiesen. 2 Das nächste Beispiel untersucht, wie häufig beim Werfen einer Münze ”Kopf” oder ”Zahl” erscheint. Wir erwarten, dass ungefähr genauso häufig ”Kopf” wie ”Zahl” das Ergebnis ist. Wir berechnen hier die zu erwartende Abweichung. Wenn wir eine Münze n-mal werfen, dann erhalten wir 2n mögliche Ergebnisse. Es gibt genau nk Ergebnisse, wo ”Kopf” k-mal fällt und ”Zahl” n − k-mal. Die Abweichung vom Mittelwert ist |n − 2k|. Die mittlere Abweichung ist also n 1 X n |n − 2k| . 2n k=0 k Beispiel 5.15.2 Es gibt positive Konstante c1 und c2 , so dass für alle n ∈ N c1 √ n √ 1 X n n≤ n |n − 2k| ≤ c2 n 2 k k=0 gilt. Der folgende Beweis benutzt nur die Stirling Formel. Es gibt sehr viel elegantere Beweise. 300 CHAPTER 5. INTEGRALRECHNUNG Beweis. Mit Stirlings Formel folgt n n! = k!(n − k)! k √ n 1 1 1 nn √ √ ≥ exp − + . √ k 12 k − 1 n − k − 1 2πk k(n − k)n−k n − k Für k = n 2 Für k = − j erhalten wir n n 2 −j n 2 1 ≥ exp − 12 − j und 0 ≤ j ≤ n 2 1√ 3 n 2 1 + −j−1 n 2 1 +j−1 √ √ 22n πn 1 − 4j 2 n2 n+1 2 1− 1+ 2j n 2j n !j . erhalten wir n 2n √ . ≥ n 4πn 2 −j Beispiel 5.15.3 Die Folge s r q √ xn = 1! 2! 3! · · · n! n∈N konvergiert. Beweis. Wir zeigen, dass die Folge {xn }n∈N monoton wachsend und nach oben beschränkt ist. xn = n Y 1 (k!) 2k < k=1 n+1 Y 1 (k!) 2k = xn+1 k=1 Damit ist die Folge monoton wachsend. xn = n Y (k!) k=1 Es bleibt zu zeigen, dass 1 2k ≤ n Y (k) k=1 k 2k = n Y k=1 ! n X k k ln k exp (ln k) k = exp 2 2k k=1 ∞ X k ln k k=1 2k konvergiert. Dazu verwenden wir das Quotientenkriterium. (k+1) ln(k+1) ln(1 + k1 ) 1 (k + 1) ln(k + 1) 1 1 2k+1 = = 1+ 1+ k ln k 2 k ln k 2 k ln k 2k 2 Beispiel 5.15.4 (Satz von Chebychev, [TeMe, p. 19]) Für eine Zahl x > 0 bezeichnet π(x) die Anzahl aller Primzahlen, die kleiner oder gleich x sind. Dann gibt es zwei Konstanten a und b, so dass für alle x > 0 x x a ≤ π(x) ≤ b ln x ln x gilt. Beweis. 2 5.16. DER SATZ VON TAYLOR UND TAYLORREIHEN 5.16 301 Der Satz von Taylor und Taylorreihen Satz 5.16.1 Es sei I ein Intervall und f : I → R sei (n + 1)-mal stetig differenzierbar auf I. Es sei x0 innerer Punkt des Intervalls I. Dann gilt für alle inneren Punkte x ∈ I n X f (k) (x0 ) (x − x0 )k + Rn (x, x0 ) f (x) = k! k=0 wobei 1 Rn (x, x0 ) = n! Z x x0 (x − t)n f (n+1) (t)dt. Man bezeichnet Rn als Restglied. Beweis. Der Beweis wird mit Induktion geführt. Für n = 0 gilt Z x f (x) = f (x0 ) + f 0 (t)dt. x0 Dies folgt aus dem RHauptsatz der Differential- und Integralrechnung (Satz 5.4.1). x Es gilt R0 (x, x0 ) = x0 f 0 (t)dt. Nun der Induktionsschritt. Wir nehmen an, dass die Aussage für n − 1 bewiesen ist, d.h. wir haben f (x) = n−1 (k) X f (x0 ) k=0 wobei k! (x − x0 )k + Rn−1 (x, x0 ), 1 Rn−1 (x, x0 ) = (n − 1)! Z x x0 (x − t)n−1 f (n) (t)dt. Durch partielle Integration erhalten wir ( ) x Z x (x − t)n (n) (x − t)n (n+1) 1 − f (t) + f (t)dt Rn−1 (x, x0 ) = (n − 1)! n n x0 x0 Z x (x − t)n (n+1) 1 (x − x0 )n (n) = f (x0 ) + f (t)dt (n − 1)! n n x0 (x − x0 )n (n) = f (x0 ) + Rn (x, x0 ). n! Hieraus folgt f (x) − 2 n−1 (k) X f (x0 ) k=0 k! (x − x0 )n (n) (x − x0 ) = f (x0 ) + Rn (x, x0 ). n! k 302 CHAPTER 5. INTEGRALRECHNUNG Satz 5.16.2 Es sei I ein Intervall und f : I → R sei (n + 1)-mal stetig differenzierbar auf I. Es sei x0 ein innerer Punkt des Intervalls I. (i) (Lagrange Form des Restglieds) Für alle x ∈ I gibt es ein Θ ∈ (0, 1) mit Rn (x, x0 ) = f (n+1) (x0 + Θ(x − x0 )) (x − x0 )n+1 . (n + 1)! (ii) (Cauchy Form des Restglieds) Für alle x ∈ I gibt es ein Θ ∈ (0, 1) mit Rn (x, x0 ) = f (n+1) (x0 + Θ(x − x0 )) (1 − Θ)n (x − x0 )n+1 . n! Man beachte, dass die Zahl Θ von f , n und x0 abhängt. Beweis. (i) Nach dem Mittelwertsatz der Integralrechnung (Satz 5.6.2) gibt es ein ξ ∈ (x0 , x) bzw. ξ ∈ (x, x0 ), so dass Z Z 1 x f (n+1) (ξ) x n (n+1) Rn (x, x0 ) = (t)dt = (x − t) f (x − t)n dt n! x0 n! x0 x (n+1) (n+1) f (ξ) 1 f (ξ) − (x − t)n+1 = (x − x0 )n+1 . = n! n+1 (n + 1)! x0 Wir wählen nun Θ, so dass ξ = x0 + Θ(x − x0 ). (ii) Mit dem Mittelwertsatz der Integralrechnung (Satz 5.6.2) erhalten wir Z 1 x 1 Rn (x, x0 ) = (x − t)n f (n+1) (t)dt = (x − ξ)n f (n+1) (ξ)(x − x0 ). n! x0 n! Wir wählen nun Θ, so dass ξ = x0 + Θ(x − x0 ). Damit erhalten wir 1 (x − x0 − Θ(x − x0 ))n f (n+1) (x0 + Θ(x − x0 ))(x − x0 ) n! f (n+1) (x0 + Θ(x − x0 )) = (1 − Θ)n (x − x0 )n+1 . n! Rn (x, x0 ) = 2 Beispiel 5.16.1 Für alle x mit |x| < 1 gilt arctan x = ∞ X (−1)n+1 n=1 x2n−1 . 2n − 1 Mit Hilfe des Grenzwertsatzes von Abel (Lemma 3.9.3) kann man weiter folgern ∞ (5.13) X (−1)n+1 π = arctan(1) = =1− 4 2n − 1 k=1 1 3 + 1 5 − 1 7 + 1 9 − ··· Diese Reihe wird auch als Leibniz Reihe bezeichnet. Leibniz hatte ein geometrisches Argument gefunden um zu zeigen, dass sich die Reihe zu π4 aufsummiert. Dieses Beispiel zeigt auch, dass eine Taylorrreihe eine Funktion nicht notwendig auf dem gesamten Definitionsgebiet darstellen muss, arctan ist auf ganz R definiert, ihre Taylorreihe mit Entwicklungsmitte 0 stellt die Funktion nur auf (−1, 1) dar. 5.17. GLEICHMÄSSIGE KONVERGENZ UND INTEGRAL 303 Beweis. Wir benutzen die Formel für die geometrische Reihe ∞ X 1 d = arctan x = (−1)n x2n . dx 1 + x2 n=0 Wir integrieren die rechte Seite summandenweise arctan x = c + ∞ X (−1)n n=0 x2n+1 . 2n + 1 Für x = 0 erhalten wir c = 0 und arctan x = ∞ X (−1)n n=0 x2n+1 . 2n + 1 Also haben wir arctan durch eine Potenzreihe dargestellt. Diese Potenzreihe ist nach Satz 3.9.3 mit ihrer Taylorreihe identisch. 2 5.17 Gleichmäßige Konvergenz und Integral Satz 5.17.1 (i) Es sei fn : [a, b] → R, n ∈ N, eine Folge Riemann-integrierbarer Funktionen, die gleichmäßig gegen eine Funktion f konvergiert. Dann ist auch f Riemann-integrierbar und Z b Z b lim f (x)dx. fn (x)dx = n→∞ a a (ii) Es sei gnP: [a, b] → R, n ∈ N, eine Folge Riemann-integrierbarer Funktionen, deren Reihe ∞ n=1 gn gleichmäßig gegen die Funktion g konvergiert. Dann ist auch g Riemann-integrierbar und es gilt ∞ Z X n=1 b b Z gn (x)dx = a g(x)dx. a Die entscheidende Voraussetzung ist die gleichmäßige Konvergenz. Es gibt eine Folge von Funktionen, die punktweise konvergiert, man aber Limes und Integral nicht vertauschen kann (Beispiel 5.17.1). Für das Lebesgue Integral steht ein komfortablerer Satz zur Verfügung, der Satz von der dominierten Konvergenz. Ebenso wichtig ist bei den Voraussetzungen des Satzes, dass das Intervall beschränkt ist. Es gibt Beispiele von Folgen, die auf R gleichmäßig konvergieren, bei denen man aber nicht Limes und (uneigentliches) Integral vertauschen kann (Beispiel 5.17.2). Beweis. (i) Wir zeigen zunächst, dass f Riemann-integrierbar ist. Da fn , n ∈ N, integrierbar sind, gilt ∀n ∈ N∀δ > 0∃P = {x0 , . . . , xK } : |OS P (fn ) − US P (fn )| < δ, 304 CHAPTER 5. INTEGRALRECHNUNG wobei OS P (fn ) = US P (fn ) = K X Mk (fn )∆k Mk (fn ) = sup f (x) x∈[xk−1 ,xk ] k=1 K X mk (fn )∆k mk (fn ) = k=1 inf f (x). x∈[xk−1 ,xk ] Wegen der gleichmäßigen Konvergenz gilt ∀ > 0∃N ∈ N∀n > N ∀x ∈ [a, b] : |fn (x) − f (x)| < . δ und ein n ∈ N, so dass für alle x ∈ [a, b] Zu gegebenem δ > 0 wählen wir = 2(b−a) die Ungleichung |fn (x) − f (x)| < gilt. Nun wählen wir eine Partition P mit |OS P (fn ) − US P (fn )| < δ. Dann gilt für alle k = 1, . . . , K mk (fn ) = inf x∈[xk−1 ,xk ] fn (x) ≤ inf x∈[xk−1 ,xk ] f (x) + = mk (f ) + . Also erhalten wir für alle k = 1, . . . , K mk (fn ) ≤ mk (f ) + . Genauso erhalten wir für alle k = 1, . . . , K Mk (fn ) ≥ Mk (f ) − . Damit erhalten wir δ > |OS P (fn ) − US P (fn )| = K X k=1 (Mk (fn ) − mk (fn ))∆k K K X X ≥ (Mk (f ) − mk (f ) − 2)∆k = (Mk (f ) − mk (f ))∆k − 2(b − a) k=1 k=1 = |OS P (f ) − US P (f )| − δ. Also gilt |OS P (f ) − US P (f )| < 2δ. Damit haben wir nachgeprüft, dass f Riemann integrierbar ist. Wir zeigen nun, dass Z b Z b lim fn (x)dx = f (x)dx. n→∞ a a Es gilt ∀ > 0∃N ∈ N∀n > N ∀x ∈ [a, b] : |f (x) − fn (x)| < . Wir erhalten für alle n mit n > N Z b Z b Z b f (x)dx ≤ fn (x) + dx = fn (x)dx + (b − a) a a a 5.17. GLEICHMÄSSIGE KONVERGENZ UND INTEGRAL 305 und ebenso b Z fn (x)dx ≤ a Z a b b Z f (x) + dx ≤ a f (x)dx + (b − a). Hieraus folgt für alle > 0 Z b Z b ≤ (b − a). f (x)dx − f (x)dx n a a Wir erhalten also Z b Z b f (x)dx = lim a n→∞ fn (x)dx. a 2 Beispiel 5.17.1 (i) Für n ∈ N sei fn : [0, 1] → R durch fn (x) = xn gegeben. Die Folge fn , n ∈ N, konvergiert punktweise gegen die Funktion f mit ( 0 für x ∈ [0, 1) f (x) = 1 für x = 1 Die Folge fn , n ∈ N, konvergiert nicht gleichmäßig. Obwohl keine gleichmäßige Konvergenz vorliegt, gilt doch Z 1 Z 1 lim fn (x)dx = lim fn (x)dx. 0 n→∞ n→∞ 0 (ii) Für n ∈ N sei fn : [0, 1] → R durch 2 n x fn (x) = − n2 x + 2n 0 x ∈ [0, n1 ) x ∈ [ n1 , n2 ) x ∈ [ n2 , 1] Die Funktionen fn , n ∈ N, sind stetig, also insbesondere Riemann-integrierbar. Die Folge konvergiert punktweise gegen f = 0, aber die Folge konvergiert nicht gleichmäßig. Weiter gelten Z 1 Z lim fn (x)dx = 0 0 n→∞ und lim n→∞ 1 fn (x)dx = 1. 0 Beweis. (i) Für x = 0 gilt limn→∞ fn (x) = 0 und für x = 1 gilt limn→∞ fn (x) = 1. Wir betrachten nun x mit 0 < x < 1. Die Folge xn , n ∈ N, ist eine positive, monoton fallende Folge. Somit ist sie konvergent. Es folgt lim xn = x lim xn−1 = x lim xn n→∞ n→∞ n→∞ Mit Beispiel 2.3.10 folgt limn→∞ xn = 0. Wir nehmen an, dass die Folge fn , n ∈ N, gleichmäßig gegen eine Funktion f konvergiert. Diese Funktion muss gleich der Funktion sein, gegen die diese Folge punktweise konvergiert. Diese Funktion ist im Punkt x = 1 nicht stetig. Dies widerspricht dem Satz 3.12.1. Wir wollen hier auch den Nachweis führen, ohne Satz 3.12.1 zu benutzen. Die Negation der gleichmäßigen Konvergenz ist ∃ > 0∀N ∈ N∃m, n > N ∃x ∈ [0, 1] : |fn (x) − fm (x)| ≥ 306 CHAPTER 5. INTEGRALRECHNUNG Wir wählen = 14 . Zu gegebenem N wählen wir n > N und m = 2n. Außerdem wählen wir 1 x = 2− n . Dann gilt |fn (x) − fm (x)| = |xn − xm | = |xn − x2n | = | 21 − 41 | = Weiter gilt 1 Z fn (x)dx = lim lim n→∞ Z n→∞ 0 1 xn dx = lim n→∞ 0 1 4 = . 1 = 0. n+1 (ii) Z 1 1 n Z fn (x)dx = 1 n 0 1 2n −n2 x + 2ndx n xdx + 0 = 2 n Z 2 2 2 x n1 0 2 + − 12 n2 x2 + 2nx n1 = 1 n Die Folge fn , n ∈ N, konvergiert punktweise gegen f = 0. Somit gilt Z 1 Z 1 fn (x)dx = 1 6= 0 = f (x)dx. 0 0 Hiermit und mit Satz 5.17.1 folgt, dass die Folge nicht gleichmäßig konvergiert. Der direkte Nachweis ist nicht viel schwerer: Die Negation der gleichmäßigen Konvergenz ist ∃ > 0∀N ∈ N∃m, n > N ∃x ∈ [0, 1] : |fn (x) − fm (x)| ≥ Wir wählen = 1. Zu gegebenem N wählen wir n = 4N und m = 2N . Außerdem wählen wir 1 x = 2N . Dann gilt 1 1 |fn (x) − fm (x)| = |f4N ( 2N ) − f2N ( 2N )| = 2N ≥ 1 = . 2 Beispiel 5.17.2 (i) Die Folge fn : [0, ∞) → R, n ∈ N, mit fn (x) = x −x e n n2 konvergiert gleichmäßig gegen 0, es gilt aber Z ∞ lim fn (x)dx = 1 und n→∞ Z lim fn (x)dx = 0 0 0 (ii) Für n ∈ N sei gn : [0, ∞) → R durch gn (x) = ∞ n→∞ x −x e n n gegeben. Die Folge gn , n ∈ N, konvergiert gleichmäßig gegen 0, aber Z ∞ lim gn (x)dx = ∞. n→∞ Beweis. (i) Es gilt Z ∞ fn (x)dx = = ∞ Z R x −x x −x n e dx = lim e n dx 2 2 R→∞ n n 0 0 Z Rn R lim te−t dt = lim [−te−t − e−t ]0n = 1. Z 0 0 R→∞ 0 R→∞ 5.17. GLEICHMÄSSIGE KONVERGENZ UND INTEGRAL 307 Die Ableitung von fn ist x x 1 −x e n − 3 e− n . 2 n n Deshalb gilt genau dann fn0 (x) > 0, wenn x < n und fn0 (x) < 0, wenn x > n. Deshalb hat fn in x = n ein absolutes Maximum und es gilt fn0 (x) = 0 ≤ fn (x) ≤ fn (n) = 1 . en (ii) Z ∞ ∞ Z R x −x x −x e n dx = lim e n dx R→∞ n n 0 0 Z Rn R n lim te−t dt = lim n[−te−t − e−t ]0n = ∞ Z gn (x)dx = 0 = R→∞ R→∞ 0 Die Folge gn , n ∈ N, konvergiert gleichmäßig gegen 0. Dazu bestimmen wir das absolute Maximum von gn . 1 x x gn0 (x) = e− n 1 − 2 n n Das absolute Maximum liegt im Punkt x = n2 . Somit gilt 0 ≤ gn (x) ≤ g(n2 ) = ne−n . 2 Satz 5.17.2 Es sei I ein Intervall und gn : I → R, n ∈ N, eine Folge stetig differenzierbarer Funktionen. Die Folge {gn }n∈N , konvergiere punktweise gegen eine Funktion g und die Folge der Ableitungen {gn0 }n∈N , konvergiere gleichmäßig gegen eine Funktion h. Dann ist g differenzierbar und g 0 = h. Beweis. gn0 , n ∈ N, ist eine Folge stetiger Funktionen, die gleichmäßig gegen h konvergiert. Mit Satz 5.17.1 folgt, dass für alle x0 , x ∈ I Z x Z x 0 lim gn (t)dt = h(t)dt n→∞ x0 x0 gilt. Wir wenden nun den Hauptsatz der Differential- und Integralrechnung an (Satz 5.4.1). Für alle x0 , x ∈ I gilt Z x lim (gn (x) − gn (x0 )) = h(t)dt. n→∞ Für alle x0 , x ∈ I gilt x0 g(x) − g(x0 ) = Z x h(t)dt x0 h ist stetig, weil die Folge gn0 aus stetigen Funktionen besteht und gleichmäßig gegen h konvergiert (Satz 3.12.1). Nun können wir noch einmal den Hauptsatz der Differential- und Integralrechnung (Satz 5.4.1) anwenden und erhalten g 0 = h. 2 308 CHAPTER 5. INTEGRALRECHNUNG Es gibt C ∞ -Funktionen, die in keinem Punkt in eine Potenzreihe entwickelbar sind [62]. Es sei φ : R → R durch ( 1 − x12 − (x−1)2 für 0 < x < 1 e e (5.14) φ(x) = 0 sonst gegeben. [x] ist die Abrundungsfunktion oder Gaußklammer. [x] ist die größte, ganze Zahl, die kleiner oder gleich x ist. Beispiel 5.17.3 Die Funktion ψ : R → R mit ψ(x) = ∞ X 1 φ(2k (x − [x])) k! k=1 ist überall unendlich oft differenzierbar, aber nirgends analytisch. Beweis. Für j = 1, 2, . . . definieren wir φj : R → R durch φj (x) = 1 φ(2j (x − [x])). j! φj ist für alle j ∈ N unendlich oft differenzierbar. Es gibt für alle k ∈ N eine Konstante C, so dass für alle x ∈ R ∞ X (k) |φj (x)| ≤ C j=1 Hiermit und mit Satz 5.17.2 folgt, dass ψ unendlich oft differenzierbar ist. Wir zeigen, dass ψ in keinem der Punkte n m o n ∈ N, m ∈ Z, m ungerade n 2 in eine Taylorreihe zu entwickeln ist. Da die Menge dicht in R ist, folgt dann, dass die Funktion in keinem Punkt analytisch ist. Es gilt ∞ n−1 ∞ X X 1 X 1 1 k k ψ(x) = φ(2 (x − [x])) = φ(2 (x − [x])) + φ(2k (x − [x])). k! k! k! k=1 k=1 k=n Wir zeigen, dass n−1 X (5.15) k=1 1 φ(2k (x − [x])) k! in den Punkten { 2mn |m ∈ Z, m / Z} analytisch ist. Es gilt für alle k = 1, . . . , n − 1 2 ∈ n−1 X k=1 n−1 X 1 1 m m m φ(2k ( n − [ n ])) = φ(2k−n (m − 2n [ n ])) k! 2 2 k! 2 k=1 m ist ungerade und 2n [ 2mn ] ist gerade. Außerdem gilt k − n < 0. Hieraus folgt, dass für alle k = 1, . . . , n − 1 m 2k−n (m − 2n [ n ]) ∈ / {0, 1}. 2 Da φ in allen Punkten außer 0 und 1 analytisch ist, ist die Funktion (5.15) in { 2mn |m ∈ Z, m / Z} 2 ∈ analytisch. 5.17. GLEICHMÄSSIGE KONVERGENZ UND INTEGRAL Wir zeigen nun, dass 309 ∞ X 1 φ(2k (x − [x])) k! k=n nicht in den Punkten { 2mn |m ∈ Z, φ(2k ( m 2 ∈ / Z} analytisch ist. Für alle k ∈ N mit k ≥ n gilt m m m − [ n ])) = φ(2k−n (m − 2n [ n ])). 2n 2 2 Es gilt 2k−n (m − 2n [ 2mn ]) ∈ Z und somit gilt für die Funktion φ nach Definition (5.14), dass für alle p ∈ N0 m φ(p) 2k−n (m − 2n [ n ]) = 0. 2 Es ergibt sich für alle p ∈ N0 ∞ X 1 φ k! !(p) 2k m 2n k=n − h m i 2n = 0. Falls diese Funktion analytisch in 2k ( 2mn − [ 2mn ]) wäre, dann wäre sie in einer Umgebung dieses Punktes identisch 0, was nicht der Fall ist. 2 Beispiel 5.17.4 Es gibt auf R eine wachsende, unendlich oft differenzierbare Funktion, die nirgendwo analytisch ist. Beweis. Die Stammfunktion von ψ (Beispiel 5.17.3) ist monoton wachsend, weil ψ positiv ist und sie ist nirgendwo analytisch. 2 Beispiel 5.17.5 [12] Zu jeder Folge reeller Zahlen {an }n∈N gibt es eine unendlich oft differenzierbare Funktion f : R → R, so dass für alle n = 0, 1, 2, . . . f (n) (0) = an gilt. Beweis. Es seien ak , k ∈ N, reelle Zahlen und bk , k ∈ N, positive Zahlen. Tatsächlich wählen wir später bk = (k!)2 |ak |. Wir betrachten die Funktion f (x) = ∞ X k=0 ak xk . 1 + bk x2 Wir nehmen an, dass f unendlich oft differenzierbar ist und dass die Ableitung gleich der Summe der Ableitungen ist. Dann gelten f (0) = a0 und für n ≥ 2 und f 0 (0) = a1 n [2] X f (n) (0) = an + (−1)j an−2j bjn−2j . n! j=1 Mit bk = (k!)2 |ak | erhalten wir für diese Bedingung n [2] X f (n) (0) (−1)j an−2j (((n − 2j)!)2 |an−2j |)j . = an + n! j=1 310 CHAPTER 5. INTEGRALRECHNUNG Wir setzen a0 = c0 und a1 = c1 . Weiter setzen wir n an = cn − [2] X j=1 (−1)j an−2j (((n − 2j)!)2 |an−2j |)j . Wir definieren hk : R → R durch hk (x) = ak xk . 1 + bk x2 In der Tat, die geometrische Reihe liefert für |bk x2 | < 1 hk (x) = ∞ ∞ X X a k xk k j j 2j = a x (−1) b x = (−1)j ak bjk x2j+k . k k 1 + bk x2 j=0 j=0 Es folgt ∞ X (n) hk (x) = 2j≥n−k (−1)j ak bjk (2j + k) · · · (2j + k − n + 1)x2j+k−n und damit (n) (hk ) (0) = j n!(−1)j an−2j bn−2j 0 k = n − 2j sonst Wir zeigen nun, dass f unendlich oft differenzierbar ist, falls die Folge abnn hinreichend schnell gegen 0 konvergiert. Wir benutzen Satz 5.17.2. Wir zeigen, dass die Reihe f punktweise und die Reihe P∞ (n) gleichmäßig konvergiert. Es gilt für k ≥ n + 2 k=1 hk |ak |k! k−n−2 (n) |x| . (hk ) (x) ≤ (n + 1)! bk Mit bk = (k!)2 |ak | folgt ∞ ∞ X X |x|k−n−2 (n) . ) (x) ≤ (n + 1)! (hk k! k=n+2 k=n+2 Diese Reihe konvergiert gleichmäßig auf allen beschränkten Intervallen. 2 Beispiel 5.17.6 (Zetafunktion von Riemann) (i) Die Reihe ζ(x) = ∞ X 1 nx n=1 konvergiert auf (1, ∞) punktweise und heißt Riemannsche Zetafunktion. Sie konvergiert auf jedem Intervall [a, b] ⊂ (1, ∞) gleichmäßig. Sie ist differenzierbar und die Ableitung ist ζ 0 (x) = − ∞ X ln n nx n=1 (Tatsächlich ist die Riemannsche Zetafunktion für alle komplexen Zahlen erklärt. Die Bestimmung der Nullstellen ist eines der berühmtesten und schwierigsten, offenen Probleme der Mathematik. Die Riemannsche Vermutung besagt, dass alle Nullstellen der Zetafunktion auf der Geraden { 21 + iy|y ∈ R} liegen.) (ii) Für n ∈ N sei fn : R → R durch fn (x) = n1 sin(n2 x) gegeben. Die Folge fn , n ∈ N, konvergiert gleichmäßig gegen f = 0. Die Folge fn0 , n ∈ N, divergiert in jedem Punkt x ∈ R. 5.17. GLEICHMÄSSIGE KONVERGENZ UND INTEGRAL 311 Beweis. (i) Nach Beispiel 5.13.1 konvergiert die Reihe für jedes x ∈ (1, ∞). Dies wurde mit dem Integralkriterium gezeigt. Wir zeigen, dass die Reihe gleichmäßig auf jedem Intervall [a, b] ⊂ (1, ∞) konvergiert. Zu gegebenem > 0 wählen wir N so groß, dass für alle n mit n > N gilt, dass P∞ 1 < . Dies ist möglich, weil die Reihe konvergiert. Deshalb gilt für alle x ∈ [a, b] a k=n+1 k n ∞ ∞ ∞ X X X X 1 1 1 1 = − ≤ < kx kx kx ka k=1 Die Ableitung von Pn k=1 k=n+1 k=1 k=n+1 k −x ist − n X ln k k=1 kx Dies folgt mit der Kettenregel. (k −x )0 = (e−(ln k)x )0 = (− ln k)k −x Wir weisen nun nach, dass die Reihe ∞ X ln k k=1 kx auf jedem Intervall [a, b] ⊂ (1, ∞) gleichmäßig konvergiert. Zunächst beobachten wir, dass ∞ X ln k k=1 kx konvergiert. Wir wählen η > 0 so klein, dass x − η > 1 gilt. Dann gibt es ein k0 , so dass für alle k > k0 ln k 1 ≤ x−η ka k gilt. Es reicht nachzuprüfen, dass es ein k0 gibt, so dass für alle k > k0 gilt, dass ln k ≤ k η . Man kann dies mit der Formel von L’Hospital nachprüfen. Es gibt also für alle > 0 ein N , so dass für alle n mit n > N ∞ X ln k < ka k=n gilt. Hiermit erhalten wir für alle x ∈ [a, b] n ∞ ∞ ∞ X ln k X X X ln k ln k ln k − = ≤ < . x x x k k k ka k=1 k=1 k=n+1 k=n+1 Mit Satz 5.17.2 folgt, dass ∞ X 1 kx !0 k=1 =− (ii) Zu gegebenem wählen wir N so groß, dass > ∞ X ln k k=1 1 N. kx . Dann gilt für alle n > N und alle x ∈ R |fn (x) − f (x)| = | n1 sin(n2 x)| ≤ Wir zeigen nun, dass in jedem x ∈ R die Folge fn0 (x) = n cos(n2 x) 1 n < . 312 CHAPTER 5. INTEGRALRECHNUNG divergiert. Wir nehmen an, es gebe einen Punkt x ∈ R, so dass limn→∞ n cos(n2 x) existiert. Dann gilt limn→∞ cos(n2 x) = 0. Wir zeigen, dass dies nicht sein kann. Für alle t ∈ R gilt cos 2t = 2 cos2 t − 1. Also cos((2n)2 x) = 2 cos2 (2n2 x) − 1 = 2(2 cos2 (n2 x) − 1)2 − 1 = 8 cos4 (n2 x) − 8 cos2 (n2 x) + 1. Es folgt 0 = = = lim cos((2n)2 x) n→∞ lim (8 cos4 (n2 x) − 8 cos2 (n2 x) + 1) 4 2 8 lim cos(n2 x) − 8 lim cos(n2 x) + 1 = 1. n→∞ n→∞ n→∞ 2 5.18 Rationale, irrationale, algebraische und transzendente Zahlen Eine Zahl heißt rational, falls sie Quotient zweier ganzer Zahlen ist, sie heißt irrational, falls sie nicht rational ist. Definition 5.18.1 Eine reelle Zahl heißt algebraisch, falls sie Nullstelle eines Polynoms ist, das nur ganze Zahlen als Koeffizienten hat. Eine Zahl heißt transzendent, falls sie nicht algebraisch ist. Definition 5.18.2 Der Grad einer algebraischen Zahl ist der kleinste Grad eines Polynoms mit ganzzahligen Koeffizienten, das diese Zahl zur Nullstelle hat. Offenbar ist jede rationale Zahl algebraisch. Zu einer rationalen Zahl pq wählen wir das Polynom p − qx. Die Zahl pq ist Nullstelle des Polynoms p − qx. Jede transzendente Zahl irrational. Andererseits √ gibt es irrationale Zahlen, die nicht√transzendent sind. Ein Beispiel hierfür ist 2. Wir haben bereits gesehen, √ dass 2 nicht rational ist (Satz 2.0.2). 2 ist aber Nullstelle des Polynoms x2 − 2 √ und damit ist 2 algebraisch. Genauso findet man, dass jede Quadratwurzel einer natürlichen Zahl algebraisch ist. Bei der Einführung der reellen Zahlen hatten wir gezeigt, dass eine reelle Zahl genau dann rational ist, wenn ihre Dezimalbruchdarstellung letztendlich periodisch ist. Mit dieser Beobachtung kann man leicht irrationale Zahlen angeben. So ist die Zahl, deren n2 -te Koeffizienten ihrer Dezimalbruchentwicklung gleich 1 sind und deren übrige Koeffizienten gleich 0 sind, irrational, weil die Dezimalbruchdarstellung nicht letztendlich periodisch ist (Beispiel 2.10.1). 5.18. RATIONALE, IRRATIONALE, ALGEBRAISCHE UND TRANSZENDENTE ZAHLEN313 Euler zeigte 1737, dass e eine irrationale Zahl ist. Lambert zeigte ca. 1770, dass e und tan x irrational sind, falls x eine rationale Zahl ist, die von 0 verschieden ist. Hieraus folgt, dass π eine irrationale Zahl sein muss, weil x arctan( π4 ) = 1. 1873 zeigte Hermite, dass e transzendent ist. Lindemann zeigte 1882, dass π transzendent ist. Man konnte bisher nicht beweisen, dass die Eulersche Zahl γ irrational ist. Auch ist nicht bekannt, ob πe irrational ist oder nicht. Wichtig sind Darstellungen für Zahlen, wenn man mit ihnen rechnen will. Wir hatten e als Limes eingeführt n 1 e = lim 1 + . n→∞ n Als weitere Darstellung für die Zahl e haben wir ∞ X 1 e= n! n=0 gefunden. Diese Reihe konvergiert schnell und man kann leicht die Dezimalbruchdarstellung mit vorgegebener Genauigkeit ausrechnen. Für die Zahl π hatten wir die Leibniz Reihe (5.13) angegeben π = 1 − 31 + 51 − 71 + 19 − · · · 4 Diese Reihe konvergiert allerdings sehr langsam. Die Formel von Wallis (Satz 5.11.1) ist ∞ π Y 4k 2 = . 2 k=1 4k 2 − 1 Die Formel von Vieta ist (Beispiel 5.11.1) v s r u r r s u 2 1 1 1 1 t1 1 1 1 1 = + + + ······ π 2 2 2 2 2 2 2 2 2 Satz 5.18.1 e ist irrational. Beweis. Wir nehmen an, dass e rational ist, es gibt also p, q ∈ N mit e = pq . Es gilt nach dem Satz von Taylor (Satz 5.16.1) für alle n ∈ N, x ∈ R und x0 ∈ R x e = n X ex0 k=0 k! (x − x0 )k + Rn (x, x0 ). 314 CHAPTER 5. INTEGRALRECHNUNG Wir verwenden die Lagrange Form des Restglieds (Satz 5.16.2). Für alle n ∈ N, x ∈ R und x0 ∈ R existiert ein Θ ∈ (0, 1) mit Rn (x, x0 ) = 1 ex0 +Θ(x−x0 ) (x − x0 )n+1 . (n + 1)! Für x = 1 und x0 = 0 folgt, dass für alle n ein Θ ∈ (0, 1) existiert, so dass n X 1 eΘ e= + k! (n + 1)! k=0 gilt. Weil eΘ (n+1)! > 0, folgt, dass für alle n ∈ N ein Θ ∈ (0, 1) mit n eΘ p X 1 eΘ e 0< = − = < (n + 1)! q k=0 k! (n + 1)! (n + 1)! existiert. Deshalb gilt für alle n ∈ N n e p X 1 < . 0< − q k=0 k! (n + 1)! Wir wählen nun n = q + 1. Damit q+1 p X 1 e 0< − < q k=0 k! (q + 2)! und somit 0 < (q + 1)(q − 1)!p − q+1 X (q + 1)! k=0 k! < e . q+2 Dies kann nicht sein, weil (q + 1)(q − 1)!p − q+1 X (q + 1)! k=0 k! eine ganze Zahl ist, die strikt größer als 0 und strikt kleiner als e gilt q+2 ≤ 3e < 1. 2 e q+2 ist. Da q ∈ N, Satz 5.18.2 π ist irrational. Beweis. [82] Wir nehmen an, dass π rational ist, dass also p, q ∈ N mit π = existieren. Wir wählen n ∈ N so groß, dass π n+1 pn < 1. n! p q 5.18. RATIONALE, IRRATIONALE, ALGEBRAISCHE UND TRANSZENDENTE ZAHLEN315 Dass dies möglich ist, folgt z.B. aus der Formel von Stirling. Es seien fn : R → R für alle x ∈ R durch xn (p − qx)n fn (x) = n! gegeben und Fn : R → R durch F n = fn − fn(2) + fn(4) − ··· + (−1)n fn(2n) = n X (−1)j fn(2j) . j=0 Wir wollen nun zeigen, dass (5.16) Fn (0) und Fn (π) ganze Zahlen sind. Dazu zeigen wir, dass für alle j = 0, 1, . . . , 2n fn(j) (0) ∈ Z. Es gilt n xn (p − qx)n xn X n k fn (x) = = p (−qx)n−k n! n! k=0 k n 1 X n = (−1)n−k pk q n−k x2n−k . n! k=0 k Für j = 0, 1, . . . , n − 1 erhalten wir n 1 X n (j) (−1)n−k pk q n−k ((2n − k)(2n − k − 1) · · · (2n − k − j + 1))x2n−k−j fn (x) = n! k=0 k (j) und es folgt sofort fn (0) = 0. Für j = n, . . . , 2n gilt fn(j) (x) = n 1 X n (−1)n−k pk q n−k ((2n − k)(2n − k − 1) · · · (2n − k − j + 1))x2n−k−j n! k=2n−j k Wenn wir x = 0 einsetzen, bleibt nur der Summand für k = 2n − j übrig, alle anderen sind 0. Wir erhalten also n j! (j) (−1)j−n p2n−j q j−n . fn (0) = n! 2n − j Dies ist eine ganze Zahl, weil j ≥ n. Also ist auch Fn (0) eine ganze Zahl. Nun zeigen wir, dass Fn (π) = Fn ( pq ) eine ganze Zahl ist. Dazu überlegen wir uns, dass für alle x ∈ R (5.17) fn (x) = fn ( pq − x) 316 CHAPTER 5. INTEGRALRECHNUNG gilt. In der Tat fn ( pq − x) = ( pq − x)n (p − q( pq − x))n ( pq − x)n (qx))n = n! n! Aus (5.17) erhalten wir für alle x ∈ R und alle j = 0, 1, . . . , 2n = fn (x). fn(j) ( pq − x) = (−1)j fn(j) (x) (j) (j) und damit, dass fn ( pq ) = (−1)j fn (0) ∈ Z. Schließlich erhalten wir Fn ( pq ) ∈ Z. Nun zeigen wir, dass d (F 0 (x) sin x − Fn (x) cos x) = Fn00 (x) sin x + Fn (x) sin x = fn (x) sin x. dx n Wir müssen hierzu zeigen, dass Fn00 + Fn = fn gilt. Es gilt (5.18) Fn00 + Fn = = n X (−1)k fn(2k+2) k=0 k=0 n+1 X n X (−1)k−1 fn(2k) + k=1 Da (2n+2) fn + n X (−1)k fn(2k) (−1)k fn(2k) = fn + (−1)n fn(2n+2) . k=0 =0 Fn00 + Fn = fn . Mit dem Hauptsatz der Differential- und Integralrechnung und (5.18) Z π π (5.19) fn (x) sin xdx = [Fn0 (x) sin x − Fn (x) cos x]0 = Fn (π) − Fn (0). 0 Andererseits gilt für alle x ∈ (0, π) π n pn . n! Die linke Ungleichung gilt, weil sin auf (0, π) strikt positiv ist und weil π = pq und fn auf (0, pq ) strikt positiv ist. Wir weisen die rechte Ungleichung nach. Wegen 0 < x < π = pq gelten xn ≤ π n und (p − qx)n ≤ pn . Deshalb 0 < fn (x) sin x ≤ xn (p − qx)n π n pn ≤ . n! n! Da fn · sin eine stetige Funktion ist, die auf dem Integrationsintervall mit Ausnahme der Intervallendpunkte strikt positiv ist, folgt Z π π n+1 pn 0< fn (x) sin xdx ≤ . n! 0 fn (x) = Mit (5.19) π n+1 pn < 1. n! Dies kann nicht sein, weil Fn (π) − Fn (0) nach (5.16) eine ganze Zahl ist. 2 0 < Fn (π) + Fn (0) ≤ Cantor bewies 1874, dass die meisten Zahlen transzendent sind. 5.18. RATIONALE, IRRATIONALE, ALGEBRAISCHE UND TRANSZENDENTE ZAHLEN317 Satz 5.18.3 (i) Die Menge der rationalen Zahlen und die Menge der algebraischen Zahlen sind abzählbar. (ii) Die Menge der irrationalen Zahlen und die Menge der transzendenten Zahlen haben die Mächtigkeit der reellen Zahlen. Lemma 5.18.1 [5] Für jede algebraische Zahl x mit Grad n > 1 existiert eine Zahl c > 0, so dass für alle p ∈ Z und alle q ∈ N x − p > c q qn gilt. Beweis. Es sei P ein irreduzibles Polynom mit P (x) = 0. Aus dem Mittelwertsatz folgt −P ( pq ) = P (x) − P ( pq ) = (x − pq )P 0 (ξ). Man kann annehmen, dass |x− pq | < 1, sonst wäre das Ergebnis trivialerweise richtig. Wegen ξ ∈ [x, pq ], folgt weiter |ξ| < 1 + |x|. Hiermit folgt 1 |P 0 (ξ)| < . c Deshalb erhalten wir |x − pq | > c|P ( pq )|. Da P irreduzibel ist, gilt P ( pq ) 6= 0 und q n P ( pq ) ist eine ganze Zahl, die dem Absolutbetrag nach größer oder gleich 1 ist. 2 Satz 5.18.4 Die Zahl x= ∞ X 10−k! k=1 ist transzendent. Beweis. Wir wählen pj = 10j! j X 10−k! und qj = 10j! . k=1 Dann gilt ∞ ∞ X X p 10 j −k! −(j+1)! x − = 10 < 10 10−k! = qj−j−1 < qj−j . qj 9 k=j+1 k=0 2 318 CHAPTER 5. INTEGRALRECHNUNG Satz 5.18.5 e ist transzendent. Beweisidee: Wir konstruieren r, s ∈ R mit |s| < 1 und p ∈ Z \ {0}, so dass r(an en + · · · + a1 e + a0 ) = s + p gilt. Da dann s + p 6= 0, so folgt an en + · · · + a1 e + a0 6= 0. Beweis. Es seien k ∈ N und g, h : R → R mit g(x) = x(x − 1) · · · (x − n) h(x) = e−x (x − 1) · · · (x − n). Weiter definieren wir f : R → R durch f (x) = g(x)k h(x). Damit gilt !k+1 n X f (x) = xk ((x − 1) · · · (x − n))k+1 e−x = xk aj x j e−x j=0 wobei a0 = (−1)n n! und an = 1. Mit neuen Koeffizienten gilt k+n(k+1) X f (x) = bj xj e−x j=k wobei bk = ((−1)n n!)k+1 . Wir setzen ∞ Z f (x)dx w0 = 0 Wegen |f (x)| = |xk ((x − 1) · · · (x − n))k+1 e−x | ≤ xk+n(k+1) e−x gilt Z 0 ∞ f (x)dx ≤ ∞ Z w0 = Z ∞ xk+n(k+1) e−x dx = (k + n(k + 1))! 0 k+n(k+1) X 0 bj x k+n(k+1) j −x e dx = j=k = j=k Z ∞ bj j=k k+n(k+1) X X xj e−x dx 0 k+n(k+1) n k+1 bj j! = ((−1) n!) k! + X bj j! j=k+1 Da alle Summanden von j = k + 1 bis k + n(k + 1) durch (k + 1)! teilbar sind, gibt es ein c0 ∈ Z mit (5.20) w0 = ((−1)n n!)k+1 k! + c0 (k + 1)! 5.18. RATIONALE, IRRATIONALE, ALGEBRAISCHE UND TRANSZENDENTE ZAHLEN319 Wir setzen r= w0 = ((−1)n n!)k+1 + c0 (k + 1) k! und für i = 0, . . . , n i Z f (x)dx vi = ∞ Z wi = 0 f (x)dx. i Es gelten für alle i = 0, . . . , n, dass w0 = vi + wi und ! n X w 1 0 r(an en + · · · + a1 e + a0 ) = ai ei = k! i=0 k! = n X ! w 0 ai e i i=0 1 1 (vn an en + · · · + v1 a1 e) + (wn an en + · · · w1 a1 e + w0 a0 ) k! k! Wir setzen s= 1 (vn an en + · · · + v1 a1 e) k! p= 1 (wn an en + · · · w1 a1 e + w0 a0 ) k! Wir betrachten ∞ Z wi = ∞ Z f (x)dx = i i xk ((x − 1) · · · (x − n))k+1 e−x dx Wir substituieren x − i = t Z ∞ wi = (t + i)k ((t + i − 1) · · · t · · · (t + i − n))k+1 e−t−i dt 0 = e −i Z 0 ∞ k+n(k+1) X k+n(k+1) j −t −i αj t e dt = e j=k+1 X αj j!, j=k+1 wobei αj ∈ Z für alle j = k + 1, . . . , k + n(k + 1). Da j ≥ k + 1, gibt es ci ∈ Z mit wi = ci (k + 1)!e−i Es folgt mit (5.20) 1 (wn an en + · · · w1 a1 e + w0 a0 ) k! 1 1 = (k + 1)!(cn an + · · · + c1 a1 ) + a0 (((−1)n n!)k+1 k! + c0 (k + 1)!) k! k! = (k + 1)(cn an + · · · + c1 a1 ) + a0 ((−1)n n!)k+1 + (k + 1)c0 a0 p = Da a0 , . . . , an ∈ Z und c0 , . . . , cn ∈ Z, gibt es ein α ∈ Z mit p = (k + 1)α + a0 ((−1)n n!)k+1 . Also gilt p ∈ Z. Wir überlegen uns nun, dass wir k so wählen können, dass p 6= 0. Es gilt genau dann p = 0, wenn (k + 1)α + a0 ((−1)n n!)k+1 = 0. 320 CHAPTER 5. INTEGRALRECHNUNG Wir wählen für k + 1 eine Primzahl, die strikt größer als n und a0 ist. Dann ist der erste Summand durch k + 1 teilbar, der zweite Summand aber nicht. Also gilt p 6= 0. Wir zeigen nun, dass |s| < 1. Da g und h stetige Funktionen sind, gibt es Konstanten Cg , Ch , so dass für alle x ∈ [0, n] |g(x)| ≤ Cg |h(x)| ≤ Ch gelten. Somit gilt |f (x)| ≤ Cgk Ch für alle x ∈ [0, n]. Hieraus folgt Z i |vi | = f (x)dx ≤ iCgk Ch 0 Es folgt weiter n n n 1 X 1 X 1 k X i i vi ai e ≤ |s| = v i ai e ≤ C g C h iai ei k! k! i=1 k! i=1 i=1 Es gilt n lim k→∞ 1 k X C Ch iai ei k! g i=1 ! =0 Also gibt es ein hinreichend großes k ∈ Z mit |s| < 1. 2 Unter Quadratur des Kreise versteht man die folgende Aufgabe. Zu einem gegebenen Kreis soll man nur mit Zirkel und Lineal ein Quadrat konstruieren, das denselben Flächeninhalt wie der Kreis hat. Wenn wir annehmen, dass der Kreis den Radius 1 hat, dann bedeutet diese Aufgabe, dass man √ zu einem gegebenen Geradenstück der Länge 1 ein Geradenstück der Länge π konstruiert. Diese Konstruktion soll nur mit Zirkel und Lineal durchgeführt werden. Man kann zeigen, dass eine Konstruktion mit Zirkel und Lineal auf ein Geradenstück mit einer Länge führt, die eine algebraische Zahl ist, wenn man von einem Geradenstück der Länge 1 ausgeht. Ein Beispiel hierfür ist die √ Konstruktion der Länge 2, wobei man von der Länge 1 ausgeht.√Man konstruiert ein Quadrat mit der Seitenlänge 1. Die Diagonale hat die Länge 2. √ Hat man die Länge 2 konstruiert, dann kann man das Rechteck mit den Seit√ √ enlängen 2 und 1 konstruieren. Die Diagonale hat die Länge 3. √ √ Weil π und damit π transzendent ist, kann man kein Streckenstück der Länge π konstruieren. Satz 5.18.6 Die Quadratur des Kreises ist nicht möglich. Chapter 6 Funktionen mehrerer reeller Variablen 6.1 Zusammenhängende Mengen im Rn Die Verbindungsstrecke [x, y] zwischen zwei Punkten x, y ∈ Rn ist die Menge {z|∃t ∈ [0, 1] : z = tx + (1 − t)y} Eine Teilmenge M des Rn heißt polygonzusammenhängend , falls es für alle x, y ∈ M endlich viele Punkte x1 , . . . , xm ∈ M gibt, so dass x = x1 , y = xm und P= m−1 [ i=1 [xi , xi+1 ] ⊆ M gilt. Man nennt P einen Polygonzug und sagt, dass x und y durch einen Polygonzug verbunden werden können. M heißt bogenzusammenhängend , falls für alle x, y ∈ M eine stetige Funktion f : [0, 1] → Rn existiert, so dass f (0) = x, f (1) = y und f ([0, 1]) ⊆ M gelten. Eine Teilmenge M eines metrischen Raumes (X, d) heißt nicht zusammenhängend , falls es zwei offene Mengen U und V von X mit M ∩ U 6= ∅ M ∩ V 6= ∅ (M ∩ U) ∪ (M ∩ V) = M (M ∩ U) ∩ (M ∩ V) = ∅ gibt. Eine Menge M ist also zusammenhängend, wenn man solche Mengen U und V nicht finden kann. Satz 6.1.1 Es seien (X, dX ) und (Y, dY ) metrische Räume und f : X → Y eine stetige Funktion mit f (X) = Y . Falls X eine zusammenhängende Menge ist, dann ist auch Y eine zusammenhängende Menge. 321 322 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Beweis. Es seien (X, dX ) und (Y, dY ) metrische Räume und f : X → Y eine stetige Funktion. Wir zeigen, dass X nicht zusammenhängend ist, falls Y nicht zusammenhängend ist. Falls Y nicht zusammenhängend ist, dann gibt es zwei nichtleere, offene Mengen A und B mit A∩B =∅ A∪B =Y Da f stetig ist, sind auch f −1 (A) und f −1 (B) offen. Wegen A ∩ B = ∅ folgt f −1 (A) ∩ f −1 (B) = ∅ und wegen A ∪ B = Y gilt f −1 (A) ∪ f −1 (B) = X Also ist X nicht zusammenhängend. 2 Beispiel 6.1.1 (i) R ist zusammenhängend. (ii) [0, 1] ist zusammenhängend. Beweis. (i) Wir nehmen an, dass R nicht zusammenhängend ist. Dann gibt es zwei offene, nichtleere Mengen A und B mit A∩B =∅ A∪B =R Wir können annehmen, dass es ein a0 ∈ A und ein b0 ∈ B mit a0 < b0 gibt. Wir betrachten c = sup{a ∈ A|a < b0 } Dann gilt c ∈ / A. Falls nämlich c ∈ A, dann gäbe es eine Umgebung von c, die ganz in A liegt und c kann nicht das Supremum sein. Wegen c ∈ / A folgt c ∈ B. Da B offen ist, muss eine ganze Umgebung von c in B enthalten sein. Also kann c nicht Supremum sein. (ii) [0, 1] ist das stetige Bild von R, z.B. ist [0, 1] das Bild der stetigen Abbildung |sin|. 2 Satz 6.1.2 Es sei M eine Teilmenge des Rn . (i) Falls M polygonzusammenhängend ist, so ist M auch bogenzusammenhängend. (ii) Falls M bogenzusammenhängend ist, so ist M auch zusammenhängend. Beweis. (i) Ein Polygonzug ist der Graph einer stetigen Funktion. (ii) Da M bogenzusammenhängend ist, gibt es für alle x, y ∈ M einen Weg Φ : [0, 1] → Rn mit Φ(0) = x Φ(1) = y Φ([0, 1]) ⊆ M Wir nehmen an, dass M nicht zusammenhängend ist. Es gibt also offene Mengen A und B mit A∩B∩M =∅ M ⊆A∪B A ∩ M 6= ∅ B ∩ M 6= ∅ 6.1. ZUSAMMENHÄNGENDE MENGEN IM RN 323 Wir wählen nun x ∈ A ∩ M und y ∈ B ∩ M . Es gibt einen Weg Φ, der die beiden Punkte verbindet. Die Menge Φ([0, 1]) ist das stetige Bild einer zusammenhängenden Menge also selbst zusammenhängend. Andererseits gelten A ∩ Φ([0, 1]) 6= ∅ A ∩ B ∩ Φ([0, 1]) = ∅ B ∩ Φ([0, 1]) 6= ∅ A ∩ Φ([0, 1])) ∪ (B ∩ Φ([0, 1])) = Φ([0, 1]) Also ist Φ([0, 1]) nicht zusammenhängend, was ein Widerspruch ist. 2 Satz 6.1.3 Es sei M eine offene Teilmenge vom Rn . Dann sind äquivalent: (i) M ist zusammenhängend. (ii) M ist bogenzusammenhängend. (iii) M ist polygonzusammenhängend. Beweis. Die Implikationen (iii) ⇒ (ii) ⇒ (i) folgen aus Satz 6.1.2. (i) ⇒ (iii): Wir wählen einen beliebigen Punkt x0 ∈ M . Es sei Mx0 die Menge aller Punkte, die mit x0 durch einen Polygonzug verbunden werden können. Falls M = Mx0 , dann ist M polygonzusammenhängend. Wir betrachten nun den Fall, dass Mx0 6= M . Wir zeigen, dass Mx0 offen ist. Dazu müssen wir zeigen, dass wir zu jedem x ∈ Mx0 eine Umgebung finden, die ganz in Mx0 liegt. Zu x ∈ Mx0 wählen wir eine offene Kugel B(x, ), die ganz in M liegt und deren Mittelpunkt x ist. Es sei N [ [x`−1 , x` ] `=1 ein Polygonzug, der x0 und x verbindet und der in M liegt. Weiter sei y ∈ B(x, ). Dann ist N [ [x`−1 , x` ] ∪ [x, y] `=1 ein Polygonzug, der x0 mit y verbindet und der in M liegt. Ebenso zeigen wir, dass die Menge Nx0 aller x ∈ M , die man nicht mit x0 durch einen Polygonzug verbinden kann, offen ist. Wir betrachten einen Punkt y dieser Menge und eine Kugel B(y, ) mit Mittelpunkt y, die ganz in M liegt. Dann müssen alle Elemente dieser Kugel ebenfalls in Nx0 liegen. Falls nicht, so gibt es ein x ∈ Mx0 , das in der Kugel B(y, ) liegt und damit einen Polygonzug N [ [y`−1 , y` ] `=1 der x mit x0 verbindet (y0 = x0 und yN = x). Diesen Polygonzug können wir bis y verlängern: N [ [y`−1 , y` ] ∪ [x, y]. `=1 324 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Somit liegt y in Mx0 , was falsch ist. Also gibt es zwei offene Teilmengen Mx0 und Nx0 , die disjunkt sind und deren Vereinigung gleich M ist. Damit ist M nicht zusammenhängend. 2 Eine Menge, die offen und zusammenhängend ist, heißt Gebiet. Beispiel 6.1.2 (i) Die Teilmenge {(x, y)|x2 + y 2 = 1} des R2 ist bogenzusammenhängend, aber nicht polygonzusammenhängend. (ii) Die Teilmenge {(x, y)|x = 0, y ∈ R} ∪ {(x, y)|x ∈ (0, 1] und y = sin x1 } des R2 ist zusammenhängend, aber nicht bogenzusammenhängend. Beweis. (ii) Wir bezeichnen S = (x, y)|y = sin x1 und x ∈ (0, 1] L = {(0, y)|y ∈ R} Wir nehmen an, dass M = L ∪ S nicht zusammenhängend ist. Dann gibt es offene Teilmengen A und B mit A∩B∩M =∅ A∪B ⊇M A ∩ M 6= ∅ B ∩ M 6= ∅ Wir betrachten zunächst den Fall A∩M =L B∩M =S Da A offen ist, gibt es ein > 0, so dass B((0, 0), ) ⊆ A Hieraus folgt B((0, 0), ) ∩ M ⊆ A ∩ M = L 1 Andererseits gilt für alle n ∈ N, dass ( 2πn , 0) ∈ S. Wir können n hinreichend groß wählen, so dass ( 1 , 0) ∈ B((0, 0), ) 2πn Das ist ein Widerspruch. Wir wenden uns nun dem Fall zu, dass A ∩ M 6= L B ∩ M 6= S Dann muss einer der folgenden Fälle gelten. A ∩ L 6= ∅ und B ∩ L 6= ∅ A ∩ S 6= ∅ und B ∩ S 6= ∅ oder Deshalb ist L oder S nicht zusammenhängend. Dies ist aber falsch. Wir zeigen nun, dass M nicht bogenzusammenhängend ist. Wir nehmen an, dass M bogenzusammenhängend ist. Insbesondere gibt es eine stetige Funktion φ : [0, 1] → M mit φ(0) = (0, 0) und φ(1) = (1, sin 1). Dann sind die beiden Koordinatenfunktionen φ1 und φ2 von φ stetig. Es gilt φ1 (0) = 0 und φ1 (1) = 1. Da φ1 stetig ist, nimmt φ1 nach dem Zwischenwertsatz alle Werte 6.1. ZUSAMMENHÄNGENDE MENGEN IM RN 325 1 , k ∈ N. Da tk , k ∈ N, eine des Intervalls [0, 1] an. Also gibt es Zahlen tk ∈ [0, 1] mit φ1 (tk ) = 2πk beschränkte Folge ist, gibt es eine Teilfolge tki , i ∈ N, die in [0, 1] konvergiert also t0 = lim tki i→∞ Es folgt lim φ(tki ) = lim (φ1 (tki ), φ2 (tki )) = lim i→∞ i→∞ i→∞ 1 ,0 2πki = (0, 0) 1 und φ1 (tki+1 ) = 2πk1i+1 , gibt es nach dem Zwischenwertsatz ein Da φ1 stetig ist und φ1 (tki ) = 2πk i si ∈ (tki , tki+1 ) mit φ1 (si ) = π(2k1+ 1 ) . Die Folge si , i ∈ N, konvergiert und i 2 lim φ(si ) = lim i→∞ i→∞ 1 π(2ki + 12 ) , 1 = (0, 1) Dies ist ein Widerspruch, weil limi→∞ φ(si ) = limi→∞ φ(tki ). 2 Beispiel 6.1.3 [110] Es seien a, b ∈ R mit a, b > 0 und a0 = a, b0 = b an+1 = p an bn an + bn 2 bn+1 = 2 für n = 0, 1, 2, . . . . Zeige: Die Folge {(an , bn )}∞ n=0 konvergiert in R gegen den Punkt (agm, agm) wobei !−1 Z π2 π 1 p agm = dt . 2 0 a2 cos2 t + b2 sin2 t Man nennt agm das arithmetisch-geometrische Mittel von a und b. Beweis. Es reicht zu zeigen, √ dass an , n ∈ N, und bn , n ∈ N, in R gegen agm konvergieren. Für alle s, t ≥ 0 gilt st ≤ s+t 2 . Wir zeigen, dass für alle n = 1, 2, . . . an ≤ bn bn+1 ≤ bn √ gelten. Die Ungleichung an ≤ bn folgt sofort aus der Ungleichung st ≤ Ungleichung an ≤ bn an+1 = p an ≤ an+1 an bn ≥ p a2n = an bn+1 = s+t 2 . Weiter folgt aus der an + bn ≤ bn 2 Hieraus folgt, dass an , n ∈ N eine beschränkte, monoton wachsende Folge ist, also eine konvergente Folge ist. bn , n ∈ N, ist eine beschränkte, monoton fallende Folge, also konvergent. Wir zeigen, dass die Grenzwerte gleich sind. lim bn+1 = lim n→∞ n→∞ a n + bn 1 1 = lim an + lim bn 2 2 n→∞ 2 n→∞ Also gilt lim an = lim bn n→∞ n→∞ Damit konvergiert die Folge (an , bn ), n ∈ N, in R2 . Wir weisen jetzt nach, dass der Grenzwert (agm, agm ist. Dazu weisen wir zunächst nach, dass Z 0 gilt. π 2 1 p dt = 2 2 a cos t + b2 sin2 t Z 0 π 2 1 q 2 ( a+b 2 ) cos2 t + ab sin2 t dt 326 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Es gilt Z 0 π √ 1 dΘ c2 + 2cd cos Θ + d2 Rπ = 0 = Mit der Transformation φ = Θ 2 erhalten wir Z π 1 √ dΘ 2 c + 2cd cos Θ + d2 0 Rπ =2 =2 R π 2 0 √ √ 0 π 2 R 1 dΘ (c+d)2 −2cd(1−cos Θ) 0 √ 1 (c+d)2 −4cd sin2 √ Θ 2 dΘ 1 dφ (c+d)2 −4cd sin2 φ 1 dφ (c+d)2 cos2 φ+(c−d)2 sin2 φ Andererseits gilt für c > d Z π Z π2 1 1 √ q dΘ = 2 dφ 2 2 c + 2cd cos Θ + d 0 0 c2 cos2 φ + (c2 − d2 ) sin2 φ ψ−Θ r c c sin Θ ψ Θ c cos Θ Halbkreis mit Radius c Es gilt r2 = (c sin Θ)2 + (d + c cos Θ)2 = c2 + cd cos Θ + d2 tan ψ = c sin Θ c cos Θ+d r= sin(Θ − ψ) = Damit folgt und d c c cos Θ+d cos ψ sin ψ d d c sin Θ tan ψ = dΘ dΘ c cos Θ + d 1 dψ c2 cos2 Θ + cd cos Θ + c2 sin2 Θ = 2 cos ψ dΘ (c cos Θ + d)2 6.1. ZUSAMMENHÄNGENDE MENGEN IM RN 327 c2 sin2 Θ c cos Θ + d dψ = c cos Θ + = c cos Θ + c sin Θ tan ψ cos2 ψ dΘ c cos Θ + d c cos Θ + d dψ = c cos Θ cos ψ + c sin Θ sin ψ = c cos(ψ − Θ) cos ψ dΘ p dψ dψ = c2 + 2cd cos Θ + d2 c cos(ψ − Θ) = r dΘ dΘ Hiermit folgt Z π 0 √ 1 dΘ = 2 c + 2cd cos Θ + d2 π Z 0 1 dψ dΘ = c cos(ψ − Θ) dΘ Z π 0 1 dψ c cos(ψ − Θ) wobei Θ = Θ(ψ). Aus der Skizze ist |ψ −Θ| < π2 und damit cos(ψ −Θ) > 0 zu entnehmen. Deshalb ist das letzte Integral gleich Z Z 1 π 1 π 1 1 q q dψ = dψ 2 c 0 c 0 1 − dc2 sin2 ψ 1 − sin2 (ψ − Θ) Z π2 1 p = 2 dψ 0 c2 − d2 sin2 ψ Z π2 1 q dψ = 2 0 (c2 − d2 ) sin2 ψ + c2 cos2 ψ Es folgt π 2 Z 1 q 0 Z (c + d)2 cos2 φ + (c − d)2 sin2 φ π 2 dφ = 1 q 0 (c2 − d2 ) sin2 ψ + c2 cos2 ψ dψ Nun setzen wir a = c + d und b = c − d. Damit gilt c2 − d2 = (c + d)(c − d) = ab Also gilt π 2 Z 0 c= 1 p dt = 2 2 a cos t + b2 sin2 t (c + d) + (c − d) a+b = 2 2 π 2 Z 1 q 0 2 ( a+b 2 ) cos2 t + ab sin2 t dt Hiermit können wir nun zeigen, dass die Grenzwerte von an , n ∈ N, und bn , n ∈ N, gleich agm sind. Mit Induktion folgt für n = 1, 2, . . . Z π 2 0 1 Z p dt = a2 cos2 t + b2 sin2 t 0 π 2 1 q a2n cos2 t + b2n sin2 t dt Es folgt weiter Z 0 π 2 1 p a2 cos2 t+ π 2 Z b2 2 sin t dt = lim n→∞ Z lim q n→∞ 0 Z 0 a2n cos2 t + b2n sin2 t π 2 = = 0 1 q 1 a2n cos2 t + b2n sin2 t π 2 dt dt 1 q limn→∞ a2n cos2 t + limn→∞ b2n sin2 t dt 328 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Da die Grenzwerte der Folgen gleich sind, folgt weiter Z π2 Z π2 1 1 1 1 π p p dt = dt = . 2 2 2 2 2 2 lim a lim a n→∞ n 0 n→∞ n 2 0 a cos t + b sin t cos t + sin t 2 Zum Schluss noch ein Auszug aus dem Buch ”Einführung in die informationstheoretische Ästhetik” von M. Bense [Ben, p.88-89]. In dem Abschnitt ”Texttopologie” schreibt er: Wie die mathematische Disziplin der Topologie sich mit Mengen von Elementen, etwa Punkten, befaßt, deren Gesamtheiten als Räume bezeichnet werden, versucht die Texttopologie in entsprechender Weise von Texten als Worträumen zu sprechen, deren Elemente Wörter oder andere linguistische Elemente wie etwa Buchstaben des Alphabets oder Morpheme sind...... Die topologische Struktur eines Textes - die texttopologische Struktur - kann allgemein als das System der Umgebungen seiner Wörter und damit natürlich auch als ein System der Teilmengen des allgemeinen zugrundeliegenden Wortraumes, also des Textes aller Texte, aufgefaßt werden. Ich sagte bereits, dass Texte Zusammenhänge von Wörtern formulieren. Die Frage nach der Struktur eines Zusammenhangs ist eine ausgesprochen topologische Frage. Doch setzt der Sinn dieser Frage einen anderen, ebenso wichtigen Begriff der Topologie voraus, den Begriff der offenen bzw. abgeschlossenen Menge. Der Begriff <abgeschlossen> fungiert in der Topologie einfach als Komplement zum Begriff <offen>, aber man sollte beide nicht allzu eng mit bildlichen Vorstellungen verbinden. Vielleicht ist es gut, daran zu erinnern, daß der Begriff offene Menge etwa in dem Sinne verwendet wird, wie man <offenes Meer> sagt und daran denkt, daß sich sein Horizont in einem gewissen Sinne immer weiter hinausschiebt. Jedenfalls soll der Begriff Offenheit einer Menge oder eines Raumes zum Ausdruck bringen, daß noch eine Ergänzung möglich ist, die erst die Abgeschlossenheit erzeugt. Die topologische Definition des Zusammenhangs besagt nun, daß eine Menge zusammenhängend genannt werden darf, wenn sie nicht in zwei offene oder, was damit gleichbedeutend wäre, in zwei abgeschlossene Teilmengen zerlegbar ist. Überträgt man diesen Aspekt auf Texte, so muß von zwei Wörtern oder sprachlichen Ausdrücken, die einen Text bilden sollen, der eine Teil als offen bezeichnet werden können und der der andere als abgeschlossen, damit von einem Zusammenhang die Rede sein kann. Daß das möglich ist, erkennt man am Beispiel eines elementaren Satzes wie <Das Meer ist grün>. Der Subjektteil des Satzes,<Das Meer>, kannn als abgeschlossener Ausdruck angesehen werden; er ist keiner Ergänzung bedürftig, um sinnvoll zu sein; er hat eine klaren Objektbezug. Der Prädikatteil des Satzes hingegen <ist grün> muß als offener Ausdruck betrachtet werden; der Logiker Frege bezeichnete das Prädikat als <ungesättigten Ausdruck>; tatsächlich fungiert ein Prädikat erst im Hinblick auf das Subjekt sinnvoll. Der Satz <Das Meer is grün> bildet daher im texttopologischen Sinne einen Zusammenhang, weil er nicht in zwei offene oder abgeschlossene Teilmengen zerlegbar ist, sondern in eine abgeschlossene und in eine offene. 6.2. RICHTUNGSSTETIGKEIT, RICHTUNGSABLEITUNG UND PARTIELLE ABLEITUNGEN329 6.2 Richtungsstetigkeit, Richtungsableitung und Partielle Ableitungen Eine Richtung im Rn ist durch einen Vektor ξ ∈ Rn mit kξk2 = n X i=1 ! 21 |ξi |2 =1 gegeben. Definition 6.2.1 Es sei U eine offene Teilmenge vom Rn . Eine Funktion f : U → R heißt in x0 ∈ U in Richtung ξ stetig, falls es ein η > 0 gibt, so dass die Funktion g : (−η, η) → R mit g(t) = f (x0 + tξ) in 0 stetig ist. gilt Äquivalent kann man sagen: Für alle reelle Folgen hk , k ∈ N, mit limk→∞ hk = 0 lim f (x0 + hk ξ) = f (x0 ). k→∞ Falls f in x0 stetig ist, so ist f auch in jede Richtung stetig. Die Umkehrung gilt nicht, wie das erste Beispiel belegt. Beispiel 6.2.1 Es sei f : R2 → R durch ( 1 f (x, y) = 0 falls y = x2 und x > 0 sonst gegeben. f ist in (0, 0) nicht stetig, aber f ist in (0, 0) in jede Richtung stetig. Beweis. Für die Folge ( k1 , k12 ), k ∈ N, gilt f ( k1 , k12 ) = 1. Es folgt lim f ( k1 , k12 ) = 1 6= 0 = f (0, 0). k→∞ Damit ist f in (0, 0) nicht stetig. 2 Definition 6.2.2 Es sei U eine offene Teilmenge des Rn . Eine Funktion f : U → R heißt in x0 ∈ U in Richtung ξ differenzierbar, falls ∂f f (x0 + hξ) − f (x0 ) (x0 ) = lim h→0 ∂ξ h existiert. Wir nennen diesen Wert die Richtungsableitung von f in Richtung ξ. 330 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Es seien ei = (0, . . . , 0, 1, 0 . . . , 0) i = 1, . . . , n die Einheitsvektoren. Die Richtungsableitung von f in Richtung ei wird als die i-te partielle Ableitung bezeichnet und mit ∂f (x0 ) ∂xi i = 1, . . . , n notiert. Dies ist also gleich der Ableitung der Funktion g : (x0 (i) − η, x0 (i) + η) → R mit g(t) = f (x0 (1), . . . , x0 (i − 1), t, x0 (i + 1), . . . , x0 (n)) im Punkt t = x0 (i). Beispiel 6.2.2 (i) Es sei f : R2 → R mit f (x, y) = exy . Dann gilt ∂f = yexy ∂x ∂f = xexy ∂y (ii) Es sei f : R2 → R mit f (x, y) = sin(xy). Dann gilt ∂f = x cos(xy) ∂y ∂f = y cos(xy) ∂x sin(xy) 1 0.5 2 0 1 -0.5 -1 -2 0 -1 -1 0 1 2 -2 (iii) Es sei f : R2 → R mit f (x, y) = x2 y 3 . Dann gilt ∂f = 2xy 3 ∂x ∂f = 3x2 y 2 ∂y 6.3. DIFFERENZIERBARKEIT IM RN 331 (iv) Es sei f : R2 → R mit ( f (x, y) = 1 falls x = 0 oder y = 0 0 sonst Dann ist f nicht in (0, 0) stetig, aber die partiellen Ableitungen existieren in (0, 0) und es gelten ∂f (0, 0) = 0 ∂x und ∂f (0, 0) = 0. ∂y Beweis. (iv) Wir zeigen, dass f nicht in (0, 0) stetig ist. Es gelten f (0, 0) = 1 und lim f ( k1 , k1 ) = 0. k→∞ 2 Es sei U eine offene Teilmenge vom Rn und x0 ∈ U. Die Funktion f : U → R sei in x0 partiell differenzierbar, d.h. die partiellen Ableitungen existieren. Der Vektor ∂f ∂f (x0 ), . . . , (x0 ) grad f (x0 ) = ∂x1 ∂xn heißt Gradient von f . Wir schreiben auch ∇f (x0 ) für grad f (x0 ). Der Ausdruck ∇ wird Nabla genannt, weil er die Form eines harfenähnlichen jüdischen Saiteninstrumentes hat. 6.3 Differenzierbarkeit im Rn Wir führen hier die Differenzierbarkeit von Funktionen mehrerer Veränderlicher ein. Dabei zeigen wir, dass sich die Ableitung einer Funktion die Matrix ihrer partiellen Ableitungen ist. Eine wichtige Frage ist, wie man leicht nachweist, dass eine gegebene Funktion differenzierbar ist. Satz 6.3.4 stellt sicher, dass eine Funktion differenzierbar ist, wenn ihre partiellen Ableitungen stetig sind. Definition 6.3.1 Es sei U eine offene Teilmenge des Rn und x0 ∈ U. Eine Funktion f : U → R heißt differenzierbar (oder auch total differenzierbar) in x0 , falls es eine lineare Abbildung T : Rn → R gibt, so dass (6.1) f (x0 + h) − f (x0 ) − T h =0 h→0 khk lim gilt. Die lineare Abbildung T heißt das Differential oder auch totales Differential von f . Wir schreiben für T auch df (x0 ). Die Bedingung (6.1) lässt sich auch anders schreiben: Es gibt eine lineare Abbildung T : Rn → R, eine Umgebung V(x0 ) von x0 und eine Abbildung R : V(x0 ) → R, so dass für alle h mit x0 + h ∈ V(x0 ) f (x0 + h) − f (x0 ) = T h + R(h), 332 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN und lim h→0 R(h) =0 khk gelten. Die Äquivalenz zur Definition der Differenzierbarkeit ergibt sich, indem man R(h) = f (x0 + h) − f (x0 ) − T h wählt. Die Matrixdarstellung (T (e1 ), . . . , T (en )) von T bzgl. der Standardbasis e1 , . . . , en des Rn bezeichnen wir als die Ableitung von f im Punkt x0 . Wir schreiben dafür auch (df (x0 )(e1 ), . . . , df (x0 )(en )). Wir schreiben für die Ableitung an der Stelle x0 auch df df (x0 ) (x0 ) bzw. dx dx df . und für die Funktion, die einem Punkt die Ableitung zuordnet dx Wenn wir T in der Matrixdarstellung bzgl. der Standardbasis e1 , . . . , en betrachten, dann nimmt die Definition der Differenzierbarkeit die folgende Form an: Es sei U eine offene Teilmenge des Rn und x0 ∈ U. Eine Funktion f : U → R heißt differenzierbar in x0 , falls es einen Vektor c = (c1 , . . . , cn ) ∈ Rn , eine Umgebung V(x0 ) und eine Funktion φ : V(x0 ) → R gibt, so dass für alle x ∈ V(x0 ) f (x) = f (x0 )+ < c, x − x0 > +φ(x)kx − x0 k und φ(x0 ) = lim φ(x) = 0 x→x0 gelten. Der Vektor c ist Ableitung von f in x0 . Als geometrische Interpretation für die Ableitung einer Funktion f : R → R hatten wir angegeben, dass f durch eine Gerade approximiert werden kann. Für eine Funktion f : Rn → R kann man sagen, dass der Graph von f durch eine Ebene approximiert werden kann. Satz 6.3.1 Es sei U eine offene Teilmenge des Rn und x0 ∈ U. Die Funktion f : U → R sei in x0 differenzierbar. Dann existieren alle partiellen Ableitungen und die Ableitung von f in x0 ist ∂f ∂f (x0 ), . . . , (x0 ) ∂x1 ∂xn Beweis. Es sei V(x0 ) eine Umgebung von x0 , so dass für alle x ∈ V(x0 ) f (x) = f (x0 )+ < c, x − x0 > +φ(x)kx − x0 k gilt. Wir setzen x = x0 + hek . Dann gilt f (x0 + hek ) = f (x0 )+ < c, hek > +φ(x0 + hek )khek k = f (x0 ) + hck + |h|φ(x0 + hek ). 6.3. DIFFERENZIERBARKEIT IM RN 333 Es folgt |h| f (x0 + hek ) − f (x0 ) = ck + φ(x0 + hek ). h h Wegen limx→x0 φ(x) = 0 folgt f (x0 + hek ) − f (x0 ) |h| ∂f (x0 ) = lim = ck + lim φ(x0 + hek ) = ck . h→0 h→0 h ∂xk h Bemerkung 6.3.1 Es sei U eine offene Teilmenge des Rn und x0 ∈ U. Die Funktion f : U → R sei in x0 differenzierbar. Dann ist f in jede Richtung ξ, kξk2 = 1, differenzierbar und die Richtungsableitung erfüllt ∂f (x0 ) =< ∇f (x0 ), ξ > ∂ξ und ∂f (x0 ) ≤ k∇f (x0 )k2 = ∂ξ 2 ! 21 n X ∂f . (x ) 0 ∂xi i=1 Beweis. Mit Satz 6.3.1 folgt f (x) = f (x0 )+ < ∇f (x0 ), x − x0 > +φ(x)kx − x0 k. Mit x = x0 + hξ erhalten wir f (x0 + hξ) = f (x0 )+ < ∇f (x0 ), hξ > +φ(x0 + hξ)khξk = f (x0 ) + h < ∇f (x0 ), ξ > +|h|φ(x0 + hξ). Es folgt f (x0 + hξ) − f (x0 ) |h| =< ∇f (x0 ), ξ > + φ(x0 + hξ). h h Damit erhalten wir f (x0 + hξ) − f (x0 ) ∂f (x0 ) = lim =< ∇f (x0 ), ξ > . h→0 ∂ξ h Die Abschätzung folgt mit der Abschätzung von Cauchy-Schwarz, ∂f (x0 ) = |< ∇f (x0 ), ξ >| ≤ k∇f (x0 )k2 kξk2 = k∇f (x0 )k2 ∂ξ 2 Falls eine Funktion in einem Punkt in jede Richtung differenzierbar ist, so muss sie nicht notwendig in diesem Punkt differenzierbar sein. Die Funktion von Beispiel 6.2.1 ist in (0, 0) in jede Richtung differenzierbar, aber nicht in (0, 0) differenzierbar. 334 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Die Bemerkung zeigt, dass die Richtung ξ= ∇f (x0 ) k∇f (x0 )k ∇f (x0 ) gilt die Richtung des größten Anstiegs ist. Für ξ = k∇f (x0 )k ∂f ∇f (x0 ) (x0 ) = ∇f (x0 ), = k∇f (x0 )k ∂ξ k∇f (x0 )k während für beliebige ξ ∂f (x0 ) ≤ k∇f (x0 )k ∂ξ gilt. Satz 6.3.2 Es sei U eine offene Teilmenge des Rn und f : U → R sei in x0 differenzierbar. Dann existiert zu jedem > 0 ein δ > 0, so dass für alle x ∈ U mit kx − x0 k2 < δ |f (x) − f (x0 )| ≤ (k∇f (x0 )k2 + )kx − x0 k2 . Beweis. Es gilt f (x) = f (x0 )+ < ∇f (x0 ), x − x0 > +φ(x)kx − x0 k2 . Da limx→x0 φ(x) = 0 gilt, gibt es ein δ > 0, so dass für alle x mit kx − x0 k2 < δ die Abschätzung |φ(x)| < gilt. Es ergibt sich |f (x) − f (x0 )| ≤ | < ∇f (x0 ), x − x0 > | + kx − x0 k2 ≤ k∇f (x0 )k2 kx − x0 k2 + kx − x0 k2 . 2 Satz 6.3.3 Es sei U eine offene Teilmenge des Rn und f : U → R sei in x0 differenzierbar. Dann ist f in x0 stetig. Beweis. Nach Satz 6.3.2 gibt es ein δ0 , so dass für alle x mit kx − x0 k2 < δ0 |f (x) − f (x0 )| ≤ (k∇f (x0 )k2 + 1)kx − x0 k2 gilt. Zu gegebenem wählen wir δ = min δ0 , k∇f (x0 )k2 + 1 . Dann gilt für alle x mit kx − x0 k2 < δ |f (x) − f (x0 )| ≤ (k∇f (x0 )k2 + 1)kx − x0 k2 < (k∇f (x0 )k2 + 1)δ = . 2 6.3. DIFFERENZIERBARKEIT IM RN 335 Satz 6.3.4 Es sei U eine offene Teilmenge des Rn und f : U → R. Es existiere eine Umgebung V(x0 ) mit V(x0 ) ⊂ U, so dass die partiellen Ableitungen ∂f : V(x0 ) → R ∂xi i = 1, . . . , n existieren und in x0 stetig sind. Dann ist f in x0 differenzierbar. Mit Satz 6.3.4 kann man in den meisten Fällen nachweisen, dass eine Funktion differenzierbar ist. Zum richtigen Verständnis sei hier noch einmal betont: Man ∂f muss nachweisen, dass ∂x als Funktion von V(x0 ) nach R, also als Funktion von n i ∂f wird als Funktion von n Variablen aufgefasst. Veränderlichen in x0 stetig ist. ∂x i Beweis. Es sei t ∈ Rn . Dann gilt f (x0 + t) = f (x0 ) +f (x0 (1) + t(1), x0 (2), . . . , x0 (n)) − f (x0 ) .. . +f (x0 (1) + t(1), . . . , x0 (k) + t(k), x0 (k + 1), . . . , x0 (n)) −f (x0 (1) + t(1), . . . , x0 (k − 1) + t(k − 1), x0 (k), . . . , x0 (n)) .. . f (x0 (1) + t(1), . . . , x0 (n) + t(n)) −f (x0 (1) + t(1), . . . , x0 (n − 1) + t(n − 1), x0 (n)). Also f (x0 + t) = f (x0 ) + n X (f (x0 (1) + t(1), . . . , x0 (k) + t(k), x0 (k + 1), . . . , x0 (n)) k=1 −f (x0 (1) + t(1), . . . , x0 (k − 1) + t(k − 1), x0 (k), . . . , x0 (n))) Dies nennt man eine Teleskopsumme. Wir wenden nun den Mittelwertsatz der Differentialrechnung (Satz 3.6.2) auf die Funktionen gk : [x0 (k), x0 (k) + t(k)] → R, k = 1, . . . , n mit gk (s) = f (x0 (1) + t(1), . . . , x0 (k − 1) + t(k − 1), s, x0 (k + 1), . . . , x0 (n)) an. Nach dem Mittelwertsatz gibt es für alle k = 1, . . . , n ξk ∈ (x0 (k), x0 (k) + t(k)) mit gk (x0 (k) + t(k)) − gk (x0 (k)) t(k) 1 = (f (x0 (1) + t(1), . . . , x0 (k) + t(k), x0 (k + 1), . . . , x0 (n)) t(k) −f (x0 (1) + t(1), . . . , x0 (k − 1) + t(k − 1), x0 (k), . . . , x0 (n))). gk0 (ξk ) = 336 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Hieraus folgt sofort für alle k = 1, . . . , n f (x0 (1) + t(1), . . . , x0 (k) + t(k), x0 (k + 1), . . . , x0 (n)) −f (x0 (1) + t(1), . . . , x0 (k − 1) + t(k − 1), x0 (k), . . . , x0 (n)) ∂f (x0 (1) + t(1), . . . , x0 (k − 1) + t(k − 1), ξk , x0 (k + 1), . . . , x0 (n)). = t(k) ∂xk Damit folgt f (x0 + t) = f (x0 ) n X ∂f (x0 (1) + t(1), . . . , x0 (k − 1) + t(k − 1), ξk , x0 (k + 1), . . . , x0 (n)). + t(k) ∂x k k=1 Also gilt f (x0 + t) − f (x0 ) − = n X t(k) k=1 n X k=1 t(k) ∂f (x0 ) ∂xk ∂f (x0 (1) + t(1), . . . , x0 (k − 1) + t(k − 1), ξk , x0 (k + 1), . . . , x0 (n)) ∂xk ∂f (x0 ) . − ∂xk Wir setzen nun φ(x0 + t) n X t(k) ∂f = (x0 (1) + t(1), . . . , x0 (k − 1) + t(k − 1), ξk , x0 (k + 1), . . . , x0 (n)) ktk ∂xk k=1 ∂f − (x0 ) . ∂xk Wegen der Stetigkeit der partiellen Ableitungen gilt lim φ(x0 + t) = 0 t→0 und es folgt f (x0 + t) − f (x0 ) − n X k=1 t(k) ∂f (x0 ) = ktkφ(x0 + t). ∂xk 2 Beispiel 6.3.1 (i) Es sei f : R2 → R mit f (x, y) = exy . Dann ist f auf R2 differenzierbar und die Ableitung ist ∂f ∂f , = (yexy , xexy ). ∂x ∂y 6.3. DIFFERENZIERBARKEIT IM RN 337 (ii) Es sei f : R2 → R mit f (x, y) = sin(xy). Dann ist f auf R2 differenzierbar und die Ableitung ist ∂f ∂f , = (y cos(xy), x cos(xy)). ∂x ∂y (iii) Es sei f : (0, ∞) × R → R durch f (x, y) = xy gegeben. Dann ist f differenzierbar und die Ableitung ist ∂f ∂f , = (yxy−1 , (ln x)xy ). ∂x ∂y In allen Fällen reicht es die Stetigkeit der partiellen Ableitungen nachzuprüfen und Satz 6.3.4 anzuwenden. Beweis. (i) Wir zeigen, dass die partiellen Ableitungen stetig sind. Die Abbildungen p, q : R2 → R mit p(x, y) = x und q(x, y) = y sind stetig. Produkte von stetigen Funktionen sind stetig, also ist p · q mit p · q(x, y) = x · y stetig. Hintereinanderausführungen von stetigen Funktionen sind stetig. Deshalb ist ep·q stetig. 2 Ein Beispiel einer Funktion, die in einem Punkt differenzierbar ist, die partiellen Ableitungen aber unstetig sind, ist das folgende. Es ist eine Variation eines Beispiels für Funktionen von R nach R (Beispiel 3.5.3). Beispiel 6.3.2 Es sei f : R2 → R durch 2 1 (x + y 2 ) sin x2 +y2 f (x, y) = 0 (x, y) 6= (0, 0) (x, y) = (0, 0) gegeben. Die Funktion ist überall differenzierbar, die partiellen Ableitungen sind nur in (0, 0) unstetig. Beweis. Die Funktion ist überall differenzierbar. Die partiellen Ableitungen existieren überall und sind bis auf (0, 0) überall stetig. Die partiellen Ableitungen für (x, y) 6= (0, 0) sind 1 2x 1 ∂f = 2x sin 2 − 2 cos 2 ∂x x + y2 x + y2 x + y2 ∂f 1 2y 1 = 2y sin 2 − 2 cos 2 2 2 ∂y x +y x +y x + y2 Die partiellen Ableitungen sind stetig in allen (x, y) 6= (0, 0). Damit ist f für (x, y) 6= (0, 0) differenzierbar. Wir zeigen nun, dass f in (0, 0) differenzierbar ist und die Ableitung (0, 0). 1 1 f (x, y) − f (0, 0) p = (x2 + y 2 ) 2 sin 2 2 2 x + y2 x +y Nun benutzen wir | sin t| ≤ 1 Also f (x, y) − f (0, 0) p p ≤ x2 + y 2 x2 + y 2 Insbesondere folgt, dass die partiellen Ableitungen in (0, 0) gleich 0 sind. 338 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Im Nullpunkt sind die partiellen Ableitungen nicht stetig. Wir zeigen, dass stetig ist. Dazu betrachten wir die Folge 1 0, √ . 2πk k∈N Es gilt ∂f ∂y 0, √ 1 2πk =√ ∂f ∂y in (0, 0) nicht √ √ 2 sin(2πk) − 2 2πk cos(2πk) = −2 2πk 2πk Diese Folge konvergiert nicht gegen 0. Die Unstetigkeit von ∂f ∂y in (0, 0) wird genau so bewiesen, wir betrachten dazu die Folge √ 1 ,0 . 2πk k∈N 2 Beispiel 6.3.3 Es sei f : R2 → R mit 0 f (x, y) = q y2 y x2 +y 2 x=y=0 falls sonst Dann ist f überall stetig und bis auf den Punkt (0, 0) differenzierbar. Die partiellen Ableitungen existieren überall. Beweis. f ist überall stetig. f ist überall, bis auf den Punkt (0, 0) differenzierbar. Die partiellen Ableitungen existieren überall. Wir berechnen die partiellen Ableitungen. Für (x, y) 6= (0, 0) gelten s |y| ∂f x2 |y| ∂f y2 (x, y) = −xy und (x, y) = + 3 3 . ∂x ∂y x2 + y 2 (x2 + y 2 ) 2 (x2 + y 2 ) 2 Außerhalb des Nullpunktes sind die partiellen Ableitungen stetig und damit ist f dort differenzierbar. Insbesondere ist f außerhalb des Nullpunktes stetig. Wir berechnen die partiellen Ableitungen in (0, 0). Es gilt f (x, 0) = 0 und f (0, y) = y. Also folgt ∂f ∂f (0, 0) = 0 (0, 0) = 1 ∂x ∂y Wir zeigen nun, dass f in (0, 0) nicht differenzierbar ist. Wir nehmen an, dass f in (0, 0) differenzierbar ist. Dann gilt ∂f 1 1 1 1 1 = ∇f (0, 0), ( √ , √ ) = (0, 1), ( √ , √ ) = √ . 1 √1 √ ∂( 2 , 2 ) 2 2 2 2 2 Andererseite lässt sich die Richtungsableitung direkt berechnen ∂f 1 √1 √ ∂( 2 , 2 ) = lim t→0 f ( √t2 , √t2 ) − f (0, 0) t 1 t t 1 t = lim f ( √ , √ ) = lim √ t→0 t t→0 t 2 2 2 Dies ist ein Widerspruch. s t2 2 t2 2 + t2 2 = 1 2 6.4. PARTIELLE ABLEITUNGEN HÖHERER ORDNUNG 339 f ist in (0, 0) stetig, weil s |f (0, 0) − f (x, y)| = |y| x2 y2 ≤ |y|. + y2 2 Beispiel 6.3.4 Es sei U eine offene Teilmenge des Rn und f : U → R in x0 differenzierbar. Wir bezeichnen die n-dimensionale Hyperebene, die durch x(n + 1) − f (x0 ) = n X ∂f (x0 )(x(k) − x0 (k)) ∂xk k=1 gegeben ist, als die Tangentialhyperebene an den Graphen von f im Punkt (x0 , f (x0 )). 6.4 Partielle Ableitungen höherer Ordnung Otto Hesse wurde am 22. April 1811 in Königsberg geboren und er starb am 4. August 1874 in München. Er studierte in Königsberg. Er lehrte in Königsberg, Halle, Heidelberg und München. Wissenschaftlich beschäftigte er sich mit der analytischen Geometrie und Determinanten. Hermann Amandus Schwarz wurde am 25. Januar 1843 in Hermsdorf in Schlesien geboren und erstarb am 30. November 1921 in Berlin. Schwarz arbeitete auf dem Gebiet der Funktionentheorie und der Theorie der Minimalflächen. Es sei U eine offene Teilmenge des Rn und f : U → R eine Funktion, deren ∂f auf U existiert. Diese partielle Ableitung ist eine Funktion partielle Ableitung ∂x i auf U. Falls die partielle Ableitung dieser Funktion in x0 nach der j-ten Koordinate existiert, so bezeichnen wir diese mit ∂ 2f (x0 ) ∂xj ∂xi Entsprechend definieren wir höhere Ableitungen. Falls die partielle Ableitung von f nach xk1 , . . . , xk` auf U existiert und die partielle Ableitung dieser Funktion in x0 nach der Variablen xk`+1 existiert, dann bezeichnen wir diese mit ∂ `+1 f (x0 ) ∂xk`+1 , . . . , ∂xk1 Falls alle partiellen Ableitungen der Ordnung ` existieren und auf einer offenen Menge U stetig sind, dann heißt f `-mal stetig differenzierbar. C ` (U)ist der Vektorraum aller `-mal stetig differenzierbaren Funktionen auf U. Im Allgemeinen kommt es bei der Bildung höherer partieller Ableitungen darauf an, in welcher Reihenfolge man differenziert. In vielen Fällen besteht Unabhängigkeit von der Reihenfolge. Man bezeichnet die Matrix ∂2f ∂2f ∂2f · · · 2 ∂x1 ∂x2 ∂x1 ∂xn ∂x ∂ 2 f1 ∂2f ∂2f ∂x2 ∂x1 · · · 2 ∂x2 ∂xn ∂x2 .. .. .. . . . ∂2f ∂2f ∂2f ··· ∂xn ∂x1 ∂xn ∂x2 ∂x2 n 340 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN als Hesse Matrix. Für die Hesse Matrix von f wird auch die Bezeichnung ∇2 f benutzt. Beispiel 6.4.1 Es sei f : R3 → R durch f (x, y, z) = 3x2 y − z 3 + x2 − 3y 7 − x6 z 3 gegeben. Dann gilt ∂f = 6xy + 2x − 6x5 z 3 ∂x und ∂2f ∂x2 ∂2f ∂y∂x ∂2f ∂z∂x ∂2f ∂x∂y ∂2f ∂y 2 ∂2f ∂z∂y ∂2f ∂x∂z ∂2f ∂y∂z ∂2f ∂z 2 ∂f = 3x2 − 21y 6 ∂y 6y + 2 − 30x4 z 3 6x = −18x5 z 2 ∂f = −3z 2 − 3x6 z 2 ∂z 6x −126y 5 0 −18x5 z 2 0 6 −6z − 6x z Satz 6.4.1 (Hermann Amandus Schwarz) Es sei U eine offene Teilmenge des Rn , w ∈ U und f : U → R besitze zweite partielle Ableitungen, die in w stetig sind. Dann gilt für alle i, j = 1, . . . , n ∂ 2f ∂ 2f (w) = (w). ∂xi ∂xj ∂xj ∂xi Beweis. Wir nehmen an, dass i < j. Wir zeigen, dass für alle hi und hj reelle Zahlen Θi und Θj mit 0 < Θi , Θj < 1 und f (w1 , . . . , wi−1 , wi + hi , wi+1 , . . . , wj−1 , wj + hj , wj+1 , . . . , wn ) −f (w1 , . . . , wj−1 , wj + hj , wj+1 , . . . , wn ) (6.2) −f (w1 , . . . , wi−1 , wi + hi , wi+1 , . . . , wn ) + f (w) ∂ 2f = hi hj (w1 , . . . , wi−1 , wi + Θi hi , wi+1 , . . . , wj−1 , wj + Θj hj , wj+1 , . . . , wn ) ∂xi ∂xj existieren. Genauso zeigen wir, dass es Θ̃i und Θ̃j gibt, so dass f (w1 , . . . , wi−1 , wi + hi , wi+1 , . . . , wj−1 , wj + hj , wj+1 , . . . , wn ) −f (w1 , . . . , wj−1 , wj + hj , wj+1 , . . . , wn ) (6.3) −f (w1 , . . . , wi−1 , wi + hi , wi+1 , . . . , wn ) + f (w) ∂ 2f = hi hj (w1 , . . . , wi−1 , wi + Θ̃i hi , wi+1 , . . . , wj−1 , wj + Θ̃j hj , wj+1 , . . . , wn ). ∂xj ∂xi Aus (6.2) und (6.3) folgt, dass es für alle hi und hj reelle Zahlen Θi , Θj , Θ̃i , Θ̃j mit 0 < Θi , Θj , Θ̃i , Θ̃j < 1 und ∂ 2f (w1 , . . . , wi−1 , wi + Θi hi , wi+1 , . . . , wj−1 , wj + Θj hj , wj+1 , . . . , wn ) ∂xi ∂xj ∂ 2f = (w1 , . . . , wi−1 , wi + Θ̃i hi , wi+1 , . . . , wj−1 , wj + Θ̃j hj , wj+1 , . . . , wn ). ∂xj ∂xi 6.4. PARTIELLE ABLEITUNGEN HÖHERER ORDNUNG gibt. Wegen der Stetigkeit von ∂2f ∂xi ∂xj und ∂2f ∂xj ∂xi 341 im Punkt w folgt ∂ 2f ∂ 2f (w) = (w). ∂xi ∂xj ∂xj ∂xi Wir zeigen nun (6.2). Dazu wenden wir den Mittelwersatz (Satz 3.6.2) auf die Funktion φ : [wj , wj + hj ] → R φ(t) = f (w1 , . . . , wi−1 , wi + hi , wi+1 , . . . , wj−1 , t, wj+1 , . . . , wn ) −f (w1 , . . . , wj−1 , t, wj+1 , . . . , wn ) an. Es gibt Θj mit 0 < Θj < 1, so dass φ0 (wj + Θj hj ) = φ(wj + hj ) − φ(wj ) . hj Dies bedeutet aber f (w1 , . . . , wi−1 , wi + hi , wi+1 , . . . , wj−1 , wj + hj , wj+1 , . . . , wn ) −f (w1 , . . . , wj−1 , wj + hj , wj+1 , . . . , wn ) −f (w1 , . . . , wi−1 , wi + hi , wi+1 , . . . , wn ) + f (w) ∂f = hj (w1 , . . . , wi−1 , wi + hi , wi+1 , . . . , wj−1 , wj + Θj hj , wj+1 , . . . , wn ) ∂xj ∂f (w1 , . . . , wj−1 , wj + Θj hj , wj+1 , . . . , wn ) . − ∂xj Wir wenden den Mittelwertsatz ein weiteres Mal an, dieses Mal auf die Funktion ψ : [wi , wi + hi ] → R ψ(t) = ∂f (w1 , . . . , wi−1 , t, wi+1 , . . . , wj−1 , wj + Θj hj , wj+1 , . . . , wn ). ∂xj Es gibt ein Θi mit 0 < Θi < 1 und ψ 0 (wi + Θi hi ) = ψ(wi + hi ) − ψ(wi ) hi Wir erhalten (6.2). Die Gleichung (6.3) wird genauso bewiesen. 2 Beispiel 6.4.2 Es sei f : R2 → R 0 2 2 f (x, y) = xy x − y 2 x + y2 falls x=y=0 sonst f ist in (0, 0) differenzierbar, die partiellen Ableitungen zweiter Ordnung existieren für alle (x, y) ∈ R2 und sind unstetig in (0, 0) und ∂2f ∂2f (0, 0) 6= (0, 0). ∂x∂y ∂y∂x 342 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Beweis. Für (x, y) 6= (0, 0) existieren die partiellen Ableitungen und man erhält sie durch direktes Differenzieren. Für x = 0 oder y = 0 gilt f (0, y) = f (x, 0) = 0. Wir erhalten falls x = y = 0 0 ∂f 4 2 2 4 (x, y) = y x + 4x y − y ∂x sonst (x2 + y 2 )2 falls x = y = 0 0 ∂f 4 2 2 4 (x, y) = x x − 4x y − y ∂y sonst (x2 + y 2 )2 Für die zweiten partiellen Ableitungen erhalten wir −1 2 ∂ f = (x2 − y 2 )(x4 + 10x2 y 2 + y 4 ) ∂x∂y (x2 + y 2 )3 1 2 ∂ f = (x2 − y 2 )(x4 + 10x2 y 2 + y 4 ) ∂y∂x (x2 + y 2 )3 falls x = y = 0 sonst falls x = y = 0 sonst f ist in (0, 0) differenzierbar, weil die partiellen Ableitungen dort stetig sind. Da ∂2f ∂2f (0, 0) = 1 6= −1 = (0, 0) ∂y∂x ∂x∂y gilt, muss mindestens eine der zweiten partiellen Ableitungen unstetig sein. Wir rechnen dies elementar nach. Für alle n ∈ N gilt ∂2f 1 1 ( , )=0 ∂x∂y n n ∂2f 1 ( , 0) = 1 ∂x∂y n 2 Beispiel 6.4.3 Eine Funktion f : Rn → R ist konvex, wenn für alle x, y ∈ Rn und alle t ∈ [0, 1] f ((1 − t)x + ty) ≤ (1 − t)f (x) + tf (y) gilt. (i) eine differenzierbare Funktion f : Rn → R ist genau dann konvex, wenn für alle x, y ∈ Rn f (x) + h∇f (x), y − xi ≤ f (y) gilt. (ii) Eine zweimal stetig differenzierbare Funktion f : Rn → R ist genau dann konvex, wenn die Hesse Matrix in allen Punkten positiv semidefinit ist. Beweis. (i) Da f konvex ist, gilt f ((1 − t)x + ty) ≤ (1 − t)f (x) + tf (y). Es folgt f (x) + f (x + t(y − x)) − f (x) ≤ f (y) t und damit f (x) + lim t→0 f (x + t(y − x)) − f (x) ≤ f (y). t 6.5. ABBILDUNGEN VOM RN IN DEN RM 343 Es gilt lim t→0 f (x + t(y − x)) − f (x) = h∇f (x), y − xi t und somit f (x) + h∇f (x), y − xi ≤ f (y). (ii) f ist genau dann konvex, wenn für alle x0 ∈ Rn und alle ξ ∈ Rn mit kξk2 = 1 die Funktion g : R → R mit g(t) = f (x0 + tξ) konvex ist. Da f zweimal stetig differenzierbar ist, so ist auch g zweimal stetig differenzierbar. Nach (??) ist g genau dann konvex, wenn für alle t ∈ R gilt, dass g 00 (t) ≥ 0. Weiter gelten g 0 (t) = h∇f (x0 + tξ), ξi = und g 00 (t) = n X i,j=1 ξi ξj n X ξj j=1 ∂f (x0 + tξ) ∂xj ∂2f (x0 + tξ) = ξ t ∇2 (x0 + tξ)ξ. ∂xi ∂xj Also ist f genau dann konvex, wenn für alle x0 und alle ξ 0≤ n X i,j=1 ξi ξj ∂2f (x0 ). ∂xi ∂xj 2 Bei dem eben bewiesenen Satz ist es wichtig, dass die Definitionsmenge der Funktion eine offene Teilmenge des Rn ist. Dazu das folgende Beispiel. Beispiel 6.4.4 [64] Es gibt eine Funktion f : Q2 → Q, die überall differenzierbar ist, die stetige, partielle Ableitungen aller Ordnungen besitzt und die für alle (x, y) ∈ Q2 die Ungleichung ∂2f ∂2f (x, y) 6= (x, y) ∂x∂y ∂y∂x erfüllt. 6.5 Abbildungen vom Rn in den Rm Carl Gustav Jacob Jacobi wurde am 10. Dezember 1804 in Potsdam geboren. Er starb am 18. Februar 1851 in Berlin an einer Pockeninfektion. Er stammte aus einer wohlhabenden jüdischen Bankiersfamilie in Berlin. Er machte schon mit 13 Jahren das Abitur. Er studierte in Berlin. Er unterrichtete in Königsberg. Er forschte über elliptische Funktionen, auf dem Gebiet der Differentialgeometrie, der partiellen Differentialgleichungen und der mathematischen Physik. Nach ihm benannt sind die Jacobi Matrix, die Jacobi Polynome und der Mondkrater Jacobi. Es sei U eine offene Teilmenge des Rn und f : U → Rm . Die Koordinateabbildungen von f sind fi U → R, i = 1, . . . m, mit fi =< f, ei >. Wir schreiben auch f = (f1 , . . . , fm ), wobei fi , i = 1, . . . , m, die Koordinatenabbildungen sind. 344 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Definition 6.5.1 Eine Funktion f : U → Rm heißt differenzierbar (oder auch total differenzierbar) in x0 , falls es eine lineare Abbildung T : Rn → Rm gibt, so dass (6.4) lim h→0 f (x0 + h) − f (x0 ) − T h =0 khk gilt. Die lineare Abbildung T heißt das Differential oder auch totales Differential von f . Dies lässt sich auch so formulieren: f heißt in x0 differenzierbar, wenn es eine m × n-Matrix C = (ci,j )m,n i,j=1 und eine Funktion φ : V(x0 ) → Rm gibt, die in einer Umgebung V(x0 ) von x0 definiert ist, so dass für alle i = 1, . . . , m φi (x0 ) = lim φi (x) = 0 x→x0 fi (x) = fi (x0 ) + n X j=1 ci,j (xj − x0j ) + φi (x)kx − x0 k gilt. Insbesondere bedeutet diese Definition, dass jede Koordinatenfunktion fi , i = 1, . . . , m, in x0 differenzierbar ist. Also gilt für i = 1, . . . , m und j = 1, . . . , n ci,j = ∂fi (x0 ). ∂xj Man sieht auch, dass f differenzierbar ist, falls alle Koordinatenabbildungen differenzierbar sind. Falls alle partiellen Ableitungen in x0 existieren (f muss nicht differenzierbar sein), so nennt man die m × n Matrix m,n ∂(f1 , . . . , fm ) ∂fi df = (x0 ) J(x0 ) = (x0 ) = (x0 ) dx ∂xj ∂(x1 , . . . , xn ) i,j=1 die Jacobische Funktionalmatrix von f an der Stelle x0 . Ausgeschrieben ist sie ∂f1 ∂f1 · · · ∂x ∂x1 n .. .. . . ∂fm ∂fm · · · ∂xn ∂x1 Beispiel 6.5.1 (Polarkoordinaten) Es sei f : (0, ∞) × R → R2 durch f (r, φ) = (r cos φ, r sin φ) gegeben. f ist auf (0, ∞) × R differenzierbar und ! ∂f1 ∂f1 df cos φ ∂r ∂φ = = ∂f2 ∂f2 sin φ d(r, φ) ∂r ∂φ −r sin φ r cos φ . Um nachzuweisen, dass f differenzierbar ist, reicht es zu zeigen, dass f1 und f2 differenzierbar sind. Nach Satz 6.3.4 reicht es zu zeigen, dass die partiellen Ableitungen stetig sind. 6.6. KETTENREGEL 6.6 345 Kettenregel Satz 6.6.1 Es sei U eine offene Teilmenge des Rn , W sei eine offene Teilmenge des Rm . Es seien f : U → Rm und g : W → R` Funktionen mit f (U) ⊆ W. Es seien f in x0 ∈ U und g in f (x0 ) ∈ W differenzierbar. Dann ist auch g ◦ f in x0 differenzierbar und dg df d(g ◦ f ) (x0 ) = (f (x0 )) (x0 ) dx dy dx bzw. ∂(g◦f )1 )1 (x0 ) . . . ∂(g◦f (x0 ) ∂x1 ∂xn .. .. . . ∂(g◦f )` (x0 ) ∂x1 = ∂g1 (f (x0 )) ∂y1 ... .. . ∂g` (f (x0 )) . . . ∂y1 ... ∂g1 (f (x0 )) ∂ym ∂(g◦f )` (x0 ) ∂xn .. . ∂g` (f (x0 )) ∂ym ∂f1 (x0 ) ∂x1 ... .. . ∂fm (x0 ) . . . ∂x1 ∂f1 (x0 ) ∂xn .. . . ∂fm (x0 ) ∂xn Die Ableitung von g ◦ f ist das Matrizenprodukt der Ableitungen von g und f . Beweis. Für alle i = 1, . . . , m gilt fi (x) = fi (x0 )+ < ∇fi (x0 ), x − x0 > +φi (x)kx − x0 k2 n X ∂fi (x0 ) = fi (x0 ) + (xj − x0j ) + φi (x)kx − x0 k2 ∂xj j=1 mit lim φi (x) = 0. x→x0 Für alle k = 1, . . . , ` gilt gk (y) = gk (f (x0 ))+ < ∇gk (f (x0 )), y − f (x0 ) > +ψk (y)ky − f (x0 )k2 m X ∂gk (f (x0 )) = gk (f (x0 )) + (yi − fi (x0 )) + ψk (y)ky − f (x0 )k2 ∂yi i=1 mit lim ψk (x) = 0. x→x0 Hieraus folgt gk (f (x)) = gk (f (x0 ))+ < ∇gk (f (x0 )), f (x) − f (x0 ) > +ψk (f (x))kf (x) − f (x0 )k2 m X ∂gk = gk (f (x0 )) + (f (x0 ))(fi (x) − fi (x0 )) + ψk (f (x))kf (x) − f (x0 )k2 ∂y i i=1 m X ∂gk = gk (f (x0 )) + (f (x0 )) < ∇fi (x0 ), x − x0 > +φi (x)kx − x0 k2 ∂y i i=1 +ψk (f (x))kf (x) − f (x0 )k2 . 346 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Es folgt weiter ! n m X X ∂fi ∂gk (f (x0 )) (x0 ) (xj − x0j ) (g ◦ f )k (x) = (g ◦ f )k (x0 ) + ∂yi ∂xj j=1 i=1 ! m X kf (x) − f (x0 )k2 ∂gk (f (x0 ))φi (x) + ψk (f (x)) kx − x0 k2 . + ∂y kx − x k i 0 2 i=1 Hiermit folgt (g ◦ f )(x) = (g ◦ f )(x0 ) + m X ∂gk !`,n ∂fi (f (x0 )) (x0 ) ∂yi ∂xj m X ∂gk i=1 k,j=1 (x − x0 ) !` kf (x) − f (x0 )k2 kx − x0 k2 ∂yi kx − x0 k2 i=1 k=1 `,m m,n ∂fi ∂gk (f (x0 )) (x0 ) (x − x0 ) = (g ◦ f )(x0 ) + ∂yi ∂xj k,i=1 i,j=1 !` m X ∂gk kf (x) − f (x0 )k2 + (f (x0 ))φi (x) + ψk (f (x)) kx − x0 k2 . ∂yi kx − x0 k2 i=1 + (f (x0 ))φi (x) + ψk (f (x)) k=1 Wir müssen überprüfen, dass für alle k = 1, . . . , ` lim x→x0 m X ∂gk i=1 kf (x) − f (x0 )k2 (f (x0 ))φi (x) + ψk (f (x)) ∂yi kx − x0 k2 ! =0 gilt. Dies gilt, weil lim φ(x) = 0 und x→x0 lim ψ(f (x)) = 0 x→x0 gelten und weil es eine Umgebung gibt, in der kf (x) − f (x0 )k2 kx − x0 k2 beschränkt ist. Letzteres gilt, weil f in x0 differenzierbar ist. Wir zeigen dies. n X ∂fi (x0 ) |fi (x) − fi (x0 )| ≤ ∂xj |xj − x0j | + |φi (x)|kx − x0 k2 j=1 !1 n X ∂fi (x0 ) 2 2 kx − x0 k2 + |φi (x)|kx − x0 k2 ≤ ∂xj j=1 Hieraus folgt kf (x) − f (x0 )k2 ≤ kx − x0 k2 i=1 2 2 21 2 ! 12 n X ∂fi (x0 ) + |φi (x)| . ∂xj j=1 m X 6.7. MITTELWERTSATZ 347 Beispiel 6.6.1 Es seien f : R2 → R2 und g : R2 → R durch g(x, y) = x2 + y 2 f (r, φ) = (r cos φ, r sin φ) gegeben. Dann gilt g ◦ f (r, φ) = r2 und ∂(g ◦ f ) = 2r ∂r ∂(g ◦ f ) =0 ∂φ Beweis. Es gilt g ◦ f (r, φ) = r2 cos2 φ + r2 sin2 φ = r2 . Hieraus folgt sofort ∂(g ◦ f ) = 2r ∂r ∂(g ◦ f ) =0 ∂φ Wir wollen nun die Kettenregel benutzen, um dasselbe Ergebnis zu bekommen. ! ∂f1 ∂f1 r cos φ −r sin φ ∂g ∂g ∂r ∂φ 2x 2y = ∂f2 ∂f2 ∂x ∂y r sin φ r cos φ ∂r ∂φ r cos φ −r sin φ 2r cos φ 2r sin φ = = ( 2r r sin φ r cos φ 6.7 0 ) Mittelwertsatz Die abgeschlossene Verbindungsstrecke oder das abgeschlossene Intervall von zwei Punkten x und y im Rn ist [x, y] = {(1 − t)x + ty|t ∈ [0, 1]}. Das offene Intervall ist (x, y) = {(1 − t)x + ty|t ∈ (0, 1)}. Satz 6.7.1 Es sei U eine offene Teilmenge des Rn und f : U → R sei auf U differenzierbar. Es seien x, y ∈ U mit [x, y] ⊆ U. Dann gibt es ein ξ ∈ (x, y) mit f (y) − f (x) =< ∇f (ξ), y − x > . Der Satz folgt unmittelbar aus dem 1-dimensionalen Fall. Beweis. Es sei F : [0, 1] → R durch F (t) = f (x + t(y − x)) gegeben. Mit der Kettenregel (Satz 6.6.1) erhalten wir F 0 (t) =< ∇f (x + t(y − x)), y − x > . 348 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Nach dem Mittelwertsatz für Funktionen einer reellen Variablen gibt es ein Θ ∈ (0, 1) mit F (1) − F (0) = F 0 (Θ) =< ∇f (x + Θ(y − x)), y − x > . 2 Eine Teilmenge M des Rn heißt konvex, falls für alle x, y ∈ M auch die Verbindungsstrecke [x, y] in M enthalten ist. Für solche Mengen ist die Voraussetzung von Satz 6.7.1 immer erfüllt. Für Funktionen f : Rn → Rm , wobei m ≥ 2 gilt, kann man den Satz nicht formulieren. Dazu das folgende Beispiel. Beispiel 6.7.1 Es sei f : R → R2 durch f (x) = (x2 , x3 ) gegeben. Dann gibt es kein ξ ∈ [0, 1] mit df (ξ) = f (1) − f (0) dx df Beweis. Wir nehmen an, dass es ein ξ ∈ [0, 1] mit dx (ξ) = f (1) − f (0) gibt. Dann folgt 1 0 2ξ − = 1 0 3ξ 2 Hieraus folgt, dass 2ξ = 1 und 3ξ 2 = 1 gelten. Aus der ersten Gleichung folgt ξ = 21 . Dies in die zweite Gleichung eingesetzt liefert 34 = 1, was falsch ist. 2 Satz 6.7.2 Es sei G ein Gebiet im Rn und f : G → R sei auf G differenzierbar. f ist genau dann auf G konstant, wenn für alle x ∈ G ∇f (x) = 0 gilt. Beweis. Falls f konstant ist, dann sind alle partiellen Ableitungen 0 und damit gilt ∇f = 0. Es gelte nun ∇f = 0. Da G ein Gebiet ist, gibt es für alle x, y ∈ G einen Polygonzug, der ganz in G liegt und der die beiden Punkte verbindet. x1 = x xm = y m−1 [ i=1 [xi , xi+1 ] ⊆ G Nach dem Mittelwertsatz gibt es für alle i = 1, 2, . . . , m − 1 ein ξi ∈ (xi , xi+1 ), so dass f (xi+1 ) − f (xi ) =< ∇f (ξi ), xi+1 − xi >= 0 Deshalb gilt für alle i = 1, . . . , m − 1 f (xi ) = f (xi+1 ). 6.8. DER SATZ VON TAYLOR 349 Insbesondere gilt f (x) = f (y). Also ist f konstant. 2 In Satz 6.7.2 wird vorausgesetzt, dass f auf einer zusammenhängenden Menge definiert ist und dort differenzierbar ist. Dies ist wesentlich. Die Funktion f : R2 \ {(x, y)|x = 0} → R ( 1 x>0 f (x, y) = −1 x<0 ist differenzierbar und es gilt ∇f = 0, aber f ist nicht konstant. 6.8 Der Satz von Taylor Für Funktionen f : I → R, die m + 1-mal stetig differenzierbar sind, hatten wir die Formel von Taylor bewiesen: f (x) = m X f (k) (x0 ) k=0 k! (x − x0 )k + Rm (x, x0 ), wobei es ein Θ ∈ (0, 1) gibt, so dass Rm (x, x0 ) = 1 (x − x0 )m+1 f (m+1) (x0 + Θ(x − x0 )). (m + 1)! Wir benutzen hier die Lagrange Form des Restglieds. Dieses Ergebnis soll nun auf Funktionen f : Rn → R verallgemeinert werden. Ein Polynom von n Veränderlichen x1 , . . . , xn ist eine Funktion p : Rn → R mit p(x1 , . . . , xn ) = N X k1 ,...,kn =1 ak1 ,...,kn xk11 xk22 · · · xknn Der Grad des Polynoms p ist die größte Zahl k1 + k2 + · · · + kn mit ak1 ,...,kn 6= 0. Das Polynom 5 + 2x + 6y + 2x2 y 2 + 7x3 y 4 hat die Koeffizienten a0,0 = 5 a1,0 = 2 a0,1 = 6 a2,2 = 2 a3,4 = 7. Alle anderen Koeffizienten sind 0. Wir schreiben formal für h = (h1 , . . . , hn ) ∈ Rn und ∇ = ( ∂x∂ 1 , . . . , ∂x∂n ) < h, ∇ >= n X i=1 hi ∂ ∂xi 350 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN und n X m < h, ∇ > = i=1 ∂ hi ∂xi !m = n X k1 ,...,km =1 hk1 · · · hkm ∂m . ∂xk1 · · · ∂xkm Wir fassen < h, ∇ >m als eine lineare Abbildung bzw. als Differentialoperator von C m (U) nach C(U) auf. !m n n X X ∂ ∂ mf m < h, ∇ > f = hi f= hk1 · · · hkm ∂xi ∂xk1 · · · ∂xkm i=1 k ,...,k =1 1 m Wir behandeln ∇ formal wie einen Vektor des Rn . Satz 6.8.1 (Taylor) Es sei U eine offene Teilmenge des Rn und f : U → R sei m + 1-mal stetig differenzierbar. Es seien x0 , x ∈ U, so dass [x0 , x] ⊂ U. Dann gibt es ein Θ ∈ (0, 1) mit m X 1 f (x) = f (x0 ) + (< x − x0 , ∇ >k f )(x0 ) k! k=1 + Der Summand 1 (< x − x0 , ∇ >m+1 f )(x0 + Θ(x − x0 )). (m + 1)! m X 1 f (x0 ) + (< x − x0 , ∇ >k f )(x0 ) k! k=1 wird als Taylorpolynom m-ten Grades bezeichnet und Rm (x, x0 ) = 1 (< x − x0 , ∇ >m+1 f )(x0 + Θ(x − x0 )) (m + 1)! als das Restglied. Beweis. Es gibt ein > 0, so dass (x0 − (x − x0 ), x0 + (1 + )(x − x0 )) ⊂ U. Wir definieren φ : (−, 1 + ) → R durch φ(t) = f (x0 + t(x − x0 )). Da f m + 1-mal stetig differenzierbar ist, folgt mit der Kettenregel, dass auch φ m + 1-mal stetig differenzierbar ist. Wir wenden nun den Taylorschen Satz für Funktionen einer Variablen auf φ an. Es gibt also ein Θ ∈ (0, 1), so dass φ(1) = φ(0) + m X φ(k) (0) k=1 k! + φ(m+1) (Θ) . (m + 1)! 6.8. DER SATZ VON TAYLOR 351 Es gelten φ(1) = f (x), φ(0) = f (x0 ) und mit der Kettenregel folgt φ(k) (0) = (< x − x0 , ∇ >k f )(x0 ). Wir weisen dies mit Induktion nach. Es folgt mit der Kettenregel n X ∂f (x0 + t(x − x0 )) φ (t) = h∇f (x0 + t(x − x0 )), x − x0 i = (xj − x0j ) ∂xj j=1 0 Wir nehmen nun an, dass wir (m) φ n X (t) = (xk1 − x0k1 ) · · · (xkm − x0km ) k1 ,...,km =1 ∂ mf (x0 + t(x − x0 )) ∂xk1 · · · ∂xkm nachgewiesen haben und schließen auf die Aussage m + 1. Dann gilt φ(m+1) (t) n X (xk1 − x0k1 ) · · · (xkm − x0km ) ∇ = = ∂ mf (x0 + t(x − x0 )), x − x0 ∂xk1 · · · ∂xkm k1 ,...,km =1 n X n X k1 ,...,km =1 km+1 =1 (xk1 − x0k1 ) · · · (xkm − x0km ) (xkm+1 − x0km+1 ) ∂ mf ∂xkm+1 ∂xk1 · · · ∂xkm ∂ 2 Falls f unendlich oft differenzierbar ist und lim Rm (x, x0 ) = 0 m→∞ gilt, dann erhalten wir ∞ X 1 f (x) = f (x0 ) + (< x − x0 , ∇ >k f )(x0 ). k! k=1 Beispiel 6.8.1 (i) Es sei U eine offene Teilmenge des R2 und (x0 , y0 ) ∈ U. Die Abbildung f : U → R sei in (x0 , y0 ) unendlich oft differenzierbar und lim Rm ((x, y), (x0 , y0 )) = 0. m→∞ Dann gilt ∞ m X 1 X m ∂ m f (x0 , y0 ) f (x, y) = (x − x0 )k (y − y0 )m−k . k ∂y m−k m! k ∂x m=0 k=0 (Man beachte, dass die Reihenfolge der Differentiation keine Rolle spielt.) (ii) Für alle (x, y) ∈ R2 gilt ∞ X m X 1 m k m−k x+y e = x y . m! k m=0 k=0 352 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Beweis. (ii) Wir wenden hier die Formel von (i) an. ∂ k+` ex+y = ex+y ∂xk ∂y ` Man kann diese Formel auch folgendermaßen herleiten. Für alle t ∈ R gilt et = Mit t = x + y folgt ex+y = ∞ X tm . m! m=0 m ∞ ∞ X X (x + y)m 1 X m k m−k = x y . m! m! m=0 k m=0 m=0 2 Das Konvergenzgebiet von Taylorreihen im 1-Dimensionalen ist ein Intervall. Die Konvergenzgebiete von Taylorreihen bzw. Potenzreihen mehrerer Veränderlichen sehen komplizierter aus als im eindimensionalen Fall. Beispiel 6.8.2 Die Potenzreihe ∞ X xn y n n=0 konvergiert absolut in der Menge {(x, y)||x · y| < 1}. Diese Menge ist log-konvex, d.h. die Menge {(ln x, ln y)|x · y < 1} ist konvex. Man kann allgemein zeigen, dass die Konvergenzmenge einer Potenzreihe mit Entwicklungspunkt 0 log-konvex ist. Im Komplexen hängt dies mit Reinhardt-Gebieten zusammen [55]. 6.9 Bogenlänge Definition 6.9.1 Es sei (X, d) ein metrischer Raum und Φ : [a, b] → X eine Funktion und P = {x0 , . . . , xN } bezeichne Partitionen von [a, b]. Die Länge des Graphens von Φ wird durch L(Graph(Φ)) = sup P N X d(Φ(xi ), Φ(xi−1 )) i=1 definiert. Satz 6.9.1 Es sei Φ : [a, b] → Rn eine stetig differenzierbare Funktion. Φ1 , . . . , Φn sind die Koordinatenfunktionen von Φ. In den Punkten a und b existieren die einseitigen partiellen Ableitungen und sie seien stetig dort. Dann ist die Länge des Graphens von Φ gleich Z L(Graph(Φ)) = a b !1 n X ∂Φi 2 2 dt ∂t (t) i=1 6.9. BOGENLÄNGE 353 Lemma 6.9.1 Es sei eine Kurve in Polarkoordinaten gegeben. Dann s 2 Z dr L() = r2 + dθ dθ Beweis. Es gilt x = r cos θ y = r sin θ Deshalb gilt ∂x ∂r = cos θ − r sin θ ∂θ ∂θ ∂y ∂r = sin θ + r cos θ ∂θ ∂θ Somit 2 2 ∂y ∂x ∂θ 2 ∂y ∂θ 2 ∂x + = ∂t ∂θ ∂t + ∂θ ∂t ∂t 2 2 !2 2 ∂r ∂θ ∂r = cos θ − r sin θ + sin θ + r cos θ ∂t ∂θ ∂θ ! 2 2 ∂θ ∂r = + r2 ∂t ∂θ Z L() = s Z ∂x 2 ∂y 2 + dt = ∂t ∂t s s 2 Z ∂θ ∂r ∂r 2 + r2 dt dθ = + r2 dθ ∂t ∂θ ∂θ dθ 2 Beispiel 6.9.1 Der Umfang einer Ellipse E mit Achsenlängen a und b mit a ≥ b ist Z 2π r b2 L(∂E) = a 1 − (1 − 2 ) cos2 θdθ a 0 Der Ausdruck wird als elliptische Integral bezeichnet. Ein elliptische Integral ist ein Integral der Gestalt Z p R(x, P (x))dx, wobei R eine rationale Funktion von zwei Variablen ist und P ein Polynom dritten oder vierten Grades ohne mehrfache Nullstellen ist. Beweis. Wir benutzen die Parametrisierung x(t) = a cos θ y(t) = b sin θ 354 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Dann gilt Z 2π p |x0 |2 + |y 0 |2 dθ = |a sin θ|2 + |b cos θ|2 dθ 0 0 Z 2π r Z 2π r b b2 2 2 = a | sin θ| + | cos θ| dθ = a 1 − (1 − 2 ) cos2 θdθ a a 0 0 Z L(∂E) = 2π p 2 Beispiel 6.9.2 (Goldene Spirale) Es seien 0 < a, b. Sp : [0, 1] → R2 durch Sp(0) = 0 und 1 − bt Sp1 (t) = ae cos t b 1 Sp2 (t) = ae− t sin t Sp ist eine stetig differenzierbare Funktion, deren partielle Ableitungen auch in den Punkten a und b stetig sind. Die Kurvenlänge ist p a b2 + 1e−b . Beweis. Es gelten für t mit 0 < t ≤ 1 ∂ Sp1 (t) ∂t ∂ Sp2 (t) ∂t = = ab − b a −b 1 1 t t e cos + 2 e sin t2 t t t 1 1 ab − b a b e t sin − 2 e− t cos t2 t t t Weiter erhalten wir ∂ Sp1 (0) ∂t ∂ Sp2 (0) ∂t b = = ae− t cos lim t→0 t − bt ae sin lim t→0 t 1 t =0 1 t =0 Es folgt ∂ Sp1 2 ∂ Sp2 2 a2 −2 b 2 + t b +1 ∂t ∂t = t4 e Die partiellen Ableitungen von Sp sind auf [0, 1] stetig. Wir können also Satz ?? anwenden. Es folgt Z 1 p 1 −b L(Graph(Sp)) = a b2 + 1 e t dt 2 0 t Wir substituieren θ = 1 t Z p 2 L(Graph(Sp)) = a b + 1 ∞ p e−bθ dθ = a b2 + 1e−b 1 2 x = r cos θ = a(cos θ)ebθ y = r sin θ = a sin θebθ 6.9. BOGENLÄNGE 355 Die Bogenlänge von 0 bis (x(θ), y(θ)) ist a√ 1 + b2 ebθ . b Die Krümmung im Punkt (x(θ), y(θ)) ist e−bθ √ a 1 + b2 Der Winkel zwischen der Tangente der Kurve im Punkt (x(θ), y(θ)) und der Geraden durch 0 und (x(θ), y(θ)) ist θ. Beispiel 6.9.3 Es seien 0 < α. sp : [0, 1] → R2 durch sp(0) = 0 und 1 sp1 (t) = tα cos t 1 sp2 (t) = tα sin t Der Graph von sp ist genau dann rektifizierbar, wenn α > 2. Beweis. ∂ sp1 ∂t ∂ sp2 ∂t Es folgt 1 1 + tα−2 sin t t 1 1 = αtα−1 sin − tα−2 cos t t = αtα−1 cos ∂ sp1 2 ∂ sp2 2 2α−4 + (α2 t2 + 1) ∂t ∂t = t Deshalb 1 Z tα−2 L(Graph(sp)) = p α2 t2 + 1dt. 0 Es gilt für α > 1 Z L(Graph(sp)) = 0 1 tα−2 Z p p α2 t2 + 1dt ≤ α2 + 1 tα−2 dt = p α2 + 1 0 Für α = 1 1 Z tα−2 L(Graph(sp)) = Z L(Graph(sp)) = Z p α2 t2 + 1dt ≥ 1 0 0 Für 0 < α < 1 2 1 1 tα−2 p 0 α2 t2 + 1dt ≥ Z 0 t−1 dt = ∞. 1 tα−2 dt = ∞. Beispiel 6.9.4 Die Helix (Schraubenlinie) H : [0, T ] → R3 ist durch H1 (t) = a cos t H2 (t) = a sin t H3 (t) = b·t definiert. Ihre Länge ist T· p a2 + b2 1 α−1 356 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Beweis. L(Graph(H)) s ∂H1 2 ∂H2 2 ∂H3 2 ∂t (t) + ∂t (t) + ∂t (t) dt T Z = 0 T Z p |a sin(t)|2 + |a cos(t)|2 + b2 dt = 0 = T p a2 + b2 2 Beispiel 6.9.5 (Lemniskate von Jakob Bernoulli) (x2 + y 2 )2 = 2a2 (x2 − y 2 ) r2 = 2a2 cos 2θ Dann gilt Z L() = √ 2a2 dt = 4a4 − t4 1 Z q 1− Z t4 4a4 dt = 2a √ 1 dt 1 − t4 Bei dem letzten Ausdruck handelt es sich um ein elliptisches Integral. Beweis. Nach Lemma ?? gilt Z L() = s r2 2 dr + dθ dθ Wir wählen nun r als Integrationsvariable s s −2 2 Z Z dθ dθ dθ L() = r2 + dr = 1 + r2 dr dr dr dr √ Wegen r = a 2 cos 2θ gilt 2a sin 2θ dr = −√ dθ 2 cos 2θ und somit √ dθ 2 cos 2θ =− . dr 2a sin 2θ Es folgt 2 dθ = cos 2θ . dr 2a2 sin2 2θ Wegen r2 = 2a2 cos 2θ sin2 2θ = 1 − cos2 2θ = 4a4 − r4 4a4 Hiermit folgt 2 r2 dθ r2 2a2 = cos 2θ = = 4 4 dr 4a4 − r4 2a2 sin2 2θ 2a2 4a4a−r 4 Es folgt weiter Z L() = 2 s 2 Z r dθ r4 1 + r2 dr = 1+ 4 dr dr 4a − r4 6.10. EXTREMWERTE 6.10 357 Extremwerte Es sei M eine Teilmenge des Rn und f : M → R. Man sagt, dass f in einem Punkt x0 ∈ M ein lokales oder relatives Minimum bzw. Maximum hat, falls es eine Umgebung V(x0 ) gibt, so dass für alle x ∈ V(x0 ) ∩ M f (x) ≥ f (x0 ) bzw. f (x) ≤ f (x0 ) gilt. Es liegt ein striktes lokales oder relatives Minimum bzw. Maximum vor, falls es eine Umgebung V(x0 ) gibt, so dass für alle x ∈ V(x0 ) ∩ M mit x 6= x0 f (x) > f (x0 ) bzw. f (x) < f (x0 ) gilt. Wir sagen, dass ein lokales Extremum vorliegt, falls ein lokales Minimum oder Maximum vorliegt. f hat ein globales Minimum oder Maximum in x0 , falls für alle x ∈ M f (x) ≥ f (x0 ) bzw. f (x) ≤ f (x0 ) gilt. Lemma 6.10.1 Es sei U eine offene Teilmenge des Rn und f : U → R nach allen Variablen partiell differenzierbar. Falls f in x0 ein lokales Extremum hat, so gilt ∇f (x0 ) = 0. Wir nennen Punkte x0 mit ∇f (x0 ) = 0 kritische Punkte . Beweis. Wir betrachten f als Funktion ihrer i-ten Variablen, φ : (x0 (i) − δ, x0 (i) + δ) → R φ(t) = f (x0 (1), . . . , x0 (i − 1), t, x0 (i + 1), . . . , x0 (n)) Offensichtlich hat φ in t = x0 (i) ein lokales Extremum. Somit gilt dφ (x0 (i)) = 0 dt Es folgt weiter ∂f (x0 ) ∂xi = dφ (x0 (i)) dt = 0. 2 Das folgende Beispiel zeigt, dass die Bedingung von Lemma 6.10.1 zwar notwendig, aber nicht hinreichend ist. Beispiel 6.10.1 Es sei f : R2 → R durch f (x, y) = x · y gegeben. Es ist (0, 0) ein kritischer Punkt mit ∇f (0, 0) = 0, aber es liegt in (0, 0) kein lokales Extremum vor. Auf Grund der Form des Graphen von f sprechen wir von einem Sattelpunkt. Siehe hierzu die Graphik. 358 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN f (x, y) = xy -2 -1 0 1 2 4 2 0 -2 -4 -2 -1 1 0 2 Beweis. Es gilt ∂f =y ∂x ∂f =x ∂y Also gilt ∇f (0, 0) = 0. Wenn wir f auf die Gerade x = y einschränken, dann erhalten wir f (x, x) = x2 . Im Punkt x = 0 liegt ein Minimum vor. Andererseits können wir f auf die Gerade y = −x einschränken und erhalten f (x, −x) = −x2 . Hier liegt in x = 0 ein Maximum vor. Somit kann in (0, 0) weder ein Minimum noch ein Maximum vorliegen. 2 Es sei A = (ai,j )ni,j=1 eine reelle, symmetrische Matrix, d.h. At = A. Das Polynom n X t QA (x) = x Ax = ai,j xi xj i,j=1 heißt die zu A gehörige quadratische Form. Die Matrix A bzw. die Funktion QA heißt (i) positiv semidefinit, wenn für alle x ∈ Rn gilt, dass QA (x) ≥ 0. (ii) negativ semidefinit, wenn für alle x ∈ Rn gilt, dass QA (x) ≤ 0. (iii) positiv definit, wenn für alle x ∈ Rn mit x 6= 0 gilt, dass QA (x) > 0. (iv) negativ definit, wenn für alle x ∈ Rn mit x 6= 0 gilt, dass QA (x) < 0. (v) indefinit, falls A weder positiv semidefinit, noch negativ semidefinit ist. Lemma 6.10.2 Es sei A eine reelle, symmetrische Matrix. Dann gilt: (i) A ist genau dann positiv (negativ) definit, wenn alle Eigenwerte von A strikt positiv (strikt negativ) sind. (ii) A ist genau dann positiv (negativ) semidefinit, wenn alle Eigenwerte von A nichtnegativ (nichtpositiv) sind. 6.10. EXTREMWERTE 359 Beweis. (i) A besitze einen Eigenwert, der nicht positiv ist. Wir zeigen, dass A nicht positiv definit ist. Es sei x ein Eigenvektor von A zum Eigenwert λ mit λ ≤ 0. Dann folgt n X t t QA (x) = x Ax = x λx = λ x2i ≤ 0 i=1 Um die andere Beweisrichtung zu führen, benötigt man das folgende Ergebnis der linearen Algebra: Falls A eine reelle, symmetrische Matrix ist, dann gibt es eine Matrix U , so dass U t U = I und U AU t = D eine Diagonalmatrix ist. Die Diagonalelemente der Matrix D sind die Eigenwerte der Matrix A. Also gilt di,i > 0, i = 1, . . . , n. Somit gilt A = U t DU und xt Ax = xt U t DU x = (U x)t D(U x) Wir setzen y = U x und erhalten t t x Ax = y Dy = n X di,i yi2 > 0 i=1 Die letzte Ungleichung gilt, weil di,i > 0 und y 6= 0. 2 Um zu entscheiden, ob eine Matrix positiv definit ist, müsste man also die Eigenwerte berechnen. Dies kann sich jedoch schwierig gestalten. Es reicht aber zu zeigen, dass die Eigenwerte sämtlich positiv sind. Dies ist im wesentlichen der Inhalt des folgenden Satzes. Satz 6.10.1 Es sei A eine reelle, symmetrische n × n Matrix. (i) A ist genau dann positiv definit, wenn für alle k = 1, . . . , n a1,1 . . . a1,k .. > 0 det ... . ak,1 . . . ak,k gilt. (ii) A ist genau dann negativ definit, wenn für alle k = 1, . . . , n a1,1 . . . a1,k .. > 0 (−1)k det ... . ak,1 . . . ak,k gilt. 360 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Beispiel 6.10.2 (i) Die Matrix λ1 0 .. 0 . λn ist genau dann positiv definit, falls für alle i = 1, . . . , n gilt, dass λi > 0. (ii) Die Matrix a b b c ist genau dann positiv definit, wenn a > 0 und ac − b2 > 0 gelten. Satz 6.10.1 lässt sich nicht direkt auf die Begriffe positiv semidefinit und negativ semidefinit übertragen. Dazu das folgende Beispiel. Es sei 0 0 A= 0 −1 Für die Hauptunterdeterminanten erhalten wir det(0) = 0 und det 0 0 0 −1 =0 aber A ist nicht positiv semidefinit. Satz 6.10.2 Eine reelle, symmetrische n×n Matrix ist genau dann positiv semidefinit, wenn alle Hauptunterdeterminanten von A nicht negativ sind, d.h. wenn für alle k = 1, . . . , n und alle i1 , . . . , ik ai1 ,i1 . . . ai1 ,ik .. ≥ 0 det ... . aik ,i1 . . . aik ,ik gilt. Es sei U eine offene Teilmenge des Rn und f : U → R sei in x0 zweimal stetig differenzierbar. Wir bezeichnen die Matrix n 2 ∂ f (x0 ) ∂xi ∂xj i,j=1 als Hesse-Matrix. Lemma 6.10.3 Es sei U eine offene Teilmenge des Rn und f : U → R sei zweimal stetig differenzierbar in U. Es seien x0 ∈ U und > 0 mit B2n (x0 , ) ⊆ U . Dann gibt es eine Funktion ρ : B2n (0, ) → R mit limy→0 ρ(y) = 0, so dass für alle h ∈ B2n (0, ) n 1 X ∂ 2 f (x0 ) hi hj + khk22 ρ(h) f (x0 + h) = f (x0 )+ < ∇f (x0 ), h > + 2 i,j=1 ∂xi ∂xj gilt. 6.10. EXTREMWERTE 361 Beweis. Nach dem Satz von Taylor (Satz 6.8.1) gibt es zu jedem h ∈ Rn ein Θ(h) ∈ (0, 1), so dass n 1 X ∂ 2 f (x0 + Θ(h)h) hi hj . f (x0 + h) = f (x0 )+ < ∇f (x0 ), h > + 2 i,j=1 ∂xi ∂xj Deshalb f (x0 + h) = f (x0 )+ < ∇f (x0 ), h > + mit n 1 X ∂ 2 f (x0 ) hi hj + r(h) 2 i,j=1 ∂xi ∂xj n 1 X ∂ 2 f (x0 + Θ(h)h) ∂ 2 f (x0 ) − hi hj r(h) = 2 i,j=1 ∂xi ∂xj ∂xi ∂xj Dann gilt n 2 2 X |r(h)| 1 ∂ f (x0 + Θ(h)h) ∂ f (x0 ) hi hj = − . khk22 2 i,j=1 ∂xi ∂xj ∂xi ∂xj khk2 khk2 Mit der Dreiecksungleichung und mit |hi | ≤ khk für i = 1, . . . , n folgt n |r(h)| 1 X ∂ 2 f (x0 + Θ(h)h) ∂ 2 f (x0 ) ≤ . − khk22 2 i,j=1 ∂xi ∂xj ∂xi ∂xj Da die zweiten partiellen Ableitungen von f in x0 stetig sind, gilt für alle i, j = 1, . . . , n 2 ∂ f (x0 + Θ(h)h) ∂ 2 f (x0 ) − lim =0 h→0 ∂xi ∂xj ∂xi ∂xj und damit |r(h)| = 0. h→0 khk2 2 lim Wir setzen für h 6= 0 ρ(h) = und ρ(0) = 0. 2 |r(h)| khk22 Lemma 6.10.4 Eine reelle, symmetrische n × n-Matrix A ist genau dann positiv definit, wenn es ein c > 0 gibt, so dass für alle x ∈ Rn (6.5) ckxk22 ≤ n X i,j=1 ai,j xi xj 362 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Beweis. Falls (6.5) gilt, dann gilt für alle x ∈ Rn mit x 6= 0 0 < ckxk22 ≤ n X ai,j xi xj = xt Ax. i,j=1 Nun die Umkehrung. Es gelte für alle x ∈ Rn mit x 6= 0 (6.6) n X 0< ai,j xi xj . i,j=1 P {x ∈ Rn |kxk2 = 1} ist eine kompakte Menge und die Abbildung, die x auf ni,j=1 ai,j xi xj abbildet, ist stetig. Nach Satz ?? nimmt diese Abbildung auf der Menge {x ∈ Rn |kxk2 = 1} ihr Minimum an. Also existiert c = min kxk2 =1 n X ai,j xi xj . i,j=1 Wegen (??) gilt c > 0. Deshalb gilt für alle y ∈ Rn mit y 6= 0 0 < c = min n X kxk2 =1 i,j=1 ai,j xi xj ≤ und damit 0< n X n X i,j=1 ai,j zi zj kzk2 kzk2 ai,j zi zj . i,j=1 2 Satz 6.10.3 Es sei U eine offene Teilmenge des Rn und f : U → R sei zweimal stetig differenzierbar in U mit ∇f (x0 ) = 0. Dann gelten: (i) Ist die Hesse-Matrix 2 n ∂ f (x0 ) ∂xi ∂xj i,j=1 positiv definit, so hat f in x0 ein lokales Minimum. Ist die Hesse-Matrix negativ definit, so hat f in x0 ein lokales Maximum. (ii) Hat f in x0 ein lokales Minimum, so ist die Hesse-Matrix n ∂ 2f (x0 ) ∂xi ∂xj i,j=1 positiv semidefinit. Hat f in x0 ein lokales Maximum, so ist die Hesse-Matrix negativ semidefinit. (iii) Ist die Hesse-Matrix indefinit, so hat f in x0 kein relatives Extremum. 6.10. EXTREMWERTE 363 Punkte, in denen die Hesse-Matrix indefinit ist, nennt man Sattelpunkte. Beweis. (i) Nach Lemma 6.10.3 gilt n 1 X ∂ 2 f (x0 ) hi hj + khk22 ρ(h) f (x0 + h) = f (x0 )+ < ∇f (x0 ), h > + 2 i,j=1 ∂xi ∂xj mit lim ρ(h) = 0. h→0 Wegen ∇f (x0 ) = 0 gilt n f (x0 + h) − f (x0 ) 1 X ∂ 2 f (x0 ) hi hj = + ρ(h). khk22 2 i,j=1 ∂xi ∂xj khk2 khk2 Wegen Lemma 6.10.4 gibt es eine Konstante c > 0 mit n 1 X ∂ 2 f (x0 ) hi hj ≥ c. 2 i,j=1 ∂xi ∂xj khk2 khk2 Da ρ in 0 stetig ist, gibt es ein δ > 0, so dass für alle h mit khk2 < δ die Ungleichung |ρ(h)| < 2c gilt. Also gilt für alle h 6= 0 mit khk2 < δ f (x0 + h) − f (x0 ) c ≥ >0 2 khk2 2 und damit 0 < f (x0 + h) − f (x0 ). (ii) Es gibt ein δ > 0, so dass für alle x mit kx − x0 k2 < δ die Funktion f differenzierbar ist. Deshalb gibt es für alle h mit khk2 < δ ein Θ ∈ (0, 1), so dass 1 f (x0 + h) − f (x0 ) = (< ∇, h > f )(x0 ) + (< ∇, h >2 f )(x0 + Θ(h)h) 2 n n X X 1 ∂ 2f ∂f (x0 )hi + (x0 + Θ(h)h)hi hj = ∂xi 2 i,j=1 ∂xi ∂xj i=1 Da ∇f (x0 ) = 0 gilt, folgt f (x0 + h) − f (x0 ) = n 1 X ∂ 2f (x0 + Θ(h)h)hi hj 2 i,j=1 ∂xi ∂xj Da f in x0 ein lokales Minimum hat, so gibt es ein > 0, so dass für alle h mit khk < n 1 X ∂ 2f 0 ≤ f (x0 + h) − f (x0 ) = (x0 + Θ(h)h)hi hj 2 i,j=1 ∂xi ∂xj 364 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Es folgt, dass für alle h mit khk < und alle t ∈ (0, 1) n 1 X ∂ 2f (x0 + Θ(th)th)thi thj 0≤ 2 i,j=1 ∂xi ∂xj gilt. Hieraus folgt, dass für alle h mit khk < und alle t ∈ (0, 1) 0≤ n X ∂ 2f (x0 + Θ(th)th)hi hj ∂x ∂x i j i,j=1 gilt. Wegen der Stetigkeit von ∂ 2f ∂xi ∂xj in x0 ergibt sich für t → 0, dass für alle h mit khk < 0≤ n X ∂ 2f (x0 )hi hj ∂x ∂x i j i,j=1 gilt. Damit ist die Hesse Matrix positiv semidefinit. (iii) Falls die Hesse Matrix weder positiv semidefinit, noch negativ semidefinit ist, dann gibt es ξ, η ∈ Rn mit n X ∂ 2f (x0 )ξi ξj > 0 ∂x ∂x i j i,j=1 n X ∂ 2f (x0 )ηi ηj < 0. ∂x ∂x i j i,j=1 Es folgt für alle t ∈ (0, 1) n 1 X ∂ 2 f (x0 ) ξi ξj f (x0 + tξ) − f (x0 ) + ρ(tξ). = ktξk22 2 i,j=1 ∂xi ∂xj kξk2 kξk2 Für hinreichend kleines t erhalten wir f (x0 + tξ) − f (x0 ) > 0. Ebeenso zeigen wir für hinreichend kleine s f (x0 + sη) − f (x0 ) < 0. 2 Beispiel 6.10.3 (i) Es sei f : R2 → R durch f (x, y) = x2 + y 2 gegeben. f hat in (0, 0) ein lokales, striktes Minimum. (ii) Es sei f : R2 → R durch f (x, y) = xy gegeben. f hat in (0, 0) einen Sattelpunkt. (iii) Es sei f : R → R durch f (x) = x3 gegeben. Satz 6.10.3 reicht nicht aus, um zu entscheiden, ob ein Minimum oder Maximum in 0 vorliegt. (Tatsächlich liegt keines von beiden vor.) 6.10. EXTREMWERTE 365 Beweis. (i) Es gilt ∂f = 2y ∂y ∂f = 2x ∂x Also ist (0, 0) der einzige kritische Punkt. Die Hesse-Matrix im Punkt (0, 0) ist ! ∂2f ∂2f 2 0 2 ∂x ∂x∂y = ∂2f ∂2f 0 2 2 ∂y∂x ∂y Die Eigenwerte der Matrix sind alle strikt positiv, also ist sie positiv definit. (ii) Es gilt ∂f ∂f =y =x ∂x ∂y Also ist (0, 0) der einzige kritische Punkt. Die Hesse-Matrix in (0, 0) ist 0 1 1 0 Die Eigenwerte sind 1 und −1. Also ist die Matrix indefinit. Es liegt ein Sattelpunkt vor. (iii) In 0 liegt der einzige kritische Punkt vor und die Hesse-Matrix ist dort 0. 2 Beispiel 6.10.4 Es sei f : R2 → R mit f (x, y) = (2x2 + 3y 2 )e−x 2 −y 2 . Dann sind (0, 0), (0, 1), (0, −1), (1, 0), (−1, 0) die kritischen Punkte. In (0, 0) liegt ein relatives Minimum vor, in (0, 1) und (0, −1) liegen relative Maxima vor und in (1, 0) und (−1, 0) liegen Sattelpunkte vor. Beweis. Die ersten partiellen Ableitungen sind 2 2 ∂f = (4x − 4x3 − 6xy 2 )e−x −y ∂x 2 2 ∂f = (6y − 6y 3 − 4x2 y)e−x −y . ∂y Die kritischen Punkte erfüllen 0 = 2x(2 − 2x2 − 3y 2 ) und 0 = 2y(3 − 2x2 − 3y 2 ). 366 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Also gelten x=0 oder 2x2 + 3y 2 = 2 y=0 oder 2x2 + 3y 2 = 3. und Hieraus ergeben sich vier Fälle 2x2 + 3y 2 = 2 y=0 x=0 y=0 x=0 2x + 3y 2 = 3 2 2x2 + 3y 2 = 2 2x2 + 3y 2 = 3 Somit sind (0, 0), (±1, 0) und (0, ±1) die kritischen Punkte. ∂2f ∂x2 ∂2f ∂y 2 2 −y 2 = (4 − 12x2 − 6y 2 )e−x = (4 − 20x2 − 6y 2 + 8x4 + 12x2 y 2 )e−x = (6 − 18y 2 − 4x2 )e−x = (6 − 30y 2 − 4x2 + 12y 4 + 8x2 y 2 )e−x 2 −y 2 + (4x − 4x3 − 6xy 2 )(−2x)e−x 2 −y 2 −y 2 + (6y − 6y 3 − 4x2 y)(−2y)e−x 2 2 2 −y 2 −y 2 2 2 2 2 2 2 ∂2f = −12xye−x −y + (4x − 4x3 − 6xy 2 )(−2y)e−x −y = (−20xy + 8x3 y + 12xy 3 )e−x −y ∂x∂y Die Hesse Matrizen in (0, 0), (±1, 0), (0, ±1) sind 8 4 0 −e 0 2 0 6 0 e 2 − 2e 0 0 − 12 e Beispiel 6.10.5 Es sei f : R2 → R durch f (x, y) = (y − x2 )(y − 3x2 ) gegeben. Diese Funktion hat in (0, 0) kein relatives Extremum, aber f eingeschränkt auf jede Gerade durch (0, 0) besitzt in (0, 0) ein striktes relatives Minimum. 6.10. EXTREMWERTE 367 Beweis. Die ersten partiellen Ableitungen sind ∂f = −2x(y − 3x2 ) − 6x(y − x2 ) = −8xy + 12x3 ∂x ∂f = (y − 3x2 ) + (y − x2 ) = 2y − 4x2 . ∂y Die kritischen Punkte erfüllen 12x3 = 8xy 4x2 = 2y. und Hieraus folgt 12x3 = 16x3 und damit x = 0. Also gilt auch y = 0. Der einzige kritische Punkt ist (0, 0). Die zweiten, partiellen Ableitungen sind ∂2f =2 ∂y 2 ∂2f = −8y + 36x2 ∂x2 ∂2f = −8x. ∂x∂y Die Hesse Matrix in (0, 0) ist 0 0 0 2 . Diese Matrix besitzt einen strikt positiven Eigenwert. Das bedeutet, dass in (0, 0) kein relatives Maximum vorliegen kann. Wir können nicht schließen, ob in (0, 0) ein lokales Minimum vorliegt oder nicht. Um einzusehen, dass in (0, 0) kein lokales Extremum vorliegt, betrachten wir die Gerade {(0, y)|y ∈ R} und die Kurve {(x, 2x2 )|}. Es gelten f (0, y) = y 2 und f (x, 2x2 ) = −x4 . Deshalb nimmt f in jeder Umgebung von (0, 0) sowohl strikt positive, als auch strikt negative Werte an. Deshalb liegt in (0, 0) kein relatives Extremum vor. Wir schränken nun f auf die Gerade y = ax ein. φa (x) = f (x, ax) = (ax − x2 )(ax − 3x2 ) = a2 x2 − 4ax3 + 3x4 φ0a (x) = 2a2 x − 12ax2 + 12x3 0 und a 2 ± a √ 2 3 sind kritische Punkte. φ00a (x) = 2a2 − 24ax + 36x2 Somit liegt in 0 ein striktes relatives Minimum vor. Wir wollen noch untersuchen, wie der Graph von f aussieht. In dem Punkt a ein relatives Minimum vor. 2 relatives Maximum von φa und in a2 + 2√ 3 a 2 − a √ 2 3 liegt ein Beispiel 6.10.6 (Beste Approximation im quadratischen Mittel) Es sei f ∈ C[0, 1]. Es gibt genau ein Polynom n X pn (x) = ak xk k=0 n-ten Grades, so dass Z 0 minmal ist. Es sei Z bk = 0 1 |f (x) − pn (x)|2 dx 1 f (x)xk dx k = 0, 1, . . . , n 368 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Dann lassen sich die Koeffizienten des Polynoms durch a0 n 1 .. . = i + j + 1 i,j=0 an b0 .. . bn berechnen. Die minimierenden Polynome sind nicht mit den Taylorpolynomen identisch. Beweis. Wir setzen 2 n X ak xk dx f (x) − 0 k=0 Z 1 Z n X |f (x)|2 dx − 2 ak Z F (a0 , . . . , an ) = = 0 1 k=0 1 f (x)xk dx + 0 n X ai aj . i+j+1 i,j=0 F ist ein Polynom 2. Grades. Wir wollen den Punkt bestimmen, an dem das absolute Minimum angenommen wird. Zunächst wissen wir noch nicht, dass das Minimum überhaupt angenommen wird, wir wissen auch noch nicht, dass dieser Punkt eindeutig ist. Wir untersuchen die kritischen Punkte. Z 1 n X ∂F ai = −2 f (x)xj dx + 2 ∂aj i + j+1 0 i=0 Damit erfüllen die kritischen Punkte a die Gleichungen Z 1 n X ai = f (x)xj dx i + j + 1 0 i=0 j = 0, 1, . . . , n Wir zeigen nun, dass es genau eine Lösung diese Gleichungssystems gibt. Dazu zeigen wir, dass die Matrix n 1 i + j + 1 i,j=0 invertierbar ist. Wir zeigen, dass alle Eigenwerte der Matrix n 1 i + j + 1 i,j=0 strikt positiv sind. Um dies zu zeigen, benutzen wir Satz und weisen nach, dass für alle k = 0, . . . , n k 1 0 < det i + j + 1 i,j=0 gilt. Hierzu benutzen wir die folgende Formel. Für alle Zahlen a0 , . . . , an und b0 , . . . , bn mit ai + bj 6= 0, i, j = 0, . . . , n gilt Q n 0 ≤ i, j ≤ n (ai − aj )(bi − bj ) 1 j <i Qn det = ai + bj i,j=0 i,j=0 (ai + bj ) Mit ai = i + 1 und bj erhalten wir für alle k = 1, . . . , n Q 2 k 0 ≤ i, j ≤ k (i − j) 1 j <i det = Qk >0 i + j + 1 i,j=0 i,j=0 (i + j + 1) 6.10. EXTREMWERTE 369 Damit gibt es genau einen kritischen Punkt, der die behauptete Gleichung erfüllt. Die Hesse Matrix von F an dieser Stelle ist n 1 . i + j + 1 i,j=0 Wie wir eben festgestellt haben besitzt sie nur positive Eigenwerte und damit liegt ein striktes, lokales Minimum vor. Nun zeigen wir, dass das lokale Minimum auch ein globales ist. Dazu müssen wir zeigen, dass ein globales Minimum existiert. Da ein globales Minimum insbesondere ein lokales ist und es nur ein lokales Minimum gibt, muss das lokale Minimum das globale sein. Wir überlegen uns, dass es ein r gibt, so dass für alle a ∈ Rn mit kak ≥ r F (0) ≤ F (a) gilt. Wir bezeichnen Q(a) = n X ai aj i + j+1 i,j=0 und L(a) = 2 n X Z 1 f (x)xj dx. aj j=0 0 Mit der Ungleichung von Cauchy Schwarz folgt n Z X |L(a)| ≤ 2kak 1 2 2 f (x)xj dx . 1 0 j=0 Weiter gilt, dass inf Q(b) = min Q(b) > 0. kbk=1 kbk=1 Das Infimum wird angenommen, weil Q eine stetige Funktion ist und die Menge {b| kbk = 1} kompakt ist. Das Minimum ist strikt größer als 0, weil Q positiv definit ist. Wir wählen 2 R 2 12 1 j j=0 0 f (x)x dx Pn r= minkbk=1 Q(b) . Hiermit gilt F (a) = ≥ Q(a) − L(a) + kak2 Q a kak Z 0 1 |f (x)|2 dx n Z X − 2kak j=0 1 2 2 Z f (x)xj dx + 1 0 0 ≥ n Z X kak kak min Q(b) − 2 kbk=1 j=0 Für a mit kak ≥ r folgt F (a) ≥ Z 0 0 1 1 |f (x)|2 dx 1 2 2 Z f (x)xj dx + 0 1 |f (x)|2 dx. 1 |f (x)|2 dx = F (0). Also wird das Minimum von f in der Menge {a| kak ≤ r} angenommen. Also muss es sich um das lokale Minimum handeln. Tatsächlich hätten wir nicht nachweisen brauchen, dass die Hesse Matrix positiv definit ist. Es reicht zu zeigen, dass ein globales Minimum existiert und dass es einen eindeutigen kritischen Punkt gibt. 370 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Unter allen quadratischen Polynomen liefert p2 (x) = (39e − 105) + (588 − 216e)x + (210e − 570)x2 das Minimum für Z 0 1 |ex − (a0 + a1 x + a2 x2 )|2 dx. Das Polynom ist nicht mit dem Taylorpolynom von ex identisch. Bei der Berechnung des Polynoms verfahren wir wie folgt. Es gelten Z 1 Z 1 Z 1 x x e dx = e − 1 xe dx = 1 x2 ex dx = e − 2. 0 0 Das Gleichungssystem 1 1 2 1 3 1 2 1 3 1 4 1 3 1 4 1 5 0 a0 e−1 a1 = 1 a2 e−2 hat die eindeutige Lösung (a0 , a1 , a2 ) = (39e − 105, 588 − 216e, 210e − 570). 2 Beispiel 6.10.7 Eine rechteckige Schachtel ohne Deckel werde aus 12 m2 Karton hergestellt. Man finde die Schachtel mit maximalem Volumen. Die Länge, Breite und Höhe der Schachtel sei mit x, y, z bezeichnet. Dann ist das Volumen gleich V = xyz. Für die Fläche erhalten wir F = 2xz + 2yz + xy = 12. Wir lösen diese Gleichung nach z auf z= Hiermit V = xy 12 − xy . 2(x + y) 12xy − x2 y 2 12 − xy = . 2(x + y) 2(x + y) Wir fassen V als Funktion von {(x, y)|x > 0 und y > 0} nach R auf. ∂V y 2 (12 − 2xy − x2 ) = ∂x 2(x + y)2 ∂V x2 (12 − 2xy − y 2 ) = ∂y 2(x + y)2 Für die kritischen Punkte gilt x 6= 0 y 6= 0 weil anderenfalls V = 0. Deshalb gilt 12 − 2xy − x2 = 0 12 − 2xy − y 2 = 0 Hieraus folgt x2 = y 2 . Da x > 0 und y > 0, so gilt x = y. Es folgt 0 = 12 − 2xy − x2 = 12 − 3x2 6.11. UMKEHRABBILDUNGEN 371 und damit x = 2. Damit gilt auch y = 2. Für z erhalten wir z= 12 − xy 12 − 4 = = 1. 2(x + y) 8 Wir prüfen nach, dass es sich um ein lokales Maximum handelt. ∂2V ∂x2 = = ∂ y 2 (12 − 2xy − x2 ) ∂x 2(x + y)2 1 (−2y 3 − 2xy 2 )(x + y)2 − 2(x + y)y 2 (12 − 2xy − x2 ) 2 (x + y)4 Für x = y = 2 erhalten wir ∂2V ∂2V (2, 2) = (2, 2) = −1. ∂x2 ∂y 2 Die gemischten, partiellen Ableitungen sind ∂2V ∂y∂x = = ∂ y 2 (12 − 2xy − x2 ) ∂y 2(x + y)2 1 (24y − 6xy 2 − 2x2 y)(x + y)2 − 2(x + y)y 2 (12 − 2xy − x2 ) . 2 (x + y)4 Für x = y = 2 erhalten wir ∂2V ∂2V 1 (2, 2) = (2, 2) = − . ∂y∂x ∂x∂y 2 Für die Hesse Matrix an der Stelle (2, 2) erhalten wir ! ∂2V ∂2V −1 ∂x2 ∂y∂x = 1 ∂2V ∂2V − 2 2 ∂x∂y ∂y − 21 −1 . Die Eigenwerte der Matrix sind − 12 und − 32 . Damit haben wir nachgewiesen, dass ein lokales Maximum in x = y = 2 vorliegt. Es bleibt noch zu zeigen, dass dies ein globales ist. 6.11 Umkehrabbildungen Falls f : Rn → Rn eine lineare Abbildung ist, also f (x) = Ax, wobei A eine n × nMatrix ist, so ist f genau dann invertierbar, wenn die Determinante von df =A dx von 0 verschieden ist. Der allgemeine Fall folgt wieder mittels Approximation der fi , i = 1, . . . , n durch Taylorpolynome 1. Grades fi (x0 + h) ∼ fi (x0 ) + n X ∂fi (x0 )hk . ∂x k k=1 372 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Definition 6.11.1 Es seien (X, dX ) und (Y, dY ) metrische Räume und f : X → Y eine Abbildung. f heißt offen, falls das Bild einer offenen Menge wieder offen ist. Falls f invertierbar und offen ist, dann ist f −1 stetig. Lemma 6.11.1 Es sei U eine offene Teilmenge vom Rn , w ∈ U und f : U → Rn stetig differenzierbar mit df (w) dx (6.7) invertierbar. Dann gibt es eine Umgebung von w, auf der f injektiv ist. Beweis. Wir zeigen, dass es ein > 0 gibt, so dass für alle ξ1 , . . . , ξn ∈ B2n (w, ) n ! ∂fi (ξi ) 6= 0 (6.8) det ∂xj i,j=1 gilt. Damit sind die Matrizen invertierbar. (Wir brauchen hier tatsächlich, dass wir jedes i einen anderen Vektor einsetzen können.) Dazu betrachten wir die Abbildung F : Rn×n → R mit n ! ∂fi . (ξi ) (6.9) F (ξ1 , . . . , ξn ) = det ∂xj i,j=1 Wir statten den Rn×n mit der Norm k(ξ1 , . . . , ξn )k = max kξi k2 1≤i≤n aus. Diese Abbildung erfüllt F (w, . . . , w) 6= 0 und sie ist stetig. Sie ist stetig, weil die partiellen Ableitungen stetig sind und weil det stetig ist (det ist ein Polynom). Da F stetig ist, gibt es ein > 0, so dass für alle (ξ1 , . . . , ξn ) ∈ B n×n ((w, . . . , w), ) F (ξ1 , . . . , ξn ) 6= 0 gilt. Damit haben wir (6.9) nachgewiesen. Es seien nun y, z ∈ B2n (w, ). Nach dem Mittelwertsatz gibt es für alle i = 1, . . . , n ein Θi mit 0 < Θi < 1 und fi (y) − fi (z) = n X ∂fi (z + Θi (y − z))(yj − zj ). ∂x j j=1 Es folgt f (y) − f (z) = n ∂fi (z + Θi (y − z)) (y − z). ∂xj i,j=1 Da die Matrix nach (6.8) invertierbar ist, folgt f (y) 6= f (z), falls y 6= z. 2 6.11. UMKEHRABBILDUNGEN 373 Lemma 6.11.2 Es sei U eine offene Teilmange des Rn und f : U → Rn sei stetig differenzierbar in U. Es sei w ∈ U und die Funktionalmatrix von f in w sei invertierbar. Dann gibt es eine Umgebung W von f (w) mit W ⊆ f (U). Beweis. Nach Lemma 6.11.1 gibt es ein > 0, so dass f auf B2n (w, ) injektiv ist. df (x)) 6= 0 auf B2n (w, ) gilt. Dies gilt, Außerdem können wir annehmen, dass det( dx df weil f stetig differenzierbar auf U ist und det( dx (w)) 6= 0. n Wir betrachten g : B2 (w, ) → R mit g(x) = kf (x) − f (w)k2 . Es gibt ein η > 0, so dass für alle x mit kx − wk = η ≤ g(x) gilt. Wir zeigen dies. Da g auf B2n (w, ) injektiv ist, gilt für alle x mit kx − wk2 = g(x) > 0. Anderenfalls würde f (x) = f (w) gelten und f wäre nicht injektiv. Da g stetig ist und B2n (w, ) kompakt, nimmt g auf {x|kx − wk2 = } ihr Minimum an. Diese Minimum ist strikt größer als 0. Wir zeigen nun, dass für alle y mit ky − f (w)k2 < η2 ein x mit kx − wk2 < und f (x) = y existiert, also B2n (f (w), η2 ) ⊆ f (B2n (w, )). Dazu betrachten wir die Funktion h : B2n (w, ) → R mit h(x) = kf (x) − yk22 . Diese Funktion nimmt ihr Minimum in einem inneren Punkt von B2n (w, ) an. Wir zeigen dies. Da h stetig ist und B2n (w, ) kompakt, nimmt h ihr Minimum auf B2n (w, ) an. Wir zeigen, dass das Minimum nicht auf der Menge {x|kx − wk2 = } angenommen wird. In der Tat, für alle x mit kx − wk2 = gilt η ≤ kf (x) − f (w)k2 = kf (x) − y + y − f (w)k2 ≤ kf (x) − yk2 + ky − f (w)k2 . Wegen ky − f (w)k2 ≤ η 2 folgt für alle x mit kx − wk2 = η ≤ kf (x) − yk2 . 2 Wir nehmen nun an, dass es ein z mit kz − wk2 = und h(z) = kf (z) − yk22 = min kx−wk2 ≤ kf (x) − yk22 gibt. Dann gilt kf (z) − yk2 = min kx−wk2 ≤ kf (x) − yk2 und damit η η ≤ kf (z) − yk2 ≤ min kf (x) − yk2 ≤ kf (w) − yk2 < . kx−wk2 ≤ 2 2 374 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Dies ist ein Widerspruch. Also wird das Minimum in einem inneren Punkt z der Menge B2n (w, ) angenommen. Somit gilt ∇h(z) = 0. Es folgt !n n X ∂fi (z) 0 = ∇h(z) = 2 (fi (z) − y) ∂xj i=1 j=1 bzw. 0= ∂fi ∂xj n i,j=1 (f (z) − y). Da die Matrix auf B2n (w, ) invertierbar ist, folgt f (z) = y. 2 Satz 6.11.1 Es sei U eine offene Teilmenge des Rn und f : U → Rn sei auf U stetig differenzierbar. Es seien x0 ∈ U und df det (x0 ) 6= 0. dx Dann gibt es offene Umgebungen V(x0 ) von x0 und W(f (x0 )) von f (x0 ), so dass V(x0 ) bijektiv auf W(f (x0 )) abgebildet wird, d.h. es gibt auf W(f (x0 )) eine Umkehrabbildung f −1 . Die Umgebungen V(x0 ) und W(f (x0 )) können so gewählt werden, dass f −1 auf W(f (x0 )) stetig differenzierbar ist und für alle x ∈ V(x0 ) (6.10) df −1 (f (x)) = dy df (x) dx −1 gilt. Wenn man bereits weiß, dass f −1 existiert und differenzierbar ist, dann folgt die Gleichung (6.10) aus der Kettenregel. In der Tat, aus f −1 (f (x)) = x folgt d −1 f (f (x)) = In . dx Mit der Kettenregel folgt df −1 df (f (x)) (x) = In . dy dx Also gilt df −1 (f (x)) = dy df (x) dx −1 . Beweis. Wir weisen zuerst die Existenz der offenen Umgebungen V(x0 ) und W(f (x0 )) von x0 und f (x0 ) nach. Wegen Lemma 6.11.1 gibt es eine offene Umgebung V1 (x0 ) 6.11. UMKEHRABBILDUNGEN 375 (x) auf von x0 , auf der f injektiv ist. Wir können außerdem sicher stellen, dass dfdx V1 (x0 ) invertierbar ist. Nun betrachten wir die Menge f (V1 (x0 )). Wegen Lemma 6.11.2 ist diese Menge offen. Mit demselben Argument schließen wir, dass die Abbildung f auf V1 (x0 ) eine offene Abbildung ist. Somit ist f −1 stetig. Da f differenzierbar ist, gilt f (x) = f (x0 ) + df (x0 ) (x − x0 ) + φ(x)kx − x0 k2 dx mit lim φ(x) = 0. x→x0 Wegen x = f −1 (y) und x0 = f −1 (y0 ) y − y0 = df (x0 ) −1 (f (y) − f −1 (y0 )) + φ(f −1 (y))kf −1 (y) − f −1 (y0 )k2 . dx Es folgt −1 −1 df (x0 ) df (x0 ) −1 −1 (y−y0 ) = f (y)−f (y0 )+ (φ(f −1 (y)))kf −1 (y)−f −1 (y0 )k2 . dx dx Also f −1 −1 df (x0 ) (y − y0 ) (y) = f (y0 ) + dx ! −1 kf −1 (y) − f −1 (y0 )k2 df (x0 ) −1 + ky − y0 k2 . (φ(f (y))) dx ky − y0 k2 −1 Es bleibt zu zeigen lim y→y0 df (x0 ) dx −1 kf −1 (y) − f −1 (y0 )k2 (φ(f −1 (y))) ky − y0 k2 ! = 0. Da f −1 stetig ist, gilt lim f −1 (y) = f −1 (y0 ). y→y0 Also lim φ(f −1 (y)) = φ(f −1 (y0 )) = φ(x0 ) = 0. y→y0 Es bleibt zu zeigen, dass für y → y0 beschränkt bleibt. (6.11) kf −1 (y) − f −1 (y0 )k2 ky − y0 k2 kx − x0 k2 kf −1 (y) − f −1 (y0 )k2 = = ky − y0 k2 kf (x) − f (x0 )k2 1 kf (x)−f (x0 )k2 kx−x0 k2 376 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Es gilt df (x0 ) kf (x) − f (x0 )k2 ≥ dx (x − x0 ) − kφ(x)k2 kx − x0 k2 2 und damit df (x0 ) kf (x) − f (x0 )k2 x − x0 − kφ(x)k2 ≥ kx − x0 k2 dx kx − x0 k2 2 df (x0 ) (z) ≥ inf − kφ(x)k2 kzk2 =1 dx 2 df (x0 ) Da die Menge {z|kzk2 = 1} kompakt ist und die Abbildung, die z auf dx (z) 2 abbildet, stetig ist, wird das Infimum angenommen. Also df (x0 ) x − x kf (x) − f (x0 )k2 0 − kφ(x)k2 ≥ dx kx − x0 k2 kx − x0 k2 2 df (x0 ) − kφ(x)k2 ≥ min (z) kzk2 =1 dx 2 Da df (x0 ) dx invertierbar ist, gilt df (x0 ) > 0. α = min (z) kzk2 =1 dx 2 Da φ in x0 stetig ist, gibt es ein > 0, so dass für alle x ∈ B2n (x0 , ) die Ungleichung |φ(x)| < gilt. Wir wählen = α2 . Dann gilt für alle x ∈ B2n (x0 , α2 ) kf (x) − f (x0 )k2 α ≥ . kx − x0 k2 2 Mit (6.11) folgt für alle y mit B2n (y0 , ) 2 kf −1 (y) − f −1 (y0 )k2 2 ≤ . ky − y0 k2 α Beispiel 6.11.1 (i) Es sei f : R2 → R2 durch f (r, φ) = (x(r, φ), y(r, φ)) = (r cos φ, r sin φ) gegeben. f ist in allen Punkten (r, φ) mit r 6= 0 lokal invertierbar. Die lokalen Inversen sind durch r= p x2 + y 2 φ = arctan y x gegeben (x 6= 0). (ii) Es sei f : (0, ∞) × R → R2 durch f (r, φ) = (x(r, φ), y(r, φ)) = (r cos φ, r sin φ) 6.11. UMKEHRABBILDUNGEN 377 gegeben. f ist in allen Punkten (r, φ) lokal invertierbar, f ist aber nicht global invertierbar. (iii) Es sei f : R2 → R2 durch f (x, y) = (u(x, y), v(x, y)) = (x2 + y 2 , xy) gegeben. f ist lokal umkehrbar, falls x2 6= y 2 . Die lokalen Inversen sind durch s r u u2 v r y= + − v2 x= q 2 4 u u2 2 2 + 4 −v gegeben. (iv) (Polarkoordinaten) Es sei f : Rn → Rn durch f (r, φ1 , . . . , φn−1 ) = (x1 , . . . , xn ) und x1 = r cos φ1 x2 = r sin φ1 cos φ2 x3 = r sin φ1 sin φ2 cos φ3 .. . xn−1 = r sin φ1 . . . sin φn−2 cos φn−1 xn = r sin φ1 . . . sin φn−2 sin φn−1 gegeben. Dies lässt sich auch so schreiben x1 = xk = r cos φ1 k−1 Y r sin φi cos φk k = 2, 3, . . . , n − 1 i=1 xn = r n−1 Y sin φi i=1 Es gilt det df d(r, φ1 , . . . , φn−1 ) = rn−1 sinn−2 φ1 sinn−3 φ2 . . . sin φn−2 = rn−1 n−2 Y sinn−k−1 φk . k=1 Beweis. (i) Wir wenden den Umkehrsatz an. Die Abbildung f ist stetig differenzierbar, weil die partiellen Ableitungen existieren und stetig sind. ∂x = cos φ ∂r ∂x = −r sin φ ∂φ Die Determinante der Funktionalmatrix ist ! ∂x ∂x cos φ ∂r ∂φ det = det ∂y ∂y sin φ ∂r ∂φ ∂y = sin φ ∂r −r sin φ r cos φ ∂y = r cos φ ∂φ = r cos2 φ + r sin2 φ = r. 378 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Die Funktionalmatrix ist also für alle (r, φ) mit r 6= 0 von 0 verschieden. Somit ist f in allen diesen Punkten lokal invertierbar. Dies kann man auch leicht dadurch einsehen, dass man die Inverse berechnet. Aus x = r cos φ und x = r sin φ folgen r 2 = x2 + y 2 y = tan φ. x und Mit dem Satz über die Umkehrfunktion erhalten wir für die Ableitung der Inversen −1 df df −1 (f (r, φ)) = (r, φ) d(x, y) d(r, φ) bzw. df −1 (f (r, φ)) d(x, y) = = −r sin φ r cos φ y r = x cos φ sin φ x r − ry2 −1 = √ x x2 +y 2 y − x2 +y 2 r2 cos φ sin φ − 1r sin φ 1r cos φ ! √ 2y 2 x +y . x x2 +y 2 Da wir die Umkehrabbildung explizit ausgerechnet haben, können wir die Ableitung auch direkt ausrechnen. (ii) f ist wegen (i) in allen Punkten lokal umkehrbar, aber nicht global umkehrbar, weil f (r, φ) = f (r, φ + 2π). (iii) Für die Funktionaldeterminante von f erhalten wir ! ∂f1 ∂f1 2x 2y ∂x ∂y det = det = 2x2 − 2y 2 . ∂f2 ∂f2 y x ∂x ∂y Die Funktionaldeterminante ist also genau dann 0, wenn x2 = y 2 . Auch hier können wir die Inversen explizit berechnen. Aus u = x2 + y 2 und v = xy folgt x= v y und u= v2 + y2 . x2 Es folgt y4 − y2 u + v2 und damit s y= u + 2 r u2 − v2 . 4 (iv) Wir entwickeln die Determinante gemäss der Laplace Formel nach der letzten Spalte, d.h. der φn−1 -Spalte. In dieser Spalte sind nur die letzten beiden Koordinaten von 0 verschieden. ∂xn det ∂(r, φ1 , . . . , φn−1 ) ∂xnn−1 ∂xnn ∂xn ∂xn = det − det ∂φn−1 ∂(r, φ1 , . . . , φn−1 ) (n,n) ∂φn−1 ∂(r, φ1 , . . . , φn−1 ) (n−1,n) Weiter gilt ∂xnn−1 ∂xnn−1 ∂xn , , . . . , n−1 ∂r ∂φ1 ∂φn−2 ∂xnn ∂xnn ∂xnn , ,..., ∂r ∂φ1 ∂φn−2 = cos φn−1 = sin φn−1 n−1 ∂xn−1 ∂xn−1 n−1 ∂xn−1 , , . . . , n−1 ∂r ∂φ1 ∂φn−2 n−1 ∂xn−1 ∂xn−1 n−1 ∂xn−1 , , . . . , n−1 ∂r ∂φ1 ∂φn−2 ! . ! 6.11. UMKEHRABBILDUNGEN 379 Damit erhalten wir det ∂xn ∂(r, φ1 , . . . , φn−1 ) weil die letzte Zeile der Matrix det = cos φn−1 det (n,n) ∂xn ∂(r,φ1 ,...,φn−1 ) ∂xn ∂(r, φ1 , . . . , φn−1 ) ∂xn−1 ∂(r, φ1 , . . . , φn−2 ) gestrichen wird. Ebenso erhalten wir = sin φn−1 det (n−1,n) ∂xn−1 ∂(r, φ1 , . . . , φn−2 ) wobei wir beachten, dass die vorletzte Zeile gestrichen wird. Es folgt ∂xn det ∂(r, φ1 , . . . , φn−1 ) ∂xnn ∂xn−1 = cos φn−1 det ∂φn−1 ∂(r, φ1 , . . . , φn−2 ) ∂xn ∂xn−1 − sin φn−1 n−1 det ∂φn−1 ∂(r, φ1 , . . . , φn−2 ) n−2 Y ∂xn−1 =r sin φi det ∂(r, φ1 , . . . , φn−2 ) i=1 2 Es stellt sich die Frage, ob man beim Umkehrsatz die Voraussetzung, dass die Funktion stetig differenzierbar ist, abschwächen kann? Reicht vielleicht die Diffferenzierbarkeit aus? Dies ist nicht der Fall. Dazu das folgende Beispiel. Beispiel 6.11.2 Es sei f : R → R durch x + x2 cos xπ2 f (x) = 0 x 6= 0 x=0 definiert. f ist überall differenzierbar f 0 (0) = 1, aber nicht in 0 lokal umkehrbar. Beweis. Falls eine differenzierbare Funktion auf einem Intervall umkehrbar ist, so muss ihre Ableitung nicht negativ oder nicht positiv auf dem Intervall sein. Da f 0 (0) = 1, so muss die Ableitung auf dem Intervall nicht negativ sein. Es gilt f 0 (x) = 1 + 2x cos und für π 2π π + sin 2 2 x x x 1 x= q 2k + erhalten wir 0 f q 1 2k + 3 2 = 1 + 2q also 0 2k + f q r 3 3 3 cos 2kπ + π + 2π 2k + sin 2kπ + π 2 2 2 1 3 2 3 2 1 2k + 3 2 = 1 − 2π r 2k + 3 <0 2 380 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN 2 1 0.5 -1 -0.5 0.5 1 -0.5 -1 6.12 Implizite Funktionen Es sei U eine offene Teilmenge des Rn und fi : U → R, i = 1, . . . , m. Unter welchen Voraussetzungen kann man das Gleichungssystem fi (x) = 0 i = 1, . . . , m lösen? Kann man das Gleichungssystem nach bestimmten Variablen auflösen? Unter welchen Voraussetzungen sind die Lösungen differenzierbare Funktionen? Wir betrachten das Gleichungssystem x2 + y 2 + z 2 = 1 ex = sin y Dieses Gleichungssystem hat x = ln(sin y) p 1 − y 2 − | ln(sin y)|2 z = als eine Lösung (vorausgesetzt die Ausdrücke sind sinnvoll). Wir haben nach x und z aufgelöst. Es seien m, n ∈ N mit m < n und U eine offene Teilmenge des Rn . Weiter sei F : U → Rm eine Funktion. Wir sagen, dass das System F (x) = 0 bzw. fi (x) = 0 i = 1, . . . , m lokal in x0 nach x(1), . . . , x(m) auflösbar ist, falls es eine Umgebung V(x0 (m + 1), . . . , x0 (n)) von (x0 (m + 1), . . . , x0 (n)) ∈ Rn−m und eine eindeutige Funktion φ : V(x0 (m + 1), . . . , x0 (n)) → Rm 6.12. IMPLIZITE FUNKTIONEN 381 gibt, so dass für alle (x(m + 1), . . . , x(n)) ∈ V(x0 (m + 1), . . . , x0 (n)) und alle i = 1, . . . , m fi (φ1 (x(m + 1), . . . , x(n)), . . . , φm (x(m + 1), . . . , x(n)), x(m + 1), . . . , x(n)) = 0 und φ(x0 (m + 1), . . . , x0 (n)) = (x0 (1), . . . , x0 (m)) gilt. Wir sagen, dass φ implizit durch das Gleichungssystem definiert ist. Satz 6.12.1 Es seien m < n, U eine offene Teilmenge des Rn und F : U → Rm stetig differenzierbare Funktionen auf U. Es sei x0 ∈ U mit F (x0 ) = 0. Die Matrix m ∂fi (x0 ) ∂xk i,k=1 sei nicht singulär. Dann ist das Gleichungssystem F (x) = 0 lokal in x0 auflösbar und die Lösung φ ist auf einer Umgebung von (x0 (m+1), . . . , x0 (n)) stetig differenzierbar. Die Funktionalmatrix von φ berechnet sich durch m,n ∂φi (x0 (m + 1), . . . , x0 (n)) ∂xk i=1,k=m+1 m !−1 m,n ∂fi ∂fi =− (x0 ) (x0 ) . ∂xk ∂xk i,k=1 i=1,k=m+1 Satz 6.12.1 ist insbesondere dann von Interesse, wenn es zu kompliziert ist, ein Gleichungssystem aufzulösen. Der Satz hat also theoretisches Interesse. Er stellt nur sicher, dass es eine Lösung gibt, ohne jedoch eine explizite Formel für die Lösung zu liefern. Zum Beweis wird der Mittelwertsatz verwendet. Die Beweisidee und Formulierung geht auf lineare Gleichungssysteme zurück. Falls fi , i = 1, . . . , m, lineare Abbildungen sind, so hat man n X ai,k x(k) = 0 i = 1, . . . , m k=1 Dieses System lässt sich nach x(1), . . . , x(m) auflösen, wenn die Determinante der Matrix m ∂fi m (ai,k )i,k=1 = ∂xk i,k=1 von 0 verschieden ist, bzw. wenn diese Matrix eine Inverse besitzt. Wir überlegen uns dies. Es gilt n X ai,k x(k) = 0 i = 1, . . . , m k=1 382 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN genau dann, wenn m X k=1 ai,k x(k) = − n X ai,k x(k) i = 1, . . . , m k=m+1 gilt. A−1 sei die Inverse der Matrix A = (ai,k )m i,k=1 . Dann folgt !m x(1) n X A ... = − ai,k x(k) k=m+1 i=1 x(m) bzw. x(1) .. −1 . =A x(m) − n X !m ai,k x(k) k=m+1 . i=1 Der Schritt von einem linearen Gleichungssystem auf ein allgemeines wird durch Approximation mittels der Taylorpolynome 1. Grades vollzogen. n X ∂fi (x0 )hk fi (x0 + h) ∼ fi (x0 ) + ∂xk k=1 i = 1, . . . , m Beweis. Wir betrachten die ergänzte Abbildung F̃ : U → Rn mit F̃ (x) = (f1 (x), . . . , fm (x), xm+1 , . . . , xn ). Dann gilt det dF̃ dx ! = det ∂fi ∂xk m ! i,k=1 Nach dem Satz über die Umkehrabbildung (Satz 6.11.1) gibt es eine offene Umgebung W von F̃ (x0 ) und eine Inverse F̃ −1 : W → V zu F̃ mit F̃ −1 (y) = (ψ1 (y), . . . , ψm (y), ym+1 , . . . , yn ). Nun definieren wir φ :→ Rm durch φi (zm+1 , . . . , zn ) = ψi (0, . . . , 0, zm+1 , . . . , zn ) für alle i = 1, . . . , m. Es gilt x = F̃ (F̃ −1 (x)) = F̃ ((ψ1 (x), . . . , ψm (x), xm+1 , . . . , xn )). Für x = (0, . . . , 0, xm+1 , . . . , xn ) folgt für i = 1, . . . , m 0 = fi (ψ1 (0, . . . , 0, xm+1 , . . . , xn ), . . . , ψm (0, . . . , 0, xm+1 , . . . , xn ), xm+1 , . . . , xn ) = fi (φ1 (xm+1 , . . . , xn ), . . . , φm (xm+1 , . . . , xn ), xm+1 , . . . , xn ). 6.12. IMPLIZITE FUNKTIONEN 383 Also gilt F (φ(x)) = 0. Wir beweisen die Ableitungsformel. Es sei f = (f1 , . . . , fm ) und V eine offene Umgebung von (x0 (m + 1), . . . , x0 (n)) im Rn−m , so dass für alle (x(m + 1), . . . , xn ) ∈ V und alle φi : V → R i = 1, . . . , m gilt f (φ1 (x(m + 1), . . . , x(n)), . . . , φm (x(m + 1), . . . , x(n)), x(m + 1), . . . , x(n)) = 0. Wir definieren g : V → Rn durch g(x(m + 1), . . . , x(n)) = (φ1 (x(m + 1), . . . , x(n)), . . . , φm (x(m + 1), . . . , x(n)), x(m + 1), . . . , x(n)). Hiermit ergibt sich für alle (x(m + 1), . . . , x(n)) ∈ V f ◦ g(x(m + 1), . . . , x(n)) = 0. Deshalb gilt für alle (x(m + 1), . . . , x(n)) ∈ V d(f ◦ g) (x(m + 1), . . . , x(n)) = 0. d((x(m + 1), . . . , x(n))) Mit der Kettenregel (Satz 6.6.1) folgt für alle (x(m + 1), . . . , x(n)) ∈ V dg df (g(x(m + 1), . . . , x(n))) (x(m + 1), . . . , x(n)) = 0. dx d(x(m + 1), . . . , x(n)) In Matrizenschreibweise erhalten wir ∂f1 ∂x1 ... .. . ∂fm ∂x1 ∂f1 ∂xn .. . ... ∂fm ∂xn ∂φ1 ∂xm+1 ... ... .. . ∂φm ∂xm+1 1 0 .. . 0 ∂φ1 ∂xn .. . ... 0 1 ... ... ... ... ... 0 ∂φm ∂xn 0 = 0. 0 1 Es folgt für alle j = m + 1, . . . , n und alle i = 1, . . . , m m X ∂fi ∂fi ∂φk + = 0. ∂x ∂x k ∂xj j k=1 In Matrizenschreibweise ist dies m,n m m,n ∂fi ∂fi ∂φk − = . ∂xj i=1,j=m+1 ∂xk i,k=1 ∂xj k=1,j=m+1 384 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Beispiel 6.12.1 (i) Es sei f : R2 → R durch f (x, y) = x2 − y gegeben. (ii) Es sei f : R2 → R durch f (x, y) = y − x3 gegeben. f (x, y) = 0 kann lokal in (0, 0) nach x aufgelöst werden. Wir können aber nicht den Satz über implizite Funktionen anwenden, um dies sicherzustellen. (iii) Es sei f : (0, ∞) × (0, ∞) × (0, ∞) → R durch f (x, y, z) = xy + y z + z x − 3 gegeben. f (x, y, z) = 0 kann in (1, 1, 1) lokal nach x aufgelöst werden und die Ableitung von x(y, z) im Punkt (1, 1) ist dx (1, 1) = (−1, −1). d(y, z) (iv) Es sei f : R2 → R durch f (x, y) = x3 + y 3 − x + y gegeben. f hat in allen Punkten, in denen f (x, y) = 0 gilt, eine lokale Auflösung nach y. Im Punkt x = √13 hat die implizite Funktion ein striktes lokales Maximum und im Punkt x = − √13 ein striktes lokales Minimum. In allen anderen Punkten, in denen eine Auflösung möglich ist, liegen keine Extrema vor. Beweis. (i) Um die implizite Funktion f (x, y) = 0 bzw. x2 − y = 0 zu bestimmen, braucht man den Satz über implizite Funktionen nicht. Wir wollen aber an diesem Beispiel die Aussage des Satzes über implizite Funktionen studieren. Offensichtlich ist die Auflösung nach y die Funktion y = x2 . Um den Satz anzuwenden müssen wir ∂f = −1 ∂y berechnen. Diese 1 × 1 Matrix ist nicht singulär. Also ist f (x, y) = 0 in allen Punkten (x0 , y0 ) mit x20 − y0 = 0 lokal auflösbar. Die Ableitung lässt sich durch die Formel dy =− dx ∂f ∂y −1 ∂f = 2x ∂x berechnen. Da wir die Auflösung y = x2 kennen lässt sich dieses Ergebnis auch direkt berechnen. √ Als Auflösung nach x erhalten wir x = y. Der Satz kann angewendet werden und sagt aus, dass wir lokal auflösen können, falls die partielle Ableitung ∂f ∂x = 2x von 0 verschieden ist. Dies schließt den Punkt (0, 0) aus. Tatsächlich gibt es auch keine lokale Auflösung im Punkt (0, 0). Eine solche Funktion müsste nach Definition in einer Umgebung des Punktes 0 existieren. Die √ Auflösung y existiert aber nur rechts von 0. Die Berechnung der Ableitung liefert dx =− dy (ii) Offensichtlich ist x = angewendet werden, weil √ 3 ∂f ∂x −1 ∂f 1 1 = = √ . ∂y 2x 2 y y eine Auflösung nach x. Der Satz kann aber nicht in (0, 0) ∂f = −3x ∂x für x = 0 gleich 0 ist. (iii) Der Punkt (1, 1, 1) erfüllt die Gleichung. Wegen ∂f = yxy−1 + (ln z)z x ∂x 6.12. IMPLIZITE FUNKTIONEN 385 gilt ∂f (1, 1, 1) = 1. ∂x Also ist f im Punkt (1, 1, 1) nach x lokal auflösbar. Weiter gilt ∂f = (ln y)y z + xz x−1 ∂z ∂f = (ln x)xy + zy z−1 ∂y ∂f (1, 1, 1) = 1 ∂y ∂f (1, 1, 1) = 1 ∂z Damit erhalten wir ∂x ∂y (1, 1) ∂x ∂z (1, 1) =− ∂f (1, 1, 1) ∂x −1 ∂f ∂y (1, 1, 1) ∂f ∂z (1, 1, 1) = (−1, −1). (iv) Wegen ∂f = 3y 2 + 1 > 0 ∂y ist f (x, y) = 0 in allen Punkten (x0 , y0 ) mit f (x0 , y0 ) = 0 lokal auflösbar. dy =− dx ∂f ∂y −1 ∂f ∂x = 1 − 3x2 3y 2 + 1 Diese Gleichung erhält man auch so: Aus x3 + y 3 − x + y = 0 folgt 3x2 + 3y 2 y 0 − 1 + y 0 = 0 und damit y0 = 1 − 3x2 . 3y 2 + 1 Deshalb sind die einzigen kritischen Punkte x = √13 und x = − √13 . Tatsächlich gibt es ein y mit f ( √13 , y) = 0. Für einen solchen Wert y muss gelten 1 1 2 y 3 + y = √ − ( √ )3 = √ 3 3 3 3 2 Für y = 0 und y = 1 ergibt sich 0 < 3√ < 1. Also gibt es nach dem Zwischenwertsatz ein y mit 3 2 3 y + y = 3√3 . Ebenso verfahren wir für x = − √13 . Nun prüfen wir nach, dass in √1 3 y 00 = Für x = √1 3 ein Maximum und in − √13 ein Minimum liegt. (3y 2 + 1)(−6x) − (1 − 3x2 )6yy 0 (3y 2 + 1)2 erhalten wir 6 (3y 2 + 1)(−6x) − (1 − 3x2 )6yy 0 = − √ (3y 2 + 1) < 0. 3 2 386 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN 6.13 Lagrangesche Multiplikatoren Joseph Lagrange (1736-1813) wurde in Turin geboren. Er sollte Jura studieren, studierte aber Mathematik und wurde mit 19 Jahren Professor für Mathematik an der Königlichen Militär Schule in Turin. Er wurde von Friedrich II. zum Nachfolger von Euler an der Akademie der Wissenschaften in Berlin ernannt. Nach Friedrichs Tod ging er auf Einladung von Louis XVI. nach Paris. 1788 veröffentlichte er sein wichtigstes Werk ”Analytische Mechanik”. Dieses Werk setzt die Mechanik von Newton, den Bernoullis und Euler fort. Es wird die Idee entwickelt, dass Probleme in der Mechanik auf gewöhnliche und partielle Differentialgleichungen zurückzuführen sind. Da er sehr introvertiert war, überlebte er die Französische Revolution. Es sei U eine offene Teilmenge des Rn . Es seien f : U → R und g : U → Rm stetig differenzierbare Funktionen. Wir wollen die lokalen Extrema von f auf der Menge {x ∈ U|g(x) = 0} bestimmen. Wir bezeichnen dies als ein Extremwertproblem mit Nebenbedingungen. Satz 6.13.1 Es sei U eine offene Teilmenge des Rn . Es seien f : U → R und g : U → Rm stetig differenzierbare Funktionen. Es sei x0 ∈ U mit g(x0 ) = 0 und rg dg (x0 ) dx = m. Wir nehmen an, dass f in x0 einn lokales Extremum unter der Nebenbedingung g(x) = 0 habe. Dann gibt es ein λ ∈ Rm mit ∇f (x0 ) = m X i=1 λi ∇gi (x0 ). Die Zahlen λ1 , . . . , λm heißen Lagrangesche Multiplikatoren. Beweis. Wir können annehmen, dass die Matrix ∂g1 ∂g1 (x0 ) . . . ∂x (x ) 0 ∂x1 m .. .. . . ∂gm ∂gm (x0 ) . . . ∂xm (x0 ) ∂x1 nicht singulär ist, anderenfalls ordnen wir die Variablen x1 , . . . , xn neu. Aus dem Satz über implizite Funktionen folgt, dass g(x) = 0 lokal in x0 nach x(1), . . . , x(m) auflösbar ist. Also gibt es eine Umgebung V(x̃0 ) von x̃0 = (x0 (m + 1), . . . , x0 (n)) und eine Funktion φ : V → Rm mit g(φ1 (x(m + 1), . . . , x(n)), . . . , φm (x(m + 1), . . . , x(n)), x(m + 1), . . . , x(n)) = 0 6.13. LAGRANGESCHE MULTIPLIKATOREN 387 Wir definieren F (x(m + 1), . . . , x(n)) = f (φ1 (x(m + 1), . . . , x(n)), . . . , φm (x(m + 1), . . . , x(n)), x(m + 1), . . . , x(n)). Nach Voraussetzungen hat F in x̃0 ein lokales Extremum. Also erhalten wir mit der Kettenregel für alle k = m + 1, . . . , n m X ∂f ∂φi ∂f ∂F = (x0 ) (x̃0 ) + (x0 ) 0= ∂xk ∂x ∂x ∂x i k k i=1 wobei wir beachten, dass x0 = (φ1 (x0 (m + 1), . . . , x0 (n)), . . . , φm (x0 (m + 1), . . . , x0 (n)), x0 (m + 1), . . . , x0 (n)) Also gilt m X ∂f ∂φj ∂f (x0 ) = − (x0 ) (x̃0 ) ∂xk ∂xj ∂xk j=1 Wir definieren nun die Lagrangeschen Multiplikatoren durch das lineare Gleichungssystem m X ∂f ∂gi λi (x0 ) = (x0 ) j = 1, . . . , m ∂xj ∂xj i=1 Da die Matrix ∂gi (x0 ) ∂xj m i,j=1 nicht singulär ist, gibt es eine eindeutige Lösung λ. Damit haben wir auch die Bedingung m X ∇f (x0 ) = λi ∇gi (x0 ) i=1 für die Koordinaten j = 1, . . . , m erfüllt. Weiter erhalten wir ∂f (x0 ) ∂xk =− =− =− m X ∂f ∂φj (x0 ) (x̃0 ) ∂x ∂x j k j=1 m X m X λi j=1 i=1 m m X X λi i=1 j=1 ∂gi ∂φj (x0 ) (x̃0 ) ∂xj ∂xk ∂φj ∂gi (x0 ) (x̃0 ) ∂xj ∂xk Mit der Kettenregel erhalten wir für k = m + 1, . . . , n aus g(φ1 (x(m + 1), . . . , x(n)), . . . , φm (x(m + 1), . . . , x(n)), x(m + 1), . . . , x(n)) = 0 388 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN dass m X ∂gi ∂φj ∂gi (x0 ) = − (x0 ) (x̃0 ). ∂xk ∂x ∂x j k j=1 Somit erhalten wir für k = m + 1, . . . , n m X ∂gi ∂f (x0 ) = λi (x0 ). ∂xk ∂xk i=1 2 Beispiel 6.13.1 (Geometrisches und arithmetisches Mittel) Es sei x ∈ Rn mit xi ≥ 0, i = 1, . . . , n. Dann gilt ! n1 n n Y 1X xi ≤ xi n i=1 i=1 Beweis. Wir können das Problem auch so formulieren: Finde das Maximum von ! n1 n Y xi i=1 unter der Nebenbedingung n 1X xi = 1 n i=1 xi ≥ 0, i = 1, . . . , n. Es reicht, das Maximum der Funktion f : {x ∈ Rn |∀i : xi ≥ 0} → R f (x) = n Y xi i=1 mit der Nebenbedingung n 0 = g(x) = 1X xi − 1 n i=1 zu finden. Da die Funktion f auf der abgeschlossenen und beschränkten, also kompakten Menge n ( ) X n1 x∈R xi = 1 und xi ≥ 0, i = 1, . . . , n n i=1 stetig ist, nimmt diese Funktion dort Minimum und Maximum an. sichtlich in einem Punkt x mit xi > 0, i = 1, . . . , n angenommen. f und es wird in einem Punkt x mit xi > 0, i = 1, . . . , xn angenommen. dere ein relatives Maximum. Nun wenden wir Satz 6.13.1 auf die Funktion f an. Wir erhalten Y xi = λ 1≤i≤n i 6= k Es folgt für alle k = 1, . . . , n Das Maximum wird offenbesitzt somit ein Maximum Das Maximum ist insbesonaus ∂f ∂xk ∂g = λ ∂x , dass k 1 n n Y 1 xi = λ xk . n i=1 Pn Da xi 6= 0, i = 1, . . . , n, so gilt λ 6= 0. Damit gilt x1 = x2 = · · · = xn . Wegen n1 i=1 xi = 1 folgt weiter x1 = x2 = · · · = xn = 1. Also wird das Maximum im Punkt (1, 1, . . . , 1) angenommen. 2 6.14. DIFFERENTIATION IN BANACHRÄUMEN 6.14 389 Differentiation in Banachräumen René Maurice Fréchet wurde am 2. September 1878 in Maligny geboren. Er starb am 4. Juni 1973 in Paris. Er lehrte an der Universität Straßburg und in Paris an der École Normale Supérieure. Er arbeitete auf dem Gebiet der Topologie und Wahrscheinlichkeitstheorie. Lineare Abbildungen zwischen endlich-dimensionalen, normierten Räumen sind stetig. Wenn der Grundraum nicht endlich-dimensional ist, so gibt es lineare Abbildungen, die nicht stetig sind. Es seien X und Y Banachräume und U eine offene Teilmenge von X. Wir sagen, dass eine Funktion f : U → Y in einem Punkt x0 ∈ U schwach differenzierbar oder auch Gâteaux-differenzierbar ist, wenn es eine stetige, lineare Abbildung A : X → Y gibt, so dass für alle x f (x0 + tx) − f (x0 ) = A(x) t→0 t lim gilt. Wir sagen, dass f : U → Y in x0 differenzierbar bzw. Fréchet-differenzierbar ist, falls es eine stetige, lineare Abbildung A : X → Y , ein > 0 und eine Funktion φ : B(0, ) → Y gibt, so dass für alle x mit kxk < f (x0 + x) = f (x0 ) + A(x) + φ(x) und φ(x) =0 x→0 kxk lim gelten. Offensichtlich ist f in einem Punkt x0 Gâteaux-differenzierbar, wenn f in x0 Fréchet-differenzierbar ist. Lemma 6.14.1 (i) Die lineare Abbildung der Gâteaux-Differenzierbarkeit ist eindeutig. (ii) Die lineare Abbildung der Fréchet-Differenzierbarkeit ist eindeutig. (iii) Die lineare Abbildung der Gâteaux-Differenzierbarkeit und die der FréchetDifferenzierbarkeit stimmen überein. Wenn f Fréchet-differenzierbar ist, dann bezeichnen wir A als das Differential bzw. Fréchet Differential von f und schreiben f 0 (x0 ) Df (x0 ) Beweis. (i) Wir nehmen an, es gäbe zwei verschiedene, lineare, stetige Abbildungen A und B. Dann gelten für alle x f (x0 + tx) − f (x0 ) = A(x) t→0 t lim 390 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN und lim t→0 f (x0 + tx) − f (x0 ) = B(x). t Also gilt für alle x A(x) = B(x) und damit A = B. (ii) und (iii) folgen aus (i). Lemma 6.14.2 Es seien X und Y Banachräume und U eine offene Teilmenge von X. Es sei f : U → Y eine Abbildung, die in x0 Fréchet-differenzierbar ist. Dann ist sie in x0 stetig. Lemma 6.14.3 Es seien X und Y Banachräume und U eine offene Teilmenge von X. Es seien f, g : U → Y Abbildungen, die in x0 Fréchet-differenzierbar sind. Dann ist f + g in x0 Fréchet-differenzierbar. Beispiel 6.14.1 Es sei f : R2 → R durch ( f (x, y) = x·y 2 x2 +y 4 0 2 (x, y) 6= (0, 0) (x, y) = (0, 0) Dann ist f Gâteaux-differenzierbar, aber nicht Fréchet-differenzierbar. Das zweite Differential D2 f ist eine Abbildung von U nach L(X, L(X, Y )). 6.15. EQUIDISTRIBUTION THEOREM 6.15 391 Equidistribution theorem In mathematics, the equidistribution theorem is the statement that the sequence a, 2a, 3a, ... mod 1 is uniformly distributed on the circle R/Z?, when a is an irrational number. While this theorem was proved in 1909 and 1910 separately by Hermann Weyl, Waclaw Sierpinski and Piers Bohl, variants of this theorem continue to be studied to this day. E. Stein, R. Shakarchi: Fourier analysis Körner. Fourier analysis 392 CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN Chapter 7 Integration im Rn Für alle i = 1, . . . , n seien −∞ < ai < bi < ∞ . Die Menge n Y I= [ai , bi ] i=1 heißt abgeschlossenes, n-dimensionales Intervall. Die Zahl n Y µ(I) = (bi − ai ) i=1 heisst n-dimensionales Volumen, n-dimensionales Mass oder n-dimensionaler Inhalt von I. Eine Menge P = {I1 , . . . , Im } von abgeschlossenen Intervallen heißt Partition von I, wenn m [ ◦ ◦ Ik und Ik ∩ I` = ∅ k 6= ` I= k=1 gilt. Der Durchmesser δ(A) einer Menge A des Rn ist δ(A) = sup kx − yk x,y∈A Die Feinheit einer Partition P ist kPk = max δ(Ik ) 1≤k≤m Man kann leicht nachrechnen, dass für alle Partitionen P = {I1 , . . . , Im } von I µ(I) = m X µ(Ik ) k=1 0 gilt. Eine Partition P 0 = {I10 , . . . , Im 0 } von I heisst Verfeinerung der Partition P = {I1 , . . . , Im } von I, falls für jedes k 0 , k 0 = 1, . . . , m0 ein k, k = 1, . . . , m mit Ik0 ⊆ Ik existiert. 393 CHAPTER 7. INTEGRATION IM RN 394 Insbesondere gilt δ(Ik0 ) ≤ δ(Ik ) und damit kP 0 k ≤ kPk. Es sei I ein abgeschlossenes, n-dimensionales Intervall im Rn und f : I → R sei beschränkt auf I. P = {I1 , . . . , Im } sei eine Partition von I. Wir setzen mk (f ) = inf f (x) Mk (f ) = sup f (x) x∈Ik x∈Ik m(f ) = inf f (x) M (f ) = sup f (x) x∈I x∈I Die Zahl US P (f ) = m X mk (f )µ(Ik ) k=1 heißt Untersumme von f bezüglich P und die Zahl OS P (f ) = m X Mk (f )µ(Ik ) k=1 heißt Obersumme von f bezüglich P. Es gilt m(f )µ(I) ≤ US P (f ) ≤ OS P (f ) ≤ M (f )µ(I) Lemma 7.0.1 Es sei P 0 eine Verfeinerung von P. Dann gilt (i) OS P 0 (f ) ≤ OS P (f ) (ii) US P 0 (f ) ≥ US P (f ) Lemma 7.0.2 Es seien P1 und P2 Partitionen von I. Dann gilt US P1 (f ) ≤ OS P2 (f ) Als unteres Integral von f auf I bezeichnen wir Z Z f (x)dx = f (x1 , . . . , xn )d(x1 , . . . , xn ) = sup US P (f ) −I P −I Als oberes Integral von f auf I bezeichnen wir Z − Z − f (x)dx = f (x1 , . . . , xn )d(x1 , . . . , xn ) = inf OS P (f ) I P I Wir sagen, dass f auf I Riemann-integrierbar ist, falls sup US P (f ) = inf OS P (f ) P P gilt und nennen diese Zahl das Riemann-Integral von f über I. Diese Zahl wird mit Z Z f (x)dx = f (x1 , . . . , xn )d(x1 , . . . , xn ) I bezeichnet. I 395 Bemerkung 7.0.1 (i) Es gilt Z −I f (x)dx ≤ Z − f (x)dx I (ii) Für alle > 0 existiert ein δ, so dass für alle Partitionen P mit kPk ≤ δ Z Z f (x)dx − ≤ US P (f ) ≤ f (x)dx −I −I Z − Z − f (x)dx ≤ OS P (f ) ≤ f (x)dx + I I Beweis. (i) folgt sofort aus Lemma. 2 Satz 7.0.1 Es sei I ein abgeschlossenes, n-dimensionales Intervall und f : I → R sei auf I stetig. Dann ist f Riemann-integrierbar. Beweis. Da I abgeschlossen und beschränkt ist, ist I kompakt. Deshalb ist f nach Lemma auf I gleichmässig stetig. ∀ > 0∃δ > 0∀x, y ∈ I, d(x, y) < δ : |f (x) − f (y)| < µ(I) Es sei P = {I1 , . . . , Im } eine Partition von I mit kPk < δ. Dann gilt R R 0 ≤ I f (x)dx − −I f (x)dx ≤ OS P (f ) − US P (f ) m m X X mk (f )µ(Ik ) Mk (f )µ(Ik ) − = k=1 k=1 m m X X = (Mk (f ) − mk (f ))µ(Ik ) ≤ µ(Ik ) = µ(I) k=1 k=1 2 Bemerkung 7.0.2 Falls f (x) = c auf I gilt, dann gilt Z f (x)dx = cµ(I) I Es sei I ein abgeschlossenes, n-dimensionales Intervall und f : I → R sei auf I beschränkt. Es sei P = {I1 , . . . , Im } eine Partition von I. Es sei ξ = (ξ1 , . . . , ξm ) mit ξk ∈ Ik , k = 1, . . . , m. Dann heisst SP (f, ξ) = m X k=1 f (ξk )µ(Ik ) CHAPTER 7. INTEGRATION IM RN 396 Riemannsche Summe von f bzgl. P und ξ. Offensichtlich gilt US P (f ) ≤ SP (f, ξ) ≤ OS P (f ) Falls ein J ∈ R existiert, so dass für alle > 0 ein δ > 0 existiert, so dass für alle Partitionen P mit kPk < δ und für alle ξ |SP (f, ξ) − J| < gilt, dann sagen wir, dass die Riemannschen Summen gegen J konvergieren und schreiben J = lim SP (f, ξ) kPk→0 Satz 7.0.2 Es sei I ein abgeschlossenes, n-dimensionales Intervall. (i) Falls f auf I Riemann-integrierbar ist, so gilt Z lim SP (f, ξ) = f (x)dx kPk→0 I (ii) Falls lim SP (f, ξ) kPk→0 existiert, so ist f auf I Riemann-integrierbar und es gilt Z lim SP (f, ξ) = f (x)dx kPk→0 7.1 I Iterierte Integrale Satz 7.1.1 Es sei I = [a, b] × [c, d] und f : I → R sei Riemann-integrierbar. Für alle x ∈ [a, b] existiere das Integral d Z f (x, y)dy c Dann existiert das iterierte Integral Z bZ d f (x, y)dydx a c und es gilt Z bZ Z f (x, y)d(x, y) = I d f (x, y)dydx a c 7.1. ITERIERTE INTEGRALE 397 Beweis. Da f auf I integrierbar ist, gilt: Z ∀ > 0∃δ > 0∀P, kPk < δ : f (x, y)d(x, y) − US P (f ) < I Wir wählen nun spezielle Partitionen. Es seien Px = {x0 , . . . , xm } Py = {y0 , . . . , yn } und Partitionen von [a, b] und [c, d]. Dann ist i = 1, . . . , m j = 1, . . . , n Ii,j = [xi−1 , xi ] × [yj−1 , yj ] eine Partition P von I = [a, b] × [c, d]. Für die Feinheit der Partition P erhalten wir kPk = max 1≤i≤m → 1≤j≤n = max 1≤i≤m → 1≤j≤n sup{kx − yk |x ∈ Ii , y ∈ Jj } q (xi − xi−1 )2 + (yj − yj−1 )2 Mit der Dreiecksungleichung für die Euklidische Norm folgt kPk ≤ max |xi − xi−1 | + max |yj − yj−1 | ≤ kPx k + kPy k 1≤i≤m 1≤j≤n Da f auf I integrierbar ist, folgt ∀ > 0∃δ > 0∀Px , kPx k < δ, ∀Py , kPy k < δ : Z f (x, y)d(x, y) − ≤ US P (f ) I = = m,n X i,j=1 m X i=1 inf (x,y)∈Ii,j f (x, y) µ(Ii,j ) (xi − xi−1 ) n X j=1 inf (x,y)∈Ii,j f (x, y) (yj − yj−1 ) Es seien ξi ∈ [xi−1 , xi ]. Dann folgt weiter ∀ > 0∃δ > 0∀Px , kPx k < δ, ∀ξ∀Py , kPy k < δ : Z m n X X f (x, y)d(x, y) − ≤ (xi − xi−1 ) ( I i=1 j=1 inf (ξi ,y)∈Ii,j f (x, y))(yj − yj−1 ) Die inneren Summen sind Untersummen für Integrale über Funktionen f (ξi , y), wobei y die Variable ist. Nach Voraussetzung sind diese Funktionen integrierbar. Also gilt ∀ > 0∃δ > 0∀Px , kPx k < δ, ∀ξ, ξi ∈ [xi−1 , xi ] : Z Z d m X f (x, y)d(x, y) − ≤ (xi − xi−1 ) f (ξi , y)dy I i=1 c CHAPTER 7. INTEGRATION IM RN 398 Die rechte R d Seite dieser Ungleichung ist eine Riemannsche Summe für die Funktion F (x) = c f (x, y)dy. Es gilt ∀ > 0∃δ > 0∀Px , kPx k < δ, ∀ξ, ξi ∈ [xi−1 , xi ] : Z m X f (x, y)d(x, y) − ≤ (xi − xi−1 )F (ξi ) I i=1 Ebenso erhalten wir ∀ > 0∃δ > 0∀Px , kPx k < δ, ∀ξ, ξi ∈ [xi−1 , xi ] : Z m X f (x, y)d(x, y) + ≥ (xi − xi−1 )F (ξi ) I i=1 Damit erhalten wir ∀ > 0∃δ > 0∀Px , kPx k < δ, ∀ξ, ξi ∈ [xi−1 , xi ] : Z m X (xi − xi−1 )F (ξi ) < f (x, y)d(x, y) − I i=1 Nach Satz ?? ist die Funktion F auf [a, b] integrierbar und Z bZ d Z f (x, y)dydx f (x, y)d(x, y) = a I 2 c Bemerkung 7.1.1 (i) Aus der Existenz des Integrals Z f (x, y)d(x, y) I folgt nicht die Existenz der iterierten Integrale. Ebenso folgt aus der Existenz der iterierten Integrale nicht notwendig die des Integrals. (ii) Es sei f : [a, b] × [c, d] → R eine stetige Funktion. Dann ist f integrierbar, die iterierten Integrale existieren und es gilt Z Z dZ b Z bZ d f (x, y)d(x, y) = f (x, y)dxdy = f (x, y)dydx [a,b]×[c,d] c a a c Dies ist ein Spezialfall des Satzes von Fubini. Als ein Beispiel zum ersten Teil der Bemerkung kann die folgende Funktion angeführt werden. f : [0, 1] × [0, 1] → R ist durch ( 1 falls x = 21 und y ∈ Q f (x, y) = 0 sonst gegeben. Das Integral von f existiert und ist gleich 0, aber das Integral Z 1 f ( 12 , y)dy 0 existiert nicht. 7.1. ITERIERTE INTEGRALE 399 Beispiel 7.1.1 (i) Es sei f : [0, 1] × [0, 1] → R durch f (x, y) = xy gegeben. Dann ist f integrierbar und es gilt Z f (x, y)d(x, y) = 14 [0,1]×[0,1] (ii) Es sei f : [1, e] × [1, e] → R durch f (x, y) = xy gegeben. Dann ist f integrierbar und es gilt Z Z e+1 y e e+1 dy − ln f (x, y)d(x, y) = y 2 2 [1,e]×[1,e] Das nichtausgewertete Integral hängt mit dem Exponentialintegral Ei zusammen. (iii) Es sei f : [2, 4] × [3, 5] → R durch f (x, y) = ex+y gegeben. Dann ist f integrierbar und es gilt Z f (x, y)d(x, y) = (e4 − e2 )(e5 − e3 ) [0,1]×[1,2] (iv) Es seien g : [a, b] → R und h : [c, d] → R integrierbare Funktionen und f : [a, b] × [c, d] → R sei durch f (x, y) = g(x)h(y) gegeben. Dann ist f integrierbar und es gilt Z Z Z d b h(y)dy g(x)dx f (x, y)d(x, y) = c a [a,b]×[c,d] (v) Es sei f : [0, 1] × [0, 1] → R durch f (x, y) = cos(xy) gegeben. Dann ist f integrierbar und es gilt Z f (x, y)d(x, y) = Si(1) = 0.94608 . . . [0,1]×[0,1] wobei Si(x) den Integralsinus bezeichnet, der durch Z x sin t dt Si(x) = t 0 festgelegt ist. Beweis. (i) f ist stetig, also ist f integrierbar und die iterierten Integrale existieren und sind gleich dem Integral. Z Z 1Z 1 Z 1 Z 1 2 1 1 1 f (x, y)d(x, y) = xydydx = [ 2 xy ]0 dx = 2 xdx = 41 [0,1]×[0,1] 0 0 0 0 (ii) f ist stetig, also ist f integrierbar und die iterierten Integrale existieren und sind gleich dem Integral. Z Z eZ e Z e y 1 f (x, y)d(x, y) = x dxdy = [ y+1 xy+1 ]e1 dy [1,e]×[1,e] 1 Z e 1 y+1 1 e 1 = − dy = y+1 1 y+1 Z e+1 y e e+1 = dy − ln y 2 2 Z 2 e+1 ey dy − [ln(y + 1)]e1 y CHAPTER 7. INTEGRATION IM RN 400 (iii) Z Z f (x, y)d(x, y) 4 Z 5 e = 2 [2,4]×[3,5] Z Z x+y Z 5 dydx = 2 3 4 = 4 Z [ex ey ]53 dx = 2 2 ex ey dydx 3 4 ex (e5 − e3 )dx (v) Da f stetig ist, gilt 1 Z Z 1 Z f (x, y)d(x, y) = [0,1]×[0,1] cos(xy)dxdy 0 0 Es gilt 1 Z 0 sin y y cos(xy)dx = 1 falls y 6= 0 falls y = 0 Diese Funktion der Variablen y ist auf [0, 1] stetig. Damit erhalten wir 1 Z Z f (x, y)d(x, y) = 0 [0,1]×[0,1] sin y dy = Si(1) y 2 Beispiel 7.1.2 Es sei f : [0, 1] × [0, 1] → R durch falls x = 0 oder y = 0 0 f (x, y) = x−y falls x = 6 0 und y = 6 0 (x + y)3 f ist nicht Riemann-intgrierbar, die iterierten Integrale existieren und es gilt Z 0 1 Z 0 1 f (x, y)dxdy = − 12 Z 1 Z 1 f (x, y)dydx = 0 0 1 2 Beweis. f ist nicht Riemann-integrierbar, weil f unbeschränkt ist. Dazu betrachten wir die Gerade y = 2x. Auf dieser Geraden nimmt f die folgenden Werte an f (x, 2x) = − x 1 =− 3 27x 27x2 Für x ∈ (0, 1] ist diese Funktion nicht beschränkt. Wir zeigen nun, dass die iterierten Integrale existieren. Es gilt f (0, x) = 0 und ist integrierbar. Für y 6= 0 ist x−y x 6= 0 f (x, y) = (x + y)3 0 x=0 eine Funktion in x, die auf (0, 1] stetig und auf [0, 1] beschränkt ist, also integrierbar. Es gilt Z 0 1 1 x−y x 1 dx = − =− 3 2 (x + y) (x + y) 0 (1 + y)2 7.1. ITERIERTE INTEGRALE 401 Damit erhalten wir 1 Z 1 Z 0 0 x−y dxdy = (x + y)3 1 Z − 0 1 1 1 dy = = − 12 (1 + y)2 1+y 0 Andererseits erhalten wir Z 1 0 1 y x−y 1 dy = = (x + y)3 (x + y)2 0 (1 + y)2 und Z 1 1 Z 0 0 x−y dydx = (x + y)3 1 Z 0 1 1 1 dy = − = (1 + y)2 1+y 0 1 2 2 Satz 7.1.2 Es sei I = [a1 , b1 ]×[a2 , b2 ]×· · ·×[an , bn ] und f : I → R sei integrierbar. Für k mit 1 ≤ k ≤ n bezeichnen wir Ixk = [a1 , b1 ] × · · · × [ak−1 , bk−1 ] × [ak+1 , bk+1 ] × · · · × [an , bn ] (i) Es existiere für jedes xk ∈ [ak , bk ] das Integral Z f (x1 , . . . , xn )d(x1 , . . . , xk−1 , xk+1 , . . . , xn ) Ixk Dann existiert das iterierte Integral Z bk Z f (x1 , . . . , xn )d(x1 , . . . , xk−1 , xk+1 , . . . , xn )dxk ak Ix k und ist gleich dem Integral Z f (x)dx I (ii) Falls für alle (x1 , . . . , xk−1 , xk+1 , . . . , xn ) ∈ Ixk das Integral Z bk f (x1 , . . . , xn )dxk ak existiert, so existiert auch das iterierte Integral Z Z bk f (x1 , . . . , xn )dxk d(x1 , . . . , xk−1 , xk+1 , . . . , xn ) Ixk ak und ist gleich Z f (x)dx I CHAPTER 7. INTEGRATION IM RN 402 Beispiel 7.1.3 Es sei f : [0, 1] × · · · × [0, 1] → R durch f (x1 , . . . , xn ) = n Y xk k=1 gegeben. f ist integrierbar und Z f (x)dx = [0,1]×···×[0,1] 1 2n Beweis. f ist stetig und damit integrierbar. Es gilt Z Z f (x)dx = [0,1]×···×[0,1] 1 n 1Y xk dx1 · · · dxn 0 k=1 Z 1 Z 1 Y n 1 xk dx2 · · · dxn ··· 2 0 0 k=1 0 = ··· Z Mit Induktion erhalten wir das Ergebnis. 2 7.2 Riemann-Integral auf beschränkten Mengen Es sei X eine Teilmenge des Rn und f : X → R. Wir bezeichnen fX : Rn → R mit ( f (x) x∈X fX (x) = 0 x∈ /X als Erweiterung von f auf den Rn . Falls X eine beschränkte Menge vom Rn ist, I ein n-dimensionales, abgeschlossenes Intervall mit X ⊆ I und f : X → R beschränkt ist, so bezeichnen wir Z Z Z − Z − f (x)dx = fX (x)dx f (x)dx = fX (x)dx −X −I X I als Unter- und Oberintegral. Man kann leicht zeigen, dass die Ausdrücke nicht von der Wahl des Intervalles I abhängen. Wir sagen, dass f auf X Riemann-integrierbar ist, falls Z Z − f (x)dx = −X und bezeichnen diese Zahl mit f (x)dx X Z f (x)dx X 7.3. DAS MASS VON MENGEN 403 Satz 7.2.1 Es sei X eine beschränkte Teilmenge des Rn und g, f : X → R seien Riemann-intgrierbar. Dann sind auch g + f , cf , |f | und gf Riemann-integrierbar und es gelten (i) Z Z cf dx = c f dx X X (ii) Z Z f + gdx = X Z f dx + gdx X X (iii) Z Z f (x)dx ≤ |f (x)|dx X 7.3 X Das Maß von Mengen Es sei X eine beschränkte Teilmenge des Rn , I ein abgeschlossenes, n-dimensi-onales Intervall mit X ⊆ I und P = {I1 , . . . , Im } eine Partition von I. Wir bezeichnen X X µ(Ik ) M P (X) = µ(Ik ) M P (X) = Ik ⊆X Ik ∩X6=∅ Die Zahlen µ(X) = sup M P (X) µ(X) = inf M P (X) P P heissen inneres und äußeres Riemann Maßvon X. Die Menge X heißt Riemann messbar, wenn µ(X) = µ(X) gilt, und diese Zahl bezeichnen wir als Riemann Maß µ(X) von X. Lemma 7.3.1 Es sei X eine beschränkte Teilmenge des Rn . X ist genau dann Riemann-messbar, wenn die charakteristische Funktion χX ( 1 falls x ∈ X χX (x) = 0 falls x ∈ /X Riemann-integrierbar ist. Es gilt für X ⊆ I Z µ(X) = Z χX dx = I dx X Beweis. Es sei I ein abgeschlossenes, n-dimensionales Intervall und P = {I1 , . . . , Im } eine Partition von I. Dann gilt m X X US P (χX ) = inf χX (x) µ(Ik ) = µ(Ik ) = M P (X) k=1 x∈Ik Ik ⊆X CHAPTER 7. INTEGRATION IM RN 404 OS P (χX ) = m X k=1 sup χX (x) µ(Ik ) = x∈Ik X µ(Ik ) = M P (X) Ik ∩X6=∅ Es folgt 2 OS P (χX ) − US P (χX ) = M P (X) − M P (X) Beispiel 7.3.1 Die Teilmenge [0, 1] ∩ Q von R ist nicht Riemann-messbar. Wir hatten bereits gezeigt, dass die Funktion χ[0,1]∩Q nicht Riemann-integrierbar ist. Lemma 7.3.2 (i) Es seien A und B beschränkte Teilmengen des Rn mit A∩B = ∅. Dann gilt µ(A ∪ B) ≤ µ(A) + µ(B) (ii) Es seien A und B Riemann-messbare Teilmengen des Rn mit A ∩ B = ∅. Dann ist auch A ∪ B Riemann-messbar und es gilt µ(A ∪ B) = µ(A) + µ(B) (iii) Es seien A und B Riemann-messbare Teilmengen des Rn mit A ⊆ B. Dann ist B \ A Riemann-messbar und es gilt µ(B \ A) = µ(B) − µ(A) Eine Riemann-messbare Teilmenge A des Rn heisst Nullmenge, falls µ(A) = 0. Wir definieren µ(∅) = 0. Beweis. (ii) Es gilt wegen Lemma ?? Z µ(A) = χA dx Z µ(B) = χB dx Damit folgt, dass χA + χB integrierbar ist und Z Z Z µ(A) + µ(B) = χA dx + χB dx = χA + χB dx Weil A und B disjunkt sind erhalten wir Z µ(A) + µ(B) = 2 χA∪B dx 7.3. DAS MASS VON MENGEN 405 Beispiel 7.3.2 (i) Eine Teilmenge von Rn , die nur aus endlichen vielen Punkten besteht, ist eine Nullmenge. (ii) Die Cantor-Menge ist eine Nullmenge. (iii) Eine beschränkte Teilmenge X von Rn , die ganz in einer Hyperebene Hj = {x ∈ Rn |xj = const.} enthalten ist, ist eine Nullmenge. (iv) Die Vereinigung von endlich vielen Nullmengen ist eine Nullmenge. Beweis. (iii) Da X eine beschränkte Teilmenge vom Rn ist, gibt es ein K > 0, so dass X ⊆ [−K, K] × · · · × [−K, K] Ausserdem ist X eine Teilmenge von Hj X ⊆ R × · · · × R × [c − , c + ] × R × · · · × R Deshalb gilt für alle > 0 X ⊆ [−K, K] × · · · × [−K, K] × [c − , c + ] × [−K, K] × · · · × [−K, K] Somit gilt für alle > 0 0 ≤ µ(X) ≤ µ(X) ≤ (2K)n−1 2 Also gilt 0 = µ(X) = µ(X) 2 Der Rand ∂X einer Teilmenge X eines metrischen Raumes ist ◦ ∂X = X\ X Satz 7.3.1 Eine beschränkte Teilmenge X des Rn ist genau dann Riemann-messbar, wenn µ(∂X) = 0. Beweis. Es gelte µ(∂X) = 0 und I sei ein abgeschlossenes, n-dimensionales Intervall mit X ⊆ I. Da I abgeschlossen ist, so gilt X ⊆ I. Es sei P = {I1 , . . . , Im } eine Partition von I mit M P (∂X) < CHAPTER 7. INTEGRATION IM RN 406 Es gilt X µ(X) − µ(X) ≤ M P (X) − M P (X) = ≤ X Ik ∩X6=∅ µ(Ik ) − X Ik ∩X6=∅ X µ(Ik ) = ◦ Ik ⊆→X µ(Ik ) − X µ(Ik ) Ik ⊆X µ(Ik ) = M P (∂X) < Ik ∩∂X6=∅ Es folgt, dass µ(X) = µ(X). Also ist X Riemann-integrierbar. Die Umkehrung wollen wir nur für abgeschlossene Mengen zeigen. Es sei I ein abgeschlossenes, n-dimensionales Intervall mit X ⊆ I und P = {I1 , . . . , Im } eine Partition mit M P (X) − M P (X) < Wir setzen ) [ x ∈ ∂X x ∈ / Ik ( X1 = ) [ x ∈ ∂X x ∈ Ik ( X2 = Ik ⊆X Ik ⊆X Offenbar gilt ∂X = X1 ∪ X2 X1 ∩ X2 = ∅ S x ∈ X2 bedeutet, dass x nicht innerer Punkt der Menge Ik ⊆X Ik sein kann. Sonst wäre x ja auch innerer Punkt von X und nicht Randpunkt von X. Also ist x Randpunkt einer der n-dimensionalen Intervalle Ik . Die Ränder von Ik liegen in Hyperebenen der Art Hj {x ∈ Rn |xj = c} Mit Beispiel ?? folgt, dass µ(X2 ) = 0. Damit ergibt sich µ(∂X) = µ(X1 ∪ X2 ) ≤ µ(X1 ) + µ(X2 ) = µ(X1 ) ≤ M P (X1 ) = X µ(Ik ) Ik ∩X1 6=∅ Es gilt {k|Ik ∩ X1 6= ∅} = {k|Ik ∩ ∂X 6= ∅ und Ik * X} = {k|Ik ∩ ∂X 6= ∅} \ {k|Ik ⊆ X} ⊆ {k|Ik ∩ X 6= ∅} \ {k|Ik ⊆ X} Da X eine abgeschlossene Menge ist, gilt X = X und wir erhalten {k|Ik ∩ X1 6= ∅} ⊆ {k|Ik ∩ X 6= ∅} \ {k|Ik ⊆ X} Damit folgt µ(∂X) ≤ X Ik ∩X1 6=∅ µ(Ik ) ≤ X Ik ∩X6=∅ µ(Ik ) − X Ik ⊆X µ(Ik ) = M P (X) − M P (X) < Also gilt für alle > 0, dass 0 ≤ µ(∂X) ≤ µ(∂X) < . Somit gilt µ(∂X) = µ(∂X) = 0. 2 7.3. DAS MASS VON MENGEN 407 Korollar 7.3.1 Falls die Teilmenge X des Rn Riemann-messbar ist, so sind auch ◦ X und X Riemann-messbar und es gilt ◦ µ(X) = µ(X ) = µ(X) Beweis. Es sei X Riemann-messbar. Dann ist nach Satz auch ∂X Riemann-messbar und µ(∂X) = 0. Es folgt ◦ ◦ µ(X\ X ) ≤ µ(X\ X ) = µ(∂X) = 0 ◦ Also ist X\ X eine Nullmenge und damit insbesondere messbar. ◦ ◦ Weiter folgt hiermit und mit Lemma, dass X \ (X\ X ) =X messbar ist und ◦ ◦ µ(X ) = µ(X) − µ(X\ X ) = µ(X) ◦ Wiederum mit Lemma ??folgt, dass X =X ∪∂X messbar ist und ◦ ◦ ◦ µ(X) = µ(X ∪∂X) = µ(X ) + µ(∂X) = µ(X ) 2 Als Anwendung dieses Korollars wollen wir zeigen, dass [0, 1]∩Q nicht Riemannmessbar ist. Wir nehmen an, dass [0, 1] ∩ Q Riemann-messbar ist. Es gilt [0, 1] ∩ Q = [0, 1] ([0, 1] ∩ Q)◦ = ∅ Nach Korollar ?? gilt 0 = µ(∅) = µ([0, 1]) = 1 Dies ist ein Widerspruch. Lemma 7.3.3 Eine Teilmenge X vom Rn ist genau dann eine Nullmenge, wenn es zu jedem > 0 endlich viele abgeschlossene, n-dimensionale Intervalle I1 , . . . , Im gibt, so dass m m [ X X⊆ Ik µ(Ik ) < k=1 k=1 Beispiel 7.3.3 Es sei X eine kompakte Teilmenge des Rn und f : X → Rm sei eine stetige Funktion. Dann ist die Teilmenge {(x, f (x))|x ∈ X} des Rn+m eine Nullmenge. CHAPTER 7. INTEGRATION IM RN 408 Beweis. Da X kompakt und f stetig ist, ist f gleichmässig stetig. ∀∃δ∀x, y ∈ X, kx − yk < δ : kf (x) − f (y)k < Es sei I ein abgeschlossenes, n-dimensionales Intervall mit X ⊆ I. Wir wählen nun eine Partition P = {I1 , . . . , IN }, so dass für alle i = 1, . . . , N gilt, dass δ(Ii ) < δ. Wegen der gleichmässigen Stetigkeit von f gilt ∀i = 1, . . . , N ∀x, y ∈ Ii ∩ X : kf (x) − f (y)k < Es folgt ∀i, Ii ∩ X 6= ∅, ∃xi ∈ Ii ∀x ∈ Ii : (x, f (x)) ∈ Ii × [f1 (xk ) − , f1 (xi ) + ] × · · · × [fm (xk ) − , fm (xi ) + ] Hieraus folgt für alle > 0 µ({(x, f (x))|x ∈ X}) X ≤ µ(Ii × [f1 (xk ) − , f1 (xi ) + ] × · · · × [fm (xk ) − , fm (xi ) + ]) Ii ∩X6=∅ ≤ N X µ(Ii )(2)m = (2)m µ(I) i=1 Also gilt µ({(x, f (x))|x ∈ X}) = 0. 2 Beispiel 7.3.4 (i) Es sei f : [−1, 1] → R durch f (x) = √ {(x, 1 − x2 )|x ∈ [−1, 1]} √ 1 − x2 gegeben. Dann ist eine Nullmenge im R2 . Hieraus folgt, dass {(x, y)|x2 + y 2 = 1} eine Nullmenge ist. Pn−1 2 xi ≤ 1} → R durch (ii) Es sei f : {(x1 , . . . , xn−1 )| i=1 v u n−1 u X t f (x1 , . . . , xn−1 ) = 1 − x2i i=1 gegeben. Dann ist v u n−1 n−1 u X X (x1 , . . . , xn−1 , t1 − x2i )| x2i ≤ 1 i=1 eine Nullmenge im Rn . Hieraus folgt, dass eine Nullmenge ist. {x| kxk = 1} i=1 7.4. BERECHNUNG VON INTEGRALEN 7.4 409 Berechnung von Integralen Es sei X eine beschränkte Teilmenge des R2 und f : X → R sei messbar. Es seien y, y : [a, b] → R zwei stetige Funktionen, so dass X = {(x, y)|a ≤ x ≤ b und y(x) ≤ y ≤ y(x)} Man kann das Integral folgendermaßen berechnen Z Z b Z y(x) f (x, y)d(x, y) = f (x, y)dydx a X y(x) Beispiel 7.4.1 Es sei X = {(x, y)|0 ≤ x ≤ 1 und x2 ≤ y ≤ x} und f : X → R sei durch f (x, y) = x + y gegeben. Dann gilt Z 3 f (x, y)d(x, y) = 20 X Beweis. Wir überlegen uns, dass f eine integrierbare Funktion ist. Nach Beispiel ist X messbar und damit χX integrierbar. Die Funktion f˜ : [0, 1] × [0, 1] → R mit f (x, y) = x + y ist eine stetige Funktion, also integrierbar. Das Produkt von zwei integrierbaren Funktionen ist wieder integrierbar, also ist χX f˜ = fX integrierbar. Z 1 Z 1Z x Z [xy + 12 y 2 ]xx2 dx x + ydydx = f (x, y)d(x, y) = 2 0 X Z0 1 x 3 2 1 5 1 3 = x − x3 − 12 x4 dx = 21 x3 − 41 x4 − 10 x 0 = 20 2 0 2 Dies kann man auch für den Rn formulieren. Es sei X eine kompakte Teilmenge des Rn . Es seien X(n−1) eine kompakte Teilmenge des Rn−1 und xn , xn : X(n−1) → R, so dass X = {x|xn (x1 , . . . , xn−1 ) ≤ xn ≤ xn (x1 , . . . , xn−1 ), (x1 , . . . , xn−1 ) ∈ X(n − 1)} Weiter seien X(k − 1), 2 ≤ k ≤ n − 1 kompakte Teilmengen des Rk−1 und xk , xk : X(k − 1) → R seien stetige Funktionen, so dass X(k) = {x|xk (x1 , . . . , xk−1 ) ≤ xk ≤ xk (x1 , . . . , xk−1 ), (x1 , . . . , xk−1 ) ∈ X(k − 1)} Außerdem gelte X(1) = {x1 |a ≤ x1 ≤ b} = [a, b] Dann gilt für stetige Funktionen Z Z b Z x2 (x1 ) Z f (x)dx = ··· X a x2 (x1 ) xn (x1 ,...,xn−1 ) xn (x1 ,...,xn−1 ) f (x)dxn dxn−1 · · · dx1 CHAPTER 7. INTEGRATION IM RN 410 Beispiel 7.4.2 Es sei X = {(x, y, z)| 0 ≤ x, y, z und x + y + z ≤ 1} und f : X → R sei durch f (x, y, z) = 1 gegeben. Dann gilt Z f (x, y, z)d(x, y, z) = 61 X Beweis. Es gilt {(x, y, z)|0 ≤ x, y, z und x + y + z ≤ 1} = {(x, y, z)|0 ≤ x ≤ 1, 0 ≤ y ≤ 1 − x, 0 ≤ z ≤ 1 − x − y} Damit erhalten wir Z f (x, y, z)d(x, y, z) Z 1 Z 1−x Z 1−x−y Z 1 Z 1−x [z]1−x−y dydx dzdydx = 0 0 0 0 0 0 Z 1 Z 1 Z 1−x [y − xy − 12 y 2 ]01−x dx 1 − x − ydydx = = 0 Z0 1 0 1 = − x + 12 x2 dx = [ 12 x − x2 + 16 x3 ]10 = 61 2 = X 0 2 7.5 Transformationsformel für Integrale Satz 7.5.1 Es sei U eine offene Teilmenge des Rn und g : U → Rn eine stetig differenzierbare Abbildung, die U eineindeutig auf V = g(U) abbildet. Für alle y ∈ U gelte dg det (y) 6= 0 dy Es sei K eine messbare, kompakte Teilmenge von V und f : K → R sei auf K stetig. Dann gilt Z Z dg f (x)dx = f (g(y)) det (y) dy dy K g −1 (K) Diese Formel ist die Verallgemeinerung der Substitutionsformel für Funktionen einer Variablen. Z b Z φ−1 (b) f (x)dx = f (φ(t))φ0 (t)dt a φ−1 (a) 7.5. TRANSFORMATIONSFORMEL FÜR INTEGRALE 411 Man beachte, dass in der Verallgemeinerung der Absolutbetrag der Determinante genommen wird. Zum Verständnis dieser Formel erinnere man sich daran, dass der Absolutbetrag der Determinante gleich dem Volumen des von den Spaltenvektoren aufgespannten Parallelflachs ist. Die Funktionaldeterminante von g beschreibt die Änderung, die das Volumen unter der Transformation g erfährt. Beispiel 7.5.1 Das Volumen der n-dimensionalen Euklidischen Kugel mit Radius R n ) ( X 2 n |xi | ≤ R x∈R i=1 ist n Rn π2 Γ( n2 + 1) Beweis. Wir benutzen Polarkoordinaten. g : [0, R] × [0, π] × · · · × [0, π] × [0, 2π] → Rn g(r, φ1 , . . . , φn−1 ) = x = (x1 , x2 , . . . , xn ) x1 = r cos φ1 x2 = r sin φ1 cos φ2 x3 = r sin φ1 sin φ2 cos φ3 .. . xn−1 = r sin φ1 . . . sin φn−2 cos φn−1 xn = r sin φ1 . . . sin φn−2 sin φn−1 g bildet [0, R] × [0, π] × · · · × [0, π] × [0, 2π] auf {x| kxk ≤ R} ab. Die Abbildung g ist auf (0, R) × (0, π) × · · · × (0, π) × (0, 2π) injektiv. Wir weisen die Injektivität nach. Es gelte g(r, φ1 , . . . , φn−1 ) = x = g(r̃, φ̃1 , . . . , φ̃n−1 ) Es folgt r = kxk = r̃. Also gilt r = r̃. Weiter gilt r cos φ1 = r̃ cos φ̃1 = r cos φ̃1 Also gilt cos φ1 = cos φ̃1 . Auf dem Intervall (0, π) ist der Cosinus aber injektiv, also gilt φ1 = φ̃1 . Durch Induktion erhalten wir nun, dass alle weiteren Winkel ebenfalls gleich sein müssen. Um das Volumen zu berechnen wollen wir nun die Transformationsformel anwenden. Auf der offenen Menge (0, R) × (0, π) × · · · × (0, π) × (0, 2π) ist g injektiv und stetig differenzierbar. Als kompakte Teilmenge wählen wir I = [, R − ] × [, π − ] × [, π − ] × · · · × [, π − ] × [, 2π − ] Wir erhalten dann Z µ(g(I )) = g(I ) Z ∂(x1 , . . . , xn ) dx = ∂(r, φ1 , . . . , φn−1 ) d(r, φ1 , . . . , φn−1 ) I CHAPTER 7. INTEGRATION IM RN 412 Man kann zeigen, dass für → 0 die linke Seite der Gleichung gegen µ(I0 ) konvergiert (wir verzichten hier auf das Argument). Damit ist das Volumen gleich Z ∂(x1 , . . . , xn ) d(r, φ1 , . . . , φn−1 ) I ∂(r, φ1 , . . . , φn−1 ) Z π Z 2π Z RZ π rn−1 sinn−2 φ1 · · · sin φn−2 drdφ1 · · · dφn−1 ··· = 0 0 0 0 Z π Z 2π sin φn−2 dφn−2 dφn−1 sinn−2 φ1 dφ1 · · · rn−1 dr 0 0 0 0 Z Z π 2π n π n−2 = sin φ1 dφ1 · · · sin φn−2 dφn−2 R n 0 0 Z R Z π = π 2 Z sin2m xdx = 0 m (2m − 1)(2m − 3) · · · 3 · 1 π π Y 2k − 1 = 2m(2m − 2) · · · 4 · 2 2 2 2k k=1 Z π 2 sin2m+1 xdx = 0 2m(2m − 2) · · · 4 · 2 = (2m + 1)(2m − 1) · · · 5 · 3 Damit erhalten wir für m = 1, 2, . . . Z π Z 2m sin xdx 0 π sin2m−1 xdx = 4 0 m Y k=1 2k 2k + 1 π π 1 = 2 2m m Damit folgt für gerades n, dass das Volumen der n-dimensionalen Euklidischen Kugel mit Radius R gleich n−2 n 2 π 2π n Y π2 R = Rn n n m ( 2 )! m=1 ist. Der Fall, dass n ungerade ist, wird ähnlich behandelt. 2 Beispiel 7.5.2 Berechnung des Volumens der 3-dimensionalen Euklidischen Kugel bzgl. rechtwinkliger Koordinaten. Beweis. Das Volumen ist Z −R Z −√R2 −x2 Z −√R2 −x2 −y2 R Es gilt √ R2 −x2 √ Z −R dzdydx = R2 −x2 −y 2 Z √ a2 − t2 dt R = 1 2 Z √ − R2 −x2 √ R2 −x2 p 2 R2 − x2 − y 2 dydx √ t t a2 − t2 + a2 arcsin a Damit erhalten wir für das Volumen √R2 −x2 Z R p y y R2 − x2 − y 2 + (R2 − x2 ) arcsin √ dx R2 − x2 −√R2 −x2 −R Z R = (R2 − x2 )(arcsin(1) − arcsin(−1))dx −R Z R R 4π 3 =π (R2 − x2 )dx = π R2 x − 13 x3 −R = R 3 −R 2 7.5. TRANSFORMATIONSFORMEL FÜR INTEGRALE 413 Beispiel 7.5.3 (Das Gravitationspotential eines hohlen Planeten) Es sei o n p 2 2 2 x + y + z ≤ r2 P = (x, y, z)|r1 ≤ ein hohler Planet. Wir nehmen an, dass die Dichte ρ(x, y, z) = 1 ist. Es sei M die 2 Gesamtmasse des Planeten, m die Masse im Punkt (x, y, z) und G = 6, 67·10−11 Nkg·m2 die Gravitationskonstante. Dann gilt für das Gravitationspotential p GmM p falls x2 + y 2 + z 2 > r2 2 + y2 + z2 x V (x, y, z) = p Gm2π(r22 − r12 ) falls x2 + y 2 + z 2 < r1 Das Potential im Inneren des Planeten ist konstant, es herrscht also Schwerelosigkeit im Innern. Beweis. Für das Gravitationspotential im Punkt (x0 , y0 , z0 ) gilt Z V (x0 , y0 , z0 ) = Gm P ρ(x, y, z) p d(x, y, z) 2 (x − x0 ) + (y − y0 )2 + (z − z0 )2 P ist eine kompakte Menge und 1 p 2 (x − x0 ) + (y − y0 )2 + (z − z0 )2 ist eine stetige Funktion auf einer offenen Umgebung von P , weil entweder p (x − x0 )2 + (y − y0 )2 + (z − z0 )2 > r2 oder p (x − x0 )2 + (y − y0 )2 + (z − z0 )2 < r1 gilt. Da der Planet rotationssymmetrisch ist, können wir annehmen, dass (x0 , y0 , z0 ) = (R, 0, 0). Außerdem wollen wir zu Polarkoordinaten übergehen. x y z r ∈ [r1 , r2 ] φ ∈ [0, π] θ ∈ [0, 2π] = r cos φ = r sin φ cos θ = r sin φ sin θ Es gilt det ∂(x, y, z) ∂(r, φ, θ) = r2 sin φ Wie schon bei der Berechnung des Volumens der Kugel müssen wir eine Grenzwertbetrachtung durchführen, wenn wir zu Polarkoordinaten übergehen. Wir erhalten CHAPTER 7. INTEGRATION IM RN 414 schließlich V (R, 0, 0) Z r2 Z = Gm π 2π r2 sin φ p dθdφdr (R − r cos φ)2 + r2 sin2 φ cos2 θ + r2 sin2 φ sin2 θ r1 0 0 Z r2 Z π Z 2π r2 sin φ p = Gm dθdφdr (R − r cos φ)2 + r2 sin2 φ 0 0 r1 Z r2 Z π r2 sin φ p dφdr = 2πGm (R2 − 2rR cos φ + r2 r1 0 Z Wir substituieren u = −2rR cos φ. Es gilt du = 2rR sin φ dφ u(0) = −2rR u(π) = 2rR Damit erhalten wir Z r2 Z 2rR r dudr + R2 + u r1 −2rR 2R Z i2rR πGm r2 h√ 2 2 = dr 2r r + R + u R −2rR r1 Z √ πGm r2 √ 2 = 2r r + R2 + 2rR − 2r r2 + R2 − 2rR dr R Zr1r2 πGm = 2r|R + r| − 2r|R − r|dr R r1 2πGm √ r2 Da r > 0 und R > 0, so gilt |r + R| = r + R. Andererseits gilt R − r > 0, falls R > r2 und R − r < 0, falls R < r1 . Damit erhalten wir zwei Fälle Z πGm r2 2 4r dr falls r2 < R R r1 Z V (R, 0, 0) = πGm r2 4rRdr falls r1 > R R r1 Damit erhalten wir 4πGm (r3 − r3 ) 2 1 V (R, 0, 0) = 3R 2πGm(r22 − r12 ) falls r2 < R falls r1 > R Da wir angenommen hatten, dass für die Dichte ρ(x, y, z) = 1 gilt, erhalten wir M= 2 4π 3 (r − r13 ) 3 2 7.6. UNSTETIGKEITSMENGEN VON FUNKTIONEN UND IHREN ABLEITUNGEN415 7.6 Unstetigkeitsmengen von Funktionen und ihren Ableitungen [90] Satz 7.6.1 Es sei X ein separabler, metrischer Raum, in dem jede offene Menge überabzählbar viele Elemente enthält. Es sei f eine Funktion, die von X nach R abbildet. Die Menge aller Punkte, in denen f unstetig ist, ist eine Fσ -Menge. Umgekehrt gibt es zu jeder Fσ -Menge A von X eine Funktion, die in allen Punkten von A unstetig und in allen Punkten von Ac stetig ist. Beweis. Es sei f : X → R eine beschränkte Funktion. Wir bezeichnen ( ) ω(f, x0 ) = lim sup δ→0 x∈B(x0 ,δ) f (x) − inf f (x) x∈B(x0 ,δ) als Oszillation von f in x0 . ω(f, x0 ) existiert, weil für alle δ > 0 sup x∈B(x0 ,δ) f (x) − inf x∈B(x0 ,δ) f (x) ≥ 0 gilt und weil für alle δ, δ̃ mit δ ≤ δ̃ sup x∈B(x0 ,δ) f (x) − inf x∈B(x0 ,δ) f (x) ≤ sup x∈B(x0 ,δ̃) f (x) − inf f (x) x∈B(x0 ,δ̃) gilt. Wir zeigen, dass f genau dann in x0 stetig ist, wenn ω(f, x0 ) = 0 gilt. Wir nehmen an, dass f in x0 stetig ist. ∀ > 0∃δ > 0∀x ∈ B(x0 , δ) : |f (x) − f (x0 )| < Hieraus folgt sup f (x) < f (x0 ) + x∈B(x0 ,δ) und inf x∈B(x0 ,δ) f (x) > f (x0 ) − Also ω(f, x0 ) < 2. Wir setzen D = {x|ω(f, x) ≥ } und zeigen, dass D für alle > 0 eine abgeschlossene Menge ist. Wir zeigen, dass Dc eine offene Menge ist. Es gelte ω(f, x0 ) < . Dann gibt es ein δ > 0, so dass für alle x ∈ B(x0 , δ) sup f (x) − inf f (x) < x∈B(x0 ,δ) x∈B(x0 ,δ) CHAPTER 7. INTEGRATION IM RN 416 Hieraus folgt, dass für alle x ∈ B(x0 , δ) ω(f, x) < gilt. Damit ist die Menge aller Unstetigkeitsstellen von f gleich [ D1 n n∈N und damit eine Fσ -Menge. Wir zeigen nun, dass es zu jeder Fσ -Menge eine Funktion gibt, die in genau diesen Punkten unstetig ist. Es seien M eine abzählbare, dichte Teilmenge von X und ∞ [ A= An n=0 wobei An abgeschlossene Mengen sind und überdies An ⊆ An+1 für n = 0, 1, 2, . . . gilt. Wir setzen A0 = ∅. Wir definieren nun Bn = {x|x ∈ (An \ An−1 ) \ (An \ An−1 )◦ oder x ∈ (An \ An−1 )◦ ∩ M } Wir definieren f (x) = −n 2 falls 0 falls x ∈ Bn ∞ [ x∈ / Bk k=1 f ist wohldefiniert, da Bn ∩ Bm = ∅ für n 6= m gilt. Wir wollen dies nachprüfen. Falls n > m, so gelten Bn ⊆ An \ An−1 und Bm ⊆ Am Wir zeigen nun, dass f für alle x ∈ A unstetig ist. Es ergeben sich drei Fälle. Falls x ∈ (An \ An−1 )◦ ∩ M , dann gilt f (x) = 2−n und es gibt ein δ0 , so dass für alle δ mit 0 < δ < δ0 und alle y mit d(x, y) < δ y ∈ (An \ An−1 )◦ gibt. Hieraus folgt, dass es ein y mit d(x, y) < δ gibt, so dass y ∈ (An \ An−1 )◦ ∩ M c Für ein solches y gilt y∈ / ∞ [ Bk k=1 Falls y ∈ Bk gilt, so folgt wegen Bk ⊆ Ak \ Ak−1 , dass k = n. Aus y ∈ (An \ An−1 )◦ ∩ M c erhalten wir y∈ / (An \ An−1 ) \ (An \ An−1 )◦ und y ∈ / (An \ An−1 )◦ ∩ M 7.6. UNSTETIGKEITSMENGEN VON FUNKTIONEN UND IHREN ABLEITUNGEN417 Damit gilt f (y) = 0. Damit ist f nicht in x stetig. Wir nehmen nun an, dass x ∈ (An \ An−1 )◦ ∩ M c . Wie wir uns eben überlegt haben, gilt dann f (x) = 0. Ebenso wie im ersten Fall finden wir ein δ0 , so dass für alle δ mit 0 < δ < δ0 ein y mit d(x, y) < δ und mit y ∈ (An \ An−1 )◦ ∩ M existiert. Also gilt f (y) = 0. Dies widerspricht der Stetigkeit von f in x. Als dritten zu betrachtenden Fall haben wir x ∈ (An \ An−1 ) \ (An \ An−1 )◦ Damit haben wir f (x) = 2−n . Weil x kein innerer Punkt von An \ An−1 ist, gibt es eine Folge von Punkten xk ∈ (An \ An−1 )c , k ∈ N, mit d(x, xk ) < k1 . Für alle xk , k ∈ N, gilt entweder xk ∈ An−1 oder xk ∈ Acn . Damit gilt, dass xk ∈ / Bn gilt. Hieraus folgt sofort, dass für alle k ∈ N f (xk ) = 0 oder f (xk ) ≥ 2−(n−1) oder f (xk ) ≤ 2−(n+1) Auch dies widerspricht der Stetigkeit von f in x. Nun zeigen wir, dass f in allen x ∈ / A stetig ist. Es gilt f (x) = 0. Es sei > 0 gegeben. Wir wählen N so gross, dass > 2−N gilt. Nun wählen wir δ so klein, dass für alle A1 , . . . , AN B(x, δ) ∩ An = ∅ gilt. Somit gilt für alle y mit d(x, y) < δ y∈ / N [ An n=1 Insbesondere gilt für alle y mit d(x, y) < δ y∈ / N [ Bn n=1 Deshalb gilt für alle y mit d(x, y) < δ, dass f (y) ≤ 2−N −1 Damit folgt für alle y mit d(x, y) < δ |f (x) − f (y)| ≤ 2−N −1 < 2 Beispiel 7.6.1 (i) Q ist eine Fσ -Menge. (ii) R \ Q ist keine Fσ -Menge. (iii) Jede Teilmenge von R, die nicht Lebesgue messbar ist, ist keine Fσ -Menge. 418 CHAPTER 7. INTEGRATION IM RN Satz 7.6.2 (i) Es sei f : [a, b] → R eine differenzierbare Funktion. Dann ist die Menge aller Punkte, in denen f 0 stetig ist, eine Gδ -Menge, die in [a, b] dicht liegt. (ii) Zu jeder Gδ -Menge A, die in [a, b] dicht liegt, gibt es eine Funktion f : [a, b] → R, für die die Menge, in denen f 0 stetig ist, gleich A ist. Satz 7.6.3 (Bruckner, p. 228) (i) Es sei f : [a, b] → R eine stetige Funktion. Dann ist die Menge der Punkte, in denen f differenzierbar ist, vo der Form A ∩ B, wobei A eine Fσ -Menge ist und B eine Fσδ -Menge mit λ(B) = λ([a, b]) ist. (ii) Umgekehrt lässt sich zu jeder solchen Menge eine entsprechende Funktion finden. 7.6. UNSTETIGKEITSMENGEN VON FUNKTIONEN UND IHREN ABLEITUNGEN419 Notizen Die Menge der invertierbaren Matrizen ist offen: Die Determinante ist eine stetige Abbildung. Der Limes Superior ist der grösste Häufungspunkt der Folge. )= Wo ist die Funktion f mit f (x) = 0 für x irrational und f ( m n m teilerfremd sind differenzierbar? 1 n wobei n und Konvergenzradius von ∞ X tan(n)xn n=1 bestimmen. Der Konvergenzradius von ∞ X 1 n x sin n n=1 ist 1. 1 m n | sin n| = | sin(n − mπ)| ≥ |n − mπ| = | − π| 2 2 m Da π irrational ist, gilt n 1 | − π| ≥ k m m n Ausserdem gilt m ∼ π. Damit folgt | sin n| ≥ 1 nk−1 Bei der Einführung der metrischen Räume muss auch die Stetigkeit von Funktionen auf metrischen Räumen abgehandelt werden. U.a. dass eine stetige Funktion auf einer kompakten Menge Minimum und Maximum annimmt. Die Euklidische Norm muss schon bei den metrischen Räumen eingeführt werden. Ausserdem müssen an dieser Stelle die kompakten Mengen vom Rn charakterisiert werden. Der Satz von Alexandoff-Hausdorff: Jeder kompakte metrische Raum ist das stetige Bild der Cantor-Menge. siehe der Artikel von Benyamini im AMM. Bei der Einführung der Gammafunktion weitere Eigenschaften herleiten, um die Berechnung des n- dimensionalen Volumens der Kugel einfacher zu gestalten. Der Satz von Tschebyscheff über die Primzahlverteilung kann bewiesen werden ,wenn man die Grössenordnung von 2n bestimmt hat. n CHAPTER 7. INTEGRATION IM RN 420 Die Determinante der Matrix α 1 1 α .. . 0 ··· 0 1 ··· 0 ··· ··· 0 0 .. . ··· ··· 1 α führt auf die Differenzengleichung [LeLe,p.98] Dn = αDn−1 − Dn−2 Aufgabe oder Beipiel: Bestimme die Anzahl aller surjektiven Abbildungen zwischen einer Menge mit n Elemente und einer mit k Elementen: n n−k k k! k Es gibt genau n n−k k k Möglichkeiten eine Menge mit n Elementen in k Teilmengen aufzuteilen, so dass jede Teilmenge mindestens ein Element enthält. Michel Rolle wurde 1652 in der Auvergne geboren, er starb 1719. Er war Mitglied der Académie des Sciences. Sein Hauptwerk Traité d’Algebre erschien 1690. card(R)=card(R2 ), card(R)=card([0,1]) Berechne R xx dx, möglicherweise als Reihe. Aufgabe: Man versucht aus Dominosteinen einen Brückenbogen zu bauen, der sich selbst trägt. Man stapelt die Steine übereinander und verschiebt sie dann seitlich, ohne dass der entstehende Bogen umfällt. Wie weit kommt man? Antwort: proportional zum Logarithmus der Anzahl der Steine. Im Abschnitt über die Formel von Stirling wird die Trapez-Regel benutzt und bewiesen. Interessant ist auch die Simpson Regel: Das Integral weicht höchstens um (b − a)5 max |f (iv) (x)| 2880n4 x von (f (a0 ) + 4f (x1 ) + 2f (a1 ) + · · · ) ab. ∆x 6 7.6. UNSTETIGKEITSMENGEN VON FUNKTIONEN UND IHREN ABLEITUNGEN421 Die Mittelpunktsregel ist auch interessant: Das Integral weicht höchstens um (b − a)3 max |f (iv) (x)| x 24n2 von (f (x1 ) + · · · + f (xn ))∆x ab. xi sind die Mittelpunkte der Teilintervalle. Das Nadel Problem von Buffon. (i) Ein Punkt (y, θ) wird zufallsartig in dem Rechteck [0, 1] × [0, π] gewählt. Bestimme die Wahrscheinlichkeit, dass y ≤ sin θ gilt. (ii) Eine Nadel der Länge 1 wird auf eine Fläche fallen gelassen, auf die parallele Linien gezeichnet sind, die jeweils den Abstand 1 voneinander haben. Es sei P der niedrigere der beiden Endpunkte von der Nadel, y sei der Abstand von P zur der Linie, die oberhalb von P liegt und θ sei der Winkel, den die Nadel mit einer Linie hat, die parallel zu den gegebenen Linien ist und die durch P läuft. Zeige, dass die Wahrscheinlichkeit, dass die Nadel eine Linie trifft, gleich der von (i) ist. Z π sin θdθ = 2 0 Also ist die Wahrscheinlichkeit gleich 2/π. Vermutlich ist es besser die e-Funktion durch Potenzreiehen einzuführen. Berechne den Erwartungswert vom Abstand eines zufällig in einem Kreis mit Radius 1 gewählten Punktes vom Kreismittelpunkt. Die Verteilungsfunktion ist F (x) = P(0 ≤ X ≤ x) = πx2 = x2 π Damit ergibt sich für die Wahrscheinlichkeitsdichte f (x) = F 0 (x) = 2x und Z E(X) = 0 1 2x2 dx = 2 3 Der triaxiale Tritorus ist x = sin u(1 + cos v) 2π y = sin(u + )(1 + cos(v + 3 4π )(1 + cos(v + z = sin(u + 3 2π )) 3 4π )) 3 wobei −π ≤ u ≤ π und −π ≤ v ≤ π. (http://astronomy.swin.edu.au/pbourke/geometry/) CHAPTER 7. INTEGRATION IM RN 422 Beispiel 7.6.2 Die Folge {(cos n, sin n)|n ∈ N} liegt dicht in {(x, y)|x2 + y 2 = 1}. Bibliography [1] A. Alexander, Infinitesimal, Farrar, Straus und Giroux, New York, 2014. [2] J. Anderson, Iterated Exponentials, American Mathematical Monthly 111 (2004), 668–679 [3] T.M. Apostol, Irrationality of the square root of two- a geometric proof, American Mathematical Monthly 107 (2000), 841-842. [4] A. Baker, A Concise Introduction to the Theory of Numbers, Cambridge University Press, Cambridge, 1984. [5] A. Baker, Transcendental Number Theory, Cambridge University Press, Cambridge, 1975. [6] D. Benko, The Basel Problem as a teleskoping series , The College Mathematics Journal 43 (2012), 244-250. [7] M.A. Bennett, Positive rational solutions to xy = y mx , American Mathematical Monthly 111(2004), 48-50 [8] M. Bense, Einführung in die informationstheoretische Ästhetik, Rowohlt, Hamburg, 1969 [9] Y. Benyamini, Applications of the universal surjectivity of the Cantor set, American Mathematical Monthly 1998 (105), 832-839 [10] L. Berggren, J. Borwein und P. Borwein, Pi: A Source Book, Springer-Verlag, New York 1997 [11] G.N. Berman, Aufgabensammlung zur Analysis, B.G. Teubner Verlagsgesellschaft, Leipzig 1981 [12] Á. Besenyei, Peano’s unnoticed proof of Borel’s theorem, American Mathematical Monthly 121 (2014), 69–72. [13] P. Billingsley, Van der Waerden’s continuous nowhere differentiable function, American Mathematical Monthly 1982 (89), 691 [14] G.G. Bilodeau, The origin and early development of non-analytic infinitely differentiable functions, Arch. Hist. Exact Sci. 27 (1982), 115-135. 423 424 BIBLIOGRAPHY [15] T. Bröcker, Analysis I,II, Spektrum Akademischer Verlag Heidelberg 1995. [16] A. Browder, Mathematical Analysis, Springer-Verlag, New York 1996. [17] A.M. Bruckner, Differentiation of Real Functions, Lecture Notes in Mathematics 659, Springer-Verlag 1978 [18] A.M. Bruckner und J. Leonard, Derivatives, American Mathematical Monthly 1966 (73), 24-56 [19] F.S. Cater, On Van der Waerden’s nowhere differentiable function, American Mathematical Monthly, 91,1984, 307-308 [20] R. Chapman, Evaluating ζ(2), [21] Wai-Kai Chen, Passive and Active Filters P 1 [22] B.R. Choe, An elementary proof of ∞ n=1 n2 = Monthly 94 1987, 662-663 π2 , 6 American Mathematical [23] K. Ciesielski, Set Theory for the Working Mathematician, London Mathematical Society, Student Texts 39, Cambridge University Press 1997 [24] H. Cohn, A short proof of the simple continued fraction expansion of e, [25] D. van Dalen, Mystic, Geometer and Intuitionist: The Life of L.E.J. Brouwer P 1 2 = π6 [26] D. Daners, A short proof of k2 [27] J. Dieudonné, Grundzüge der modernen Analysis 1-8, Vieweg und Sohn, Braunschweig, 1985 [28] K. Devlin, The Joy of Sets, Springer-Verlag, 1979 [29] J. Douchet und B. Zwahlen, Calcul différentiel et intégral 3, Fonctions réelles d’une variable rélle, Exercices résolus, Presses polytechniques romandes, Lausanne, 1987 [30] W. Dunham, Euler-The Master of Us All, Dolciani Mathematical Expositions, No. 22, Mathematical Association of America, Washington, 1999 [31] W. Dunham, The Calculus Gallery - Masterpieces from Newton to Lebesgue, Princeton University Press, Princeton and Oxford, 2005. [32] M. Eckert, Euler and the fountains of Sanssouci, Arch. Hist. Exact Sci. 56 (2002), 451–468. [33] G.A. Edgar, Measure, Topology, and Fractal Geometry, Springer-Verlag, New York, 1990 BIBLIOGRAPHY 425 [34] K. Endl und W. Luh, Analysis I,II, Akademische Verlagsgesellschaft, Wiesbaden, 1977 [35] B. Enquist und Wilfried Schmidt, Mathematics Unlimited: 2001 and Beyond [36] F. Erwe, Differential- und Integralrechnung I,II, Bibliographisches Institut, Mannheim, Zürich 1962 [37] L. Euler, De summis serierum reciprocarum, Comm. Acad. sci. Petrop. 7 (1734/35) 1740, 123-134, Nachdruck in Opera Omnia, Ser. I v. 14, 73-86. [38] P. Eymard und Jean-Pierre Lafon, Autour du nombre π, Actualités scientifiques et industrielles 1443, Hermann, Paris 1999 [39] L. Feigenbaum , Happy tercentenary, Brook Taylor!, Mathematical Intelligencer 8 (1986), 53 [40] O. Forster, Analysis 1,2, Vieweg, Braunschweig/Wiesbaden 1983 [41] O. Forster, Analysis 3, Integralrechnung im Rn mit Anwendungen, Vieweg Braunschweig/Wiesbaden 1984 [42] O. Forster und R. Wessoly, Übungsbuch zur Analysis 1, Aufgaben und Lösungen, Vieweg, Braunschweig, Wiesbaden 1995 [43] O. Forster und T. Szymczak, Übungsbuch zur Analysis 2, Aufgaben und Lösungen, Vieweg, Braunschweig, Wiesbaden 1995. [44] A.M. Gleason, Fundamentals of Abstract Analysis, Jones and Bartlett Publishers, Boston 1991. [45] S. Goldberg, Introduction to Difference Equations, Dover 1986. [46] J.R. Goldman, The Queen of Mathematics, A historically motivated guide to number theory, A.K. Peters, Wellesley, Massachusetts 1998 [47] P.R. Halmos, Naive Set Theory, Springer-Verlag, 1974. [48] I. Halperin, Sums of a series, permitting rearrangements, C. R. Math. Rep. Acad. Sci. Canada 8 (1986), 87–102. [49] G.H. Hardy, Weierstrass’s non-differentiable function, Transactions of the American Mathematical Society 17 (1916), 301-325. [50] J.D. Harper, Another simple proof of 1 + Mathematical Monthly 110 (2003), 540–541. 1 22 + 1 32 + ··· = π2 , 6 American [51] A. Herschfeld, On infinite radicals, American Mathematical Monthly 42 (1935), 419-429 426 BIBLIOGRAPHY [52] H. Heuser, Lehrbuch der Analysis, Teil 1 und Teil 2, B.G. Teubner, Stuttgart 1990 [53] M.D. Hirschhorn, A simple proof that ζ(2) = telligencer 33 (2011), 81-82. π2 , 6 The Mathematical In- [54] E.W. Hobson, The Theory of Functions of a Real Variable, Dover 1957 2 New York [55] L. Hörmander, An Introduction to Complex Analysis in Several Variables, North-Holland, New York, 1990 2 [56] J. Hofbauer, A simple proof of 1 + 212 + 312 + · · · = π6 and related identities, American Mathematical Monthly 109 (2002), 196–200 [57] A. Jones, S.A. Morris und K.R. Pearson, Abstract Algebra and Famous Impossibilities, Springer-Verlag, New York 1991 [58] D.J. Jones, Continued powers and a sufficient condition for their convergence, Mathematical Magazine 68 (1995), 387-392 [59] W.J. Kaczor und M.T. Nowak, Problems in Mathematical Analysis I, Student Mathematical Library 4, American Mathematical Society 2000 [60] D. Kalman, Six ways to sum a series, College Math. J. 24 (1993), 402-421 [61] R. Kannan und C.K. Krueger, Advanced Analysis on the Real Line, Springer-Verlag New York 1996 [62] S.S. Kim und K.H. Kwon, Smooth C ∞ but nowhere analytic functions, American Mathematical Monthly 107 (2000), 264-266 [63] T. Körner, Bulletin of the London Mathematical Society 23 (1991), 557562. [64] T. Körner, Butterfly hunting and the symmetry of mixed partial derivatives, American Mathematical Monthly 105 (1998), 756–758. [65] E. Landau Grundlagen der Analysis, Akademische Verlagsgesellschaft, Leipzig, 1930. [66] S. Lang, Analysis II, Addison-Wesley 1969. [67] W.G.Leavitt, The sum of the reciprocals of the primes, Two-Year College Mathematics Journal 10 (1979), 198-199. [68] J.-P. Lecoutre und P. Pilibossian, Analyse I,II, Exercices corrigés avec rappels de cours, Masson, Paris, Mailand, Barcelona 1994. [69] J. Lelong-Ferrand, Exercices résolus d’analyse, Dunod Université 1977 BIBLIOGRAPHY 427 [70] H. Levy und F. Lessmann, Finite Difference Equations, Dover, New York 1992 [71] E.H. Lieb und M. Loss, Analysis, Graduate Studies in Mathematics 14, American Mathematical Society Providence, Rhode Island 1997 [72] L.H. Loomis und S. Sternberg, Advanced Calculus, Revised Edition, Jones and Bartlett Publishers, Boston, London 1990 [73] M. Lynch, A continuous nowhere differentiable function, American Mathematical Monthly 99 (1992), 8-9. [74] C.D. Lynd, Using difference equations to generalize results for periodic nested radicals, American Mathematical Monthly 212 (2014), 45–59. [75] B. Mandelbrot, The Fractal Geometry of Nature, W.H. Freeman and Company 1982. [76] E. Maor, The Pythagorean Theorem, Princton University Press 2007. [77] J.E. Marsden und M.J. Hoffman, Elementary Classical Analysis, W.H. Freeman and Company, New York 1974 [78] T. Marshall, A short proof of ζ(2) = 117 (2010), 352–353 [79] H. Meschkowski, Mannheim Unendliche π2 , 6 American Mathematical Monthly Reihen, Bibliographisches Institut [80] J.M. Monier, Analyse, Tome 1, 800 exercises résolus et 18 sujets d’étude, Dunod Université, Paris, 1990 [81] J.M. Monier, Analyse, Tome 2, 600 exercises résolus et 21 sujets d’étude, Dunod Université Paris, 1990. [82] I. Niven, A simple proof that π is irrational, Bulletin of the American Mathematical Society 53 (1947), 509. [83] J.E. Nymann, The sum of the Cantor set with itself, L’Enseignement Mathématique 39 (1993), 177-178 [84] C.D. Olds, Continued Fractions, Random House 1963. [85] C.D. Olds, The simple continued fraction expansion of e, American Mathematical Monthly 77 (1970), 968-974. [86] J.C. Oxtoby, Mass und Integral, Hochschultext, Springer-Verlag Berlin 1971. [87] M. Pavone, The Cantor set and a geometric construction, L’Enseignement Mathématique 35 (1989), 41-49. 428 BIBLIOGRAPHY [88] O. Perron, Die Lehre von den Kettenbrüchen I,II, B.G. Teubner Verlagsgesellschaft, Stuttgart 1954. [89] J.-P. Pier, Development of Mathematics 1950-2000, Birkhäuser [90] G. Piranian, The set of nondifferentiability of a continuous function, American Mathematical Monthly 73 (1966), 57–66. [91] A.S. Posamentier, The Pythagorean Theorem, Prometheus Books, Amherst, 2010. 2 [92] D. Ritelli, Another proof of ζ(2) = π6 using double integrals, American Mathematical Monthly 120 (2013), 642–645 [93] A.M. Rockett und P. Szüsz, Continued Fractions, World Scientific Publishing Company, 1992. [94] A. Rosenthal, On functions with infinitely many derivatives, Proceedings of the American Mathematical Society 4 (1953), 600-602. [95] H. Sagan, An elementary proof that Schoenberg’s space-filling function is nowhere differentiable, Mathematical Magazine 65 (1992), 125-128. [96] C.E. Sandifer, Euler’s solution of the Basel problem - the longer story, Euler at 300, MAA Spectrum, Mathematical Association of America, Washington, 2007, 105–117. [97] A. Shidear, On the continuity of Van der Waerden’s function in the Hölder sense, American Mathematical Monthly 93 (1986), 375-376. [98] D. Singh, The infinitude of primes, American Mathematical Monthly 111(2004), 863 [99] W.S. Sizer, Continued roots, Mathematical Magazine 59 (1986), 23-27. [100] W.I. Smirnow, Lehrgang der höheren Mathematik I,II, VEB Deutscher Verlag der Wissenschaften, Berlin 1972. [101] J. Sondow, Double integrals for Euler’s constant and ln π4 and an analog of Hadjicostas’s formula, American Mathematical Monthly 112 (2005), 61–65. [102] S.B. Stechkin, A simple proof of Chebyshev’s prime number theorem, Uspekhi Mat. Nauk 23 (1968), 221-222. [103] R.R. Stoll, Theory and Logic, Dover, New York 1979. [104] A. Stubhang, Niels Henrik Abel, Springer-Verlag [105] P. Suppes, Axiomatic Set Theory, Dover, New York, 1972 BIBLIOGRAPHY 429 [106] Tenenbaum und M. Mendés France, The Prime Numbers and their Distribution, American Mathematical Society, 2000. [107] J. Thim, Continuous nowhere differentiable functions, Master Thesis, Lulea University of Technology, 2003. [108] H.A. Thurston, The Number System, Dover Publications, New York, 2007. [109] F. Toenniessen, Das Geheimnis der transzendenten Zahlen, SpringerVerlag, 2010. [110] F. G. Tricomi, Elliptische Funktionen, Akademische Verlagsgesellschaft, Leipzig, 1948. [111] H. Tsumura, An elementary proof of Euler’s formula for ζ(2m), American Mathematical Monthly 111 (2004), 430-431 [112] S. Ungar, The Koch curve: a geometric proof, American Mathematical Monthly, 114 (2007), 61–66 [113] W. Walter, Analysis I,II, Springer-Verlag, Berlin, 1985, 1990. [114] K. Weierstrass, Mathematische Werke, Band 2, Berlin, 1895. [115] L. Wen, A nowhere differentiable continuous function, American Mathematical Monthly 107 (2000), 450-453 [116] G.T. Williams, A new method of evaluating ζ(2n), American Mathematical Monthly 60 (1953), 19-25 [117] D. Zagier, Die ersten 50 Millionen Primzahlen, Mathematical Intelligencer 0 (1977) Index π, 194, 197, 302 e, 74, 75, 81, 180 überabzählbar, 44, 46 Euklidische Norm, 227 Euler-Mascheroni Konstante, 172 Exponentialfunktion, 153, 180 abgeschlossen, 220 Ableitung, 332 abzählbar, 46 algebraische Zahl, 312 analytische Funktion, 308 arithmetisch-geometrisches Mittel, 325 Auswahlaxiom, 22, 25 Axiomensystem von Cantor, 20 Axiomensystem von Peano, 27 Axiomensystem von Zermelo-Fraenkel, 21 Fibonacci Zahlen, 84 Folge, 61 Folge, konvergent, 61 Folge, monoton wachsend, 68 folgenstetig, 132 Fréchet differenzierbar, 389 Funktion, 24 Funktion, differenzierbar, 157 Funktion, konvex, 141, 342 Funktion, Riemann integrierbar, unstetig in allen rationalen Punkten, 243 Funktion, stetig, 129 Funktion, stetig in irrationalen Punkten, unstetig in rationalen Punkten, 139 Funktion, stetig, nicht differenzierbar, 160 Funktion, stetig, nirgendwo differenzierbar, 213 Funktion, trigonometrisch, 194 Funktion, unendlich oft differenzierbar, nirgends analytisch, 308 Funktionalmatrix, 344 Betafunktion, 276 bijektiv, 24 Binomialkoeffizient, 40, 180 Binomische Formel, 40 Bogenlänge, 352 bogenzusammenhängend, 321 Cauchy Folge, 64 Cauchy Produkt von Reihen, 104 Cauchy-Hadamard, Formel von, 186 Cosinus, 194 Cotangens, 198 De Morgan, Formel von, 20 Dedekind Schnitt, 52 Dedekind vollständig, 59 Dezimalbruchdarstellung, 113 Differential, 331 Differenzengleichungen, 81 differenzierbar, 331 differenzierbar, linksseitig, 165 differenzierbar, rechtsseitig, 165 Dirichletfunktion, 130 elliptisches Integral, 353 Gammafunktion, 274 gleichmäßig stetig, 142 gleichmäßige Konverenz, 208 goldene Spirale, 354 Goldener Schnitt, 84 Grenzwertsatz von Abel, 192 Häufungspunkt, 220 Häufungswert, 87 Halbordnung, 24 Hauptsatz der Differential- und Integralrechnung, 266 430 INDEX Hausdorffs Maximum Prinzip, 25 Hesse Matrix, 340 implizite Funktionen, 380 Induktion, 37 Infimum, 36 injektiv, 24 Integralkriterium für Reihen, 290 Intervallschachtelung, 72 Jacobi Matrix, 344 Körper, 32 Körper, Archimedisch, 36 Körper, geordnet, 34 Kardinalität, 43 Kettenbruch, 121 Kettenregel, 163, 345 kompakt, 224 Kontinuumshypothese, 47 Konvergenzradius, 186 kritischer Punkt, 357 Kurvenlänge vom Graphen, 277 L’Hôpital, Formel von, 200 Lagrange Multiplikatoren, 386 Leibniz Kriterium, 98 Lemniskate, 356 Limes Inferior, 88 Limes Superior, 88 linksseitig stetig, 133 Logarithmus, 153 Mächtigkeit, 43 Majorantenkriterium, 101 Mathematische Induktion, 37 Matrix, positiv definit, 358 Metrik, 219 Mittelwertsatz, 169 Mittelwertsatz der Integralrechnung, 271 Mittelwertsatz im Rn , 347 natürliche Zahlen, 26 Norm, 226 Obersumme, 240 offen, 220 431 offene Überdeckung, 224 offener Kern, 220 Ordnung, 24 p-adische Entwicklung, 113 partielle Ableitung, 330 partielle Integration, 270 Partition, 240 Polarkoordinaten, 353, 377 polygonzusammenhängend, 321 Potenzmenge, 45 Potenzreihen, 183 Primzahl, 29, 108 Primzahlsatz, 174 Primzahlzerlegung, 30 Produkt von Wallis, 287 Produktregel des Differenzierens, 162 Quotientenkriterium, 102 Quotientenregel des Differenzierens, 162 Raabe Kriterium, 103 rationale Zahlen, 31 Raum, metrisch, 219 Raum, normierter, 226 rechtsseitig stetig, 133 Regentropfen Funktion, 243 Reihe, absolut konvergent, 100 Reihe, geometrische, 93 Reihe, harmonische, 95 Reihe, unbedingt konvergent, 109 Restglied, Cauchy Form, 178 Restglied, Lagrange Form, 178 Richtungsableitung, 329 Riemann integrierbar, 242 Sattelpunkt, 357 Satz über implizite Funktionen, 381 Satz von Bolzano-Weierstraß, 73, 225 Satz von Rolle, 168 Satz von Schröder-Bernstein, 43 Satz von Taylor, 178, 350 Sinus, 194 Stammfunktion, 265 Stirling, Formel von, 295 Supremum, 36 432 surjektiv, 24 Takagifunktion, 213 Tangens, 198 Taylorreihe, 180 Teilfolge, 69 Thomae Funktion, 243 total , 225 transzendente Zahl, 312 Umkehrabbildung, 374 Umkehrfunktion, 144 Umordnungsatz von Riemann, 109 uneigentliche Integrale, 272 unendlich oft differenzierbare, nirgends analytische Funktion, 308 Untersumme, 240 Verdichtungskriterium von Cauchy, 94 Verfeinerung einer Partition, 240 Vieta, Formel von, 289 vollständig, 71 Weierstraßfunktion, 285 Wohlordnung, 25 Wurzelkriterium, 185 Zetafunktion, 239, 310 Zorns Lemma, 25 zusammenhängend, 321 Zwischenwertsatz, 137 INDEX