Skriptum zur Vorlesung Einführung in die Analysis von Bernhard Krön Version vom 02.02.2014 Sommersemester 2013 VO LV-Nr.: 250053, 5 ECTS UE LV-Nr.: 250054, 4 ECTS http://homepage.univie.ac.at/bernhard.kroen/Analysis.html Inhaltsverzeichnis Vorwort Zum Vorlesungsaufbau Einleitung 1 1 4 Kapitel 1. Zahlen und Folgen 1.1. Konstruktion und Axiomatik 1.2. Natürliche Zahlen 1.3. Ganze Zahlen 1.4. Zur Konstruktion der Zahlenbereiche 1.5. Rationale Zahlen 1.6. Folgen 1.7. Konvergenz und geometrische Folgen 1.8. Cauchy-Folgen und Grenzwertsätze 1.9. Intervallschachtelungen 1.10. Reelle Zahlen 1.11. Erweiterte reelle Zahlen 1.12. Vollständigkeit der reellen Zahlen 1.13. Häufungswerte und Häufungspunkte 1.14. Wurzeln 1.15. Komplexe Zahlen 1.16. Konvergenzkriterien für Reihen 1.17. Das Cauchy-Produkt von Reihen 1.18. Die Exponentialreihe 7 7 7 8 9 10 12 14 17 20 21 24 25 27 29 31 32 37 39 Kapitel 2.1. 2.2. 2.3. 2.4. 2.5. 2.6. 41 41 41 46 49 50 51 2. Stetigkeit Metrische Räume Stetigkeit in metrischen Räumen Stetigkeit reeller Funktionen Stetige Umkehrabbildungen Limiten zu Exponentialfunktion und Logarithmus Trigonometrische Funktionen Kapitel 3. Differentiation 3.1. Differenzierbarkeit 3.2. Erste Ableitungsregeln 57 57 58 Literaturverzeichnis 63 i Vorwort Auch wenn mehrere Personen einen längeren mathematischen Text genau korrigiert haben, werden sich beim erneuten Lesen wieder Fehler finden lassen. In diesem Sinne bitte ich Sie, dieses Skriptum aufmerksam zu studieren; berichten Sie mir Fehler, auch wenn es sich nur um Tippfehler handelt. Ich bin auch an kritischen Anmerkungen jeder Art zu Aufbau, fehlenden Beispielen oder zu unverständlichen Argumenten interessiert. Ihre Kommentare werde ich laufend einarbeiten und immer wieder aktualisierte Fassungen des Skriptums auf http://homepage.univie.ac.at/bernhard.kroen/Analysis.html online stellen und zwar in zwei Versionen: mit Zeilennummerierung, die Ihnen helfen, auf Fehler hinzuweisen, und ohne Zeilennummerierung, für eine optisch ungestörte Lektüre. Herzlichen Dank an Lukas Hobel, Stefanie Hofbauer, Andreas Kalb, Florian König, Doris Laßnig, Peter Leitner, Christine Neuhuber, Christine Pünner, Katrin Schönegger, Tobias Slowiak und Stephan Wastyn für die Korrektur zahlreicher kleiner Fehler. Beispiele zu den Übungen finden Sie im Text am Ende der Kapitel und noch einmal in gesammelter Form. Auch am Ende jedes Kapitels sind sogenannte Theoriefragen formuliert, die Ihnen bei der Vorbereitung zur Prüfung helfen sollen. Ich halte mich im Aufbau an kein bestimmtes Lehrbuch. W. Rudins “Principles of Mathematical Analysis” [10] (nicht zu verwechseln mit seinem Buch “Real and Complex Analysis”) ist ein Standardwerk im englischsprachigen Raum und auf Deutsch als “Analysis” [8] erschienen (nicht zu verwechseln mit “Reelle und Komplexe Analysis”). Der deutsche Klassiker von H. Heuser [2] ist ausführlich geschrieben und enthält viele Beispiele. In der Literaturliste finden Sie weitere wichtige Lehrbücher zur Analysis, die meisten stammen aus dem deutschsprachigen Raum. Zu empfehlen ist auch das Vorlesungsskriptum [3] von G. Hörmann und D. Langer, sowie als Nachschlagwerk zum Kurs “Einführung in das mathematische Arbeiten” das gleichnamige Buch [11] von H. Schichl, R. Steinbauer. Dieser Kurs wird in der Vorlesung vorausgesetzt. Zum Vorlesungsaufbau Die folgenden Gedanken zum Aufbau der Lehrveranstaltung richten sich an die mathematisch erfahrenere Leserschaft. Im Weiteren setze ich nur die Lehrveranstaltung “Einführung in das mathematische Arbeiten” voraus. Es gibt unzählige Unterlagen und einführende Bücher zur reellen Analysis und trotzdem habe ich mich entschlossen, ein neues Vorlesungsskriptum zu verfassen. Die Frage, wie die Vorlesung zur Analysis aufgebaut sein soll und insbesondere, wie reelle Zahlen eingeführt werden, beschäftigt die universitäre Lehre seit dem ausgehenden 19. und frühen 20. Jahrhundert, als die Mathematik auf ein strenges formales Fundamet gestellt wurde. Edmund Landau schreibt 1929 im Vorwort zu seinen “Grundlagen der Analysis” [6]: “Dies Büchlein ist eine Konzession an die (leider in der Mehrzahl befindlichen) Kollegen, welche meinen Standpunkt in der folgenden Frage nicht teilen. Auch wer Mathematik hauptsächlich für die Anwendungen auf Physik und andere Wissenschaften lernt, also vielfach sich selbst weitere mathematische Hilfssätze zurechtlegen muß, kann auf dem betretenen Pfade nur dann sicher weiterschreiten, wenn er gehen gelernt hat, d.h. zwischen falsch und wahr, zwischen Vermutungen und Beweisen (oder, wie manche so schön sagen, zwischen unstrengen und strengen Beweisen) unterscheiden kann. Darum finde ich es (. . . ) richtig, daß der Studierende bereits im ersten Semester lernt, auf welchen als Axiomen angenommenen Grundtatsachen sich lückenlos die Analysis aufbaut und wie dieser Aufbau begonnen werden kann. Bei der Wahl der Axiome kann man bekanntlich verschieden verfahren; ich erkläre es also nicht etwa für falsch, sondern für meinem persönlichen Standpunkt fast diametral entgegengesetzt, wenn man für reelle Zahlen zahlreiche der üblichen Rechengesetze als Axiome postuliert.” 1 Ganz ähnlich sieht das Charles Chapman Pugh in [7, Section 1.2] “The current mathematics teaching trend treats the real number system R as a given — it is defined axiomatically. Ten or so of its properties are listed, called axioms of a complete ordered field, and the game becomes: deduce its other properties from the axioms. This is something of a fraud, considering that the entire structure of analysis is built on the real number system. For what if a system satisfying the axioms failed to exist? Then one would be studying the empty set! However, you need not take the existence of the real numbers on faith alone — we will give a concise mathematical proof of it.” Landau geht von den Peano-Axiomen aus, wohingegen Pugh natürliche Zahlen ohne Axiomatik als gegeben annimmt. Wenn wir eine Mathematik betreiben wollen, in der Mengen verwendet werden (und das wollen wir), dann stellt sich eine weitere Frage: Gibt es die (oder eine) Menge natürlicher Zahlen? Gibt es eine Menge, die die Peano-Axiome der natürlichen Zahlen erfüllt? Auch diese Frage muss beantwortet werden, auch wenn die Antwort einfach und kurz ist: Die Existenz einer solchen Menge folgt aus dem Unendlichkeitsaxiom der Zermelo-Fraenkelschen Mengenlehre. Und gibt es überhaupt eine Menge? Eine solche Frage ist als mathematische Frage nicht ganz richtig gestellt, weil ein Objekt offenbar außerhalb der formalen Theorie in der realen Welt gesucht wird. Die Frage müsste lauten: Ist das Axiomensystem der Mengenlehre widerspruchsfrei? Hier wird die Sache etwas komplizierter: Gödel hat gezeigt, dass jedes hinreichend große widerspruchsfreie formale System die eigene Widerspruchsfreiheit nicht zeigen kann. Dies trifft auch auf die Zermelo-Fraenkelsche Mengenlehre zu. Das heißt, wenn wir mit ihr arbeiten, können wir nicht beweisen, dass sie widerspruchsfrei ist, auch wenn sie es wohl doch ist, woran niemand zweifelt. “Bei der Wahl der Axiome kann man bekanntlich verschieden verfahren;” (Landau, siehe oben). Man muss sich nur bewusst werden, welche die axiomatische Basis ist. Grundsätzlich wäre es möglich, eine rein arithmetische Mathematik zu betreiben (zum Beispiel in der Zahlentheorie), in der es keine Mengen und auch keine Geometrie gibt, dann genügen die Peano-Axiome oder andere. Ein besonderes Axiom der Mengenlehre ist das Auswahlaxiom (axiom of choice), weil es die Existenz von Objekten impliziert, die nicht konstruktiv beschreibbar sind, weswegen es von manchen Mathematiker/innen vermieden oder gar abgelehnt wird. Mit ZFC wird die Zermelo-Fraenkelsche Mengenlehre (ZF) zusammen mit dem Auswahlaxiom (C) bezeichnet. Sie hat sich als mächtige Grundlage der Mathematik etabliert. Zusammen mit der Prädikatenlogik im Hintergrund lässt sich mit ihr die gesamte Mathematik in einer Theorie vereinen, das macht ZFC so attraktiv. Die für uns relevanten Zahlenbereiche lassen sich aus ZF ableiten. Weder die PeanoAxiome noch die Axiome der reellen Zahlen als vollständig geordneter Körper sind für uns also eine Grundlegung der Zahlenbereiche, sondern nützliche Charakterisierungen. Das heißt, sie helfen uns, Theoreme folgender Art zu formulieren: Die aus der Zermelo-Fraenkelschen Mengenlehre konstruierten Zahlenbereiche (insb. die natürlichen und die reellen Zahlen) erfüllen (zusammen mit den darauf definierten Rechenoperationen) eine bestimmte Liste von Axiomen und jedes andere Objekt, das diese Axiome auch erfüllt, ist isomorph zu den aus der Mengenlehre konstruierten Zahlenbereichen. Auch wenn die Axiomatiken der Zahlenbereiche keine Grundlegungen darstellen, dienen sie als Basislager auf halber Höhe des Berges, von dem aus wir den Gipfel besteigen können. Unten im Tal befinden sich Logik und Mengenlehre als Ausgangspunkt. Das erste Problem bei der von Landau empfohlenen Vorgehensweise ist der enorme Zeitaufwand, der nötig ist um dies rigoros und vollständig zu tun. Ich beschränke mich daher bei der Konstruktion der Zahlenbereiche aus der Mengenlehre auf wenige wesentliche Schritte und verzichte auf die in der Analysis sonst erforderliche Vollständigkeit. Nachdem Rudin 1953 in [9] die reellen Zahlen zunächst rigoros über Dedekindschnitte eingeführt hat, schreibt er in seinem Vorwort zur dritten Auflage [10] von 1976 über das zweite, nämlich das mathematisch-didaktische Problem bei der Konstruktion reeler Zahlen: 2 “Experience has convinced me that it is pedagogically unsound (though logically correct) to start off with the construction of the real numbers from the rational ones. At the beginning, most students simply fail to appreciate the need for doing this.” Die Vollständigkeit ist die wichtigste der Eigenschaften, die die reellen von den rationalen Zahlen unterscheidet. Um sich der Bedeutung dieser Eigenschaft bewusst zu werden, habe ich gerade aus didaktischen Gründen nicht auf eine Konstruktion der reellen Zahlen verzichtet. Allerdings stelle ich diese nicht wie sonst üblich an den Beginn der Vorlesung, sondern arbeite erst eine Zeit nur mit rationalen Zahlen und behandle Konvergenz, Cauchy-Folgen und Grenzwertsätze bis wir an einen Punkt kommen, wo sich die Konstruktion der reellen Zahlen zwingend und gleichzeitig auf natürliche Weise ergibt. Allerdings muss man bei dieser Vorgehensweise später an einer Stelle festhalten, dass vieles, was zuvor über rationale Folgen gesagt wurde, nun auch für reelle Zahlen gilt. Dies trifft auf alle Aussagen zu, die nur aus den Körperaxiomen abgeleitet wurden und die Eigenschaft rationaler Zahlen, dass sie Quotienten ganzer Zahlen sind, nicht verwenden. Anstatt den Aufbau der Mathematik auszublenden, sollte begründet werden, warum es notwendig ist, ihn zu kennen. Gerade in allgemein bildenden Schulen sollte auch Platz für Reflexionen über das Fach an sich sein. Das mathematische Theoriegebäude dient als Beispiel einer Wissenschaft und hilft das Wesen der Wissenschaft besser zu verstehen. Es ist wichtig, auch in der Schule über Möglichkeiten und Grenzen einer naturwissenschaftlichen Theorie nachzudenken und unterscheiden zu lernen zwischen Phänomenen der realen Welt und erklärenden Thesen, zwischen Wissenschaft und Pseudowissenschaft, zwischen Glaube, Spekulation, Empirie und - wie im Fall der Mathematik - einer formalen Theorie. Deswegen sollten Lehrkräfte zumindest eine grobe Vorstellung davon haben, was das Theoriegebäude Mathematik ist, auch wenn Grundlagen der Mathematik in der Schule nicht standardmäßig unterrichtet werden. Wir müssen davon ausgehen, dass die meisten Studierenden später nie eine Lehrveranstaltung über Mengenlehre oder Grundlagen der Mathematik belegen werden und dass die Analysis ihre einzige Chance ist, einen Einblick in dieses Theoriegebäude zu bekommen. Die verbreitetsten Konstruktionen der reellen Zahlen sind jene mit Cauchy-Folgen und jene mit Dedekind-Schnitten. Man kann reelle Zahlen auch direkt über Dezimalbrüche einführen. Dedekind-Schnitte sind intuitiv leicht zu verstehen, das ist ihr Vorteil. Ein Nachteil ist wohl, dass sie abgesehen von der Konstruktion der reellen Zahlen kaum eine Verwendung finden. Das heißt, es wird Zeit und Energie für eine kleine Theorie investiert, deren einziger Zweck die Konstruktion der reellen Zahlen ist. Ich habe mich für die Konzepte der Cauchy-Folgen und Intervallschachtelungen entschieden, weil diese auch im späteren Aufbau der Analysis von großer Bedeutung sind. Bis wir zu dem Punkt gelangen, wo wir reelle Zahlen als Äquivalenzklassen von Cauchy-Folgen definieren, muss viel gearbeitet werden. Diese Arbeit ist aber nicht umsonst, denn das Kapitel über Folgen und Konvergenz wird im Laufe dieser Konstruktion bereits großteils abgearbeitet. Auch bekommen wir wichtige Sätze wie jenen von Bolzano-Weierstrass im Zuge der Konstruktion praktisch geschenkt. Ich will mit dieser Vorlesung zeigen, wie die Konstruktion der reellen Zahlen auf natürliche Weise motiviert und in den Aufbau der Analysis integriert werden kann, ohne den Umfang der Lehrveranstaltung zu erhöhen. Potenzen mit reellen Exponenten können bequem über Exponentialfunktion und Logarithmus eingeführt werden. Wenn dafür erst Umkehrfunktionen und stetige Funktionen behandelt werden müssen, bedeutet das, dass die Exponentialfunktion erst relativ spät behandelt wird. Die Exponentialreihe selbst spielt in verschiedenen Bereichen der Mathematik eine ganz zentrale Rolle. Aus diesem Grund behandle ich die Exponentialfunktion schon relativ früh im Kapitel über Reihen. Um zu zeigen, dass ihre Umkehrfunktion auf allen positiven reellen Zahlen definiert ist, verwende ich den Zwischenwertsatz. Daher wird der Logarithmus erst später eingeführt. Wir wollen jedoch schon zu einem früheren Zeitpunkt Wurzeln ziehen, zum Beispiel beim Wurzelkriterium für Reihen. Wurzeln und rationale Exponenten 3 werden daher schon früher direkt über die Vollständigkeit der reellen Zahlen definiert. An dieser Stelle könnten durch einen Grenzübergang direkt reelle Exponenten eingeführt werden (siehe z.B. [4, 2]), worauf ich aus Zeitgründen in den Kapiteln zu Reihen verzichte, weil wir irrationale Exponenten ohnehin erst ab den Kapiteln zur Stetigkeit brauchen. Einleitung 0.0.1. Die Frage nach dem “Was” und das Fundament. Was ist eine Funktion? Eine Funktion ist eine Relation. Und was ist eine Relation? Eine Relation ist eine Menge von Paaren. Egal bei welchem mathematischen Objekt wir die Frage nach dem “Was” stellen, am Ende landen wir immer bei den Mengen. Mathematik beschäftigt sich nicht mit der Wirklichkeit, sondern mit formalen Modellen. Mengen haben sich als Einheitsmodell bewährt. Mengen mit bestimmten Eigenschaften bekommen Namen, zum Beispiel “Funktion”. Die Frage, was in der realen Welt tatsächlich eine Funktion ist, stellt sich uns nicht. Für ontologische Diskussionen ist in der Mathematik kein Platz, das ist Sache der Philosophie und auch dort ist umstritten, ob sie sinnvoll sind. Die zweite Zutat, mit der wir das Fundament der Mathematik errichten, ist die Logik. Moderne höhere Mathematik ist das Treffen von Aussagen über Mengen, sonst nichts. Mengen sind die Objekte, Logik ist die Sprache. So wie die Chemiker ihre Welt aus Atomen aufbauen, so bauen Mathematiker ihre Welt aus Mengen und Logik. Nun gibt es auch Kernphysiker, die nicht wissen wollen, was man aus Atomen bauen kann, sondern die auf der Suche nach dem Ursprung der Dinge Atome in möglichst kleine Einzelteile zerlegen. Wie sieht das in der Mathematik aus? Was passiert, wenn wir die Frage nach dem “Was” weiter treiben? Was ist eine Menge? Was ist eine Ausage? Was ist das Urteilchen der Mathematik? Irgendwann müssen wir ein Zeichen auf ein Papier machen, ein “x” oder ein “t”, ohne dabei sagen zu können, was das sein soll. Am Ende baut auch die strengste aller Wissenschaften auf etwas auf, das unsicher und unklar ist, über das wir nichts wissen und nichts sagen können. Das letzte Urteilchen der Mathematik gibt es nicht. Ab der ersten Grundsteinlegung ist die Mathematik allerdings zu hundert Prozent sicher und, wenn wir so wollen, “wahr”. Das ist, was diese Wissenschaft vor allen anderen auszeichnet. Wie das Gebäude der Analysis auf das Fundament aus Mengenlehre und Logik aufgebaut wird, ist Inhalt dieser Vorlesung. Im übertragenen Sinn: Dies ist eine Vorlesung über Chemie und nicht über Kernphysik. Die Kernphysik der Mathematik wird in Vorlesungen zu Mengenlehre und Logik behandelt. Einige Aspekte daraus sind auch für uns relevant. Ich will insbesondere dazu anregen, folgende Fragen zu geeigneten Zeitpunkten immer wieder zu stellen. (1) Wir können zwei Arten von Axiomensystemen unterscheiden: solche, die bis auf Isomorphie ein eindeutiges Objekt bestimmen, von jenen Systemen, die eine möglichst allgemeine Klasse von Objekten bestimmen. Was sind Beispiele solcher Axiomensysteme und worin besteht der Vorteil einer solchen Axiomatik? (2) Was besagen die Gödelschen Unvollständigkeitssätze und welche Auswirkungen haben sie für die Mathematik? (3) Welche Folgen hat das Auswahlaxiom? Wie sind Objekte beschaffen, deren Existenz mit dem Auswahlaxiom aber nicht ohne das Auswahlaxiom gezeigt werden kann? (4) Welche Probleme können sich ergeben, wenn Mathematik ohne axiomatisches Fundament betrieben wird und welche Probleme sind in früheren Jahrhunderten aufgrund fehlender Axiomatiken aufgetreten? (5) In welchen Studienrichtungen sollten Logik, Mengenlehre oder zumindest die darauf basierende Konstruktion der Mathematik behandelt werden? 4 0.0.2. Mathematik von Menschenhand oder naturgegeben? Die reelle Analysis ist Ergebnis einer Entwicklung, die sich vom 17. Jahrhundert bis in das 19. Jahrhundert gezogen hat. Manche fundamentalen Erkenntnisse zu den Grundlagen der modernen Mathematik konnten erst im 20. Jahrhundert erlangt werden (z.B. die Gödelschen Unvollständigkeitssätze). Ob Mathematik naturgegeben existiert und wir sie Schritt für Schritt entdecken, oder ob Mathematik etwas ist, das der Mensch erschafft, ist eine philosophische und keine mathematische Frage. Unbestritten ist, dass es auch historische Gründe dafür gibt, dass das Gebäude der modernen Analysis ist so, wie es ist. Es könnte genauso gut ganz anders aussehen. Der Aufbau der heutigen Mathematik ist, überspitzt formuliert, nur eine vorherrschende Lehrmeinung, die sich durchgesetzt hat. In der Nichtstandardanalysis wird beispielsweise mit unendlich kleinen Größen gerechnet und in der konstruktiven Mathematik auf das Auswahlaxiom verzichtet, denn es impliziert die Existenz von Objekten, die insofern pathologisch sind, als sie nicht genau beschrieben werden können. Die “vorherrschende Lehrmeinung” die in dieser Vorlesung präsentiert wird, behandelt “gewöhnliche” reelle Zahlen (nicht jene der Nichtstandardanalysis) und verwendet bei Bedarf das Auswahlaxiom. Aber nicht nur wie die Analysis aufgebaut ist, sondern auch die Gestalt ihrer Grundlagen (Mengenlehre und Logik) ist ein zum Teil zufälliges Produkt einer historischen Entwicklung. In diesem Sinn ist klar, dass die Mathematik als Theoriegebäude ein Werk von Menschenhand ist. Dass hingegen das Verhältnis aus Kreisumfang und Kreisdurchmesser als Grenzwert von verschiedenen schönen Zahlenreihen auftritt, ist nicht uns Menschen zu verdanken, sondern das ist ein Wunder der Natur. In der aktuellen Forschung der reinen Mathematik haben gerade jene Teilgebiete, die die spektakulärsten Erkenntnisse liefern und die meisten Forscherinnen und Forscher in ihren Bann ziehen, auch immer wieder verblüffende Anwendungen außerhalb der Mathematik bzw. tragen diese Teilgebiete externe (d.h. der realen Welt zuzurechnende) Inputs in sich. Es ist interessant danach zu fragen, ob dies daran liegt, dass tiefe Mathematik etwas Naturgegebenes ist, oder ob das eine Folge des Umstandes ist, dass unsere Hirne Maschinen unserer Welt und unserer Körper sind und somit von Natur aus kaum andere interessante Modelle beschreiben können, als solche, die in unserer Welt Anwendung finden. 0.0.3. Was ist Analysis? Das zentrale Objekt dieser Vorlesung sind reelle Funktionen, also Funktionen von R nach R. In weiteren Lehrveranstaltungen zur Analysis werden auch Funktionen in mehreren Veränderlichen betrachtet. In der komplexen Analysis (auch “Funktionentheorie” genannt) wird mit komplexen anstatt reellen Zahlen gearbeitet. Reelle Funktionen sind ein absolut unverzichtbares Modell in Naturwissenschaft, Technik und praktischen Anwendungen aller Art. Um als Mathematiker sinnvoll mit ihnen arbeiten zu können, müssen wir sie im “unendlich Kleinen” betrachten und verstehen, das heißt, wir zoomen mit einem Mikroskop immer tiefer und tiefer an einer Stelle hinein. Das ist die herausragende Eigenschaft der reellen Zahlen: Egal wo wir uns mit dem Mikroskop unendlich tief hineinzoomen, immer wird dort, wo wir das tun, am Ende etwas zu sehen sein, ein Punkt und kein Loch. Die Menge der reellen Zahlen ist aber nicht mit dieser Eigenschaft vom Himmel gefallen, sondern eben so konstruiert, dass sie diese Eigenschaft hat, dass sie eben keine “Löcher” hat. Die Mathematiker nennen das Vollständigkeit. Das sich-beliebig-nahe-Annähern heißt in der Mathematik Konvergenz. Sie steckt in allen zentralen Begriffen der Analysis: in der Stetigkeit, der Ableitung, im Integral usw. Damit Konvergenz funktioniert, brauchen wir Zahlenbereiche, die keine “Löcher” haben, die eben vollständig sind. Um die zentralen Begriffe der Analysis wirklich zu begreifen, ist es also hilfreich, schon die reellen Zahlen zu begreifen und zu verstehen, warum Analysis mit ganzzahligen Brüchen alleine nicht funktionieren kann, denn die Menge der ganzzahligen Brüche (die Menge der rationalen Zahlen) hat sehr wohl “Löcher”. Betrachten wir die rationalen Zahlen als Zahlenstrahl und zoomen uns mit dem Mikroskop an jener Stelle in die Tiefe, wo die Zahlen, deren Quadrat größer 2 ist, auf die Zahlen treffen, deren Quadrat kleiner als 5 6 2 ist, dann zeigt sich an dieser Stelle ein Loch. Es gibt keinen ganzzahligen Bruch, dessen Quadrat gleich 2 ist. Eine offene Kugel ist die Menge aller Punkte, die zu einem bestimmten Punkt (dem Mittelpunkt) einen Abstand haben, der kleiner als der gegebene Radius ist. Im dreidimensionalen Raum, sind Kugeln das, was wir uns gemeinhin unter Kugeln vorstellen. In der Ebene sind offene Kugeln Kreisscheiben ohne Randlinie und am Zahlenstrahl sind Kugeln offene Intervalle (ohne Randpunkte). Ein innerer Punkt einer Menge ist ein Punkt, der Mittelpunkt einer Kugel (bzw. eines Intervalls) ist, welche ganz in der Menge enthalten ist. Im Gegensatz zu den inneren Punkten berühren Randpunkte einer Menge den Bereich außerhalb der Menge. Wenn eine Menge nur aus inneren Punkten besteht, nennen wir sie offen. Beispiele sind offene Intervalle aber auch Vereinigungen von offenen Intervallen. Offene Mengen sind Gegenstand der Topologie, der Lehre von der Gestalt von Objekten und Räumen. In der Topologie werden offene Mengen nicht über Kugeln sondern allgemeiner durch eine Axiomatik definiert. Begriffe wie offene Mengen, Kompaktheit, Konvergenz oder Stetigkeit sind Grundbegriffe der Topologie. Wenn Studierenden die Analysis beigebracht wird, gibt es zwei Ansätze: Entweder man geht der Terminologie der Topologie soweit wie möglich aus dem Weg und jongliert stattdessen vermehrt mit kleinen Parametern (meist ε und δ), oder man versucht, diese manchmal technisch erscheinenden Rechnungen mit Parametern zu vermeiden und greift auf die Terminologie der Topologie zurück. Topologische Grundbegriffe im Kontext reeller Zahlen zu begreifen, bedeutet zwar, eine gewisse Abstraktion vollziehen zu müssen, dies ist jedoch ohnehin notwendig, um die nötigen Grundvorstellungen zu entwickeln. Ist dieser Schritt der topologischen Abstraktion einmal getan, werden die Grundbegriffe besser verständlich und mit ihnen zu arbeiten wird leichter. Die Analysis ist geprägt durch das Aufeinandertreffen von Arithmetik und Topologie, von konkreten Rechnungen und abstrakten Überlegungen, in deren Mittelpunkt der Grenzwertbegriff steht. 0.0.4. Bevor wir beginnen. Kommen Sie nicht in Versuchung, zu glauben, dass es ausreicht, sich beim Studieren auf die rechnerischen Aspekte der Analysis zu beschränken. Ihre wichtigste Aufgabe ist es, die theoretischen Grundbegriffe gut zu verstehen und sie in Beweisen anwenden zu können. Lernen Sie nichts auswendig, sondern bemühen Sie sich zu verstehen. Es ist in diesem Kurs nicht möglich, das Semester auch nur ein paar Wochen ohne intensive Arbeit vorrüber ziehen zu lassen, um dann vor der Prüfung punktuell den versäumten Stoff nachzuholen. Der Stoff ist aufbauend. Sie müssen theoretische Konzepte verinnerlichen und sich mit ihnen aktiv auch im Rahmen der Übungen auseinandersetzen, um Sicherheit zu gewinnen. Das erfordert viel Zeit. Ein oder zwei Vorlesungen zu versäumen und den Stoff nicht nachzuholen, kann bereits dazu führen, dass Sie den Anschluss verlieren. KAPITEL 1 Zahlen und Folgen 1.1. Konstruktion und Axiomatik Von der Schule kommend müssen wir uns davon verabschieden, Zahlen als etwas bloß Naturgegebenes zu behandeln. Jeder weiß zwar, wie man Schafe zählt, 1, 2, 3,. . . , aber was ist diese Eins, was ist dieser Zweier? Im Alltagsgebrauch ist es nicht notwendig, den Begriff einer Zahl zu präzisieren, aber in der höheren Mathematik hat sich eine rein anschauliche Herangehensweise als nicht praktikabel erwiesen. Wenn wir ohne klare Definitionen komplexe Mathematik betreiben wollen, entstehen schnell Missverständnisse und Widersprüche. Natürliche, ganze, rationale, relle und komplexe Zahlen sowie ihre grundlegenden Eigenschaften sind Stoff der Lehrveranstaltung “Einführung in das mathematische Arbeiten”. Die Konstruktionen der Zahlen werden in dieser Einführung in die Analysis in kurzgefasster Form dargestellt und nur einzelne Punkte genauer besprochen. Für eine ausführlichere Darstellung sei auf [11, Kapitel 6] verwiesen. Auch die im Folgenden erwähnten Axiomensysteme können dort nachgelesen werden. Die Zahlenbereiche benötigen keine axiomatische Grundlegung, sondern werden auf Mengenlehre und Prädikatenlogik aufgebaut und danach axiomatisch charakterisiert. Wichtig sind vor allem die Peano-Axiome der natürlichen Zahlen sowie die Axiome eines vollständig geordneten Körpers für die reellen Zahlen. 1.2. Natürliche Zahlen Das Fundament, auf das wir aufbauen, besteht aus Mengenlehre und Logik. Mengen werden heute meistens durch das sogenannte Zermelo-Fraenkelsche Axiomensystem eingeführt, welches Anfang des 20. Jahrhunderts entwickelt wurde. Die leere Menge, die mit { } oder ∅ bezeichnet wird, ist ein Urteilchen der höheren Mathematik. Das Unendlichkeitsaxiom ist eines der Zermelo-Fraenkelschen Axiome und besagt, dass es eine Menge M gibt, die die leere Menge als Element enthält, und die mit jedem ihrer Elemente x auch die Menge x ∪ {x} enthält. Eine Menge, die das Unendlichkeitsaxiom erfüllt, enthält die leere Menge ∅ und somit auch ∅ ∪ {∅} = {∅}. Da sie {∅} enthält, muss sie nach dem Unendlichkeitsaxiom auch {∅} ∪ {{∅}} = {∅, {∅}} enhalten, usw. Die Menge der natürlichen Zahlen inklusive der Null ist definiert als der Durchschnitt aller Mengen, die das Unendlichkeitsaxiom erfüllen: N0 := {∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}, . . .}, das ist die Menge die nur das enthält, was sie enthalten muss um das Unendlichkeitsaxiom zu erfüllen - und nicht mehr. Für x in N0 heißt x ∪ {x} der Nachfolger von x, er wird mit x0 bezeichnet. Definition 1.2.1. Die Abbildung + : N0 × N0 → N0 ist rekursiv gegeben durch (1.2.1.1) +(x, ∅) = x und (1.2.1.2) +(x, y 0 ) = +(x, y)0 . Den Elementen von N0 geben wir Namen. Wir schreiben 0 statt ∅, 1 statt 00 = {∅}, 2 statt 000 = {∅, {∅}}, 3 statt 0000 = {∅, {∅}, {∅, {∅}}} usw. Außerdem schreiben wir x + y 7 8 1. ZAHLEN UND FOLGEN statt +(x, y). Also entspricht (1.2.1.1) der Identität x + 0 = x und (1.2.1.2) entspricht x + (y + 1) = (x + y) + 1 bzw. x + y 0 = (x + y)0 . Wieviel ist 1 + 1 bzw. +(00 , 00 )? Aus (1.2.1.2) folgt +(00 , 00 ) = +(00 , 0)0 und (1.2.1.1) impliziert +(00 , 0)0 = (00 )0 = 000 = 2. Also ist 1+1 = 2. Es ist 000 nur eine andere Schreibweise für (00 )0 , das ist also der Nachfolger des Nachfolgers von 0, den wir mit 2 bezeichnen. Die Multiplikation natürlicher Zahlen wird über wiederholte Addition definiert. Kommutativität und Distributivgesetze lassen sich Induktiv zeigen, was wir aus Zeitgründen nicht durchführen wollen. Die Multiplikation natürlicher Zahlen ergibt sich durch wiederholte Addition. Für natürliche Zahlen x, y schreiben wir x < y, wenn x ∈ y ist. Zum Beispiel ist 0 < 2 weil ∅ ∈ {∅, {∅}} ist. Diese Relation ist eine totale Ordnung auf N0 . Das Prinzip der vollständigen Induktion lässt sich ebenfalls aus Axiomen der Mengenlehre ableiten, insbesondere mithilfe des Unendlichkeitsaxioms: Wenn für alle n ∈ N0 eine Aussage A(n) die Aussage A(n + 1) impliziert und die Aussage A(0) wahr ist, dann ist die Aussage A(n) für alle n ∈ N0 wahr. Die Peano-Axiome, welche die natürlichen Zahlen charakterisieren, sind etwas älter als die Zermelo-Fraenkelschen Axiome der Mengenlehre. Dass die oben mengentheoretisch eingeführten natürlichen Zahlen die Peano-Axiome erfüllen, ist für alle, die mit Mengen arbeiten wollen, ein zu beweisendes Theorem und nicht die Grundlegung der natürlichen Zahlen. Beispiel 1.2.2 (Übungsbeispiel 1). Zeigen Sie 3 + 2 = 5 bzw. +(0000 , 000 ) = 000000 unter Verwendung der Definition der Addition natürlicher Zahlen. 1.2.3 (Theoriefrage 1). Was besagt das Unendlichkeitsaxiom und wie kann damit die Menge der natürlichen Zahlen definiert werden? 1.3. Ganze Zahlen Wir schreiben (a, b) ∼ (c, d), wenn a + d = b + c ist. Das ist eine Äquivalenzrelation auf N0 × N0 . Definition 1.3.1. Die Menge der ganzen Zahlen Z ist definiert als Quotientenmenge (N0 × N0 )/ ∼. Verknüpfungen Summe ⊕ : Z × Z → Z und Produkt : Z × Z → Z definieren wir durch [(a, b)] ⊕ [(c, d)] := [(a + c, b + d)], [(a, b)] [(c, d)] := [(ac + bd, ad + bc)]. Zum Beispiel entspricht die Äquivalenzklasse {(0, 2), (1, 3), (2, 4), (3, 5), (4, 6), . . .}. der ganzen Zahl -2 in unserem natürlich-anschaulichen Zahlenverständnis. Die Zahl 3 entspricht z.B. [(3, 0)] oder [(5, 2)]. Die Summe 3 + (−2) ist formal [(5, 2)] ⊕ [(0, 2)] = [(5, 4)]. Der Äquivalenzklasse [(5, 4)] entspricht die Zahl 1 in unserer Anschauung. Die Definition des Produkts wird verständlicher durch die Identität ac + bd − ad − bc = (a − b)(c − d). Um zu zeigen, dass die Summe von [(a, b)] und [(c, d)] wohl definiert ist, muss gezeigt werden, dass [(a + c, b + d)] nicht von der Wahl der Repräsentanten (a0 , b0 ) ∈ [(a, b)] und (c0 , d0 ) ∈ [(c, d)] abhängt. Es seien also (a0 , b0 ) ∈ [(a, b)] und (c0 , d0 ) ∈ [(c, d)] zwei beliebige Repräsentanten. Wegen (a0 , b0 ) ∼ (a, b) und (c0 , d0 ) ∼ (c, d) ist a0 +b = a+b0 und c0 +d = d0 +c. Daraus folgen a0 + c0 + b + d = a + c + b0 + d0 und somit (a + c, b + d) ∼ (a0 + c0 , b0 + d0 ) und [(a + c, b + d)] = [(a0 + c0 , b0 + d0 )]. Also erhalten wir unabhängig von der Wahl der Repräsentanten immer die gleiche Summe, was zu zeigen war. Ganze Zahlen mit einem Repräsentanten (n, 0), n ∈ N, nennen wir positiv, die mit einem Repräsentanten (0, n) negativ und die ganze Zahl, die (0, 0) enthält, nennen wir die Null. 1.4. ZUR KONSTRUKTION DER ZAHLENBEREICHE 9 Für zwei natürliche Zahlen m, n ist [(m, 0)] ⊕ [(n, 0)] = [(m + n, 0)]. Das heißt, wenn wir natürliche Zahlen n durch [(n, 0)] ersetzen und die Addition + der natürlichen Zahlen durch die Addition ⊕ der ganzen Zahlen ersetzen, sehen wir, dass die natürlichen Zahlen zusammen mit ihrer Addition sich als Teil der ganzen Zahlen darstellen lassen. Im Folgenden betrachten wir N0 daher als Teilmenge von Z und schreiben auch + und · statt ⊕ und . Wir halten fest, dass (Z, +, ·) ein Ring ist, ohne alle Rechengesetze zu überprüfen. Die Ordnung der ganzen Zahlen konstruieren wir mithilfe der Ordnung der natürlichen Zahlen, indem wir [(a, b)] < [(c, d)] schreiben, falls a + d < b + c ist. Beispiel 1.3.2 (Übungsbeispiel 2). Zeigen Sie x · 2 = x + x, für alle x ∈ Z bzw. [(2, 0)] [(a, b)] = [(a, b)] ⊕ [(a, b)] unter Verwendung der Definition von Addition und Multiplikation ganzer Zahlen. Beispiel 1.3.3 (Übungsbeispiel 3). Zeigen Sie das Distributivgesetz für ganze Zahlen, also [(a, b)] ([(c, d)] ⊕ [(e, f )]) = [(a, b)] [(c, d)] ⊕ [(a, b)] [(e, f )], für alle [(a, b)], [(c, d)] und [(e, f )] in Z. 1.3.4 (Theoriefrage 2). Wie ist die Menge der ganzen Zahlen definiert? Definieren Sie Addition und Multiplikation ganzer Zahlen und zeigen Sie, dass die Addition wohl definiert ist. 1.4. Zur Konstruktion der Zahlenbereiche Bevor wir weitere Zahlenbereiche definieren, wollen wir das Prinzip beschreiben, das hinter diesen Konstruktionen steht. Ganze Zahlen sind Äquivalenzklassen von Paaren natürlicher Zahlen. Natürliche Zahlen werden also verwendet, um Ganze Zahlen zu konstruieren, gleichzeitig sehen wir natürliche Zahlen auch als ganze Zahlen an. Welche ist nun die richtige natürliche Zahl 2, jene Zahl 2 = {∅, {∅}}, die wir durch das Unendlichkeitsaxiom aus der Mengenlehre erhalten haben, oder die Äquivalenzklasse [(2, 0)] = [({∅, {∅}}, {})], die ein Element von Z ist? Die für uns relevanten Zahlenbereiche N, Z, Q, R und C können alle axiomatisch charakterisiert werden, siehe [11, Kapitel 6]. Das heißt, sie erfüllen jeweils eine Liste an Axiomen und je zwei Zahlenbereiche, die diese Axiome erfüllen, sind zueinander isomorph in dem Sinn, dass sie strukturell gleich sind. Isomorphe Zahlenbereiche sind bis auf die Bezeichnung ihrer Elemente gleich. Formal: Wenn +1 : M1 ×M1 → M1 und +2 : M2 ×M2 → M2 zwei Abbildungen (Verknüpfungen) sind, dann nennen wir (M1 , +1 ) und (M1 , +2 ) isomorph, wenn es eine Bijektion f : M1 → M2 gibt, für die x +1 y = z genau dann gilt, wenn f (x) +2 f (y) = f (z) ist. Es sei N = N0 \ {0} = {1, 2, 3, . . .} und Z+ = {[(n, 0)] ∈ Z | n ∈ N}. Dann ist f : N → Z+ , n 7→ [(n, 0)], + ein Isomorphismus (N, +) → (Z , ⊕), weil k + m = n ⇐⇒ [(k, 0)] ⊕ [(m, 0)] = [(n, 0)]. Strukturell sind (N, +) und (Z+ , ⊕) also gleich, nur ihre Elemente sehen anders aus. Da wir uns nur für die strukturellen (algebraischen) Eigenschaften der Zahlenbereiche interessieren und nicht für das Aussehen ihrer Elemente, sprechen wir auch nicht von diesen und jenen natürlichen Zahlen, sondern nur von den natürlichen Zahlen. Andere Axiomensyteme sind hingegen so formuliert, dass sie möglichst allgemein gehalten sind, das heißt, dass sie möglichst viele Mengen umfassen. Beispiele sind die Axiomensysteme für Halbgruppen, Gruppen, Ringe oder Körper. Die ganzen Zahlen zusammen mit ihrer Addition bilden zum Beispiel eine Gruppe. Es gibt jedoch noch viele andere Gruppen, die sich strukturell wesentlich voneinander unterscheiden. Sich mit diesen Gruppen zu befassen, ist eine eigene wichtige Teildisziplin der Mathematik: die Gruppentheorie. 10 1. ZAHLEN UND FOLGEN Die natürlichen Zahlen sind ein Beispiel einer Halbgruppe, die ganzen Zahlen mit ihrer Addition und Multiplikation sind ein Beispiel eines Rings und die rationalen, reellen und komplexen Zahlen sind Beispiele von Körpern, vergleiche [11, Kapitel 5]. 1.4.1 (Theoriefrage 3). Was bedeutet es, dass (Z+ , ⊕) und (N, +) isomorph sind? 1.5. Rationale Zahlen Wir schreiben ab statt a · b für ganze Zahlen a, b und (a, b) ≈ (c, d), wenn ad = cb. Lemma 1.5.1. Die Relation ≈ auf Z × N ist eine Äquivalenzrelation. Beweis. Reflexivität und Symmetrie sind klar. Angenommen, es ist (a, b) ≈ (c, d) und (c, d) ≈ (e, f ), also ad = cb und cf = ed. Dann ist adf = cbf , cf b = edb und daher adf = edb, woraus af = eb bzw. (a, b) ≈ (e, f ) folgt. Das heißt, die Relation ist auch transitiv. In diesem Beweis haben wir nur mit ganzen Zahlen gerechnet. Daher dürfen wir keine Division verwenden. Die Menge der rationalen Zahlen definieren wir als Q := (Z × N)/ ≈ . Statt (a, b) schreiben wir auch a b oder a/b. Zum Beispiel sind 3 1 und 2 6 Elemente der selben ≈-Äquivalenzklasse. Es ist (1, 2) 6= (3, 6) aber [(1, 2)] = [(3, 6)]. Man beachte, dass per Definition die Nenner dieser Brüche stets positiv sind. Lemma 1.5.2. Jede rationale Zahl enthält genau ein Paar (x, y) mit ggT(x, y) = 1. Umgekehrt, wenn ggT(x, y) = 1 und (x, y) ≈ (a, b), dann gibt es ein n ∈ N0 , sodass (a, b) = (nx, ny). Beweis. Es sei q eine rationale Zahl und (a, b) ∈ q. Wenn wir a und b in ihrer eindeutigen Primfaktorzerlegung (siehe [11, Satz 5.3.45]) anschreiben und gemeinsame Faktoren streichen, erhalten wir (x, y) mit ggT(x, y) = 1. Es sei (x0 , y 0 ) ein beliebiges Paar in q mit ggT(x0 , y 0 ) = 1. Aus (x, y) ≈ (x0 , y 0 ) folgt 0 xy = x0 y. Jeder Primfaktor von y 0 teilt y, weil er x0 nicht teilt, folglich ist y 0 |y. Umgekehrt folgt mit dem gleichen Argument y|y 0 . Da y und y 0 natürliche Zahlen sind, ist y = y 0 . Somit ist auch x = x0 . Also ist (x, y) = (x0 , y 0 ) und (x, y) eindeutig. Es sei ggT(x, y) = 1 und (x, y) ≈ (a, b). Aus (x, y) ≈ (a, b) folgt xb = ay und ggT(x, y) = 1 impliziert x|a und y|b. Also gibt es natürliche Zahlen m, n mit a = mx und b = ny. In xb = ay eingesetzt ergibt das nxy = mxy und daher m = n beziehungsweise (a, b) = (nx, ny). Die Verknüpfung : Q × Q → Q sei definiert durch [(a, b)] [(c, d)] := [(ad + bc, bd)] Es ist zu zeigen, dass diese Abbildung wohl definiert ist, dass also die Wahl des Repräsentanten der Äquivalenzklasse keine Auswirkung auf das Ergebnis der Verknüpfung hat. Nach Lemma 1.5.2 gibt es (a0 , b0 ) ∈ [(a, b)] und (c0 , d0 ) ∈ [(c, d)] mit ggT(a0 , b0 ) = ggT(c0 , d0 ) = 1, (a, b) = (ma0 , mb0 ) und (c, d) = (nc0 , nd0 ). Die Gleichung [(a, b)] [(c, d)] = [(ad + bc, bd)] = [(ma0 nd0 + mb0 nc0 , mb0 nd0 )] = [(mn(a0 d0 + b0 c0 ), mn(b0 d0 ))] = [(a0 d0 + b0 c0 , b0 d0 )] = [(a0 , b0 )] [(c0 , d0 )] 1.5. RATIONALE ZAHLEN 11 besagt, dass die Verknüpfung für beliebige Repräsentanten (a, b), (c, d) immer dasselbe Ergebnis wie die eindeutig bestimmten relativ primen Repräsentanten (a0 , b0 ), (c0 , d0 ) liefert. Somit ist die Wahl der Repräsentanten (a, b), (c, d) unerheblich und die Verknüpfung wohl definiert. Wenn wir z.B. von der rationalen Zahl 32 sprechen, meinen wir deren Äquivalenzklasse. Wir schreiben 2 4 = 3 6 und meinen damit, dass die Äquivalenzklassen dieser Brüche ident sind, auch wenn (2, 3) und (4, 6) verschiedene Elemente von Z × N sind. Statt −1 1 kann − 2 2 geschrieben werden, auch wenn dieser Ausdruck nicht die Form a b mit a ∈ Z und b ∈ N hat. Aus der Ordnungsrelation auf Z erhalten wir eine Ordnungsrelation auf Q, indem wir [(a, b)] ≤ [(c, d)] schreiben, falls ad ≤ bc ist. Für diese Relation auf Q muss gezeigt werden, dass sie wohl definiert ist und die Axiome einer Ordnungsrelation erfüllt. Die rationalen Zahlen bilden mit ihrer Addition, ihrer Multiplikation und dieser Ordnungsrelation einen geordneten Körper, siehe [11, Kapitel 6.3]. Definition 1.5.3. Wir sagen, dass zwei Mengen gleich mächtig sind, bzw. gleich viele Elemente haben, wenn sie bijektiv aufeinander abgebildet werden können. Eine Menge heißt unendlich abzählbar wenn sie gleich viele Elemente wie N hat und abzählbar, wenn sie endlich oder unendlich abzählbar ist. Anschaulich ist eine Menge abzählbar, wenn alle ihre Elemente in einer Reihe aufgeschrieben werden können: Es wird ein erstes Element gewählt, dann ein zweites, drittes usw. und zwar so, dass jedes Element der Menge in dieser Aufzählung einmal vorkommt. Die Bijektion bildet das erste Element der Aufzählung auf die natürliche Zahl 1 ab, das zweite auf die Zahl 2 ab usw. Satz 1.5.4. Die Mengen Z und Q sind abzählbar. Beweis. Die ganzen Zahlen können abgezählt werden durch 0, 1, −1, 2, −2, 3, −3, . . . Die ganzzahligen Brüche ordnen wir nach folgendem Diagonalschema an, wobei kürzbare Brüche weggelassen werden. Die verbleibenden nicht kürzbaren Brüche sind Repräsentanten der positiven rationalen Zahlen. 1/1 → . 2/1 ↓ % 3/1 . 4/1 ↓ % 5/1 1/3 → 1/4 1/5 → . % 2/2 2/3 2/4 . % 3/2 3/3 % 4/2 1/2 % Nehmen wir die Null und die negativen Zahlen hinzu, erhalten wir folgende Abzählung der rationalen Zahlen Q (bzw. ihrer gekürzten Repräsentanten): 12 1. ZAHLEN UND FOLGEN 0, 1 1 1 1 2 2 3 3 1 1 1 1 2 2 , − , , − , , − , , − , , − , , − , , − ,... 1 1 2 2 1 1 1 1 3 3 4 4 3 3 Beispiel 1.5.5 (Übungsbeispiel 4). Zeigen Sie, dass die Verknüpfung : Q×Q → Q mit [(a, b)] [(c, d)] := [(ac, bd)] wohl definiert ist. Beispiel 1.5.6 (Übungsbeispiel 5). Zeigen Sie, dass es für jede nicht leere endliche Menge M eine Bijektion zwischen der Menge der Teilmengen von M mit gerader Mächtigkeit und der Menge der Teilmengen von M mit ungerader Mächtigkeit gibt. Beispiel 1.5.7 (Übungsbeispiel 6). Es sei M eine nicht leere Menge und F die Menge aller Funktionen M → {0, 1}. Zeigen Sie, dass es keine Bijektion zwischen M und F geben kann und leiten Sie daraus ab, dass die Potenzmenge einer Menge stets mehr Elemente als die Menge selbst hat. Hinweis: Angenommen es gäbe eine Bijektion f : M → F, dann betrachten Sie die Funktion g : M → {0, 1}, die jedes m ∈ M abbildet auf ( 1, falls f (m)(m) = 0 g(m) = . 0, falls f (m)(m) = 1 1.5.8 (Theoriefrage 4). Konstruieren Sie die Menge der rationalen Zahlen aus den ganzen und den natürlichen Zahlen über eine Relation. Zeigen Sie, dass diese Relation eine Äquivalenzrelation ist. Definieren Sie Addition und Multiplikation rationaler Zahlen. 1.5.9 (Theoriefrage 5). Zeigen Sie, dass Q abzählbar ist. 1.6. Folgen Definition 1.6.1. Ein Folge in einer Menge ist eine Abbildung von den natürlichen Zahlen in diese Menge. Eine Folge f : N → M bezeichnet man oft mit (xn )n∈N , wobei xn = f (n) ist. Wir nennen f (n) = xn das n-te Folgenglied und n den Index von xn . Wenn klar ist, dass die Folge den Index n hat und dieser N durchläuft, dann schreiben wir auch kurz (xn ) statt (xn )n∈N . Beispiel 1.6.2. 1. Es ist f : N → Z mit f : n 7→ 2n − 3 eine Folge in Z. Die alternative Schreibweise ist (2n − 3)n∈N . Gliedweise angeschrieben ist diese Folge −1, 1, 3, 5, 7, . . . n n (−1) 2. Die Folge f : N → Q mit f : n 7→ (−1) 3n ist in den anderen Schreibweisen ( 3n )n∈N bzw. 1 1 1 1 − , ,− , ,... 3 6 9 12 3. Für M = {D, 7, ♥, ∗} ist f : N → M mit ( D n = 1, 2 f (n) = ♥ n≥3 eine Folge in M . Gliedweise angeschrieben ergibt das D, D, ♥, ♥, ♥, ♥, ♥, . . . 1.6. FOLGEN 13 Definition 1.6.3. Ein Folge (xn )n∈N ist konstant, wenn xm = xn für alle m und n ist. Ein rationale Folge heißt nach oben (bzw. nach unten) beschränkt, wenn es eine rationale Zahl c gibt, sodass xn ≤ c (bzw. c ≤ xn ) für alle n in N ist. Eine Folge heißt beschränkt, wenn die Folge ihrer Beträge (|xn |)n∈N nach oben beschränkt ist. Die Folge (xn )n∈N heißt monoton steigend (bzw. monoton fallend ) wenn xn ≤ xn+1 (bzw. xn ≥ xn+1 ) ist für alle n ∈ N. Eine Folge, die entweder monoton steigend oder monoton fallend ist, heißt monoton. Gilt < statt ≤ oder > statt ≥, nennen wir die Folge streng monoton. Für eine (Vorzeichen-)alternierende Folge (xn )n∈N gilt entweder x2n > 0 und x2n+1 < 0 für alle n oder x2n < 0 und x2n+1 > 0. Wir sagen, dass (xn )n∈N eine Eigenschaft ab einer Stelle (oder ab einem Index ) hat, wenn es ein N ∈ N gibt, sodass die Folge (xn )n≥N = xN , xN +1 , xN +2 , . . . diese Eigenschaft hat. Fast alle Elemente einer Menge sind alle Elemente bis auf endlich viele. Anstatt zu sagen, eine Folge habe eine Eigenschaft ab einer Stelle, können wir auch sagen, dass fast alle ihre Glieder diese Eigenschaft haben. Die erste Folge in Beispiel 1.6.2 ist streng monoton steigend, sie ist nach unten, jedoch nicht nach oben beschränkt. Die zweite Folge ist alternierend, beschränkt und nicht monoton. Für die dritte Folge macht es keinen Sinn, nach Monotonie oder Beschränktheit zu fragen, da unsere entsprechenden Definitionen nur für Folgen rationaler Zahlen gelten. Diese Folge ist aber ab einer Stelle konstant. Folgen werden sowohl als Abbildung als auch als Menge ihrer Bildpunkte betrachtet, also ohne die Indices der Folgenglieder zu berücksichtigen. Zum Beispiel sagen wir “Die Folge ( n1 )n∈N ist in [0, 1] enthalten” wobei die Folge als Abbildung ja keine Teilmenge des Einheitsintervalls [0, 1] ist, sondern die Menge ihrer Bildpunkte 1 1 1 {1, , , , . . .} 2 3 4 in [0, 1] enthalten ist. Diese Ungenauigkeit in der Terminologie akzeptieren wir, solange dadurch keine Missverständnisse entstehen. Eine Abbildung N0 → M bezeichnen wir ebenfalls als Folge. Manchmal ist es praktischer, Folgenglieder mit x0 , x1 , x2 . . . zu bezeichnen anstatt mit x1 , x2 , x3 . . . Beispiel 1.6.4 (Übungsbeispiel 7). Finden Sie rekursive Darstellungen (mit Anfangsbedingung) und explizite Darstellungen der Folgen (1) 5, 7, 9, 11, 13, 15 . . . 1 1 (2) −2, 1, − 12 , 14 , − 18 , 16 , − 32 ,... (3) 4, 1, 0, 1, 4, 9, 16, 25, 36, . . . Beispiel 1.6.5 (Übungsbeispiel 8). Ist die Folge (xn ) mit n−1 xn = 2 n +2 ab einer Stelle monoton oder alternierend? Wenn ja, ab welcher Stelle? Ist die Folge beschränkt? Hinweis: Berechnen Sie die ersten Glieder der Folge, leiten Sie daraus Vermutungen ab und beweisen Sie diese Vermutungen dann. Beispiel 1.6.6 (Übungsbeispiel 9). Eine rationale Folge ist rekursiv gegeben durch xn+1 = x2n + 1. (1) Für welche Werte von x0 ist diese Folge monoton steigend, monoton fallend, konstant, beschränkt bzw. alternierend? (2) Bestimmen Sie xn explizit (nur in Abhängigkeit von x0 ). 14 1. ZAHLEN UND FOLGEN Beispiel 1.6.7 (Übungsbeispiel 10). Wie Übungsbeispiel 9 nur mit xn+1 = −2xn + 1. Beispiel 1.6.8 (Übungsbeispiel 11). Die Fibonacci-Zahlen sind rekursiv definiert durch F0 = 0, F1 = 1 und Fn = Fn−1 + Fn−2 . Es sei Fn+1 xn = . Fn Bestimmen Sie das Monotonieverhalten der Folgen (x2n )n∈N0 und (x2n+1 )n∈N0 . Hinweis: Berechnen Sie die ersten Werte und leiten Sie daraus eine Vermutung ab. Diese beweisen Sie dann z.B. indem sie die Rekursionsgleichung im Zähler der Folgenglieder anwenden. Sollten Sie bereits etwas über Konvergenz von Folgen wissen: Das werden wir auch für diese Folge zu einem späteren Zeitpunkt behandeln. 1.6.9 (Theoriefrage 6). Was ist eine Folge? Was bedeutet es, dass eine Folge eine Eigenschaft ab einer Stelle besitzt? Stellen Sie zu gegebenen Folgen fest, ob diese ab einer Stelle konstant, beschränkt, alternierend oder (streng) monoton steigend bzw. fallend sind. 1.7. Konvergenz und geometrische Folgen Mit Q+ bezeichnen wir die Menge der positiven rationalen Zahlen {x ∈ Q | x > 0}. Der folgende Hilfssatz ist sehr einfach. Wir formulieren ihn trotzdem als solchen, weil er insbesondere für die axiomatische Charakterisierung der reellen Zahlen, welche wir noch nicht definiert haben, wichtig ist. Lemma 1.7.1 (Archimedische Eigenschaft der rationalen Zahlen). Für alle ε ∈ Q+ gibt es ein n ∈ N mit n1 < ε. Für alle x, y ∈ Q+ gibt es ein n ∈ N, sodass nx > y ist. Beweis. Es sei ε = ab aus Q+ . Dann ist für n = b + 1 die erste Ungleichung n1 < ε erfüllt. Insbesondere gibt es also für ε = xy ein n ∈ N mit n1 < xy und somit auch y < nx, wodurch auch die zweite Ungleichung gezeigt ist. Wir definieren n0 = 1 für alle n ∈ N0 . Potenzen mit Exponenten aus N ergeben sich aus der Definition der Multiplikation. Satz 1.7.2 (Ungleichung von Bernoulli). Wenn x ∈ Q, x ≥ −1, und n ∈ N0 , dann ist (1 + x)n ≥ 1 + nx. Beweis. Wir beweisen die Aussage mit Induktion nach n. Für n = 0 erhalten wir 1 ≥ 1 und somit ein wahre Aussage. Nach der Induktionsannahme (I.A.) ist die Ungleichung für n erfüllt; dann ist (1 + x)n+1 = (1 + x)n (1 + x) I.A. ≥ 2 (1 + nx)(1 + x) = 1 + (n + 1)x + nx ≥ 1 + (n + 1)x, womit der Indutionsschritt von n nach n + 1 bewiesen ist. Definition 1.7.3. Ein offenes rationales Intervall ist eine Menge der Form (a, b) := {x ∈ Q | a < x < b} oder (a, ∞) := {x ∈ Q | a < x} bzw. (−∞, b) := {x ∈ Q | x < b}. Ein abgeschlossens rationales Intervall ist ein Menge [a, b] := {x ∈ Q | a ≤ x ≤ b}. Eine Umgebung in Q einer rationalen Zahl a in Q ist eine Menge U ⊂ Q, für die es ein ε ∈ Q+ gibt, sodass (a − ε, a + ε) in U enthalten ist. Eine Menge rationaler Zahlen heißt offen, wenn sie Umgebung jedes ihrer Punkte ist. 1.7. KONVERGENZ UND GEOMETRISCHE FOLGEN 15 Beispiel 1.7.4. Jedes offene Intervall I ist Umgebung in Q jedes seiner Punkte, denn wenn ε der kleinere der Abstände von x zu den Randpunkten von I ist, dann ist ε > 0, x ∈ (x − ε, x + ε) ⊂ I und (x − ε, x + ε) eine Umgebung von x in I. Ein abgeschlossenes Intervall [a, b] ist Umgebung aller Punkte aus (a, b), aber keine Umgebung der Randpunkte a und b. Eine Menge ganzer Zahlen ist keine Umgebung in Q irgendeines ihrer Punkte. Lemma 1.7.5. Eine Menge rationaler Zahlen ist genau dann offen, wenn sie eine Vereinigung von offenen Intervallen ist. Beweis. Es sei O ⊂ Q Umgebung jedes ihrer Punkte. Für jedes x ∈ O gibt es ein ε(x) > 0 mit (x − ε(x), x + ε(x)) ⊂ O. Dann ist [ O= (x − ε(x), x + ε(x)) x∈O und somit eine Vereinigung offener Intervalle. Umgekehrt, wenn O ⊂ Q eine Vereinigung offener Intervalle ist, gibt es für jedes x ∈ O eines dieser Intervalle I mit x ∈ I ⊂ O und dieses I ist nach Beispiel 1.7.4 eine Umgebung von x in O. Definition 1.7.6. [Konvergenz einer Folge – topologische Formulierung] Eine Folge konvergiert gegen einen Punkt, wenn sie in jeder offenen Umgebung des Punktes ab einer Stelle enthalten ist. So ein Punkt heißt Grenzwert oder Limes der Folge. Wenn x Grenzwert der Folge (xn )n∈N ist, schreiben wir lim xn = x, n→∞ oder wenn klar ist, welcher der Index ist, dann auch lim xn . Wenn wir lim xn = x schreiben, ohne das weiter zu kommentieren, dann sind damit zwei Aussagen gemeint: Erstens, dass die Folge (xn )n∈N konvergent ist und zweitens, dass ihr Grenzwert x ist. Gelegentlich sagt man auch, die Folge (xn )n∈N geht gegen x. Folgen, die nicht konvergent sind, heißen divergent. Die Folge, der Grenzwert und die Umgebungen müssen in einer vorher festgelegten Grundmenge liegen. Was unter einer offenen Menge zu verstehen ist, hängt von der Grundmenge ab. In Q sind das offene Intervalle, in der Ebene offene Kreisscheiben (ohne Rand). Die allgemeinste Definition einer Umgebung findet sich in der Topologie. Dort werden offene Umgebungen über allgemeine offene Mengen definiert, die bestimmte Axiome erfüllen müssen. Verbreitet in der Literatur ist folgende Definition, die für rationale Folgen äquivalent zu Definition 1.7.6 ist. Definition 1.7.7. [Konvergenz einer Folge – ε-Formulierung] Eine Folge (xn )n∈N rationaler Zahlen konvergiert gegen x ∈ Q, wenn es für alle ε > 0 ein n0 ∈ N gibt, sodass |xn − x| < ε für alle n ≥ n0 . Satz 1.7.8. Eine Folge rationaler Zahlen hat höchstens einen Grenzwert. Beweis. Angenommen (xn )n∈N hat zwei verschiedene Grenzwerte a und b, wobei wir mit a den größeren der Grenzwerte bezeichnen. Dann sind a−b a−b a−b a−b ,b + und a− ,a + b− 2 2 2 2 zwei disjunkte Umgebungen dieser Grenzwerte; siehe Abbildung 1. Eine Folge kann aber nicht ab einer Stelle in einer Menge und zugleich ab einer Stelle in einer dazu disjunkten Menge liegen. Daher führt die Annahme, dass es zwei verschiedene Grenzwerte gibt, auf einen Widerspruch. 16 1. ZAHLEN UND FOLGEN b a−b 2 a a−b 2 a−b 2 a−b 2 Abbildung 1. Eindeutigkeit des Grenzwerts Definition 1.7.9. Eine Folge, die gegen 0 konvergiert, heißt Nullfolge. Die Folge ( n1 )n∈N heißt harmonische Folge und (q n )n∈N0 geometrische Folge. Beispiel 1.7.10 (Konvergente rationale Folgen). (1) Eine Folge, die ab einer Stelle konstant ist, ist konvergent. (2) Die harmonische Folge ist eine Nullfolge. (3) Für |q| < 1 ist die geometrische Folge (q n )n∈N0 eine Nullfolge. Beweis. Die Konvergenz einer Folge, die ab einer Stelle konstant ist, folgt unmittelbar aus der Definition der Konvergenz. In jedem Intervall (−ε, ε) liegt die harmonische Folge ab einer Stelle, siehe dazu Lemma 1.7.1. 1 1 − 1, also |q| = 1+x . Wegen |q| < 1 ist x > 0. Nach der Ungleichung Für q 6= 0 sei x = |q| von Bernoulli (Satz 1.7.2) gilt 1 1 |q|n = ≤ n (1 + x) 1 + nx für alle n ∈ N0 . Es sei (−ε, ε) eine beliebig kleine Umgebung von 0. Die Ungleichung 1 <ε 1 + nx ist äquivalent zu 1−ε < n. εx Für alle n > 1−ε εx ist also 1 1 |q|n = ≤ < ε. (1 + x)n 1 + nx Daher ist die Folge (|q|n )n∈N0 für jedes ε > 0 ab einer Stelle in (−ε, ε), was zu zeigen war. Beispiel 1.7.11 (Übungsbeispiel 12). Aus der Vorlesung wissen wir, dass eine Menge rationaler Zahlen genau dann offen ist, wenn sie eine Vereinigung von offenen Intervallen ist. Daher ist die Vereinigung von beliebig vielen offenen Mengen offen. Gilt dies auch für den Durchschnitt? Wenn nicht, geben Sie eine Gegenbeispiel an. Beispiel 1.7.12 (Übungsbeispiel 13). Es sei xn = n + (−1)n n+1 und 1 1 , 1 + i ). 10i 10 Finde für i = 1, 2, 3 jeweils ein N (i), sodass xn ∈ Ui für alle n ≥ N (i). Anmerkung: Die N (i) müssen nicht minimal gewählt werden. Ui = (1 − Beispiel 1.7.13 (Übungsbeispiel 14). Zeigen Sie, dass die Folge (xn ) mit n 28 xn = 1 − 2 n gegen 1 konvergiert, indem Sie mit Ihren Argumenten von der Definition der Konvergenz ausgehen. Hinweis: Beroulli-Ungleichung für genügend große n. 1.8. CAUCHY-FOLGEN UND GRENZWERTSÄTZE 17 Beispiel 1.7.14 (Übungsbeispiel 15). Zeigen Sie, dass die Folge ((−1)n )n∈N nicht konvergent ist. Hinweis: Sie können z.B. einen indirekten Beweis führen, indem Sie eine Zahl a als Grenzwert annehmen, dann ein geeignetes ε > 0 wählen und einen Widerspruch zur Definition der Konvergenz ableiten. 1.7.15 (Theoriefrage 7). Formulieren und beweisen Sie die Ungleichung von Bernoulli. 1.7.16 (Theoriefrage 8). Zeigen Sie, dass eine konvergente rationale Folge nur einen Grenzwert hat. 1.7.17 (Theoriefrage 9). Zeigen Sie die Konvergenz der geometrischen Folge (zum Beispiel mithilfe der Ungleichung von Bernoulli). 1.8. Cauchy-Folgen und Grenzwertsätze Definition 1.8.1. Eine Folge rationaler Zahlen ist eine Cauchy-Folge, wenn für alle rationalen ε > 0 ab einer Stelle die Abstände der Folgenglieder zueinander kleiner als ε sind. Formal: Es ist (xn )n∈N eine Cauchy-Folge, wenn es für alle ε > 0 ein N ∈ N gibt, sodass |xm − xn | < ε für alle n, m mit n, m ≥ N . Satz 1.8.2. Jede konvergente Folge ist Cauchy-Folge. Beweis. Um zu zeigen, dass eine gegen x konvergente Folge (xn )n∈N eine Cauchy-Folge ist, wählen wir ein beliebiges ε > 0. Da die Folge konvergent ist, liegt sie ab einer Stelle in (x − ε/2, x + ε/2). Daher gilt auch |xm − xn | < ε ab dieser Stelle und die Folge ist somit eine Cauchy-Folge. Satz 1.8.3. Jede Cauchy-Folge ist beschränkt. Beweis. Wenn (xn ) eine Cauchy-Folge ist, gibt es ein N , sodass |xm − xn | < 1 für alle m, n ≥ N . Insbesondere ist |xm − xN | < 1 für alle m ≥ N . Daraus folgt, dass die ganze Folge in der beschränkten Menge {x0 , x1 , . . . , xN −1 } ∪ [xN − 1, xN + 1] enthalten und somit selbst beschränkt ist. Korollar 1.8.4. Jede konvergente Folge ist beschränkt. Satz 1.8.5. Wenn (xn ) und (yn ) konvergent sind, dann konvergieren auch (xn + yn ) und (xn yn ) und es ist (1.8.5.1) lim(xn + yn ) = lim xn + lim yn , (1.8.5.2) lim(xn yn ) = lim xn lim yn . Beweis. Es sei x := lim(xn ) und y := lim(yn ). Für jedes ε > 0 sind |(xn − x)| und |(yn − y)| ab einer Stelle kleiner als ε/2. Also ist ab einer Stelle ε ε |(xn + yn ) − (x + y)| = |(xn − x) + (yn − y)| ≤ |(xn − x)| + |(yn − y)| < + = ε. 2 2 Somit konvergiert (xn + yn ) gegen den Grenzwert x + y. Für das Produkt der Folgen gehen wir ähnlich vor: |xn yn − xy| = |xn yn − xn y + xn y − xy| = |xn (yn − y) + (xn − x)y| ≤ |xn ||yn − y| + |xn − x||y|. Letzterer Term geht mit wachsendem Index n gegen Null, weil |yn − y| und |xn − x| gegen Null gehen, weil |xn | beschränkt und y eine Konstante ist. Also ist auch |xn yn − xy| eine Nullfolge und somit lim(xn yn ) = xy. 18 1. ZAHLEN UND FOLGEN Wenn wir die Größen benennen, sieht dieser Beweis so aus: Nach Korollar 1.8.4 ist (xn )n∈N beschränkt. Daher ist auch (|xn |)n∈N von einer positiven Zahl c nach oben beschränkt. Es sei K := max{c, y} und ε > 0 beliebig. Es gibt ein N sodass |yn − y| < ε/(2K) und |xn − x| < ε/(2K) für alle n ≥ N . Nun ist ε ε |xn yn − xy| ≤ |xn ||yn − y| + |xn − x||y| ≤ K +K =ε 2K 2K für alle n mit n ≥ N und somit lim(xn yn ) = xy. Korollar 1.8.6. Wenn lim(xn ) = x und c eine Zahl ist, dann ist lim(cxn ) = cx. Beweis. Für yn := c folgt aus Satz 1.8.5: lim(cxn ) = lim(yn xn ) = lim(yn ) lim(xn ) = lim(c) lim(xn ) = cx. Satz 1.8.7 (Sandwich-Theorem). Wenn lim(xn ) = lim(zn ) = a, und xn ≤ yn ≤ zn für fast alle n, dann ist auch lim(yn ) = a. Beweis. Für jedes ε > 0 ist ab einer Stelle a − ε < xn ≤ yn ≤ zn < a + ε und daher −ε < yn − a < ε beziehungsweise |yn − a| < ε. Somit ist lim yn = a. Lemma 1.8.8. Wenn lim(xn ) = 0 und (yn ) beschränkt ist, dann ist lim(xn yn ) = 0. Beweis. Wenn a ≤ yn ≤ b für alle n, dann ist axn ≤ xn yn ≤ bxn für alle n. Aus Korollar 1.8.6 folgen lim axn = 0 und lim bxn = 0. Nach dem Sandwich-Teorem 1.8.7 ist nun auch lim xn yn = 0. Satz 1.8.9. Wenn (xn ) und (yn ) konvergent sind, yn 6= 0 für alle n und lim(yn ) 6= 0, dann ist lim xn xn = . lim yn lim yn Beweis. Es sei lim xn = x und lim yn = y. Wir betrachten erst die Folge ( y1n )n∈N : 1 1 1 − 1 = y − yn = |y − yn | . yn y yn y |yn | |y| | {z } |{z} |{z} →0 beschr. konst. Der erste Faktor der rechten Seite ist beschränkt, der zweite konstant und der dritte strebt gegen Null. Nach Korollar 1.8.6 ist |y − yn |/|y| eine Nullfolge und nach Lemma 1.8.8 auch der ganze letztere Term, also strebt 1/yn gegen 1/y. Aus 1.8.5.2 folgt lim(xn 1 1 1 ) = lim xn lim = x lim , yn yn yn was nach dem soeben Gezeigten gleich x/y ist. Beispiel 1.8.10 (Übungsbeispiel 16). Ist die Folge (xn ) konvergent? Wenn ja, wohin konvergiert sie? Sie dürfen Satz 1.8.5 und Korollar 1.8.6 verwenden. 1.8. CAUCHY-FOLGEN UND GRENZWERTSÄTZE (1) xn = (1 − 4n2 )2 (1 + 2n)(1 − 2n)(4n + 4)2 (2) xn = n3 (n + 1)2 19 Beispiel 1.8.11. Für Zahlen a0 , a1 , . . . , ak , b0 , b1 , . . . , bl , ak 6= 0, bl 6= 0, ist ( ak falls k = l, a0 + a1 n + a2 n2 + . . . + ak nk bl = lim 2 l n→∞ b0 + b1 n + b2 n + . . . bl n 0 falls k < l. wobei wir annehmen, dass ak , bl und der ganze Nenner stets ungleich 0 sind. Beweis. Wenn k = l, dann ist obiger Term gleich (1.8.11.1) a0 + a1 n + a2 n2 + . . . + ak nk = b0 + b1 n + b2 n2 + . . . bk nk a0 nk b0 nk + + a1 nk−1 b1 nk−1 + + a2 nk−2 b2 nk−2 + ... + + ... + ak−1 n bk−1 n + ak + bk . Nach Beispiel 1.7.10.2 ist lim n1 = 0. Aus Satz 1.8.5.2 folgt 1 11 1 1 lim 2 = lim = lim lim = 0. n nn n n Mittels Induktion sehen wir, dass 1 =0 ni ist für alle natürlichen i ≥ 1. Nach Korollar 1.8.6 ist lim n→∞ lim ai n→∞ 1 =0 ni und Satz 1.8.5.1 impliziert, dass der Zähler der rechten Seite der Gleichung 1.8.11.1 gegen ak strebt und der Nenner gegen bk . Aus Satz 1.8.9 folgt schließlich die Aussage. Beispiel 1.8.12 (Übungsbeispiel 17). Ist die Folge (xn ) konvergent? Wenn ja, wohin konvergiert sie? Verwenden Sie Lemma 1.8.8. (1) (2) (−1)n n2 (n + 3)3 (−1)n n xn = 1+n xn = Beispiel 1.8.13 (Übungsbeispiel 18). Zeigen Sie, dass die Folge n3 /2n n∈N eine Nullfolge ist. Hinweis: Es folgt n3 /2n ≤ 1/n aus n4 ≤ 2n . Zum Induktionsschritt: Für ausreichend große n, ist der Faktor, der n4 in (n + 1)4 umwandelt, kleiner als 2. 1.8.14 (Theoriefrage 10). Zeigen Sie, dass jede konvergente Folge eine Cauchy-Folge ist und dass jede Cauchy-Folge beschränkt ist. 1.8.15 (Theoriefrage 11). Zeigen Sie, dass der Grenzwert der Summe bzw. des Produktes zweier Folgen gleich der Summe bzw. dem Produkt der Grenzwerte ist. 1.8.16 (Theoriefrage 12). Zeigen Sie, dass der Grenzwert des Quotienten zweier Folgen gleich dem Quotienten der Grenzwerte ist. Was muss für die Folge im Nenner des Quotienten vorausgesetzt werden? 1.8.17 (Theoriefrage 13). Formulieren und beweisen Sie das Sandwich-Theorem. 20 1. ZAHLEN UND FOLGEN 1.9. Intervallschachtelungen Definition 1.9.1. Die Länge `(I) eines offenen Intervalls I = (a, b) oder abgeschlossenen Intervalls I = [a, b] ist definiert als |b−a|. Eine Folge von Mengen (Mn ) heißt abnehmende oder fallende Mengenfolge, wenn Mn ⊃ Mn+1 ist für alle n. Eine abnehmende Mengenfolge abgeschlossener Intervalle heißt Intervallschachtelung, wenn ihre Längen gegen Null gehen. Eine Folge liegt in einer Intervallschachtelung, wenn sie in jedem der Intervalle ab einer Stelle enthalten ist. Beispiel 1.9.2. Die Folge (1/n)n∈N liegt in ([0, 1/2n ])n∈N . Um die Aussage des Beispiels zu beweisen, ist fast nichts zu zeigen; wir müssen beachten, dass nicht zweimal der selbe Buchtabe “n” verwendet werden darf, wenn der Index der Intervallschachtelung mit dem Index der Folge verglichen wird, denn das Folgenglied 1/n liegt nicht im Intervall [0, 1/2n ]. Zum Beispiel liegt 1 nicht in [0, 1/2] und 1/2 nicht in [0, 1/4]. Beweis von Beispiel 1.9.2. Die Archimedische Eigenschaft für rationale Zahlen (Lemma 1.7.1) impliziert, dass es für alle ε = 1/2m ein N ∈ N gibt mit 1/N < ε. Für alle n ≥ N gilt also 1/n ∈ [0, 1/2m ], das heißt, die Folge liegt in jedem der Intervalle [0, 1/2m ] ab einer Stelle. Satz 1.9.3. Eine Folge ist genau dann Cauchy-Folge, wenn sie in einer Intervallschachtelung liegt. Beweis. Wir nehmen an, die Folge (xn )n∈N liegt in einer Intervallschachtelung (In )n∈N . Es sei ε > 0 beliebig und IN eines der Intervalle mit `(IN ) ≤ ε. Die Glieder xn liegen ab einer Stelle in IN . Daher ist |xm −xn | < ε für alle m, n ab einer Stelle und (xn ) eine Cauchy-Folge. Es sei umgekehrt (xn )n∈N eine Cauchy-Folge. Dann gibt es für jedes k ∈ N ein N (k), sodass |xm − xn | < k1 ist für alle m, n ≥ N (k). Daraus folgt insbesondere |xN (k) − xn | < k1 für alle n ≥ N (k). Das heißt, dass 1 1 Jk := xN (k) − , xN (k) + k k alle Folgenglieder ab xN (k) enthält. Es ist im Allgemeinen nicht Jk+1 ⊂ Jk , aber für Ik = J1 ∩ J2 ∩ . . . ∩ Jk gilt Ik ⊃ Ik+1 . Außerdem ist `(Ik ) ≤ 2/k und jedes Ik enthält fast alle Glieder der Folge, weil auch jedes der Jk fast alle Folgenglieder enthält. Also ist (Ik ) eine Intervallschachtelung, in der die Folge liegt. Satz 1.9.4. In einer Intervallschachtelung liegen entweder nur konvergente Folgen, oder nur Cauchy-Folgen, die nicht konvergent sind. Im ersten Fall enthält der Durchschnitt aller Intervalle der Intervallschachtelung genau einen Punkt und die Folgen, die in der Intervallschachtelung liegen, sind genau jene, die diesen Punkt als Grenzwert haben. Im zweiten Fall ist der Durchschnitt der Intervalle leer. Beweis. Dass im Durchschitt aller Intervalle einer Intervallschachtelung nicht zwei verschiedene Punkte liegen, folgt daraus, dass die Längen der Intervalle gemäß der Definition einer Intervallschachtelung eine Nullfolge bilden. Wenn der Durchschnitt aller Intervalle nur einen Punkt x enthält, dann sind in jeder Umgebung (x − ε, x + ε) alle Intervalle enthalten, deren Längen kleiner als ε sind, und das sind fast alle. Somit enthält eine beliebig kleine Umgebung (x − ε, x + ε) von x fast alle Glieder einer jeden Folge, die in der Intervallschachtelung liegt. Das heißt, alle Folgen, die in der Intervallschachtelung liegen, konvergieren gegen x. Nehmen wir nun an, der Durchschnitt der Intervalle sei leer. Wenn eine Folge, die in der Intervallschachtelung liegt, einen Grenzwert x hat, dann muss es ein Intervall IN geben, das x nicht enthält. Da x von IN einen positiven Abstand ε hat, ist (x − ε, x + ε) eine 1.10. REELLE ZAHLEN 21 Umgebung von x, die mit IN disjunkt ist. Es liegen fast alle Glieder der Folge in IN und nicht in (x − ε, x + ε), das ist ein Widerspruch zur Konvergenz. Also sind die Folgen in der Intervallschachtelung nicht konvergent. Um zu erkennen, dass es Cauchy-Folgen gibt, die nicht konvergieren, stellen wir zunächst ein paar Überlegungen zu Potenzen rationaler Zahlen an: Beispiel 1.9.5. Wenn x in Q \ Z ist, dann liegt auch xk in Q \ Z für alle k ∈ N. Beweis. Es sei x = ab aus Q+ \ N mit ggT(a, b) = 1 (siehe Lemma 1.5.2), wobei b ≥ 2, da x ∈ / N. In ihrer eindeutigen Primfaktorzerlegung [11, Satz 5.3.45] haben a und b keinen Faktor gemeinsam. Dasselbe gilt für die eindeutigen Primfaktorzerlegung von ak und bk . k Das bedeutet, dass abk nicht gekürzt werden kann und ( ab )k keine ganze Zahl ist. Korollar 1.9.6. Es gibt keine rationale Zahl, deren k-te Potenz in N \ {nk | n ∈ N} ist, für k ≥ 2. Das heißt, es gibt in Q keine k-te Wurzel einer natürlichen Zahl, es sei denn die Wurzel ist ganzzahlig. Beispiel 1.9.7. Es sei I0 = [a0 , b0 ] = [1, 2]. Wir definieren rekursiv ( n 2 ) ≥ 2, [an , an +bn ] falls ( an +b 2 In+1 = [an+1 , bn+1 ] := an +bn 2 an +bn 2 [ 2 , bn ] falls ( 2 ) < 2. Die ersten drei Intervalle der Folge sind I1 = [1, 1.5], I2 = [1.25, 1.5] und I3 = [1.375, 1.5]. Mit Induktion folgt, dass a2n < 2 < b2n für alle n. Es ist `(In ) = 21n eine Nullfolge und In+1 ⊂ In , das heißt, diese Intervalle bilden eine Intervallschachtelung. Angenommen, die Folgen (an )n∈N und (bn )n∈N sind konvergent, dann haben sie denselben Grenzwert, und nach Satz 1.8.5.2 ist lim a2n = (lim an )2 = (lim bn )2 = lim b2n . Wegen a2n < 2 < b2n ist nach dem Sandwich-Theorem 1.8.7 dieser Wert gleich lim 2 = 2. Eine rationale Zahl, deren Quadrat gleich 2 ist, gibt es aber nach Korollar 1.9.6 nicht. Also sind die Folgen (an )n≥0 und (bn )n≥0 Cauchy-Folgen, weil sie in einer Intervallschachtelung liegen (Satz 1.9.3), die jedoch nicht konvergent sind, weil sie keinen Grenzwert in Q haben. 1.9.8 (Theoriefrage 14). Zeigen Sie, dass jede Folge, die in einer Intervallschachtelung liegt, eine Cauchy-Folge ist. 1.9.9 (Theoriefrage 15). Zeigen Sie: Wenn eine konvergente (rationale) Folge in einer (rationalen) Intervallschachtelung liegt, dann besteht der Durchschnitt aller Intervalle aus genau einem Punkt, nämlich dem Grenzwert der Folge. 1.9.10 (Theoriefrage 16). Zeigen Sie, dass es ganze Zahlen gibt, die in Q keine Quadratwurzel haben und leiten Sie daraus ab, dass es in Q Cauchy-Folgen gibt, die nicht konvergieren. 1.10. Reelle Zahlen Definition 1.10.1. Wir schreiben (xn ) ∼ (yn ), wenn lim |xn − yn | = 0. Lemma 1.10.2. Die Relation aus Definition 1.10.1 ist eine Äquivalenzrelation auf der Menge der rationalen Folgen. Beweis. Es seien (xn ), (yn ), (zn ) beliebige rationale Folgen. Aus lim |xn − xn | = 0 folgt (xn ) ∼ (xn ) für alle Folgen (Relfexivität). Wenn lim |xn − yn | = 0, dann ist auch lim |yn − xn | = 0, also folgt y ∼ x aus x ∼ y (Symmetrie). 22 1. ZAHLEN UND FOLGEN Wegen der Dreiecksungleichung ist |zn − xn | = |(zn − yn ) + (yn − xn )| ≤ |zn − yn | + |yn − xn |. Daher ist (xn ) ∼ (zn ) falls (xn ) ∼ (yn ) und (yn ) ∼ (zn ). Mit C bezeichnen wir die Menge aller rationalen Cauchy-Folgen. Definition 1.10.3. Die Menge der reellen Zahlen ist definiert als Quotientenmenge R := C/ ∼ . Jede rationale Zahl q wird auch als reelle Zahl aufgefasst, nämlich als jene Äquivalenzklasse von rationalen Cauchy-Folgen, die die konstante Folge (q)n∈N enthält. Lemma 1.10.4. Die Intervalle von Intervallschachtelungen, in denen die Cauchy-Folgen unterschiedlicher reeller Zahlen liegen, haben ab einer Stelle einen positiven Abstand voneinander. Beweis. Abgeschlossene Intervalle, die keinen positiven Abstand voneinander haben, haben ein gemeinsames Element. Falls die Intervallschachtelungen keinen positiven Abstand haben, gibt es also eine Folge, die in beiden liegt, was der Annahme widerspricht, das in den Intervallschachtelungen die Cauchy-Folgen unterschiedlicher reeller Zahlen liegen. Wir haben bereits in Satz 1.8.5 gesehen, dass der Grenzwert von Summe oder Produkt konvergenter Folgen wieder gleich der Summe bzw. dem Produkt der Grenzwerte ist. Um zu zeigen, dass reelle Zahlen addiert und multipliziert werden können, müssen wir einen analogen Satz für Cauchy-Folgen zeigen: Satz 1.10.5. Wir nehmen an, es liegt (xn )n∈N in der Intervallschachtelung ([an , bn ])n∈N und (yn )n∈N in der Intervallschachtelung ([cn , dn ])n∈N . Dann ist ([an + cn , bn + dn ])n∈N eine Intervallschachtelung, in der (xn + yn )n∈N liegt. Wenn an > 0 und cn > 0, für alle n dann liegt (xn · yn )n∈N in der Intervallschachtelung ([an · cn , bn · dn ])n∈N . Beweis. Aus an ≤ an+1 < bn+1 ≤ bn und cn ≤ cn+1 < dn+1 ≤ dn folgt an + cn ≤ an+1 + cn+1 < bn+1 + dn+1 ≤ bn + dn , also ist [an+1 + cn+1 , bn+1 + dn+1 ] ⊂ [an + cn , bn + dn ]. Nach Satz 1.8.5 ist lim(bn − an ) + lim(dn − cn ) = lim((bn + dn ) − (an + cn )) = 0. Das heißt, die Längen der Intervalle [an + cn , bn + dn ] gehen gegen Null. Also ist gezeigt, dass ([an + cn , bn + dn ])n∈N eine Intervallschachtelung ist. Für jedes n sind ab einem Index N die Glieder xm in [an , bn ] und die Glieder ym in [cn , dn ] enthalten und somit an +cn ≤ xm +ym ≤ bn +dn für alle m ≥ N . Also liegt (xn +yn ) in ([an + cn , bn + dn ])n∈N . Für das Produkt ist bn dn − an cn = (bn − an )dn + (dn − cn )an . Weil (an )n∈N und (dn )n∈N beschränkt und (bn − an )n∈N und (dn − cn )n∈N Nullfolgen sind, ist nach Lemma 1.8.8 lim(bn − an )dn = lim(dn − cn )an = 0 und somit nach Satz 1.8.5 lim(bn dn − an cn ) = 0. Außerdem ist [an+1 cn+1 , bn+1 dn+1 ] ⊂ [an cn , bn dn ] 1.10. REELLE ZAHLEN 23 und wieder gibt es für jedes n ein N , sodass für alle m ≥ N gilt: xm ∈ [an , bn ] , ym ∈ [cn , dn ] und weil beide linken Intervallgrenzen positiv sind, folgt xm ym ∈ [an cn , bn dn ] für alle m ≥ N . Satz 1.10.5 gilt auch für Produkte beliebiger (nicht notwendigerweise positiver) Zahlen, es müssen nur die Vorzeichen angepasst werden. Sind z.B. beide Folgen ab einer Stelle negativ, dann sind die linken Intervallgrenzen an und cn auch alle negativ, und aus an < xn < 0 und bn < yn < 0 folgt −an bn < −xn yn < 0, daher sind −an bn die gesuchten linken Intervallgrenzen für das Produkt. Korollar 1.10.6. Summen von beliebigen und Produkte von positiven Cauchy-Folgen sind wieder Cauchy-Folgen. Definition 1.10.7. Für x, y ∈ R definieren wir (1.10.7.1) x + y := {(xn + yn )n∈N | (xn )n∈N ∈ x, (yn )n∈N ∈ y}, (1.10.7.2) x · y := {(xn · yn )n∈N | (xn )n∈N ∈ x, (yn )n∈N ∈ y}. Wenn x 6= 0, definieren wir 1 (1.10.7.3) := {(zn )n∈N | (zn xn )n∈N ∼ (1)n∈N für eine Folge (xn )n∈N ∈ x}. x Nach der Definition reeller Zahlen, ist die reelle Zahl 0 genau die Mengen aller rationalen Nullfolgen. In 1.10.7 bedeutet x 6= 0 also, dass die Äquivalenzklasse x nicht jene der Nullfolgen ist. Lemma 1.10.8. Die Verknüpfungen aus Definition 1.10.7 sind Abbildungen R × R → R. Beweis. Nach Korollar 1.10.6 bestehen die Mengen in 1.10.7.1 und 1.10.7.2 aus CauchyFolgen, die zueinander äquivalent sind. Noch zu zeigen ist, dass diese Mengen tatsächlich alle Folgen dieser Äquivalenzklassen enthalten. Wenn (zn ) aus dieser Äquivalenzklasse ist, wenn also (zn ) ∼ (xn + yn ) mit (xn ) ∈ x und (yn ) ∈ y, dann ist (zn − yn ) ∼ (xn + yn − yn ) = (xn ). Also ist (zn )n∈N = (zn − yn )n∈N + (yn )n∈N die Summe aus zwei Folgen, von denen die erste Element von x und die zweite Element von y ist. Somit ist (zn )n∈N in x + y, was zu zeigen war. Der Beweis für 1.10.7.2 läuft analog. Definition 1.10.9. Für x, y ∈ R schreiben wir x ≤ y, wenn es eine Folge (xn ) in x und eine Folge (yn ) in y gibt mit xn ≤ yn für alle n. Wir schreiben x < y, wenn x ≤ y und x 6= y. Ist 0 < x, dann heißt x positiv, wenn x < 0 ist, dann heißt x negativ. Lemma 1.10.10. Es ist (R, ≤) eine total geordnete Menge. Beweis. Wenn (xn ) ∈ x, (yn ) ∈ y und x 6= y, dann sind zwei rationale Intervallschachtelungen, die diese Folgen enthalten, ab einer Stelle disjunkt. Daraus ergibt sich entweder x < y oder y < x. Reflexivität, Antisymmerie und Transitivität übertragen sich von den entsprechenden Eigenschaften der Ordnung von Q. Reelle Zahlen können in eindeutiger Weise durch sogenannte Dezimalbrüche dargestellt werden. Das heißt, zu jeder reellen Zahl x ∈ [0, 1) gibt es eine Folge (an )n∈N in {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, sodass die Folge (sn )n∈N mit 1 1 1 1 sn = a1 + a2 2 + a3 3 + . . . + an n 10 10 10 10 gegen x konvergiert. Wir können dann 0.a1 a2 a3 . . . statt x schreiben. Wenn wir den Fall, dass (an ) ab einer Stelle nur aus Ziffern 9 besteht ausschließen, dann ist diese Dezimalbruchdarstellung eindeutig, was wir erkennen, wenn wir Intervallschachtelungen mit halboffenen 24 1. ZAHLEN UND FOLGEN Intervallen betrachten: Wir teilen [0, 1) in 10 gleich große Intervalle. Liegt x im ersten dieser Intervalle, ist a1 = 0, liegt es im zweiten ist a2 = 1 und so fort. Nun teilen wir jenes Intervall, in dem x liegt, wieder in zehn halboffene Intervalle und bestimmen so a2 . Auf diese Weise bestimmen wir die Folge (an ). Sollte jedoch x einmal am linken Randpunkt eines der Intervalle liegen, brechen wir diesen Algorithmus ab und stellen x als endlichen Dezimalbruch dar, also durch eine endlich Folge in {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}. Der Fall, dass ab einer Stelle alle an = 9 sind, kann nicht eintreten, denn dann wäre x gleich dem rechten Randpunkt von jenem halboffenen Intervall, ab dem alle an = 9 sind. Definition 1.10.11. Mengen, die nicht abzählbar sind, nennen wir überabzählbar. Satz 1.10.12. Die Menge der reellen Zahlen ist überabzählbar. Beweis. Angenommen R hätte eine Abzählung, dann hätte auch [0, 1) eine Abzählung y1 , y2 , y3 ,. . . mit y1 = 0. x1,1 x1,2 x1,3 x1,4 . . . y2 = 0. x2,1 x2,2 x2,3 x2,4 . . . y3 = 0. x3,1 x3,2 x3,3 x3,4 . . . y4 = 0. x4,1 x4,2 x4,3 x4,4 . . . .. .. .. .. .. . . . . . Wir wählen nun zn ∈ {0, 1} so, dass zn 6= xn,n ist. Dann ist z = 0.z1 z2 z3 . . . in (0, 1] und unterscheidet sich von jedem der yn in mindestens einer Ziffer. Wegen der Eindeutigkeit der Dezimalbruchentwicklung ist z verschieden von allen yn . Das ist ein Widerspruch dazu, dass eine Abzählung alle Elemente der Menge enthält. Also ist [0, 1) und somit auch R überabzählbar. 1.10.13 (Theoriefrage 17). Wie werden die reellen Zahlen mithilfe rationaler CauchyFolgen konstruiert? 1.10.14 (Theoriefrage 18). Zeigen Sie, dass die Summe zweier rationaler Cauchy-Folgen wieder eine Cauchy-Folge ist. 1.10.15 (Theoriefrage 19). Zeigen Sie, dass die Menge der reellen Zahlen überabzählbar ist. 1.11. Erweiterte reelle Zahlen Definition 1.11.1. Wenn eine Folge ab einer Stelle größer (bzw. kleiner) als jede beliebig gewählte reelle Zahl ist, nennen wir sie bestimmt divergent gegen +∞ (sprich: “plus Unendlich”), bzw. bestimmt divergent gegen −∞ (sprich: “minus Unendlich”). Formal: Wenn (xn ) eine Folge ist und es für jedes x ∈ R ein N ∈ N gibt, sodass xn > x bzw. xn < x ist für alle n > N , nennen wir (xn ) bestimmt divergent gegen +∞ bzw. bestimmt divergent gegen −∞ und schreiben lim an = +∞ bzw. lim an = −∞. Wenn lim xn = ∞ und lim yn ∈ R, dann ist lim(xn + yn ) = lim(xn − yn ) = ∞. Wenn y > 0, ist außerdem lim(xn yn ) = lim(xn /yn ) = ∞. Wenn auch lim yn = ∞ ist, dann gilt lim(xn + yn ) = lim(xn yn ) = ∞. Für das Konvergenzverhalten der Folgen (xn − yn )n∈N und (xn /yn )n∈N gibt es in diesem Fall jedoch keine allgemeinen Regeln. 1.12. VOLLSTÄNDIGKEIT DER REELLEN ZAHLEN 25 Beispiel 1.11.2 (Übungsbeispiel 19). Finden Sie jeweils ein Beispiel für Folgen (xn ) und (yn ) mit lim(xn yn ) = 0 und (1) lim xn = ∞ (2) lim xn ∈ R \ {0} (3) (xn ) divergent, aber nicht bestimmt diverent. 1.12. Vollständigkeit der reellen Zahlen Wir erinnern uns daran, dass rationale Zahlen einerseits jene Zahlen sind, die in der Konstruktion der reellen Zahlen verwendet werden, und dass andererseits eine rationale Zahl q auch selbst als reelle Zahl aufgefasst werden kann, nämlich als jene Äquivalenzklasse von rationalen Cauchy-Folgen, welche die konstante Folge (q)n∈N enthält, siehe dazu auch Kapitel 1.4. Definition 1.12.1. Wir nennen I = R \ Q die Menge der irrationalen Zahlen. Lemma 1.12.2. Wenn x rational und y irrational ist, dann ist x + y irrational. Wenn außerdem x 6= 0 ist, dann ist xy irrational. Beweis. Wenn die Summe z = x + y (bzw. das Produkt z = xy) rational wäre, dann wäre auch z − x (bzw. z/x) und somit y rational, also ist z = x + y (bzw. z = xy) irrational. Satz 1.12.3. Zwischen allen Paaren verschiedener reeller Zahlen liegen unendlich viele rationale und unendlich viele irrationale Zahlen. In der Topologie sagen wir, dass sowohl Q als auch I in R dicht liegen. Beweis von Satz 1.12.3. Von zwei gegebenen verschiedenen reellen Zahlen bezeichnen wir mit x die kleinere und mit y die größere. Es sei ([an , bn ])n∈N eine rationale Intervallschachtelung, in der eine Cauchy-Folge von x liegt, und ([cn , dn ])n∈N eine, in der eine Folge von y liegt. Nach Lemma 1.10.4 gibt es ein N , sodass x < bn < cn < y, ist für alle n ≥ N . Zwischen den rationalen Zahlen bn und cn lassen sich nun leicht unendlich viele rationale Zahlen konstruieren; diese liegen zwischen x und y. Für p, q ∈ Q mit p < q ist 1 p < p + √ (q − p) < q 2 √ wegen 0 < 1/ 2 < 1. Dass der mittlere Term der Ungleichungskette irrational ist, folgt aus Korollar 1.9.6 und Lemma 1.12.2. Also liegt zwischen je zwei verschiedenen rationalen Zahlen eine irrationale Zahl. Da zwischen x und y unendlich viele verschiedene rationale Zahlen liegen, müssen auch unendlich viele irrationale Zahlen zwischen x und y liegen. R − Mit R+ bezeichnen wir die Menge der positiven reellen Zahlen {x ∈ R | x > 0}, und mit die Menge der negativen reellen Zahlen {x ∈ R | x < 0}. Lemma 1.12.4 (Archimedische Eigenschaft der reelle Zahlen). Für alle ε ∈ R+ gibt es ein n ∈ N mit n1 < ε. Für alle x, y ∈ R+ gibt es ein n ∈ N, sodass y < nx ist. 1 n Beweis. Nach Satz 1.12.3 liegt eine rationale Zahl q = m/n zwischen 0 und ε. Also ist < ε für n ∈ N. Auch für ε = xy gibt es ein n ∈ N mit n1 < xy und somit y < nx. Bemerkung 1.12.5. Die reellen Zahlen bilden wie die rationalen Zahlen einen Körper, siehe zum Beispiel [11, Kapitel 5.4]. Unsere bisherigen Argumente in den Sätzen über rationale Zahlen basieren meist nur auf den Axiomen eines Körpers, also auf den Rechenregeln für die vier Grundrechnungsarten. Aus diesem Grund lassen sie sich unverändert auf die reellen Zahlen übertragen. Insbesondere gelten daher folgende Definitionen und Aussagen auch für reelle Zahlen: 1.7.2–1.7.9, 1.8.1–1.8.9 und 1.9.1–1.9.4. 26 1. ZAHLEN UND FOLGEN Eine Ausnahme bildet die Archimedische Eigenschaft der rationalen Zahlen (Lemma 1.7.1), weil in ihrem Beweis verwendet wird, dass rationale Brüche einen ganzzahligen Nenner und einen ganzzahligen Zähler haben, was auf reelle Zahlen im Allgemeinen nicht zutrifft. Daher haben wir für die Archimedische Eigenschaft der reellen Zahlen in Lemma 1.12.4 einen eigenen Beweis angegeben. Folgen reeller Zahlen nennen wir auch kurz reelle Folgen. Satz 1.12.6. Die reellen Zahlen sind vollständig, das heißt, jede reelle Cauchy-Folge konvergiert. Beweis. Jede reelle Cauchy-Folge liegt nach Bemerkung 1.12.5 und Satz 1.9.3 in einer Intervallschachtelung. Die Intervalle können so gewählt werden, dass die Endpunkte rational sind, aber auch aus Satz 1.12.3 folgt, dass in jedem Intervall eine rationale Folge liegt. Diese ist eine rationale Cauchy-Folge und die durch sie nach Definition 1.10.3 bestimmte reelle Zahl ist Grenzwert der reellen Cauchy-Folge, von der wir ausgegangen sind. Die Vollständigkeit ist die wesentlichste Eigenschaft, die die reellen von rationalen Zahlen unterscheidet. Wir erinnern uns daran, dass ein Supremum einer Menge eine kleinste obere Schranke ist. Diese kann Element der Menge sein, dann ist sie ein Maximum, sie muss aber nicht Element der Menge sein. Ein Infimum ist eine größte untere Schranke. In total geordneten Mengen (d.h. alle Paare von Elementen sind vergleichbar) kann es nicht passieren, dass eine Menge zwei Suprema oder zwei Infima hat. Für die im folgenden Satz verwendeten Begriffe siehe bei Bedarf Definitionen 4.2.28, 4.2.32., 6.3.1 und 6.4.1 aber auch Proposition 6.4.2 in [11]. Satz 1.12.7 (Supremums- und Infimumseigenschaft). Die reellen Zahlen sind ordnungsvollständig, das heißt, jede nicht leere nach oben beschränkte Menge hat ein eindeutiges Supremum und jede nach unten beschränkte Menge hat ein eindeutiges Infimum. Beweis. Eine nach oben beschränkte Menge A reeller Zahlen ist auch durch eine rationale Zahl b0 nach oben beschränkt. Es sei a0 eine rationale Zahl, die kleiner als irgendein Element von A ist. Im Folgenden betrachten wir Intervalle reeller Zahlen mit rationalen Endpunkten. Wir definieren I0 = [a0 , b0 ] und für n ≥ 1 sei ( n−1 [an−1 , an−1 +bn−1 ], falls [ an−1 +b , bn−1 ] ∩ A = ∅, 2 In = [an , bn ] = an−1 +bn−1 2 [ , b ] sonst. n−1 2 Vollständige Induktion impliziert, dass bn für alle n eine obere Schranke von A ist und dass [an , bn ] ein Element von A enthält. Da die Längen dieser Intervalle gegen Null gehen, ist die rationale Folge (bn )n∈N eine Cauchy-Folge. Um zu sehen, dass die reelle Zahl x, die diese Cauchy-Folge enthält, das gesuchte Supremum von A ist, müssen wir uns zwei Punkte überlegen: Erstens, dass x eine obere Schranke von A ist. Dies folgt aus der Definition der Zahlen bn die alle größer oder gleich jedem Element von A sind. Und zweitens, dass x die kleinste obere Schranke von A ist: Wir nehmen an, es gibt eine kleinere obere Schranke y. Die Längen der Intervalle der Intervallschachtelung sind ab einem Index N kleiner als x − y. Da x in [aN , bN ] ist, kann y nicht in [aN , bN ] liegen, wegen y < x ist y < aN . Nun ist aber y kleiner als ein Punkt in A, was der Annahme widerspricht, dass y eine obere Schranke von A ist. Beispiel 1.12.8 (Übungsbeispiel 20). Haben folgende Mengen ein Supremum bzw. ein Infimum in Q und/oder in R? Wenn ja, welches? \ 1 (2) {q ∈ Q | q 2 < 2} (1) − , 1 ∪ {k ∈ N | k ≥ n} n n∈N 1.13. HÄUFUNGSWERTE UND HÄUFUNGSPUNKTE 27 Beispiel 1.12.9 (Übungsbeispiel 21). Es sei A ⊂ R nicht leer, nach unten beschränkt und −A = {−x | x ∈ A}. Zeigen Sie: inf A = − sup(−A). 1.12.10 (Theoriefrage 20). Zeigen Sie, dass zwischen je zwei verschiedenen reellen Zahlen unendlich viele rationale und unendlich viele irrationale Zahlen liegen. 1.12.11 (Theoriefrage 21). Zeigen Sie, dass Q nicht vollständig und dass R vollständig ist. Gehen Sie von der Konstruktion der reellen Zahlen über Cauchy-Folgen aus. 1.12.12 (Theoriefrage 22). Zeigen Sie, dass R ordnungsvollständig ist. 1.13. Häufungswerte und Häufungspunkte Definition 1.13.1. Ein Punkt heißt Häufungswert einer Folge, wenn jede seiner Umgebungen unendlich viele Glieder der Folge enthält. Expliziter und formaler: Ein Punkt x ist Häufungswert der Folge (xn )n∈N , wenn es für jede Umgebung U von x eine unendliche Menge I ⊂ N gibt, sodass {xi | i ∈ I} ⊂ U ist. Beispiel 1.13.2. Die Folge ((−1)n )n∈N hat zwei Häufungswerte, nämlich −1 und 1. Die Folge (1/n + (−1)n )n∈N hat ebenfalls die Häufungswerte -1 und 1. Definition 1.13.3. Eine Teilfolge einer Folge (xn )n∈N ist eine Folge (xnk )k∈N , wobei (nk )k∈N eine streng monoton steigende Folge natürlicher Zahlen ist. Ein Teilfolge entsteht also durch das Weglassen von Gliedern der Folge. Zum Beispiel ist 2, 4, 6,. . . eine Teilfolge von 1, 2, 3, 4,. . . Lemma 1.13.4. Ein Punkt ist genau dann Häufungswert einer Folge, wenn er Grenzwert einer Teilfolge ist. Beweis. Dass ein Grenzwert einer Teilfolge ein Häufungswert ist, folgt aus der Definition der Konvergenz (Definition 1.7.6). Umgekehrt, wenn x ein Häufungswert ist, wählen wir für jede Umgebung (x − 1/k, x + 1/k), k ∈ N, ein nk ∈ N mit xnk ∈ (x − 1/k, x + 1/k) und nk > nk−1 . Dies ist möglich, da in (x−1/k, x+1/k) unendlich viele Folgenglieder liegen. Satz 1.13.5 (Satz von Bolzano-Weierstraß). Jede beschränkte reelle Folge hat einen Häufungswert. Beweis. Es sei (xn )n∈N durch a0 nach unten und durch b0 nach oben beschränkt. Wir definieren rekursiv am + bm [am+1 , bm+1 ] := am , , 2 m falls unendlich viele xn in [am , am +b ] liegen und anderenfalls 2 am + bm [am+1 , bm+1 ] := , bm . 2 Induktiv wird eine Teilfolge von (xn )n∈N definiert, die in ([am , bm ])m∈N liegt: Wir setzen xn0 = x0 und wählen ein weiters Glied der Folge aus [a1 , b1 ], das wir mit xn1 bezeichnen. Von den unendlich vielen Gliedern der Folge (xn )n∈N , die in [am , bm ] liegen, wählen wir eines, das verschieden von den Folgengliedern xn0 , xn1 ,. . . xnm−1 ist und bezeichnen es mit xnm und so fort. Die so definierte Folge (xnm )m∈N ist eine Cauchy-Folge und liegt in der Intervallschachtelung ([am , bm ])m∈N . Die dadurch definierte reelle Zahl ist Grenzwert von (xnm )m∈N und somit Häufungswert von (xn )n∈N . Lemma 1.13.6. Eine beschränkte reelle Folge, die genau einen Häufungswert hat, ist konvergent. 28 1. ZAHLEN UND FOLGEN Beweis. Wenn x der einzige Häufungswert einer beschränkten Folge ist, muss jede Umgebung von x fast alle Glieder der Folge enthalten, denn sonst würden die Folgenglieder außerhalb der Umgebung eine beschränkte Folge bilden, die nach dem Satz von BolzanoWeierstraß einen Häufungswert hat und dieser wäre dann von x verschieden. Beispiel 1.13.7. Lemma 1.13.6 gilt nur für beschränkte Folgen, denn die unbeschränkte Folge (n + (−1)n n)n∈N hat zwar genau einen Häufungswert, ist aber trotzdem nicht konvergent. Satz 1.13.8. Jede beschränkte monotone reelle Folge ist konvergent. Beweis. Nach dem Satz Bolzano-Weierstraß hat eine solche Folge zumindest einen Häufungswert. Wir nehmen indirekt an, es gäbe zwei Häufungswerte. Zwei disjunkte Umgebungen dieser Punkte enthalten jeweils unendlich viele Glieder der Folge, was jedoch nur möglich ist, wenn die Folge unendlich oft zwischen den Umgebungen hin und her wechselt. Das wiederum widerspricht ihrer Monotonie. Also hat die Folge genau einen Häufungswert und ist nach Lemma 1.13.6 konvergent. Es spricht nichts gegen verbal geführte Beweise wie jenen von Satz 1.13.8. Wichtig ist, dass man bei Bedarf in der Lage ist, eine Argumentation beliebig detailliert und explizit auszuführen. Wenn die zwei Häufungswerte im letzten Beweis zum Beispiel mit x und y bezeichnet werden, können die disjunkten Umgebungen als y−x y−x y−x y−x ,x + ,y + und y− oder als x− 2 2 2 2 y−x y−x y−x y−x ,x + und y− ,y + x− 3 3 3 3 angegeben werden. Außerdem könnten die Indices der Folgenglieder, die in der einen und der anderen Umgebung liegen bezeichnet werden. Wie genau und explizit Beweise geführt werden, ist bis zu einem gewissen Grad eine Frage des Geschmacks. Definition 1.13.9. Ein Punkt x heißt Häufungspunkt einer Menge M , wenn für jede Umgebung U von x die Menge U \ {x} unendliche viele Elemente von M enthält. Lemma 1.13.10. Jeder Häufungspunkt der Menge {xn | n ∈ N} ist Häufungswert der Folge (xn )n∈N . Beweis. Die folgende Konstruktion ist jener im Beweis des Satzes von Bolzano-Weierstraß (Satz 1.13.5) ähnlich. Wir setzen xn0 = x0 . Für m ≥ 1 wählen wir von den unendlich vielen Gliedern der Folge, die in (x − 1/m, x + 1/m) liegen, eines aus, das verschieden von den Folgengliedern xn0 , xn1 ,. . . ,xnm−1 ist und bezeichnen es mit xnm . Die so definierte Folge (xnm )m∈N konvergiert gegen x. Also ist der Häufungspunkt x auch Häufungswert der Folge. Beispiel 1.13.11. Die Umkehrung der Aussage von Lemma 1.13.10 gilt im Allgemeinen nicht, denn c ist zwar Häufungswert der konstanten Folge (c)n∈N , aber kein Häufungspunkt der Menge {c}. Definition 1.13.12. Mit lim sup xn bzw. lim inf xn bezeichnen wir das Supremum bzw. das Infimum der Häufungswerte einer Folge (xn )n∈N . Das folgende Lemma besagt, dass das Supremum und das Infimum aus Definition 1.13.12 in Wahrheit ein Maximum und ein Minimum sind. Lemma 1.13.13. Existiert der Limes superior (bzw. der Limes inferior) einer reellen Folge, dann hat sie eine Teilfolge, die gegen ihn konvergiert. 1.14. WURZELN 29 Beweis. Es sei z = lim sup xn . Für jedes k ∈ N muss es einen Häufungswert zk der Folge in [z − 1/k, z] geben, da z ja die kleinste obere Schranke der Häufungswerte ist. Eines der Folgenglieder in [zk − 1/k, zk + 1/k] bezeichnen wir mit xnk . Also ist xnk ∈ (z − 2/k, z + 1/k) und daher lim xnk = z k→∞ und z ein Häufungswert von (xn )n∈N . Beispiel 1.13.14 (Übungsbeispiel 22). Bestimmen Sie die Menge der Häufungswerte der Folge 1 1 1 1 1 1 x1 = 1, x2 = , x3 = 1, x4 = , x5 = , x6 = 1, x7 = , x8 = , x9 = , x10 = 1, . . . 2 2 3 2 3 4 Finden Sie eine Teilfolge, die gegen den Limes superior konvergiert und eine, die gegen den Limes inferior konvergiert. 1.13.15 (Theoriefrage 23). Definieren Sie Teilfolgen und Häufungswerte einer Folge. Zeigen Sie, dass jeder Häufungswert Grenzwert einer Teilfolge ist. 1.13.16 (Theoriefrage 24). Formulieren und beweisen Sie den Satz von Bolzano-Weierstraß. 1.13.17 (Theoriefrage 25). Zeigen Sie mithilfe des Satzes von Bolzano-Weierstraß, dass eine beschränkte Folge mit genau einem Häufungswert konvergent ist. Ist die Voraussetzung der Beschränktheit hier notwendig? Leiten Sie daraus ab, dass jede beschränkte monotone reelle Folge konvergent ist. 1.13.18 (Theoriefrage 26). Definieren Sie Häufungspunkte einer Menge und Häufungswerte einer Folge. Ist jeder Häufungswert einer Folge (xn )n∈N auch Häufungspunkt von {xn | n ∈ N}? Gilt die Umkehrung der letzten Aussage? 1.13.19 (Theoriefrage 27). Wie sind Limes superior und Limes inferior einer Folge definiert? Zeigen Sie, dass Limes superior und Limes inferior einer Folge Häufungswerte der Folge sind. 1.14. Wurzeln k Definition 1.14.1. √Wenn x = c für k ∈ N, dann nennen wir x eine k-te Wurzel von c und bezeichnen sie mit k c oder c1/k . Um zu zeigen, dass es in R im Gegensatz zu Q (siehe Korollar 1.9.6) möglich ist, Wurzeln zu ziehen, verwenden wir das Verfahren der Intervallhalbierung, das wir schon aus 1.9.7, 1.12.7 und 1.13.5 kennen. Lemma 1.14.2. Für jedes k ∈ N haben alle positiven reellen Zahlen eine eindeutig bestimmte k-te Wurzel in R+ . Beweis. Wegen der Supremumseigenschaft (Satz 1.12.7) hat für jedes c ∈ R+ die Menge {a ∈ R | ak ≤ c} ein eindeutiges Supremum x. Für alle n ∈ N ist (x − 1/n)k ≤ c, denn wenn (x − 1/n)k > c wäre, dann wäre x − 1/n eine kleinere Schranke der Menge als x und somit x nicht das Supremum. Außerdem ist (x + 1/n)k > c, denn falls (x + 1/n)k ≤ c, wäre x keine obere Schranke der Menge. Also ist (x − 1/n)k ≤ c < (x + 1/n)k und daher k k 1 1 lim x − ≤ c < lim x + . n n Wegen dem Grenzwertsatz für Produkte (1.8.5.2) ist das gleichbedeutend mit k k 1 1 lim x − ≤ c < lim x + n n und somit xk ≤ c ≤ xk beziehungsweise xk = c. 30 1. ZAHLEN UND FOLGEN Also ist x die k-te Wurzel von c in R+ . Für m, n ∈ N und x ∈ R+ ist (xm )n = (xn )m = xmn . Aus √ √ xm = (( n x)n )m = (( n x)m )n folgt √ n √ xm = ( n x)m , was folgende Definition gerechtfertigt: m Definition 1.14.3. Für m, n ∈ N und x ∈ R+ ist x n := √ n √ xm = ( n x)m . Lemma 1.14.4. Wenn x ∈ R und p, q ∈ Q, dann ist xp < xq ⇐⇒ p < q, p q x > x ⇐⇒ p < q, falls x > 1, falls 0 < x < 1. Beweis. Wir schreiben p = mp√ /n und q = mq /n √ als ganzzahlige√Brüche mit gemeinsamem Nenner. Wenn x > 1 folgt n x > 1, denn n x ≤ 1 würde ( n x)n = x ≤ 1n = 1 implizieren. Somit ist mp < mq äquivalent zu √ √ xp = ( n x)mp < ( n x)mq = xq . √ Wenn 0 < x < 1 ist n x < 1 und mp < mq ist äquivalent zu √ √ xp = ( n x)mp > ( n x)mq = xq . Beispiel 1.14.5. Es ist lim √ n n = 1. √ Beweis. Wir definieren xn = n n−1. Diese xn sind alle positiv. Nach dem Binomischen Lehrsatz ist n X n k n(n − 1) 2 xn = 1 + nxn + n = (1 + xn )n = xn + . . . k 2 k=0 Daraus folgen n> n(n − 1) 2 xn 2 und r 2 > xn . n−1 Also bilden die xn eine Nullfolge. √ √ Beispiel 1.14.6 (Übungsbeispiel 23). Konvergiert die Folge (n( n + 1 − n))n∈N ? Wenn ja, wohin? Hinweis: Erweitern Sie in geeigneter Weise zu einem Bruch. Beispiel 1.14.7 (Übungsbeispiel 24). Zu einer beliebigen positiven reellen Zahl c sei die Folge (xn )n∈N rekursiv definiert, indem für x0 ein beliebiger positiver Wert gewählt wird, dessen Quadrat größer als c ist und für n ≥ 1 ist c 1 xn−1 + . xn := 2 xn−1 Zeigen Sie, dass diese Folge in R gegen eine Zahl konvergiert, deren Quadrat c ist. Hinweis: Zeigen Sie, dass alle xn positiv sind, dass x2n > c ist und danach, dass die Folge monoton fällt. Da die Folge dann konvergiert, können Sie Grenzwertsätze anwenden. Beispiel 1.14.8 (Übungsbeispiel 25). Fortsetzung zu den Fionacci-Zahlen: Es sei xn der Quotient der Fibonacci-Zahlen Fn+1 /Fn . Zeigen Sie, dass die Folge (xn ) konvergiert und bestimmen Sie den Grenzwert. Welche Sätze aus der Vorlesung verwenden Sie dabei? 1.15. KOMPLEXE ZAHLEN 31 1.14.9 (Theoriefrage 28). Zeigen Sie, dass jede natürliche Zahl für jedes natürliche k eine k-te Wurzel in R+ hat. √ √ 1.14.10 (Theoriefrage 29). Warum ist n xm = ( n x)m für alle m, n ∈ N und x ∈ R+ ? Zeigen Sie für p, q ∈ Q: xp < xq ⇐⇒ p < q, falls x > 1, p x > xq ⇐⇒ p < q, falls 0 < x < 1. √ 1.14.11 (Theoriefrage 30). Zeigen Sie, dass lim n n = 1 ist. 1.15. Komplexe Zahlen Definition 1.15.1. Die komplexen Zahlen C sind definiert als die Menge aller Paare reeller Zahlen zusammen mit den Verknüpfungen (a, b) + (c, d) = (a + c, b + d), (a, b) · (c, d) = (ac − bd, ad + bc). Mit diesen Verknüpfungen ist C ein Körper mit Nullelement (0, 0) und Einselement (1, 0). Definition 1.15.2. Der Realteil einer komplexen Zahl z = (a, b) ist Re(z) = a, der Imaginärteil Im(z) = b und die Konjugierte z̄ = (a, −b). Die Imaginäre Einheit ist i = (0, 1). Die reellen Zahlen werden als Teilmenge von C aufgefasst, wobei eine relle Zahl x der komplexen Zahl (x, 0) entspricht. Den Umgang mit den vier Grundrechnungsarten in C setzen wir als bekannt voraus. Man √ beachte dass (0, 1) · (0, 1) = (−1, 0) ist. Anders geschrieben, heißt das i2 = −1 bzw. i = −1. Die Wurzel aus −1 ist also kein Mysterium, über das es sich zu philosophieren lohnt, sondern ein Element eines Zahlenbereichs, den wir auf einfache Weise aus den reellen Zahlen erhalten. Die komplexen Zahlen können als Ebene interpretiert werden. Der Betrag√ einer komplexen Zahl ist definiert wie die Länge des entsprechenden Vektors als |(a, b)| = a2 + b2 . Das ergibt den Abstand zweier komplexer Zahlen als p |(a, b) − (c, d)| = (a − c)2 + (b − d)2 . Konvergenz komplexer Folgen wird ähnlich behandelt wie für reelle Folgen, wobei statt reeller Intervalle Kreisscheiben betrachtet werden, die über diesen Abstandsbegriff definiert sind. Definition 1.15.3. Ein komplexe Folge (zn )n∈N heißt Cauchy-Folge, wenn es für alle reellen ε > 0 ein N gibt, sodass |zm − zn | < ε für alle m, n ≥ N . Eine Menge U heißt Umgebung von z, wenn es ε > 0 gibt, sodass {y ∈ C : |z − y| < ε} ⊂ U ist. Die Folge konvergiert gegen z ∈ C, wenn sie in jeder Umgebung von z ab einer Stelle enthalten ist. Äquivalent: Wenn es für jedes ε > 0 ein N gibt sodass |z − zn | < ε für alle n ≥ N. Lemma 1.15.4. Es seien zn = (an , bn ) und z = (a, b) komplexe Zahlen, dann gilt: lim zn = z ⇐⇒ lim an = a und lim bn = b. Beweis. Es ist lim zn = z ⇐⇒ lim |zn − z| = 0 ⇐⇒ lim(an − a)2 = 0 und lim(bn − b)2 = 0 lim p (an − a)2 + (bn − b)2 = 0 ⇐⇒ ⇐⇒ lim an = a und lim bn = b. Satz 1.15.5. Die komplexen Zahlen sind vollständig. 32 1. ZAHLEN UND FOLGEN Beweis. Es sei (zn ) mit zn = (an , bn ) eine komplexe Cauchy-Folge. Das heißt, für alle ε > 0 gibt es ein N , sodass |zm − zn | < ε für alle m, n ≥ N . Dann ist |zm − zn |2 = (am − an )2 + (bm − bn )2 < ε2 und folglich |am − an | < ε und |bm − bn | < ε. Das heißt, (an ) und (bn ) sind reelle CauchyFolgen, die wegen der Vollständigkeit von R (siehe Satz 1.12.6) konvergieren. Nach Lemma 1.15.4 konvergiert auch (zn ), was bedeutet, dass C vollständig ist. Aus der Konstruktion der Zahlenbereiche N, Z, Q, R und C sehen wir, dass die mit Abstand aufwändigste Konstruktion jene der reellen Zahlen ist. Die wichtigsten algebraischen Eigenschaften, die diese Zahlenbereiche voneinander unterscheiden sind folgende: N: In N kann addiert und multipliziert werden werden. Z: In Z gibt es im Gegensatz zu N eine Umkehrung der Addition. Q: In Q gibt es im Gegensatz zu Z eine Umkehrung der Multiplikation. R: In R ist im Gegensatz zu Q jede Cauchy-Folge konvergent. C: In C hat im Gegensatz zu R jedes Polynom eine Nullstelle. Diese Eigenschaft von C nennt man algebraische Abgeschlossenheit. Was die rellen Zahlen gegenüber C auszeichnet, ist, dass sie einen geordneten Körper bilden. Die Erweiterungen der Zahlenbereiche ergeben sich auf natürliche Weise durch die algebraischen Eigenschaften, die im jeweiligen mathematischen Arbeitsbereich benötigt werden. Zum Beispiel für einfache Schluss- oder Prozentrechnungen im Alltag benötigen wir weder Limiten noch stetige Funktionen, hier reichen rationale Zahlen vollkommen aus. Beispiel 1.15.6 (Übungsbeispiel 26). Sind die Folgen (xn )n∈N konvergent? Bestimmen Sie die Menge der Häufungswerte. n n 2 2i n 3 3i + (2) xn = + (3) xn = (1 + in ) (1) xn = 4 4 3 3 2n + 1 Hinweis: Beispiel 1.7.10.3 gilt nicht nur für rationale und reelle Folgen, sondern auch für komplexe Folgen. Warum ist das so? Verwenden Sie auch Lemma 1.15.4. 1.15.7 (Theoriefrage 31). Wie ist die Menge der komplexen Zahlen definiert? Leiten Sie aus der Vollständigkeit von R ab, dass C vollständig ist. 1.16. Konvergenzkriterien für Reihen P∞ Definition 1.16.1.PEine Reihe k=0 ak ist definiert als Folge der Partialsummen n (sn )n∈N0 , wobei sn = a und a k ∈ R. Die Zahlen ak nennen wir Summanden der k=0 k Reihe. P P∞ P∞ P∞ Wir schreiben statt k=0 , n=0 , i=0 usw., wenn klar ist, was der Summationsindex ist und der Index von 0 weg läuft. Beispiel 1.16.2. Für alle q 6= 1 lässt sich mit Induktion zeigen, dass 1 + q + q2 + . . . + qn = 1 − q n+1 1−q q k ist nach Definition 1.16.1 die Folge 1 − q n+1 = . 1−q n∈N0 k=0 n∈N0 P P Wenn die Reihe ak konvergiert, bezeichnen wir mit aP k auch gleichzeitig ihren Grenzwert, sofern das nicht zu Missverständnissen führt. Wenn ak bestimmt gegen ∞ P divergiert, schreiben wir ak = ∞. Nach Beispiel 1.7.10.3 konvergiert die Folge (q n+1 ) genau dann, wenn |q| < 1 ist. Also 1 konvergiert die geometrische Reihe auch genau dann, wenn |q| < 1 ist, und zwar gegen 1−q . ist. Die sogenannte geometrische Reihe ! n X k q P 1.16. KONVERGENZKRITERIEN FÜR REIHEN Satz 1.16.3 (Cauchy-Kriterium für Reihen). Eine komplexe Reihe genau dann, wenn es für alle ε > 0 ein N ∈ N gibt, sodass n X ak < ε 33 P ak konvergiert k=m für alle m, n ≥ N . Beweis. Wegen der Vollständigkeit der reellen Zahlen (Satz 1.12.6) konvergiert die Folge der Partialsummen genau dann, wenn sie eine Cauchy-Folge ist, also wenn es für alle ε > 0 ein N gibt, sodass für alle m − 1, n ≥ N n X |sn − sm−1 | = ak < ε k=m ist, wobei wir n ≥ m annehmen. Korollar 1.16.4. Wenn eine Nullfolge. P∞ k=0 ak konvergiert, ist die Folge ihrer Summanden (ak )k∈N0 Pm Beweis. Satz 1.16.3 gilt insbesondere für m = n. Für jedes ε > 0 ist daher | k=m ak | = |am | ≤ ε ab einer Stelle. Lemma 1.16.5. Eine Reihe mit positiven Summanden ist genau dann konvergent, wenn sie beschränkt ist. Beweis. Wenn die Summanden positiv sind, bilden die Partialsummen eine streng steigende Folge. Wenn diese beschränkt ist, ist sie nach Satz 1.13.8 konvergent. P Satz 1.16.6 (Minoranten- und Majorantenkriterium). Es sei bk eine reelle Reihe. P P∞ (1) Für eine komplexe Reihe ak gilt: Wenn P∞ ab einer Stelle |ak | ≤ bk ist und k=0 bk konvergiert, P dann konvergiert auch k=0 ak . P∞ (2) Wenn ak eine reelle Reihe ist, ab einer Stelle 0 ≤ bk ≤ ak ist und k=0 bk P∞ divergiert, dann divergiert auch k=0 ak . Beweis. Ob die Abschätzungen in (1) und (2) für fast alle oder für alle Summanden der Reihe erfüllt sind, macht für ihr Konvergenzverhalten keinen Unterschied. Daher nehmen wir der Einfachheit halber an, dassP sie für alle Summanden erfüllt sind. n In (1) sind die Partialsummen k=0 |ak | wegen 0≤ n X |ak | ≤ k=0 ∞ X bk k=0 P∞ beschränkt. Daher konvergiert k=0 P|ank | nach Lemma 1.16.5. P∞ In (2) sind die Partialsummen k=0 ak nicht beschränkt und k=0 ak ist daher nach Lemma 1.16.5 divergent. P∞ Definition 1.16.7. Die Reihe k=0 bkP aus Satz 1.16.6 heißt in (1) konvergente Majo∞ rante und in (2) divergente Minorante von k=0 ak . Beispiel 1.16.8. Die Reihe ∞ X 1 ns n=1 divergiert für s ≤ 1 und konvergiert für 1 < s. 34 1. ZAHLEN UND FOLGEN Beweis. Für s = 1 ist 2k X 1 1 1 1 1 1 1 1 1 1 + +... + =1+ + + + + + + ... + k n 2 3 4 5 6 7 8 2k−1 + 1 2 n=1 | | {z } | {z } {z } > 12 > 21 > 12 1 ≥1+k . 2 Letzterer Term divergiert gegen ∞, wenn k gegen ∞ geht. Also divergieren P∞ auch die Partialsummen gegen ∞. Für s < 1 ist 1/ns > 1/n nach Lemma 1.14.4, und n=0 1/ns divergiert nach Satz 1.16.6.2. Für s > 1, ist 2k+1 X−1 1 1 1 1 1 1 1 =1+ + s + + ... + s +... + + . . . + k+1 ns 2s 3 4s 7 2ks (2 − 1)s n=1 | {z } | {z } | {z } ≤2 21s ≤1+ 1 ≤22 22s 1 2s−1 + 1 2 2s−1 ≤2k + ... + 1 2s−1 k = 1 2ks 1 1 − ( 2s−1 )k+1 1 < 1 1 , 1 − 2s−1 1 − 2s−1 somit beschränkt und die Reihe nach Lemma 1.16.5 konvergent, wobei wir hier die Summenformel für die geometrische Reihe verwendet haben, siehe Beispiel 1.16.2. P∞ Die Reihe n=1 1/n wird harmonische Reihe genannt. P∞ P∞ Definition 1.16.9. Eine Reihe k=0 ak heißt absolut konvergent, wenn k=0 |ak | konvergiert. Lemma 1.16.10. Absolut konvergente Reihen konvergieren. P∞ Beweis. Nach Satz 1.16.3 bedeutet absolute Konvergenz Pn von k=0 ak , dass es für alle ε > 0 ein N gibt, sodass für alle n ≥ N der Betrag | k=m |ak || < ε ist. Daraus folgt Pm, n durch die Dreiecksungleichung | k=m ak | < ε, womit die Reihe konvergiert. Satz 1.16.11 (Leibnitz-Kriterium). Wenn (ak )k∈N0 monoton fallend gegen 0 konvergiert, dann konvergiert X (−1)k ak = a0 − a1 + a2 − a3 + . . . k∈N gegen eine Zahl s und |s − sn | ≤ an+1 , genauer: s2n − s ≤ a2n+1 und s − s2n+1 ≤ a2n+2 , wobei sn die n-te Partialsumme der Reihe bezeichnet. Pn Beweis. Für die n-ten Partialsummen sn = k=0 (−1)k ak gilt s0 ≥ s2 ≥ s4 ≥ . . . und s1 ≤ s3 ≤ s5 ≤ . . . weil s2n+2 − s2n = a2n+2 − a2n+1 ≤ 0 und s2n+3 − s2n+1 = −a2n+3 + a2n+2 ≥ 0. Außerdem ist s2n ≥ s2n+1 und lim(s2n − s2n+1 ) = lim −a2n+1 = 0 bzw. s2n+2 ≥ s2n+1 und lim(s2n+2 − s2n+1 ) = lim a2n+2 = 0. Also ist [s1 , s0 ] ⊃ [s1 , s2 ] ⊃ [s3 , s2 ] ⊃ [s3 , s4 ] ⊃ . . . eine Intervallschachtelung, in der (sn )n∈N liegt. Die Reihe konvergiert daher gegen eine Zahl s und es ist |s − sn | ≤ |sn+1 − sn | = an+1 . Anschaulich gesagt, springen die Partialsummen links-rechts-links usw. um den Grenzwert s und nähern sich diesem dabei. 1.16. KONVERGENZKRITERIEN FÜR REIHEN 35 P Beispiel 1.16.12. Die Reihe (−1)n n1 konvergiert nach dem dem Leibnitz-Kiriterium (Satz 1.16.11). Sie ist jedoch nicht absolut konvergent, weil die harmonische Reihe divergiert. p Satz 1.16.13 (Wurzel-Kriterium). Ist n |an | ≤p c für ein festes positives c < 1 ab einem P n |an | ≥ 1 für unendlich viele n, dann Index, dann ist a absolut konvergent. Wenn n P divergiert an . P n Beweis. Wenn ab einer Stelle |an | ≤ cn ist, dann ist c eine konvergente Majorante P P von |an |. Wenn |an | ≥ 1 für unendlich viele n, dann ist (an )n∈N keine Nullfolge und an divergiert. Satz 1.16.14 (Quotienten-Kriterium). Ist |an+1 /an | ≤ c für ein festes c < 1 ab einem P Index n, dann ist a absolut konvergent. Wenn |an+1 /an | ≥ 1 ab einer Stelle, dann n P divergiert an . Beweis. Wenn |an+1 /an | ≤ c ab einem Index N , dann ist |aN +1 | ≤ c|aN | und |aN +2 P| ≤ c|aN +1 | ≤ c2 |aN |. Mittels Induktion folgt |aN +k | ≤ ck |aN | für alle k ∈ N. Also ist |aN | cn eine konvergente Majorante. Wenn |an+1 /an | ≥ 1 ab einer Stelle, dann ist die Folge der Beträge |an | steigend und daher keine Nullfolge. Definition 1.16.15. Wenn k 7→ nk eine Bijektion N0 → N0 ist, nennen wir ∞ X ank k=0 eine Umordnung der Reihe P∞ k=0 ak bzw. P∞ n=0 an . P Beispiel 1.16.16. Die alternierende harmonische Reihe (−1)n+1 /n konvergiert nach dem Leibnitz-Kriterium (Satz 1.16.11). Es ist 1 1 1 1 1 1 5 1 1 + − + +··· < 1 − + = . 1− + + − + 2 3 4 5 6 7 2 3 6 | {z } | {z } <0 <0 Für die folgende Umordnung ist 1 1 1 1 1 1 1 1 1 1 5 1+ − + + − + + − + ··· > 1 − + = , 3 2 5 7 4 9 11 6 2 3 6 weil für alle k 1 1 1 + − >0 4k − 3 4k − 1 2k ist. Das heißt, der Grenzwert einer Reihe kann sich durch Umordnung ändern. Satz 1.16.17 (Umordnungssatz). Wenn eine Reihe absolut konvergiert, dann konvergiert auch jede ihrer Umordnungen und zwar gegen denselben Grenzwert. P∞ P Beweis. Es sei k=0 ank eine Umordnung von an . Für jedes N gibt es ein k, sodass {n0 , n1 , n2 , . . . , nk } die Zahlen 0, 1, 2, . . . , N enthält. Pm Wenn m > k, dann treten die Pm Summanden a0 , . . . , aN sowohl in n=0 an als auch in i=0 ani auf. Also ist m nm m N X X X X an − ani ≤ |an | − |an |. n=0 n=0 n=0 i=0 P Da an absolut konvergiert, ist die rechte Seite der letzteren Ungleichung ab einem hinreichend großen N (und dementsprechend gewählten k und m) kleiner als jedes positive ε. Somit wird auch die linke Seite kleiner als jedes ε. Das bedeutet, dass auch die umgeordnete Reihe konvergiert, und zwar gegen den Grenzwert der ursprünglichen Reihe. 36 1. ZAHLEN UND FOLGEN Beispiel 1.16.18 (Übungsbeispiel 27). Sind folgende Reihen konvergent, sind sie absolut konvergent? (1) X (−1)n √ n n (2) ∞ X (n!)2 (2n)! n=0 Beispiel 1.16.19 (Übungsbeispiel 28). Sind folgende Reihen konvergent, sind sie absolut konvergent? X (−1)n n − 7 X 1 (2) (1) 2n + 1 2n2 − 1 Beispiel 1.16.20 (Übungsbeispiel 29). Berechne ∞ X n=1 n2 2 . + 3n Hinweis: Partialbruchzerlegung. Beispiel 1.16.21 (Übungsbeispiel 30). Drücken Sie den Wert der Reihe ∞ X 1 (2n − 1)2 n=1 durch ∞ X 1 2 n n=1 aus. Beispiel 1.16.22 (Übungsbeispiel 31). Finden Sie eine Umordnung der Reihe ∞ X (−1)n+1 , n n=3 deren Partialsummen alle negativ sind. 1.16.23 (Theoriefrage 32). Formulieren und beweisen Sie das Cauchy-Kriterium für reelle Reihen und leiten Sie daraus ab, dass die Summanden einer konvergenten Reihe eine Nullfolge bilden. 1.16.24 (Theoriefrage 33). Warum sind beschränkte reelle Reihen mit positiven Summanden konvergent? Formulieren und beweisen Sie das Majoranten- und das Minorantenkriterium für Reihen. P 1 1.16.25 (Theoriefrage 34). Zeigen Sie, für welche positiven s die Reihe ns konvergent bzw. divergent ist. 1.16.26 (Theoriefrage 35). Formulieren und beweisen Sie das Leibnitz-Kriterium für Reihen. Geben Sie (ohne weiteren Beweis) ein Beispiel einer Reihe an, die nach dem LeibnitzKriterum konvergent ist, die aber nicht absolut konvergiert. 1.16.27 (Theoriefrage 36). Formulieren und beweisen Sie das Wurzel-Kriterium für Reihen. Geben Sie (ohne weiteren Beweis) ein Beispiel einer Reihe an, die nach dem WurzelKriterum konvergiert. 1.16.28 (Theoriefrage 37). Formulieren und beweisen Sie das Quotienten-Kriterium für Reihen. Geben Sie (ohne weiteren Beweis) ein Beispiel einer Reihe an, die nach dem Quotienten-Kriterum konvergiert. 1.16.29 (Theoriefrage 38). Formulieren und beweisen Sie den Umordnungssatz für absolut konvergente Reihen. Zeigen Sie durch ein Gegenbeispiel, dass dieser Satz im Allgemeinen nicht für alle konvergenten Reihen gilt. 1.17. DAS CAUCHY-PRODUKT VON REIHEN 37 1.17. Das Cauchy-Produkt von Reihen P P Definition 1.17.1. Das Produkt (oder Cauchy-Produkt) der Reihen an und bn ist definiert als ∞ X n X X X an bn = ak bn−k = (a0 b0 ) + (a0 b1 + a1 b0 ) + (a0 b2 + a1 b1 + a2 b0 ) + . . . n=0 k=0 P Eine Potenzreihe ist eine Reihe der Form an z n . Die Zahlen an sind ihre Koeffizienten. P P Die Notation an bn hat zwei Bedeutungen, denn abgesehen vom Cauchy-Produkt kann damit auch der Zahlenwert des Produktes der Limiten gemeint sein, sofern diese existieren. Es sollte daher stets aus dem Zusammenhang klar sein, was mit dieser Schreibweise gemeint ist. Pn Für Potenzreihen sind die Koeffizienten k=0 ak bn−k des Cauchy-Produkts gerade die Koeffizienten der Potenz z n : X an z n X bn z n = ∞ X n X ak z k bn−k z n−k = n=0 k=0 ∞ n X X n=0 ! zn. ak bn−k k=0 Das folgende Beispiel zeigt, dass das Produkt konvergenter Reihen nicht immer konvergent ist. Beispiel 1.17.2. Die Reihe ∞ X 1 1 1 (−1)n √ = −1 + √ − √ + √ · · · n 2 3 4 n=1 konvergiert nach Satz 1.16.11. Das Produkt der Reihe mit sich selbst ist jedoch divergent: ∞ ∞ X (−1)n X (−1)n √ √ = n n=1 n n=1 =√ 1 − 1·1 ∞ X n=2 √ n−1 X k=1 1 1 +√ 1·2 2·1 (−1)k (−1)n−k √ √ n−k k √ + ! = 1 1 1 +√ +√ 1·3 2·2 3·1 ∞ X (−1)n n=2 n−1 X 1 p k=1 k(n − k) − ··· = Wir ergänzen k(n − k) = nk − k 2 zu einem Quadrat n2 n − nk + k 2 = ( − k)2 ≥ 0 4 2 und erhalten k(n − k) ≤ n2 4 1 4 ≥ 2 k(n − k) n bzw. und 1 p k(n − k) ≥ 2 . n Also ist n−1 X 1 p k=1 k(n − k) ≥ n−1 X k=1 2 2(n − 1) = . n n Letzterer Ausdruck konvergiert gegen 2, daher bilden die Summanden (−1)n Pn−1 k=1 √ 1 k(n−k) der Produktreihe keine Nullfolge. Folglich divergiert die Produktreihe. Lemma 1.17.3. Das Produkt einer absolut konvergenten Reihe mit einer Reihe, die gegen 0 konvergiert, konvergiert absolut gegen 0. 38 1. ZAHLEN UND FOLGEN P P Beweis. Es sei P an absolut konvergent und bn konvergent gegen 0. Wir setzen P n α= |an | und βn = k=0 bk . Die n-te Partialsumme des Produkts ist die Summe aller Paare ak bl mit k + l ≤ n, also n X k X ai bk−i = a0 (b0 + . . . + bn ) + a1 (b0 + . . . + bn−1 ) + . . . + an (b0 ) = k=0 i=0 n X ai βn−i . i=0 Wegen lim βn = 0 gibt es für jedes ε > 0 ein N , sodass |βn | < ε für alle n > N . Es ist n X ai βn−i = |a0 βn + a1 βn−1 + . . . + an β0 | ≤ i=0 |a0 |ε + |a1 |ε + . . . + |an−(N +1) |ε + |an−N βN + . . . + an β0 | ≤ αε + |an−N βN + . . . + an β0 | . Bei fest gewähltem ε und davon abhängigem festen N ist lim |an−N βN + . . . + an β0 | = 0 n→∞ und daher n X lim sup ai βn−i ≤ αε n→∞ i=0 für dieserPLimes superior ein Limes und gleich Null. Das heißt, P jedes P ε > 0. Also ist P | an bn | = 0 und somit an bn = 0. Satz 1.17.4. Das Produkt einer absolut konvergenten Reihe mit einer konvergenten Reihe ist absolut konvergent und der Grenzwert des Produkts ist das Produkt der Grenzwerte. P P Beweis.PEs sei an absolut konvergent gegen α und bn konvergent gegen β. Dann konvergiert bn − β gegen 0. Nach Lemma 1.17.3 ist X X X X X an β = αβ. an bn − β = 0 und daher an bn = Beispiel 1.17.5 (Übungsbeispiel 32). Zeigen Sie mithilfe von Satz 1.17.4, dass die Reihe ∞ X (−1)n n=1 n−1 X k=1 1 − k) k 2 (n konvergent ist. Beispiel 1.17.6 (Übungsbeispiel 33). Bestimmen Sie (1) (an ) und (2) (bn ) so, dass ∞ X 1 = an z n (1 − z)2 n=0 und ∞ X 1 = bn z n (1 − z)3 n=0 ist, wobei z ∈ C mit |z| < 1. 1.17.7 (Theoriefrage Definieren P39). √ Sie das Cauchy-Produkt von Reihen. Nach welchem ∞ Kriterium konvergiert n=1 (−1)n / n? P∞ √ 1.17.8 (Theoriefrage 40*). Zeigen Sie, dass das Cauchy-Produkt von n=1 (−1)n / n mit sich selbst divergiert. 1.17.9 (Theoriefrage 41*). Zeigen Sie, dass das Produkt einer absolut konvergenten Reihe mit einer Reihe, die gegen 0 konvergiert, absolut gegen 0 konvergiert. Zeigen Sie, dass dies auch gilt, wenn die zweite Reihe gegen eine andere Zahl als 0 konvergiert. 1.18. DIE EXPONENTIALREIHE 39 1.18. Die Exponentialreihe Als Konvention definieren wir 00 = 1 und 0! = 1. Definition 1.18.1. Die Exponentialfunktion ist definiert für alle z ∈ C als exp(z) = ∞ X zn n! n=0 Satz 1.18.2. Es konvergiert exp(z) für alle komplexen z, es ist (1) exp(0) = 1 und für alle z, w ∈ C gilt (2) exp(z + w) = exp(z) exp(w), (3) exp(z) 6= 0. Für alle x, y ∈ R ist (4) exp(x) > 0, (5) x < y ⇐⇒ exp(x) < exp(y). Außerdem ist (6) lim exp(n) = ∞ und lim exp(−n) = 0. n→∞ n→∞ Beweis. Aus der Definition von exp(z) folgt unmittelbar exp(0) = 1. Nach dem Quotientenkriterium ist exp(z) für alle komplexen z absolut konvergent, denn lim sup n→∞ z z n+1 n! = lim sup = 0. (n + 1)!z n (n + 1) n→∞ Nach Satz 1.17.4 konvergiert daher das Produkt exp(z) exp(w) dieser Reihen und es ist n ∞ X ∞ ∞ X X z k wn−k z n X wn = n! n=0 n! k!(n − k)! n=0 k=0 n=0 ∞ n ∞ X 1 X n X (z + w)n = z k wn−k = = exp(z + w). n! k n! n=0 n=0 exp(z) exp(w) = k=0 Aus exp(z) exp(−z) = exp(z − z) = exp(0) = 1 folgt exp(−z) = 1 exp(z) und exp(z) 6= 0 für alle komplexen z. Für alle reelle Zahlen x folgt exp(x) > 0. Wenn x > 0, folgt aus Definition 1.18.1, dass exp(x) > 1 ist. Wenn x, y ∈ R und x < y, dann ist y = x + h und exp(y) = exp(x + h) = exp(x) exp(h), wobei exp(h) > 1 wegen h > 0. Also ist exp(y) > exp(x). Für n ∈ N ist nach Definition 1.18.1 exp(n) > 1 + n und somit limn→∞ exp(n) = ∞. Wegen exp(−n) exp(n) = 1 folgt limn→∞ exp(−n) = 0. Definition 1.18.3. Die Eulersche Zahl ist definiert als e = exp(1). Satz 1.18.4. 1 lim 1 + n n = e. Beweis. Nach dem Binomialsatz ist n X n n n X X 1 n 1 nn−1 n − (k − 1) 1 1 1+ = = . . . ≤ = e. n−k n k n n n n k! k! k=0 k=0 k=0 40 1. ZAHLEN UND FOLGEN n Daraus folgt lim sup 1 + n1 ≤ e. Andererseits ist für m ≤ n n X m m X n 1 nn−1 n − (k − 1) 1 1 ≥ = ... . 1+ n k nk n n n k! k=0 k=0 Wenn wir in der letzten Summe m konstant und n gegen ∞ gehen lassen, strebt diese Summe gegen m X 1 . k! k=0 Also ist n X ∞ 1 1 lim inf 1 + ≥ = e. n→∞ n k! k=0 Das heißt lim inf 1 + 1 n n n 1 ≥ e ≥ lim sup 1 + , n woraus die Aussage folgt. Beispiel 1.18.5 (Übungsbeispiel 34). Sind folgende Reihen konvergent? !n ∞ ∞ X X X n 2n (−1)k (1) (2) k! n+1 n=0 k=0 1.18.6 (Theoriefrage 42). Wie ist die Exponentialreihe exp(z) definiert? Zeigen Sie exp(z) exp(w) = exp(z + w) für alle z, w ∈ C und exp(x) > 0 für alle x ∈ R. n P∞ 1 1.18.7 (Theoriefrage 43). Zeigen Sie lim 1 + n1 = n=0 n! . KAPITEL 2 Stetigkeit 2.1. Metrische Räume Definition 2.1.1. Wenn X eine Menge und d eine Abbildung X × X → R ist, dann heißt das Paar (X, d) metrischer Raum, wenn für alle x, y und z gilt: (1) d(x, y) > 0 wenn x 6= y und d(x, x) = 0 (Definitheit), (2) d(x, y) = d(y, x) (Symmetrie), (3) d(x, y) + d(y, z) ≥ d(x, z) (Dreiecksungleichung). Die Abbildung d heißt Metrik. Beispiel 2.1.2. Alle bisher kennengelernten Zahlenbereiche N, Z, Q, R, C sowie alle Teilmengen davon sind metrische Räume. Auch R2 = R × R ist ein metrischer Raum, z.B. mit p d1 ((x1 , y1 ), (x2 , y2 )) = (x2 − x1 )2 + (y2 − y1 )2 , d2 ((x1 , y1 ), (x2 , y2 )) = |x2 − x1 | + |y2 − y1 | oder d3 ((x1 , y1 ), (x2 , y2 )) = max{|x2 − x1 |, |y2 − y1 |}. In der Ebene ist d1 der direkte euklidische Abstand und d2 ist die Länge eines kürzesten Weges, der sich in waagrechte und senkrechte Teilabschnitte zerlegen lässt. Definition 2.1.3. Wenn x ∈ X und ε > 0, dann heißt Uε (x) = {y ∈ X | d(x, y) < ε} offene ε-Umgebung von x im metrischen Raum (X, d). Ein Punkt x heißt innerer Punkt einer Menge M ⊂ X und M heißt Umgebung von x, wenn M eine offene ε-Umgebung von x enthält. Die Menge M heißt offen, wenn sie nur aus inneren Punkten besteht, und sie heißt abgeschlossen, wenn ihr Komplement X \ M offen ist. Beispiel 2.1.4. Offene Intervalle in Q bzw. in R sind offene Mengen, abgeschlossene Intervalle sind abgeschlossene Mengen in Q bzw. in R. Die offene Kreisscheibe {(x, y) ∈ R2 | (x − a)2 + (y − b)2 < r2 } mit Mittelpunkt (a, b) und Radius r ist eine offene Teilmenge von (R2 , d1 ) mit d1 aus Beispiel 2.1.2, aber auch bezüglich der anderen Abstandsfunktionen d2 oder d3 . Beispiel 2.1.5 (Übungsbeispiel 35). Ist (R2 , d) ein metrischer Raum für d((x1 , y1 ), (x2 , y2 )) = (x2 − x1 )2 + (y2 − y1 )2 ? 2.2. Stetigkeit in metrischen Räumen Definition 2.2.1. Wenn f eine Funktion X → Y ist, bezeichnet f −1 (A) = {x ∈ X | f (x) ∈ A} das Urbild oder das f -Urbild der Menge A. Es seien (X1 , d1 ) und (X2 , d2 ) metrische Räume und x0 ∈ X1 . Eine Funktion X1 → X2 heißt stetig in x0 , wenn das Urbild jeder Umgebung von f (x0 ) eine Umgebung von x0 ist. 41 42 2. STETIGKEIT Die Funktion heißt stetig auf einer Menge, wenn sie in jedem Punkt der Menge stetig ist, und sie heißt stetig, wenn sie auf dem ganzen Definitionsbereich stetig ist. Eine Funktion ist unstetig an einer Stelle, wenn sie an dieser Stelle definiert, aber nicht stetig ist. Eine solche Stelle heißt Unstetigkeitsstelle. Beispiel 2.2.2. Es seien f1 , f2 , f3 , f4 : R → R Funktionen mit f1 (x) = x, f2 (x) = 1 f3 (x) = |x| und f4 (x) = sign(x). Die Funktionen f1 , f2 , f3 sind auf ganz R stetig, f4 ist auf R \ {0} stetig, jedoch unstetig in 0. Für x ∈ R und ein beliebiges ε > 0 betrachten wir die Urbilder der Umgebungen (fi (x) − ε, fi (x) + ε). Für i = 1 ist das Urbild von (f1 (x) − ε, f1 (x) + ε) = (x − ε, x + ε) gleich f1−1 ((x − ε, x + ε)) = (x − ε, x + ε) und daher eine Umgebung von x. Also ist f1 stetig in jeder Stelle x. Für i = 2 ist das Urbild von (f2 (x) − ε, f2 (x) + ε) = (1 − ε, 1 + ε) gleich R und somit eine Umgebung von jedem Punkt x. Also ist f2 stetig auf R. Das f3 -Urbild von (f3 (x) − ε, f3 (x) + ε) für x 6= 0 ist (−x − ε, −x + ε) ∪ (x − ε, x + ε) für ε < |x|. Für x = 0 ist f3 (0) = 0 und das f3 -Urbild von (−ε, ε) ist wieder (−ε, ε) und somit eine Umgebung von 0. Die Funktion f4 ist auf R+ und auf R− stetig, weil sie dort konstant ist. Für x < 0 ist das Urbild jeder Umgebung von f4 (x) = −1 gleich R− und wenn x > 0 ist das Urbild jeder Umgebung von f4 (x) = 1 gleich R+ . Es ist (−1/2, 1/2) eine Umgebung von f4 (0) = 0, jedoch ist das Urbild dieser Umgebung {0} und somit keine Umgebung von 0. Daher ist 0 eine Unstetigkeitsstelle von f4 . Die Funktion f : R \ {0} → R mit f (x) = 1/x ist auf ihrem ganzen Definitionsbereich stetig. Es wäre falsch zu sagen, dass die Funktion in 0 unstetig ist, weil sie dort nicht definiert ist. f1 (x) f1 (x) = x f2 (x) f2 (x) = c x f3 (x) x f4 (x) f3 (x) = |x| f4 (x) = sign(x) x Abbildung 1. Stetige und unstetige Funktionen x 2.2. STETIGKEIT IN METRISCHEN RÄUMEN 43 Definition 2.2.3. Ein Punkt x ∈ X in einem metrischen Raum (X, dX ) heißt isoliert, wenn er kein Häufungspunkt von X ist. In so einem Fall gibt es eine Umgebung von x, die nur endlich viele Elemente hat. Wenn dies der Fall ist, dann gibt es ε > 0, sodass Uε (x) = {x} ist. Anders formuliert: Der Punkt x ist genau dann isoliert, wenn {x} eine Umgebung von x ist. In einem isolierten Punkt p ist jede Funktion stetig, denn das Urbild jeder Umgebung von f (p) enthält p und ist daher eine Umgebung von p. Im Folgenden setzen wir für alle metrischen Räume voraus, dass sie keine isolierten Punkte haben. Solche metrischen Räume werden auch perfekt genannt. Definition 2.2.4. Es seien (X, dX ) und (Y, dY ) metrische Räume, D ⊂ X, f : D → Y eine Abbildung, p ein Häufungspunkt von D und q ∈ Y . Wir schreiben lim f (x) = q x→p oder f (x) → q für x → p, falls es für alle ε > 0 ein δ > 0 gibt, sodass für alle x ∈ D mit 0 < dX (x, p) < δ die Ungleichung dY (f (x), q) < ε erfüllt ist. Anders formuliert: Wir schreiben limx→p f (x) = q, wenn es für jede Umgebung V in Y von q eine Umgebung U von p in X gibt, sodass f ((U ∩ D) \ {p}) ⊂ V ist. Anschaulich formuliert ist der Limes einer Funktion an einer Stelle der Wert, gegen den sich die Funktion annähert, wobei die Stelle p selbst außer Acht gelassen wird. Es kann p sogar außerhalb des Definitionsbereichs D liegen. Beispiel 2.2.5. Es sei f : R → R gegeben durch ( 1 wenn x = 0, f (x) = 0 wenn x 6= 0. Dann existiert limx→0 f (x) und ist gleich 0 und somit ungleich dem Funktionswert f (0) = 1. f (x) x Abbildung 2. Funktion mit limx→0 f (x) 6= f (0) Die reelle Vorzeichenfunktion f mit f (x) = sign(x) aus Beispiel 2.2.2 hat in 0 jedoch keinen Limes. Gelegentlich wird der Funktionenlimes auch anders definiert und die Stelle selbst berücksichtigt. In so einem Fall wird also verlangt, dass der Limes mit dem Funktionswert an der betreffenden Stelle übereinstimmt. Satz 2.2.6. Es seien (X, dX ) und (Y, dY ) metrische Räume ohne isolierte Punkte, f eine Abbildung X → Y . Dann sind folgende Aussagen äquivalent: (1) Die Funktion f ist stetig in p. Das heißt, für jede Umgebung U von f (p) ist f −1 (U ) eine Umgebung von p. (2) Für alle ε > 0 gibt es ein δ > 0, sodass dY (f (x), f (p)) < ε ist für alle x mit dX (x, p) < δ (“ε-δ-Definition” der Stetigkeit). (3) Es ist limx→p f (x) = f (p). 44 2. STETIGKEIT (4) Für jede Folge (xn ) in X mit lim xn = p und xn 6= p ist lim f (xn ) = f (p). (Folgenkriterium) Beweis. Wenn (1) erfüllt ist, dann ist für jedes ε > 0 das Urbild f −1 (Uε (f (p)) eine Umgebung von p. Folglich gibt es ein δ > 0 mit Uδ (p) ⊂ f −1 (Uε (f (p)). Daraus folgt f (Uδ (p)) ⊂ Uε (f (p)) und es ist dY (f (x), f (p)) < ε für alle x mit dX (x, p) < δ. Also gilt (1) ⇒ (2). Wenn (2) erfüllt ist, gibt es für alle ε > 0 ein δ > 0 mit f (Uδ (p)) ⊂ Uε (f (p)). Das bedeutet nach Definition 2.2.4, dass limx→p f (x) = f (p) ist, also folgt Bedingung (3). Angenommen es gilt (3) und lim xn = p. Dann sei Uε (f (p)) eine beliebig kleine Umgebung von f (p). Nach Definition 2.2.4 gibt es δ > 0, sodass f (Uδ (p)) ⊂ Uε (f (p)). Wegen lim xn = p liegt die Folge (xn ) ab einer Stelle in Uδ (p) und daher die Folge (f (xn )) ab einer Stelle in f (Uδ (p)) und somit in Uε (f (p)). Das bedeutet, dass (f (xn )) in jeder beliebig kleinen Umgebung von f (p) ab einer Stelle liegt und gegen f (p) konvergiert, womit (3)⇒ (4) gezeigt ist. Um die Implikation (4) ⇒ (1) zu zeigen, nehmen wir indirekt an, dass (4) erfüllt und (1) nicht erfüllt ist. Dann gibt es eine Umgebung Uε (f (p)) von f (p), deren Urbild keine Umgebung von p ist. Das heißt, es liegen Punkte x beliebig nahe bei p mit x ∈ / f −1 (Uε (f (p))) bzw. f (x) ∈ / Uε (f (p)). Daher existieren xn mit |xn − p| < 1/n und f (xn ) ∈ / Uε (f (p)). Somit ist lim xn = p, aber (f (xn )) konvergiert nicht gegen f (p). Das ist ein Widerspruch, folglich muss (1) doch gelten. Damit haben wir die Implikationskette (1) ⇒ (2) ⇒ (3) ⇒ (4) ⇒ (1) bewiesen. Das bedeutet, die vier Aussagen sind äquivalent. Korollar 2.2.7. Es seien f und g komplexwertige Abbildungen auf einem metrischen Raum, die stetig an einer Stelle p sind. Dann sind auch die Funktionen f + g und f · g stetig in p und es ist limx→p (f (x)+g(x)) = limx→p (f +g)(x) bzw. limx→p (f (x)·g(x)) = limx→p (f · g)(x). Wenn g(x) 6= 0 für alle x, dann ist auch f /g stetig in p und limx→p (f (x)/g(x)) = limx→p (f /g)(x). Beweis. Es sei f stetig in p und (xn ) eine beliebige Folge mit lim xn = p. Dann ist nach Satz 2.2.6.4 lim f (xn ) = f (p) und lim g(xn ) = g(p). Mit Satz 1.8.5 folgt lim(f + g)(xn ) = lim(f (xn ) + g(xn )) = lim f (xn ) + lim g(xn ) = f (p) + g(p) = (f + g)(p). Daher ist f +g nach Satz 2.2.6 stetig in p. Dass f ·g und f /g stetig in p sind, folgt analog. Lemma 2.2.8. Für alle N ∈ N und z ∈ C mit |z| ≤ ez = N X zn + RN +1 (z) n! n=0 Beweis. RN +1 (z) = mit N +2 2 ist |RN +1 | ≤ 2 |z|N +1 . (N + 1)! N ∞ ∞ X X zn X zn zn − = , n! n=0 n! n! n=0 n=N +1 |RN +1 (z)| ≤ ∞ X |z|n |z|N +1 |z| |z|2 = 1+ + +... n! (N + 1)! N + 2 (N + 2)(N + 3) n=N +1 | {z } |z|2 ≤ (N +2)2 k ∞ |z|N +1 X |z| ≤ (N + 1)! N +2 k=0 ≤ |z|≤ N2+2 ∞ k |z|N +1 X 1 |z|N +1 =2· . (N + 1)! 2 (N + 1)! k=0 2.2. STETIGKEIT IN METRISCHEN RÄUMEN 45 Lemma 2.2.9. Die Exponentialfunktion ist stetig auf ganz C. Beweis. Es sei p ∈ C und ε > 0. Dann ist |ez − ep | = |ep ez−p − ep | = |ep | · |ez−p − 1|. Nach Lemma 2.2.8 ist für N = 0 |ez−p | ≤ 1 + 2|z − p| und |ep−z | ≤ 1 + 2|z − p| woraus |e|z−p| | ≤ 1 + 2|z − p| folgt. Wegen e|z−p| ≥ 1 ist |e|z−p| | − 1 = |e|z−p| − 1| ≤ 2|z − p|. Insgesamt erhalten wir |ez − ep | = |ep | · |ez−p − 1| ≤ |ep | · 2|z − p|. Daher ist für alle z mit |z − p| < ε/(2|ep |) =: δ der Betrag |ez − ep | < ε. Also ist die Exponentialfunktion nach Satz 2.2.6.2 stetig. Satz 2.2.10. Es seien (X, dX ) und (Y, dY ) metrische Räume und f : X → Y , dann ist f genau dann stetig, wenn das Urbild jeder offenen Menge offen ist. Beweis. Wenn das Urbild jeder offenen Menge offen ist, ist das Urbild einer offenen Umgebung von f (p) offen und somit eine Umgebung von p. Also ist f stetig in p. Es sei f stetig und O eine offene Menge in Y . Für jedes p ∈ X mit f (p) ∈ O gibt es eine offene Umgebung U (p) mit f (U (p)) ⊂ O. Das Urbild f −1 (O) ist die Vereinigung all dieser offenen Umgebungen und somit offen. Satz 2.2.11. Es seien (X, dX ), (Y, dY ) und (Z, dZ ) metrische Räume, g : X → Y und f : g(X) → Z. Wenn g stetig in p und f stetig in g(p) ist, dann ist auch f ◦ g stetig in p. Beweis. Es sei p ∈ X und ε > 0 beliebig. Weil f stetig an der Stelle g(p) ist, gibt es ein δ > 0, sodass f (Uδ (g(p))) ⊂ Uε (f (g(p))) = Uε (f ◦ g(p)) . Weil g stetig in p ist, gibt es ein η > 0, sodass g (Uη (p)) ⊂ Uδ (g(p)) . Daraus folgt f ◦ g (Uη (p)) ⊂ Uε (f ◦ g(p)) . Das bedeutet, dass f ◦ g stetig in p ist. Beispiel 2.2.12 (Übungsbeispiel 36). Es seien f, f1 , f2 , f3 : R → R reelle Funktionen mit f1 (x) = f (−x), f2 (x) = f (2x) und f3 (x) = (x + 2). Wie sehen die Graphen von f1 , f2 und f3 im Vergleich zu jenem von f aus? Veranschaulichen Sie durch Skizzen. Beispiel 2.2.13 (Übungsbeispiel 37). Auf welcher Menge ist die Funktion f : R → R 1, falls x < 0, f (x) = x, falls 0 ≤ x ≤ 1, x e , falls x > 1, stetig? Begründen Sie, an welchen Stellen die Funktion nicht stetig ist, indem Sie von einer Umgebung des Bildpunktes zeigen, dass sie die Definition der Stetigkeit nicht erfüllt. mit Beispiel 2.2.14 (Übungsbeispiel 38). Es sei f : R → R mit ( 0, wenn x < 0, f (x) = . 1, für x ≥ 0. (1) Finden Sie eine Umgebung von 1, deren f -Urbild keine um Umgebung von 0 ist. 46 2. STETIGKEIT (2) Finden Sie ein ε > 0, für das es kein δ > 0 mit |x − 0| < δ =⇒ |f (x) − f (0)| < ε gibt. (3) Finden Sie ein Folge (xn )n∈N in R \ {0} mit limn→∞ xn = 0, für die (f (xn )) nicht gegen f (0) konvergiert. Beispiel 2.2.15 (Übungsbeispiel 39). Zeigen Sie, dass e zwischen 2 und 3 liegt. Sie können dafür die Restgliedabschätzung der Exponentialreihe verwenden. 2.2.16 (Theoriefrage 44). Was ist ein metrischer Raum? Wie ist Stetigkeit einer Funktion zwischen metrischen Räumen an einer Stelle definiert? Zeigen Sie von einfachen gegebenen Funktionen (ähnlich wie in Beispiel 2.2.2), dass sie unstetig bzw. stetig an einer Stelle sind. 2.2.17 (Theoriefrage 45). Es sei f eine Funktion zwischen metrischen Räumen. Wie lautet die sogenannte ε-δ-Definition der Stetigkeit an einer Stelle? Definieren Sie den Limes einer Funktion. Zeigen Sie, dass limx→p f (x) = f (p) ist, wenn f in p die ε-δ-Definition der Stetigkeit erfüllt. 2.2.18 (Theoriefrage 46). Wie lautet das Folgenkriterium für die Stetigkeit von Funktionen zwischen metrischen Räumen? Zeigen Sie, dass eine Funktion stetig ist, wenn sie das Folgenkriterium erfüllt. 2.2.19 (Theoriefrage 47*). Zeigen Sie eine Restgliedabschätzung für die Exponentialreihe und leiten Sie daraus ab, dass die komplexe Exponentialfunktion stetig ist. 2.2.20 (Theoriefrage 48). Zeigen sie, dass eine Funktion zwischen metrischen Räumen genau dann stetig ist, wenn das Urbild jeder offenen Menge offen ist. 2.2.21 (Theoriefrage 49). Welche Resultate können verwendet werden um zu zeigen, dass die Summe zweier stetiger Funktionen stetig ist? Zeigen sie, dass die Zusammensetzung stetiger Funktionen stetig ist. 2.3. Stetigkeit reeller Funktionen Zwei Eigenschaften zeichnen die reellen Zahlen gegenüber allgemeinen metrischen Räumen aus: Vollständigkeit und lineare Ordnung. In diesem Kapitel behandeln wir Aussagen über reelle Funktionen, bei denen diese beiden Eigenschaften eine zentrale Rolle spielen. Definition 2.3.1. Es sei D ⊂ R, p ein Häufungspunkt von D ∩ (p, ∞) und f : D → R. Dann schreiben wir lim f (x) = q x→p+ wenn für jede Folge (xn ) in D ∩ (p, ∞) die Folge (f (xn )) gegen q konvergiert und wir nennen q den rechtsseitigen Grenzwert von f in p. Den linksseitigen Grenzwert von f in p limx→p− f (x) = q definieren wir analog für Folgen in D ∩ (−∞, p). Wenn D unbeschränkt nach oben ist, ist der Grenzwert von f in Unendlich lim f (x) = q, x→∞ wenn für jede Folge in D, die bestimmt gegen ∞ divergiert, die Folge f (xn ) gegen q konvergiert. Analog definieren wir lim f (x) = q, x→−∞ über Folgen, die bestimmt gegen −∞ divergieren. Wenn die Folgen f (xn ) bestimmt divergieren, bezeichnen wir die entsprechenden uneigentlichen Limiten mit lim ±∞ und lim ±∞. x→p x→±∞ 2.3. STETIGKEIT REELLER FUNKTIONEN 47 Für eine reelle Funktion existiert limx→p f (x) genau dann, wenn limx→p+ f (x) und limx→p− f (x) existieren und limx→p+ f (x) = limx→p− f (x) ist. Die Funktion f ist genau dann stetig in p, wenn limx→0+ f (x) = limx→0− f (x) = f (p) ist. Beispiel 2.3.2. (1) Es ist limx→0+ sign(x) = 1 und limx→0− sign(x) = −1. (2) Die Abbildung x 7→ 1/x ist auf R \ {0} definiert und es ist 1 = ∞, x→0+ x lim 1 = −∞ und x→0− x lim 1 1 = lim = 0. x→∞ x x→−∞ x lim (3) Analog zu Beispiel 1.8.11 seien a0 , a1 , . . . , ak , b0 , b1 , . . . , bl Zahlen mit ak 6= 0, bl 6= 0, und f : D → R eine Funktion mit f (x) = a0 + a1 x + a2 x2 + . . . + ak xk , b0 + b1 x + b2 x2 + . . . bl xl wobei D die Menge der reellen Zahlen ist, für die obiger Nenner nicht Null ist. Solche Funktionen werden auch rationale Funktionen genannt. Dann ist ak falls k = l, bl , 0, falls k < l, lim f (x) = x→∞ ∞, falls l < k und abkl > 0, −∞, falls l < k und abkl < 0. Die Fälle k = l und k < l folgen aus Beispiel 1.8.11. Wenn l < k, erhalten wir f (x) = xk−l a0 x−k + a1 x1−k + a2 x2−k + . . . + ak . b0 x−l + b1 x1−l + b2 x2−l + . . . bl Der Grenzwertsatz 1.8.5 für Folgen impliziert, dass der letztere Bruch gegen ak /bl strebt. Angenommen, es ist ak /bl > 0, dann gibt es ein x0 , sodass f (x) für x > x0 in der Umgebung (ak /(2bl ), ∞) von ak /bl liegt, wobei c = ak /(2bl ) > 0 ist. Also ist f (x) > cxk−l ≥ cx für x ≥ x0 . Für x → ∞ strebt cx → ∞ und somit f (x) → ∞. Der Fall ak /bl wird analog gezeigt. Satz 2.3.3 (Zwischenwertsatz). Es sei f : [a, b] → R eine stetige Abbildung. Wenn f (a) ≤ f (b), dann gibt es für alle q ∈ [f (a), f (b)] ein p ∈ [a, b] mit f (p) = q. Falls f (b) ≤ f (a), dann gibt es für alle q ∈ [f (b), f (a)] ein p ∈ [a, b] mit f (p) = q. Beweis. Wir definieren eine Intervallschachtelung rekursiv durch I0 = [a, b] und wenn In = [an , bn ], dann setzen wir ( n n ], wenn f bn +a ≥ q und [an , bn +a 2 2 In+1 = [an+1 , bn+1 ] = bn +an bn +an [ 2 , bn ], wenn f < q. 2 Für alle n ∈ N ist somit f (an ) ≤ q ≤ f (bn ). Es sei p die reelle Zahl, die durch die Intervallschachtelung definiert ist. Dann ist lim(an ) = lim(bn ) = p. Weil f stetig ist, gilt lim(f (an )) = lim(f (bn )) = f (p). Nach dem Sandwich Theorem 1.8.7 folgt aus f (an ) ≤ q ≤ f (bn ), dass f (p) = q ist und somit die erste Aussage des Satzes. Wenn f (b) ≤ f (a), ist −f (a) ≤ −f (b) und die bereits bewiesene Aussage angewendet auf −f liefert zu jedem −q ∈ [−f (a), −f (b)] ein p ∈ [a, b] mit −f (p) = −q und somit f (p) = q. 48 2. STETIGKEIT Beispiel 2.3.4. Jede reelle Polynomfunktion mit ungeradem Grad hat eine Nullstelle. Formal: Es sei f : R → R eine Polynomfunktion ungeraden Grades, also f (x) = c2n+1 x2n+1 + . . . + c0 mit c2n+1 6= 0 und n ≥ 0. Nach Beispiel 2.3.2.3 ist limn→∞ f (x) = ∞ und limn→−∞ f (x) = −∞, wenn c2n+1 > 0 bzw. limn→∞ f (x) = −∞ und limn→−∞ f (x) = ∞, wenn c2n+1 < 0. Also gibt es ein Intervall [a, b] mit f (a) ≤ 0 ≤ f (b) oder ein Intervall [a, b] mit f (b) ≤ 0 ≤ f (a). Nach dem Zwischenwertsatz existiert ein p mit f (p) = 0. Definition 2.3.5. Eine reelle Funktion f : D → R heißt beschränkt, wenn die Bildmenge f (D) beschränkt ist. Satz 2.3.6. Eine stetige Funktion auf einem abgeschlossenen Intervall ist beschränkt und nimmt Supremum und Infimum ihres Wertebereichs an (und besitzt daher Minimum und Maximum). Anders ausgedrückt: Wenn f : [a, b] → R stetig ist, dann gibt es p1 , p2 ∈ [a, b], sodass f (p1 ) ≤ f (x) ≤ f (p2 ) für alle x ∈ [a, b]. Beweis. Wir definieren q2 = sup f ([a, b]), wobei q2 ∈ R∪{∞}. Es sei (xn ) eine beliebige (nicht notwendigerweise konvergente) Folge in [a, b] mit lim f (xn ) = q2 . Nach dem Satz von Bolzano-Weierstraß 1.13.5 gibt es eine konvergente Teilfolge (xnk ) und es sei p2 = limk→∞ xnk . Weil f stetig ist, ist limk→∞ f (xnk ) = f (p2 ) = q2 , also ist q2 ein reelle Zahl und f (x) ≤ f (p2 ) für alle x ∈ [a, b]. Beispiel 2.3.7. Die folgenden Beispiele zeigen, dass Satz 2.3.6 im Allgemeinen nicht gilt, wenn eine der Voraussetzungen verletzt ist. (1) Auf dem halboffenen Intervall (0, 1] ist f1 mit f1 (x) = x zwar beschränkt, es hat aber die Bildmenge f1 ((0, 1]) kein Minimum. Die Funktion f2 : x 7→ 1/x ist auf diesem Intervall stetig, aber trotzdem unbeschränkt. (2) Die Funktion f3 : [0, 1] → R mit f3 (x) = sign(x) − x ist zwar auf einem abgeschlossenen Intervall definiert und beschränkt, es ist sup f3 ([0, 1]) = 1, aber es gibt kein p ∈ [0, 1] mit f (p) = 1. Die Funktion f3 ist nicht stetig in 0. Korollar 2.3.8. Das stetige Bild eines Intervalls ist ein Intervall. Das stetige Bild eines abgeschlossenen Intervalls ist ein abgeschlossenes Intervall. Anders formuliert: Wenn I ein Intervall ist und f : I → R stetig ist, dann ist f (I) ein Intervall. Ist I abgeschlossen, dann ist auch f (I) abgeschlossen. Beweis. Dass das Bild f (I) einer stetigen Funktion f eines Intervalls I ein Intervall ist, folgt aus dem Zwischenwertsatz 2.3.3: Angenommen f (I) wäre kein Intervall, dann gäbe es y1 < q < y2 mit y1 , y2 ∈ f (I) und q 6∈ f (I). Nach dem Zwischenwertsatz muss es aber ein p ∈ I geben mit f (p) = q. Man beachte, dass Intervalle auch einelementig oder unbeschränkt sein können. Wenn I abgeschlossen und f stetig ist, dann ist nach Satz 2.3.6 f (I) = [f (p1 ), f (p2 )] mit f (p1 ) ≤ f (x) ≤ f (p2 ) für alle x ∈ I. Beispiel 2.3.9. Der zweite Teil von Korollar 2.3.8 gilt nur für abgeschlossene Intervalle. Das stetige Bild eines offenen Intervalls kann offen oder abgeschlossen sein. Für f1 mit f1 (x) = x ist jedes Bild eines offenen Intervalls offen. Wenn f2 (x) = c ist das Bild jedes Intervalls {c} = [c, c] und somit ein abgeschlossenes Intervall. Es sei der Graph f3 : (−2, 2) → R stückweise linear zwischen den Punkten mit den Koordinaten (−2, 0), (−1, 1), (1, −1), (2, 0), also für − 2 < x ≤ −1, x + 2 f3 (x) = −x für − 1 < x ≤ 1, x−2 für 1 < x < 2. 2.4. STETIGE UMKEHRABBILDUNGEN 49 Dann ist f3 stetig und f3 ((−2, 2)) = [−1, 1]. Beispiel 2.3.10 (Übungsbeispiel 40). Es sei f : R \ {3} → R mit 2x − 1 f (x) = . 3−x Bestimmen Sie lim f (x), x→3+ lim f (x), x→3− lim f (x) x→∞ und lim f (x). x→−∞ 2.3.11 (Theoriefrage 50). Geben Sie ein allgemeines Kriterium, um limx→∞ f (x) für rationale reelle Funktion zu bestimmen, und wenden Sie dieses für konkrete Beispiele an. 2.3.12 (Theoriefrage 51). Formulieren und beweisen Sie den Zwischenwertsatz. 2.3.13 (Theoriefrage 52). Zeigen Sie, dass eine stetige reelle Funktion auf einem abgeschlossenen Intervall Maximum und Minimum annimmt. Leiten Sie daraus mithilfe des Zwischenwertsatzes ab, dass das stetige Bild eines abgeschlossenen Intervalls wieder ein abgeschlossenes Intervall ist. 2.4. Stetige Umkehrabbildungen Definition 2.4.1. Für eine Menge A bezeichnen wir mit idA die Identität A → A mit x 7→ x. Wenn f : A → B, g : f (A) → A und g ◦f = idA , dann nennen wir g Umkehrabbildung von f und schreiben f −1 statt g. Eine Abbildung f hat genau dann eine Umkehrabbildung, wenn sie injektiv ist. Wenn f : A → B injektiv ist, dann ist f : A → f (A) bijektiv. Die Umkehrabbildung f −1 ist ebenfalls bijektiv. Die Abbildung f ist auch die Umkehrabbildung von f −1 . Es ist f −1 ◦ f = idA und f ◦ f −1 = idf (A) . Satz 2.4.2. Eine stetige Abbildung auf einem Intervall ist genau dann injektiv, wenn sie streng monoton ist. Beweis. Jede Funktion f : [a, b] → R, die streng monoton ist, ist injektiv. Angenommen f ist injektiv und stetig. Wir nehmen indirekt an, f sei nicht streng monoton. Dann gibt es x1 , x2 , x3 ∈ [a, b], x1 < x2 < x3 mit f (x1 ) ≤ f (x2 ) und f (x2 ) ≥ f (x3 ) oder mit f (x1 ) ≥ f (x2 ) und f (x2 ) ≤ f (x3 ). Im ersteren Fall gibt es für jedes q ∈ [f (x1 ), f (x2 )] ∩ [f (x3 ), f (x2 )] Punkte p1 , p2 mit x1 < p1 < x2 < p2 < x3 und f (p1 ) = f (p2 ) = q, im Widerspruch zur Injektivität von f . Im zweiten Fall folgt Gleiches für q ∈ [f (x2 ), f (x1 )] ∩ [f (x2 ), f (x3 )]. Lemma 2.4.3. Die Umkehrfunktion einer streng monoton steigenden (bzw. fallenden) reellen Funktion ist streng monoton steigend (bzw. fallend). Beweis. Es sei f : D → R injektiv. Streng steigend zu sein, bedeutet für f x1 < x2 ⇐⇒ f (x1 ) < f (x2 ). Für f −1 und y1 , y2 ∈ f (D) mit y1 = f (x1 ) und y2 = f (x2 ) folgt f −1 (y1 ) < f −1 (y2 ) ⇐⇒ y1 < y2 . Also ist auf f −1 streng monoton steigend. Streng fallend zu sein, bedeutet für f x1 < x2 ⇐⇒ f (x1 ) > f (x2 ), beziehungsweise f −1 (y1 ) < f −1 (y2 ) ⇐⇒ y1 > y2 . Satz 2.4.4. Existiert die Umkehrabbildung einer stetigen Funktion auf einem Intervall, dann ist sie stetig. 50 2. STETIGKEIT Beweis. Nach Satz 2.4.2 sind f und f −1 streng monoton. Wir nehmen an, f ist steigend auf dem Intervall I, dies gilt nach Lemma 2.4.3 auch für f −1 auf f (I). Es sei q = f (p) ein innerer Punkt von f (I) und ε > 0 beliebig mit (p − ε, p + ε) ⊂ I. Wegen der Monotonie ist f (p − ε) < f (p) = q < f (p + ε). Es gibt ein δ > 0 mit f (p − ε) < q − δ < q + δ < f (p + ε) Uδ (q) ⊂ f (Uε (p)) und f −1 bzw. (Uδ (q)) ⊂ Uε (p). Wenn f fallend ist, läuft der Beweis analog. Beispiel 2.4.5. Die reelle Exponentialfunktion ist nach Lemma 2.2.9 stetig und nach Satz 1.18.2.5 streng monoton. Ihre Umkehrfunktion bezeichnen wir mit log und nennen sie (natürlichen) Logarithmus. Der Logarithmus ist nach den Sätzen 1.18.2.6 und 2.4.4 definiert und stetig auf exp(R) = R+ . Aus Satz 1.18.2.2 folgt für x, y ∈ R exp(log(x) + log(y)) = exp(log(x)) exp(log(y)) = xy und folglich log(x) + log(y) = log(xy). n Außerdem ist log(x ) = n log(x). Definition 2.4.6. Für a ∈ R+ und x ∈ R definieren wir ax = ex log(a) . Dach dieser Definition folgt unmittelbar log(ax ) = x log(a). Es ist ax eine Verallgemeinerung ganzzahliger Potenzen, denn für n ∈ N ist n an = elog(a ) = en log(a) = elog(a)+···+log(a) = elog(a) · · · elog(a) = a · · · a. 2.4.7 (Theoriefrage 53). Zeigen Sie, dass eine stetige Abbildung auf einem Intervall genau dann injektiv ist, wenn sie streng monoton ist. 2.4.8 (Theoriefrage 54). Zeigen Sie, dass eine Umkehrabbildung einer stetigen reellen Funktion stetig ist. 2.4.9 (Theoriefrage 55). Wie ist der reelle Logarithmus definiert? Aus welchen Sätzen können Sie ableiten, dass er stetig ist? 2.5. Limiten zu Exponentialfunktion und Logarithmus Lemma 2.5.1. (1) Für alle k ∈ N ist ex = ∞, x→∞ xk denn für x > 0 ist ∞ X xn xk+1 ex = > n! (k + 1)! n=0 xk =0 x→∞ ex lim lim und daher Daraus folgt unmittelbar limx→∞ xk ex und lim xk e1/x = ∞, x→0+ ex x →∞ > xk (k + 1)! für x → ∞. = 0. Für y = 1/x ist ey = ∞. y→∞ y k lim xk e1/x = lim x→0+ (2) Es folgen lim ex = ∞ x→∞ und lim ex = 0, x→−∞ aus dem entsprechenden Limes für ganzzahlige n statt reeller x, siehe Satz 1.18.2.6, sowie aus der Monotonie und der Stetigkeit der Exponentionalfunktion (Satz 1.18.2.5, Lemma 2.2.9). Für den Logarithmus (Beispiel 2.4.5) gilt daher lim log(x) = ∞ x→∞ und lim log(x) = −∞. x→0+ 2.6. TRIGONOMETRISCHE FUNKTIONEN 51 (3) Für alle α ∈ R+ ist lim xα = 0 lim x−α = ∞. und x→0+ x→0+ Die erste Aussage folgt aus xα = eα log(x) und (2). Die zweite Aussage folgt aus der ersten. (4) Für alle α ∈ R+ ist lim x→∞ log(x) =0 xα lim xα log(x) = 0, und x→0+ denn log(x) 1 log(x) y/α y = lim α log(x) = lim y = lim y = 0, α x→∞ e x→∞ x y→∞ e α y→∞ e wobei y = α log(x). Daraus folgt außerdem lim lim xα log(x) = lim y→∞ x→0+ log(1/y) log(y) = lim − α = 0 α y→∞ y y mit y = 1/x. (5) Für alle x ∈ R ist eh − 1 ex+h − ex = 1 und lim = ex . h→0 h→0 h h Die Restgliedabschätzung 2.2.8 von eh für N = 1 mit |h| ≤ (N + 2)/2 = 3/2 bedeutet |h|2 |eh − h − 1| ≤ 2 = h2 2! und somit h h e − 1 e − h − 1 = ≤ |h|, − 1 h h woraus die erste Aussage folgt. Schließlich ist lim ex+h − ex eh − 1 = ex lim = ex . h→0 h→0 h h lim 2.5.2 (Theoriefrage 56). Zeigen Sie limx→∞ 0 für alle α ∈ R+ . ex xk 2.5.3 (Theoriefrage 57). Zeigen Sie limh→0 dabschätzung der Exponentialfunktion. = ∞ für alle k ∈ N sowie limx→∞ eh −1 h log(x) xα = 1 unter Verwendung der Restglie- 2.6. Trigonometrische Funktionen Es ist eix = ∞ n n X x2 x3 x4 x5 x6 x7 x8 x9 i x = 1 + ix − −i + +i − −i + + i − ··· n! 2 3! 4! 5! 6! 7! 8! 9! n=0 Definition 2.6.1. Wir definieren Cosinus und Sinus als ∞ X x2n x2 x4 x6 x8 cos(x) = Re(eix ) = (−1)n =1− + − + − ··· (2n)! 2 4! 6! 8! n=0 sin(x) = Im(eix ) = ∞ X n=0 (−1)n = x3 x5 x7 x9 x2n+1 =x− + − + − ··· (2n + 1)! 3! 5! 7! 9! Satz 2.6.2. Für alle x ∈ R gilt: (1) Die Reihen cos(x) und sin(x) sind absolut konvergent, (2) |eix | = cos2 (x) + sin2 (x) = 1, 52 2. STETIGKEIT (3) cos(x) = eix + e−ix eix − e−ix , sin(x) = , 2 2i (4) cos(x) = cos(−x) und sin(x) = − sin(−x), (5) die Summenformeln lauten sin(x ± y) = sin(x) cos(y) ± cos(x) sin(y), cos(x ± y) = cos(x) cos(y) ∓ sin(x) sin(y), (6) x+y x−y sin 2 2 x−y x+y sin . 2 cos 2 2 cos(x) − cos(y) = −2 sin sin(x) − sin(y) = (7) Sinus und Cosinus sind stetig. Beweis. Die absolute Konvergenz folgt zum Beispiel aus dem Quotientenkriterium wie für die Exponentialfunktion. Es ist cos2 (x) + sin2 (x) = (Re(eix ))2 + (Im(eix ))2 = |eix |2 = eix eix = ∞ X x3 x4 (−i)n xn x2 +i + − · · · = eix = eix e−ix = e0 = 1. eix 1 − ix − 2 3! 4! n! n=0 Ebenfalls direkt aus der Reihendarstellung folgen (3) und (4). Es ist cos(x + y) + i sin(x + y) = ei(x+y) = eix eiy = (cos(x) + i sin(x))(cos(y) + i sin(y)) = (cos(x) cos(y) − sin(x) sin(y)) + i(sin(x) cos(y) + cos(x) sin(y)). Durch den Vergleich von Real- und Imaginärteil dieser Gleichung ergibt sich (5). Die Aussage für x − y statt x + y folgt aus (4). Für u= x+y 2 und v = x−y 2 bzw. x=u+v und y = u − v ist cos(x) − cos(y) = cos(u + v) − cos(u − v) = cos(u) cos(v) − sin(u) sin(v) − cos(u) cos(v) + sin(u) sin(v) = −2 sin(u) sin(v) = −2 sin x+y x−y sin . 2 2 Die Aussage für sin(x) − sin(y) folgt analog. Nach Korollar 2.2.7 sind Sinus und Cosinus stetig, weil sie sich als Summe bzw. Differenz der stetigen Exopnentialfunktionen darstellen lassen. In der komplexen Zahlenebene liegen die Punkte (cos(x), sin(x)) wegen Satz 2.6.2.2 auf dem Einheitskreis. Daraus gibt sich das gewohnte Bild rechtwinkeligen Dreiecks mit Hypthenusenlänge 1. Lemma 2.6.3. (1) Es ist cos(0) = 1 und cos(2) ≤ −1/3. (2) Für 0 < x ≤ 2 ist sin(x) > 0. (3) Der Cosinus ist streng fallend auf [0, 2]. 2.6. TRIGONOMETRISCHE FUNKTIONEN 53 Beweis. Zunächst ist klar, dass cos(0) = Re(ei0 ) = 1 ist. Die Reihe ∞ X 22k cos(2) = (−1)k (2k)! k=0 erfüllt das Leibnitz-Kriterium 1.16.11, in dessen Notation ist s ≤ a0 − a1 + a2 . Für cos(2) bedeutet das 22 24 2 1 + =1−2+ =− . cos(2) ≤ 1 − 2! 4! 3 3 Für 0 < x ≤ 2 gilt für die Reihe des Sinus s ≥ a0 − a1 , also x3 x2 4 x = x(1 − ) ≥ x(1 − ) = > 0, 6 6 6 3 womit (2) gezeigt ist. Es sei 0 ≤ x1 < x2 ≤ 2, dann ist x2 − x1 x1 + x2 ≤ 2 und 0 < ≤ 2. 0< 2 2 Nach Satz 2.6.2.7 ist x1 + x2 x2 − x1 cos(x2 ) − cos(x1 ) = −2 sin · sin <0 2 | {z } | {z2 } sin(x) ≥ x − >0 >0 und der Cosinus daher fallend. Satz 2.6.4. Es gibt genau ein x0 ∈ [0, 2] mit cos(x0 ) = 0 Beweis. Wegen cos(0) > 0 und cos(2) < 0 und weil cos stetig ist, gibt es nach dem Zwischenwertsatz 2.3.3 ein x0 mit cos(x0 ) = 0. Dass der Cosinus auf [0, 2] keine weitere Nullstelle hat, folgt aus seiner strengen Monotonie. Definition 2.6.5. Wir definieren die Zahl Pi als π = 2x0 , wobei x0 die Nullstelle des Cosinus aus Satz 2.6.4 ist. Nach dieser Definition und nach Lemma 2.6.3 ist π π π cos(x) > 0 für 0 ≤ x < , cos < x ≤ 2. = 0, cos(x) < 0 für 2 2 2 Nach Satz 2.6.2.2 ist cos2 (x) + sin2 (x) = 1 und daher sin π2 = 1. Daher ist π π π π k π π = ik . cos k + i sin k = eik 2 = (ei 2 )k = cos + i sin 2 2 2 2 Für k = 0, 1, 2, 3, 4 erhalten wir die folgende Tabelle 0 π 2 π 3π 2 2π sin(x) 0 cos(x) 1 1 0 0 −1 −1 0 0 1 x Lemma 2.6.6. Für alle x ∈ R gilt Folgendes: (1) Cosinus und Sinus sind periodisch mit Periode 2π. Das heißt, es ist cos(x + 2π) = cos(x) und sin(x + 2π) = sin(x). cos(x + π) = − cos(x) und sin(x + π) = − sin(x), und sin (2) Es ist (3) cos π 2 − x = sin(x) π (4) cos(x) = 0 ⇐⇒ wenn x = sin(x) = 0 ⇐⇒ x = kπ, 2 − x = cos(x), π + kπ und 2 wobei k ∈ Z. 54 2. STETIGKEIT (5) cos(x) − 1 =0 x→0 x lim und sin(x) = 1. x→0 x lim Beweis. Wegen ei2π = i4 = 1 ist cos(x + 2π) = Re(ei(x+2π) ) = Re(eix ei2π ) = Re(eix ) = cos(x), sin(x + 2π) = Im(ei(x+2π) ) = Im(eix ei2π ) = Im(eix ) = sin(x), somit ist (1) gezeigt. Wegen eiπ = i2 = −1 folgt (2) auf gleiche Weise. Aussage (3) folgt aus π ei 2 = i, denn π π π cos − x = Re(ei( 2 −x) ) = Re(ei 2 e−ix ) = Re(i(cos(−x) + i sin(−x))) = 2 sin π 2 Re(i cos(−x) − sin(−x)) = − sin(−x) = sin(x), bzw. π π − x = Im(ei( 2 −x) ) = Im(ei 2 e−ix ) = Im((cos(−x) + i sin(−x))i) = Im(i cos(x) − sin(−x)) = cos(x). Wir wissen, dass der Cosinus auf [0, π2 ) größer als 0 ist. Wegen cos(x) = cos(−x) gilt dies auch für (− π2 , π2 ). Aus cos(x + π) = − cos(x) folgt, dass der Cosinus auf ( π2 , 3π 2 ) kleiner als 0 π π π ] genau die Nullstellen − , und 3 . Wegen der Periodizität ist. Folglich hat er auf [− π2 , 3π 2 2 2 2 folgt die Aussage (4) für den Cosinus. Die Beziehung (3) impliziert nun (4) für den Sinus. Aus i = − 1i und den Definitionen von Cosinus folgt cos(x) − 1 i(cos(x) − 1) cos(x) − 1 = Im = − Im = x x ix ix e −1 cos(x) + i sin(x) − 1 = − Im . − Im ix ix Wenn h gegen 0 strebt, geht letzterer Ausdruck wegen Lemma 2.5.1.5 gegen − Im(1) = 0. Ebenfalls nach Lemma 2.5.1.5 strebt ix sin(x) cos(x) + i sin(x) − 1 e −1 = Re = Re x ix ix gegen Re(1) = 1. Definition 2.6.7. Der Tangens ist die Funktion tan : R \ { π2 + kπ | k ∈ Z} → R mit tan(x) = sin(x) . cos(x) Der Cotangens ist cot : R \ {kπ | k ∈ Z} → R mit cot(x) = cos(x) . sin(x) Tangens und Kotangens sind ungerade Funktionen, das heißt tan(x) = − tan(−x) und cot(x) = − cot(−x), was daraus folgt, dass der Sinus ungerade und der Cosinus gerade ist. Auch die Periodizität überträgt sich von Sinus und Cosinus. Dass cos(x) auf [0, π2 ] streng fallend ist folgt aus Lemma 2.6.3.3, der Sinus ist auf [0, π2 ] streng steigend. Also ist der Tangens auf [0, π2 ) streng steigend, und weil er ungerade ist, auch auf (− π2 , π2 ) streng steigend. Somit ist der Tangens steigend auf den Intervallen (− π2 + kπ, π2 + kπ) für k ∈ Z. Der Cotangens ist fallend auf den Intervallen (kπ, (k + 1)π). Außerdem ist tan((− π2 , π2 )) = R und cot((0, π)) = R wegen des Zwischenwertsatzes 2.3.3 und weil der Nenner an den Randpunkten der Intervalle gegen Null strebt, während die Zähler gegen -1 bzw. 1 streben. Aus dem zuvor Gezeigten ergibt sich der folgende Satz. 2.6. TRIGONOMETRISCHE FUNKTIONEN 55 Satz 2.6.8. (1) Der Cosinus ist streng fallend auf [0, π], cos([0, π]) = [−1, 1], und er besitzt eine streng abnehmende Umkehrfunktion, genannt Arcuscosiuns, arccos : [−1, 1] → [0, π]. (2) Der Sinus ist streng steigend auf [− π2 , π2 ], sin([− π2 , π2 ]) = [−1, 1], und er besitzt eine streng steigende Umkehrfunktion, genannt Arcussiuns, h π πi arcsin : [−1, 1] → − , . 2 2 (3) Der Tangens ist streng steigend auf (− π2 , π2 ), tan((− π2 , π2 )) = R, und er besitzt eine streng steigende Umkehrfunktion, genannt Arcustangens, π π . arctan : R → − , 2 2 2.6.9 (Theoriefrage 58). Wie sind Sinus und Cosinus definiert? Warum ist Cosinus eine gerade und Sinus eine ungerade Funktion? Warum ist cos2 (x) + sin2 (x) = 1 für alle x ∈ R? 2.6.10 (Theoriefrage 59). Formulieren und beweisen Sie die Summenformeln für sin(x + y) und cos(x + y). 2.6.11 (Theoriefrage 60). Zeigen Sie, dass der Cosinus auf [0, 2] nicht mehr als eine Nullstelle hat. 2.6.12 (Theoriefrage 61). Geben Sie eine kurze Begründung für π π cos k + i sin k = ik , 2 2 mit k ∈ Z. Leiten Sie daraus die Werte des Sinus und Cosinus an den Stellen 0, Zeigen Sie, dass Sinus und Cosinus die Periode 2π haben. π 2, π, 3π 2 ab. KAPITEL 3 Differentiation 3.1. Differenzierbarkeit Definition 3.1.1. Es sei D ⊂ R eine Menge ohne isolierter Punkte und f eine Funktion D → R. Für ξ 6= x heißt f (ξ) − f (x) ξ−x Differenzialquotient. Die Funktion f ist differenzierbar in x, wenn der Grenzwert f 0 (x) = lim ξ→x f (ξ) − f (x) ξ−x existiert. Der Wert f 0 (x) heißt Differenzialquotient oder Ableitung von f an der Stelle x. Die Funktion heißt differenzierbar, wenn sie in allen Punkten von D differenzierbar ist. Die Funktion f 0 : D → R heißt Ableitung von f . Die Sekante über dem Intervall [ξ, x] (bzw. [x, ξ]) ist die Gerade durch die Punkte (ξ, f (ξ)) und (x, f (x)). Die Tangente an der Stelle x ist die Gerade im R2 , die durch den Punkt (x, f (x)) geht und die Steigung f 0 (x) hat. Der Differenzenquotient gibt die Steigung der Sekante über dem Intervall [ξ, x] (bzw. [x, ξ]) an. Ableitung von Funktionen, die einen metrischen Raum auf C oder R abbilden, werden auf dieselbe Weise definiert. Wir beschränken uns jedoch hier auf reelle Funktionen. Anders angeschrieben, ist f (x + h) − f (x) . h Wenn eine Funktion f nur durch den Term ihrer Zuordnungsvorschrift gegeben ist, also zum Beispiel y 2 z, und nicht klar ist, welcher Buchstabe die Variable ist, oder f auf Rn mit mehreren Variablen definiert ist, dann macht es Sinn, die Variable in der Ableitung f 0 zu spezifizieren. Man schreibt dann df df bzw. . dy dz Diese Notation ist in der Physik gängig, wo mit den Symbolen dy und dz oft gerechnet wird, als wären es reelle Zahlen, auch wenn dies nicht der Fall ist. f 0 (x) = lim h→0 (1) Für die konstante Funktion f : R → R, f (x) = c ist Beispiel 3.1.2. f (x + h) − f (x) c−c = lim = 0. h→0 h h (2) Wenn f (x) = cxn mit n ∈ N, dann ist ! n n n X c(x + h) − cx 1 n f 0 (x) = lim = c lim hk xn−k − xn = h→ 0 h→ 0 h h k f 0 (x) = lim h→0 k=0 1 0 h c lim h→ n X k=1 n X n k n−k n k−1 n−k h x = c lim h x = h→ 0 k k k=1 57 58 3. DIFFERENTIATION c lim h→ 0 ! n n n−1 X n k−1 n−k n n−1 x + h x =c x = cnxn−1 . 1 k 1 k=2 (3) Für f : R \ {0} → R mit f (x) = 1/x ist f 0 (x) = lim 1 x+h h→0 − h 1 x x − (h + x) −1 1 = lim = − 2. h→0 hx(h + x) h→0 x(h + x) x = lim (4) Aus der Additionseigenschaft der Exponentialfunktion 1.18.2.2 und dem Grenzwert 2.5.1.5 folgt ex+h − ex eh − 1 = ex lim = ex · 1 = ex . h→0 h→0 h h (ex )0 = lim (5) Es ist sin(x + h) − sin(x) h nach Satz 2.6.2.6 und Lemma 2.6.6.5 gleich 2 cos x + h2 sin h2 sin h2 h = cos(x), lim = lim cos x + lim h h→0 h→0 h 2 h→0 2 sin0 (x) = lim h→0 wobei wir bei der Bildung der Limiten Lemma 2.6.6.5 verwendet haben. Für den Cosinus gilt −2 sin(x + h2 ) cos( h2 ) cos(x + h) − cos(x) = lim = h→0 h→0 h h sin h2 h − lim sin x + = − sin(x). lim h h→0 2 h→0 2 cos0 (x) = lim Satz 3.1.3. Ist eine reelle Funktion differenzierbar an einer Stelle, dann ist sie dort auch stetig. Proof. Wenn f differenzierbar in x ist, gilt f (ξ) − f (x) lim (f (ξ) − f (x)) = lim · (ξ − x) = ξ→x ξ→x ξ−x f (ξ) − f (x) lim lim (ξ − x) = f 0 (x) · 0 = 0 ξ→x ξ→x ξ−x und somit limξ→x f (ξ) = limξ→x f (x) bzw. limξ→x f (ξ) = f (x). Daher ist f stetig in x. 3.1.4 (Theoriefrage 62). Wie ist die Differenzierbarkeit einer Funktion an einer Stelle definiert. Bestimmen Sie die Ableitung der Exponentialfunktion und die Ableitung von f mit f (x) = xn , wobei n eine beliebige natürliche Zahl ist. 3.1.5 (Theoriefrage 63). Zeigen Sie, dass eine Funktion, die an einer Stelle differenzierbar ist, dort auch stetig ist. 3.2. Erste Ableitungsregeln Satz 3.2.1. Es seien f und g differenzierbare Funktion D → R, D ∈ R. (1) Für alle c, d ∈ R ist cf + dg differenzierbar und (cf + dg)0 (x) = cf 0 (x) + dg 0 (x). (2) Produktregel: Es ist f · g differenzierbar und (f · g)0 (x) = f 0 (x)g(x) + f (x)g 0 (x) für alle x ∈ D. (3) Quotientenregel: Es sei g(x) 6= 0 für alle x ∈ D, dann ist f /g differenzerbar und 0 f f 0 (x)g(x) − f (x)g 0 (x) (x) = . g g 2 (x) 3.2. ERSTE ABLEITUNGSREGELN Beweis. 59 (1) cf (x + h) + dg(x + h) − (cf (x) + dg(x)) = h cf (x + h) − cf (x) dg(x + h) − dg(x) lim + lim = cf 0 (x) + dg 0 (x) h→0 h→0 h h (cf + dg)0 (x) = lim h→0 (2) (f · g)0 (x) = lim h→0 1 (f (x + h)g(x + h) − f (x)g(x)) = h 1 (f (x + h)(g(x + h) − g(x)) + (f (x + h) − f (x))g(x)) = f (x)g 0 (x) + f 0 (x)g(x), h wobei wir im letzten Schritt limh→0 f (x + h) = f (x) verwenden, was gilt, da f in x stetig ist und die Stetigkeit aus der Differenzierbarkeit folgt, siehe Satz 3.1.3. (3) Es ist 0 1 1 1 g(x) − g(x + h) g(x+h) + g(x) = lim = lim = h→0 h→0 hg(x)g(x + h) g(x) h lim h→0 1 g(x + h) − g(x) g 0 (x) lim =− . h→0 g(x)g(x + h) h→0 h g(x)2 Mit der Produktregel folgt 0 1 g 0 (x) f 0 (x)g(x) − f (x)g 0 (x) 1 = f 0 (x) − f (x) = . f· g g(x) g(x)2 g(x)2 − lim Beispiel 3.2.2. (1) Wenn f : R → R mit f (x) = a0 + a1 x + a2 x2 + . . . + an xn mit beliebigen ai ∈ R, ist f 0 (x) = a1 + 2a2 x + . . . + nan xn−1 . Das folgt aus Beispiel 3.1.2.2 und Satz 3.2.1.1. (2) Für f : R \ {0} → R mit f (x) = 1/xn und n ∈ N ist nach der Quotientenregel Satz 3.2.1.2 1 0 − nxn−1 0 f (x) = = −nx−n−1 . = xn x2n (3) Für den Tangens tan : R \ ( π2 + πZ) → R gilt 0 sin(x) cos(x) cos(x) − sin(x)(− sin(x)) cos2 (x) + sin2 (x) 1 0 (tan x) = = = = , cos(x) cos2 (x) cos2 (x) cos2 (x) wobei wir die Ableitungen von Cosinus und Sinus (siehe Beispiel 3.1.2.5) und die Quotientenregel verwenden. Satz 3.2.3 (Kettenregel). Es sei D ⊂ R, f : D → R und g : f (D) → R. Wenn f in x und g in f (x) differenzierbar ist, dann ist die Zusammensetzung g ◦ f differenzierbar in x und (g ◦ f )0 (x) = g 0 (f (x)) · f 0 (x). Wir hätten gerne einen einfachen Beweis der Form g(f (ξ)) − g(f (x)) f (ξ) − f (x) g(f (ξ)) − g(f (x)) = lim = (g ◦ f )0 (x) = lim ξ→x ξ→x ξ−x f (ξ) − f (x) ξ−x g(f (ξ)) − g(f (x)) f (ξ) − f (x) lim = g 0 (f (x))f 0 (x). ξ→x ξ→x f (ξ) − f (x) ξ−x Leider ist dieser “Beweis” falsch, denn f (ξ)−f (x) könnte gleich 0 sein, zum Beispiel f könnte eine konstante Funktion sein und wir wollen, dass unsere Kettenregel auch für stückweise konstante Funktionen gilt. Für einen korrekten Beweis der Kettenregel benötigen wir ein Hilfsmittel: lim 60 3. DIFFERENTIATION Definition 3.2.4. Die Sekantensteigungsfunktion gx∗ einer in x differenzierbaren reellen Funktion g definieren wir durch ( g(ξ)−g(x) wenn ξ 6= x ∗ ξ−x gx (ξ) = g 0 (x) wenn ξ = x. Beweis von Satz 3.2.3. Wegen g(ξ) − g(x) = gx∗ (ξ)(ξ − x) und limξ→x gx∗ (ξ) = g 0 (x) ist g(f (ξ)) − g(f (x)) g ∗ (f (ξ))(f (ξ) − f (x)) = lim x = ξ→x ξ→x ξ−x ξ−x f (ξ) − f (x) lim gx∗ (f (ξ)) lim = g 0 (f (x))f 0 (x). ξ→x ξ→x ξ−x (g ◦ f )0 (x) = lim R Das Symbol dx, dem wir bei der Integralrechnung in der Form f (x)dx noch begegnen werden, steht für Differenzen, die gegen 0 streben. Diese Notation bezieht sich zuächst nicht auf eine Funktion, sondern auf einen Term, in dem x vorkommt. Dieser Term wird dann in unserem Sinn als Funktion in x aufgefasst. In der Physik wird mit diesen Symbolen oft gerechnet wie mit reellen Zahlen. Für den “Beweis” der Kettenregel würden Physiker zunächst statt der Funktionsbezeichnungen f, g Termbezeichnungen wählen, zum Beispiel z(y(x)), wobei z als Term (Funktion) in y und y als Term (Funktion) in x gesehen wird. Das dx-Rechenkalkül ergibt dann dz dz dy = = z 0 (x), dx dy dx wobei das Symbol dy so weggekürzt wird, als wäre es eine feste reelle Zahl ungleich Null. z 0 (y)y 0 (x) = Definition 3.2.5. Ein Funktion heißt stetig differenzierbar, wenn sie differenzierbar und ihre Ableitung stetig ist. Beispiel 3.2.6. Es sei fn : N → N mit ( xn sin x1 , wenn x 6= 0 fn (x) = 0, wenn x = 0. Für welche n ∈ N ist fn stetig, differenzierbar oder stetig differenzierbar? (1) Für n = 0 ist f0 (x) = sin(1/x) und f0 ist nicht stetig in 0, denn für 1 xk = ist lim xk = 0, k→∞ 2πk + π2 jedoch fk (xk ) = 1 und daher lim f (xk ) = 1 6= 0 = f (0). k→∞ Interessant an diesem Beispiel ist, das der Funktionsgraph bzw. die Funktion (d.h. die Menge aller Punkte (x, f0 (x)) als Teilmenge des R2 topologisch zusammenhängend ist. Das heißt, er lässt sich nicht als Vereinigung zweier offener Mengen darstellen. (2) Für n ≥ 1 ist f1 (x) = xn sin(1/x) und limx→0 fn (x) = 0. Also ist fn in 0 stetig. (3) Der Limes 1 f1 (h) − f1 (0) 1 1 = lim h sin = lim sin lim h→0 h→0 h h→0 h h h existiert nicht, daher ist f1 nicht in 0 nicht differenzierbar. (4) Für n ≥ 2 ist f1 (h) − f1 (0) 1 0 n−1 fn (0) = lim = lim h sin =0 h→0 h→0 h h und somit fn differenzierbar in 0. 3.2. ERSTE ABLEITUNGSREGELN 61 (5) Für n ≥ 2 und x 6= 0 ist 1 1 n−2 = nx sin −x cos . x x Also ist f2 zwar überall differenzierbar aber nicht stetig diffenrenzierbar in 0. Für n ≥ 3 hingegen ist fn auch stetig differenzierbar. fn0 (x) n−1 3.2.7 (Theoriefrage 64). Formulieren und beweisen Sie die Produkt- und die Quotientenregel. Literaturverzeichnis [1] H. Amann, J. Escher, Analysis I. Birkhäuser, 3. Aufl. 2006. [2] H. Heuser, Lehrbuch der Analysis. Teil 1. Vieweg+Teubner, 17. Aufl. 2009. [3] G. Hörmann, D. Langer, Vorlesungsskriptum zur Einf. in die Analysis, Fak. f. Math., Univ. Wien, 2008, neue Fassung Juli 2010. Verfügbar unter www.mat.univie.ac.at/ gue/lehre/08einan/einfanalysis.pdf (2.4.2013) [4] K. Endl, W. Luh, Analysis, Bd. 1, Aula, 9. Aufl. 2008. [5] K. Königsberger, Analysis 1, 6. Aufl. Springer 2004. [6] E. Landau, Grundlagen der Analysis, Akademische Verlagsgesellschaft, Leipzig 1930. Verfügbar unter http://www.cs.ru.nl/ freek/aut/grundlagen-1.0.tar.gz (9.4.2013) [7] C.C. Pugh, Real Mathematical Analysis, Springer 2002. [8] W. Rudin, Analysis, Oldenbourg, 4. Aufl. 2009. [9] W. Rudin, Pinciples of modern Analysis, McGraw-Hill, 1953. [10] W. Rudin, Pinciples of modern Analysis, McGraw-Hill, 3. Aufl. 1976. [11] H. Schichl, R. Steinbauer, Einführung in das mathematische Arbeiten, 2. Auflage, Springer 2012. [12] H. Rinder, Analysis, Skriptum zur Einf. in die Analysis und zu Analysis 1 (teilw.), Fak. f. Math., Univ. Wien, 2012. 63