Analysis 1 Vorlesungsskript Wintersemester 2013/14 Bernd Schmidt∗ Version vom 29. Juli 2014 ∗ Institut für Mathematik, Universität Augsburg, Universitätsstr. 14, 86135 Augsburg, [email protected] 1 Inhaltsverzeichnis Inhaltsverzeichnis 2 1 Einleitung 4 2 Allgemeine Grundlagen 2.1 Aussagen und Beweise . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Mengen und Abbildungen . . . . . . . . . . . . . . . . . . . . . . 2.3 Vollständige Induktion . . . . . . . . . . . . . . . . . . . . . . . . 6 6 14 21 3 Reelle und komplexe Zahlen 3.1 Die Körperaxiome . . . . . . . . 3.2 Die Anordnungsaxiome . . . . . 3.3 Zum Aufbau des Zahlensystems 3.4 Das Vollständigkeitsaxiom . . . 3.5 Die komplexen Zahlen . . . . . . . . . . 28 28 34 39 42 48 . . . . . . 54 54 60 64 66 75 77 . . . . . 83 83 88 91 95 98 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Folgen und Reihen 4.1 Folgen und Grenzwerte . . . . . . . . . . . 4.2 Reelle Folgen und Monotonie . . . . . . . 4.3 Konsequenzen der Vollständigkeit . . . . . 4.4 Reihen . . . . . . . . . . . . . . . . . . . . 4.5 Zur Darstellung der reellen Zahlen . . . . . 4.6 Potenzreihen und die Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . 5 Stetige Funktionen 5.1 Definition und grundlegende Eigenschaften . . 5.2 Stetige Funktionen auf kompakten Intervallen 5.3 Monotonie und Umkehrfunktionen . . . . . . . 5.4 Asympotisches Verhalten . . . . . . . . . . . . 5.5 Trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Differentiation 105 6.1 Definition, Beispiele und Grundlagen . . . . . . . . . . . . . . . . 106 6.2 Der Mittelwertsatz und seine Konsequenzen . . . . . . . . . . . . 113 2 6.3 Monotonie, Extrema und Konvexität . . . . . . . . . . . . . . . . 118 7 Das Integral 126 7.1 Definition des Integrals . . . . . . . . . . . . . . . . . . . . . . . . 126 Literaturverzeichnis 138 3 Kapitel 1 Einleitung Es ist nicht möglich, in einer allgemeingültigen Definition zusammenfassen, was ‘die Mathematik’ für eine Wissenschaft sei. Ausgehend von Untersuchungen der Eigenschaften von Zahlen und geometrischen Figuren, zu denen schon in der Antike bedeutende Beiträge geleistet wurden, hat sie sich mittlerweile zu einem riesigen theoretischen Gebäude aufgebaut, in viele einzelne Gebiete aufgegliedert, und doch wieder Verbindungen zwischen entfernt scheinenden Bereichen aufgezeigt, so dass man nur sehr schwer einen Überblick gewinnen kann. Immer aber geht es darum, Probleme zu lösen, theoretische Fragen durch logisches Schließen absolut zweifelsfrei beantworten zu können. Die Herausforderung und Neugier an ungelösten Fragestellungen waren seit jeher eine der wesentlichen Antriebsfedern zur Beschäftigung und dadurch auch zur Weiterentwicklung der Mathematik. Man denke nur an die Quadratur des Kreises – ein antikes Problem, das doch erst nach Jahrtausenden gelöst werden konnte. Um derartige Fragen beantworten zu können, wurden eigene mathematische Theorien geschaffen, indem eine Vielzahl neuer mathematischer Konstrukte definiert und deren Beziehungen untereinander untersucht wurden. Wie in anderen Wissenschaften, wirft jedoch eine gelöste Frage oft gleich eine Vielzahl weiterer interessanter Fragestellungen auf. In den allermeisten Fällen muss man dabei schon ein Experte sein, um überhaupt vestehen zu können, was diese Fragen denn eigentlich sind. Doch obwohl sich die Mathematik damit innermathematisch immer weiter fortentwickelt und sich in immer abstrakteren Gedankengebilden zu verlieren scheint, kann sie erstaunliche Erfolge in den Anwendungen auf die verschiedensten außermathematischen Wissenschaften vorweisen: von den Naturwissenschaften und der Physik im Besonderen bis zu den Wirtschafts- und Sozialwissenschaften. Die angedeutete Schaffung einer mathematischen Theorie spiegelt sich auch im Aufbau dieser Vorlesung – wie in den meisten Lehrbüchern zur Mathematik – wieder. Überspitzt ausgedrückt folgt der Aufbau dem Schema Definition – Satz – Beweis. In den Definitionen werden die Begriffe, also die mathematischen Konstrukte 4 einer Theorie festgelegt. Ein Satz (auch Lehrsatz oder Theorem) macht dann eine Aussage über die Eigenschaften dieser Konstrukte und die Beziehungen der Begriffe untereinander. Schließlich muss die Gültigkeit dieses Satzes durch einen absolut zwingenden logischen Schluss begründet werde. Natürlich werden wir diesem etwas blutleeren Aufbau durch motivierende Worte etwas Farbe geben, die erklären sollen, warum es interessant ist, gerade diesen oder jenen Begriff näher zu untersuchen. Man darf sich durch diesen in Lehrbüchern üblichen Aufbau nicht bei der eigenen mathematischen Arbeit am Problemlösen verunsichern lassen. Das, was hier in der Vorlesung Analysis 1 vorgestellt wird, ist über viele Jahrhunderte auch in der Effizienz der Darstellung gereift. Beim eigenen Arbeiten an den Hausaufgaben werden Sie merken, dass die ersten Wege zur Lösung meistens nicht geradlinig verlaufen. In der Vorlesung Analysis 1 nun geht es im Wesentlichen um die Differentialund Integralrechnung einer reellen Veränderlichen. Wir untersuchen also Eigenschaften von Funktionen, die einer reellen Zahl wieder eine reelle Zahl zuordnen. Vorkenntnisse: sind (fast) keine nötig. Abitur ist mehr als genug. Literatur: Es gibt viele gute Lehrbücher zur Analysis 1. Sehr empfehlenswert sind die Analysisbücher [Fo] von Forster und [Kö] von Königsberger, deren Aufbau auch dieser Vorlesung zugrunde liegt. Des Weiteren sei hier insbesondere auf die Bücher [Br] von Bröcker, [He] von Heuser (sehr ausführlich), [Hi] von Hildebrandt und [La] von Lang (auf Englisch) verwiesen. Fehler: Bitte teilen Sie mir evtl. Tipp- oder auch andere Fehler in diesem Skript per E-Mail mit. Vielen Dank an alle, die mich auf Fehler in früheren Versionen dieses Skripts aufmerksam gemacht haben, insbesondere an Herrn Gassner, Frau Maucher und Herrn von Seelstrang. 5 Kapitel 2 Allgemeine Grundlagen Wir beginnen damit, einige wichtige Grundlagen zusammenzustellen, die die Basis nicht nur der Analysis sind. Die eigentliche Analysis beginnt dann im Kapitel 3, wenn wir die reellen Zahlen axiomatisch einführen. Schon jetzt werden wir allerdings in etlichen Beispielen Zahlen verwenden (natürliche, ganze, rationale wie auch reelle), die Sie ja aus der Schule kennen. 2.1 Aussagen und Beweise Ein mathematischer Sachverhalt wird durch eine mathematische Aussage formuliert. Dies ist ein Satz, der entweder zutrifft oder nicht und dem man entsprechend den Wahrheitswert ‘wahr’ (w) oder ‘falsch’ (f) zuordnet. Eine Aussage kann jedoch nicht sowohl wahr als auch falsch sein. Beispiele: Diese Sätze sind Aussagen: • Der Lech fließt in die Donau. (w) • Die Donau mündet in die Nordsee. (f) • Eine gerade Quadratzahl ist durch 4 teilbar. (w) √ • 2 ist rational. (f) Die folgenden Sätze sind keine Aussagen: • Hol mir mal ’ne Flasche Bier! • Wie geht es dir? • Dieser Satz ist falsch. In der Mathematik geht es nun darum, (möglichst interessante) mathematische Aussagen zu treffen und mathematisch zu beweisen, dass diese wahr sind. Beweisen bedeutet hierbei, dass die fragliche Aussage durch mathematisch zulässige 6 Schlüsse aus anderen wahren Aussagen hergeleitet wird. Die wesentliche Arbeit der Mathematiker besteht also darin, Folgerungen zu ziehen. Da man damit offensichtlich irgendwo beginnen muss, ist es nötig, einige (möglichst wenige und möglichst grundlegende) Aussagen als wahr zu postulieren. Dies sind die sogenannten Axiome einer mathematischen Theorie. Sind die einmal festgelegt, beginnt die eigentliche Arbeit des Aufdeckens von Zusammenhängen, Formulierens von Vermutungen und Aufsuchens eines mathematischen Beweises. Auch die Suche nach geeigneten Axiomensystemen, also der Auswahl der grundlegenden als wahr postulierten Aussagen, kann ein interessantes mathematisches Problem darstellen. Ein solches System sollte in sich widerspruchsfrei sein, andererseits aber zu einer reichhaltigen Theorie, also vielen beweisbaren Aussagen führen. Dabei hat – zumindest im Prinzip – jede Mathematikerin die Freiheit, ihr eigenes Axiomensystem festzulegen. Tatsächlich haben sich in der Mathematik jedoch gewisse allgemeinverbindliche Axiome durchgesetzt, die von den meisten Mathematikern akzeptiert sind. Es gibt jedoch auch Axiome, wie z.B. das Auswahlaxiom der Mengenlehre, die von einigen Mathematikern gemieden werden. Beide Sichtweisen haben ihre Berechtigung. Ein Leitgedanke bei der Aufsuchung eines geeigneten Axiomensystems sollte es jedoch sein, zentrale Objekte der Mathematik, durch die sich auch Modelle in den Anwendungen etwa in den Natur- oder Wirtschaftswissenschaften untersuchen lassen, einer mathematischen Analyse zugänglich zu machen. Hierbei kann es durchaus vorkommen, dass es sinvoll ist, konkurrierende und miteinander nicht vereinbare Axiomensysteme zu studieren. So gibt es in der ebenen Geometrie z.B. das Parallelenaxiom, das von den übrigen Axiomen Euklids1 unabhängig ist. Es besagt, dass es ‘zu jeder Geraden und jedem Punkt, der nicht auf dieser Geraden liegt, genau eine zu der gegebenen Geraden parallele Gerade durch diesen Punkt gibt’. Alternativ lässt sich das Gegenteil dieser Aussage als wahr postulieren, was zur Nichteuklidischen Geometrie führt. Alle Sätze, die wir in der Mathematik als wahr erkennen, sind also eigentlich nur wahr relativ zu einem ausgewählten Axiomensystem. Kehren wir zurück zu unser Hauptaufgabe, mathematische Sätze zu formulieren und zu beweisen. Ein mathematischer Satz enthält Voraussetzungen und Behauptungen. Er ist wahr, wenn im Falle, dass die Voraussetzungen wahr sind, auch die Behauptungen wahr sind. Beispiel: Ist n eine gerade Quadratzahl, so ist n | durch{z4 teilbar}. {z } | = Behauptung =Voraussetzung Durch logisches Schließen können wir diesen Satz beweisen: Beweis. 1. Ist n eine Quadratzahl, so gibt es eine natürliche Zahl m mit n = m2 . 2. Da n gerade ist, muss auch m gerade sein. Denn für m ungerade, ist auch m2 = m · m ungerade. Wir können also m = 2k für eine natürliche Zahl k schreiben. 1 aus Euklids Elementen 7 3. Dann aber ist n = m2 = (2k)2 = 4k 2 , was zeigt, dass n tatsächlich durch 4 teilbar ist. (Die Box bezeichnet immer das Ende eines Beweises.) Verknüpfungen von Aussagen Mathematische Aussagen können – wie wir eben schon am Beispiel dieses Satzes gesehen haben – verknüpft werden, wodurch eine neue Aussage entsteht. Die wichtigsten Verknüpfungen sind die Folgenden. Hierbei stehen A und B jeweils für eine Aussage und die Wahrheitstafel gibt an, unter welchen Wahrheitswerten für A bzw. B die Verknüpfung wahr oder falsch ist: 1. Die Negation ¬: ¬A, gesprochen ‘Nicht-A’ oder ‘Non-A’. A ¬A w f f w Das heißt: Ist A wahr, so ist ¬A falsch. Ist A falsch, so ist ¬A wahr. 2. Die Konjunktion ∧: A ∧ B, gesprochen ‘A und B’ oder ‘sowohl A als auch B’. A w w f f B w f w f A∧B w f f f Das heißt: A ∧ B ist wahr, wenn sowohl A als auch B wahr sind. In allen anderen Fällen ist A ∧ B falsch. 3. Die (nicht ausschließende) Disjunktion oder Adjunktion ∨: A ∨ B, gesprochen ‘A oder B’. A w w f f B w f w f A∨B w w w f Das heißt: A∨B ist wahr, wenn (mindestens) eine der Aussagen A oder B (ggf. sogar beide) wahr sind. Nur wenn A und B beide falsch sind, ist auch A ∨ B falsch. 4. Die Implikation ⇒: A ⇒ B, gesprochen ‘A impliziert B’ oder ‘Aus A folgt B’ oder ‘Wenn A dann B’ oder ‘B ist eine Konsequenz von A’. A B w w w f f w f f A⇒B w f w w Aus einer wahren Aussage kann wahrheitsgemäß nur eine wahre Aussage folgen. Ist jedoch A falsch, so ist die Implikation A ⇒ B wahr unabhängig vom Wahrheitswert von B. (‘Ex falso quodlibet.’) 8 Gilt A ⇒ B, d.h. ist A ⇒ B eine wahre Aussage, so nennt man A eine hinreichende Bedingung für B und B eine notwendige Bedingung für A. Denn die Wahrheit von A ist ein hinreichender Grund für die Wahrheit von B und umgekehrt muss B wahr sein, damit auch A wahr sein kann. 5. Die Äquivalenz ⇔: A ⇔ B, gesprochen ‘A ist äquivalent zu B’ oder ‘Genau dann B wenn A’. A w w f f B w f w f A⇔B w f f w Die Äquivalenz A ⇔ B ist also wahr, wenn A und B die gleichen Wahrheitswerte besitzen, und anderenfalls falsch. Tautologien und Beweisprinzipien Es gelten die folgenden wichtigen logischen Tautologien, also Aussagen, die unabhängig vom Wahrheitswert der beteiligten Aussagen A, B, C immer wahr sind: Doppelte Verneinung: ¬(¬A) ⇔ A. Beweis. Mit Wahrheitstafel: A ¬A ¬(¬A) ¬(¬A) ⇔ A w f w w f w f w De Morgansche Regeln: Diese beiden Tautologien sind ¬(A ∧ B) ⇔ (¬A ∨ ¬B) und ¬(A ∨ B) ⇔ ¬A ∧ ¬B. Beweis. Wir beweisen nur die erste Regel – wieder mit einer Wahrheitstafel. Der Beweis der zweiten Regel verläuft analog. (Überlegen Sie sich das!) A B A ∧ B ¬(A ∧ B) ¬A ¬B ¬A ∨ ¬B ¬(A∧B) ⇔ (¬A∨¬B) w w w f f f f w w f f w f w w w f w f w w f w w f f f w w w w w Die Wahrheitswerte von ¬(A ∧ B) ⇔ (¬A ∨ ¬B) sind also tatsächlich immer wahr. Beispiel: Ist A die Aussage ‘n ist eine Quadratzahl’, B die Aussage ‘n ist eine gerade Zahl’. Dann ist A ∧ B ‘n ist eine Quadratzahl und n ist eine gerade Zahl’. D.h.: ‘n ist eine gerade Quadratzahl’. Die Negation ¬(A∧B) ist dann ¬A∨¬B ‘n ist nicht gerade oder n ist keine Quadratzahl’. Das bedeutet nicht, dass ‘n weder gerade noch eine Quadratzahl ist’. (Überlegen Sie sich das für den Fall n = 6.) 9 Zur Äquivalenz: (A ⇔ B) ⇔ (A ⇒ B) ∧ (B ⇒ A) . Beweis. Mit Wahrheitstafel: A B A ⇔ B A ⇒ B B ⇒ A (A ⇒ B) ∧ (B ⇒ A) w w w w w w w f f f w f f w f w f f f f w w w w Die Wahrheitswerte der dritten und der sechsten Spalte sind identisch. Daher gilt (A ⇔ B) ⇔ (A ⇒ B) ∧ (B ⇒ A) . Die Äquivalenz bedeutet also, dass sowohl A B impliziert als auch B A. Wird in einem mathematischen Satz die Äquivalenz von zwei Aussagen A und B behauptet, so kann man dies nachweisen, indem man A ⇒ B und B ⇒ A beweist. Transitivität der Implikation: (A ⇒ B) ∧ (B ⇒ C) ⇒ (A ⇒ C). Beweis. Mit Wahrheitstafel, wobei wir die zu beweisende Tautologie mit (∗) abkürzen. A B C A ⇒ B B ⇒ C (A ⇒ B) ∧ (B ⇒ C) A ⇒ C (∗) w w w w w w w w w w f w f f f w w f w f w f w w w f f f w f f w f w w w w w w w f w f w f f w w f f w w w w w w f f f w w w w w Wenn aus A B und aus B C folgt, so impliziert A C. Insbesondere dürfen wir in Beweisen schrittweise schließen: Um C aus A zu folgern, können wir zunächst von A auf eine andere (Hilfs-)Aussage B und von dieser dann auf C schließen. Dieses Vorgehen kann man natürlich wiederholt anwenden und eine ganze Kette von (Hilfs-)Aussagen B1 , . . . , Bn einführen, für die sich A ⇒ B1 , B1 ⇒ B2 , . . . , Bn−1 ⇒ Bn sowie Bn ⇒ C zeigen lässt und damit A ⇒ C. Einen Beweis nach diesem Schema nennt man auch einen direkten Beweis. Kontraposition: (A ⇒ B) ⇔ (¬B ⇒ ¬A). Beweis. Mit Wahrheitstafel: A B A ⇒ B ¬A ¬B ¬B ⇒ ¬A w w w f f w w f f f w f f w w w f w f f w w w w 10 Die Wahrheitswerte der dritten und der sechsten Spalte sind identisch. Diese Tautologie liegt dem Beweisprinzip der Kontraposition zugrunde. Um zu zeigen, dass aus A B folgt, kann man nachweisen, dass aus Nicht-B Nicht-A folgt. M.a.W.: Man nehme an, dass B falsch ist und zeige dann, dass auch A falsch ist. Beispiel: Dieses Prinzip haben wir oben schon angewandt: Aus n gerade und n = m2 für eine natürliche Zahl m folgt, dass auch m gerade ist. Beweis. Durch Kontraposition: Ist m ist nicht gerade, also von der Form m = 2k−1 für eine natürlich Zahl k. Dann ist auch n = m2 = (2k−1)2 = 4k 2 −4k+1 = 2(2k 2 − 2k) + 1 nicht gerade. Prinzip des Widerspruchsbeweises: (A ⇒ B) ⇔ ¬(A ∧ ¬B). Beweis. Mit Wahrheitstafel: A B A ⇒ B ¬B A ∧ ¬B ¬(A ∧ ¬B) w w w f f w w f f w w f f w w f f w f f w w f w Die Wahrheitswerte der dritten und der sechsten Spalte sind identisch. Diese Äquivalenz liegt dem Prinzip des Widerspruchsbeweises zugrunde: Um B aus A zu folgern, kann man wie folgt vorgehen. Man findet eine Aussage C, so dass sich C sowie deren Gegenteil ¬C aus der Annahme, dass A wahr und B falsch ist, ableiten lassen, d.h. man weist nach, dass sowohl (A ∧ ¬B) ⇒ C als auch (A ∧ ¬B) ⇒ ¬C gelten: Man konstruiert einen Widerspruch. Damit ist dann A ⇒ B gezeigt. Es gilt nämlich, wobei man streng genommen auch die ersten beiden der folgenden Schritte wieder mit Wahrheitstafeln begründen müsste, (A ∧ ¬B) ⇒ C ∧ (A ∧ ¬B) ⇒ ¬C ⇔ (A ∧ ¬B) ⇒ (C ∧ ¬C) ⇔ ¬(A ∧ ¬B) ⇔ (A ⇒ B) (s.o.). Die zweite Äquivalenz ergibt sich hier daraus, dass Implikation mit der immer falschen Folgerung C ∧¬C genau dann wahr ist, wenn die Prämisse A∧¬B falsch ist. √ Beispiel: 2 ist irrational. (Wie oben schon erwähnt ist auch dieser Satz eigentlich als eine Folgerung aus gewissen Grundannahmen in der Mathematik zu verstehen.) √ √ Beweis. Widerspruchsannahme: 2 ist rational, etwa 2 = pq mit p ∈ Z und √ q ∈ N. Wegen 2 > 0√ist dann sogar p ∈ N. Indem wir diesen Bruch vollständig kürzen, erhalten wir 2 = rs mit natürlichen Zahlen r und s. Dabei gilt: 11 r ist ungerade oder s ist ungerade. √ Multiplikation mit s und anschließendes Quadrieren der Gleichung 2 = rs liefert 2s2 = r2 . Aus früheren Überlegungen (s.o.) wissen wir, dass dann r gerade und r2 sogar durch 4 teilbar ist, etwa r2 = 4t. Dann aber folgt s2 = 2t, weshalb auch s2 und damit auch s selbst gerade ist. D.h.: r ist gerade und s ist gerade. Widerspruch! Quantoren und quantifizierte Aussagen In der Mathematik werden oft Sätze, die von gewissen Variablen x, y, z, . . . aus gewissen Mengen abhängen, untersucht. Ein solcher Satz A(x, y, x, . . .) ist selbst keine Aussage. Er wird erst dann zu einer Aussage, wenn man die Variablen quantifiziert. Die wichtigsten Quantoren, die dies leisten, sind der Allquantor ∀ ‘für alle’ und der Existenzquantor ∃ ‘es existiert/gibt ein’. Für einen Satz A(x) kann man dann etwa die Aussagen • ∀ x : A(x), d.h. ‘Für alle x gilt A(x)’, und • ∃ x : A(x), d.h. ‘Es existiert ein x, so dass A(x) gilt’, bilden. ‘Es existiert ein x’ ist hier im Sinne von ‘Es existiert mindestens ein x’ zu verstehen. Möchte man ausdrücken, dass es genau ein x gibt (also nicht zwei oder mehr), so schreibt man ∃!. Beispiele: 1. Ist A(x) der Satz x > 7, wobei x eine Variable aus der Menge der reellen Zahlen ist, so ergeben sich die folgenden Aussagen. ∀ x : x > 7: ‘Für alle x gilt x > 7’. (Offensichtlich falsch.) Sowie ∃ x > 7: ‘Es existiert ein x mit x > 7’. (Offensichtlich wahr.) 2. Ist A(x) der Satz x2 = 2, wobei x eine Variable aus der Menge der reellen (oder rationalen) Zahlen ist, so ist ∃ x : A(x) eine wahre (bzw. falsche) Aussage. 3. Es sei A(x, y) der Satz x < y mit reellen Zahlen x, y. Durch Quantifizierung erhält man z.B. ∀ x ∃ y : x < y. In Worten: Für alle x gibt es ein y, so dass x < y gilt. Dies ist ein wahrer Satz, denn man kann y = x + 1 wählen. Man kann aber etwa auch den Satz ∃ y ∀ x : x < y bilden. In Worten: Es existiert ein y, so dass für alle x gilt x < y. Dieser Satz ist falsch, wie das Gegenbeispiel y = x zeigt. 12 Das letzte Beispiel zeigt, dass es wichtig ist, die Reihenfolge der Quantoren zu beachten. Insbesondere darf die Reihenfolge verschiedener Quantoren nicht vertauscht werden. Ist A(x, y) der Satz: Am Tag x esse ich zu Mittag gerne y, wobei x einen Tag im Oktober und y etwas zu essen bezeichnet, so ist • ∀ x ∃ y : A(x, y): ‘An jedem Tag des Oktobers esse ich zu Mittag gerne etwas’ eine wahre Aussage, • ∃ y ∀x : A(x, y): ‘Es gibt etwas, das ich an jedem Tag im Oktober gern zu Mittag esse’ falsch. (Teilen Sie diese Erkenntnis doch mit dem Studentenwerk.) Zulässig ist es jedoch, die Reihenfolge zweier aufeinanderfolgender Allquantoren sowie die Reihenfolge zweier aufeinanderfolgender Existenzquantoren zu vertauschen, d.h. es gelten ∀ x ∀ y : A(x, y) ⇔ ∀ y ∀ x : A(x, y) und ∃ x ∃ y : A(x, y) ⇔ ∃ y ∃ x : A(x, y). Die Negation einer Aussage mit Quantoren ist ganz einfach: Es ist ¬∀ x : A(x) ⇔ ∃ x : ¬A(x) und ¬∃ x : A(x) ⇔ ∀ x : ¬A(x). Das Gegenteil von ‘Für alle x gilt A(x)’ ist ‘Es gibt ein x, für das A(x) nicht gilt’. Das Gegenteil von ‘Es gibt ein x, für das A(x) gilt’ ist ‘Für alle x gilt A(x) nicht’. Man kann also die Negation ¬ an einem Quantor ‘vorbeiziehen’, wobei ∀ zu ∃ bzw. ∃ zu ∀ wird. Damit lassen sich auch Aussagen mit mehreren Quantoren leicht negieren, indem man (sukzessive) ¬ von links nach rechts schiebt und die Quantoren auswechselt. Beispiele: 1. Die Negation von ‘An jedem Tag des Oktobers esse ich zu Mittag gerne etwas’ lautet ‘Es gibt einen Tag im Oktober, an dem ich nicht gerne zu Mittag esse’. 2. Bezeichnet x, y reelle Zahlen, so ist ¬∃ y ∀ x : x < y ⇔ ∀ y ∃x : ¬x < y ⇔ ∀ y ∃x : x ≥ y. 3. Es ist ¬∀ x ∃ y ∀ z : A(x, y, z) ⇔ ∃ x ∀ y ∃ z : ¬A(x, y, z). 4. Das Gegenteil von 13 ‘Für jede positive rationale Zahl x und jede natürlich Zahl n gibt es eine rationale Zahl y mit x = y n ’ (was falsch ist) lautet ‘Es gibt eine rationale Zahl x und eine natürliche Zahl n, so dass für alle rationalen Zahlen y gilt x 6= y n ’ (richtig, setze z.B. x = 2, n = 2). Übung: Betrachten Sie den Satz A(x, y, z): ‘Am Tag x versteht der Student y in der Analysisvorlesung z’, wobei z die Worte des Dozenten bezeichnet. Formulieren Sie alle möglichen Quantifizierungen durch ∀ und ∃ und deren Negation umgangssprachlich. 2.2 Mengen und Abbildungen Die Mengenlehre ist die Grundlage der modernen Mathematik. So lassen sich die Begriffe, die wir insbesondere in der Analysis untersuchen, letztlich auf Begriffe der Mengenlehre zurückführen. Das heute allgemein anerkannte Axiomensystem der Mengenlehre geht auf Zermolo und Fraenkel zurück. Eine sorgfältige Untersuchung dieses Systems und seiner Konsequenzen muss jedoch einer eigenen Vorlesung vorbehalten bleiben. Für die Zwecke der Analysis genügt es, eine Vorstellung vom Begriff der Menge zu haben und einige Operationen, die man mit Mengen durchführen kann, zu erläutern. Nach Cantor ist eine Menge eine “Zusammenfassung von bestimmten, wohlunterschiedenen Objekten unserer Anschauung oder unseres Denkens (welche ‘Elemente der Menge’ genannt werden) zu einem Ganzen.” Dieser Begriff ist nicht unproblematisch, wie wir gleich noch sehen werden, genügt als Leitfaden für alle Zwecke der Analysis 1-3 jedoch vollauf. Für eine Menge M schreiben wir • x ∈ M , wenn x ein Element von M ist (man sagt auch x liege in M ) und • x∈ / M , wenn x kein Element von M ist (wenn x nicht in M liegt). Gilt für zwei Mengen M, N die Implikation x ∈ N ⇒ x ∈ M , so heißt N eine Teilmenge von M , geschrieben N ⊂ M . (Manchmal schreibt man hierfür auch N ⊆ M .) Gilt N ⊂ M und gibt es mindestens ein Element, das in M aber nicht in N liegt, so nennen wir N eine echte Teilmenge von M und schreiben dafür auch N ( M . Zwei Mengen, die kein Element gemein haben, nennt man disjunkt. 14 Zwei Mengen sind gleich, wenn sie dieselben Elemente besitzen: M = N heißt M ⊂ N und N ⊂ M , m.a.W.: x ∈ M ⇔ x ∈ N . So ist z.B. {3, 19, 8, 2013, 3} = {8, 19, 8, 8, 2013, 3} = {3, 8, 19, 2013}. Üblicherweise schreibt man jedoch jedes Element nur einmal. Es gibt auch eine Menge, die gar keine Elemente enthält: Die leere Menge ∅. Sie ist Teilmenge jeder Menge. Besitzt eine Menge M nur endlich viele Elemente, etwa x1 , x2 , . . . , xn , so lässt sich M durch Aufzählen als M = {x1 , x2 , . . . , xn } schreiben. Auch für gewisse unendliche Mengen ist das möglich, wie etwa {2, 4, 6, 8, . . .}, wenn durch die Pünktchen ‘. . . ’ klar ist, wie es weitergeht. Meistens beschreibt man Mengen durch eine die Elemente charakterisierende Eigenschaft als Teilmenge einer anderen Menge in der Form N = {x ∈ M : A(x)}, was heißt x ∈ N ⇔ (x ∈ M ∧ A(x)). Hier ist A(x) eine Aussage, die in Abhängigkeit von x ∈ M wahr oder falsch sein kann. Wir schreiben Mengen bisweilen auch einfach als {x : A(x)} mit einer definierenden Eigenschaft A(x), wenn es sich versteht, welche x hier zu betrachten sind. Aus der Schule sollten Ihnen auch die folgenden unendlich großen Mengen von Zahlen in Erinnerung sein: • N = {1, 2, 3, . . .} (die natürliche Zahlen) sowie N0 = {0, 1, 2, 3, . . .} (die natürliche Zahlen mit 0), • Z = {. . . , −2, −1, 0, 1, 2, . . .} (die ganzen Zahlen), • Q = { pq : p ∈ Z, q ∈ N} (die rationalen Zahlen) und • die reellen Zahlen R. Mengenoperationen Durch Mengenoperationen lassen sich aus Mengen neue Mengen konstruieren. Im Folgenden seien M, N Mengen. • Der Schnitt (oder auch Durchschnitt) von M und N ist M ∩ N = {x : x ∈ M ∧ x ∈ N }, also x ∈ M ∩ N ⇔ (x ∈ M ∧ x ∈ N ). 15 Beispiele: 1. {n ∈ N : n ist Primzahl} ∩ {n ∈ N : n ≤ 10} = {2, 3, 5, 7}. 2. Zwei Mengen M und N sind genau dann disjunkt, wenn M ∩ N = ∅ ist. • Die Vereinigung von M und N ist M ∪ N = {x : x ∈ M ∨ x ∈ N }. Beispiel: {1, 3, 5, . . .} ∪ {2, 4, 6, . . .} = N. • Die Differenz von M und N ist M \ N = {x : x ∈ M ∧ x ∈ / N }. Beispiel: R \ {x ∈ R : x > 0} = {x ∈ R : x ≤ 0}. • Das kartesische Produkt von M und N ist M × N = {(x, y) : x ∈ M ∧ y ∈ N }. Hierbei ist (x, y) ein geordnetes Paar: Es gilt (x, y) = (x0 , y 0 ) ⇔ (x = x0 ∧ y = y 0 ). • Die Potenzmenge von M ist die Menge aller Teilmengen von M : P(M ) = {U : U ⊂ M }. Beispiel: P({1, 2, 3}) = ∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3} . Das letzte Beispiel zeigt, dass die Elemente von Mengen selbst Mengen sein dürfen. An dieser Stelle ist ein Wort der Vorsicht angebracht. A priori ist es nicht ausgeschlossen, dass eine Menge sogar sich selbst als Element enthält. Wir werden so etwas nicht zulassen. Die uneingeschränkte Bildung von Mengen nach der Cantorschen Definition würde dazu führen, dass man etwa auch ‘die Menge aller Mengen’ M betrachten könnte, also M = {M : M ist Menge}. Dann aber könnten wir auch die folgende Teilmenge konstruieren: N = {M ∈ M : M ∈ / M }. Gilt nun N ∈ N ? Falls ja, so ist N ∈ / N . Ist andererseits N ∈ / N , so müsste doch N ∈ N sein. Widerspruch! Dies ist die Russelsche Antinomie in der Mengenlehre, 16 die die Mathematik zu Beginn des letzten Jahrhunderts in eine Grundlagenkrise gestürzt hat. In dieser Vorlesung werden wir solche problematischen Mengen allerdings gar nicht betrachten. Oft ist es nötig, den Schnitt bzw. die Vereinigung mehrerer, eventuell sogar unendlich vieler Mengen zu bilden. Ist I eine beliebige Menge und ist für jedes i ∈ I eine Menge Mi gegeben, so defniert man den Durchschnitt und die Vereinigung der Mi durch \ [ Mi = {x : ∀ i ∈ I : x ∈ Mi }, Mi = {x : ∃ i ∈ I : x ∈ Mi }. i∈I i∈I In diesem Zusammenhang, wenn mehrere mathematische Objekte (hier Mengen) durch eine Menge I indiziert werden, nennt man I auch eine Indexmenge. Für den Umgang mit ∩ und ∪ gelten die folgenden Rechenregeln. Im Folgenden seien L, M, N Mengen. • Kommutativgesetze: M ∩N =N ∩M und M ∪ N = N ∪ M. • Assoziativgesetze: (L ∩ M ) ∩ N = L ∩ (M ∩ N ) und (L ∪ M ) ∪ N = L ∪ (M ∪ N ), weshalb man die Klammern auch gleich ganz weglassen darf. • Distributivgesetze: L ∩ (M ∪ N ) = (L ∩ M ) ∪ (L ∩ N ) und L ∪ (M ∩ N ) = (L ∪ M ) ∩ (L ∪ N ). • De Morgansche Gesetze: (L \ M ) ∩ (L \ N ) = L \ (M ∪ N ) und (L \ M ) ∪ (L \ N ) = L \ (M ∩ N ). Beweis. Wir beweisen exemplarisch das zweite Distributivgesetz: x ∈ L ∪ (M ∩ N ) ⇔ x ∈ L ∨ x ∈ M ∩ N ⇔ x ∈ L ∨ (x ∈ M ∧ x ∈ N ) ⇔ (x ∈ L ∨ x ∈ M ) ∧ (x ∈ L ∨ x ∈ N ) ⇔ (x ∈ L ∪ M ) ∧ (x ∈ L ∪ N ) ⇔ x ∈ (L ∪ M ) ∩ (L ∪ N ). (s.u.) Hier haben wir im dritten Schritt das Distributivgesetz A ∨ (B ∧ C) ⇔ (A ∨ B) ∧ (A ∨ C) ausgenutzt, das man mit einer Wahrheitstafel zeigen kann. (Übung!) 17 Funktionen Eine Funktion oder Abbildung f von einer Menge M in eine Menge N ordnet jedem Element von M genau ein Element von N zu. Man schreibt f : M → N und bezeichnet das x ∈ M zugeordnete Element aus N mit f (x), was man auch als x 7→ f (x) notiert. Man nennt M den Definitionsbereich von f und N den Bildbereich oder Wertebereich von f . Ist M = {x1 , . . . , xn } endlich, so lässt sich eine Funktion durch eine vollständige Liste der Funktionswerte f (x1 ), . . . , f (xn ) angeben. Im Allgemeinen wird eine Funktion jedoch durch eine Funktionsvorschrift gegeben sein, die f (x) durch einen Ausdruck in x definiert. Eine Funktion f : M → N heißt • injektiv, wenn es zu jedem y ∈ N höchstens ein x ∈ M mit f (x) = y gibt, d.h.: ∀ x ∈ M ∀ x0 ∈ M : f (x) = f (x0 ) ⇒ x = x0 , • surjektiv, wenn es zu jedem y ∈ N mindestens ein x ∈ M mit f (x) = y gibt, d.h.: ∀ y ∈ N ∃ x ∈ M : y = f (x), und • bijektiv, wenn es zu jedem y ∈ N genau ein x ∈ M mit f (x) = y gibt, d.h. wenn f sowohl injektiv als auch surjektiv ist. Beispiele: 1. f : N → N, f (x) = x + 1 ist injektiv aber nicht surjektiv. 2. f : Z → Z, f (x) = x + 1 ist bijektiv. 3. f : R → R, f (x) = x3 − x ist surjektiv aber nicht injektiv. 4. f : R → R, x 7→ sin x ist weder injektiv noch surjektiv. 5. f : Q → Q, x 7→ x3 ist injektiv aber nicht surjektiv. 6. f : R → R, x 7→ x3 ist bijektiv. Der Begriff der Bijektivität, also der ‘eineindeutigen Zuordnung’ gestattet es insbeondere, die Größe von Mengen zu vergleichen. Wir sagen, dass die Mengen M und N gleichmächtig sind, wenn es eine Bijektion (d.h. eine bijektive Abbildung) von M nach N gibt. Endliche Mengen sind diejenigen, die gleichmächtig zu einer Menge {1, 2, . . . , n} für ein n ∈ N sind (und dann gerade n Elemente haben). Ist eine Menge M gleichmächtig zur Menge der natürlichen Zahlen N, so nennt man M abzählbar. Eine Menge, die weder endlich noch abzählbar ist, heißt überabzählbar. 18 Beispiele: 1. {1, 2, 3, 4, 5, 6, 7, 8} und {2, 3, 5, 7, 11, 13, 17, 19} sind gleichmächtig, wie die Abbildung 1 7→ 2, 2 7→ 3, . . . , 8 7→ 19 zeigt. 2. N0 ist abzählbar, denn f : N → N0 , f (n) = n − 1 ist eine Bijektion. 3. Auch N und Z sind gleichmächtig, denn die Wertetabelle x f (x) 1 2 0 1 3 4 5 6 7 ··· −1 2 −2 3 −3 · · · definiert eine Bijektion f : N → Z. S 4. Die Vereinigung n∈N Mn abzählbar vieler abzählbarer Mengen M1 , M2 , . . . ist wieder abzählbar. Dies lässt sich mit dem ‘ersten Cantorschen Diagonalverfahren’ zeigen. Wir bezeichnen die Elemente S der i-ten Menge Mi mit xi1 , xi2 , xi3 , . . .. Dann lassen sich alle Elemnte aus n∈N Mn abzählen, indem man sie auf die folgende Weise anordnet und der Reihe nach abzählt, wobei man diejenigen xij überspringt, die nicht zum ersten Mal in dieser Reihe auftreten. (Gewisse Elemente können ja in mehreren Mi liegen.) x11 x12 ↓ % x21 x22 . x31 x32 ↓ % x41 x42 .. .. . . → x13 x14 . % x23 x24 % . x33 x34 . x43 x44 .. .. . . → x15 · · · . ··· ··· ··· .. . 5. Q ist abzählbar, wie man mit Hilfe des vorigen Beispiels aus der Darstellung [ Q= { pq : p ∈ Z} q∈N erkennt. 6. Für keine Menge M gibt es eine surjektive Abbildung f : M → P(M ). Wir zeigen dies durch einen Widerspruchsbeweis und nehmen an, dass M eine Menge und f : M → P(M ) surjektiv ist. Es sei N = {x ∈ M : x ∈ / f (x)} ∈ P(M ). 19 Da f surjektiv ist, gibt es ein x0 ∈ M mit f (x0 ) = N . Ist nun x0 ∈ N , so gilt x0 ∈ / f (x0 ) = N . Ist andererseits x0 ∈ / N = f (x0 ), so folgt x0 ∈ N . Das ergibt den Widerspruch x0 ∈ / N ∧ x0 ∈ N . Insbesondere ist P(M ) für jede unendliche Menge sogar überabzählbar. Ist f : M → N eine Funktion von M nach N , so nennen wir für U ⊂ M f (U ) = {f (x) : x ∈ U } = {y ∈ N : ∃ x ∈ U mit y = f (x)} das Bild von U unter f . Für V ⊂ N heißt f −1 (V ) = {x ∈ M : f (x) ∈ V } das Urbild von V unter f . Für U, U 0 ⊂ M und V, V 0 ⊂ N gelten die folgenden Regeln: f (U ∪ U 0 ) = f (U ) ∪ f (U 0 ), f −1 (V ∩ V 0 ) = f −1 (V ) ∩ f −1 (V 0 ), f −1 (V ∪ V 0 ) = f −1 (V ) ∪ f −1 (V 0 ). Im Allgemeinen ist jedoch f (U ∩ U 0 ) = f (U ) ∩ f (U 0 ) falsch. Übung: Beweisen Sie diese Aussagen! Eine wichtige Operation ist die Verkettung von Funktionen. Sind L, M, N Mengen und f : L → M , g : M → N Funktionen, so ist die Verkettung (oder Komposition) von f und g die Funktion g ◦ f : L → N, g ◦ f (x) = g(f (x)). Sie entsteht, indem man zunächst f und auf das Ergebnis dann g anwendet. Beispiel: Sind f, g : R → R gegeben durch f (x) = x2 und g(x) = sin x, so sind g ◦ f : R → R und f ◦ g : R → R gegeben durch g ◦ f (x) = sin(x2 ) und f ◦ g(x) = (sin x)2 . Die Verkettung erfüllt das Assoziativgesetz: Sind f : K → L, g : L → M und h : M → N Funktionen, so gilt (h ◦ g) ◦ f = h ◦ (g ◦ f ). Denn für alle x ∈ K gilt (h ◦ g) ◦ f (x) = (h ◦ g)(f (x)) = h(g(f (x))) = h((g ◦ f )(x)) = h ◦ (g ◦ f ) (x). 20 2.3 Vollständige Induktion Die vollständige Induktion ist ein besonders wichtiges Beweisprinzip, um Aussagen über natürliche Zahlen zu beweisen. Tatsächlich lässt sich dieses Prinzip direkt aus einem geeigneten Axiomensystem für die natürlichen Zahlen gewinnen, was wir hier aber nicht weiterverfolgen wollen. Ist A(n) ein Satz, der für jede Wahl einer Zahl n ∈ N0 zu einer (wahren oder falschen) Aussage wird, so betrachtet man oft die Aussage ‘Für alle n ∈ N0 gilt A(n)’, in Formeln: ∀ n ∈ N0 : A(n). Manchmal interessiert man sich auch nur dafür, ob A(n) ab einem bestimmten n0 ∈ N0 gilt, also ‘Für alle n ≥ n0 gilt A(n)’, d.h. ∀ n ≥ n0 : A(n), wobei die letzte Formel abkürzend für ∀ n ∈ {m ∈ N0 : m ≥ n0 } : A(n) steht. Das Beweisprinzip der vollständigen Induktion besagt nun, dass es, um ∀ n ≥ n0 : A(n) zu beweisen, genügt nachzuweisen, dass (i) A(n0 ) wahr ist (Induktionsanfang) sowie (ii) für jedes n ≥ n0 die Gültigkeit von A(n) die Gültigkeit von A(n + 1) impliziert. (M.a.W.: ∀ n ≥ n0 : A(n) ⇒ A(n + 1).) (Induktionsschritt). Anstelle A(n) gleich für beliebiges n zu beweisen, schränkt man sich also zunächst einmal auf den ersten Fall n = n0 ein. Zweitens darf man, um A(n + 1) für beliebiges n ≥ n0 nachzuweisen, annehmen, dass A(n) (die Induktionsvoraussetzung) schon als wahr erkannt ist. Dass die fragliche Behauptung hiermit gezeigt ist, erklärt sich so: Zunächst gilt A(n0 ) nach (i). Wendet man dann (ii) auf den Fall n = n0 an, so erhält man, dass auch A(n0 + 1) wahr ist. Nun kann man (ii) auf n = n0 + 1 anwenden und erkennt die Gültigkeit von A(n + 2). Indem man diesen Prozess wiederholt und (ii) immer wieder auf das nächstgrößere n anwendet, folgt schließlich A(n) für alle n ≥ n0 . Man kann sich das wie beim Umwerfen einer Reihe von Dominosteinen (nummeriert durch 0, 1, 2, . . .) vorstellen. Wenn Sie feststellen wollen, ob alle Steine ab dem n0 -ten fallen, so genügt es, zwei Dinge zu wissen: (i) Der n0 -te Stein fällt. (ii) Wenn der n-te Stein fällt, so fällt auch sein Nachfolger mit der Nummer n + 1. Ähnlich wie eben sieht man ein, dass sich die Bedingung (ii) abschwächen lässt zu 21 (ii’) ∀ n ≥ n0 : (A(n0 ) ∧ . . . ∧ A(n)) ⇒ A(n + 1). Man darf also, um A(n + 1) zu zeigen, annehmen, dass all die Behauptungen A(n0 ), . . . , A(n) erfüllt sind. Wir werden nun einige Sätze mit diesem Prinzip beweisen. Zunächst führen dazu noch die folgenden abkürzenden Notationen ein: Sind m ≤ n ganze Zahlen und ist für jedes ganze k mit m ≤ k ≤ n eine reelle Zahl ak gegeben, so setzen wir n X ak = am + am+1 + . . . + an , n Y sowie k=m ak = am · am+1 · . . . · an . k=m (Sprich: Die Summe/das Produkt der ak von m bis n.) Ist m = n + 1, so ist es bisweilen nützlich, für die leere Summe und das leere Produkt n X ak = 0, bzw. n Y ak = 1 k=m k=m zu setzen. Das Produkt der ersten n natürlichen Zahlen nennt man n! (sprich: n-Fakultät): n Y k. n! = 1 · 2 · . . . · n = k=1 Satz 2.1 Für alle n ∈ N gilt n X k=1 k= n(n + 1) . 2 Beweis. Mit vollständiger Induktion. Induktionsanfang: Die Behauptung ist richtig für n = 1, denn es ist 1 X 1(1 + 1) k=1= . 2 k=1 Induktionsschritt: Wir nehmen an, dass die Behauptung für ein n richtig ist, also n X n(n + 1) k= 2 k=1 22 für dieses n gilt. Daraus folgt dann n+1 X k= k=1 n X k + (n + 1) k=1 n(n + 1) + (n + 1) 2 n(n + 1) + 2(n + 1) = 2 (n + 1)(n + 2) , = 2 (nach Induktionsvoraussetzung) = also die Behauptung für n + 1. Satz 2.2 (Die geometrische Summenformel) Es sei q ∈ R \ {1}. Für alle n ∈ N0 gilt n X 1 − q n+1 qk = . 1−q k=0 Beweis. Mit vollständiger Induktion. Induktionsanfang: Die Behauptung ist richtig für n = 0, denn 0 X 1−q . q0 = 1 = 1 − q k=0 (q 0 ist immer 1, nach Konvention sogar für q = 0.) Induktionsschritt: Die Behauptung sei wahr für n. Dann folgt n+1 X k q = k=0 n X q k + q n+1 k=0 1 − q n+1 + q n+1 (nach Induktionsvoraussetzung) 1−q 1 − q n+1 + q n+1 − q n+2 = 1−q n+2 1−q = , 1−q = was gerade die Behauptung für n + 1 ist. Satz 2.3 Es gibt unendlich viele Primzahlen. Dem Beweis schicken wir ein Lemma, also einen Hilfssatz voraus: Lemma 2.4 Jede natürliche Zahl n ≥ 2 ist durch eine Primzahl teilbar. 23 Beweis. Mit vollständiger Induktion. Induktionsanfang: 2 ist eine Primzahl und natürlich durch sich selbst teilbar. Induktionsschritt (gemäß (ii’)): Die Behauptung sei für alle 2 ≤ k ≤ n bereits etabliert. Entweder ist dann n + 1 selbst eine Primzahl, woraus die Behauptung für n + 1 sofort folgt. Oder es ist n + 1 = km mit 2 ≤ k, m ≤ n. Nach Induktionsvoraussetzung gibt es eine Primzahl, die m teilt und damit auch n + 1 = km. Beweis von Satz 2.3. Widerspruchsannahme: Es gibt nur endlich viele Primzahlen, etwa p1 , . . . , pn . Dann aber ist die natürliche Zahl N =1+ n Y pk k=1 durch keine der Primzahlen p1 , . . . , pn teilbar. (Immer bleibt der Rest 1.) Dies widerspricht dem vorigen Lemma. Satz 2.5 Die Anzahl der möglichen Anordnungen einer Menge mit n ∈ N Elementen ist n!. Erster Beweis. Es gibt n Möglichkeiten, dass erste Element auszuwählen, n − 1 Möglichkeiten, dass zweite Element auszuwählen, n − 2 für das dritte u.s.w. Schließlich hat man noch zwei Auswahlmöglichkeiten für das vorletzte und nur eine einzige für das letzte Element. Dies führt zu n · (n − 1) · (n − 2) · . . . 2 · 1 = n! möglichen Anordnungen. Wir haben hier – wie auch schon zuvor mit Pünktchen ‘. . . ’– durch ‘und so weiter’ angedeutet, dass es klar ist (oder sein sollte), wie das Verfahren Schritt für Schritt weitergeht. Ganz formal lässt sich dieses Vorgehen mit Hilfe eines Beweises durch vollständige Induktion begründen. Zweiter Beweis. Mit vollständiger Induktion. Induktionsanfang: Für n = 1 ist dies klar, da man eine einelementige Menge nur auf eine Weise anordnen kann und 1! = 1 ist. Induktionsschritt: Die Behauptung sei für n-elementige Mengen bewiesen. Ist nun M = {x1 , . . . , xn+1 } eine (n + 1)-elementige Menge, so kann man die möglichen Anordnungen von M in n + 1 Klassen K1 , . . . , Kn+1 aufteilen, wobei die Anordnungen der Klasse Kk dadurch charaketrisiert seien, dass sie an der ersten Stelle das Element xk haben. In jeder Klasse Kk liegen dann so viele Anordnungen, wie es Möglichkeiten gibt, wie verbleibenden n Elemente anzuordnen, also nach Voraussetzung gerade n!. Insgesamt gibt es also (n + 1)n! = (n + 1)! 24 Anordnungen von M . Eine bijektive Abbildung f : M → M einer Menge in sich nennt man auch eine Permutation von M . Da jede Anordnung (xi1 , xi2 , . . . , xin ) der Elemente von M = {x1 , . . . , xn } durch f (x1 ) = xi1 , . . . , f (xn ) = xin eine Permutation f : M → M definiert und umgekehrt jeder Permutation f : M → M eine Anordnung (f (x1 ), . . . , f (xn )) entspricht, erhalten wir: Korollar 2.6 Die Anzahl der Permutationen auf einer n-elementigen Menge ist n!. (Ein Korollar ist ein Satz, der – mehr oder weniger – unmittelbar aus einem anderen Ergebnis folgt.) Beweis. Klar nach Satz 2.5 Definition 2.7 Für n, k ∈ N0 definieren wir den Binomialkoeffizienten n n · (n − 1) · . . . · (n − k + 1) := k 1 · 2 · ... · k = k Y n−i+1 i=1 i ! . Es ist dann ( 0 n = n! k = k!(n−k)! n n−k für k > n, für k ≤ n. (Mit dem Zeichen := wird ausgedrückt, dass die linke Seite der Gleichung durch die rechte Seite definiert wird.) Der Name Binomialkoeffizient rührt daher, dass diese Zahlen als Koeffizienten im Binomischen Lehrsatz, einer Verallgemeinerung der binomischen Formel auf höhere Exponenten, auftreten, s. Satz 2.9. Diese Zahlen haben auch in der Kombinatorik eine wichtige Bedeutung: nk ist die Anzahl der k-elementigen Teilmengen einer n-elementigen Menge.2 Denn zunächst gibt es n · (n − 1) · . . . · (n − k + 1) Möglichkeiten, k Elemente unter Berücksichtigung der Reihenfolge aus n Elementen auszuwählen3 : n Möglichkeiten für die erste Wahl, dann n − 1 für die zweite u.s.w. Für das zuletzt gewählte Element bleiben noch (n−k+1) Auswahlmöglichkeiten. Nach Satz 2.5 entspricht nun jede k-Elementige Teilmenge genau k! dieser Auswahlen, so das sich Teilmengen tatsächlich für die Anzahl der k-elementigen n·(n−1)·...·(n−k+1) n n = k ergibt. Insbesondere ist k immer eine ganze Zahl. k! 2 Dies kennen Sie vielleicht noch aus der Schule unter dem Namen ‘Kombination ohne Zurücklegen’. In einer Menge kommt es ja nicht auf die Reihenfolge der Elemente an. 3 Dies kennen Sie vielleicht unter dem Namen ‘Variation ohne Zurücklegen’. 25 Lemma 2.8 Für k, n ∈ N0 gilt n n n+1 = + . k+1 k k+1 Beweis. Für k = n ist die Behauptung 1 = 1 + 0, für k > n lautet sie 0 + 0 = 0, was beides offensichtlich richtig ist. Für die übrigen Fälle k < n kann man wie folgt schließen: n n n! n! + = + k k+1 k!(n − k)! (k + 1)!(n − k − 1)! n!(k + 1) n!(n − k) = + (k + 1)!(n − k)! (k + 1)!(n − k)! n!(k + 1 + n − k) = (k + 1)!(n − k)! n+1 (n + 1)! = . = k+1 (k + 1)!(n − k)! Die Werte der Binomialkoeffizienten lassen sich im Pascalschen Dreieck anordnen: 1 1 1 1 1 1 . 1 2 3 4 1 3 6 5 10 1 4 10 1 5 .. 1 .. . Dabei findet man nk in der n-ten Zeile an der k-ten Position (wobei die Zählung n n bei 0 beginnt). Ganz außen steht wegen 0 = n immer 1. Nach Lemma 2.8 ergeben sich die anderen Einträge als Summe der beiden (schräg) darüber befindlichen Werte. Satz 2.9 (Binomischer Lehrsatz) Für n ∈ N0 und reelle Zahlen x, y gilt n X n k n−k x y . (x + y) = k k=0 n Beweis. Mit vollständiger Induktion. Der Fall n = 0 ist klar, denn 0 0 0 0 X n k n−k (x + y) = 1 = xy = x y . 0 k k=0 0 26 Ist der Satz für ein n ∈ N0 bereits gezeigt, so ergibt sich (x + y)n+1 = (x + y)(x + y)n n X n k n−k = (x + y) x y k k=0 n n X X n k n−k n k n−k =x x y +y x y k k k=0 k=0 n n X X n k+1 n−k n k n−k+1 = x y + x y k k k=0 k=0 n+1 n X X n n k n−k+1 k n−k+1 = x y + x y k−1 k k=1 k=0 n X n 0 n+1 n n n n+1 0 k n−k+1 = + x y + x y + xy k−1 k n 0 k=1 n X n + 1 k n+1−k n + 1 n+1 0 n + 1 0 n+1 = x y + x y + xy k n + 1 0 k=1 n+1 X n + 1 = xk y n+1−k , k k=0 wobei wir im siebten Schritt Lemma 2.8 und die Identitäten nn = 1 = sowie n0 = 1 = n+1 benutzt haben. 0 Bemerkung. Speziell für x = y = 1 führt dieser Satz auf die Formel n+1 n+1 n X n k n−k x y = 2n . k k=0 Insbesondere besitzt eine n-elementige Menge genau 2n Teilmengen. (Was Sie sich auch direkt überlegen können.) 27 Kapitel 3 Reelle und komplexe Zahlen Wir beginnen die eigentliche Analysis nun damit, die grundlegenden Objekte durch eine ganze Reihe von Axiomen einzuführen: die reellen Zahlen. Dabei werden wir die natürlichen, die ganzen sowie die rationalen Zahlen als Teilmengen der reellen Zahlen wiedergewinnen. Schließlich werden wir den Zahlbereich auf die sogennnten komplexen Zahlen ausdehnen. Das grundlegende Axiom der reellen Zahlen lautet: Axiom. Es gibt eine Menge, fortan mit R bezeichnet, die den Körperaxiomen, den Anordnungsaxiomen und dem Vollständigkeitsaxiom genügt. Diese Begriffe werden nun gleich in den folgenden Kapiteln erklärt. Kurz sagt man auch: R ist ein vollständiger angeordneter Körper. Die Elemente von R heißen reelle Zahlen. 3.1 Die Körperaxiome Die Menge der reellen Zahlen R ist eine Menge auf der zwei innere Verknüpfungen gegeben sind: Die Addition R × R → R, (x, y) 7→ x + y und die Multiplikation R × R → R, (x, y) 7→ x · y (kurz: x · y = xy). Diese genügen den folgenden Regeln: • Axiome der Addition: (A1) Assoziativgesetz: ∀ x, y, z ∈ R: x + (y + z) = (x + y) + z. 28 (A2) Kommutativgesetz: ∀ x, y ∈ R: x + y = y + x. (A3) Existenz eines additiv neutralen Elements: Es gibt eine Zahl 0 ∈ R (die Null), so dass für alle x ∈ R gilt x + 0 = x. (A4) Existenz eines additiv inversen Elements: Zu jedem x ∈ R gibt es ein −x ∈ R (das Negative von x) mit x + (−x) = 0. • Axiome der Multiplikation: (M1) Assoziativgesetz: ∀ x, y, z ∈ R: x(yz) = (xy)z. (M2) Kommutativgesetz: ∀ x, y ∈ R: xy = yx. (M3) Existenz eines multiplikativ neutralen Elements: Es gibt eine Zahl 1 ∈ R (die Eins), so dass für alle x ∈ R gilt x · 1 = x. (M4) Existenz eines multiplikativ inversen Elements: Zu jedem x ∈ R \ {0} gibt es ein x−1 ∈ R (schlicht das Inverse von x) mit xx−1 = 1. • Über den Zusammenhang von + und ·: (N) Für die neutralen Elemente gilt 0 6= 1. (D) Distributivgesetz: ∀ x, y, z ∈ R: x(y + z) = (xy) + (xz). Beachten Sie, dass −x und x−1 lediglich Bezeichnungen für das additiv bzw. multiplikativ Inverse einer Zahl x sind. Weder haben wir bislang die Subtraktion noch Potenzen eingeführt. Die Klammern geben an, in welcher Reihenfolge die inneren Verknüpfungen auszuführen sind. Wie üblich vereinbaren wir dabei die 29 ‘Punkt-vor-Strich-Regel’, so dass wir etwa (xy) + (xz) auch einfach als xy + xz schreiben können. Des Weiteren setzen wir abkürzend x x − y := x + (−y) und := x/y := xy −1 . y für x, y ∈ R. (Hierdurch werden nun tatsächlich innere Verknüpfungen auf R bzw. R \ {0} definiert, denn wie wir gleich sehen werden sind −y und y −1 durch y eindeutig gegeben.) Bemerkung. Man nennt diese Regeln die Körperaxiome. Jede Menge, auf der zwei innere Verknüpfungen + und · definiert sind, die diesen Axiomen genügen, nennt man einen Körper. So ist etwa auch Q ein Körper. Eine wichtige Konsequenz aus diesen Axiomen ist, dass wir elementare Gleichungen lösen können: Satz 3.1 Es seien a, b ∈ R. (i) Die Gleichung a + x = b hat eine eindeutige Lösung. (Nämlich x = b − a.) (ii) Ist a 6= 0, so hat auch die Gleichung ax = b hat eine eindeutige Lösung. (Nämlich x = a−1 b.) Beweis. (i) Tatsächlich ist x = b − a eine Lösung, denn (A2) a + (b − a) = a + (b + (−a)) = a + ((−a) + b) (A1) (A4) (A2) (A3) = (a + (−a)) + b = 0 + b = b + 0 = b. Es bleibt, die Eindeutigkeit zu begründen. Dazu zeigen wir, dass beliebige Lösungen x1 , x2 gleich sein müssen: a + x1 = b = a + x2 ⇒ a + x1 = a + x2 ⇒ (−a) + (a + x1 ) = (−a) + (a + x2 ) (A1) ⇒ ((−a) + a) + x1 = ((−a) + a) + x2 (A2) ⇒ (a + (−a)) + x1 = (a + (−a)) + x2 (A4) ⇒ 0 + x1 = 0 + x2 (A2) ⇒ x1 + 0 = x2 + 0 (A3) ⇒ x1 = x2 . 30 (ii) Der Beweis verläuft völlig analog zu (i). Man muss nur ‘+’ durch ‘·’, ‘−a’ durcg ‘a−1 ’ und ‘0’ durch ‘1’ ersetzen und entsprechend die Axiome (M1)–(M4) verwenden. Korollar 3.2 (i) Eindeutigkeit der neutralen Elemente: Die Zahlen 0 und 1 sind durch ihre Eigenschaften eindeutig festgelegt. (ii) Eindeutigkeit der additiven und multiplikativen Inversen: Für jedes a ∈ R ist −a und für jedes a ∈ R \ {0} ist a−1 eindeutig festgelegt. Beweis. (i) Ist c eine beliebige Zahl (6= 0), so gilt nach Satz 3.1(i) c+x=c ⇒ x=0 bzw. c · x = c ⇒ x = 1. (ii) Nach Satz 3.1(ii) haben die Gleichungen a+x=0 bzw. a·x=1 für a ∈ R bzw. a ∈ R \ {0} eine eindeutige Lösung. Aus den Körperaxiomen folgen alle Rechenregeln der vier Grundrechenarten. Wir nennen hier exemplarisch die Folgenden. Satz 3.3 Für reelle Zahlen x, y gilt: (i) −(−x) = x, (ii) −(x + y) = −x − y, (iii) x · 0 = 0, (iv) (−x)y = −(xy) = x(−y), (v) (x−1 )−1 = x (wenn x 6= 0), (vi) (xy)−1 = x−1 y −1 (wenn x, y 6= 0), (vii) xy = 0 ⇔ x = 0 ∨ y = 0. Beweis. (i) Nach (A4) und (A2) gilt −x + (−(−x)) = 0 und − x + x = 0. Aus der Eindeutigkeit des Negativen von −x folgt daher −(−x) = x. (ii) Aus (A1)–(A4) folgt x + y + (−x − y) = x + y + ((−y) + (−x)) = x + (y + (−y)) + (−x) = x + 0 + (−x) = x + (−x) = 0 31 und damit −x − y = −(x + y) aus der Eindeutigkeit des Negativen von x + y. (iii) Nach (A3) und (D) ist x · 0 = x(0 + 0) = x · 0 + x · 0. Mit Satz 3.1(i) ergibt sich daraus x · 0 = x · 0 − x · 0 = 0. (iv) Nach (D), (A4), und (iii) ist xy + x(−y) = x(y − y) = x · 0 = 0, also x(−y) = −xy. Angewandt auf x und y mit vertauschten Rollen folgt dann auch (−x)y = y(−x) = −(yx) = −(xy), wobei wir (M2) benutzt haben. (v) Das folgt analog zu (i). (vi) Das folgt analog zu (ii). (vii) ‘⇐’: Nach (iii) (und (M2)) ist x · 0 = 0 · y = 0. ‘⇒’: Ist x = 0, so ist nichts zu beweisen. Ist dagegen x 6= 0, so folgt aus xy = 0 mit (M2), (M3), (M4), (M1) und (iii) y = 1 · y = (x−1 x)y = x−1 (xy) = x−1 · 0 = 0. Bemerkung. All diese Regeln gelten in einem beliebigen Körper. Ein exotischeres Beispiel für einen Körper – und der kleinstmögliche mit nur zwei Elementen – ist die Menge {0, 1}, wenn die Addition und die Multiplikation gegeben sind durch 0 + 0 = 0, 0 · 0 = 0, 0 + 1 = 1, 0 · 1 = 0, 1 + 0 = 1, 1 · 0 = 0, 1 + 1 = 0, 1 · 1 = 1. Wiederholte Anwendung des Assoziativgesetzes (Induktion!) zeigt, dass jede mögliche Klammerung in endlichen Summen oder Produkten zum gleichen Ergebnis führt, so dass man die Klammern auch ganz weglassen kann. Das haben wir schon oben ausgenutzt, indem wir n X ak = am + am+1 + . . . + an und k=m n Y ak = am · am+1 · . . . · an k=m für am , . . . , an ∈ R geschrieben haben. Wiederholte Anwendung des Kommutativgesetzes zeigt, dass für jede Umordnung (Permutation) (k0 , k1 , . . . , kn−m ) von (m, m + 1, . . . , n) gilt n X k=m ak = n−m X aki sowie i=0 n Y k=m 32 ak = n−m Y i=0 aki . Für Doppelsummen und -produkte mit Zahlen aij , m ≤ i ≤ n, m0 ≤ j ≤ n0 ist daher 0 n X n X i=m 0 aij = j=m0 n X n X j=m0 0 aij n Y n Y sowie i=m i=m 0 aij = j=m0 n Y n Y j=m0 aij . i=m Hier wird die Summe bzw. das Prdukt aller aij gebildet. Da es auf die Reihenfolge nicht ankommt schreibt man dies auch als X Y aij bzw. aij . m≤i≤n m0 ≤j≤n0 m≤i≤n m0 ≤j≤n0 Durch wiederholte Anwendung des Distributivgesetzes schließlich ergibt sich für Zahlen am , . . . , an und bm0 , . . . , bn0 X n n0 X X ai bj = ai b j . i=m j=m0 m≤i≤n m0 ≤j≤n0 Wir definieren hier noch die ganzzahligen Potenzen: Definition 3.4 Für x ∈ R und n ∈ N setzt man x0 := 1, xn := x . . · x} | · .{z (eigtl. per Induktion: xn+1 := xn x), n-mal x−n := (x−1 )n , falls x 6= 0. Es gelten dann die folgenden Rechenregeln: Satz 3.5 Für n, m ∈ Z und x, y ∈ R (ungleich 0, wenn der entsprechende Exponent negativ ist) ist (i) xn xm = xn+m , (ii) (xn )m = xnm , (iii) xn y n = (xy)n . Beweis. Übung! 33 3.2 Die Anordnungsaxiome Mit reellen Zahlen lässt sich nicht nur rechnen, man kann sie auch der Größe nach vergleichen. Dies wird in den Anordnungsaxiomen formalisiert: In R gibt es eine Menge R+ ⊂ R, deren Elemente positive Zahlen heißen, mit den folgenden Eigenschaften: (O1) Trichotomie: Für jedes x ∈ R gilt genau eine der folgenden Aussagen: x ∈ R+ , −x ∈ R+ . x = 0, (O2) Verträglichkeit mit der Addition: Für x, y ∈ R+ ist auch x + y ∈ R+ . (O3) Verträglichkeit mit der Multiplikation: Für x, y ∈ R+ ist auch xy ∈ R+ . Statt x ∈ R+ schreiben wir auch x > 0 (sprich: ‘x ist größer als 0’). Gilt −x ∈ R+ , so sagen wir, x sei negativ. Allgemeiner setzen wir dann für x, y ∈ R: x>y x≥y x<y x≤y :⇔ :⇔ :⇔ :⇔ x − y > 0, x > y ∨ x = y, y > x, y≥x (sprich: (sprich: (sprich: (sprich: x x x x größer y) größer/gleich y) kleiner y) kleiner/gleich y). Bemerkung. Ein Körper, der den Anordnungsaxiomen (O1), (O2) und (O3) genügt, heißt angeordneter Körper. Auch Q ist ein solcher. Beachte: Nach (O1) ist für x 6= y immer entweder x > y oder x < y, denn entweder ist x − y > 0 oder −(x − y) = y − x > 0. Es gelten die folgenden Regeln für die Manipulation von Ungleichungen. Satz 3.6 (i) Für reelle Zahlen x, y, x0 , y 0 gilt x>y x≥y x<y x≤y ∧ ∧ ∧ ∧ x0 x0 x0 x0 ≥ y0 ≥ y0 ≤ y0 ≤ y0 x + x0 x + x0 x + x0 x + x0 ⇒ ⇒ ⇒ ⇒ > y + y0, ≥ y + y0, < y + y0, ≤ y + y0. (ii) Für x, y, z ∈ R gilt x>y x≥y x>y x≥y ∧ ∧ ∧ ∧ z z z z >0 >0 <0 <0 ⇒ ⇒ ⇒ ⇒ xz xz xz xz > yz, ≥ yz, < yz, ≤ yz. Entsprechende Aussagen gelten für x < y bzw. x ≤ y. 34 (iii) Für x, y ∈ R gilt x≥0 ∨ y≥0 xy > 0 ⇒ ⇔ xy ≥ 0, (x > 0 ∧ y > 0) ∨ (x < 0 ∧ y < 0). (iv) Für alle x ∈ R ist x2 ≥ 0. Insbesondere ist 1 > 0. (v) Für x ∈ R \ {0} ist x>0 ⇔ x−1 > 0. (vi) Für reelle x, y gilt ⇒ x>y>0 x−1 < y −1 . Beweis. (i) Wir zeigen nur die beiden ersten Implikationen: x > y ∧ x0 ≥ y 0 ⇒ x − y > 0 ∧ x0 − y 0 > 0 ∨ x0 = y 0 ⇒ x − y > 0 ∧ x0 − y 0 > 0 ∨ x − y > 0 ∨ x0 = y 0 (O2) ⇒ x − y + x0 − y 0 > 0 | {z } | {z } ∈R+ ∈R+ ∪{0} ⇒ x + x0 > y + y 0 und x ≥ y ∧ x0 ≥ y 0 ⇒ (O2) ⇒ x − y > 0 ∨ x = y ∧ x0 − y 0 > 0 ∨ x0 = y 0 x − y + x0 − y 0 > 0 ∨ x = y ∧ x 0 = y ⇒ x + x0 ≥ y + y 0 . Die anderen beiden Implikationen folgen daraus und der Definition von < und ≤ unmittelbar. (ii) Es genügt, die erste und die dritte Implikation zu beweisen. Die anderen ergeben sich daraus direkt, da dann nur noch der Fall x = y zu betrachten bleibt. Sie folgen aus x>y∧z >0 ⇒ x−y >0∧z >0 (O3) ⇒ xz − yz = (x − y)z > 0 ⇒ xz > yz 35 bzw. x > y ∧ z < 0 ⇒ x − y > 0 ∧ −z > 0 (O3) ⇒ yz − xz = (x − y)(−z) > 0 ⇒ yz > xz. (iii) Für x, y > 0 ist nach (O3) auch xy > 0. Für x > 0 und y < 0 ist wegen (O3) −xy = x(−y) > 0 und damit xy < 0. Genauso folgt aus x < 0 und y > 0 auch xy < 0. Sind x, y beide negativ, so folgt wieder mit (O3) xy = (−x)(−y) > 0. Nach Satz 3.3(vii) ist außerdem xy = 0 ⇔ x = 0 ∨ y = 0. Aus all dem folgen die Behauptungen. (iv) Dies folgt aus (iii) mit x = y und 1 = 12 , da nach Axiom (N) 1 6= 0 ist. (v) Nach (iv) ist xx−1 = 1 > 0. Nach (iii) sind daher x und x−1 beide positiv oder beide negativ. (vi) Nach (v) und (O3) ist x−1 y −1 > 0. Mit Hilfe von (ii) für z = x−1 y −1 folgt dann y −1 = xx−1 y −1 > yx−1 y −1 = x−1 . Die Beziehungen ≥ und ≤ definieren eine Ordnungsrelation auf R. Wir formulieren dies im folgenden Satz nur für ≥. Entsprechende Regeln gelten dann aber (offensichtlich!) auch für ≤. Satz 3.7 Für alle x, y, z ∈ R gelten: (i) Reflexivität: x ≥ x, (ii) Antisymmetrie: x ≥ y ∧ y ≥ x ⇒ x = y, (iii) Transitivität: x ≥ y ∧ y ≥ z ⇒ x ≥ z. Beweis. (i) Klar. (ii) Durch Kontraposition: Wie oben bemerkt gilt x 6= y ⇒ x < y ∨ x > y. (iii) Aus Satz 3.6 folgt x ≥ y ∧ y ≥ z ⇒ x + y ≥ y + z ⇒ x = x + y − y ≥ y + z − y = z. Da für zwei Zahlen x, y immer x ≥ y oder y ≥ x (genauso für ≤) gilt, nennt man dies auch eine totale Ordnung. Wir halten fest: Für den Umgang mit den Relationen >, <, ≥ und ≤ gelten die Ihnen aus der Schule bekannten Regeln. Wir haben sie nun auf eine feste axiomatische Grundlage gelegt. 36 Definition 3.8 Der Absolutbetrag (oder Betrag) einer Zahl x ist ( x, x ≥ 0, |x| = −x, x < 0. Satz 3.9 (i) Für alle x ∈ R gilt |x| ≥ 0 |x| = 0 ⇔ x = 0. sowie (ii) Für alle x ∈ R gilt | − x| = |x| |x−1 | = |x|−1 (falls x 6= 0). sowie (iii) Für alle x, y ∈ R ist |xy| = |x| |y|. (iv) Dreiecksungleichung1 : Für alle x, y ∈ R ist |x + y| ≤ |x| + |y|. (v) Umgekehrte Dreiecksungleichung: Für alle x, y ∈ R ist |x − y| ≥ |x| − |y|. Beweis. (i) Klar. (ii) Für x > 0 ist −x < 0 also | − x| = −(−x) = x > 0. Für x ≤ 0 ist −x ≥ 0 also auch | − x| = −x ≥ 0. Für x > 0 ist nach Satz 3.6(v) auch x−1 > 0 also |x−1 | = x−1 > 0. Für x < 0 ist nach Satz 3.6(v) auch x−1 < 0 also |x−1 | = −x−1 > 0. (iii) Die Behauptung ist nach (i) klar für x = 0 ∨ y = 0. Für x 6= 0, y 6= 0 gilt nach Satz 3.6(iii) xy = |xy|, falls x > 0, y > 0, (−x)y = −xy = |xy|, falls x < 0, y > 0, |x| |y| = x(−y) = −xy = |xy|, falls x > 0, y < 0, (−x)(−y) = xy = |xy|, falls x < 0, y < 0. (iv) Wegen x ≤ |x|, y ≤ |y|, −x ≤ |x| und −y ≤ |y| ist x + y ≤ |x| + |y| sowie − (x + y) = −x − y ≤ |x| + |y|. Dann aber muss auch |x + y| ≤ |x| + |y| 1 Woher der Name kommt, wird im Abschnitt 3.5 klar werden. 37 gelten. (v) Wendet man die Dreiecksungleichung auf x − y und y an, so folgt |x − y| = |x − y| + |y| − |y| ≥ |x − y + y| − |y| = |x| − |y|, Indem man die Rollen von x und y vertauscht, ergibt sich auch |x − y| = |y − x| ≥ |y| − |x| = −(|x| − |y|). Mit diesen beiden Abschätzungen ist dann aber |x − y| ≥ |x| − |y|. Für x, y ∈ R ist ( x − y, falls x ≥ y, . |x − y| = y − x, falls y ≥ x, Man nennt |x − y| daher auch den Abstand von x zu y. In der Analysis sind Abschätzungen, also Ungleichungen besonders wichtig. Wir werden im Laufe des Vorlesungszyklus einige nützliche Ungleichungen beweisen. Erste Beispiele geben die beiden folgenden Sätze. Satz 3.10 (Die Bernoullische Ungleichung) Für alle n ∈ N0 und x ∈ R mit x ≥ −1 gilt (1 + x)n ≥ 1 + nx. Beweis. Mit Induktion: Der Fall n = 0 ist klar. Ist die Behauptung für n gezeigt, so ergibt sich wegen 1 + x ≥ 0 (1 + x)n+1 = (1 + x)n (1 + x) ≥ (1 + nx)(1 + x) = 1 + nx + x + nx2 ≥ 1 + (n + 1)x. Satz 3.11 Für das arithmetische Mittel x+y 2 x<y ⇒ x< zweier reeller Zahlen x, y gilt x+y < y. 2 Beweis. Dies folgt aus x= x x x y y y + < + < + = y. 2 2 2 2 2 2 Zum Schluss dieses Abschnitts führen wir noch eine spezielle Klasse von Teilmengen in R ein: Die Intervalle. 38 Definition 3.12 Für a, b ∈ R mit a < b (bzw. a ≤ b im vierten Fall) setzt man: (a, b) := {x ∈ R : a < x < b}, [a, b) := {x ∈ R : a ≤ x < b}, (a, b] := {x ∈ R : a < x ≤ b}, [a, b] := {x ∈ R : a ≤ x ≤ b}, (−∞, b) := {x ∈ R : x < b}, (−∞, b] := {x ∈ R : x ≤ b}, (a, ∞) := {x ∈ R : a < x}, [a, ∞) := {x ∈ R : a ≤ x}, (−∞, ∞) := R. Man nennt diese Mengen Intervalle. In den ersten vier Fällen sagt man, die Intervalle seien endlich; die übrigen sind unendlich. Die Intervalle (a, b), (−∞, b), (a, ∞) nennt man offen, [a, b), (a, b] sind halboffen, [a, b], (−∞, b], [a, ∞) heißen abgeschlossen, (−∞, ∞) ist sowohl offen als auch abgeschlossen.2 Die Länge der endlichen Intervalle ist definiert als |(a, b)| = |[a, b)| = |(a, b]| = |[a, b]| = b − a. Beispiel. Für x ∈ R und r ∈ R+ ist {y ∈ R : |y − x| < r} = (x − r, x + r). Überlegen Sie sich das! 3.3 Zum Aufbau des Zahlensystems Bisher haben wir mit den Mengen N, Z, Q und – zumindest vor Kapitel 3 – auch mit R ‘naiv’, also wie aus der Schule bekannt gerechnet. Wir wollen diese Zahlbereiche nun auf eine gefestigte axiomatische Grundlage stellen, wobei nur die bisher eingeführten Axiome von R verwendet werden. Sie müssen also für diesen Abschnitt zunächst vergessen, was die natürlichen, ganzen und rationalen Zahlen sind und was wir über diese Zahlen schon bewiesen haben. Wir definieren diese Zahlbereiche dann hier als gewisse Teilmengen von R. Die Regeln für das Rechnen und Anordnen übertragen sich direkt auf diese Mengen. Insbesondere werden wir aus den Axiomen für R das Induktionsprinzip für N ableiten. Mit diesem Wissen können sie dann noch einmal zurückblättern, sich wieder an alles erinnern und feststellen, dass sich auch die schon früher gezeigten Aussagen aus den Axiomen für R beweisen lassen. 2 Die Begriffe offen und abgeschlossen werden später noch für viel allgemeinere Mengen definiert werden. 39 Definition 3.13 Eine Menge M ⊂ R heißt induktiv, wenn gilt: (i) 1 ∈ M und (ii) a ∈ M ⇒ a + 1 ∈ M . Beispiel. R, R+ , {x ∈ R : x ≥ 1} sind induktiv. LemmaT3.14 Ist (Mi )i∈I eine Familie von induktiven Mengen, so ist auch der Schnitt i∈I Mi induktiv. T T Beweis. Wegen 1 ∈ Mi für alle i ∈ I gilt auch 1 ∈ i∈I Mi . Ist a ∈ i∈I Mi , so gilt a ∈ TMi für jedes i und somit auch a + 1 ∈ Mi für jedes i, also in der Tat a + 1 ∈ i∈I Mi . Definition 3.15 Die Menge N der natürlichen Zahlen ist \ M. N := M induktiv D.h.: N ist der Durchschnitt aller induktiven Mengen in R und also Teilmenge einer jeden induktiven Menge. Nach dem vorigen Lemma ist N selbst induktiv. Das Induktionsprinzip lässt sich nun so formulieren: Satz 3.16 (Induktionsprinzip) Ist M ⊂ N induktiv, so gilt M = N. Direkt aus den obigen Beispielen sieht man, dass N ⊂ R+ ist, so dass natürliche Zahlen positiv sind, und dass sogar N ⊂ {x ∈ R : x ≥ 1} gilt. 1 ist also die kleinste natürliche Zahl. Um eine Aussage A(n) für natürlich Zahlen zu beweisen, setzt man dann einfach M = {n ∈ N : A(n) stimmt}. (Um eine Aussage der Form ∀ n ≥ n0 : A(n) zu beweisen, betrachtet man M = {n ∈ N : n < n0 ∨ (n ≥ n0 ∧ A(n))}.) Beweis von Satz 3.16. Nach Voraussetzung ist M ⊂ N. Da M induktiv ist, gilt aber auch N ⊂ M . Es folgt M = N. Die Summen- und Produktbildung führt nicht aus N hinaus: Satz 3.17 Die Summe m + n und das Produkt mn zweier natürlicher Zahlen m, n ist wieder eine natürliche Zahl. Man sagt auch, N sei bezüglich + und · abgeschlossen. Beweis. 1. Summen: Ist n ∈ N gegeben, so betrachten wir M = {m ∈ N : n+m ∈ N}. Da N induktiv ist und somit n + 1 ∈ N ist, gilt 1 ∈ M . Aus demselben Grund folgt m ∈ M ⇒ n + m ∈ N ⇒ n + m + 1 ∈ N ⇒ m + 1 ∈ M. M ⊂ N ist also induktiv, d.h. M = N. 40 2. Produkte: Es sei für festes n ∈ N nun M = {m ∈ N : nm ∈ N}. Offenbar ist 1 ∈ M . Da – wie schon gezeigt – Summen nicht aus N hinausführen, ist zudem m ∈ M ⇒ nm ∈ N ⇒ n(m + 1) = nm + n ∈ N ⇒ m + 1 ∈ M. Dies zeigt M = N. Dass N tatsächlich so beschaffen ist, wie wir das gewohnt sind, und sich der Größe nach anordnen lässt durch 1 < 2 := 1 + 1 < 3 := 1 + 1 + 1 + . . . , wird im folgenden Satz präzisiert. Satz 3.18 Für alle n ∈ N gilt: Es gibt kein m ∈ N mit n < m < n + 1. Beweis. Wir zeigen dies, indem wir nachweisen, dass M = {n ∈ N : Es gibt kein m ∈ N mit n < m < n + 1} induktiv ist. 1. Die Menge M1 = {1} ∪ {x ∈ R : x ≥ 2 = 1 + 1} ist induktiv: Offenbar gilt 1 ∈ M1 . Ist x ∈ M1 , so ist entweder x = 1 und damit 1 + 1 = 2 ∈ M1 oder x ≥ 2 und daher auch x + 1 ≥ 2. Das zeigt N ⊂ M1 , so dass zwischen 1 und 2 keine natürliche Zahl liegt: Es gilt 1 ∈ M . 2. Wir überlegen uns zunächst, dass für jedes n ∈ N die folgende Aussage richtig ist: n = 1 oder n − 1 ∈ N. Dies folgt wieder daraus, dass die fragliche Menge M2 = {n ∈ N : n = 1 ∨ n − 1 ∈ N} induktiv ist: Es ist 1 ∈ M2 und n ∈ M2 impliziert (trivialerweise) n ∈ N. Dann aber ist n + 1 ∈ N und (n + 1) − 1 = n ∈ N, also auch n + 1 ∈ M2 . 3. Es sei nun n ∈ M . Wäre n + 1 ∈ / M , so gäbe es ein m ∈ N mit n + 1 < m < n + 2. Wegen m > n + 1 ∈ N muss m 6= 1 sein. Nach 2. ist dann aber auch m − 1 ∈ N, wobei n < m − 1 < n + 1 ist. Dies widerspricht n ∈ M . Aus diesem Satz nun lässt sich das Wohlordnungsprinzip der natürlichen Zahlen gewinnen. Satz 3.19 (Wohlordnungsprinzip) Jede nicht leere Menge natürlicher Zahlen besitzt ein kleinstes Element Beweis. Um einen Widerspruchsbeweis zu führen, nehmen wir an, dass es eine Menge M ⊂ N, M 6= ∅, gibt, die kein kleinstes Element besitzt. D.h.: Es gibt kein m ∈ M mit m ≤ x für alle x ∈ M . Definiere L = {n ∈ N : n ≤ x für alle x ∈ M }. 41 L ist induktiv: 1 ∈ L ist klar. Es sei nun n ∈ L und insbesondere n ≤ x für alle x ∈ M . Es gilt n ∈ / M , denn sonst wäre n ein kleinstes Element von M . Da es nach Satz 3.18 kein Element von M zwischen n und n + 1 geben kann, muss dann auch n + 1 ∈ L gelten. Damit ist L als induktiv nachgewiesen, d.h. L = N. Da M nicht leer ist, gibt es ein x0 ∈ M . Wegen x0 + 1 ∈ N folgt der Widerspruch x0 + 1 ≤ x0 . Die übrigen Zahlbereiche ergeben sich aus N nun wie folgt: Definition 3.20 Es seien (i) N0 := N ∪ {0} die natürlichen Zahlen mit 0, (ii) Z := N ∪ {0} ∪ {−n : n ∈ N} die Menge der ganzen Zahlen und (iii) Q := { pq : p ∈ Z, q ∈ Z \ {0}} die Menge der rationalen Zahlen. Es ist nicht schwer zu sehen, dass die Summen- und Produktbildung in N0 , Z bzw. Q nicht aus den jeweiligen Mengen hinausführt. Z enthält mit jeder Zahl auch ihr Negatives, Q enthält mit jeder Zahl bzw. jeder von 0 verschiedenen Zahl auch deren Negatives bzw. Inverses. Bemerkung. Diese Mengen lassen sich in jedem angeordneten Körper definieren. 3.4 Das Vollständigkeitsaxiom Wir benötigen noch ein letztes Axiom, das – anschaulich gesagt – garantiert, dass R ‘keine Löcher hat’. Wir formulieren es erst und erklären die dabei auftretenden Begriffe gleich im Anschluss. Das Vollständigkeitsaxiom besagt: (V) In R besitzt jede nach oben beschränkte nicht leere Teilmenge ein Supremum. Definition 3.21 Es sei M ⊂ R. (i) a ∈ R heißt – obere Schranke für M , wenn für alle x ∈ M gilt x ≤ a, – untere Schranke für M , wenn für alle x ∈ M gilt x ≥ a. (ii) Besitzt M eine obere (oder untere) Schranke, so nennt man M nach oben (bzw. nach unten) beschränkt. Ist M nach oben und nach unten beschränkt, so heißt M schlicht beschränkt. (iii) a ∈ R heißt – Supremum von M , wenn a obere Schranke von M ist und für jede obere Schranke a0 von M gilt a ≤ a0 , 42 – Infimum von M , wenn a untere Schranke von M ist und für jede untere Schranke a0 von M gilt a ≥ a0 . Wir schreiben dann a = sup M bzw. a = inf M . Ein Supremum nennt man daher auch kleinste obere Schranke, ein Infimum auch größte untere Schranke von M . Beachten Sie: Ein Supremum bzw. Infimum, so es denn existiert, muss nicht in der Menge M selbst liegen. Äquivalent zu (V) hätte man auch die Existenz eines Infimums für nach unten beschränkte Mengen fordern können, wie sich gleich aus Satz 3.24 ergeben wird. Nicht jede Teilmenge von R hat eine obere bzw. untere Schranke. (Z.B. gibt es für R selbst kein a ∈ R mit x ≤ a für alle x ∈ R.) Es gilt aber: Lemma 3.22 Ist M ⊂ R nach oben (nach unten) beschränkt, so ist das Supremum (bzw. Infimum) von M eindeutig. Beweis. Sind a1 und a2 Suprema von M , also insbesondere obere Schranken, so gilt a1 ≤ a2 und a2 ≤ a1 . Dies zeigt a1 = a2 . Analog argumentiert man für Infima. Dieses Lemma rechtfertigt auch die Schreibweisen sup M und inf M . Wir vereinbaren noch, sup M = +∞ für nicht nach oben, inf M = −∞ für nicht nach unten beschränkte M zu schreiben und für die leere Menge sup ∅ = −∞ sowie inf ∅ = +∞ zu setzen. +∞ und −∞ zwar sind keine reellen Zahlen. Fügt man diese Größen den reellen Zahlen hinzu, so erhält man den erweiterten Zahlbereich R = R ∪ {−∞, +∞}. Auch auf R lässt sich – mit Vorsicht!! – rechnen, was wir hier aber nicht vertiefen wollen. Die Ordnungsrelationen jedoch lassen sich leicht auf R erweitern, indem man +∞ > x und −∞ < x für alle x ∈ R definiert. Definition 3.23 Es sei M ⊂ R eine nach oben (unten) beschränkte Menge. Gilt sup M ∈ M (bzw. inf M ∈ M ) so schreiben wir auch sup M = max M (bzw. inf M = min M ) und nennen diesen Wert das Maximum (Minimum) von M . Beispiele. 1. Endliche Intervalle sind beschränkt. Für reelle a < b ist inf(a, b) = inf[a, b) = inf(a, b] = inf[a, b] = a, sup(a, b) = sup[a, b) = sup(a, b] = sup[a, b] = b. (Dies gilt für die in diesem Fall definierten Intervalle auch noch für a, b ∈ R.) Für reelle a < b ist min[a, b) = min[a, b] = a und max(a, b] = max[a, b] = b. Die übrigen Suprema/Infima sind keine Maxima/Minima. 43 2. Jede endliche Menge reeller Zahlen ist beschränkt und besitzt ein Minimum sowie ein Maximum. 3. N ist nicht nach oben beschränkt. Ansonsten gäbe es nach (V) eine kleinste obere Schranke x0 ∈ R für N. Da mit n auch n + 1 natürlich ist, gilt dann für alle n ∈ N auch n + 1 ≤ x0 , also n ≤ x0 − 1. Auch x0 − 1 ist damit eine obere Schranke von N im Widerspruch zur Minimalität von x0 . 4. Die Menge M = {x ∈ Q : x2 ≤ 2} ist nach oben beschränkt, etwa durch 2. (x > 2 ⇒ x2 > 4 > 2.) Wegen 1 ∈ M gilt 1 ≤ sup M ≤ 2. 2 Bemerkung. √ Im letzten Beispiel wird sich zeigen, dass (sup M ) = 2 (also sup M = 2) ist. Im Körper Q selbst hat diese Menge kein Supremum. Dies zeigt, dass Q nicht vollständig ist. Für M ⊂ R sei −M = {x ∈ R : −x ∈ M }. Satz 3.24 (i) a ist obere Schranke für M ⊂ R genau dann, wenn −a eine untere Schranke für −M ist. (ii) a ist Supremum von M genau dann, wenn −a Infimum von −M ist. Beweis. (i) Dies folgt aus ∀ x ∈ M : x ≤ a ⇔ ∀ x ∈ M : −x ≥ −a ⇔ ∀ y ∈ −M : y ≥ −a. (ii) Ist a = sup M , so ist −a nach (i) eine untere Schranke für −M . Ist auch r eine solche, so ist wiederum nach (i) −r eine obere Schranke von M = −(−M ). Dann aber ist −r ≥ a und somit r ≤ −a. Damit ist −a = inf M nachgewiesen. Die Umkehrung folgt analog. Satz 3.25 Für alle x, y ∈ R mit x, y > 0 gibt es ein n ∈ N mit nx > y. Beweis. Anderenfalls wäre xy eine obere Schranke von N. Bemerkung Man bezeichnet die Aussage dieses Satzes auch als das archimedische Axiom. In unserem Axiomensystem ist es eine Folgerung aus den Körper-, Anordnungs- und Vollständigkeitsaxiomen. Ohne (V) muss Satz 3.25 nicht gelten. Einen angeordneten Körper, in dem dieser Satz gilt, nennt man auch archimedisch angeordnet. Korollar 3.26 (i) Für jedes ε > 0 gibt es ein n ∈ N, so dass 0 < 1 n < ε gilt.3 (ii) Ist q > 1, so gibt es für jedes K > 0 ein n ∈ N mit q n > K. 3 Genauer natürlich: Für jedes ε ∈ R mit ε > 0 . . . . – Im Folgenden lassen wir das ‘∈ R’ bisweilen weg und verabreden, dass in Ausdrücke wie ‘Sei x > 0’ oder ‘Für alle x > 0’ o.ä. x als reell vorausgesetzt wird, wenn es nicht ausdrücklich anders spezifiziert ist. 44 (iii) Ist 0 < q < 1, so gibt es für jedes ε > 0 ein n ∈ N mit 0 < q n < ε. Beweis. (i) Wähle n > 1ε . (ii) Schreibt man q = 1 + x, so folgt aus der Bernoullischen Ungleichung q n = (1 + x)n ≥ 1 + nx > nx. Die Behauptung stimmt also für n ≥ Kx . (iii) Nach (ii) gibt es ein n ∈ N mit q1n = ( 1q )n > 1ε , also (0 <) q n < ε. Der folgende Satz besagt, dass Q in R ‘dicht liegt’, obwohl es – wie wir in Satz 3.30 sehen werden – ‘viel mehr’ reelle als rationale Zahlen gibt. Satz 3.27 Ist x ∈ R, so gibt es zu jedem ε > 0 ein r ∈ Q mit |x − r| < ε. Beweis. Wir zeigen, dass es zu jedem x ∈ R und q ∈ N ein p ∈ Z gibt mit |x − pq | ≤ 1q . Nach Korollar 3.26 folgt hieraus die Behauptung. Für x = 0 ist das klar. Für x > 0 sei p das minimale Element in {p ∈ N : x ≤ p }, welches nach Satz 3.19 ja existiert. Falls p > 1 ist, muss dann p−1 < x ≤ pq q q gelten. Ist p = 1, so ist 0 < x ≤ 1q . In jedem Fall folgt |x − pq | < 1q . Für x < 0 wähle p ∈ N mit | − x − pq | < 1q , so dass dann |x − −p | < 1q ist. q Korollar 3.28 Zu x1 , x2 ∈ R mit x1 < x2 gibt es ein r ∈ Q mit x1 < r < x2 . 2 Beweis. Wähle r ∈ Q mit | x1 +x − r| < 2 x2 −x1 . 2 Dann ist tatsächlich x2 − x1 x 2 − x1 x1 + x2 x2 − x1 + >− + = 0, 2 2 2 2 x2 − x 1 x1 + x2 x2 − x1 x2 − x1 x2 − r = + −r > − = 0. 2 2 2 2 r − x1 = r − Eine weitere wichtige Konsequenz aus (V) ist der folgende Existenzsatz über Elemente in ineinandergeschachtelten Intervallen. Satz 3.29 (Intervallschachtelungsprinzip) Es seien I1 , I2 , I3 , . . . endliche abgeschlossene Intervalle mit I1 ⊃ I2 ⊃ I3 ⊃ . . .. T (i) Dann ist n∈N In 6= ∅. (ii) Gibt es für jedes ε ∈ R mit T ε > 0 ein n ∈ N, so dass |In | < ε gilt, so gibt es genau eine reelle Zahl in n∈N In . Beweis. (i) Ist In = [an , bn ], so gilt a1 ≤ a2 ≤ a3 ≤ . . . ≤ b 3 ≤ b 2 ≤ b 1 . Da also A = {a1 , a2 , . . .} (etwa durch b1 ) nach oben beschränkt und B = {b1 , b2 , . . .} (etwa durch a1 ) nach unten beschränkt ist, existieren sup A und inf B. Da jedes 45 bn obere Schranke von A ist, gilt auch sup A ≤ bnTfür alle n ∈ N. Das aber zeigt, dass für alle n gilt sup A ∈ [an , bn ], also sup A ∈ n∈N T In . 0 (ii) Gäbe es zwei verschiedene Punkte x, x ∈ n∈N In , so wählen wir ε = |x − x0 |. Nach Voraussetzung gibt es ein n mit |In | < ε. Anderereits folgt aus x, x0 ∈ In auch |In | ≥ |x − x0 | = ε. Widerspruch. Bemerkung. Die Aussage von Satz 3.29 ist – auf der Basis der übrigen Axiome – sogar äquivalent zum Vollständigkeitsaxiom (V). Man hätte also ebensogut die Aussage dieses Satzes zu einem Axiom erklären können und dann die Supremumseigenschaft nach oben beschränkter Mengen als Satz beweisen können. Als Anwendung dieses Satzes zeigen wir, dass R (im Gegensatz zu Q) ‘viel größer’ als N ist: Satz 3.30 R ist überabzählbar. Beweis. Es genügt zu zeigen, dass keine Abbildung von N nach R surjektiv ist. Zu f : N → R definieren dazu induktiv: • I1 ⊂ [0, 1] sei ein abgeschlossenes Intervall der Länge 1 3 mit f (1) ∈ / I1 . • Ist In schon gewählt, so nehmen wir In+1 ⊂ In als abgeschlossenes Intervall / In+1 . der Länge 31n mit f (n + 1) ∈ I1 kann man hierbei als eines der Intervalle [0, 13 ] oder [ 23 , 1] wählen, die ja nicht beide f (1) enthalten können. Ist In = [an , an + 31n ] schon konstruiert, so wählen 1 2 wir als In+1 etwa dasjenige der Intervalle [an , an + 3n+1 ], [an + 3n+1 , an + 31n ], das f (n + 1) nicht enthält. T Für jedes n ist dann f (n) ∈ / k∈N Ik , obwohl diese Menge nicht leer ist. f ist also nicht surjektiv. 2 Wir können nun auch endlich garantieren, dass die Gleichung x = 2 in R lösbar ist. Allgemein gilt: Satz 3.31 Zu jeder reellen Zahl y ≥ 0 und jedem k ∈ N gibt es genau ein reelles x ≥ 0 mit xk = y. Bemerkung. Wir werden dies gleich mit Hilfe einer Intervallschachtelung und damit mehr oder weniger direkt aus den Axiomen von R ableiten. Später, wenn wir schon wesentlich mehr Theorie entwickelt haben werden, wird sich dieser Satz in wenigen Zeilen beweisen lassen. Wir schicken dem Beweis die folgende Übungsaufgabe voraus: Übung. Für a, b ∈ R, n ∈ N gilt n n b −a = b−a b n−1 +b n−2 a + . . . + ba n−2 +a n−1 n−1 X n−1−k k = (b − a) b a . k=0 46 Beweis von Satz 3.31. Es sei zunächst y > 1. Wir konstruieren eine Intervallschachtelung I1 = [a1 , b1 ] ⊃ I2 = [a2 , b2 ] ⊃ . . ., so dass für alle n ∈ N gilt akn ≤ y ≤ bkn sowie |In+1 | = 12 |In |. Dazu definieren wir die In induktiv mit dem Intervallhalbierungsverfahren: Für n = 1 setzen wir [a1 , b1 ] = [1, y], so dass ak1 = 1k ≤ y ≤ y k = bk1 gilt. Ist In mit den geforderten Eigenschaften schon definiert, so setzen wir ( n n k [an , an +b ], falls ( an +b ) ≥ y, 2 2 In+1 = an +bn an +bn k [ 2 , bn ], falls ( 2 ) < y. Dann genügt auch In+1 den geforderten Bedingungen. 1 Induktiv ergibt sich, dass |In | = 2n−1 |I1 | ist, womit nach Korollar 3.26(ii) zu jedem ε > 0 ein n ∈ N mit |In | < ε existiert. Gemäß Satz 3.29 gibt es ein T x ∈ n∈N In . Wir betrachten nun die Intervalle Jn = [akn , bkn ]. Offensichtlich ist Jn+1 ⊂ Jn für alle n. Indem man n ∈ N zu gegebenem ε > 0 mit ( 21 )n−1 < kbεk wählt, was 1 nach Korollar 3.26(ii) möglich ist, lässt sich die Länge von Jn abschätzen durch |Jn | = bkn − akn k−2 = (bn − an )(bnk−1 + bk−2 + ak−1 n an + . . . + b n an n ) 1 ε 1 kbk = ε. ≤ n−1 kbkn ≤ n−1 kbk1 < 2 2 kbk1 1 Nun ist wegen x ∈ In für alle n auch xk ∈ Jn für alle n. Nach Konstruktion gilt aber auch y ∈ Jn für alle n. Gemäß Satz 3.29(ii) muss dann aber xk = y gelten. Die behauptete Eindeutigkeit ist einfacher zu sehen: Für alle x0 > 0 mit x0 6= x gilt entweder x0 < x und somit auch (x0 )k < xk = y oder aber x0 > x und somit auch (x0 )k > xk = y. Im Fall 0 < y < 1 folgt die Behauptung nun aus dem schon Gezeigten und der Beobachtung xk = y ⇔ (x−1 )k = y −1 . Die Fälle y = 0 und y = 1 schließlich sind trivial. Definition 3.32 Ist y ∈ R nicht negativ, k ∈ N, so nennt man die eindeutige √ reelle Zahl x ≥ 0 mit xk = y die k-te Wurzel von y und schreibt x = k y oder 1 √ auch x = y k . Für k = 2 schreibt man auch nur x = y. Wir bemerken noch, dass die k-ten Wurzeln die folgende Monotonieeigenschaft besitzen: √ √ k 0 ≤ y1 < y2 ⇒ y1 < k y2 . 47 Dies ergibt sich einfach durch Kontraposition, denn √ √ ( k y1 )k ≥ ( k y2 )k = y2 (Induktion nach k). √ √ k y ≥ k y 1 2 impliziert y1 = Übung. Zeigen Sie, dass für die Menge M aus Beispiel 4 von Seite 44 tatsächlich √ sup M = 2 ist. Bemerkung. Zum Ende dieses Abschnitts bemerken wir noch, dass R ‘bis auf Isomorphie’ als vollständiger angeordneter Körper eindeutig ist. D.h.: Ist etwa R̃ ein weiterer vollständiger angeordneter Körper, so gibt es eine (eindeutige) Bijektion R → R̃, die sämtliche Strukturen erhält. (Das Bild einer Summe ist die Summe der Bilder, genauso für Produkte, die neutralen und inversen Elemente in R werden auf die entsprechenden in R̃ abgebildet, die Anordnungsrelation bleibt erhalten u.s.w.) Von unserem Standpunkt lassen sich R und R̃ schlicht nicht unterscheiden. Obwohl der Beweis nicht allzu schwierig ist, verzichten wir darauf, ihn hier anzugeben, da er für das Folgende nicht von Belang ist. Eine Selbstverständlichkeit ist dies jedoch nicht. Schließlich mussten wir bis zum letzten Axiom (V) warten, um endlich R und Q unterscheiden zu können. 3.5 Die komplexen Zahlen In den natürlichen Zahlen allein kann man nicht uneingeschränkt subtrahieren: Die elementare Gleichung a+x=b besitzt selbst für a, b ∈ N nicht immer eine Lösung x ∈ N. In Z dagegen ist sie lösbar – sogar für alle a, b ∈ Z. Die Gleichung (a 6= 0) ax = b ist jedoch auch in Z im Allgemeinen nicht lösbar. Wohl aber in Q – sogar für alle a, b ∈ Q (a 6= 0). Auch Q jedoch genügt unseren Ansprüchen noch nicht, da es nicht vollständig ist und insbesondere im Allgemeinen keine Lösungen der Gleichung x2 = b (b ≥ 0) zulässt. Selbst in R gibt es nun immer noch elementare Gleichungen, die keine Lösungen besitzen: x2 = −1 kann für keine reelle Zahl x gelten, da ja immer x2 ≥ 0 und −1 < 0 ist. Dennoch möchten wir in der Mathematik diese Gleichung lösen können – aus vielerlei Gründen, die sich Ihnen so richtig wohl erst dann erschließen, wenn Sie im Laufe Ihres Studiums sehen, was man damit machen kann. Dies führt uns zum Zahlbereich der komplexen Zahlen. Mathematiker haben schon recht lange mit diesen Zahlen gerechnet. Bevor sie von Gauß und Hamilton im vorletzten 48 Jahrhundert auf eine theoretisch fundierte Grundlage gestellt wurden, wurden damit schon Gleichungen gelöst, die im Reellen keine Lösung besitzen. Für quadratische Gleichungen x2 + px + q = 0 etwa lassen sich mit der ‘Mitternachts-’ oder ‘p-q-Formel’ die Lösungen als p −p ± p2 − 4q x1,2 = 2 angeben. Ist p2 − 4q ≥ 0, so sind diese Lösunen reell. Im Fall p2 − 4q < 0 lässt sich dies mit einer ‘imaginären Einheit’ i, für die i2 = −1 ist, unformen zu p |p2 − 4q| p i, x1,2 = − ± 2 2 √ 2 |p −4q| p eine Zahl mit einem ‘Realteil’ − 2 und einem ‘Imaginärteil’ ± . 2 Wir werden solche Zahlen nun – ohne das Imaginationsvermögen überzustrapazieren – ganz formal als Paare reeller Zahlen einführen. Definition 3.33 Der Körper der komplexen Zahlen C ist die Menge R × R mit den inneren Verknüpfungen (i) Addition: (x1 , y1 ) + (x2 , y2 ) := (x1 + x2 , y1 + y2 ), (ii) Multiplikation: (x1 , y1 ) · (x2 , y2 ) := (x1 x2 − y1 y2 , x1 y2 + x2 y1 ). Die Addition ist hier nichts Anderes als die Vektoraddition in der Ebene, die Sie evtl. aus der Schule kennen. Wir werden gleich sehen, was es mit der Multiplikation auf sich hat. Satz 3.34 C ist ein Körper. Beweis. Die Köperaxiome (A1), (A2), (A3), (M1), (M2), (M3), (N) und (D) bestätigt man durch einfaches Nachrechnen, wobei die Null durch (0, 0) und die Eins durch (1, 0) gegeben ist. Ebenso rechnet man leicht nach, dass das Negative von z = (x, y) durch −z = (−x, −y) sowie das Inverse von z = (x, y) 6= (0, 0) durch 1 x −y = , . z x2 + y 2 x2 + y 2 49 gegeben ist. Speziell für komplexe Zahlen der Form (x1 , 0), (x2 , 0) gilt (x1 , 0) + (x2 , 0) = (x1 + x2 , 0) (x1 , 0) · (x2 , 0) = (x1 x2 , 0). und Dies erlaubt es, die reellen Zahlen mit der Teilmenge {(x, 0) : x ∈ R} von C zu identifizieren. (Ganz formal: Die Abbildung x 7→ (x, 0) vermittelt einen Isomorphismus zwischen den Körpern R und {(x, 0) : x ∈ R}, d.h. sie ist bijektiv und mit der Körperstruktur (den inneren Verknüpfungen) verträglich.) Wir dürfen daher die Elemente der Form (x, 0) selbst als reelle Zahlen betrachten und einfach mit x bezeichnen. Definition 3.35 Es sei z = (x, y) ∈ C. (i) Man nennt Re z = x den Realteil von z. (ii) Man nennt Im z = y den Imaginärteil von z. (iii) Ist Im z = 0, so heißt z reell, ist Re z = 0, so heißt z rein imaginär. (iv) Die rein imaginäre Zahl i = (0, 1) heißt die imaginäre Einheit. Wegen i2 = (−1, 0) = −1 sind z = ±i Lösungen der Gleichung z 2 + 1 = 0. Damit haben wir nun einerseits unser Ausgangsproblem gelöst. Auf der anderen Seite impliziert dieser Zusammenhang, dass C nicht angeordnet werden kann, da ja in jedem angeordneten Körper von 0 verschiedene Quadrate positiv sind. In C sind jedoch sowohl 1 = 12 als auch −1 = i2 Quadrate. Für gewöhnlich schreibt man die komplexen Zahlen nicht explizit als Paare reeller Zahlen, sondern nutzt die Darstellung (x, y) = (x, 0) + (0, 1) · (y, 0) = x + iy als Summe des Realteils und des Produkts des Imaginärteils mit der imaginären Einheit. – Dann muss man sich die Regeln zur Summen- und Produktregel nicht auswendig merken; sie ergeben sich automatisch aus i2 = −1: Für x1 , y1 , x2 , y2 ∈ R ist (x1 + iy1 ) + (x2 + iy2 ) = (x1 + x2 ) + i(y1 + y2 ), (x1 + iy1 ) · (x2 + iy2 ) = x1 x2 + ix1 y2 + iy1 x2 + i2 y1 y2 = (x1 x2 − y1 y2 ) + i(x1 y2 + x2 y1 ). (Und aus diesem Grund haben wir diese Operationen natürlich genau so definiert.) 50 Definition 3.36 Es sei z = x + iy ∈ C (x, y ∈ R). (i) Die zu z konjugiert komplexe Zahl ist z := x − iy. p √ (ii) Der Betrag von z ist |z| := zz = x2 + y 2 . (In (ii) haben wir (x+iy)(x−iy) = x2 −(iy)2 = x2 +y 2 ausgenutzt. Beachte, dass (ii) mit unserer früheren Definition des Betrags einer reellen Zahl übereinstimmt, wenn z reell ist.) Die Konjugation erfüllt die folgenden Eigenschaften: Satz 3.37 Es seien z, z1 , z2 ∈ C. (i) z = z, (ii) z1 + z2 = z1 + z2 , (iii) z1 z2 = z1 z2 , (iv) Re z = 12 (z + z), (v) Im z = 1 (z 2i − z). Beweis. (i) und (ii) sind klar. (iii) Ist z1 = x1 + iy1 , z2 = x2 + iy2 (x1 , y1 , x2 , y2 ∈ R), so gilt z1 z2 = x1 x2 − y1 y2 + i(x1 y2 + x2 y1 ) = x1 x2 − y1 y2 − i(x1 y2 + x2 y1 ) = x1 x2 − (−y1 )(−y2 ) + i x1 (−y2 ) + x2 (−y1 ) = z1 z2 . (iv, v) Mit z = x + iy ist 1 (z + z) = 2 1 (z − z) = 2i 1 (x + iy + x − iy) = x = Re z und 2 1 x + iy − (x − iy) = y = Im z. 2i Für den Betrag ergeben sich die folgenden Regeln: Satz 3.38 Es seien z, z1 , z2 ∈ C. (i) |z| ≥ 0 und |z| = 0 ⇔ z = 0. (ii) |z| = |z|, (iii) | Re z| ≤ |z| und | Im z| ≤ |z|, 51 (iv) |z1 z2 | = |z1 ||z2 |, (v) Dreiecksungleichung: |z1 + z2 | ≤ |z1 | + |z2 |. (vi) Umgekehrte Dreiecksungleichung: |z1 − z2 | ≥ |z1 | − |z2 |. Beweis. Es sei z = x + iy (x, y ∈ R). p (i) Klar, da |z| = x2 + y 2 ≥ 0 und |z| = 0 ⇔ x = y = 0 ⇔ z = 0. p p (ii) Dies folgt aus |z| = x2 + y 2 = x2 + (−y)2 = |z|. (iii) Aus der Monotonieeigenschaft der Wurzel folgt p √ sowie | Re z| = |x| = x2 ≤ x2 + y 2 = |z| p p | Im z| = |y| = y 2 ≤ x2 + y 2 = |z|. (iv) Dies folgt nach Wurzelziehen aus |z1 z2 |2 = z1 z2 z1 z2 = z1 z1 z2 z2 = |z1 |2 |z2 |2 . (v) Nach (iii), (iv) und (ii) ist |z1 + z2 |2 = (z1 + z2 )(z1 + z2 ) = z1 z1 + z1 z2 + z2 z1 + z2 z2 = |z1 |2 + z1 z2 + z1 z2 +|z2 |2 ≤ |z1 |2 + 2|z1 z2 | + |z2 |2 | {z } =2 Re(z1 z2 ) 2 = |z1 | + 2|z1 ||z2 | + |z2 |2 = (|z1 | + |z2 |)2 . Die Behauptung folgt nun durch Wurzelziehen. (vi) Dies folgt genauso wie im reellen Fall direkt aus der Dreiecksungleichung (vgl. Satz 3.9(v)). Da man C nicht anordnen kann, ist es nicht sinnvoll, obere oder untere Schranken für Teilmengen von C definieren zu wollen. Man kann jedoch von beschränkten Mengen sprechen: Definition 3.39 Eine Menge M ⊂ C komplexer Zahlen heißt beschränkt, wenn die Menge {|z| : z ∈ M } in R beschränkt ist. (D.h.: Wenn ein c ∈ R mit |z| ≤ c für alle z ∈ M existiert.) Man kann sich die komplexen Zahlen in der Gaußschen Zahlenebene R × R veranschaulichen. z = x + iy ∈ C ist dann der Punkt (x, y), so dass dem xAchsenabschnitt der Realteil und dem y-Achsenabschnitt der Imaginärteil von z entspricht. (Man spricht daher hier auch von der ‘reellen’ bzw. ‘imaginären Achse’.) In dieser Interpretation ist z gerade der an der reellen Achse gespiegelte Punkt z. Die Addition ist dann – wie schon bemerkt – die Addition von ebenen Vektoren. Alternativ kann man den z darstellenden Vektor auch durch seine Länge r = |z| und den mit der reellen Achse eingeschlossenen Winkel φ 52 beschreiben. Dies ist die sogenannte Polardarstellung, die wir später noch ganz sauber definieren werden. Es gilt dann x = r cos φ und y = r sin φ. Im Vorgriff hierauf – und ohne dies im Folgenden auszunutzen, bevor wir die folgenden Rechnungen gerechtfertigt haben, – gehen wir auf diese vor allem auch für die Anschauung nützliche Darstellung kurz ein. Sind z1 = x1 + iy1 , z2 = x2 + iy2 komplexe Zahlen mit entsprechenden Beträgen r1 bzw. r2 und Winkeln φ1 bzw. φ2 , so ist nach den trigonometrischen Additionstheoremen z1 z2 = (r1 cos φ1 + ir1 sin φ1 )(r2 cos φ2 + ir2 sin φ2 ) = r1 r2 cos φ1 cos φ2 − sin φ1 sin φ2 + i(cos φ1 sin φ2 + cos φ2 sin φ1 ) = r1 r2 (cos(φ1 + φ2 ) + i sin(φ1 + φ2 )). Das heißt: Bildet man das Produkt zweier komplexer Zahlen, so werden die Beträge multipliziert und die Winkel zur reellen Achse addiert. Hält man w ∈ C mit Betrag r und Winkel φ fest, so ist die Abbildung C → C, z 7→ wz eine Drehstreckung: z = (x, y) wird um den Faktor r gestreckt und dann um den Winkel φ gedreht. Speziell für w = i (mit r = 1 und φ = 90◦ ) ergibt sich eine Drehung um 90◦ . Nun wird auch endlich klar, woher der Name Dreiecksungleichung für die Beziehung |z1 + z2 | ≤ |z1 | + |z2 | für komplexe Zahlen z1 , z2 stammt. In einem Dreieck mit den Eckpunkten 0, z1 und z1 + z2 ist die Seite zwischen 0 und z1 + z2 der Länge |z1 + z2 | höchstens so groß wie die Summe der beiden anderen Seiten zwischen 0 und z1 der Länge |z1 | und zwischen z1 und z1 + z2 der Länge |z2 |. 53 Kapitel 4 Folgen und Reihen Ein zentrales Konzept in der Analysis ist der Begriff des Grenzwerts. Hierdurch wird in mathematisch rigoroser Weise formalisiert, was eine ‘beliebig genaue Approximation’ ist. Dabei werden wir in diesem Kapitel untersuchen, was es heißt eine Zahl durch eine (abzählbar unendliche) Folge von Zahlen beliebig gut zu approximieren. 4.1 Folgen und Grenzwerte Definition 4.1 Es sei M eine Menge. Eine Abbildung von N nach M (oder auch von N0 nach M ) heißt eine Folge in M . Ist M = R bzw. M = C, so spricht man auch von einer reellen bzw. komplexen Folge. Folgen schreibt man meist nicht in der Form f : N → M , n 7→ f (n). Stattdessen notiert man eine Folge N → M mit n 7→ an als (an )n∈N oder auch (a1 , a2 , . . .), manchmal auch einfach als (an ). Die an nennt man die Folgenglieder der Folge (an ). Bisweilen bezeichntet man allgemeiner auch Abbildungen {m, m + 1, m + 2, . . .} → M , n 7→ an als Folgen, wenn m irgendeine ganze Zahl ist. Dies notiert man dann mit (an )n≥m . Da wir uns im Folgenden nur für das asymptotische Verhalten von Folgen interessieren, auf das endliche Abschnitte zu Beginn der Folge keinen Einfluss haben, ergeben sich hierfür im Folgenden keine wesentlichen Unterschiede. Beispiele. 1. Für M = N ist die Folge der ungeraden Zahlen (1, 3, 5, . . .) = (2n − 1)n∈N . 2. Die harmonische Folge ist die reelle Folge 1 1 1 = 1, , , . . . . n n∈N 2 3 54 3. Für an = 2−n ist 1 1 1 (an )n∈N0 = 1, , , , . . . . 2 4 8 4. Eine komplexe Folge ist z.B. (in )n∈N0 = (1, i, −1, −i, 1, i, −1, −i, 1, . . .). 5. Für beliebiges z ∈ C ist (z n )n∈N0 = (1, z, z 2 , z 3 , . . .) eine sogenannte geometrische Folge. P 6. Für xn = nk=1 9 · 10−k ist1 (xn )n∈N = (0.9, 0.99, 0.999, . . .). Wir betrachten nun Folgen mit Werten in R oder C. Sie dürfen – und sollen, wenn sie mit den komplexen Zahlen noch nicht völlig vertraut sind, – sich im Folgenden beim ersten Lesen immer auf den reellen Fall konzentrieren. (In diesem Fall müssen sie sich beim zweiten Lesen dann jedoch noch den komplexen Fall klar machen.) Definition 4.2 Es sei (an )n∈N eine reelle (oder komplexe) Folge. (an ) konvergiert gegen a ∈ R (oder C), wenn gilt: ∀ ε > 0 ∃ N ∈ N ∀ n ≥ N : |an − a| < ε. (D.h.: Für jedes ε > 0 gibt es einen (von ε abhängigen) Index N ∈ N, so dass für alle n ≥ N die Bedingung |an −a| < ε erfüllt ist.) Man schreibt dann limn→∞ an = a oder auch an → a (für n → ∞). Ist a = 0, so nennt man (an )n∈N auch eine Nullfolge. Konvergiert (an ) gegen eine Zahl, so heißt (an ) konvergent. Konvergiert (an ) nicht, so sagt man (an ) divergiert oder sei divergent. Nochmal: an → a heißt: Zu beliebig vorgelegtem ε > 0 dürfen die an für hinreichend große n ∈ N nicht weiter als ε von a entfernt liegen. Äquivalente Formulierung: Für jedes ε > 0 gilt |an − a| < ε für fast alle n ∈ N. (D.h. für alle n ∈ N mit endlich vielen Ausnahmen.) Beispiele. 1. Ist (an )n∈N eine konstante Folge mit an = a für alle n ∈ N, so gilt limn→∞ an = a. Klar, denn für jedes ε > 0 und alle n ∈ N ist |an − a| = 0 < ε. 1 Die Dezimaldarstellung werden wir später noch exakt einführen. 55 2. limn→∞ 1 n = 0. Denn zu ε > 0 gibt es nach dem archimedischen Axiom ein N ∈ N mit 1 < ε (vgl. Korollar 3.26(i)). Dann aber ist für n ≥ N N 1 1 ≤ < ε. n N 3. Die Folge (in )n∈N0 divergiert. Denn wäre limn→∞ in = z, so müsste für ε = 1 ein N ∈ N mit |in − z| < 1 für alle n ≥ N existieren. Dann aber wäre nach der Dreiecksungleichung 2 > |iN +2 − z| + |iN − z| ≥ |iN +2 − iN | = |iN ||i2 − 1| = | − 1 − 1| = 2. 4. Die Folge ((−1)n )n∈N0 divergiert. Das sieht man ähnlich wie im vorigen Beispiel. (Übung!) 5. Allgemein gilt: Die Folge (z n )n∈N0 konvergiert für |z| < 1 gegen 0 und für z = 1 gegen 1. Anderenfalls divergiert sie. Für |z| < 1 gibt es zu jedem ε > 0 nach Korollar 3.26(iii) nämlich ein N ∈ N mit |z|N < ε. Dann aber ist auch |z n | = |z|n ≤ |z|N < ε ∀ n ≥ N. Der Fall z = 1 folgt direkt aus 1. Ist nun |z| ≥ 1 und z 6= 1, so kann (z n ) nicht gegen ein w ∈ C konvergieren. Anderenfalls gäbe es zu ε = |z−1| (> 0) ein N ∈ N mit |z n − w| < ε für alle 2 n ≥ N . Dann aber wäre (Dreiecksungleichung) |z − 1| = 2ε > |z N +1 − w| + |w − z N | ≥ |z N +1 − w + w − z N | = |z N +1 − z N | = |z N ||z − 1| = |z|N |z − 1| ≥ |z − 1|. Der folgende Satz rechtfertigt es, im Falle der Existenz von dem Grenzwert einer Folge zu sprechen. Satz 4.3 Der Grenzwert einer konvergenten reellen (oder komplexen) Folge ist eindeutig. Beweis. Wäre dies nicht der Fall, so gäbe es eine (reelle oder komplexe) Folge (an )n∈N mit an → a und an → a0 für n → ∞ für zwei verschiedene a und a0 . Dann 0| > 0, so dass N ∈ N und N 0 ∈ N mit aber ist ε = |a−a 2 |an − a| < ε ∀ n ≥ N und |an − a0 | < ε ∀ n ≥ N 0 existieren. Für n ≥ max{N, N 0 } ergibt sich hieraus der Widerspruch |a − a0 | = |a − an + an − a0 | ≤ |an − a| + |an − a0 | < ε + ε = |a − a0 |. 56 Satz 4.4 Eine konvergente reelle (oder komplexe) Folge ist beschränkt. Beweis. Gilt limn→∞ an = a, so wählen wir N ∈ N, so dass für alle n ≥ N gilt |an − a| < 1. Für diese n ist dann 1 > |an − a| ≥ |an | − |a| nach der umgekehrten Dreiecksungleichung und damit |an | ≤ |a| + 1. Setzt man nun c = max{|a1 |, . . . , |aN −1 |, |a| + 1}, so gilt tatsächlich |an | ≤ c für alle n ∈ N. Bemerkung. Die Umkehrung dieser Behauptung ist falsch! Z.B. ist ((−1)n )n∈N beschränkt aber divergent. Der folgende Satz fasst wichtige Grenzwertsätze zusammen. Satz 4.5 (Grenzwertsätze für Folgen) Es seien (an )n∈N und (bn )n∈N konvergente reelle (oder komplexe) Folgen. Dann gilt: (i) Auch (an ± bn )n∈N ist konvergent und es ist lim an ± bn = lim an ± lim bn . n→∞ n→∞ n→∞ (ii) Auch (an bn )n∈N ist konvergent und es ist lim an bn = lim an lim bn . n→∞ n→∞ n→∞ (iii) Gilt bn 6= 0 für alle n und limn→∞ bn 6= 0, so ist auch ( abnn )n∈N konvergent mit lim an an = n→∞ . lim n→∞ bn lim bn n→∞ Bemerkung. Gilt limn→∞ bn = b 6= 0, so gibt es zu ε = |b| ein N mit |bn | ≥ |b| − |bn − b| > |b| − ε = 0 für n ≥ N . Es können also höchstens endlich viele der bn gleich 0 sein. Da dies für das Grenzwertverhalten nicht von Belang ist, können wir in (iii) auf die Bedingung bn 6= 0 für alle n auch verzichten. (Zumindest wenn wir uns nicht daran stören, dass die Folgenglieder abnn ggf. nur für hinreichend große n erklärt sind.) Beweis. Es seien limn→∞ an = a und limn→∞ an = b. (i) Zu ε > 0 gibt es N ∈ N und N 0 ∈ N mit |an − a| < ε 2 ∀n ≥ N und |bn − b| < ε 2 ∀ n ≥ N 0. Für n ≥ max{N, N 0 } ergibt sich hieraus |an + bn − (a + b)| ≤ |an − a| + |bn − b| < 57 ε ε + = ε, 2 2 wie gewünscht. (ii) Nach Satz 4.4 gibt es ein C > 0 mit |bn | ≤ C für alle b ∈ N. Wir wählen nun N ∈ N und N 0 ∈ N mit |an − a| < ε 2C ∀n ≥ N |bn − b| < und ε 1 + 2|a| ∀ n ≥ N 0. Für n ≥ max{N, N 0 } ist dann |an bn − ab| = |an bn − abn + abn − ab| ≤ |an bn − abn | + |abn − ab| ε ε ε ε = |bn ||an − a| + |a||bn − b| < C + |a| ≤ + = ε. 2C 1 + 2|a| 2 2 (iii) Nach (ii) genügt es Gilt b 6= 0, so gibt es zu 1 bn |b| 2 → 1b zu zeigen. ein N ∈ N mit |bn | = |b − (b − bn )| ≥ |b| − |bn − b| > |b| − |b| |b| = 2 2 für n ≥ N . Zu gegebenem ε > 0 gibt es außerdem ein N 0 ∈ N mit |bn − b| < für n ≥ N 0 . Ist nun n ≥ max{N, N 0 }, so folgt |b|2 ε 2 1 1 |b − bn | |b|2 ε/2 < = ε. − = bn b |bn b| |b|2 /2 Beispiele. 1. Wendet man Satz 4.5 speziell mit einer konstanten Folge bn = c für alle n an, so ergibt sich für eine konvergente Folge (an ) lim c an = c lim an . n→∞ n→∞ 2. Nach den Grenzwertsätzen ist 1 + 6n−3 − 3n−5 n7 + 6n4 − 3n2 = lim n→∞ 3 + n−1 − 2n−7 n→∞ 3n7 + n6 − 2 3 5 lim 1 + 6 lim n1 − 3 lim n1 n→∞ n→∞ = n→∞ 7 1 lim 3 + lim n − 2 lim n1 lim n→∞ n→∞ n→∞ 1 + 6 · 03 − 3 · 05 1 = = . 7 3+0−2·0 3 Beachte hierbei, dass die Anwendung der Grenzwertsätze gerechtfertigt ist, da alle auftretenden Limites existieren und der Nenner nicht verschwindet. 58 Bei der Untersuchung von Folgen ist es – wie wir sehen werden – oft nützlich, aus einer Folge eine neue Folge zu generieren, indem man einfach einige Folgenglieder weglässt. Genauer: Definition 4.6 Es sei (an )n∈N eine Folge und (nk )k∈N eine Folge natürlicher Zahlen mit n1 < n2 < . . .. Dann ist die Folge (ank )k∈N (also k 7→ ank ) eine Teilfolge von (an )n∈N . Beispiele. 1. Die Folge (2,4,6,. . . ) der geraden Zahlen ist eine Teilfolge der Folge (1, 2, 3, . . .) aller natürlichen Zahlen. 2. Für nk = 2k erhält man aus ( n1 )n∈N die Teilfolge ( 21k )k∈N . Satz 4.7 Konvergiert (an ) gegen a, so gilt auch limk→∞ ank = a für jede Teilfolge (ank ). Beweis. Das ist (fast) klar: Für jedes ε > 0 gilt |an − a| < ε für fast alle n, erst recht also |ank − a| < ε für fast alle k. Definition 4.8 Es sei (an ) eine reelle (oder komplexe) Folge. a ∈ R (oder C) heißt Häufungspunkt von (an ), wenn es eine Teilfolge (ank ) von (an ) gibt, die gegen a konvergiert. Eine äquivalente Formulierung gibt der folgende Satz an: Satz 4.9 a ist Häufungspunkt der reellen (oder komplexen) Folge (an ) genau dann, wenn es für jedes ε > 0 unendlich viele Indizes n mit |an − a| < ε gibt. Beweis. ⇒: Klar: Gilt etwa ank → a, so gibt es zu ε > 0 ein K ∈ N mit |ank −a| < ε für alle (unendlich vielen) k ≥ K. ⇐: Wir definieren natürliche Zahlen n1 < n2 < . . . wie folgt induktiv. Zunächst wählen wir n1 mit |an1 −a| < 1. Ist nun nk schon definiert, so wählen wir nk+1 > nk 1 . Da unendlich viele Folgenglieder dieser Abschätzung mit |ank+1 − a| < k+1 genügen, ist dies möglich. Zu gegebenem ε > 0 gibt es nun ein K ∈ N mit K1 < ε. Für k ≥ K ist dann |ank − a| < k1 ≤ K1 < ε. Dies zeigt, dass limk→∞ ank = a gilt, a also ein Häufungspunkt von (an ) ist. Beispiele. 1. Die Häufungspunkte der Folge (an )n∈N mit ( 3 + n1 , n ungerade, an = 0, n gerade, sind 0 und 3. 59 2. Die Häufungspunkte der komplexen Folge (in )n∈N sind 1, i, −1 und −i. 3. Es sei q1 , q2 , . . . eine Nummerierung der rationalen Zahlen, also Q = {q1 , q2 , . . .}. Dann ist die Menge der Häufungspunkte der Folge (qn )n∈N ganz R. (Überlegen Sie sich das!) 4.2 Reelle Folgen und Monotonie Wir untersuchen nun speziell reelle Folgen und die Konsequenzen, die sich durch Größenvergleiche auf den Grenzwertprozess ergeben. Satz 4.10 Es seien (an ) und (bn ) konvergente reelle Folgen mit an ≤ bn für alle n ∈ N. Dann gilt auch limn→∞ an ≤ limn→∞ bn . Beweis. Setze a = limn→∞ an , b = limn→∞ bn . Wäre a > b, so gäbe es zu ε = natürliche Zahlen N und N 0 mit |an − a| < ε für alle n ≥ N und a−b 2 |bn − b| < ε für alle n ≥ N 0 . Für n = max{N, N 0 } führt dies zum Widerspruch a − b = a − an + an − bn +bn − b ≤ |a − an | + |b − bn | < 2ε = a − b. | {z } ≤0 Beachten Sie: Aus an < bn folgt im Allgemeinen nicht limn→∞ an < limn→∞ bn . Gegenbeispiel: an = 0 und bn = n1 für n ∈ N. Korollar 4.11 Es seien (an ) eine konvergente reelle Folge und a0 , a00 ∈ R mit a0 ≤ an ≤ a00 für alle n ∈ N. Dann gilt auch a0 ≤ limn→∞ an ≤ a00 . Beweis. Dies folgt sofort aus Satz 4.10, angewandt auf (an ) und die konstanten Folgen (a0 ) und (a00 ). Durch Größenvergleich lassen sich auch neue Konvergenzkriterien gewinnen: Satz 4.12 (Einschnürungssatz) Es seien (an ), (bn ) und (xn ) reelle Folgen mit limn→∞ an = limn→∞ bn = x und an ≤ xn ≤ bn für alle n ∈ N. Dann gilt auch limn→∞ xn = x. Beweis. Übungsaufgabe! Eine wichtige Klasse von Folgen besteht aus solchen, deren Folgenglieder der Größe nach angeordnet sind. Für diese Folgen lässt sich – wie wir gleich sehen werden – erstens ein besonders einfaches Kriterium für die Konvergenz angeben. Zweitens gewinnt man hieraus ein für viele theoretische Untersuchungen grundlegendes Existenzresultat auch für allgemeinere Folgen. Drittens schließlich umfasst diese Klasse viele interessante Anwendungen, was wir schon im folgenden Abschnitt 4.4 bei der absoluten Konvergenz von Reihen ausnutzen werden 60 Definition 4.13 Eine reelle Folge (an )n∈N heißt (i) monoton wachsend, wenn an ≤ an+1 für alle n ∈ N gilt, (ii) streng monoton wachsend, wenn an < an+1 für alle n ∈ N gilt, (iii) monoton fallend, wenn an ≥ an+1 für alle n ∈ N gilt, und (iv) streng monoton fallend, wenn an > an+1 für alle n ∈ N ist. Eine Folge (an ) ist also genau dann (streng) monoton fallend, wenn (−an ) (streng) mononoton wächst. Satz 4.14 Jede beschränkte monoton wachsende (bzw. fallende) Folge (an ) konvergiert. Es gilt lim an = sup{an : n ∈ N} n→∞ (bzw. lim an = inf{an : n ∈ N}). n→∞ Da eine monoton wachsende (fallende) Folge (an ) durch a1 immer nach unten (oben) beschränkt ist, hätte es auch genügt zu fordern, dass (an ) nach oben (unten) beschränkt ist. Beweis. 1. Es seien (an ) beschränkt und monoton wachsend, a = sup{an : n ∈ N}. Ist ε > 0, so ist a − ε keine obere Schranke von {an : n ∈ N}, so dass ein N ∈ N mit aN > a − ε existiert. Da (an ) monoton wächst, gilt dann aber auch an ≥ a − ε ∀ n ≥ N. Andererseits ist an ≤ a < a + ε sogar für alle n. Damit ist a − ε < an < a + ε ∀ n ≥ N, so dass an → a folgt. 2. Ist (an ) beschränkt und monoton fallend, so folgt nach 1. lim (−an ) = sup{−an : n ∈ N} = − inf{an : n ∈ N}, n→∞ also in der Tat limn→∞ an = inf{an : n ∈ N}. Satz 4.15 Jede reelle Folge besitzt eine monotone Teilfolge. Beweis. Für eine reelle Folge (an ) setze M = {n ∈ N : für alle k ≥ n gilt ak ≥ an }. Fall 1: M ist unbeschränkt. Dann gibt es unendlich viele n1 , n2 , . . . ∈ M mit n1 < n2 < . . .. Nach Konstruktion ist ank+1 ≥ ank , so dass die Teilfolge (ank ) monoton wächst. Fall 2: M ist beschränkt. Wähle dann n1 > sup M und induktiv nk+1 > nk mit ank+1 < ank . (Dies ist möglich, da nk > sup M , also nk ∈ / M ist.) Die Teilfolge (ank ) fällt dann (sogar streng) monoton. Das folgende Korollar, ist eine wichtige(!) Existenzaussage in der Analysis. 61 Korollar 4.16 (Satz von Bolzano-Weierstraß (für reelle Folgen)) Jede beschränkte reelle Folge besitzt eine konvergente Teilfolge. Beweis. Klar nach den Sätzen 4.15 und 4.14. Konvergiert eine reelle Folge deshalb nicht, weil ihre Folgenglieder ‘gegen +∞ oder gegen −∞ streben’, spricht man von uneigentlicher Konvergenz oder bestimmter Divergenz. Genauer: Definition 4.17 Eine Folge (an ) mit Werten in R∪{−∞, +∞} heißt uneigentlich konvergent gegen +∞ (oder −∞), wenn es zu jedem K > 0 ein N ∈ N gibt mit an ≥ K (bzw. an ≤ −K) ∀ n ≥ N. Man schreibt dann auch limn→∞ an = +∞ bzw. limn→∞ an = −∞. Statt von uneigentlicher Konvergenz spricht man auch von bestimmter Divergenz gegen +∞ bzw. −∞. Beispiele. 1. limn→∞ −2n + 1 = −∞. 2. Es sei (an )n∈N eine Folge mit an > 0 (bzw. an < 0) für alle n. Genau dann ist (an )n∈N eine Nullfolge, wenn ( a1n )n∈N bestimmt gegen +∞ (bzw. −∞) divergiert. Übung: Zeigen Sie dies! 3. Es sei x ∈ R. Die Folge (xn )n∈N – konvergiert für −1 < x ≤ 1 (vgl. Beispiel 5 auf Seite 56), – konvergiert uneigentlich gegen +∞ für x > 1 und – divergiert (nicht bestimmt) für x ≤ −1. Übung: Zeigen Sie dies! Satz 4.18 Jede monotone Folge ist entweder konvergent oder uneigentlich konvergent. Beweis. Es sei (an ) monoton wachsend. Ist (an ) nach oben beschränkt, so folgt die Behauptung aus Satz 4.14. Ist (an ) nach oben unbeschränkt, so gibt es zu jedem K > 0 ein N ∈ N mit aN > K. Aus der Monotonie folgt dann aber auch an > K ∀ n ≥ N. Ist (an ) monoton fallend, so ist (−an ) nach dem eben Gezeigten konvergent oder uneigentlich konvergent, also auch (an ) selbst. Schließlich bemerken wir, dass eine Folge offensichtlich nicht zugleich konvergieren und uneigentlich konvergieren kann. Wir führen nun noch ein Konzept ein, dass es uns erlaubt, das asymptotische Verhalten einer möglicherweise divergenten reellen Folge genauer zu untersuchen. 62 Definition 4.19 Es sei (an ) eine reelle Folge. (i) Der Limes superior von (an ) ist lim sup an := lim sup{ak : k ≥ n}. n→∞ n→∞ (ii) Der Limes inferior von (an ) ist lim inf an := lim inf{ak : k ≥ n}. n→∞ n→∞ Statt lim sup schreibt man auch lim , statt lim inf auch lim . n→∞ n→∞ n→∞ n→∞ Beachte, dass die Folge (sup{ak : k ≥ n})n∈N monoton fällt. (Mit wachsendem n wird das Supremum über immer kleinere Mengen gebildet.) Der Limes dieser Folge existiert also im eigentlichen oder uneigentlichen Sinne. Genauso konvergiert (inf{ak : k ≥ n})n∈N als monoton wachsende Folge eigentlich oder uneigentlich. Im Gegensatz zum Limes existieren der Limes inferior und der Limes superior einer jeden Folge! Beispiele. 1. Es gilt lim inf (−1)n = −1 und n→∞ lim sup(−1)n = 1. n→∞ 2. Ist (an )n∈N gegeben durch ( 3 + n1 , n ungerade, an = − n12 , n gerade, so ist lim supn→∞ an = 3 und lim inf n→∞ an = 0. Satz 4.20 Es sei (an ) eine reelle Folge. (i) Genau dann gilt limn→∞ an = a, wenn lim sup an = lim inf an = a n→∞ n→∞ ist. (ii) Ist (an )n∈N beschränkt und bezeichnet H die Menge der Häufungspunkte von (an ), so gilt max H = lim sup an und n→∞ 63 min H = lim inf an . n→∞ Beweis. Übung! Zum Schluss dieses Abschnitts notieren wir noch das Satz 4.10 entsprechende Ergebnis für lim inf und lim sup: Satz 4.21 Es seien (an ) und (bn ) reelle Folgen mit an ≤ bn für alle n ∈ N. Dann gilt auch lim inf an ≤ lim inf bn n→∞ n→∞ und lim sup an ≤ lim sup bn . n→∞ n→∞ Beweis. Dies folgt sofort aus Satz 4.10, indem man beobachtet, dass inf{ak : k ≥ n} ≤ inf{bk : k ≥ n} sowie sup{ak : k ≥ n} ≤ sup{bk : k ≥ n} für jedes n ∈ N gilt. 4.3 Konsequenzen der Vollständigkeit Besonders wichtig für die Analysis sind die Konsequenzen für die Untersuchung von Folgen, die sich aus dem Vollständigkeitsaxiom ergeben, wie etwa der Satz 4.14 und der Satz von Bolzano-Weierstraß, dessen reelle Variante wir schon in Korollar 4.16 kennengelernt haben. (Die übrigen bisher diskutierten Ergebnisse lassen sich auch aus dem schwächeren Archimedischen Axiom gewinnen.) Zunächst bemerken wir, dass die Ergebnisse des vorigen Abschnitts auch Konsequenzen für komplexe Folgen haben. Deren Konvergenz lässt sich nämlich auf die Konvergenz von reellen Folgen zurückführen. Satz 4.22 Eine komplexe Folge (zn )n∈N konvergiert genau dann gegen z ∈ C, wenn limn→∞ Re zn = Re z und limn→∞ Im zn = Im z gilt. Beweis. ⇒: Zu ε > 0 wähle N ∈ N mit |zn − z| < ε für alle n ≥ N . Für diese n gilt dann auch | Re zn − Re z| ≤ |zn − z| < ε und | Im zn − Im z| ≤ |zn − z| < ε. ⇐: Zu ε > 0 wähle N1 ∈ N und N2 ∈ N mit | Re zn − Re z| < 2ε für alle n ≥ N1 und | Im zn − Im z| < 2ε für alle n ≥ N2 . Für n ≥ N := max{N1 , N2 } ist dann nach der Dreiecksungleichung |zn − z| = | Re zn − Re z + i(Im zn − Im z)| ≤ | Re zn − Re z| + |i|| Im zn − Im z| < ε ε + = ε. 2 2 Satz 4.23 (Satz von Bolzano-Weierstraß) Jede beschränkte reelle (oder komplexe) Folge besitzt eine konvergente Teilfolge. 64 Beweis. Nach Korollar 4.16 müssen wir nur noch komplexe Folgen untersuchen. Ist nun (an ) eine beschränkte komplexe Folge, so sind nach Satz 3.38(iii) (Re an )n∈N und (Im an )n∈N beschränkte reelle Folgen. Nach Korollar 4.16 gibt es eine Teilfolge (znk )k∈N , so dass (Re znk )k∈N konvergiert. Wieder nach Korollar 4.16 gibt es eine (Teil-)Teilfolge (znkj )j∈N , für die (Im znkj )j∈N konvergiert. Als Teilfolge der konvergenten Folge (Re znk )k∈N konvergiert aber auch (Re znkj )j∈N . Gemäß Satz 4.22 konvergiert dann auch die komplexe Folge (znkj )j∈N . Ein zentrales Konvergenzkriterium ist das Cauchykriterium, das eine notwendige und hinreichende Bedingung für die Konvergenz einer reellen (oder komplexen) Folge angibt, ohne dass der fragliche Grenzwert angegeben werden muss. Da man dieses Kriterium allgemeiner auch für andere Bereiche als R oder C untersucht, in denen es notwendig, jedoch nicht hinreichend sein muss, geben wir hier zunächst eine extra Definition, die sich später leicht verallgemeinern lässt. Definition 4.24 Eine Folge reeller (oder komplexer) Zahlen (an ) heißt Cauchyfolge, wenn es zu jedem ε > 0 ein N ∈ N gibt, so dass |am − an | < ε für alle m, n ≥ N gilt. Satz 4.25 Eine reelle (oder komplexe) Folge ist genau dann konvergent, wenn sie eine Cauchyfolge ist. Beweis. ⇒: Gilt limn→∞ an = a, so gibt es zu jedem ε > 0 ein N ∈ N mit |an − a| < 2ε für alle n ≥ N . Dann gilt aber auch ε ε |am − an | = |am − a + a − an | ≤ |am − a| + |an − a| < + = ε 2 2 für m, n ≥ N . ⇐: Es sei nun (an ) als Cauchyfolge vorausgesetzt. Zu ε = 1 gibt es dann ein N ∈ N mit |an − aN | < 1 und damit |an | ≤ |aN | + 1 für alle n ≥ N . Dann aber ist |an | ≤ max{|a1 |, |a2 |, . . . , |aN −1 |, |aN | + 1}, was zeigt, dass die Folge (an ) beschränkt ist. Nach Satz 4.23 besitzt (an ) also eine konvergente Teilfolge (ank )k∈N , etwa limk→∞ ank = a. Tatsächlich gilt dann aber schon an → a. Ist nämlich ε > 0 gegeben, so können wir N, K ∈ N mit ε ε |am − an | < für m, n ≥ N sowie |ank − a| < für k ≥ K 2 2 wählen. Dann aber folgt für alle n ≥ N , indem man k ≥ K mit nk ≥ N wählt, ε ε |an − a| ≤ |an − ank | + |ank − a| < + = ε. 2 2 65 Bemerkungen. 1. Die Aussagen des Satzes von Bolzano-Weierstraß und des Cauchykriteriums sind im folgenden Sinne sogar äquivalent zur Vollständigkeit von R: Ist K ein angeordneter Körper, so sind äquivalent: • K ist vollständig. (D.h. das Vollständigkeitsaxiom (V) gilt.) • K ist ein archimedisch angeordneter Körper, in dem jede beschränkte Folge eine konvergente Teilfolge besitzt. • K ist ein archimedisch angeordneter Körper, in dem jede Cauchyfolge konvergiert. Um dies zu zeigen, muss man zunächst bemerken, dass man die Konvergenz von Folgen – genau wie oben beschrieben – allgemein für archimedisch angeordnete Körper definieren kann, s. z.B. [Fo]. (Das archimedische Axiom garantiert dann, dass der Grenzwert einer konvergenten Folge eindeutig ist.) Wir gehen hier nicht weiter darauf ein. (Was Sie nicht daran hindern soll, sich dies selbst zu überlegen.) 2. Mit Hilfe von Cauchyfolgen lässt sich nun die Vollständigkeit auch für nicht angeordnete Räume definieren. Da nach Satz 4.25 insbesondere auch in C jede Cauchyfolge konvergiert, sagen wir auch, dass C vollständig ist. 4.4 Reihen Durch sukzessive Addition der Glieder einer gegebenen reellen (oder komplexen) Folge (an )n∈N entsteht eine neue Folge: (sm )m∈N mit sm = a1 + . . . , +am , die unendliche Reihe der an . Etwas allgemeiner betrachten wir gleich Folgen mit erstem Index n0 ∈ Z (vgl. den Absatz zu Beginn des Abschnitts 4.1). In diesem Abschnitt stellen wir grundlegende Konvergenzkriterien für Reihen bereit. Definition Pm 4.26 Es sei (an )n≥n0 eine reelle (oder komplexe) Folge. Die Zahl sm = n=n0 an heißt die m-te Partialsumme von (an ). Die Folge der Partialsummen (sm )m≥n0 nennt man auch die (unendliche) Reihe der an und schreibt (sm )m≥n0 = ∞ X an . n=n0 Ist diese Reihe konvergent oder uneigentlich konvergent, so bezeichnet man auch ihren Grenzwert so: lim m→∞ m X an = n=n0 ∞ X n=n0 66 an . P Beachten Sie: Das Symbol ∞ n=1 an bedeutet zweierlei: Erstens steht es für die Folge der Partialsummen, zweitens – im Falle der Konvergenz – auch für deren Limes. Natürlich kann man die Folge (an )n≥n0 aus der Folge der Partialsummen (sm )m≥n0 zurückgewinnen, da ja an0 = sn0 und an = sn − sn−1 für n ≥ n0 + 1 gilt. Beispiele. 1. Die geometrische Reihe: Für z ∈ C mit |z| < 1 gilt ∞ X zn = n=0 1 . 1−z Für |z| ≥ 1 ist diese Reihe divergent. Der Fall z = 1 ist hier klar. Für z 6= 1 beobachten wir zunächst, dass der Satz 2.2 auch im Komplexen gültig ist. (Der Beweis ist haargenau der gleiche.) Demnach ist m X 1 − z m+1 . zn = 1−z n=0 Da z m+1 → 0 mit m → ∞, wenn |z| < 1 ist, und anderenfalls (z m+1 ) divergiert, folgt die Behauptung. 2. Die harmonische Reihe ∞ X 1 n n=1 divergiert bestimmt gegen +∞: Wählt man zu gegebenem K > 0 ein N ∈ N mit N ≥ 2K, so gilt für m ≥ 2N N m 2 N −1 X X 1 X1 ≥ ≥ n n=2 n n=1 k=0 k+1 2X N −1 X 1 N 1 ≥ 2k · k+1 ≥ ≥ K. n 2 2 k=0 n=2k +1 | {z } 2k Summanden, jeweils ≥ 1/2k+1 3. Es gilt ∞ X 1 1 1 1 + + + ... = = 1. 1·2 2·3 3·4 n(n + 1) n=1 67 P 1 1 1 1 Die Summe ∞ n=1 n(n+1) ist eine ‘Teleskopsumme’: Wegen n(n+1) = n − n+1 ist tatsächlich m 1 X 1 1 1 1 1 1 1 = 1− + − + − + ... + − n(n + 1) 2 2 3 3 4 m m+1 n=1 =1− 1 →1 m+1 mit m → ∞. Direkt aus den Grenzwertsätzen ergibt sich: P∞ P (oder komplexe) unSatz 4.27 Sind ∞ n=n0 bn konvergente reelleP n=n0 an und endliche Reihen sowie c ∈ R (oder C), so konvergiert auch ∞ n=n0 (an + c bn ) und es ist ∞ ∞ ∞ X X X (an + c bn ) = an + c bn . n=n0 n=n0 n=n0 Beweis. Klar nach Satz 4.5. Wir untersuchen nun Kriterien für die Konvergenz von unendlichen Reihen. Als erstes notwendiges (aber nicht hinreichendes!) Kriterium halten wir fest: P Satz 4.28 Konvergiert die reelle (oder komplexe) unendliche Reihe ∞ n=n0 an , so ist (an )n≥n0 eine Nullfolge. P Pm Beweis. Es seien a = ∞ n=n0 an und sm = n=n0 an die m-te Partialsumme. Zu gegebenem ε > 0 wählen wir M ∈ N mit |sm − a| < 2ε für alle m ≥ M . Dann gilt für m ≥ M + 1 auch |am | = |sm − sm−1 | = |sm − a + a − sm−1 | ε ε ≤ |sm − a| + |a − sm−1 | < + = ε. 2 2 ( n1 )n∈N eine Beachten Sie: DiePUmkehrung dieses Satzes gilt nicht! Z.B. ist 1 Nullfolge, die Reihe ∞ n=1 n aber – wie wir gesehen haben – divergent. Natürlich liefert jedes Konvergenzkriterium für Folgen auch ein Konvergenzkriterium für Reihen, indem man es auf die entsprechende Partialsummenfolge anwendet. Da es im Folgenden wichtig ist, gehen wir hier (noch einmal) speziell auf das Cauchykriterium ein. P Satz 4.29 Die unendliche Reihe ∞ k=n0 ak mit ak ∈ R (oder C) konvergiert genau dann, wenn es zu jedem ε > 0 ein N ∈ N gibt, so dass m X ak < ε k=n für alle m ≥ n ≥ N gilt. 68 Beweis. Ist (sm ) die Folge der Partialsummen, so besagt diese Bedingung wegen Pm a k=n k = sm − sn−1 gerade, dass (sm ) eine Cauchyfolge ist. Die Behauptung folgt daher aus Satz 4.25. Als nächstes diskutieren wir ein hinreichendes (aber nicht notwendiges!) Kriterium für Reihen mit weitreichenden Konsequenzen. Dazu führen wir zunächst einen Begriff ein. P∞ Definition 4.30 Eine unendliche reelle (oder komplexe) Reihe n=n0 an konP |a | konvergiert. vergiert absolut, wenn die Reihe ∞ n n=n0 Satz 4.31 Jede absolut konvergente Reihe konvergiert. P∞ Beweis. Es sei n=n0 an absolut konvergent. Ist ε > 0, so gibt es nach dem Cauchykriterium ein N ∈ N mit m X |ak | < ε k=n für Pm alle m, n ≥ N gilt. Nach der Dreiecksungleichung aber ist | k=n |ak |, so dass auch m X ak < ε Pm k=n ak | ≤ k=n für P∞alle m, n ≥ N gilt. Wieder nach dem Cauchykriterium folgt nun, dass auch n=n0 an konvergiert. Beachten Sie: Die Umkehrung giltn im Allgemeinen nicht. Z.B. ist – wie wir P∞ (−1) gleich noch P sehen werden – n=1 n konvergent, nicht jedoch absolut konver1 gent, da ja ∞ n=1 n divergiert. P Die wesentlich Beobachtung ist nun, dass ∞ n=n0 an monoton wächst. Hieraus ergibt sich: P Satz 4.32 Eine unendliche reelle (oder komplexe) Reihe ∞ n=n0 an konvergiert P∞ genau dann absolut, wenn die Folge der Partialsummen der Reihe n=n0 |an | beschränkt ist. P Beweis. Dies folgt sofort aus Satz 4.14, da die Partialsummenfolge ∞ n=n0 |an | monoton wächst. Im Folgenden diskutieren wir einige Konvergenzkriterien für die absolute Konvergenz einer Reihe. P∞ Satz 4.33 (Majorantenkriterium) Es seien n=n0 an eine reelle (oder komP∞ plexe) Reihe und n=n0 bn eine konvergente P Reihe mit reellen Gliedern bn ≥ 0. Gilt |an | ≤ bn für alle n ≥ n0 , so konvergiert ∞ n=n0 an absolut. 69 P∞ Man nennt in diesem Fall die Reihe n=n0 bn eine Majorante der Reihe P∞ a . n=n0 n P∞ Beweis. Da n=n0 bn als konvergente Reihe gemäß Satz 4.4 insbesondere beschränkt ist, gibt es ein C > 0 mit m X n=n0 m X |an | ≤ bn ≤ C n=n0 für alle m ≥ n0 . Die Behauptung folgt somit aus Satz 4.32. Beispiel. Die Reihe ∞ X 1 n=1 n2 konvergiert. P 1 Es genügt hier zu begründen, dass ∞ n=2 n2 konvergiert. Dies folgt nun daraus, dass die Reihe ∞ X 1 1 1 1 = + + + ... (n − 1)n 1 · 2 2 · 3 3 · 4 n=2 eine – nach dem Beispiel 3 von Seite 67 konvergente – Majorante ist. Die folgenden beiden Kriterien für die absolute Konvergenz beruhen auf dem Majorantenkriterium, wobei eine geometrische Reihe als konvergente Majorante dient. Vorbereitend beweisen wir ein Lemma, durch das sich die Voraussetzungen dieser Kriterien äquivalent umformulieren lassen. Lemma 4.34 Ist (xn ) eine reelle Folge, so gilt lim supn→∞ xn < 1 genau dann, wenn es ein r < 1 und ein N ∈ N gibt, so dass xn ≤ r für alle n ≥ N gilt. Achtung! Diese Bedingung ist nicht äquivalent dazu, dass xn < 1 für alle n ≥ N gilt. (Gegenbeispiel: xn = 1 − n1 .) Beweis. ⇒: Ist lim supn→∞ xn = limn→∞ sup{xk : k ≥ n} =: x < 1, so gibt es zu x < r < 1 ein N ∈ N mit (setze ε = r − x) sup{xk : k ≥ N } < r. ⇐: Gibt es einen Index N und ein r < 1, so dass xk ≤ r für alle k ≥ N ist, dann ist auch sup{xk : k ≥ N } ≤ r und damit nach Satz 4.14 lim sup xn = lim sup{xk : k ≥ n} ≤ sup{xk : k ≥ N } ≤ r < 1. n→∞ n→∞ 70 P Satz 4.35 (Quotientenkriterium) Es sei ∞ n=n0 an eine reelle (oder komplexe) Reihe. Gilt |an+1 | lim sup < 1, |an | n→∞ P so konvergiert ∞ n=n0 an absolut. Bemerkung. Gemäß Lemma 4.34 ist die Voraussetzung lim supn→∞ äquivalent zur folgenden Bedingung: ∃ r < 1 ∃N ≥ n0 ∀n ≥ N : |an+1 | |an | <1 |an+1 | ≤ r. |an | Beweis von Satz 4.35. Wir wählen nach Lemma 4.34 N ∈ N und r P > 0 mit ∞ |an+1 | ≤ r für n ≥ N . Es genügt nun, die absolute Konvergenz der Reihe n=N an |an | nachzuweisen, da die ersten endlich vielen Glieder keinen Einfluss auf das Konvergenzverhalten haben. | Aus |a|an+1 ≤ r folgt induktiv aber |an | ≤ rn−N |aN |, so dass sich die Behaupn| tung aus dem Majorantenkriterium ergibt, denn es ist ∞ X |aN |r n−N = |aN | ∞ X rn < ∞. n=0 n=N Beispiel. Die Reihe n7 2−n n=1 1+n2 P∞ (n+1)7 2−n−1 1+(n+1)2 n7 2−n 1+n2 = konvergiert absolut, denn es gilt (n + 1)7 2−n−1 1 1 + n2 · → <1 · 7 −n 2 + 1) 2 {z } | 2{z } |1 + (n | n {z } 1 →1 →2 →1 mit n → ∞. P Satz 4.36 (Wurzelkriterium) Es sei ∞ n=n0 an eine reelle (oder komplexe) Reihe. p P (i) Gilt lim supn→∞ n |an | < 1, so konvergiert ∞ n=n0 an absolut. p P (ii) Gilt lim supn→∞ n |an | > 1, so divergiert ∞ n=n0 an . Beweis. (i) Wiepim Beweis von Satz 4.35 wählen wir nach Lemma 4.34 N ∈ N und r > 0 mit n |an | ≤P r für n ≥ N und beobachten, dass es genügt, die absolute Konvergenz der Reihe ∞ n=N an nachzuweisen. 71 p Aus n |an | ≤ r folgt aber direkt |an | ≤ rn , so dass sich die Behauptung wieder aus dem Majorantenkriterium ergibt, denn es ist ∞ X n r =r N ∞ X rn < ∞. n=0 n=N p p (ii) Gilt lim supn→∞ n |an | > 1, so gibt es unendlich viele n mit n |an | ≥ 1 und damit auchP|an | ≥ 1. Die Folge (an ) kann demnach keine Nullfolge sein, so dass die Reihe ∞ n=n0 an gemäß Satz 4.28 divergiert. p n Beachten Sie: Gilt lim supn→∞ |an | = 1, so ist Aussage qkeine allgemeine P q 1 möglich. Z.B. gilt lim supn→∞ n | n1 | = lim supn→∞ n | n12 | = 1, wobei ∞ n=n0 n P∞ divergiert, n=n0 n12 aber konvergiert. Beispiel. Es sei ( 2−n für n gerade, an = 3−n für n ungerade. P Dann konvergiert ∞ n=0 an nach dem Wurzelkriterium. Es ist nämlich ( 1 √ für n gerade, n an = 21 für n ungerade 3 p und somit lim supn→∞ n |an | = 12 < 1. Das Quotientenkriterium versagt in diesem Beispiel, denn es ist ( n a 2 = 13 · ( 23 )n für n gerade, n+1 3n+1 = 3n an = 12 · ( 32 )n für n ungerade 2n+1 und daher lim supn→∞ | an+1 | = ∞. an Das folgende Kriterium gilt für alternierende Reihen, deren Glieder abwechselnd positives und negatives Vorzeichen haben. Satz 4.37 (Leibnizkriterium) Ist (an )n≥n0 eine monoton fallende Nullfolge, dann ist die Reihe ∞ X (−1)n an n=n0 P∞ P n (und damit auch n=n0 (−1)n+1 an = − ∞ n=n0 (−1) an ) konvergent. Für alle m ≥ n0 gilt die Abschätzung m ∞ X X n (−1) an − (−1)n an ≤ am+1 . n=n0 n=n0 72 Beweis. Es genügt den Fall n0 = 0 zu betrachten. Der allgemeine Fall folgt hieraus durch Umnummerierung der Summe und ggf. Multiplikation mit −1: P∞ P ∞ n n = ± n=0 (−1) an0 +n . n=n0 (−1) an P n Setze sm = m n=0 (−1) an . Dann sind wegen s2k = s2k−2 −a2k−1 + a2k ≤ s2k−2 | {z } ≤0 und s2k+1 = s2k−1 +a2k − a2k+1 ≥ s2k−1 | {z } ≥0 für k ∈ N die Folgen (s2k )k∈N0 und (s2k+1 )k∈N0 monoton fallend bzw. monoton wachsend. Dabei ist s1 ≤ s2k+1 = s2k − a2k+1 ≤ s2k ≤ s0 . Diese Folgen sind also auch beschränkt und somit konvergent. Wir setzen s = limk→∞ s2k+1 . Für m ≥ k ist außerdem s2k+1 ≤ s2m+1 = s2m − a2m+1 ≤ s2m ≤ s2k und folglich (mit m → ∞) s2k+1 ≤ s ≤ s2k . Für m ∈ N ist also sm ≤ s ≤ sm+1 oder sm+1 ≤ s ≤ sm . Es folgt |sm − s| ≤ |sm+1 − sm | = am+1 → 0 mit m → ∞. Beispiel. Die alternierende harmonische Reihe ∞ X (−1)n+1 n n=1 konvergiert nach Satz 4.37. Wir untersuchen nun noch die Frage, inwiefern es bei unendlichen Reihen auf die Summationsreihenfolge ankommt. Im Allgemeinen darf man die Reihenglieder nicht beliebig umordnen wie die folgende Überlegung zeigt: Es ist ∞ X 1 1 1 1 + + + ... = =∞ 3 5 2k − 1 k=1 und ∞ X 1 1 1 1 + + + ... = = ∞. 2 4 6 2k k=1 P P∞ 1 1 oder 2 (Anderenfall wären 2 ∞ k=1 2k−1 k=1 2k konvergente Majoranten der harmonischen Reihe.) Nun kann man die Glieder der alternierenden harmonischen P (−1)n+1 Reihe ∞ z.B. so umordnen: n=1 n 73 • Addiere so lange die ersten Glieder mit ungeraden Indizes auf, bis das Ergebnis ≥ 15 ist. • Addiere dann die ersten Glieder mit geraden Indizes hinzu, bis das Ergebnis ≤ −14 ist. • Addiere dazu nun die nächsten Glieder mit geraden Indizes, bis das Ergebnis wieder ≥ 15 ist. • Addiere dann die nächsten Glieder mit ungeraden Indizes, bis das Ergebnis wieder ≤ −14 ist. • u.s.w. Die Partialsummenfolge nimmt dann sowohl immer wieder Werte ≥ 15 als auch Werte ≤ −14 an und kann nicht konvergieren. Vgl. auch die Bemerkung im Anschluss an den folgenden Satz. Umordnungen sind jedoch für absolut konvergente Reihen erlaubt: P Satz 4.38 Es sei ∞ n=n0 an eine reelle (oder komplexe) absolut konvergente Reihe. P∞Ist π : {n ∈ Z : n ≥ n0 } → {n ∈ Z : n ≥ n0 } bijektiv, so konvergiert auch n=n0 aπ(n) absolut und es ist ∞ X aπ(n) = n=n0 Beweis. Da mit P∞ n=n0 ∞ X an . n=n0 an absolut konvergiert, gibt es zu gegebenem ε > 0 ein N ∈ N m N X X ε |an | = |an | − |an | < 2 n=n n=n n=N +1 m X 0 0 für alle m ≥ N und N ∞ X ε X < . a a − n n 2 n=n n=n 0 0 0 Ist nun N ∈ N so groß gewählt, dass {π(1), . . . , π(N 0 )} ⊃ {1, . . . , N } ist (insbesondere N 0 ≥ N ), so folgt für m ≥ N 0 mit M = max{π(1), . . . , π(N 0 )} (≥ N ) m m X ∞ ∞ N X X X X X N ε ε aπ(n) − an ≤ aπ(n) − an + an − an < + = ε. 2 2 n=n0 n=n0 n=n0 n=n0 n=n n=n0 {z } | 0 P ≤ M n=N +1 |an | Bemerkung. Es sei n=n0 an eine konvergente aber nicht absolut konvergente Folge P∞ in R. Dann gibt es zu jedem x ∈ R eine Umordnung π der Indizes, so dass n=n0 aπ(n) = x ist. (Übungsaugfgabe: Überlegen Sie sich das!) P∞ 74 4.5 Zur Darstellung der reellen Zahlen Endlich können wir nun mit Hilfe der unendlichen Reihen die Darstellung der reellen Zahlen im Dezimalsystem oder – allgemeiner – in einem Zahlensystem zu einer natürlichen Basis ≥ 2 angeben. Definition 4.39 Es sei b ∈ N \ {1}. Ein b-adischer Bruch ist eine Reihe von der Form ∞ X ± an b−n , n=−k wobei k ∈ N0 und an ∈ {0, 1, . . . , b−1} die ‘Ziffern’ sind. Ist festgelegt, zu welcher Basis b man rechnet, so schreibt man eine solche Reihe dann auch einfach als ± ∞ X an b−n = ±a−k a−k+1 . . . a0 , a1 a2 . . . , n=−k indem man die an einfach hintereinander aufreiht. Satz 4.40 Es sei b ∈ N \ {1}. (i) Jeder b-adische Bruch konvergiert gegen eine reelle Zahl. (ii) Umgekehrt lässt sich jede reelle Zahl in einen b-adischen Bruch entwickeln. Für b = 10 heißt diese Darstellung die Dezimaldarstellung, für b = 2 die binäre Darstellung. Beispiel. Die Zahl 0, 101010 . . . im Binärsystem ist ∞ X n=0 −(2n+1) 2 −1 =2 ∞ X 1 1 (4−1 )n = · 2 1− n=0 1 4 2 = . 3 Bemerkung. In speziellen Fällen ist die Darstellung einer reellen Zahl als badischer Bruch nicht eindeutig. Das ist immer dann der Fall, wenn sich ein Zahl durch einen b-adischen Bruch schreiben lässt, dessen Ziffern von irgendeiner Stelle an immer b − 1 sind. Z.B. ist etwa im Dezimalsystem 2, 5999 . . . = 2, 6000 . . . und im binären Sytem 0, 111 . . . = 1, 000 . . .. Für alle anderen Zahlen ist die Darstellung als b-adischer Bruch jedoch eindeutig. (Übungsaufgabe: Überlegen Sie sich das!) P −n Beweis von Satz 4.40.2 (i) Dies folgt daraus, dass jeder b-adische Bruch ± ∞ n=−k an b dem Cauchykriterium genügt. Ist nämlich m ≥ n, so gilt ∞ m m X X X (b − 1)b−n −j −j −n b−j ≤ aj b ≤ = b−n+1 . (b − 1)b = (b − 1)b ± −1 1−b j=n j=n j=0 2 Dieser Beweis wurde in der Vorlesung weggelassen. 75 Wegen b−n+1 → 0 mit n → ∞, lässt sich daher zu gegebenem ε > 0 ein N ∈ N finden, so dass m X aj b−j < ε ± j=n für m ≥ n ≥ N ist. P −n (ii) Es genügt zu zeigen, dass sich jedes x ≥ 0 als Dezimalbruch x = ∞ n=−k an b schreiben lässt. Es sei k die kleinste Zahl aus N0 mit x < bk+1 . Wir definieren die Folge (an )n≥−k mit an ∈ {0, 1, . . . , b − 1} und sm := m X an b−n ≤ x < n=−k m X an b−n + b−m = sm + b−m . n=−k induktiv: Zunächst betrachten wir die Unterteilung 0 = 0 · bk < 1 · bk < 2 · bk < . . . < (b − 1)bk < b · bk = bk+1 des Intervalls [0, bk+1 ). Da x in diesem Intervall liegt, gibt es genau ein a−k ∈ {0, 1, . . . , b − 1} mit s−k := a−k bk ≤ x < (a−k + 1)bk = a−k bk + bk . Ist nun a−k , . . . , am schon definiert, so betrachten wir die Unterteilung sm = sm + 0 · b−m−1 < sm + 1 · b−m−1 < . . . < sm + (b − 1)b−m−1 < sm + b · b−m−1 = sm + b−m des Intervalls [sm , sm + b−m ) und wählen am+1 mit sm+1 := sm + am+1 b−m−1 ≤ x < sm + (am+1 + 1)b−m−1 = sm+1 + b−m−1 . Wegen |sm − x| < b−m folgt nun x = lim sm = m→∞ ∞ X an b−n . n=−k Bemerkungen. 1. Die rationalen Zahlen sind genau diejenigen, deren b-adische Darstellung von irgendeiner Stelle an periodisch ist: Q = {a−k a−k+1 . . . a0 , a1 a2 . . . : ∃ N ≥ −k ∃ p ∈ N ∀ n ≥ N : an+p = an }. (Übungsaufgabe: Überlegen Sie sich das!) 76 2. Mit Hilfe der Dezimaldarstellung lässt sich ein alternativer Beweis von Satz 3.30 angeben. Mit dem ‘zweiten Cantorschen Diagonalverfahren’ (vgl. das Beispiel 4 von Seite 19 zum Ersten) zeigt man dazu, dass eine Abbildung f : N → R nicht surjektiv sein kann. Schreibt man nämlich die Nachkommastellen der Bilder von f als f (1) = . . . , a11 a12 a13 . . . f (1) = . . . , a21 a22 a23 . . . f (1) = . . . , a31 a32 a33 . . . .. . und bildet aus den diagonalen Einträgen a11 , a22 , a33 , . . . die Zahl x = 0, b1 b2 b3 . . . mit ( 7 falls ann = 6 7, bn = 3 falls ann = 7, so ist tatsächlich x 6= f (n) für jedes n ∈ N. 4.6 Potenzreihen und die Exponentialfunktion Viele spezielle Funktionen, insbesondere etwa die Ihnen aus der Schule bekannte e-Funktion oder auch die Sinus- und Cosinusfunktion lassen sich mit Hilfe von Reihen definieren. Diese Reihen sind von der Form ∞ X cn (z − z0 )n , n=0 wobei cn ∈ C komplexe Koeffizienten und z0 ∈ C der sogenannte Entwicklungspunkt sind, die wir als fest gewählt betrachten. z ∈ C ist eine Variable. (Wir betrachten hier gleich allgemein den komplexen Fall.) Konvergiert diese Reihe für z ∈ M , M eine C, so definiert dies eine Abbildungsvorschrift P Teilmenge von n M → C, z 7→ ∞ c (z − z ) . Eine Reihe von dieser Form nennt man eine 0 n=0 n Potenzreihe. Kümmert man sich zunächst nicht um deren Konvergenz, so spricht man auch von einer formalen Potenzreihe. Mit den bislang entwickelten Methoden lässt sich genauer beschreiben, für welche z diese Reihen konvergieren. Es stellt sich heraus, dass dies gerade auf Kreisscheiben um z0 der Fall ist. Wir führen daher die Notation Br (z0 ) := {z ∈ C : |z − z0 | < r} ein. 77 Satz 4.41 Es seien cn , z0 ∈ C, n ∈ N0 . Setze r= wobei hier(!) 1 ∞ als 0 und 1 0 1 lim supn→∞ p , n |cn | als ∞ zu lesen ist. Dann gilt: (i) Die Reihe ∞ X cn (z − z0 )n n=0 konvergiert absolut, falls |z − z0 | < r ist, und stellt damit eine Funktion f : Br (z0 ) → C dar. (ii) Sie divergiert, falls |z − z0 | > r ist. Beweis. Setze an = cn (z − z0 )n . Dann ist p p lim sup n |an | = |z − z0 | lim sup n |cn | n→∞ n→∞ < 1 ⇔ |z − z0 | < 1√ , lim sup n |cn | > 1 ⇔ |z − z0 | > 1√ . lim sup n |cn | n→∞ n→∞ Die Behauptung folgt nun sofort aus dem Wurzelkriterium (Satz 4.36). Die Reihe konvergiert also für diejenigen z ∈ C, die in einer Kreisscheibe mit dem Radius r um z0 liegen. Dabei wird allerdings keine Aussage darüber gemacht, ob sie auch auf den Randpunkten dieses Kreises konvergiert. Liegt z weiter als r von z0 entfernt, so divergiert sie jedoch auf jeden Fall. Dies legt die folgende Definition nahe: Definition 4.42 Es sei P∞ n=0 cn (z − z0 )n eine Potenzreihe. Die Zahl ∞ X n sup |z − z0 | : cn (z − z0 ) konvergiert = n=0 1 lim supn→∞ p n |cn | heißt der Konvergenzradius dieser Potenzreihe. n| Bemerkung. Der Konvergenzradius ist auch gegeben durch limn→∞ |c|cn+1 , falls | dieser Grenzwert existiert. (Übung!) Beispiele: P n 1. Die Potenzreihe ∞ n=0 z hat den Konvergenzradius r = 1. Sie stellt die 1 Funktion B1 (0) → C, z 7→ 1−z dar. P n n 2. Die Potenzreihe ∞ n=0 n z hat den Konvergenzradius 0. (Übung!) 78 3. Die Potenzreihe P∞ n=0 3n z n hat den Konvergenzradius r= 1 lim supn→∞ p n 1 = . 3 |3n | 1 Sie stellt die Funktion B1/3 (0) → C, z 7→ 1−3z dar. P∞ zn 4. Die sogenannte Exponentialreihe n=0 n! hat den Konvergenzradius ∞, konvergiert also für alle z ∈ C. Dies folgt aus dem Quotientenkriterium, da |z| |z n+1 n!| = →0<1 |z n (n + 1)!| n+1 mit n → ∞. Bemerkung: Sind z0 = x0 und alle cn reell, so stellt die reelle Potenzreihe P∞ n n=0 cn (x − x0 ) , x ∈ R, eine reelle Funktion f : (x0 − r, x0 + r) → R dar, wobei ∞ X k ck (x − x0 ) konvergiert r = sup |x − x0 | : x ∈ R und k=0 ist. Nach unseren Ergebnissen von oben, konvergiert diese Reihe aber tatsächlich auf der ganzen komplexen Kreisscheibe {z ∈ C : |z − x0 | < r} und stellt dort eine Funktion f : Br (x0 ) → C dar. Multipliziert man zwei Potenzreihen mit demselben Entwiclungspunkt z0 , so erhält man wieder eine Potenzreihe mit dem Entwicklungspunkt z0 . Die Idee hierbei ist, all die Terme, die beim Ausmultiplizieren des Produktes der Reihen entstehen, nach Potenzen von z n zusammenzufassen. Wir fomulieren dazu zunächst einen Produktsatz für allgemeine Reihen. P P∞ Satz 4.43 (Das Cauchyprodukt) Es seienP ∞ n=0 an und n=0 bn absolut konn vergente komplexe Reihen. Setzt man cn = k=0 an−k bk , so ist auch die Reihe P ∞ n=0 cn absolut konvergent und es gilt X X ∞ ∞ ∞ X cn = an · bn . n=0 n=0 n=0 Beweis. Setze sm = m X cn = n=0 n m X X an−k bk , s̄m = m X |cn | ≤ n=0 n=0 k=0 m X n X |an−k bk | n=0 k=0 sowie tm = X m n=0 X m an · bn , t̄m = n=0 X m n=0 79 X m |an | · |bn | . n=0 Nach Voraussetzung konvergieren (tm ) und (t̄m ), wobei X X ∞ ∞ lim tm = an · bn m→∞ n=0 n=0 ist. Mit Hilfe der Indezmengen Qm = {(i, j) ∈ N0 × N0 : i, j ≤ m} und Dm = {(i, j) ∈ N0 × N0 : i + j ≤ m} lassen sich diese Summen auch schreiben als X X sm = ai bj , s̄m ≤ |ai bj | (i,j)∈Dm (i,j)∈Dm sowie tm = X ai b j , X t̄m = (i,j)∈Qm |ai bj |. (i,j)∈Qm Wegen P∞ Dm ⊂ Qm folgt hieraus zunächst s̄m ≤ t̄m ≤ limk→∞ t̄m , so dass in der Tat n=0 cn absolut konvergiert. Zu gegebenem ε > 0 wählen wir nun ein k ∈ N mit t̄m − t̄k < ε für m ≥ k. Für m ≥ 2k ergibt sich dann wegen Dm ⊃ Qk , dass X X |tm − sm | = |ai bj | = t̄m − t̄k < ε ai bj ≤ (i,j)∈Qm \Qk (i,j)∈Qm \Dm ist. Damit aber folgt limm→∞ sm = limm→∞ tm , was zu zeigen war. Speziell für Potenzreihen zeigt dies, dass das Produkt zweier Potenzreihen wieder eine Potenzreihe ist, deren Konvergenzradius mindesten so groß ist, wie das Minimum der Konvergenzradien der Faktoren: P∞ P n Korollar 4.44 Konvergieren die Potenzreihen ∞ n=0 bn (z− n=0 an (z−z0 ) und n z0 ) im Punkt z absolut, so gilt X X X ∞ ∞ ∞ X n n n an (z − z0 ) · bn (z − z0 ) = an−k bk (z − z0 )n . n=0 n=0 n=0 k=0 Beweis. Klar nach Satz 4.43. Wir werden uns später noch wesentlich ausführlicher mit Potenzreihen beschäftigen. Hier konzentrieren wir uns nun auf eine besonders wichtige. (Die Wichtigste überhaupt!) Nach Beispiel 4 von Seite 79 dürfen wir definieren: Definition 4.45 Die Funktion exp : C → C, exp(z) = ∞ X zn n=0 n! heißt die Exponentialfunktion. Die Zahl e := exp(1) heißt auch die Eulersche Zahl. 80 Beachte, dass nach der Bemerkung von Seite 79 exp(x) reell ist, wenn x reell ist. Offensichtlich ist exp(0) = 1. Grundlegend ist nun die folgende Funktionalgleichung für die Exponentialfunktion. Satz 4.46 Für z1 , z2 ∈ C ist exp(z1 + z2 ) = exp(z1 ) · exp(z2 ). Beweis. Nach Satz 4.43 ist exp(z1 ) · exp(z2 ) = = ∞ X n X ∞ n z2k X 1 X n n−k k z1n−k · = z z2 (n − k)! k! n! k=0 k 1 n=0 n=0 k=0 ∞ X (z1 + n=0 z2 )n = exp(z1 + z2 ), n! wobei wir im dritten Schritt den allgemeinen binomischen Lehrsatz 2.9 ausgenutzt haben. (Der gilt auch in C; der Beweis ist wörtlich derselbe.) Satz 4.47 Es gilt (i) exp(z) 6= 0 für alle z ∈ C, (ii) exp(x) > 0 für alle x ∈ R, (iii) exp(n) = en für alle n ∈ Z, √ (iv) exp( pq ) = q ep für alle p ∈ Z, q ∈ N. Beweis. (i) Für z ∈ C ist exp(−z) exp(z) = exp(z − z) = exp(0) = 1 und somit insbesondere exp(z) 6= 0. P xn (ii) Für x ≥ 0 ist offensichtlich exp(x) = ∞ n=0 n! ≥ 1 > 0. Für x < 0 folgt dann wegen exp(x) exp(−x) = 1 und exp(−x) > 0 nach dem schon Gezeigten auch exp(x) > 0. (iii, iv) Wir überlegen uns, dass allgemeiner für jedes z ∈ C und n ∈ Z gilt exp(nz) = (exp(z))n . Zunächst gilt exp(0 · z) = 1 = (exp(z))0 . Induktiv ergibt sich daraus exp(nz) = (exp(z))n für alle n ∈ N: Ist dies für n schon gezeigt, so folgt exp((n + 1)z) = (exp(z))n exp(z) = (exp(z))n+1 . 81 Hieraus folgt dann für n ∈ Z \ N (und damit −n ∈ N) auch 1 = exp(nz − nz) = exp(nz) exp(−nz) = exp(nz)(exp(z))−n , 1 n also exp(nz) = (exp(z)) −n = (exp(z)) . Nun folgt (iii) sofort mit z = 1. (iv) ergibt sich mit z = exp(q · pq ) = exp(p) = ep (nach (iii)). 82 p q aus (exp( pq ))q = Kapitel 5 Stetige Funktionen Wir untersuchen nun Funktionen, die auf Teilmengen von R (oder C) definiert sind. Dabei konzentrieren wir uns im Wesentlichen auf den reellen Fall, also Funktionen f : D → R mit D ⊂ R. Oft ist dabei D ein Intervall in R. 5.1 Definition und grundlegende Eigenschaften Im Folgenden sei D ⊂ R. Eine ganz wesentliche Güteeigenschaft einer Funktion f : D → R ist dann gegeben, wenn kleine Änderungen in x ∈ D nur kleine Änderungen der Funktionswerte f (x) bewirken. Formal: Definition 5.1 Eine Funktion f : D → R heißt stetig im Punkt x0 ∈ D, wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass für alle x ∈ D mit |x − x0 | < δ gilt |f (x) − f (x0 )| < ε, d.h.: ∀ ε > 0 ∃ δ > 0 ∀ x ∈ D : |x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε. f : D → R heißt stetig, wenn f in jedem Punkt aus D stetig ist. Das bedeutet: Zu jeder vorgelegten ‘Fehlertoleranz’ ε > 0 gibt es ein (kleines) δ > 0, so dass die Funktionswerte f (x) weniger als ε von f (x0 ) abweichen, wenn nur der Abstand von x zu x0 kleiner als δ ist. Beispiele. 1. Jede konstante Funktion f : R → R, f (x) = c (für ein c ∈ R) ist stetig. (Klar: δ kann hier beliebig gewählt werden.) 2. Die identische Funktion f : R → R, f (x) = x ist stetig. Indem man zu gegebenem ε > 0 einfach δ = ε wählt folgt tatsächlich für jedes x0 ∈ R: |f (x) − f (x0 )| = x − x0 ≤ |x − x0 | < ε. 83 3. Der Absolutbetrag f : R → R, f (x) = |x| ist stetig. Sind nämlich x0 ∈ R und ε > 0 gegeben, so gilt für x mit |x − x0 | < δ := ε nach der umgekehrten Dreiecksungleichung |f (x) − f (x0 )| = |x| − |x0 | ≤ |x − x0 | < ε. 4. f : R → R, f (x) = x2 stetig. ε Sind nämlich x0 ∈ R und ε > 0 gegeben, so wählen wir δ = min{1, 1+2|x }. 0| Dann gilt für x mit |x − x0 | < δ |f (x) − f (x0 )| = |x2 − x20 | = |x − x0 + x0 + x0 ||x − x0 | ≤ (|x − x0 | + 2|x0 |)|x − x0 | < (δ + 2|x0 |)δ ≤ (1 + 2|x0 |)δ ≤ ε. 5. Die Funktion f : R → R, ( 0, für x ≤ 0, f (x) = 1, für x > 0, ist im Nullpunkt nicht stetig. (Sonst schon.) Zu ε = 21 gibt es zu jedem δ > 0 den Punkt x = 2δ , der zwar |x − 0| = erfüllt, aber auch δ 2 <δ |f (x) − f (0)| = |1 − 0| = 1 > ε. 6. Der ganzzahlige Anteil f : R → R, f (x) = bxc ist genau in den Punkten x0 ∈ Z nicht stetig. (Überlegen Sie sich das!) 7. Die Funktion f : R → R, ( 1, für x ∈ Q, f (x) = 0, für x ∈ R \ Q ist nirgends stetig. (Überlegen Sie sich das!) Während diese ‘ε-δ-Definition’ der Stetigkeit für viele Untersuchungen grundlegend ist, ist sie, wie wir etwa im vorangegangenen Beispiel 4 gesehen haben, für Beispiele oft zu schwerfällig. Wir geben daher nun eine äquivalente Umformulierung mit Hilfe von Grenzwerten der Form limx→x0 f (x) an. Dazu müssen wir uns zunächst überlegen, wie sich eine solcher Grenzwert einer Funktion definieren lässt. 84 Definition 5.2 Es seien D ⊂ R, f : D → R. (i) Die Menge D = {x ∈ R : Es gibt eine Folge (xn ) in D mit lim xn = x} n→∞ heißt der Abschluss von D. (ii) Ist x0 ∈ D, so schreiben wir lim f (x) = a x→x0 (oder auch f (x) → a für x → x0 ), wenn für jede Folge (xn ) in D mit limn→∞ xn = x0 gilt limn→∞ f (xn ) = a. a heißt der Grenzwert von f bei x0 . Offensichtlich gilt immer D ⊂ D. Beachten Sie: In (ii) genügt es nicht, dass limn→∞ f (xn ) = a für eine Folge (xn ) mit xn → x0 gilt. Diese Bedingung muss für alle diese Folgen erfüllt sein. Beispiele. 1. Für f : R → R, f (x) = xk (k ∈ N0 ) und x0 ∈ R ist lim f (x) = lim xk = xk0 = f (x0 ). x→x0 x→x0 Für jede Folge (xn ) mit xn → x0 gilt nach dem Grenzwertsatz für Produkte nämlich lim xkn = xk0 . n→∞ 2. Für exp : R → R gilt lim exp(x) = 1. x→0 Um dies einzusehen, bemerken wir zuerst, dass für |x| < 1 gilt ∞ n ∞ X X x 1 ≤ |x| = |x|(e − 1). | exp(x) − 1| = n! n! n=1 n=1 Ist nun (xn ) eine Folge in R mit xn → 0, so folgt hieraus limn→∞ | exp(xn ) − 1| → 0 und damit exp(xn ) → 1 für n → ∞. Satz 5.3 Eine Funktion f : D → R ist genau dann stetig in x0 ∈ D, wenn gilt lim f (x) = f (x0 ). x→x0 85 Beweis. ⇒: Es sei (xn ) eine Folge in D mit xn → x0 . Zu gegebenem ε > 0 wählen wir δ > 0 mit |f (x) − f (x0 )| < ε für alle x ∈ D mit |x − x0 | < δ. Danach wählen wir N ∈ N mit |xn − x0 | < δ für alle n ≥ N . Für n ≥ N ist damit auch |f (xn ) − f (x0 )| < ε. ⇐: Die Rückrichtung zeigen wir durch Kontraposition: Ist f bei x0 nicht stetig, so gilt ∃ ε > 0 ∀ δ > 0 ∃ x ∈ D : |x − x0 | < δ und |f (x) − f (x0 )| ≥ ε. Es gibt also ein ε > 0, so dass wir insbesondere zu jedem δ = xn ∈ D finden mit |xn − x0 | < 1 n (n ∈ N) ein 1 und |f (xn ) − f (x0 )| ≥ ε. n Dann aber gilt xn → x0 und f (xn ) 6→ f (x0 ) und somit f (x) 6→ f (x0 ) für x → x0 . Beispiele. 1. Nach Beispiel 1 von Seite 85 ist die für jedes k ∈ N0 Funktion f : R → R, f (x) = xk stetig. 2. Die Exponentialfunktion exp : R → R ist stetig. Die Stetigkeit im Nullpunkt folgt sofort aus Beispiel 2 von Seite 85. Ist allgemein x0 ∈ R, so folgt hieraus auch lim exp(x) = exp(x0 ) lim exp(x − x0 ) = exp(x0 ). x→x } | 0 {z x→x0 =exp(0)=1 Wir zeigen nun, dass aus stetigen Funktionen zusammengesetzte Funktionen wieder stetig sind. Dabei definieren wir die Summe, die Differenz, das Produkt oder den Quotienten zweier Funktionen ganz allgemein punktweise: Definition 5.4 Es seien M eine Menge, f, g : M → R Funktionen. Man definiert dann dann f + g, f − g, f g : M → R und, falls g nirgends 0 ist, fg : M → R durch (f ± g)(x) = f (x) ± g(x), (f g)(x) = f (x)g(x), f f (x) (x) = . g g(x) (Hat g Nullstellen, so kann man auf diese Weise immer noch 0} → R definieren.) 86 f g : {x ∈ M : g(x) 6= Satz 5.5 Es seien f, g : D → R in x0 ∈ D stetige Funktionen. Dann sind auch die Funktionen f + g, f − g, f g : D → R und, falls g(x0 ) 6= 0, fg : {x ∈ D : g(x) 6= 0} → R stetig in x0 . Beweis. Das folgt sofort aus den Grenzwertsätzen. Auch die Komposition stetiger Abbildungen ist wieder stetig: Satz 5.6 Es seien D, E ⊂ R, f : D → E stetig in x0 ∈ D und g : E → R stetig in f (x0 ). Dann ist g ◦ f stetig in x0 . Beweis. Gilt xn → x0 in D, so folgt f (xn ) → f (x0 ) aus der Stetigkeit von f bei x0 und hieraus dann g(f (xn )) → g(f (x0 )) aus der Stetigkeit von g bei f (x0 ), wie zu zeigen war. Beispiele. 1. Ist f : D → R stetig, c ∈ R, so auch cf : R → R, x 7→ cf (x). cf ist ja das Produkt der konstanten Funktion mit Wert c und f . 2. Jedes Polynom, also jede Funktion f : R → R, f (x) = an xn + an−1 xn−1 + . . . + a1 x + a0 für gegebene Koeffizienten a0 , . . . , an ∈ R ist stetig. (Ist an 6= 0, so nennt man n den Grad dieses Polynoms.) 3. Jede rationale Funktion fg : R \ {x ∈ R : g(x) = 0} → R, wobei f und g Polynome sind, ist stetig. 4. Die Funktion f : R → R, f (x) = exp(x5 ) 2 + |x| ist stetig. Zum Schluss dieses Abschnitts bemerken wir noch, dass man all diese Ergebnisse direkt ins Komplexe übertragen kann. Die Definition der Stetigkeit ist genau die gleiche: Definition 5.7 Es sei nun D ⊂ C, z0 ∈ D. Eine Funktion f : D → C heißt stetig im Punkt z0 ∈ D, wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass für alle z ∈ D mit |z − z0 | < δ gilt |f (z) − f (z0 )| < ε, d.h.: ∀ ε > 0 ∃ δ > 0 ∀ z ∈ D : |z − z0 | < δ ⇒ |f (z) − f (z0 )| < ε. f : D → C heißt stetig, wenn f in jedem Punkt aus D stetig ist. Bemerkung. Genau wie zuvor zeigt man, dass die Stetigkeit in einem Punkt z0 ∈ D zu limz→z0 f (z) = f (z0 ) äquivalent ist und dass aus stetigen Funktionen (durch Addition, Subtraktion, Multiplikation und Division wie auch durch Komposition) zusammengesetzte Funktionen wieder stetig sind. Genau die gleiche Argumentation wir im Reellen zeigt, dass die Exponentialfunktion exp : C → C auch im Komplexen stetig ist. 87 5.2 Stetige Funktionen auf kompakten Intervallen Wir untersuchen nun drei grundlegende Sätze über stetige Funktionen auf einem abgeschlossenen beschränkten Intervall [a, b]. Ein solches Intervall nennt man auch kompakt. Für den folgenden Abschnitt fixieren wir a, b ∈ R mit a < b. Die im Folgenden wesentliche Eigenschaft solcher Intervalle ist das folgende Korollar zum Satz von Bolzano-Weierstraß, das man auch selbst oft wieder einfach ‘Satz von Bolzano-Weierstraß’ nennt. Korollar 5.8 Jede Folge in [a, b] besitzt eine in [a, b] konvergente Teilfolge. Beweis. Nach Satz 4.23 besitzt jede Folge in [a, b] eine konvergente Teilfolge, deren Limes nach Korollar 4.11 selbst in [a, b] liegt. Der erste Satz befasst sich mit der Existenz von Minima und Maxima stetiger Funktionen. Definition 5.9 Ist M eine Menge, f : M → R eine Abbildung, so nennt man f (nach oben/nach unten) beschränkt, wenn f (M ) (nach oben/unten) beschränkt ist. Satz 5.10 Es sei f : [a, b] → R stetig. (i) Dann ist f beschränkt. (ii) f nimmt ihr Minimum und Maximum an, d.h. es gibt Punkte xmin ∈ [a, b] und xmax ∈ [a, b] mit f (xmin ) = min f ([a, b]) f (xmax ) = max f ([a, b]). sowie Achtung: Für beide Aussagen ist es wichtig, dass das Intervall [a, b] kompakt, also abgeschlossen und beschränkt, ist! (Z.B. ist das Intervall (0, 1] beschränkt, die Funktion (0, 1] → R, x 7→ x1 aber stetig und unbeschränkt. Weiterhin ist R ein abgeschlossenes Intervall, die identische Funktion auf R jedoch ebenso stetig und unbeschränkt.) Des Weiteren sind die Extremalstellen xmin , xmax im Allgemeinen nicht eindeutig. Beweis von Satz 5.10. Setze M = sup f ([a, b]). Dann gibt es zu jedem n ∈ N ein xn ∈ [a, b] mit M− 1 ≤ f (xn ) ≤ M, n falls M < ∞, bzw. 88 n ≤ f (xn ), falls M = ∞. In jedem Fall gilt also f (xn ) → M mit n → ∞. Nach dem Satz von BolzanoWeierstraß in der Form von Korollar 5.8 gibt es eine Teilfolge (xnk ) mit xnk → xmax für ein xmax ∈ [a, b]. Aus der Stetigkeit von f folgt nun f (xmax ) = lim f (xnk ) = M k→∞ und damit erstens M = f (xmax ) < ∞, so dass f nach oben beschränkt ist, und zweitens f (xmax ) = M = max f ([a, b]). Wendet man das eben Gezeigte auf −f an, so zeigt sich, dass f auch nach unten beschränkt ist und auch sein Minimum annimmt. Der zweite Satz garantiert unter geeigneten Voraussetzungen, dass eine Gleichung von der Form f (x) = 0 eine Lösung in [a, b] besitzt. (Er zeigt sogar, wie man etwa mit Hilfe des sogenannten Intervallhalbierungsverfahren eine solche Lösung numerisch berechnen kann.) Satz 5.11 (Zwischenwertsatz) Es sei f : [a, b] → R stetig. Es gelte entweder f (a) > 0 und f (b) < 0 oder f (a) < 0 und f (b) > 0. Dann gibt es ein x0 ∈ (a, b) mit f (x0 ) = 0. Wir zeigen zunächst ein auch für sich genommen interessantes Lemma über stetige Funktionen. Lemma 5.12 Es sei f : D → R in x0 ∈ D stetig mit f (x0 ) > 0. Dann gibt es ein δ > 0 mit f (x) > 0 ∀ x ∈ D ∩ (x0 − δ, x0 + δ). (Indem man dies auf −f anwendet, ergibt sich eine analoge Aussage für f (x0 ) < 0.) Beweis. Setze ε = f (x0 ). Dann gibt es nach der Definition der Stetigkeit in x0 ein δ > 0 mit f (x) = f (x0 ) + f (x) − f (x0 ) ≥ f (x0 ) − |f (x) − f (x0 )| > f (x0 ) − ε = 0 für alle x ∈ D mit |x − x0 | < δ. Beweis von Satz 5.11. Es sei f (a) > 0 und f (b) < 0. Setze A := {x ∈ [a, b] : f (x) ≥ 0} und x0 := sup A. Wegen a ∈ A ist A nicht leer. Wir wählen (ähnlich wir im Beweis von Satz 5.10) eine Folge (xn ) in A mit limn→∞ xn = x0 . Da für jedes n gilt f (xn ) ≥ 0, muss auch f (x0 ) = lim f (xn ) ≥ 0 n→∞ 89 gelten. Insbesondere folgt x0 6= b. Wäre aber f (x0 ) > 0, so gäbe es nach Lemma 5.12 ein δ > 0 mit (x0 − δ, x0 + δ) ∩ [a, b] ⊂ A im Widerspruch zu x0 = sup A. Dies zeigt, dass in der Tat f (x0 ) = 0 ist. Wegen f (a), f (b) 6= 0, ist sogar x0 ∈ (a, b). Ist umgekehrt f (a) < 0 und f (b) > 0, so folgt die Behauptung, indem wir das eben Gezeigte auf −f anwenden. Tatsächlich folgt hieraus direkt, dass f alle Werte zwischen f (a) und f (b) annimmt: Korollar 5.13 Es sei f : [a, b] → R stetig. Setze c = min{f (a), f (b)}, d = max{f (a), f (b)}. Dann gilt [c, d] ⊂ f ([a, b]). Beweis. Natürlich ist immer {c, d} = {f (a), f (b)} ⊂ f ([a, b]). Es bleibt zu zeigen, dass, falls c 6= d, auch (c, d) ⊂ f ([a, b]) gilt. Es sei also y ∈ (c, d). Definiere g : [a, b] → R durch g(x) := f (x) − y. Dann ist g stetig und es gilt entweder g(a) = f (a) − y < 0 und g(b) = f (b) − y > 0 oder umgekehrt g(a) > 0 und g(b) < 0. Nach dem Zwischenwertsatz gibt es also tatsächlich ein x0 ∈ (a, b) mit 0 = g(x0 ) = f (x0 ) − y. Beachten Sie, dass f auch größere und kleinere Werte annehmen kann. Der letzte wichtige Satz in diesem Abschnitt zeigt, dass stetige Funktionen auf abgeschlossenen beschränkten Intervallen sogar einer verschärften Version der Stetigkeit genügen, die besagt, dass das δ zu ε unabhängig vom betrachteten Punkt x0 gewählt werden kann. Zur Erinnerung formulieren wir noch einmal die Bedingung, dass eine Funktion f : D → R, D ⊂ R, stetig ist: ∀ x ∈ D ∀ ε > 0 ∃ δ > 0 ∀ x0 ∈ D : |x0 − x| < δ ⇒ |f (x0 ) − f (x)| < ε. Definition 5.14 Eine Funktion f : D → R heißt gleichmäßig stetig, wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass für alle x, x0 ∈ D mit |x − x0 | < δ gilt |f (x) − f (x0 )| < ε, d.h.: ∀ ε > 0 ∃ δ > 0 ∀ x ∈ D ∀ x0 ∈ D : |x0 − x| < δ ⇒ |f (x0 ) − f (x)| < ε. Beispiele. 1. Offensichtlich ist jede gleichmäßig stetige Funktion auch stetig. (Die Umkehrung aber gilt, wie wir gleich sehen werden, nicht!) 2. Die Beispiele 1, 2 und 3 von Seite 83-84 (konstante Funktionen, identische Funktion und Absolutbetrag) sind – wie wir dort schon gezeigt haben – sogar gleichmäßig stetig. 90 3. Die Funktion f : R → R, f (x) = x2 aus Beispiel 4 von Seite 84 ist nicht gleichmäßig stetig. Für ε = 1 und jedes δ > 0 können wir nämlich x = wählen, so dass |x0 − x| = 2δ < δ, aber auch |f (x0 ) − f (x)| = 1 δ + 1 δ und x0 = 1 δ + δ 2 δ 2 1 2 δ2 − =1+ >ε 2 δ 4 ist. Satz 5.15 Jede stetige Funktion f : [a, b] → R ist sogar gleichmäßig stetig. Beweis. Angenommen f ist nicht gleichmäßig stetig. Dann gibt es ein ε > 0, so dass es zu jedem n ∈ N Punkte xn , x0n ∈ [a, b] gibt mit (wähle δ = n1 ) |x0n − xn | < 1 n aber |f (x0n ) − f (xn )| ≥ ε. Nach dem Satz von Bolzano-Weierstraß in der Form von Korollar 5.8 gibt es eine Teilfolge (xnk ) in [a, b] mit limk→∞ xnk = x für ein x ∈ [a, b]. Wegen |x0n − xn | < 1 → 0 mit n → ∞, folgt dann aber auch limk→∞ x0nk = x. Aus der Stetigkeit von n f (und dem Absolutbetrag) folgt nun der Widerspruch lim |f (x0nk ) − f (xnk )| = |f (x) − f (x)| = 0. {z } k→∞ | ≥ε für alle n Achtung: Wieder ist es wichtig vorausszusetzen, dass das betrachtete Intervall abgeschlossen und beschränkt ist! Z.B. ist (0, 1) → R, x 7→ x1 nicht gleichmäßig stetig. (Übungsaufgabe: Überlegen Sie sich das!) Beispiel 3 von Seite 91 zeigt, dass auch die Beschränktheit notwendig ist. √ Beispiel. Für jedes k ∈ N0 ist f : [0, ∞) → R, f (x) = k x gleichmäßig stetig. (Übung!) 5.3 Monotonie und Umkehrfunktionen Wir untersuchen nun bijektive Abbildungen f , für die sich die Zuordnungsvorschrift x 7→ f (x) umkehren lässt. Allgemein definiert man: Definition 5.16 Ist f : M → N eine bijektive Abbildung zwischen Mengen M und N , so ist die Umkehrfunktion f −1 : N → M definiert durch f −1 (y) = x ⇔ f (x) = y. 91 Definition 5.17 Es sei D ⊂ R. Eine Funktion f : D → R heißt (i) monoton wachsend, wenn ∀ x, x0 ∈ D : x < x0 ⇒ f (x) ≤ f (x0 ), (ii) streng monoton wachsend, wenn ∀ x, x0 ∈ D : x < x0 ⇒ f (x) < f (x0 ), (iii) monoton fallend, wenn ∀ x, x0 ∈ D : x < x0 ⇒ f (x) ≥ f (x0 ), und (iv) streng monoton fallend, wenn ∀ x, x0 ∈ D : x < x0 ⇒ f (x) > f (x0 ). Beispiele. 1. f : [0, ∞) → R, f (x) = xk (k ∈ N) ist streng monoton wachsend. 2. f : (0, ∞) → R, f (x) = x−k (k ∈ N) ist streng monoton fallend. 3. exp : R → R ist streng monoton wachsend: Für x < x0 ist x0 − x > 0 und daher exp(x0 − x) = aber ist auch P∞ n=0 (x0 −x)n n! > 1. Damit exp(x0 ) = exp(x + x0 − x) = exp(x) exp(x0 − x) > exp(x). Satz 5.18 Es seien D ⊂ R und f : D → R streng monoton wachsend (oder fallend). (i) Dann ist f : D → f (D) bijektiv und f −1 : f (D) → D ebenfalls streng monoton wachsend (bzw. fallend). (ii) Ist f stetig und D = [a, b] ein kompaktes Intervall, so ist auch f −1 stetig und f (D) = [f (a), f (b)] (bzw. f (D) = [f (b), f (a)]). Hierbei ist mit f : D → f (D) diejenige Funktion gemeint, die aus f : D → R entsteht, wenn man den Bildbereich R auf das Bild f (D) einschränkt. Streng genommen sind das zwei verschieden Funktionen, wenn nicht gerade f (D) = R ist. Für die Stetigkeit oder Monotonie einer Funktion ist diese Unterscheidung jedoch offenbar irrelevant. Genauso können wir f −1 auch wieder als Funktion f −1 : f (D) → R mit Wertebereich R auffassen. Beweis. (i) Wir behandeln nur den Fall, dass f streng monoton wächst. Der andere Fall ergibt sich völlig analog dazu (oder daraus durch Übergang zu −f .) Als streng monoton wachsende Funktion ist f injektiv. Offensichtlich ist f : D → f (D) (nach Konstruktion) auch surjektiv, also bijektiv. Sind nun y, y 0 ∈ f (D) mit y < y 0 , etwa f (x) = y und f (x0 ) = y 0 , so folgt f −1 (y) < f −1 (y 0 ), denn anderenfalls wäre x = f −1 (y) ≥ f −1 (y 0 ) = x0 und damit y = f (x) ≥ f (x0 ) = y 0 . (ii) Setze [c, d] = [f (a), f (b)] (bzw. [c, d] = [f (b), f (a)]). Aus der Monotonie von f folgt f (D) ⊂ [c, d]. Andererseits gilt nach Korollar 5.13 auch [c, d] ⊂ f (D). 92 Wäre nun f −1 nicht stetig, so gäbe es ein y ∈ [c, d] und eine Folge (yn ) in [c, d] mit yn → y aber f −1 (yn ) 6→ f −1 (y). D.h. es gäbe ein ε > 0 und unendlich viele Indizes n1 < n2 < . . . mit |f −1 (ynk ) − f −1 (y)| ≥ ε für alle k ∈ N. Nach dem Satz von Bolzano-Weierstraß gibt es dann eine Teilfolge (f −1 (ynkj ))j∈N von (f −1 (ynk ))k∈N mit limj→∞ f −1 (ynkj ) = x für ein x ∈ [a, b]. Aus der Stetigkeit von f ergibt sich dann aber f (x) = lim f (f −1 (ynkj )) = lim ynkj = y j→∞ j→∞ und hieraus lim f −1 (ynkj ) = x = f −1 (y) j→∞ im Widerspruch zu |f −1 (ynk ) − f −1 (y)| ≥ ε für alle k ∈ N. Beachten Sie: Für die Stetigkeit der Umkehrfunktion ist es wichtig vorauszusetzen, dass D ein Intervall ist. Z.B. ist die Umkehrfunktion der stetigen und streng wachsenden Funktion ( x für 0 ≤ x ≤ 1, f : [0, 1] ∪ (2, 3] → [0, 2], f (x) = x − 1 für 2 < x ≤ 3, gegeben durch f −1 : [0, 2] → [0, 1] ∪ (2, 3], ( x für 0 ≤ x ≤ 1, f −1 (x) = x + 1 für 1 < x ≤ 1, und somit nicht stetig. Beispiele. 1. Die Umkehrfunktion von f : [0, ∞) → [0, ∞), f (x) = xk (k ∈ N) ist √ f −1 : [0, ∞) → [0, ∞), f −1 (y) = k y. 2. Die Exponentialfunktion bildet R bijektiv auf (0, ∞) ab. Wir schon, dass exp(R) ⊂ (0, ∞) ist, s. Satz 4.47(ii). Wegen exp(k) = P∞ wissen kn 1 ≥ k und damit auch exp(−k) = exp(k) ≤ k1 , ergibt sich aus Satz n=0 n! 5.18(ii) [ [ h1 i , k = (0, ∞). exp(R) ⊃ exp([−k, k]) ⊃ k k∈N k∈N Das letzte Beispiel gibt zur Definition einer wichtigen Funktion Anlass. Definition 5.19 Die Umkehrfunktion der Exponentialfunktion heißt der natürliche Logarithmus. Sie wird mit log : (0, ∞) → R oder auch mit ln : (0, ∞) → R bezeichnet. 93 Nach Satz 5.18 ist log stetig und streng monoton wachsend. Aus der Funktionalgleichung für exp (‘Summen werden zu Produkten’, vgl. Satz 4.46) gewinnt man die entsprechende Funktionalgleichung für log (‘Produkte werden zu Summen’). Satz 5.20 Für x, x0 > 0 gilt log(xx0 ) = log(x) + log(x0 ). Beweis. Es ist exp(log(xx0 )) = xx0 = exp(log(x)) exp(log(x0 )) = exp(log(x) + log(x0 )). Da exp bijektiv ist, folgt hieraus auch log(xx0 ) = log(x) + log(x0 ) wie behauptet. Mit Hilfe der Exponential- und Logarithumsfunktion lassen sich nun beliebige allgemeine Potenzen definieren. Definition 5.21 Für a > 0 und b ∈ R definieren wir die reelle Zahl ab (sprich: ‘a hoch b’) durch ab := exp(b log(a)). Beachte, dass dies für b ∈ Z wegen (vgl. den Beweis von Satz 4.47) exp(b log(a)) = (exp(log(a)))b = ab mit unserer früheren Definition übereinstimmt. Für b = √ 1 a n = n a, denn 1 an n = exp 1 n log a n 1 n (n ∈ N) ist außerdem 1 = exp n · log a = exp(log a) = a. n Insbesondere ist für a = e = exp(1) und somit log(e) = 1 exp(x) = exp(x log(e)) = ex für alle x ∈ R. Allgemeiner schreibt man auch für z ∈ C exp(z) = ez . Wir bemerken noch, dass sich unmittelbar aus dieser Definition das Rechengesetz log(ab ) = b log(a). ergibt. 94 Satz 5.22 (i) Es sei b ∈ R fixiert. Die allgemeine Potenzfunktion x 7→ xb (0, ∞) → (0, ∞), ist stetig, für b > 0 streng monoton wachsend und für b < 0 streng monoton fallend. Es gilt xb (x0 )b = (xx0 )b für alle x, x0 > 0. (ii) Es sei a > 0 fixiert. Die Exponentialfunktion zur Basis a x 7→ ax R → (0, ∞), ist stetig, für a > 1 streng monoton wachsend und für 0 < a < 1 streng monoton fallend. Es gilt 0 ax+x = ax ax 0 0 axx = (ax )x sowie 0 für alle x.x0 ∈ R. Beweis. Setze pb : (0, ∞) → (0, ∞), pb (x) = xb und expa : R → (0, ∞), expa (x) = ax . Die Stetigkeit von pb und expa ergibt sich daraus, dass sich diese Funktionen als Verkettung stetiger Funktionen schreiben lassen. Ist nämlich fc : R → R für (festes) c ∈ R gegeben durch fc (x) = cx, so ist pb = exp ◦fb ◦ log und expa = exp ◦flog a . Übungsaufgabe: Beweisen Sie die übrigen Aussagen! 5.4 Asympotisches Verhalten In diesem Abschnitt untersuchen und vergleichen wir das Verhalten von xα , exp(x) und log(x) für betragsmäßig sehr kleine oder sehr große Werte von x und insbesondere im Limes x → 0 und x → ∞. Dazu müssen wir zunächst auch uneigentliche Funktionengrenzwerte definieren. Definition 5.23 Es seien D ⊂ R, f : D → R. (i) Ist x0 ∈ D und c ∈ {−∞, +∞}, so schreiben wir lim f (x) = c, x→x0 wenn für jede Folge (xn ) in D, die gegen x0 konvergiert, gilt limn→∞ f (xn ) = c (im uneigentlichen Sinne). 95 (ii) Ist D nach unten (oder oben) unbeschränkt und c ∈ R ∪ {−∞, +∞}, so schreiben wir lim f (x) = c bzw. x→−∞ lim f (x) = c, x→+∞ wenn für jede Folge (xn ) in D, die gegen −∞ bzw. +∞ uneigentlich konvergiert, gilt limn→∞ f (xn ) = c (im eigentlichen oder uneigentlichen Sinne). Beachten Sie, dass diese Grenzwerte und sogar die bloße Existenz dieser Grenzwerte vom Definitionsbereich D abhängt. Man schreibt die Bedingung x ∈ D zur Verdeutlichung daher auch oft explizit unter das Limeszeichen. Beispiele. 1. Für D = (0, +∞) ist lim x→0 x∈D 1 1 = lim = +∞, x→0 x x x>0 für D = (−∞, 0) aber lim x→0 x∈D 1 1 = lim = −∞. x→0 x x x<0 Für D = R \ {0} existiert lim x→0 x∈D 1 x = lim x→0 x6=0 1 x nicht. 2. Es sei D = R und p : R → R, p(x) = an xn + . . . a1 x + a0 ein Polynom mit an > 0. Dann ist ( +∞, falls n gerade ist, lim p(x) = ∞ und lim p(x) = x→∞ x→−∞ −∞, falls n ungerade ist. Übungsaufgabe: Zeigen Sie dies! Wir vergleichen nun das Wachstumsverhalten der Exponential-, Potenz- und Logarithumsfunktion für x → 0 und x → ∞. Satz 5.24 Für jedes α ∈ R gilt ex = ∞. x→∞ xα Man sagt daher, die Exponentialfunktion wachse stärker als jede Potenz. Beweis. Wir wählen k ∈ N mit k ≥ α. Für x ≥ 1 ist nach Satz 5.22(ii) lim x e = ∞ X xn n=0 xk+1 xxα > ≥ , n! (k + 1)! (k + 1)! ex x d.h. xα ≥ (k+1)! . Ist nun (xn ) eine Folge mit xn → ∞ und also auch xn so folgt hieraus auch limn→∞ exα = +∞. n 96 xn (k+1)! → ∞, Korollar 5.25 Für jedes α ∈ R gilt lim xα e−x = 0 1 lim xα e x = +∞. x→0 und x→∞ x>0 Beweis. Die erste Behauptung folgt aus xα e−x = Die Zweite ergibt sich (mit y = x1 ) aus 1 x−α ex für x > 0 und Satz 5.24. 1 lim xα e x = lim y −α ey = ∞ x→0 x>0 y→∞ nach Satz 5.24. Eine weitere unmittelbare Konsequenz ist das Korollar 5.26 Es gilt (i) limx→+∞ ex = +∞ und limx→−∞ ex = 0 sowie (ii) limx→+∞ log x = +∞ und lim x→0 log x = −∞. x>0 Beweis. (i) folgt sofort aus Satz 5.24 und Korollar 5.25 im Falle α = 0. (ii) Ist (xn ) eine Folge mit xn → ∞ und K > 0, so gibt es ein N ∈ N mit xn > eK für alle n ≥ N . Aus der Monotonie des Logarithmus folgt dann aber auch log xn ≥ log eK = K für n ≥ N . Dies zeigt limx→+∞ log x = +∞. Die zweite Behauptung ergibt sich hieraus, denn es ist lim log x = lim log(y −1 ) = − lim log y = −∞. x→0 y→+∞ x>0 y→+∞ Korollar 5.27 (i) Für jedes α > 0 gilt lim xα = +∞ lim xα = 0. x→0 und x→+∞ x>0 (ii) Für jedes α < 0 gilt lim xα = 0 x→+∞ und lim xα = +∞. x→0 x>0 97 Beweis. (i) Ist (xn ) eine Folge mit xn → +∞, so folgt log xn → ∞ wie eben gesehen und damit auch xαn = eα log xn → ∞. Dies zeigt limx→+∞ xα = +∞. Daraus folgt auch 1 = 0. y→∞ y α lim xα = lim (y −1 )α = lim x→0 y→∞ x>0 (ii) Dies folgt aus (i) wegen lim xα = lim y −α = 0 y→0 x→+∞ und y>0 lim xα = lim y −α = +∞. x→0 y→+∞ x>0 Wir können also die Potenzfunktion x → 7 x für positive α auf [0, ∞) stetig α fortsetzen, indem wir 0 := 0 vereinbaren. α Korollar 5.28 Für jedes α > 0 gilt log x =0 x→+∞ xα lim und lim xα log x = 0. x→0 x>0 Das heißt: Der Logarithmus wächst im Unendlichen langsamer als jede positive Potenz; für x → 0 divergiert er langsamer gegen Unendlich als jede positive Potenz gegen 0 konvergiert. Beweis. Mit x → ∞ gilt auch α log x → ∞ und daher nach Korollar 5.25 1 α log x log x = lim · α log x = 0. α x→+∞ x x→+∞ α e lim Hieraus ergibt sich auch lim xα log x = lim y −α log(y −1 ) = lim x→0 x>0 y→∞ y→∞ − log y = 0. yα 5.5 Trigonometrische Funktionen Wir definieren nun die trigonometrischen Funktionen sin, cos und tan und untersuchen einige ihre Eigenschaften. Für x ∈ R ist |eix |2 = eix eix = eix e−ix = e0 = 1. eix liegt also auf dem Einheitskreis in der komplexen Ebene. 98 Definition 5.29 Die Cosinusfunktion cos : R → R und die Sinusfunktion sin : R → R sind definiert durch cos x = Re eix sin x = Im eix und für x ∈ R. Unmittelbar aus der Definition ergeben sich die im folgenden Satz zusammengestellten Eigenschaften. Satz 5.30 Für alle x ∈ R gelten (i) die Eulersche Fomel eix = cos x + i sin x, (ii) cos x = 12 (eix + e−ix ) und sin x = 1 (eix 2i − e−ix ), (iii) cos(−x) = cos x und sin(−x) = − sin x, (iv) der ‘trigonometrische Pythagoras’ cos2 x + sin2 x = 1, (mit cos2 x = (cos x)2 und sin2 x = (sin x)2 ) sowie (v) cos(0) = 1 und sin(0) = 0. Beweis. Klar. Satz 5.31 cos und sin sind stetig. Beweis. Ist (xn ) eine reelle Folge mit xn → x, so folgt aus der Bemerkung von Seite 87 und Satz 4.22 cos xn = Re eixn → Re eix = cos x und sin xn = Im eixn → Im eix = sin x. Endlich können wir nun auch die schon am Ende von Abschnitt 3.5 benutzten Additionstheoreme für den Cosinus und den Sinus beweisen. Satz 5.32 Für x, y ∈ R gelten cos(x + y) = cos x cos y − sin x sin y sin(x + y) = sin x cos y + cos x sin y. 99 und Beweis. Aus der Eulerschen Formel und der Funktionalgleichung der Exponentialfunktion folgt cos(x + y) = i sin(x + y) = ei(x+y) = eix eiy = (cos x + i sin x)(cos y + i sin y) = cos x cos y − sin x sin y + i(sin x cos y + cos x sin y), woraus die Behauptung folgt, indem man Real- und Imaginärteil vergleicht. Aus der Exponentialreihe lässt sich auch eine Reihendarstellung für cos und sin ableiten: Satz 5.33 Für jedes x ∈ R ist cos x = sin x = ∞ X n=0 ∞ X (−1)n x2n x2 x4 =1− + − +... (2n)! 2! 4! (−1)n x2n+1 x3 x 5 =x− + − +.... (2n + 1)! 3! 5! n=0 und Diese Reihen konvergieren absolut. Beweis. Die absolute Konvergenz dieser Reihen folgt sofort aus der absoluten Konvergenz der Exponentialreihe und dem Majorantenkriterium. Für alle N ∈ N gilt 2N +1 X n=0 N N 2n X (ix)n X x2n+1 n x (−1) (−1)n = +i , n! (2n)! (2n + 1)! n=0 n=0 woraus im Limes N → ∞ cos x + i sin x = eix = ∞ X (ix)n n=0 n! = ∞ X n=0 (−1)n ∞ X x2n x2n+1 +i (−1)n (2n)! (2n + 1)! n=0 folgt. Die Behauptung ergibt sich nun durch Vergleich des Real- und Imaginärteils. Zur näherungsweisen Berechnung dieser Reihen durch ihre Partialsummen, beweisen wir noch eine Restgliedabschätzung. Dazu setzen wir R2N +2 (x) := cos x − N X n=0 (−1)n ∞ X x2n x2n = (−1)n , (2n)! n=N +1 (2n)! N ∞ 2n+1 X X x2n+1 n x R2N +3 (x) := sin x − (−1) = (−1)n . (2n + 1)! n=N +1 (2n + 1)! n=0 100 Satz 5.34 Für |x| ≤ 2N + 3 bzw. |x| ≤ 2N + 4 gilt 2N +2 2N +3 x x . |R2N +2 (x)| ≤ bzw. |R2N +3 (x)| ≤ (2N + 2)! (2N + 3)! Beweis. Setze an = |x| ≤ 2N + 4 ist |x|2n , (2n)! bn = |x|2n+1 . (2n+1)! Für n ≥ N + 1 und |x| ≤ 2N + 3 bzw. |x|2 (2N + 3)2 an ≤ an ≤ an (2n + 1)(2n + 2) (2N + 3)(2N + 4) |x|2 (2N + 4)2 = bn ≤ bn ≤ bn , (2n + 2)(2n + 3) (2N + 4)(2N + 5) an+1 = bn+1 bzw. d.h. (an )n≥N +1 und (bn )n≥N +1 sind monoton fallende Nullfolgen. Aus der Abschätzung im Leibnizkriterium (Satz 4.37, der auch für m = n0 −1 richtig bleibt) folgt daher 2N +2 ∞ 2n X x n ≤ x bzw. |R2N +2 (x)| = (−1) (2N + 2)! (2n)! n=N +1 ∞ 2N +3 2n+1 X x n ≤ x . |R2N +3 (x)| = (−1) (2n + 1)! (2N + 3)! n=N +1 Wir wissen schon, dass sin(0) = 0 und cos(0) = 1 ist. Genauer können wir nun folgern: Korollar 5.35 Es gilt lim x→0 x6=0 sin x =1 x Beweis. Wegen |R3 (x)| ≤ 2 cos x−(1− x ) |x|3 3! und lim x→0 x6=0 1 1 − cos x = . x2 2 für |x| ≤ 3 ist | sin xx−x | ≤ |x|2 6 und wegen |R4 (x)| ≤ x4 4! 2 2 für |x| ≤ 4 ist | | ≤ |x| . Hieraus folgt die Behauptung. x2 24 Als weitere Folgerung halten wir fest, dass der Cosinus auf dem Intervall [0, 2] sein Vorzeichen wechselt. Lemma 5.36 Der Cosinus besizt im Intervall [0, 2] eine Nullstelle. Beweis. Nach Satz 5.30 ist cos(0) = 1. Andererseits gilt nach Satz 5.34 |R4 (2)| ≤ 24 und somit 4! 22 24 2 1 cos(2) ≤ 1 − + = 1 − 2 + = − < 0. 2! 4! 3 3 Die Behauptung folgt daher aus dem Zwischenwertsatz. 101 Definition 5.37 Die Kreiszahl π ist definiert als das Doppelte der kleinsten positiven Nullstelle von cos: π := 2 min{x > 0 : cos x = 0}. Beachte, dass das Minimum der Menge M := {x > 0 : cos x = 0} tatsächlich existiert. Nach Lemma 5.36 ist M nicht leer. Setzt man x = inf M (≥ 0) und wählt man eine Folge (xn ) aus M mit xn → x, so folgt aus der Stetigkeit des Cosinus auch cos x = 0. Wegen cos(0) = 1 6= 0 muss außerdem x > 0 sein. Es ist also x ∈ M und damit x = min M . iπ Satz 5.38 Es gilt e 2 = i. Beweis. Wegen cos π2 = 0 ist nach Satz 5.30(iv) sin π2 = ±1. Satz 5.34 liefert nun für x = π2 ≤ 2 x2 x sin x = x + R3 (x) ≥ x 1 − ≥ >0 | {z 6 } 3 ≥1− 46 = 13 iπ und somit sin π2 = 1. Dies zeigt e 2 = cos π2 + i sin π2 = i. Hieraus ergibt sich allgemein e x eix cos(x) sin(x) ··· ··· ··· ··· iπn 2 0 1 1 0 = in für n ∈ Z und daraus die Wertetabelle π 2 i 0 1 3π π 2π 2 −1 −i 1 −1 0 1 0 −1 0 ··· ··· ··· ··· Insbesondere gilt die wunderschöne Formel eiπ + 1 = 0, die die Eulersche Zahl e, die Kreiszahl π, die imaginäre Einheit i, das neutrale Element 1 bezüglich der Multiplikation und das neutrale Element 0 bezüglich der Addition verbindet. Als Folgerung aus dieser Wertetabelle und Satz 5.38 erhalten wir weitere Eigenschaften der Cosinus- und Sinusfunktion Korollar 5.39 Für x ∈ R gilt (i) cos(x + 2π) = cos x und sin(x + 2π) = sin(x), (ii) cos(x + π) = − cos x und sin(x + π) = − sin(x), (iii) cos(x + π2 ) = − sin x und sin(x + π2 ) = cos x, (iv) cos( π2 − x) = sin x und sin( π2 − x) = cos(x). 102 Beweis. Die Aussagen (i)–(iv) folgen direkt aus den Additionstheoremen, der oben angegebenen Wertetabelle und Satz 5.30(iii). Z.B. folgt die erste Gleichung in (iv) aus cos( π π π − x) = cos cos(−x) − sin sin(−x) = sin x. 2 | {z 2} | {z2} | {z } =0 =1 =− sin x Bemerkung. (i) besagt, dass die Funktionen cos und sin 2π-periodisch sind. Allgemein nennt man eine Funktion f : R → R p-periodisch für ein p ∈ R, wenn gilt f (x + p) = f (x) ∀ x ∈ R. Wir charakterisieren nun noch die Nullstellenmengen sowie die Positivitätsund Negativitätsbereiche von cos und sin. Wegen der 2π-Periodizität genügt es hier, das Intervall [0, 2π) zu betrachten. Satz 5.40 Auf [0, 2π) gilt 3π π > 0 für x ∈ [0, 2 ) ∪ ( 2 , 2π), cos x = 0 für x ∈ { π2 , 3π }, 2 π 3π < 0 für x ∈ ( 2 , 2 ), > 0 für x ∈ (0, π), sin x = 0 für x ∈ {0, π}, < 0 für x ∈ (π, 2π). Beweis. Wegen sin(0) = 0 ist nach Korollar 5.39(ii) auch sin(π) = 0. Andererseits ist nach Definition von π und wegen cos x = cos(−x) für alle x und cos(0) = 1 auch cos x > 0 für − π2 < x < π2 . Nach 5.39(iii) ist daher sin x > 0 für 0 < x < π und damit nach 5.39(ii) auch sin x < 0 für π < x < 2π. Aus 5.39(i) und (iii) folgen nun auch die entsprechenden Aussagen für den Cosinus. Korollar 5.41 Für x ∈ R ist (i) cos x = 0 ⇔ x ∈ π 2 + πZ und sin x = 0 ⇔ x ∈ πZ, (ii) eix = 1 ⇔ x ∈ 2πZ. Beweis. (i) Klar nach Korollar 5.39(i) und Satz 5.40. (ii) Es gilt eix = 1 genau dann, wenn cos x = 1 und sin x = 0 ist. Dabei ist nach (i) sin x = 0 genau dann, wenn x ∈ πZ ist. Nach 5.39(ii) ist außerdem cos(nπ) = (−1)n für ∈ Z. Hieraus folgt die Behauptung. Auch die Quotienten von Sinus und Cosinus sind wichtige Größen, weshalb sie einen eigenen Namen verdienen. 103 Definition 5.42 durch (i) Die Tangensfunktion tan : R \ ( π2 + πZ) → R ist definiert tan x = sin x . cos x (ii) Die Cotangensfunktion cot : R \ πZ → R ist definiert durch cot x = cos x . sin x Da diese Funktionen durch cos und sin vollständig beschrieben sind, diskutieren wir ihre Eigenschaften hier nicht im Detail, bemerken aber noch, dass sie sogar periodisch zur Periode π sind: tan(x + π) = tan x bzw. für alle x, für die dieser Ausdruck definiert ist. 104 cot(x + π) = cot x Kapitel 6 Differentiation Wir wollen das Verhalten einer Funktion f : D → R (D ⊂ R) nun lokal, d.h. in der Nähe eines gegebenen Punktes x0 ∈ D genauer untersuchen. Ist f in x0 stetig, so bedeutet dies gerade, dass sich f (x) für x nahe x0 durch einen konstanten Wert, nämlich f (x0 ) approximieren lässt; es gilt dann ja lim f (x) = f (x0 ). x→x0 Etwas umständlicher lässt sich das so ausdrücken: In einer (kleinen) Umgebung (x0 − η, x0 + η) ∩ D lässt sich die Funktion f durch die konstante Abbildung x 7→ f (x0 ) approximieren. Damit ist aber noch nicht quantifiziert, wie gut diese Approximation für p x 6= x0 ist. Z.B. ist R → R, x 7→ k |x| stetig in x0 = 0, die Konvergenz f (x) → f (0) für große k aber sehr langsam. Dies hat zur Folge, dass der map k ximale Approximationsfehler (im Beispiel |x|) viel größer sein kann als der Abstand von x zu x0 . Besonders gutartig sind nun solche Funktionen, für die sich eine lokale Änderungsrate definieren lässt. Das heißt, dass es ein a ∈ R (die ‘Änderungsrate’) gibt, das das Verhältnis der Differenz der Funktionswerte f (x) − f (x0 ) und der Differenz der Argumente x − x0 approximiert, so dass also f (x) − f (x0 ) ≈a x − x0 gilt. (Genauer: Für x → x0 konvergiert die linke Seite gegen a.) Auflösen nach f (x) ergibt dann f (x) ≈ f (x0 ) + a(x − x0 ), wobei der Approximationsfehler sehr viel kleiner als |x − x0 | ist. (Genauer: Nach Division durch x − x0 konvergiert der Fehler für x → x0 immer noch gegen 0.) Wie wir sehen werden ist dies für viele Funktionen der Fall, insbesondere für Polynome, rationale Funktionen, trigonometrische Funktionen, allgemeine Potenz105 und Exponentialfunktionen und den Logarithmus. Dies führt zur Definition der Differenzierbarkeit von f in x0 . Während die Stetigkeit also eine Approximation von f durch eine konstante Funktion liefert, erhalten wir aus der letzten Gleichung eine wesentlich genauere Approximation von f durch die affine Abbildung1 x 7→ f (x0 ) + a(x − x0 ). Es geht also eigentlich darum, die Funktion f lokal zu ‘linearisieren’ und sie dadurch weiteren Untersuchungen zugänglicher zu machen. 6.1 Definition, Beispiele und Grundlagen Definition 6.1 Es seien D ⊂ R und f : D → R. (i) Es sei x0 ∈ D, so dass es mindestens eine Folge (xn ) in D \ {x0 } gibt mit xn → x0 . Existiert der Grenzwert f 0 (x0 ) = x→x lim 0 x6=x0 f (x) − f (x0 ) x − x0 (x0 ) , so heißt f differenzierbar in x0 . f 0 (x0 ) der Differenzenquotienten f (x)−f x−x0 heißt der Differentialquotient bei x0 oder auch die Ableitung von f bei x0 . Statt f 0 (x0 ) schreibt man auch df (x0 ). dx (ii) Ist f in jedem Punkt x0 ∈ D differenzierbar, so heißt f selbst differenzierbar. Die Abbildung f 0 : D → R, x 7→ f 0 (x) nennt man dann die Ableitung von f. Geometrisch ist der Differenzenquotient die Steigung der Sekante des Graphen von f durch die Punkte (x0 , f (x0 )) und (x, f (x)). Im Limes x → x0 gehen diese Sekanten in eine Tangente an den Graphen über, die diesen im Punkt (x0 , f (x0 )) berührt. Bemerkungen. 1. Die Bedingung, dass es mindestens eine gegen x0 konvergente Folge in D \ {x0 } geben muss, heißt, dasss x0 kein isolierter Punkt von D ist. Sie ist für den wichtigsten Fall, dass D ein Intervall ist, immer für alle x0 ∈ D erfüllt. 2. Oft schreibt man den Differentialquotienten in der äquivalenten Form f (x0 + h) − f (x0 ) , h→0 h f 0 (x0 ) = lim wobei hier h → 0 eigentlich bedeutet h → 0 mit h 6= 0 und x0 + h ∈ D. 1 Abbildungen der Form x 7→ ax + b mit a, b ∈ R nennt man affin. 106 Beispiele. 1. Ist f : R → R konstant, etwa f (x) = c, so gilt für jedes x0 ∈ R f 0 (x0 ) = x→x lim 0 x6=x0 f (x) − f (x0 ) = x→x lim 0 = 0. 0 x − x0 x6=x0 2. Ist f : R → R affin, etwa f (x) = ax + b, so gilt für jedes x0 ∈ R f (x0 + h) − f (x0 ) a(x0 + h) + b − ax0 − b = lim = a. h→0 h→0 x − x0 h f 0 (x0 ) = lim 3. Es sei nun f : R → R, f (x) = xn (n ∈ N). Dann ist für jedes x0 ∈ R (x0 + h)n − xn0 h→0 h n X n n−k k 1 n n−1 x0 + nx0 h + x0 h − xn0 = nxn−1 . = lim 0 h→0 h k k=2 f 0 (x0 ) = lim 4. Für die Exponentialfunktion ergibt sich für alle x exp(x + h) − exp(x) h→0 h exp(h) − exp(0) = exp(x), = exp(x) lim h→0 h exp0 (x) = lim denn für |h| < 1 ist | exp(h) − 1 − h| ≤ ∞ X |h|k k=2 ∞ X 1 ≤ |h| ≤ e|h|2 . k! k! k=2 2 Dies ist eine fundamental wichtige Eigenschaft der Exponentialfunktion: Sie ist ihre eigene Ableitung! 5. Die Ableitung des Sinus ist der Cosinus. Für x ∈ R ist nämlich sin(x + h) − sin x h→0 h sin x cos h + cos x sin h − sin x = lim h→0 h cos h − 1 sin h = sin x lim + cos x lim = cos x h→0 h→0 h h sin0 (x) = lim nach Korollar 5.35. 107 6. Umgekehrt ist die Ableitung des Cosinus das Negative des Sinus. Für x ∈ R ist nämlich cos(x + h) − cos x h→0 h cos x cos h − sin x sin h − cos x = lim h→0 h sin h cos h − 1 − sin x lim = − sin x = cos x lim h→0 h h→0 h cos0 (x) = lim nach Korollar 5.35. 7. Die Funktion f : R → R, f (x) = |x| ist im Nullpunkt nicht differenzierbar, n denn für xn = (−1) → 0 (n → ∞) existiert der Grenzwert von n |xn | f (xn ) − f (0) = = (−1)n xn xn nicht. (In jedem Punkt x 6= 0 ist f aber differenzierbar, was man wie in Beispiel 2 sieht.) Die einseitigen Grenzwerte lim x→0 x>0 f (x) − f (0) =1 x und lim x→0 x<0 f (x) − f (0) = −1 x existieren in diesem Beispiel jedoch. Bemerkung. Im Falle der Existenz nennt man f+0 (x0 ) = x→x lim 0 x>x0 f (x) − f (x0 ) x − x0 f−0 (x0 ) = x→x lim und 0 x<x0 f (x) − f (x0 ) x − x0 die rechtsseitige bzw. linksseitige Ableitung in x0 . Wir kommen nun auf unsere eingangs gegebene Motivation der Approximierbarkeit von Funktionen zurück. Satz 6.2 Es seien x0 ∈ D, so dass es mindestens eine Folge (xn ) in D \ {x0 } gibt mit xn → x0 , und f : D → R. Genau dann ist f in x0 differenzierbar, wenn es ein a ∈ R gibt, so dass f (x) = f (x0 ) + a(x − x0 ) + r(x) mit einer Funktion r gibt, für die lim x→x 0 x6=x0 0 Ist dies der Fall, so ist a = f (x0 ). 108 r(x) x−x0 = 0 ist. In diesem Sinne ist die Abbildung x 7→ f (x0 )+f 0 (x0 )(x−x0 ) die Linearisierung von f in der Nähe von x0 .2 Beweis. Für a ∈ R ist die gefragte Gleichung gerade für r(x) = f (x) − f (x0 ) − a(x − x0 ) erfüllt. Aus r(x) f (x) − f (x0 ) = −a x − x0 x − x0 ergibt sich nun, dass die linke Seite für x → x0 genau dann gegen 0 konvergiert, wenn f bei x0 differenzierbar ist und a = f 0 (x0 ) gilt. Diffenzierbare Funktionen sind insbesondere stetig, denn es gilt: Satz 6.3 Ist D ⊂ R, x0 ∈ D und f : D → R in x0 differenzierbar, so ist f in x0 stetig. Beweis. Für r wie in Satz 6.2 ist offensichtlich limx→x0 r(x) = 0, da ja sogar r(x) = 0 ist, so dass sich im Limes x → x0 lim x→x 0 x−x0 x6=x 0 f (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + r(x) → f (x0 ) | {z } |{z} →0 →0 ergibt. Beachten Sie: Die Umkehrung gilt nicht!! (S. Beispiel 7 von Seite 108.) Ähnlich wie bei der Stetigkeit sind auch aus differenzierbaren Funktionen zusammengesetzte Funktionen wieder differenzierbar. Satz 6.4 Es seien f, g : D → R in x0 ∈ D differenzierbare Funktionen und λ, µ ∈ R. Dann gilt: (i) Linearität: Auch λf + µg ist bei x0 differenzierbar. Dabei ist (λf + µg)(x0 ) = λf 0 (x0 ) + µg 0 (x0 ), (ii) Produktregel: Auch f g ist bei x0 differenzierbar. Es ist (f g)0 (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ), (iii) die Quotientenregel: Falls g(x0 ) 6= 0, zierbar in x0 mit f 0 g 2 (x0 ) = f g : {x ∈ D : g(x) 6= 0} → R differen- f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 ) . (g(x0 ))2 Be wise, linearize! (Engl. Sprichwort) 109 Beweis. (i) Nach den Grenzwertsätzen gilt in der Tat lim x→x0 x6=x0 λf (x) + µg(x) − λf (x0 ) − µg(x0 ) x − x0 = λ x→x lim 0 x6=x0 f (x) − f (x0 ) g(x) − g(x0 ) + µ x→x lim = λf 0 (x0 ) + µg 0 (x0 ) 0 x − x0 x − x 0 x6=x0 (ii) Dies folgt aus f (x)g(x) − f (x0 )g(x0 ) f (x)g(x) − f (x)g(x0 ) + f (x)g(x0 ) − f (x0 )g(x0 ) = x − x0 x − x0 g(x) − g(x0 ) f (x) − f (x0 ) = f (x) +g(x0 ) |{z} x − x0 x − x0 {z } | {z } →f (x0 ) | →g 0 (x0 ) →f 0 (x0 ) → f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ) im Grenzwert x → x0 , wobei wir Satz 6.3 benutzt haben. (iii) Für den Quotienten schließlich betrachten wir zunächst den Fall f = 1. Nach Satz 6.3 ist dann 1 g(x) − 1 g(x0 ) x − x0 = g 0 (x0 ) 1 g(x0 ) − g(x) →− g(x)g(x ) x − x0 (g(x0 ))2 {z } | {z 0 } | →−g 0 (x0 ) →(g(x0 ))2 für x → x0 . Nach (ii) folgt dann auch für allgemeines f , dass der Quotient fg bei x0 differenzierbar ist mit f 0 g 0 (x0 ) f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 ) 1 − f (x0 ) = . (x0 ) = f 0 (x0 ) g g(x0 ) (g(x0 ))2 (g(x0 ))2 Es bleibt zu bemerken, dass x0 kein isolierter Punkt von {x ∈ D : g(x) 6= 0} ist. Wegen g(x0 ) 6= 0 gibt es nach Lemma 5.12 nämlich ein ε > 0, so dass g(x) 6= 0 für alle x ∈ D ∩ (x0 − ε, x0 + ε) ist. Beispiele. 1. Für f : R \ {0} → R, f (x) = x−n (n ∈ N) ist 1 0 nxn−1 f 0 (x) = = − = −nx−n−1 . xn x2n 2. Für x ∈ / π 2 + πZ ist 0 tan (x) = sin x 0 cos x sin0 (x) cos x − sin x cos0 (x) cos2 x 2 cos x + sin2 x 1 = = . cos2 x cos2 x = 110 Auch die Verkettung differenzierbarer Funktionen ist wieder differenzierbar: Satz 6.5 Es seien D, E ⊂ R, f : D → E differenzierbar in x0 ∈ D und g : E → R differenzierbar in f (x0 ). Dann ist g ◦ f differenzierbar in x0 , die Ableitung berechnet sich nach der Kettenregel: (g ◦ f )0 (x0 ) = g 0 f (x0 ) f 0 (x0 ). Beweis. Nach Satz 6.2 gibt es eine Funktion r : E → R mit g(y) − g f (x0 ) = g 0 f (x0 ) y − f (x0 ) + r(y) r(y) y−f (x0 ) = 0. Teilen durch x − x0 führt für y = f (x) auf f (x) − f (x0 ) r f (x) g f (x) − g f (x0 ) 0 = g f (x0 ) + . x − x0 x − x0 x − x0 und limy→f (x0 ) Für x → x0 und damit auch f (x) → f (x0 ) (Satz 6.3) folgt nun wegen ( r f (x) 0, falls f (x) = f (x0 ), = f (x)−f (x0 ) r(f (x)) x − x0 · x−x0 , falls f (x) 6= f (x0 ), f (x)−f (x0 ) zunächst lim x→x 0 x6=x 0 r(f (x)) x−x0 = 0 und damit dann g f (x) − g f (x0 ) lim = g 0 f (x0 ) f 0 (x0 ). x→x0 x − x0 x6=x0 Beispiele. 2 1. Die Ableitung von f : R \ {0} → R, f (x) = sin3 (e1/x ) ist gegeben durch 2 2 2 2 f 0 (x) = (sin3 (e1/x ))0 = 3 sin2 (e1/x ) · cos(e1/x ) · e1/x · (−2x−3 ). 2. Für die Exponentialfunktion R → R, x 7→ ax zur Basis a > 0 ist (ax )0 = (ex log a )0 = (ex log a ) log a = ax log a. Wir untersuchen nun noch Umkehrfunktionen. Satz 6.6 Es seien D ⊂ R ein Intervall und f : D → R stetig und streng monoton. Ist f in x ∈ D differenzierbar mit f 0 (x) 6= 0, so ist die Umkehrfunktion f −1 : f ([a, b]) → R in y = f (x) differenzierbar und es gilt (f −1 )0 (y) = 1 f 0 (f −1 (y)) 111 . Beweis. Es sei (yn ) eine Folge in f ([a, b]) mit yn → y und yn 6= y für alle n. Setze xn = f −1 (yn ). Da auch f −1 nach Satz 5.18 stetig und streng monoton ist, gilt lim xn = lim f −1 (yn ) = f −1 (y) = x n→∞ n→∞ und xn 6= x ∀ n ∈ N. Es folgt xn − x f −1 (yn ) − f −1 (y) = lim = lim n→∞ f (xn ) − f (x) n→∞ n→∞ yn − y lim wie behauptet. Beispiele. 1 f (xn )−f (x) xn −x = 1 f 0 (x) , 1. Für x > 0 ist log0 (x) = 1 1 = . exp0 (log x) x 2. Hieraus folgt mit Hilfe der Kettenregel für die allgemeine Potenzfunktion (0, ∞) → R, x 7→ xα (α ∈ R) α α (xα )0 = (eα log x )0 = eα log x · = xα · = αxα−1 . x x 3. Eine alternative Darstellung der Exponentialfunktion: Wird ein Euro mit x (also mit 100x Prozent) verzinst, so erhält man nach einem Jahr 1 + x Euro. Würden stattdessen die halben Zinsen halbjährig gutgeschrieben, so erhielte man mit Zins und Zinseszins nach einem Jahr den größeren Betrag von (1 + x2 )2 Euro. Bei Dritteljähriger Verzinsung mit x3 ergäben sich (1 + x3 )3 Euro. Würde allgemein n1 -jährig der Zinssatz nx angerechnet, so ergäbe sich nach einem Jahr ein Guthaben von (1 + nx )n Euro. Man kann sich nun fragen, welcher Betrag sich erreichen ließe, wenn man immer kurzfristiger mit dem entsprechenden Bruchteil von x verzinsen würde, also zum Grenzwert n → ∞ einer instantanen ‘stetigen Verzinsung’ überginge. Mathematisch ausgedrückt: Was ist x n ? lim 1 + n→∞ n Die Antwort folgt aus Beispiel 1. Für die logarithmierten Werte ergibt sich wegen log(1) = 0 demnach nämlich log(1 + nx ) − log(1) x lim n log 1 + = x lim = x log0 (1) = x. x n→∞ n→∞ n n Da exp aber stetig ist, folgt hieraus x n x lim 1 + = exp lim n log 1 + = ex . n→∞ n→∞ n n (Für x = 0, 02 ist das mit ca. 1.0202 nur geringfügig größer als 1+x = 1, 02. Viel bringt es also nicht.) 112 Wir bemerken zum Schluss dieses Absatzes noch, dass man den Prozess des Ableitens natürlich auch iterieren kann: Ist f : D → R differenzierbar, so kann man überprüfen, ob die Ableitung f 0 : D → R selbst eine Ableitung f 00 : D → R besitzt, die womöglich wieder einer Ableitung f 000 : D → R hat u.s.w. Definition 6.7 Es sei f : D → R eine Funktion. Ist f (einmal) differenzierbar bei x0 ∈ D, so schreibt man auch f (1) (x0 ) = f 0 (x0 ). Induktiv definiert man für n ≥ 2: (i) Es sei x0 ∈ D. Die Funktion f ist n-mal differenzierbar bei x0 , wenn es ein ε > 0 gibt, so dass f in jedem x ∈ (x0 − ε, x0 + ε) (n − 1)-mal differenzierbar ist und die Abbildung (x0 − ε, x0 + ε), x 7→ f (n−1) (x) bei x0 differenzierbar ist. Die n-te Ableitung bei x0 ist dann f (n) (x0 ) := (f n−1 )0 (x0 ). (Für n = 2, 3 schreibt man auch f 00 (x0 ) bzw. f 000 (x0 ).) (ii) Ist f in jedem Punkt x ∈ D n-mal differenzierbar, so heißt f n-mal differenzierbar. Die n-te Ableitung von f ist f (n) : D → R. Mit der ‘nullten Ableitung’ f (0) von f ist die Funktion f selbst gemeint. Beispiele. 1. Für f : R → R, f (x) = xm ist ( f (n) (x) = m(m − 1) · . . . · (m − n + 1)x m−n = m! m−n x , n! 0, falls n ≤ m, falls n > m. 2. Für f : R → R, f (x) = cos x ist cos x, − sin x, f (n) (x) = − cos x, sin x, 6.2 falls falls falls falls n ∈ 4N0 , n ∈ 4N0 + 1, n ∈ 4N0 + 2, n ∈ 4N0 + 3. Der Mittelwertsatz und seine Konsequenzen Wir wollen nun untersuchen, inwiefern sich aus bestimmten Aspekten der Ableitung f 0 einer Funktion f Rückschlüsse auf f selbst gewinnen lassen. Ein grundlegender Satz der Differentialrechnung ist hier der sogenannte Mittelwertsatz, der aus dem Satz von Rolle folgen wird. 113 Definition 6.8 Es sei D ⊂ R. Eine Funktion f : D → R hat in x ∈ D ein lokales Maximum (bzw. lokales Minimum), wenn es ein ε > 0 gibt, so dass f (x) = max{f (y) : y ∈ D mit |y − x| < ε} f (x) = min{f (y) : y ∈ D mit |y − x| < ε} bzw. gilt. Man nennt dann x eine lokale Maximal- bzw. Minimalstelle. Maxima und Minima nennt man auch Extrema, Maximal- und Minimalstellen entsprechend Extremalstellen. Wir beschränken uns in diesem Abschnitt fortan auf den Fall, dass D ein Intervall ist. Im Folgenden sei a < b. Durch Ableiten erhält man ein notwendiges Kriterium für Extremalstellen: Satz 6.9 Es sei f : (a, b) → R und x0 ∈ (a, b). Ist x0 eine Extremalstelle von f und f differenzierbar in x0 , so gilt f 0 (x0 ) = 0. Beweis. Hat f bei x0 ein lokales Maximum, so so gibt es ein ε > 0 mit f (x) ≤ f (x0 ) für alle x ∈ D mit |x − x0 | < ε. Daher ist f 0 (x0 ) = x→x lim f (x) − f (x0 ) ≤0 x − x0 f 0 (x0 ) = x→x lim f (x) − f (x0 ) ≥ 0, x − x0 0 x>x0 und 0 x<x0 also f 0 (x0 ) = 0. Ist x0 eine lokale Minimalstelle, so hat −f bei x0 ein lokales Maximum, weshalb −f 0 (x0 ) = 0 also auch f 0 (x0 ) = 0 ist. Beachten Sie: Dieses Kriterium ist nicht hinreichend! So gilt z.B. für die Funktion f : (−1, 1) → R, f (x) = x3 f 0 (0) = 0, obwohl sie bei 0 kein lokales Extremum hat. Es ist außerdem wichtig anzunehmen, dass x0 im offenen Intervall (a, b) liegt. Z.B. sind die Extremalstellen von f : [0, 1] → R, f (x) = x 0 und 1, jedoch f 0 (0) = f 0 (1) 6= 0. Satz 6.10 (Satz von Rolle) Es sei f : [a, b] → R stetig und in (a, b) differenzierbar. Gilt f (a) = f (b), so gibt es ein x0 ∈ (a, b) mit f 0 (x0 ) = 0. 114 Beweis. Ist f konstant, so ist die Behauptung trivial. Anderenfalls gibt es, da nach Satz 5.10 f sein Minimum und sein Maximum in [a, b] annimmt, eine Extremalstelle x0 ∈ (a, b). Gemäß Satz 6.9 ist dann f 0 (x0 ) = 0. Korollar 6.11 (Mittelwertsatz) Es sei f : [a, b] → R stetig und in (a, b) dif(a) ferenzierbar. Dann gibt es ein x0 ∈ (a, b) mit f 0 (x0 ) = f (b)−f . b−a Das heißt: Es gibt einen Punkt x0 ∈ (a, b), so dass die Steigung f 0 (x0 ) der (a) Tangente an den Graphen von f durch (x0 , f (x0 )) gerade die Steigung f (b)−f b−a der Sekante durch (a, f (a)) und (b, f (b)) ist. Beweis. Setze g : [a, b] → R, g(x) = f (x) − f (b) − f (a) (x − a), b−a so dass insbesondere g(b) = g(a) ist. Nach dem Satz 6.10 von Rolle gibt es ein x0 ∈ (a, b) mit f (b) − f (a) 0 = g 0 (x0 ) = f 0 (x0 ) − , b−a womit x0 die Behauptung des Satzes erfüllt. Korollar 6.12 (Schrankensatz) Es sei f : [a, b] → R stetig und in (a, b) differenzierbar. Setze m = inf{f 0 (x) : x ∈ (a, b)} und M = sup{f 0 (x) : x ∈ (a, b)}. Dann gilt m(y − x) ≤ f (y) − f (x) ≤ M (y − x) für alle x, y ∈ [a, b] mit x ≤ y. Beweis. Wendet man den Mittelwertsatz (Korollar 6.11) auf das Intervall [x, y] an, so folgt für ein x0 ∈ (x, y) f (y) − f (x) = f 0 (x0 ) ∈ [m, M ]. y−x Korollar 6.13 Es sei f : [a, b] → R stetig und in (a, b) differenzierbar. Gilt f 0 (x) = 0 für alle x ∈ (a, b), so ist f konstant. Beweis. Nach dem Schrankensatz (mit m = M = 0) ist f (x) = f (y) für alle x, y ∈ [a, b]. Eine weitere Folgerung aus dem Satz von Rolle ist eine verallgemeinerte Form des Mittelwertsatzes. 115 Satz 6.14 (Verallgemeinerter Mittelwertsatz) Es seien f, g : [a, b] → R stetig und in (a, b) differenzierbar, wobei g 0 (x) 6= 0 für alle x ∈ (a, b) sei. Dann gibt es ein x0 ∈ (a, b) mit f (b) − f (a) f 0 (x0 ) = 0 . g(b) − g(a) g (x0 ) (Insbesondere ist g(a) 6= g(b).) Beweis. Wir bemerken zunächst, dass g(a) 6= g(b) ist. Anderenfalls hätte g nämlich nach dem Satz von Rolle eine Nullstelle in (a, b). Setze nun h : [a, b] → R, h(x) = f (x) − f (b) − f (a) (g(x) − g(a)), g(b) − g(a) so dass insbesondere h(b) = f (a) = h(a) ist. Nach dem Satz 6.10 von Rolle gibt es ein x0 ∈ (a, b) mit 0 = h0 (x0 ) = f 0 (x0 ) − f (b) − f (a) 0 g (x0 ), g(b) − g(a) womit x0 die Behauptung des Satzes erfüllt. Der verallgemeinerte Mittelwertsatz liefert ein nützliches Kriterium zur Berechnung von Funktionengrenzwerten von Quotienten in Fällen, in denen die Grenzwertsätze versagen. Satz 6.15 (Regel von l’Hospital) Es seien f, g : (a, b) → R differenzierbar, wobei g 0 (x) 6= 0 für alle x ∈ (a, b) sei. Des Weiteren gelte lim f (x) = 0 x→a und x>a lim g(x) = 0 x→a x>a oder lim f (x) = ±∞ x→a und x>a lim g(x) = ±∞. x→a x>a Falls nun der Grenzwert lim x→a x>a es ist lim x→a x>a f 0 (x) g 0 (x) existiert, so existiert auch lim x→a x>a f (x) g(x) und f (x) f 0 (x) = lim . x→a g(x) g 0 (x) x>a Analoge Aussagen gelten für x → b. Dies gilt auch noch für a = −∞ oder b = +∞, da sich diese Fälle durch eine geeignete Substitution (y = ∓ x1 ) auf den Fall endlicher Intervallgrenzen zurückführen lassen. Beweis. 1. Im ersten Fall können wir f und g durch f (a) := g(a) := 0 stetig bei a ergänzen. Ist nun (xn ) eine Folge in (a, b) mit xn → a, so gibt es nach dem 116 verallgemeinerten Mittelwertsatz Punkte ξn ∈ (a, xn ) (und damit auch ξn → a) mit f (xn ) f (xn ) − f (a) f 0 (ξn ) f 0 (x) = = 0 → lim . x→0 g 0 (x) g(xn ) g(xn ) − g(a) g (ξn ) x>a 0 f (x) zu gegebenem ε > 0 ein 2. Im zweiten Fall wählen wir für c = lim x→a 0 x>a g (x) δ > 0, so dass f 0 (x) − c < ε für x ∈ (a, a + δ) 0 g (x) gilt. Für alle x, y ∈ (a, a + δ) gibt es nun nach dem verallgemeinerten Mittelwertsatz ein ξ zwischen x und y mit f (x) f 0 (ξ) f (x) − f (y) 1 − g(y)/g(x) = 0 = · d(x, y) g(x) g(x) − g(y) 1 − f (y)/f (x) g (ξ) {z } | =:d(x,y) und daher wegen ξ ∈ (a, a + δ) f 0 (ξ) f (x) − c = d(x, y) − c 0 g(x) g (ξ) f 0 (ξ) − c d(x, y) + c d(x, y) − 1 = 0 g (ξ) ≤ ε|d(x, y)| + |c| |d(x, y) − 1|, wobei die rechte Seite für x → a gegen ε konvergiert, da ja dann d(x, y) → 1 gilt. Indem wir 0 < δ 0 < δ hinreichend klein wählen, folgt also f (x) − c < 2ε g(x) für x ∈ (a, a + δ 0 ). Hieraus folgt lim x→a x>a Beispiele. f (x) g(x) = c. 1. Für α > 0 ist im Grenzwert x → 0 x−1 log x lim x log x = lim = − lim = α−1 lim xα = 0. x→0 αx−α−1 x→0 x→0 x→0 x−α x>0 x>0 x>0 x>0 α 2. Zweimalige Anwendung der l’Hospitalschen Regel zeigt tan x − x cos−2 x − 1 2 cos−3 x sin x 1 = lim = lim = , 3 2 x→0 x→0 x→0 x 3x 6x 3 lim da ja limx→0 sin x x = 1 ist. 117 6.3 Monotonie, Extrema und Konvexität Eine weitere direkte Folgerung aus dem Mittelwertsatz gestattet es, das Monotonieverhalten von f in Termen der Ableitung f 0 zu beschreiben, was uns schließlich bei der genaueren Untersuchung von Extremalstellen von f nützlich sein wird. Das Vorzeichen der lokalen Änderungsrate gibt Auskunft darüber, ob die Funktionswerte mit wachsendem Argument lokal zu- oder abnehmen. Genauer gilt: Satz 6.16 Es seien [a, b] ⊂ R ein Intervall und f : [a, b] → R eine stetige Funktion, die in (a, b) differenzierbar sei. Dann gilt: (i) f 0 (x) ≥ 0 für alle x ∈ (a, b) ⇔ f ist monoton wachsend, (ii) f 0 (x) > 0 für alle x ∈ (a, b) ⇒ f ist streng monoton wachsend, (iii) f 0 (x) ≤ 0 für alle x ∈ (a, b) ⇔ f ist monoton fallend, (iv) f 0 (x) < 0 für alle x ∈ (a, b) ⇒ f ist streng monoton fallend. Beachten Sie: Die Umkehrungen in (ii) und (iv) gelten nicht, wie die Beispiele f : (−1, 1) → R mit f (x) = x3 bzw. f (x) = −x3 zeigen. Beweis. (i) ‘⇒’: Für x, x0 ∈ [a, b] mit x < x0 gibt es nach dem Mittelwertsatz ein x0 ∈ (x, x0 ) mit f (x0 ) − f (x) = f 0 (x0 ) ≥ 0. 0 x −x ‘⇐’: Ist f monoton wachsend, so gilt für jedes x0 ∈ (a, b) f 0 (x) = x→x lim 0 x>x0 f (x) − f (x0 ) ≥ 0. x − x0 (ii) Dies folgt analog zu ‘⇒’ in (i) mit > statt ≥. (iii) & (iv) Diese Aussagen ergeben sich aus (i) und (ii) durch Übergang zu −f . Als Anwendung dieses Satzes kommen wir nun auf die Untersuchung der trigonometrischen Funktionen zurück. Beispiele. 1. Der Cosinus ist streng monoton fallend auf [0, π]. Nach Satz 5.40 nämlich ist (cos x)0 = − sin x < 0 für 0 < x < π. Wegen cos(0) = 1 und cos(π) = −1 ist daher [0, π] → [−1, 1], x 7→ cos x bijektiv. Die Umkehrfunktion hiervon wird als Arcuscosinus (oder auch als der Hauptzweig des Arcuscosinus) arccos : [−1, 1] → [0, π] bezeichnet. Nach 118 Satz 6.6 und der Beziehung sin y = ± x ∈ (−1, 1) (arccos x) = p 1 − cos2 y für alle y ∈ R gilt für 1 1 1 = ∓√ = ∓p . − sin(arccos x) 1 − x2 1 − cos2 (arccos x) Beachtet man noch, dass auch arccos monoton fällt, so ergibt sich arccos0 x = − √ 1 . 1 − x2 Nach Satz 5.40 und Korollar 5.39 ist nun cos auf jedem Intervall der Form [nπ, (n + 1)π], n ∈ Z, streng monoton, so dass man die Cosinusfunktion auch auf ein solches Intervall einschränken und die Umkehrfunktion hierzu betrachten kann. Dies führt für n 6= 0 auf die sogenannten Nebenzweige des Arcuscosinus. 2. Nach dem ersten Beispiel und Korollar 5.39 ist h π πi → [−1, 1], x→ 7 sin x − , 2 2 streng monoton wachsend und bijektiv. Die Umkehrfunktion hiervon wird als Arcussinus (oder als auch der Hauptzweig des Arcussinus) arcsin : [−1, 1] → [− π2 , π2 ] bezeichnet. Nach Satz 6.6 und der Beziehung cos y = p ± 1 − sin2 y für alle y ∈ R gilt für x ∈ (−1, 1) (arcsin x)0 = 1 1 1 √ = ±p = ± . cos(arcsin x) 1 − x2 1 − sin2 (arcsin x) Beachtet man noch, dass auch arcsin monoton wächst, so ergibt sich arcsin0 x = √ 1 . 1 − x2 Analog wie für den Arcuscosinus sind die Nebenzweige des Arcussinus definiert. 3. Die Tangensfunktion erfüllt tan0 x = 1 = 1 = tan2 x > 0 cos2 x für alle x ∈ (− π2 , π2 ). Wegen cos x > 0 auf (− π2 , π2 ), sin(− π2 ) = −1, sin( π2 ) = 1 und cos(± π2 ) = 0 gilt außerdem lim tan x = −∞ x→− π 2 x> π 2 und 119 lim tan x = +∞, x→+ π 2 x< π 2 so dass also tan : (− π2 , π2 ) → R monoton wachsend und bijektiv ist. Die Umkehrfunktion, der sogenannte (Hauptzweig des) Arcustangens π π arctan : R → (− , ) 2 2 ist dann ebenfalls streng wachsend mit arctan0 x = 1 1 = . 1 + tan (arctan x) 1 + x2 2 Wieder gibt es analog zum Arcuscosinus auch Nebenzweige des Arcustangens. Ganz analog erhält man auch die Umkehrfuntion des Cotangens: den streng fallenden Arcuscotangens arccot : R → (0, π). Wir leiten nun ein hinreichendes Kriterium für lokale Extrema her. Satz 6.17 Es seien f : (a, b) → R, x0 ∈ (a, b). Ist f in x0 zweimal differenzierbar mit f 0 (x0 ) = 0 und f 00 (x0 ) > 0 oder f 00 (x0 ) < 0, so hat f bei x0 ein lokales Minimim bzw. Maximum. Beweis. Ist f 00 (x0 ) = lim x→x0 f 0 (x) − f 0 (x0 ) > 0, x − x0 so gibt es ein ε > 0 mit f 0 (x) − f 0 (x0 ) >0 x − x0 für alle x ∈ (x0 − ε, x0 + ε). Wegen f 0 (x0 ) = 0 ist daher f 0 (x) < 0 für x ∈ (x0 − ε, x0 ) und f 0 (x) > 0 für x ∈ (x0 , x0 + ε), so dass f nach Satz 6.16 auf [x0 − ε, x0 ] streng monoton fällt und auf [x0 , x0 + ε] streng monoton wächst. Dies zeigt, dass f bei x0 ein Minimum hat. Den Fall f 00 (x0 ) < 0 behandelt man analog oder indem man das eben Gezeigte auf −f anwendet. Beachten Sie: Das Kriterium ist nicht notwendig, wie das Beispiel (−1, 1) → R, x 7→ x4 zeigt. Bemerkung. Der Beweis zeigt, dass in x0 sogar eine isolierte Extremalstelle vorliegt: Es gibt ein ε > 0, so dass für x ∈ (x0 − ε, x0 + ε) mit x 6= x0 sogar die strikte Ungleichung f (x0 ) < f (x) bzw. f (x0 ) > f (x). erfüllt ist. Wir untersuchen nun noch eine Eigenschaft von Funktionen, die in vielen Anwendungen und in der Analysis selbst eine wichtige Rolle spielt. 120 Definition 6.18 Es sei D ⊂ R ein Intervall. Eine Funktion f : D → R heißt (i) konvex, wenn für alle x1 , x2 ∈ D und alle λ ∈ [0, 1] gilt f (λx1 + (1 − λ)x2 ) ≤ λf (x1 ) + (1 − λ)f (x2 ), (ii) strikt konvex, wenn für alle x1 , x2 ∈ D mit x1 6= x2 und alle λ ∈ (0, 1) gilt f (λx1 + (1 − λ)x2 ) < λf (x1 ) + (1 − λ)f (x2 ), (iii) (strikt) konkav, wenn −f (strikt) konvex ist. Geometrisch bedeutet die (strikte) Konvexität, dass der Graph von f im Intervall (x1 , x2 ) (echt) unterhalb der Sekante durch die Punkte (x1 , f (x1 )) und (x2 , f (x2 )) liegt. Da für x1 < x2 die Punkte x = λx1 + (1 − λ)x2 mit λ ∈ [0, 1] gerade die Punkte x ∈ [x1 , x2 ] sind, lässt sich die Konvexitätsungleichung äquivalent auch als x2 − x x − x1 f (x) ≤ f (x1 ) + f (x2 ) x2 − x1 x2 − x1 (mit strikter Ungleichung für x ∈ / {x1 , x2 } im Falle strikter Konvexität) schreiben. −x 1 (Beachte, dass x = λx1 + (1 − λ)x2 ⇔ λ = xx22−x ⇔ 1 − λ = xx−x .) 1 2 −x1 Bemerkung. Konvexe Funktionen sind stetig. (Übung!) Beispiel. Die Funktion f : R → R, f (x) = |x| ist konvex: Für x1 , x2 ∈ R und 0 ≤ λ ≤ 1 ist |λx1 + (1 − λ)x2 | ≤ λ|x1 | + (1 − λ)|x2 | nach der Dreiecksungleichung. (Insbesondere müssen konvexe Funktionen nicht unbedingt differenzierbar sein.) Lemma 6.19 Es seien D ⊂ R ein Intervall, f : D → R eine Funktion, x, x1 , x2 ∈ D mit x1 < x < x2 . Dann sind äquivalent (i) f (x) ≤ x2 −x f (x1 ) x2 −x1 (ii) f (x)−f (x1 ) x−x1 (iii) f (x2 )−f (x1 ) x2 −x1 (iv) f (x)−f (x1 ) x−x1 ≤ ≤ ≤ + x−x1 f (x2 ), x2 −x1 f (x2 )−f (x1 ) , x2 −x1 f (x2 )−f (x) x2 −x und f (x2 )−f (x) . x2 −x Dies gilt auch, wenn man in diesen Ungleichungen jeweils ≤ durch < ersetzt. 121 Beweis. (i) ⇔ (ii): (i) ist äquivalent zu f (x) − f (x1 ) ≤ − x − x1 x − x1 (x − x1 )(f (x2 ) − f (x1 )) f (x1 ) + f (x2 ) = , x2 − x1 x2 − x1 x2 − x1 was wiederum zu (ii) äquivalent ist. (i) ⇔ (iii): (i) ist äquivalent zu f (x) − f (x2 ) ≤ x2 − x x2 − x (x2 − x)(f (x1 ) − f (x2 )) f (x1 ) − f (x2 ) = , x2 − x1 x2 − x1 x2 − x1 was wiederum zu (iii) äquivalent ist. (i) ⇔ (iv): (i) ist äquivalent zu (x2 − x + x − x1 )f (x) ≤ (x2 − x)f (x1 ) + (x − x1 )f (x2 ) und damit zu (x2 − x)(f (x) − f (x1 )) ≤ (x − x1 )(f (x2 ) − f (x)), was wiederum zu (iv) äquivalent ist. Damit ist der Satz vollständig bewiesen. Satz 6.20 Es seien (a, b) ⊂ R ein Intervall und f : (a, b) → R eine zweimal differenzierbare Funktion. Dann gilt: (i) f 00 (x) ≥ 0 für alle x ∈ (a, b) ⇔ f ist konvex, (ii) f 00 (x) > 0 für alle x ∈ (a, b) ⇒ f ist strikt konvex. Natürlich gelten entsprechende Aussagen für konkave Funktionen. Beweis. Gilt f 00 (x) ≥ 0 (bzw. > 0) für alle x ∈ (a, b), so ist f 0 nach Satz 6.16 (streng) monoton wachsend. Sind nun x, x1 , x2 ∈ (a, b) mit x1 < x < x2 gegeben, so folgt aus dem Mittelwertsatz f (x) − f (x1 ) f (x2 ) − f (x) = f 0 (ξ1 ) ≤ f 0 (ξ2 ) = x − x1 x2 − x für geeignete ξ1 ∈ (x1 , x) und ξ2 ∈ (x, x2 ), wobei die Ungleichung im Fall f 00 > 0 strikt ist. Nach Lemma 6.19 ist f demnach (strikt) konvex. Ist nun umgekehrt f als konvex vorausgesetzt, so folgt für x1 < x2 aus Lemma 6.19 (ii) und (iii) f 0 (x1 ) = x→x lim 1 x>x1 f (x) − f (x1 ) f (x2 ) − f (x1 ) f (x) − f (x2 ) ≤ ≤ x→x lim = f 0 (x2 ). 2 x − x1 x 2 − x1 x − x2 x<x2 f 0 ist also monoton. Nach Satz 6.16 folgt hieraus aber f 00 ≥ 0. 122 Beispiele. 1. Die Funktion f : R → R, f (x) = x2 ist strikt konvex. 2. exp : R → R ist strikt konvex. 3. log : (0, ∞) → R ist strikt konkav, denn log00 (x) = − x12 < 0 für alle x > 0. Als Anwendung leiten wir nun einige Ungleichungen her, die für viele Untersuchungen in der Analysis von großer Bedeutung sind. Satz 6.21 (Die Youngsche Ungleichung) Es seien p, q ∈ (1, ∞) mit 1. Dann gilt für alle a, b ≥ 0 ap bq + . ab ≤ p q 1 p + 1q = Beweis. Die Behauptung ist klar für a = 0 oder b = 0. Gilt a, b 6= 0, so folgt aus der Konkavität des Logarithmus 1 1 q 1 1 p log a + b ≥ log(ap ) + log(bq ) p q p q und hieraus, indem man auf beiden Seiten die Exponentialfunktion anwendet, 1 1 ap b q + ≥ (ap ) p (bq ) q = ab. p q Hieraus ergeben sich zwei grundlegende Ungleichungen für Vektoren im Rn (oder Cn ) (also n-Tupel von reellen bzw. komplexen Zahlen). Zunächst führen wir die folgende Notation ein. Definition 6.22 Für x = (x1 , . . . , xn ) ∈ Rn (oder Cn ) und p ∈ [1, ∞) definieren wir die p-Norm von x durch kxkp := X n p |xk | p1 . k=1 Für p = ∞ setzt man kxk∞ := max |xk | 1≤k≤n (:= max{|xk | : k = 1, . . . , n}). Satz 6.23 (Die Höldersche Ungleichung) Es seien p, q ∈ [1, ∞] mit p1 + 1q = 1 1, wobei hier ∞ = 0 zu lesen ist. Dann gilt für x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ∈ n C n X |xk yk | ≤ kxkp kykq . k=1 123 Beweis. O.B.d.A. (d.h. ‘ohne Beschränkung der Allgemeinheit’) nehmen wir an, dass kxk, kyk = 6 0 ist. (Anderenfalls ist x = 0 oder y = 0 und die Aussage trivial.) 1. Fall: p, q ∈ (1, ∞). Indem wir für k = 1, . . . , n die Youngsche Ungleichung |xk | |yk | jeweils mit a = kxk und b = kyk anwenden, ergibt sich p q n n n X X X 1 |xk |p |yk |q 1 1 |xk | |yk | · ≤ = + = 1. |xk yk | = p + q kxkp kykq k=1 kxkp kykq pkxkp qkykq p q k=1 k=1 Nach Multiplikation mit kxkp kykq folgt hieraus die Behauptung. 2. Fall: {p, q} = {1, ∞}. O.B.d.A. sei p = 1 und q = ∞. (Ansonsten vertausche man die Rollen von p und q.) Es folgt n n X X |xk yk | ≤ max |yk | |xk | = kyk∞ kxk1 . 1≤k≤n k=1 k=1 Bemerkung. Speziell für p = 2 ergibt sich die Cauchy-Schwarzsche Ungleichung n n auf von x und y ist x · y := Pn Pn dem R (oderPCn ): Das euklidische Skalarprodukt k=1 xk yk ). Wegen |x · y| ≤ k=1 |xk yk | folgt nun k=1 xk yk (bzw. |x · y| ≤ kxk2 kyk2 . Satz 6.24 (Die Minkowskische Ungleichung) Es sei p ∈ [1, ∞]. Dann gilt für x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ∈ Cn kx + ykp ≤ kxkp + kykp . (Hierbei bezeichnet x + y = (x1 + y1 , . . . , xn + yn ) die komponentenweise zu bildende Vektorsumme von x und y.) Beweis. 1. Fall: p ∈ (1, ∞). Nach der Hölderschen Ungleichung ist für p1 + 1q = 1, p also q = p−1 , kx + ykpp = ≤ n X k=1 n X |xk + yk | · |xk + yk |p−1 p−1 |xk | · |xk + yk | + k=1 ≤ kxkp ∞ X |yk | · |xk + yk |p−1 k=1 X n |xk + yk |(p−1)q 1q + kykp k=1 k=1 = kxkp + kykp X n X n |xk + yk |p k=1 = kxkp + kykp kx + ykpp−1 . 124 p1 pq |xk + yk |(p−1)q 1q Division durch kx + ykp−1 ergibt die Behauptung p 2. Fall: p = 1: Für p = 1 folgt direkt aus der Dreiecksungleichung kx + yk1 = n X k=1 |xk + yk | ≤ n X |xk | + k=1 n X |yk | = kxk1 + kyk1 . k=1 3. Fall: p = ∞: Für p = ∞ schließlich erhält man die Behauptung, da mit |xk | ≤ kxk∞ und |yk | ≤ kyk∞ für alle k auch |xk + yk | ≤ kxk∞ + kyk∞ für alle k ist. 125 Kapitel 7 Das Integral Rb In diesem Kapitel definieren wir das Integral a f (x) dx für geeignete Funktionen f : [a, b] → R und und untersuchen dessen wichtigste Eigenschaften. Das Integral misst die (signierte) Fläche zwischen Funktionsgraph und x-Achse. Heuristisch erhält man das Integral, indem man die Strecke [a, b] in unendlich viele unendlich feine Intervalle [x, x+dx) aufteilt und die entsprechend unendlichRvielen unendlich dünnen Rechtecke mit signierter Fläche f (x) dx aufsummiert: f (x) dx. Daher auch das stilisierte S als Integrationszeichen. Unsere erste Aufgabe wird es sein, diese heuristischen Ideen in sinnvolle Mathematik zu überfüren: Das geschieht in Abschnitt 7.1. Der Integrationsbegriff ist von grundlegender Bedeutung für die gesamte Analysis und viele weitere Bereiche innerhalb der Mathematik und den Anwendungen. Vor allem der Zusammenhang zur Differentiation ist fundamental: Wir werden sehen, dass die Integration in gewisser Hinsicht eine zur Differentiation inverse Operation darstellt. 7.1 Definition des Integrals Die Strategie zur Definition des Integrals ist die folgende: Zunächst betrachten wir besonders einfache Funktionen, für die man das Integral einfach hinschreiben kann. Dann verwenden wir einen Grenzprozess, um die Klasse der integrierbaren Funktionen soweit auszudehnen, dass sie für all unsere Belange ausreicht und insbesondere alle stetigen Funktionen beinhaltet. Für diesen Grenzprozess gibt es in der mathematischen Literatur mehrere Ansätze, die zu Integralbegriffen unterschiedlicher Allgemeinheit führen. Wir werden hier vor allem das RiemannIntegral behandeln und später noch kurz auf das sogenannte Regelintegral eingehen. Beide dieser Ansätze haben ihre Vorzüge und Nachteile, der Begriff des Riemann-Integrals ist aber wohl der anschaulichere. Das wesentlich allgemeinere Lebesgue-Integral werden wir erst in der Analysis 3 behandeln. 126 Das Integral für Treppenfunktionen Es sei [a, b] ⊂ R ein kompaktes Intervall. Definition 7.1 Eine Funktion f : [a, b] → R heißt Treppenfunktion, wenn es eine Unterteilung a = x0 < x1 < . . . < xn = b derart gibt, dass f |(xi−1 ,xi ) konstant ist für alle i = 1, . . . , n. Eine solche Unterteilung heiße f zugehörig. Die Menge der Treppenfunktionen auf [a, b] wird mit T [a, b] bezeichnet. (Sind M, N Mengen, f : M → N eine Abbildung und U ⊂ M , so bezeichnet f |U : U → N die Einschränkung von f auf U , die durch f |U (x) = f (x) für x ∈ U gegeben ist.) Lemma 7.2 Sind f, g ∈ T [a, b] und λ ∈ R, so sind auch f + g und λf Treppenfunktionen. Beweis. Es seien Z : a = x0 < x1 < . . . < xn = b Z 0 : a = x00 < x01 < . . . < x0m = b und Zerlegungen, so dass f auf allen (xi−1 , xi ) und g auf allen (x0j−1 , x0j ) konstant ist. Die gemeinsame Verfeinerung von Z und Z 0 ist dann die Unterteilung Z 00 : a = x000 < x001 < . . . < x00l = b mit {x000 , . . . , x00l } = {x0 , . . . , xn } ∪ {x00 , . . . , x0m }. Da f + g und λf auf allen Intervallen (x00k−1 , x00k ) konstant sind, ergibt sich die Behauptung. Bemerkung. Da die Menge R[a,b] aller Abbildungen von [a, b] nach R ein Vektorraum ist und offensichtlich 0 ∈ T [a, b] gilt, besagt dieses Lemma gerade, dass T [a, b] ein Vektorraum ist. Man spricht daher auch vom Raum der Treppenfunktionen auf [a, b]. Definition 7.3 Es sei f ∈ T [a, b] mit f (x) = ci für x ∈ (xi−1 , xi ), i = 1, . . . , n, für die f zugehörige Unterteilung a = x0 < x1 < . . . < xn = b. Das Integral von f ist dann definiert durch Z b n X f (x) dx := ci (xi − xi−1 ). a i=1 Wir schreiben auch manchmal nur kurz Rb a f. Wir müssen zeigen, dass dieser Begriff wohldefiniert ist, also nicht von der speziell gewählten Zerlegung abhängt. Beweis. Es seien Z : a = x0 < x1 < . . . < xn = b und 127 Z 0 : a = x00 < x01 < . . . < x0m = b zu f gehörige Zerlegungen, so dass f die Werte ci bzw. c0j auf den entsprechenden Intervallen annehme. Enthält etwa Z 0 nur einen zusätzlichen Punkt x0 , der im Intervall (xk−1 , xk ) liegt, so ist m X c0j (x0j − x0j−1 ) j=1 = k−1 X ci (xi − xi−1 ) + ck (x0 − xk−1 ) + ck (xk − x0 ) + i=1 = n X n X ci (xi − xi−1 ) i=k+1 ci (xi − xi−1 ), i=1 so dass diese Unterteilungen zum gleichen Integral führen. Daraus ergibt sich induktiv der Fall, dass Z 0 eine Verfeinerung von Z ist, d.h., dass jeder Unterteilungspunkt von Z auch einer von Z 0 ist, induktiv. Der allgemeine Fall folgt dann, indem man die Werte für Z und Z 0 mit dem der gemeinsamen Verfeinerung Z 00 vergleicht. Lemma 7.4 Das Integral ist linear und monoton auf T [a, b]: (i) Für f, g ∈ T [a, b], λ ∈ R gilt Z a b Z b Z f (x) dx + f (x) + g(x) dx = a Z b Z b λf (x) dx = λ f (x) dx. a b g(x) dx sowie a a (ii) Für f, g ∈ T [a, b] mit f ≤ g ist Z b Z f (x) dx ≤ a b g(x) dx. a Beweis. Indem wir ggf. zur gemeinsamen Verfeinerung übergehen, dürfen wir alle Integrale bezüglich einer sowohl zu f als auch zu g gehörigen Unterteilung angeben. Die Behauptungen sind dann klar. Das Riemann-Integral Wir kommen nun zur wesentlichen Idee der Riemann-Integration: der Approximation von oben und unten durch Treppenfunktionen. 128 Definition 7.5 Ist f : [a, b] → R beschränkt, so definieren wir das Ober- und Unterintegral von f durch Z ∗ b Z ϕ(x) dx : ϕ ∈ T [a, b], ϕ ≥ f f (x) dx := inf , a Z Z b ϕ(x) dx : ϕ ∈ T [a, b], ϕ ≤ f f (x) dx := sup ∗ bzw. . a Ist f selbst schon eine Treppenfunktion, so gilt natürlich Z ∗ Z Z b f (x) dx = f (x) dx = f (x) dx. ∗ a Des Weiteren ist offenbar für jedes f Z Z ∗ f≤ f und Z ∗ Z f =− ∗ (−f ). ∗ Lemma 7.6 Es seien f, g : [a, b] → R beschränkt und λ ≥ 0. Dann gilt: (i) Subadditivität des Oberintegrals: Z Z ∗ (f + g) ≤ ∗ Z ∗ g. f+ (ii) Superadditivität des Unterintegrals: Z Z Z (f + g) ≥ f + g. ∗ ∗ ∗ (iii) Positive Homogenität des Ober- und Unterintegrals: Z ∗ Z ∗ Z Z λf = λ f und λf = λ f. ∗ ∗ Beweis. (i) Es sei ε > 0. Wähle Treppenfunktionen ϕ, ψ mit ϕ ≥ f , ψ ≥ g und R∗ Rb R∗ Rb f ≥ a ϕ − 2ε sowie g ≥ a ψ − 2ε . Nach Lemma 7.4 ist dann Z ∗ Z (f + g) ≤ b Z (ϕ + ψ) = a b Z Z ψ≤ ϕ+ a b a Da ε beliebig war, folgt die Behauptung. R R∗ (ii) Das folgt direkt aus (i) und ∗ f = − (−f ). 129 ∗ Z f+ ∗ g + ε. (iii) Der Fall λ = 0 ist trivial, so dass wir λ > 0 annehmen. Zu ε > 0 wähle R∗ Rb eine Treppenfunktion ϕ mit ϕ ≥ f und f ≥ a ϕ − λε . Da λf ≤ λϕ gilt, ergibt sich Z ∗ Z b Z ∗ Z ∗ Z b ε λϕ = λ ϕ≤λ =λ f + ε. λf ≤ f+ λ a a Wieder weil ε beliebig war, folgt daraus nun Z ∗ Z λf ≤ λ ∗ f und damit – angewendet auf λ−1 – auch Z ∗ Z ∗ Z −1 −1 f =λ λ λf ≤ λλ λ ∗ Z λf = ∗ λf. Die analoge Aussage für Unterintegrale ergibt sich nun wieder durch Übergang von f zu −f . Definition 7.7 Eine beschränkte Funktion f : [a, b] → R heißt (Riemann-)integrierbar, wenn Z ∗ Z f= f ∗ gilt. Ist f Riemann-integrierbar, so definiert man das (Riemann-)Integral von f durch Z b Z b Z ∗ f := f (x) dx := f (x) dx. a a Die Menge der Riemann-integrierbaren Funktionen auf [a, b] bezeichnen wir mit R[a, b]. Natürlich kann man statt für die IntegrationsvaR b x auch R b andere RBezeichnungen b riable benutzen, etwa a f = a f (t) dt = a f (y) dy . . . Beachte, dass dieses Integral für Treppenfunktionen mit dem zuvor definierten Integral übereinstimmt. Beispiel: Es seien a = 0, b = 1 und f (x) = x. Für jedes n ∈ N sind die Funktionen ϕ, ψ mit 1 1 ϕn (x) = ψn (x) + ψn (x) = bnxc , n n Treppenfunktionen mit ψn ≤ f ≤ ϕn und Integralen Z 0 1 n−1 X i 1 n−1 ψn (x) dx = · = , n n 2n i=0 Z 1 Z ϕ(x) dx = 0 130 1 ψn (x) dx + 0 1 n+1 = . n 2n Daher ist für alle n n−1 ≤ 2n Z Z ∗ f (x) dx ≤ f (x) dx ≤ ∗ n+1 . 2n Mit n → ∞ folgt f ∈ R[0, 1] und 1 Z 0 1 x dx = . 2 Direkt aus der Definition ergibt sich das folgende Kriterium. Lemma 7.8 Eine Funktion f : [a, b] → R liegt genau dann in R[a, b], wenn es zu jedem ε > 0 Treppenfunktionen ψ, ϕ ∈ T [a, b] mit ψ ≤ f ≤ ϕ und Z b b Z ψ≤ε ϕ− a a gibt. Beweis. Klar. Integrierbare Funktionen Satz 7.9 Die Menge der Riemann-integrierbaren Funktionen R[a, b] bildet einen Vektorraum. Das Riemann-Integral ist eine monotone lineare Abbildung von R[a, b] nach R: (i) Für f, g ∈ R[a, b], λ ∈ R sind auch f + g und λf ∈ R[a, b] mit Z a b Z b Z f (x) dx + f (x) + g(x) dx = a Z b Z b λf (x) dx = λ f (x) dx. a b g(x) dx sowie a a (ii) Für f, g ∈ R[a, b] mit f ≤ g gilt Z b Z f (x) dx ≤ a b g(x) dx. a Beweis. (i) Die Additivität folgt aus Lemma 7.6. Demnach ist Z b Z Z g≤ f+ a b a Z (f + g) ≤ ∗ ∗ Z (f + g) ≤ Z f+ a 131 b b g, a so dass hier sogar Gleichheit gilt. Damit ist f + g integrierbar und das Integral ist Z b Z b Z ∗ Z b g. f+ (f + g) = (f + g) = a a a Die positive Homogenität ergibt sich auch direkt aus Lemma 7.6. Dann gilt aber auch für λ < 0 Z Z ∗ Z Z b Z ∗ Z ∗ Z λf, f = λ f = − (−λf ) = f =λ (−λf ) = λ λf = − ∗ ∗ a ∗ Rb Rb also λf ∈ R[a, b] mit a λf = λ a f . (ii) Für jedes ϕ ∈ T [a, b] mit ϕ ≥ g ist auch ϕ ≥ f . Daher ist Z b Z ∗ ∗ Z f≤ f= Z g= a b g. a Des Weiteren erfüllt R[a, b] die folgenden Eigenschaften. Satz 7.10 Sind f, g ∈ R[a, b], so sind auch (i) f+ , f− ∈ R[a, b], (ii) |f |α ∈ R[a, b] für alle α > 0 und (iii) f g ∈ R[a, b]. Hierbei bezeichnet f± die Funktionen ( f (x), falls f (x) ≥ 0, f+ (x) = 0, falls f (x) < 0 ( −f (x), falls f (x) ≤ 0, f− (x) = (−f )+ (x) = 0, falls f (x) > 0. und Beweis. (i) Für jedes ε > 0 gibt es ϕ, ψ ∈ T [a, b] mit ψ ≤ f ≤ ϕ und ε. Dann aber sind auch ϕ± und ψ± Treppenfunktionen, die ψ+ ≤ f+ ≤ ϕ+ ϕ− ≤ f− ≤ ψ− und erfüllen. Die Behauptung folgt dann aus Lemma 7.8 mit Z b Z b Z b ϕ+ − ψ+ ≤ (ϕ − ψ) < ε, a a a 132 Rb a ϕ− Rb a ψ< denn es ist ϕ+ − ψ+ ≤ ϕ − ψ, und Z b Z b Z b ψ− − ϕ− ≤ (ϕ − ψ) < ε, a a a denn es ist ψ− − ϕ− = (−ψ)+ − (−ϕ)+ ≤ −ψ − (−ϕ) = ϕ − ψ. (ii) Wir überlegen uns zunächst, dass es zu jedem η > 0 und M > 0 eine Konstante C gibt, so dass |y α − xα | ≤ η + C|y − x| ∀ x, y ∈ [0, M ] gilt. Dazu muss man nur beachten, dass es wegen der gleichmäßigen Stetigkeit der Abbildung t 7→ tα auf [0, M ] ein δ > 0 gibt, so dass |y α − xα | ≤ η für |y − x| ≤ δ α gilt. Setzt man dann C = Mδ , so gilt diese Abschätzung für alle x, y ∈ [0, M ]. ε . Es sei ε > 0 beliebig. Setze M = max{|f (x)| : x ∈ [a, b]} und η = 2(b−a) Rb Rb ε Wähle ϕ, ψ ∈ T [a, b] mit 0 ≤ ψ ≤ |f | ≤ ϕ ≤ M und a ϕ − a ψ < 2C . α α (Nach (i) ist |f | = f+ + f− ∈ R[a, b].) Dann sind einerseits ϕ , ψ ∈ T [a, b] mit ψ α ≤ |f |α ≤ ϕα . Andererseits gilt Z b Z b Z b Z b Z b ε α α ϕ− ψ < ε. ϕ − ψ ≤ (η + C(ϕ − ψ)) = + C 2 a a a a a (iii) Dies folgt aus (ii) und f g = 14 (|f + g|2 − |f − g|2 ). Als direkte Folgerung halten wir noch eine elementare aber wichtige Abschätzung fest. Korollar 7.11 Ist f Riemann-integrierbar, so auch |f |. Dabei gilt Z b Z b ≤ f (x) dx |f (x)| dx. a a Beweis. Dies folgt direkt aus der Monotonie des Integrals und aus f, −f ≤ |f |. In Abhängigkeit vom Integrationsbereich ergibt sich das folgende Lemma. Lemma 7.12 Es sei a < b < c. Genau dann ist f ∈ R[a, c], wenn f |[a,b] ∈ R[a, b] und f |[b,c] ∈ R[b, c] ist. In diesem Falle gilt Z c Z b Z c f= f+ f. a a b Beweis. Klar. Vereinbarungsgemäß setzen wir noch Z a Z b f := − f b a für a < b. Besonders wichtig ist es nun natürlich zu wissen, ob gegebene Funktionen integrierbar sind. Der folgende Satz garantiert dies für alle stetigen Funktionen. 133 Satz 7.13 Jede stetige Funktion f : [a, b] → R ist Riemann-integrierbar. Wir zeigen hierzu ein auch für sich genommen interessantes Lemma über die Approximierbarkeit von stetigen Funktionen durch Treppenfunktionen. Lemma 7.14 Es sei f : [a, b] → R stetig. Zu jedem ε > 0 gibt es Treppenfunktionen ϕ, ψ ∈ T [a, b] mit ψ ≤ f ≤ ϕ und ϕ − ψ ≤ ε. Beweis. Da f auf [a, b] gleichmäßig stetig ist, können wir zu gegebenem ε > 0 ein δ > 0 finden, so dass |f (x) − f (y)| ≤ ε für alle x, y ∈ [a, b] mit |x − y| ≤ δ ist. Es sei nun Z : a = x0 < x1 < . . . < xn = b eine Zerlegung mit max{xk − xk−1 : k = 1, . . . , n} < δ, z.B. die äquidistante Zerlegung mit xk = a + nk (b − a) mit xk − xk−1 = b−a für hinreichend große n. Wir definieren dann Treppenfunktionen n ψ, ϕ durch ψ(x) = min{f (ξ) : ξ ∈ [xi−1 , xi ]}, ϕ(x) = max{f (ξ) : ξ ∈ [xi−1 , xi ]} für x ∈ [xi−1 , xi ) und ψ(b) = ϕ(b) = f (b). Dann gilt ψ ≤ f ≤ ϕ und ϕ − ψ ≤ ε. Beweis von Satz 7.13. Es sei f : [a, b] → R stetig. Zu jedem ε > 0 gibt es nach ε . Lemma 7.14 Treppenfunktionen ϕ, ψ ∈ T [a, b] mit ψ ≤ f ≤ ϕ und ϕ − ψ < b−a Dann aber ist auch Z b Z b Z b ε ϕ− ψ≤ dx = ε, a a a b−a und die Behauptung folgt aus Lemma 7.8. 1 Bemerkungen. 1. Es gibt noch mehr integrierbare Abbildungen. Eine weitere Klasse ist die der monotonen Funktionen: Jede monotone Funktion f : [a, b] → R ist Riemann-integrierbar. (Übung!) 2. Ohne Beweis und Relevanz für unsere weiteren Untersuchungen geben wir noch ein notwendig und hinreichendes Kriterium für die Riemann-Integrierbarkeit an. Man nennt eine Teilmenge M ⊂ [a, b] eine Lebesguesche Nullmenge, wenn es zu jedem ε > 0 eine Folge von Intervallen (ai , bi ) gibt, die M überdecken, d.h. [ M ⊂ (ai , bi ) gilt, und die X (bi − ai ) < ε i erfüllen. (Solche Mengen sind also in gewissem Sinne sehr klein.) Man kann dann zeigen, dass eine beschränkte Funktion f : [a, b] → R genau dann Riemann-integrierbar ist, wenn sie außerhalb einer Lebesgueschen Nullmenge stetig ist. 1 Die zweite Bemerkung wurde in der VL weggelassen. 134 Riemannsche Summen Ist f : [a, b] → R eine Funktion, Z : a = x0 < x1 < . . . < xn = b eine Zerlegung von [a, b] und ξk ∈ [xk−1 , xk ], k = 1, . . . , n, so nennt man n X f (ξk )(xk − xk−1 ) k=1 eine Riemannsche Summe. Man definiert die Feinheit von Z durch ρ(Z) := max{xk − xk−1 : k = 1, . . . , n}. In der Tat konvergieren Riemannsche Summen gegen das Integral von f , wenn die Feinheit der Zerlegung gegen 0 strebt: Satz 7.15 Es sei f : [a, b] → R stetig. Dann gibt es zu jedem ε > 0 ein δ > 0, so dass für jede Unterteilung Z : a = x0 < x1 < . . . < xn = b mit ρ(Z) ≤ δ und jede Wahl von Stützstellen ξk ∈ [xk−1 , xk ], k = 1, . . . , n, Z n b X f (x) dx − f (ξk )(xk − xk−1 ) < ε a k=1 gilt. Bemerkung: Der Satz gilt sogar für alle f ∈ R[a, b], was wir hier aber nicht beweisen. Beweis. Zu gegebenem ε > 0 definieren wir genau wie im Beweis von Lemma 7.14 ε (nur mit b−a an Stelle von ε) zu einer Zerlegung Z : a = x0 < x1 < . . . < xn = b mit ρ(Z) ≤ δ die Treppenfunktionen ψ und ϕ. Es ist dann einerseits b Z Z ψ≤ a b Z b f≤ a b Z ϕ≤ ψ + ε. a a Andererseits ergibt sich wegen ψ(x) ≤ f (ξk ) ≤ ϕ(x) für x ∈ [xk−1 , xk ) auch Z b ψ≤ a n X Z f (ξi )(xi − xi−1 ) ≤ Z ϕ≤ a i=1 b b ψ + ε. a Hieraus folgt die Behauptung. Als Anwendung dieses Satzes können wir nun die Hölder- und die MinkowskiUngleichung vom Rn auf Funktionen übertragen. 135 Definition 7.16 Für f ∈ R[a, b] und 1 ≤ p < ∞ definiert man die p-Norm von f durch Z b p1 kf kp := |f (x)|p dx . a Satz 7.17 Es sei f : [a, b] → R stetig. 1 p (i) Höldersche Ungleichung: Für p, q ∈ (1, ∞) mit + 1 q = 1 ist kf gk1 ≤ kf kp kgkq . (ii) Minkowski-Ungleichung: Für p ∈ [1, ∞) ist kf + gkp ≤ kf kp + kgkp . Beweis. Wir zerlegen das Intervall [a, b] äquidistant in n ∈ N Strecken der Länge ∆n = b−a und wählen entsprechende Stützstellen ξ1 , . . . , ξn . Indem man die n 1/p Höldersche Ungleichung für den Rn auf die Vektoren ∆n (f (ξ1 ), . . . , f (ξn )) und 1/q ∆n (g(ξ1 ), . . . , g(ξn )) anwendet, ergibt sich n X |f (ξk )g(ξk )|∆n ≤ k=1 n X ! p1 |f (ξk )|p ∆n k=1 n X ! 1q |g(ξk )|q ∆n . k=1 Die hier auftretenden Summen sind nun Riemannsche Summen, so dass sich die Behauptung (i) mit n → ∞ ergibt. Ähnlich sieht man mit der Minkowski-Ungleichung für den Rn angewendet 1/p 1/p auf die Vektoren ∆n (f (ξ1 ), . . . , f (ξn )) und ∆n (g(ξ1 ), . . . , g(ξn )) n X i=1 ! p1 |f (ξk ) + g(ξk )|p ∆n ≤ n X ! p1 |f (ξk )|p ∆n k=1 + n X ! p1 |g(ξk )|p ∆n , k=1 so dass sich im Limes n → ∞ auch (ii) aus Satz 7.15 ergibt. Bemerkung: Auch dieser Satz gilt sogar auf R[a, b]. Integration vektorwertiger Funktionen Die Integration vektorwertiger Funktionen f : [a, b] → Rn , insbesondere die Integration komplexwertiger Funktionen f : [a, b] → C kann ganz einfach auf die Integration reeller Funktionen zurückgespielt werden, indem man das Integral komponentenweise definiert: 136 Definition 7.18 Eine Funktion f : [a, b] → Rn , x 7→ f (x) = (f1 (x), . . . , fn (x)) heißt Riemann-integrierbar, wenn jede Komponente fk : [a, b] → R, k = 1, . . . , n, Riemann-integrierbar ist. Wir schreiben dann f ∈ R([a, b]; Rn ) und setzen Z b Z b Z b fn (x) dx . f (x) dx := f1 (x) dx, . . . , a a a Für eine komplexwertige Funktion f : [a, b] → C, x 7→ f (x) = u(x) + iv(x) mit u, v : [a, b] → R erhält man gemäß C ∼ = R2 , dass f Riemann-integrierbar ist (d.h. f ∈ R([a, b]; C)), wenn u, v ∈ R[a, b] ist. Es ist dann Z b Z f (x) dx := a b Z u(x) dx + i a v(x) dx. a 137 b Literaturverzeichnis [Br] Th. Bröcker: Analysis I Spektrum Akademischer Verlag, 1995. [Fo] O. Forster: Analysis 1. Vieweg + Teubner, Wiesbaden, 2011. [He] H. Heuser: Lehrbuch der Analysis, Teil 1. Vieweg + Teubner, Wiesbaden, 2009. [Hi] S. Hildebrandt: Analysis 1. Springer, Berlin, 2006. [Kö] K. Königsberger: Analysis 1. Springer, Berlin, 2004. [La] S. Lang: Undergraduate Analysis. Springer, New York, 1997. 138