Mathematik für Informatiker 1 Version: 19.07.2012 Gerhard Freiling und Hans-Bernd Knoop bearbeitet von Frank Müller iii Inhalt von Teil I Inhalt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii-iv § 0 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 0.1 Aussagenlogik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 0.2 Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 0.3 Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 § 1 Reelle Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.1 Die Körperaxiome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.2 Die Anordnungsaxiome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.3 Die reellen Zahlen als vollständig geordneter Körper . . . . . . . . . . . . . . . . . . . . . . 16 1.4 Das Induktionsprinzip. Induktive Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 1.5 Endliche, abzählbare und überabzählbare Mengen . . . . . . . . . . . . . . . . . . . . . . . . 28 1.6 R als metrischer Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 1.7 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 1.8 Gleitpunktarithmetik und Rundungsfehler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 1.8.1 1.8.2 1.8.3 1.8.4 Darstellungen natürlicher Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 Die p-al-Bruch-Darstellung der reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . 52 Gleitpunktzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 Arithmetik von Gleitpunktzahlen: Ein Ausblick . . . . . . . . . . . . . . . . . . . . . . 63 § 2 Folgen und Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .66 2.1 Konvergente Folgen. Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 2.2 Das Rechnen mit konvergenten Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 2.3 Prinzipien der Konvergenztheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 2.4 Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 2.5 Multiplikation von Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 § 3 Stetige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 3.1 Reell- bzw. komplexwertige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 3.2 Grenzwerte von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 3.3 Stetige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 3.4 Sätze über stetige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 3.5 Logarithmus und allgemeine Potenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 iv 3.6 Trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 3.7 Uneigentliche Grenzwerte und Grenzwerte im Unendlichen . . . . . . . . . . . . . . 114 § 4 Differentiation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 4.1 Die Ableitung einer differenzierbaren Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . 118 4.2 Relative Extrema. Mittelwertsätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 4.3 Höhere Ableitungen. Taylor-Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 4.4 Konvexe und konkave Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 4.5 Grenzwertbestimmung mittels Differentiation . . . . . . . . . . . . . . . . . . . . . . . . . . . .132 § 5 Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 5.1 Integration und Differentiation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 5.2 Integration rationaler Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 5.3 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 5.4 Näherungsweise Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 § 6 Folgen und Reihen von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 6.1 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 6.2 Gleichmäßige Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 1 § 0 Einleitung Der Studienplan für das Studium der Angewandten Informatik an der Universität Duisburg-Essen sieht im Grundstudium vier mathematische Grundvorlesungen vor. Dies sind neben zwei 3-stündigen Vorlesungen zur Diskreten Mathematik auch zwei 4-stündige Vorlesungen mit dem Titel Mathematik für Informatiker. Gegenstand dieser beiden letztgenannten Vorlesungen sind im Wesentlichen Grundlagen der Analysis und Elemente der Stochastik. Der Autor der ersten Version dieser Vorlesung (Hans-Bernd Knoop) hat im Sommersemester 2003 und dem nachfolgenden Wintersemester 2003/04 den Versuch unternommen, aus dem Stoff der entsprechenden Mathematik-Vorlesungen (Analysis I bis III und Stochastik) im Diplom- bzw. Lehramtsstudiengang Mathematik die Grundlagen zusammenzustellen, die einerseits für das Informatik-Studium unabdingbar erscheinen und die andererseits für den Besuch mathematisch orientierter Veranstaltungen im Hauptstudium Angewandte Informatik unbedingt notwendig sind. Gedacht ist dabei an Vorlesungen aus dem Bereich der Numerischen Mathematik wie Mathematisches Modellieren, Bildverarbeitung oder Computer Aided Geometric Design bzw. an Veranstaltungen aus dem Bereich der Optimierung. Wegen der in diesen Vorlesungen üblichen mathematischen Strenge haben wir auch in diesen Einführungsvorlesungen fast alle Aussagen bewiesen. Diese Notwendigkeit mag vielleicht einem Studierenden der Angewandten Informatik gerade zu Beginn des Studiums nicht einsichtig sein; wir sind aber der festen Überzeugung, dass dies zum Verständnis im weiteren Verlauf des Studiums nur hilfreich sein kann. Grundlage für die Gegenstände aus der Analysis ist eine Vorlesung Analysis I bis IV, die der zweitgenannte Autor in der Zeit zwischen dem Wintersemester 2001/02 und dem Sommersemester 2003 für den Diplom- bzw. Lehramtsstudiengang Mathematik gehalten hat. Ab dem Sommersemester 2004 wurde die Vorlesung von Gerhard Freiling übernommen; hierbei wurde das Vorlesungsmanuskript überarbeitet und um einige Themen ergänzt, die teilweise dem Vorlesungsmanuskript Analysis I bis IV von G. Freiling bzw. anderen Quellen entnommen wurden; dieses Skript erhebt keinerlei Anspruch auf Originalität. An dieser Stelle möchten die Autoren Herrn D. Winkler (Karlsruhe) danken, der die Unterlagen (files) eines von ihm ausgearbeiteten Vorlesungsmanuskripts zur Verfügung gestellt hat - wir haben hier insbesondere einige von ihm angefertigte Abbildungen verwandt. Ferner danken wir unserem Kollegen Heinz H. Gonska (Duisburg), der zu diesem Skript die erste Version von §1.8 beigetragen hat. Mit Sicherheit wird diese Vorlesung, die durch einen ungemein umfangreichen Stoffkatalog geprägt ist, nicht alle Wünsche der Informatik und der Mathematik, speziell der Studierenden der Angewandten Informatik erfüllen. Deshalb sind uns Anregungen, Ergänzungen, Änderungswünsche oder auch Hinweise zu Fehlern in dem nachfolgenden Text sehr willkommen. Um die Dinge, die wir beweisen wollen, möglichst eindeutig, klar und dennoch kurz darstellen zu können, benötigen wir einige Verabredungen, die wir als erstes zusammenstellen. Dabei stellen wir uns auf einen naiven Standpunkt. 2 0.1 Aussagenlogik Wir wollen den Begriff Aussage klären: Als Aussage soll jeder sprachliche Satz verstanden werden, der seiner inhaltlichen Bedeutung nach entweder wahr oder falsch ist. Dabei kommt es nicht darauf an, dass man tatsächlich weiß, ob der Satz wahr oder falsch ist. Der Satz Morgen wird es regnen ist schon heute eine Aussage, obwohl sich erst morgen herausstellen wird, ob sie wahr oder falsch ist. Wir legen uns also auf eine zweiwertige Logik fest und führen zur Formalisierung die Wahrheitswerte W (für wahr) und F (für falsch) ein. Wenn wir kurz davon sprechen, dass eine Aussage wahr ist, so bedeutet das: Einer Aussage wird der Wahrheitswert W zugeordnet. Wir verknüpfen Aussagen miteinander; dabei kommt es uns nicht auf die neu entstandenen Sätze unserer Sprache an, sondern auf die Wahrheitswerte der Aussage-Verknüpfungen. Wir verstehen also die Aussage-Verknüpfungen als Verknüpfungen von Wahrheitswerten: a) Die Negation (Verneinung, im Zeichen ¬) ordnet jedem Wahrheitswert den entgegengesetzten W -Wert zu: A ¬ A W F F W b) Die Konjugation (UND-Verknüpfung, im Zeichen ∧) ordnet den Aussagen A und B genau dann den Wahrheitswert W zu, wenn sowohl A als auch B wahr sind: A B A ∧B W W W W F F F W F F F F c) Die Disjunktion (ODER-Verknüpfung, im Zeichen ∨) ordnet den Aussagen A und B genau dann den Wahrheitswert W zu, wenn A oder B wahr sind: A B A ∨B W W W W F W F W W F F F d) Die Subjunktion (Implikation, im Zeichen A ⇒ B) ordnet den Aussagen A und B 3 Wahrheitswerte gemäß der folgenden Tabelle zu: A B A ⇒B W W W W F F F W W F F W e) Die Bijunktion (Äquivalenz, im Zeichen A ⇔ B) ordnet den Aussagen A und B genau dann den Wahrheitswert W zu, wenn A und B denselben Wahrheitswert besitzen: B A ⇔B A W W W W F F F W F F F W Mit den so definierten Verknüpfungen kann man komplizierte Gebilde, sog. aussagenlogische Ausdrücke aufbauen, z.B.: (A ⇒ B) ∧ (B ∨ (¬A)) = C. Bei der Ermittlung des Wahrheitswertes eines solchen Ausdrucks verwendet man vorteilhaft Wahrheitstabellen. A ⇒ B B ∨ (¬A) A B W W W W W W F F F F F W W W W F F W W W C Der Satz x ist eine Großstadt ist keine Aussage. Erst wenn x durch den Namen eines Objekts ersetzt wird, ergibt sich eine Aussage. Wir nennen x eine Variable und x ist eine Großstadt eine Aussageform. Wir schreiben allgemein für eine Aussageform mit einer Variablen x auch kurz A(x). Wir setzen nun alle zur Verfügung stehenden Objekte aus dem Variablenbereich ein und überprüfen die entstandenen Aussagen auf ihren Wahrheitswert. Folgende drei Fälle sind möglich: (i) Alle aus A(x) entstandenen Aussagen sind wahr. (ii) Mindestens eine der aus A(x) entstandenen Aussagen ist wahr. 4 (iii) Keine der aus A(x) entstandenen Aussagen ist wahr. Die Sätze unter (i), (ii) und (iii) sind Aussagen. Untersuchungen dieser Art sind – gerade in der Mathematik – so häufig, dass man für die verwendeten Redewendungen eigene Symbole zur Abkürzung eingeführt hat: Statt (i) sagt man: Für alle x gilt A(x) oder mit der Abkürzung: ∀x : A(x) ∧ : A(x) x oder: Statt (ii) sagt man: Es existiert ein x, so dass A(x) gilt oder ∃x : A(x) ∨ : A(x) x bzw. ∀ heißt Allquantor und ∃ heißt Existenzquantor. Für den Satz in (iii) brauchen wir keinen eigenen Quantor, denn die Aussage unter (iii) ist die Verneinung der Aussage unter (ii). Auf einen der beiden anderen Quantoren könnte man noch verzichten, denn es gilt: (∀x : A(x)) ⇔ ¬(∃x : ¬A(x)) bzw. (∃x : A(x)) ⇔ ¬(∀x : ¬A(x)). Hieraus folgt die bei mathematischen Beweisen oft benutzte Äquivalenz: ¬(∀x : A(x)) ⇔ ∃x : ¬A(x) bzw. ¬(∃x : A(x)) ⇔ ∀x : ¬A(x). Will man nun einen mathematischen Satz beweisen, so reiht man eine Kette wahrer Aussagen aneinander. Jedes Glied der Kette ist entweder ein Postulat oder ein bereits früher bewiesener Satz oder es geht nach gewissen Regeln aus den vorangehenden Gliedern der Kette hervor. Diese Regeln heißen Beweisregeln; wir geben einige wichtige Regeln an: a) Modus ponens (Abtrennungsregel): Wenn man weiß, dass die Implikation A ⇒ B wahr ist und dass A wahr ist, so ist auch B wahr. b) Modus tollens (Widerlegungsregel): Wenn man weiß, dass die Implikation A ⇒ B wahr ist und dass ¬B wahr ist, so ist A falsch. c) Kontrapositionsregel: (A ⇒ B) ⇔ (¬B ⇒ ¬A). Diese Regel überprüft man sofort anhand der zugehörigen Wahrheitswertetafel. d) Kettenschluß: Wenn man weiß, dass die Implikation A ⇒ B wahr ist und dass B ⇒ C wahr ist, so ist auch A ⇒ C wahr. Diese Regel kann man sofort aus der Wahrheitswertetafel für die Implikation ablesen. 5 0.2 Mengen Wir verstehen unter einer Menge M die Zusammenfassung gewisser wohlunterschiedener Objekte x unserer Anschauung oder unseres Denkens zu einem Ganzen. Die Objekte x nennen wir die Elemente der Menge und schreiben: x ∈ M. Es dürfen nur solche Mengen gebildet werden, bei denen objektiv entscheidbar ist, ob ein gewisses Objekt Element dieser Menge ist oder nicht. Ist x kein Element der Menge M, so schreiben wir: x 6∈ M. Dies ist äquivalent dazu, dass die Aussage x ∈ M falsch ist oder die Aussage ¬(x ∈ M) wahr ist. Die Menge, die kein Element besitzt, bezeichnen wir mit ∅. Sie heißt leere Menge. In der Regel beschreiben wir eine Menge in der Form {x | x besitzt die Eigenschaft A}, also z.B.: {x | x ist eine natürliche Zahl} oder ∅ = {x | x 6= x}. Ausgehend von zwei Mengen können wir neue Mengen konstruieren: Definition 0.1 Sind M und N Mengen, so heißen M und N gleich (M = N), wenn gilt: x ∈ M ⇔ x ∈ N. Wir schreiben ferner: M ∪ N := {x | x ∈ M ∨ x ∈ N} (Vereinigung) M ∩ N := {x | x ∈ M ∧ x ∈ N} (Durchschnitt) M \ N := {x | x ∈ M ∧ x 6∈ N} (Differenzmenge) M ⊂ N :⇔ (x ∈ M ⇒ x ∈ N) P(M) := {N | N ⊂ M} CM N := M \ N für N ∈ P(M) (Teilmenge, Inklusion) (Potenzmenge) (Komplement) Ist klar, bezüglich welcher Menge M das Komplement zu bilden ist, so lassen wir auch das M bei CM N weg. Die definierende Eigenschaft für den Durchschnitt von M und N können wir dabei folgendermaßen auffassen: Wir schreiben x ∈ M ∩N, wenn die Aussagen x ∈ M und x ∈ N wahr sind. Diese Interpretation ermöglicht es, Eigenschaften bei der Verknüpfung von Mengen auf die Verknüpfung von Aussagen zurückzuführen. Wir wollen dies an einem demonstrieren an einem Beispiel: Sind L, M, N Mengen, so folgt aus L ⊂ M und M ⊂ N stets L ⊂ N (Transitivität von ⊂). Beweis: Wir setzen also L ⊂ M ⇔ (x ∈ L ⇒ x ∈ M) und M ⊂ N ⇔ (x ∈ M ⇒ x ∈ N). voraus und müssen zeigen, dass x ∈ L ⇒ x ∈ N wahr ist. Diese Implikation ist nach der Kettenschluß-Regel wahr. 2 Weitere Eigenschaften bei der Verknüpfung von Mengen fassen wir zusammen in 6 Satz 0.2. Für beliebige Mengen L, M, N gilt: a) M ∩ N = N ∩ M, M ∪N = N ∪M (Kommutativität) b) (M ∩ N) ∩ L = M ∩ (N ∩ L) (Assoziativität) (M ∪ N) ∪ L = M ∪ (N ∪ L) (Assoziativität) c) M ∩ (N ∪ L) = (M ∩ N) ∪ (M ∩ L) (Distributivität) M ∪ (N ∩ L) = (M ∪ N) ∩ (M ∪ L) (Distributivität) d) M \ (N ∩ L) = (M \ N) ∪ (M \ L) (de Morgansche Regel) M \ (N ∪ L) = (M \ N) ∩ (M \ L) (de Morgansche Regel) e) L ⊂ (M ∩ N) ⇔ (L ⊂ M ∧ L ⊂ N) Aufgrund der Assoziativität können wir bei Vereinigungs- und Durchschnittsbildung von mehr als zwei Mengen auf Klammern verzichten. Wir können diese Begriffe auch auf beliebige Mengensysteme ausdehnen: Definition 0.3: Es sei I eine nichtleere Menge und {Mi , i ∈ I} eine Familie von Mengen. Dann heißt \ Mi := {x | ∀i ∈ I : x ∈ Mi } [ Mi := {x | ∃i ∈ I : x ∈ Mi } i∈I der Durchschnitt und i∈I die Vereinigung der Mengen Mi , i ∈ I. Die Eigenschaften aus Satz 0.2 übertragen sich sinngemäß. Wir wollen dies speziell für die de Morganschen Regeln zeigen: Satz 0.4. Es sei {Mi , i ∈ I} eine Familie von Teilmengen von X. Dann gilt: [ Mi ) = \ Mi ) = CX ( bzw. CX ( i∈I i∈I \ CX Mi [ CX Mi . i∈I i∈I 7 Beweis: Wir zeigen eine Gleichheit, z.B. x ∈ CX ( [ i∈I Mi ) ⇔ x ∈ \ i∈I CX Mi ; die andere Gleichheit folgt völlig analog. x ∈ CX ( [ i∈I Mi ) ⇔ x ∈ X ∧ x 6∈ [ Mi i∈I ⇔ x ∈ X ∧ (¬(x ∈ [ Mi )) i∈I ⇔ x ∈ X ∧ (¬(∃i ∈ I : x ∈ Mi )) ⇔ x ∈ X ∧ (∀i ∈ I : ¬(x ∈ Mi )) ⇔ x ∈ X ∧ (∀i ∈ I : x 6∈ Mi ) ⇔ x ∈ X ∧ (∀i ∈ I : x ∈ CX Mi ) ⇔ x∈ \ (CX Mi ) i∈I 2 0.3 Abbildungen Definition 0.5. Gegeben seien zwei nichtleere Mengen M und N. Unter einer Abbildung oder Funktion f von M nach N verstehen wir eine (Zuordnungs-) Vorschrift, die jedem x ∈ M genau ein y ∈ N in eindeutiger Weise zuordnet. Dieses Element y bezeichnen wir auch mit f (x) und nennen es den Wert der Funktion f an der Stelle x oder das Bild von x unter f , während x ein Urbild von f (x) heißt. M heißt Definitionsbereich von f , N Bildbereich von f . Wir schreiben auch f : M ∋ x 7→ f (x) ∈ N oder f : M → N, x 7→ f (x). Bemerkung 0.6. Jede Abbildung f : M → N können wir mit einer Teilmenge von M × N = {(x, y) | x ∈ M, y ∈ N} identifizieren. Ist f gegeben, so können wir f die Menge Gf := G(f ) := {(x, f (x)) | x ∈ M} ⊂ M × N zuordnen. G(f ) heißt Graph von f ; wir können uns die Elemente von G(f ) im cartesischen Koordinatensystem vorstellen. 8 Abbildung 1: Beispiel: f0 : [0, 2] → R, x 7→ x2 Definition 0.7. Zwei Abbildungen f1 : M1 → N1 und f2 : M2 → N2 heißen gleich, wenn M1 = M2 , N1 = N2 und f1 (x) = f2 (x) für alle x ∈ M1 gilt. Wir schreiben kurz: f1 = f2 . Vermöge einer Abbildung f : M → N können wir Teilmengen von M bzw. N solche in N bzw. M zuordnen. Für A ⊂ M bzw. B ⊂ N definieren wir f (A) := {f (x) | x ∈ A} (Bild von A) bzw. f −1 (B) := {x ∈ M | f (x) ∈ B} (Urbild von B). Wir erhalten Satz 0.8. Gegeben seien eine Abbildung f : M → N sowie Teilmengen Ai ⊂ M bzw. Bj ⊂ N. Dann gilt: (a) A1 ⊂ A2 ⇒ f (A1 ) ⊂ f (A2 ) B1 ⊂ B2 ⇒ f −1 (B1 ) ⊂ f −1 (B2 ) (b) f ( [ Ai ) = \ Ai ) ⊂ i∈I f( i∈I (c) f −1 ( [ f (Ai ) \ f (Ai ) i∈I i∈I [ Bj ) = \ Bj ) = j∈J f −1 ( j∈J [ f −1 (Bj ) \ f −1 (Bj ) j∈J j∈J 9 (d) f −1 (CN B0 ) = CM f −1 (B0 ) (e) f −1 (f (A0 )) ⊃ A0 , f (f −1(B0 )) ⊂ B0 . Beweis: Wir demonstrieren an einem Beispiel, wie die Aussagen bewiesen werden können: x ∈ f −1 ( [ j∈J Bj ) ⇔ x ∈ M ∧ f (x) ∈ [ Bj j∈J ⇔ x ∈ M ∧ (∃j ∈ J : f (x) ∈ Bj ) ⇔ ∃j ∈ J : x ∈ f −1 (Bj ) ⇔ x∈ [ f −1 (Bj ). j∈J 2 Definition 0.9. Eine Abbildung f : M → N heißt surjektiv, falls f (M) = N gilt. Eine Abbildung f : M → N heißt injektiv, falls aus x1 , x2 ∈ M und x1 6= x2 stets f (x1 ) 6= f (x2 ) folgt. (Nach obigen Überlegungen ist f genau dann injektiv, wenn aus x1 , x2 ∈ M und f (x1 ) = f (x2 ) stets x1 = x2 folgt.) Für eine injektive Abbildung f können wir die Umkehrabbildung f −1 : f (M) → M dadurch definieren, dass wir jedem f (x) ∈ f (M) das eindeutig bestimmte x ∈ M zuordnen. Es gilt f −1 (f (x)) = x für alle x ∈ M und f (f −1 (y)) = y für alle y ∈ f (M). Eine Abbildung f , die injektiv und surjektiv ist, heißt bijektiv. Beispiele 0.10. Bezeichnen wir die Menge der natürlichen Zahlen mit N, d.h. N := {1, 2, 3, . . .}, so ist f : N ∋ n 7→ n2 ∈ N injektiv, aber nicht surjektiv und g : N ∋ n 7→ surjektiv, aber nicht injektiv. n 2 , falls n gerade n+1 , falls n ungerade 2 ∈N 10 Definition 0.11. Gegeben seien zwei Abbildungen g : M → N1 und f : N2 → L. Ist g(M) ⊂ N2 , so ist die Komposition f ◦ g : M → L definiert durch M ∋ x 7→ f (g(x)) ∈ L. Bezeichnen wir die Abbildung M ∋ x 7→ x ∈ M mit idM (Identität auf M), so erhalten wir für injektives f : M → N: f −1 ◦ f = idM und f ◦ f −1 = idf (M ) . Beispiel 0.12. Betrachten wir die Beispiele aus 0.10, so erhalten wir f (g(n)) = also f n n2 = 2 4 , falls n gerade (n + 1)2 n+1 = f , falls n ungerade 2 4 n f (g(n)) 1 1 2 1 3 4 4 4 5 9 6 9 , ... ; ... die Abbildung g ◦ f ist ebenfalls definiert, und es gilt: 2 g(f (n)) = g(n ) = d.h. n g(f (n)) 1 1 2 2 n2 2 , falls n gerade n2 + 1 , falls n ungerade 2 3 5 4 8 5 13 6 18 , ... . ... Hieraus liest man ab, dass im Allgemeinen gilt: f ◦ g 6= g ◦ f , selbst wenn beide Verknüpfungen definiert sind. 11 § 1 Reelle Zahlen Wir wollen bei der Einführung der reellen Zahlen, der Grundlage der Differential- und Integralrechnung, den axiomatischen Weg verfolgen, d.h. dass wir die fundamentalen Rechenregeln für den Umgang mit reellen Zahlen als definierende Eigenschaften wählen. 1.1 Die Körperaxiome Definition 1.1. Ein Körper K ist eine Menge mit zwei Abbildungen + : K × K → K und · : K × K → K, Addition bzw. Multiplikation genannt, die den folgenden Axiomen genügen: (A1) (x + y) + z = x + (y + z) für alle x, y, z ∈ K. (Die Addition ist assoziativ; hierbei haben wir an Stelle von +(x, y) kurz x + y geschrieben.) (A2) x + y = y + x für alle x, y ∈ K. (Die Addition ist kommutativ.) (A3) Es existiert ein Element 0 ∈ K mit 0 + x = x für alle x ∈ K. (Existenz des neutralen Elements bzgl. + .) (A4) Zu jedem x ∈ K existiert ein Element −x ∈ K mit x + (−x) = 0. (Existenz des inversen Elements bzgl. + ; −x heißt auch Negatives zu x.) (M1) (xy)z = x(yz) für alle x, y, z ∈ K. (Die Multiplikation ist assoziativ; hierbei haben wir an Stelle von ·(x, y) kurz xy geschrieben.) (M2) xy = yx für alle x, y ∈ K. (Die Multiplikation ist kommutativ.) (M3) Es existiert ein Element 1 ∈ K, 1 6= 0, mit 1x = x für alle x ∈ K. (Existenz des neutralen Elements bzgl. · .) (M4) Zu jedem x ∈ K \ {0} existiert ein x−1 ∈ K mit xx−1 = 1. (Existenz des inversen Elements bzgl. · .) (D) Für alle x, y, z ∈ K gilt: x(y + z) = xy + xz. (Distributivgesetz.) 12 Man sagt, dass K mit der Verknüpfung + eine kommutative Gruppe bildet ((A1) - (A4)); K \ {0} bildet bzgl. · eine kommutative Gruppe. Beispiele 1.2. Die rationalen Zahlen Q := m | m ∈ Z, n ∈ N n mit Z := {z | z = 0 ∨ z ∈ N ∨ −z ∈ N} bilden einen Körper. Der kleinste Körper besteht aus zwei Elementen, mit obigen Bezeichnungen 0 und 1, die folgendermaßen verknüpft werden: + 0 1 0 0 1 · 0 1 1 1 0 0 0 0 1 0 1 Wir halten einige Regeln für das Rechnen in Körpern fest; diese Regeln sind uns von Q her bekannt. Satz 1.3. Die Axiome der Addition ergeben folgende Regeln in einem Körper K: a) Ist x + y = x + z, so folgt y = z. (Kürzungsregel) b) Ist x + y = x, so folgt y = 0, d.h. 0 ist eindeutig bestimmt. c) Ist x + y = 0, so folgt y = −x, d.h. dass das inverse Element bzgl. + eindeutig bestimmt ist. d) Für alle x ∈ K gilt −(−x) = x. Beweis: Zu a): Aus x + y = x + z folgt y (A3) = (V or) = (A4) (A1) 0 + y = (−x + x) + y = −x + (x + y) (A1) −x + (x + z) = (−x + x) + z = 0 + z = z. Zu b): Setze in a) z = 0. Zu c): Setze in a) z = −x. Zu d): Aus c) folgt mit −x statt x: Ist −x+y = 0, so ist y = −(−x). Andererseits ist −x+x = 0, also wegen der Eindeutigkeit des Inversen: x = −(−x). 2 13 Bemerkung. Wir schreiben x − y an Stelle von x + (−y). Wegen (x + y) + ((−x) + (−y)) = (x + y) + ((−y) + (−x)) = ((x + y) + (−y)) + (−x) = (x + (y + (−y))) + (−x) = (x + 0) + (−x) = x + (−x) = 0 ist dann −(x + y) = −x + (−y) = −x − y. Weiter folgt x − (y + z) = x + (−(y + z)) = x + ((−y) + (−z)) = (x + (−y)) + (−z) = (x − y) + (−z) = x − y − z. Entsprechend zu Satz 1.3 folgt Satz 1.4. Die Axiome der Multiplikation ergeben: a) Ist x 6= 0 und xy = xz, dann ist y = z. b) Ist x 6= 0 und xy = x, dann ist y = 1 (Eindeutigkeit des neutralen Elements). c) Ist x 6= 0 und xy = 1, so folgt y = x−1 (Eindeutigekeit der Inversen). d) Ist x 6= 0, so gilt (x−1 )−1 = x. Bemerkung: Wir schreiben für x 6= 0 auch 1 an Stelle von x−1 . x Ferner gelten in einem Körper folgende Aussagen: Satz 1.5. a) 0x = 0. b) Ist x 6= 0 und y 6= 0, so auch xy 6= 0. c) (−x)y = −(xy) = x(−y). d) (−x)(−y) = xy. 14 Beweis: Zu a): Es gilt (A3) 0x = (0 + 0)x (D,M 2) = 0x + 0x, also nach Satz 1.3 b): 0x = 0. Zu b): Angenommen, es gilt x 6= 0, y 6= 0 und xy = 0, so folgt 1 = (x−1 x)(y −1 y) = ((x−1 )xy −1 )y = (x−1 (xy −1))y = (x−1 (y −1 x))y = ((x−1 y −1)x)y = (x−1 y −1)(xy) = 0 also ein Widerspruch zu (M3). Also muß xy 6= 0 gelten. Zu c): Es ist (D) also (a) (−x)y + xy = (−x + x)y = 0 · y = 0, (−x)y = −(xy). Entsprechend folgt die zweite Gleichheit. Zu d): Es gilt nach c) und Satz 1.3 d): (−x)(−y) = −(x(−y)) = −(−(xy)) = xy. 2 Der Körper Q der rationalen Zahlen trägt noch mehr Struktur als wir bisher aus der Addition und der Multiplikation entnehmen konnten. 1.2 Die Anordnungsaxiome Definition 1.6. Ein Körper K heißt geordnet, wenn gewisse Elemente als positiv ausgezeichnet sind (wir schreiben: x > 0), so dass folgende Anordnungsaxiome erfüllt sind: (O.1) Für jedes x ∈ K gilt genau eine der drei Beziehungen: x > 0, x = 0 oder −x > 0. (O.2) Sind x > 0 und y > 0, so folgt x + y > 0. (O.3) Sind x > 0 und y > 0, so folgt xy > 0. Wir setzen x > y, falls x − y > 0 gilt, und schreiben x ≥ y, falls x > y oder x = y gilt; statt x > y (bzw. x ≥ y) schreiben wir auch y < x (bzw. y ≤ x). 15 Satz 1.7. Ist K ein geordneter Körper, so gilt: a) x > 0 ⇔ −x < 0 b) Aus x < y und y < z folgt x < z. (Transitivität der <-Beziehung .) c) Ist x < y und z ∈ K beliebig, so folgt x + z < y + z. d) Ist x < y und z > 0, so folgt xz < yz. e) Ist x ∈ K \ {0}, so folgt x2 = x · x > 0; insbesondere ist 1 > 0. f) Ist 0 < x < y, so folgt 0 < y −1 < x−1 . Beweis: Zu a): Es gilt: −x < 0 ⇔ 0 > −x ⇔ 0 − (−x) > 0 ⇔ −(−x) = x > 0. Zu b): Aus y − x > 0 und z − y > 0 folgt nach (O.2): (y − x) + (z − y) > 0, d.h. z − x > 0. Zu c): Aus y − x > 0 folgt (y + z) − (x + z) > 0. Zu d): Aus y − x > 0 und z > 0 folgt nach (O.3): (y − x)z > 0, d.h. yz − xz > 0. Zu e): Ist x ∈ K \ {0}, so folgt nach (O.1): x > 0 oder x < 0. Für x > 0 folgt die Behauptung aus (O.3). Ist x < 0, so gilt nach Teil a): −x > 0 und damit nach (0.3): (−x)(−x) > 0; nach Satz 1.5 d) bedeutet dies: x2 > 0. Wegen 12 = 1 folgt speziell: 1 > 0. Zu f): Aus x > 0 folgt x−1 6= 0 und damit nach Teil e): (x−1 )2 > 0. Teil d) liefert: x(x−1 )2 > 0, d.h. (x · x−1 )x−1 = x−1 > 0. Entsprechend folgt y −1 > 0. (O.3) liefert: x−1 y −1(= (xy)−1) > 0. Multiplikation der Ungleichung x < y mit x−1 y −1 > 0 ergibt y −1 = x(x−1 y −1 ) < y(x−1 y −1) = x−1 . 2 Der Körper Q der rationalen Zahlen wird durch die übliche Anordnung zu einem geordneten Körper. Wir werden an einem Beispiel demonstrieren, dass der geordnete Körper Q einen Nachteil aufweist: 16 Beispiel 1.8. Es sei A := {p ∈ Q | p > 0, p2 < 2} und B := {p ∈ Q | p > 0, p2 > 2}. Wir zeigen, dass A kein größtes und B kein kleinstes Element enthält, d.h.: zu jedem p ∈ A existiert ein q ∈ A mit p < q und zu jedem p ∈ B existiert ein q ∈ B mit q < p. Um dies einzusehen, betrachten wir zu jedem p ∈ Q mit p > 0 die Zahl (i) q =p− p2 − 2 2p + 2 = ; p+2 p+2 dann gilt (ii) q2 − 2 = 2(p2 − 2) . (p + 2)2 Ist nun p ∈ A, d.h. p2 − 2 < 0, so folgt aus (i): q > p und aus (ii): q ∈ A. Ist dagegen p ∈ B, d.h. p2 − 2 > 0, so folgt aus (i): 0 < q < p und aus (ii): q ∈ B. Wir werden im Folgenden mit einem Körper rechnen, der dieses Manko nicht hat. 1.3 Die reellen Zahlen als vollständig geordneter Körper Definition 1.9. Es sei K ein geordneter Körper und M ⊂ K: Existiert ein b ∈ K derart, dass für jedes x ∈ M gilt: x ≤ b, so heißt M nach oben beschränkt, und wir nennen b eine obere Schranke von M. Untere Schranken definiert man analog. Ist M ⊂ K nach oben beschränkt und existiert ein a ∈ K mit folgenden Eigenschaften: (i) a ist obere Schranke von M; (ii) ist b < a, so ist b keine obere Schranke von M, so heißt a kleinste obere Schranke oder Supremum von M; wir schreiben: a = sup M. Analog heißt a größte untere Schranke oder Infimum einer nach unten beschränkten Menge M, Schreibweise a = inf M, wenn gilt: (i) a ist untere Schranke von M; (ii) ist b > a, so ist b keine untere Schranke von M, 17 Beispiele 1.10. a) Wir betrachten die Mengen A und B aus Beispiel 1.8 als Teilmengen des geordneten Körpers Q. A ist nach oben beschränkt; die oberen Schranken von A sind genau die Elemente von B. Da B kein kleinstes Element enthält, hat A keine kleinste obere Schranke in Q. Entsprechend hat B keine größte untere Schranke in Q. b) Falls a = sup M existiert, kann a ∈ M oder a 6∈ M sein. Z.B. gilt für die Mengen M1 := {p ∈ Q | p < 0} bzw. M2 := {p ∈ Q | p ≤ 0} : 0 = sup M1 = sup M2 . c) Für M := 1 | n ∈ N ist sup M = 1 und inf M = 0 mit 1 ∈ M und 0 6∈ M. n Satz 1.11. Es existiert ein geordneter Körper, der Q enthält und in dem jede nichtleere, nach oben beschränkte Teilmenge ein Supremum besitzt. Diesen Körper bezeichnen wir mit R und nennen seine Elemente reelle Zahlen. Beweis: vgl. W. Rudin: Analysis. Oldenbourg-Verlag. Bemerkung. Ein geordneter Körper, in dem jede nichtleere nach oben beschränkte Teilmenge ein Supremum besitzt, heißt vollständig geordnet. (Man könnte auch fordern, dass jede nichtleere nach unten beschränkte Teilmenge ein Infimum besitzt.) Konstruktiv kann eine reelle Zahl als eine Äquivalenzklasse von Cauchy-Folgen rationaler Zahlen definiert werden. Der Beweis bei Rudin verwendet die Methode der Dedekindschen Schnitte. Beide Verfahren gehen auf das Jahr 1872 zurück. Wir ziehen einige Folgerungen aus Satz 1.11: Satz 1.12. a) Sind x, y ∈ R gegeben mit x > 0, so existiert ein n ∈ N mit nx > y. (Archimedisches Prinzip) b) Sind x, y ∈ R gegeben mit x < y, so gibt es ein p ∈ Q mit x < p < y. (Q ist eine dichte Teilmenge von R.) 18 Beweis: Zu a): Wir nehmen an, die Behauptung sei falsch; dann ist die Menge A := {nx | n ∈ N} nichtleer und nach oben beschränkt (durch y). Aufgrund der Vollständigkeit von R existiert a = sup A (in R). Wegen x > 0 ist a − x < a, also a − x keine obere Schranke von A. Daher gibt es ein m ∈ N mit a − x < mx, d.h. a < (m + 1)x, im Widerspruch dazu, dass a eine obere Schranke von A ist. Zu b): Wegen y − x > 0 existiert nach Teil a) ein n ∈ N mit n(y − x) > 1. Weiter gibt es m1 , m2 ∈ N mit m1 > nx bzw. m2 > −nx, d.h. −m2 < nx < m1 . Also existiert ein m ∈ Z (mit −m2 + 1 ≤ m ≤ m1 ) derart, dass m − 1 ≤ nx < m gilt. Zusammenfassen dieser Ungleichungen liefert Wegen n > 0 folgt mit p = m : n nx < m ≤ 1 + nx < ny. x< m = p < y. n 2 Bemerkungen. a) Häufig wird das Archimedische Prinzip in folgender Form benutzt: Zu jedem ε > 0 existiert ein n ∈ N mit 1 < ε. n Diese Eigenschaft ist äquivalent zu der in Satz 1.12 a) formulierten Eigenschaft. (Aus Satz 1.12 a) folgt, dass zu ε = 1 und y = 1 ein n ∈ N exisitiert mit nε > 1, 1 woraus < ε folgt. Für die Umkehrung seien x > 0 und y ∈ R gegeben. Wir wollen n zeigen, dass ein n ∈ N existiert mit nx > y; o.B.d.A. können wir y > 0 voraussetzen, x da sonst die Ungleichung für jedes n ∈ N richtig ist. Zu > 0 finden wir ein n ∈ N y 1 x mit < , was zu n y x d.h. nx > y äquivalent ist.) n> y 19 b) Wir haben die reellen Zahlen als Oberkörper von Q und damit als Obermenge von N eingeführt. Will man darauf verzichten, so führt man R als vollständig geordneten Körper ein, in dem das Archimedische Axiom (x, y > 0 ⇒ ∃n ∈ N : nx > y) gilt. (Dabei sind die natürlichen Zahlen induktiv einzuführen, d.h. 2 := 1 + 1, 3 := 2 + 1, . . . .) Bis auf Isomorphie ist R dann eindeutig bestimmt. 1.4 Das Induktionsprinzip. Induktive Definition. Gegeben sei eine Zahl n0 ∈ Z; wir betrachten die Aussagen A(n) für jedes n ≥ n0 , n ∈ Z. Wir wollen beweisen, dass die Aussagen A(n) für alle n ≥ n0 wahr sind, ohne die Richtigkeit einzeln nachzuprüfen. Dabei hilft uns Das Induktionsprinzip Um die Richtigkeit der Aussagen A(n) für alle n ≥ n0 zu beweisen, genügt es, Folgendes zu zeigen: (I) A(n0 ) ist richtig. (Induktionsanfang) (II) Für beliebiges n ≥ n0 gilt: Falls A(n) richtig ist, so ist auch A(n + 1) richtig. (Induktionsschritt) Bemerkung. Häufig formuliert man das Induktionsprinzip nur für n0 = 1. Bei vielen Abschätzungen ist es jedoch besser, bei einem anderen n0 zu starten. Wir fügen einige Beispiele an, bei denen das Induktionsprinzip erfolgreich beim Beweis angewandt werden kann: Satz 1.13. Es gilt für alle n ∈ N 1 + 2 + 3 + ...+ n = n(n + 1) , 2 12 + 22 + 32 + . . . + n2 = n(n + 1)(2n + 1) , 6 13 + 23 + 33 + . . . + n3 = n2 (n + 1)2 . 4 Beweis: Wir beweisen die dritte Aussage mit Hilfe des Induktionsprinzips. (I) Induktionsanfang für n0 = 1. Die linke Seite ergibt: 13 = 1; die rechte Seite ergibt: 12 · 22 = 1. Also ist die Formel für n = 1 richtig. 4 20 (II) Induktionsschritt: Es gelte 13 + . . . + n3 = der Formel für n + 1, d.h. n2 (n + 1)2 ; zu zeigen ist die Richtigkeit 4 13 + . . . + n3 + (n + 1)3 = (n + 1)2 (n + 2)2 . 4 Nun ist 13 + . . . + n3 + (n + 1)3 = (13 + . . . + n3 ) + (n + 1)3 1 n2 (n + 1)2 + (n + 1)3 = (n + 1)2 (n2 + 4(n + 1)) = 4 4 = 1 (n + 1)2 (n + 2)2 . 4 Das Induktionsprinzip liefert dann die Gültigkeit der Aussage für alle n ∈ N. 2 Beim Prinzip der induktiven Definition geht man davon aus, dass eine Größe für die natürliche Zahl n schon definiert ist und sagt, wie sich die Größe für n + 1 aus der für n ergibt. Allgemein läßt sich das Prinzip folgendermaßen beschreiben: Prinzip der induktiven Definition Gegeben seien eine Menge X, eine Abbildung g : X × N → X und ein a ∈ X. Dann gibt es genau eine Abbildung f : N → X mit f (1) = a und f (n + 1) = g(f (n), n) für alle n ∈ N. Beispiele 1.14. a) Sei X = R und g definiert durch g(r, n) = a · r und f (1) = a. Dann ist f (n) = an = a | · a ·{z. . . · a} ∀ n ∈ N. n−mal Dies beweist man mit dem Induktionsprinzip. b) Sei X = N, a = 1 und g definiert durch g(m, n) = m(n + 1). Dann ist f (n) = 1 · 2 · 3 · . . . · n. Dieses spezielle Produkt trägt den Namen n-Fakultät ; wir schreiben dafür n! . Wir setzen noch 0! = 1. Wir können auch allgemeinere Produkte bzw. Summen in abgekürzter Form aufschreiben; so setzen wir für (reelle) Zahlen a1 , a2 , . . . , an : n X k=1 ak := a1 + a2 + . . . + an 21 und n Y k=1 ak := a1 · a2 · . . . · an . Den Summationsindex k können wir auch anders bezeichnen; so gilt z.B. n X ak = k=1 n X aℓ = ℓ=1 n+10 X n+m X am−10 = m=11 ak−m . k=m+1 Ganz allgemein setzen wir für n ≥ m, m, n ∈ Z: n X ak := am + am+1 + . . . + an k=m bzw. n Y k=m ist dagegen n < m, so sei n X ak := am · am+1 · . . . · an ; ak := 0 n Y und k=m ak := 1. k=m Satz 1.15. Es gilt für m ≤ n n X (ak − ak−1 ) = an − am−1 , n X (ak − ak+1 ) = am − an+1 k=m (Teleskop-Summen) k=m sowie n X ak bk = An bn+1 + k=1 mit Ak = k P j=1 n X k=1 Ak (bk − bk+1 ) (Abelsche Partielle Summation) aj und beliebigem bn+1 . Beweis: Wir beweisen nur die Behauptung über die Abelsche Partielle Summation. Mit A0 = 0 folgt ak = Ak − Ak−1 für k = 1, . . . , n, also n X ak bk = k=1 n X (Ak − Ak−1 )bk = n X Ak bk − n−1 X Ak bk+1 n X Ak bk − n X Ak bk+1 + An bn+1 k=1 = k=1 = k=1 = An bn+1 + n X k=1 Ak bk − n X Ak−1 bk k=1 k=1 k=1 n X k=1 Ak (bk − bk+1 ). 2 22 Wir wollen nun an einigen Beispielen den Umgang mit dem Summen- und dem Produktzeichen üben. Es sei A = {a1 , a2 , . . . , an } eine n-elementige Menge. Eine Permutation (auf A) ist eine bijektive Abbildung von A in sich. Jede solche Abbildung ist eindeutig durch die Bilder der a1 , . . . , an festgelegt. Wegen der Injektivität einer Permutation kommt jedes Element ai unter den Bildern f (a1 ), . . . , f (an ) genau einmal vor. Also beschreibt z.B. das n-Tupel (a2 , a3 , . . . , an , a1 ) eine Permutation auf A, wenn man vereinbart, dass an der i-ten Stelle das Bild f (ai ) steht. Hier ist f (ai ) = ai+1 für a1 für i = 1, . . . , n − 1 i = n. Hieraus ist ersichtlich, dass es im Prinzip nur auf die Reihenfolge der Indizes bei den ai ankommt; deshalb beschreibt man eine Permutation auch kurz durch ein n-Tupel der natürlichen Zahlen 1, . . . , n, z.B. (2, 3, . . . , n, 1). Wieviele n-Tupel der Zahlen 1, . . . , n gibt es? Das führt auf eine Aussage der elementaren Kombinatorik (vgl. Vorlesung Diskrete Mathematik für Informatiker), das sog. Abzähltheorem 1.16. Es sei k ∈ N und K1 , . . . , Kk seien k Kästen, die belegt werden können, z.B. mit Kugeln verschiedener Farbe. Gibt es n1 Möglichkeiten, K1 zu belegen, nach vorgenommener Belegung n2 Möglichkeiten, K2 zu belegen, und daran anschließend n3 Möglichkeiten, K3 zu belegen, . . . und schließlich nk Möglichkeiten, Kk zu belegen, so gibt es insgesamt k Y ni Belegungen der K1 , . . . , Kk . i=1 Beweis: Induktion nach k. 2 Wenden wir diesen Satz auf die Frage nach der Anzahl der bijektiven Abbildungen von A in sich an, so erhalten wir n−1 Y i=0 Permutationen von n Elementen. (n − i) = n! 23 Definition 1.17. Für k, n ∈ N0 := N ∪ {0} setzen wir ! k Y n−j+1 n n(n − 1) · . . . · (n − k + 1) := = k j 1 · 2 · ...· k j=1 ! n heißen Binomialkoeffizienten. (lies: n über k). Die Zahlen k Bemerkung. Aus der Definition folgt unmittelbar ! n = 0 für k > n k und ! n! n n = = k k!(n − k)! n−k Für 1 ≤ k ≤ n gilt ferner ! ! ! für 0 ≤ k ≤ n. ! n−1 n−1 n . + = k k−1 k Beweis: Für k = n ist die Formel richtig. Für 1 ≤ k ≤ n − 1 erhalten wir ! n−1 n−1 + k k−1 ! = (n − 1)! (n − 1)! + (k − 1)!(n − k)! k!(n − k − 1)! ! k(n − 1)! + (n − k)(n − 1)! (n − 1)!n n = . = = k!(n − k)! k!(n − k)! k 2 Satz 1.18. Die Anzahl der Menge A = {a1 , . . . , an } ! ! k-elementigen Teilmengen einer n-elementigen n n ∈ Z ist. , 0 ≤ k ≤ n. Speziell folgt, dass ist gleich k k Beweis: Mit Ckn bezeichnen wir die Anzahl der k-elementigen Teilmenge von A. Wir beweisen Ckn ! n durch Induktion nach n. = k (I) Induktionsanfang: Sei n = 1; dann gibt es eine 0-elementige Teilmenge von A = 1 1 {a1 }, nämlich ∅ und eine 1-elementige Teilmenge, nämlich A. Also ist C0 = C1 = 1. Andererseits ist 10 = 11 = 1. 24 n k (II) Induktionsschritt: Es gelte Ckn = n+1 n+1 . Wegen C0n+1 = 1 = n+1 0 n+1 und Cn+1 =1= brauchen wir nur den Fall 1 ≤ k ≤ n zu behandeln, d.h. Ckn+1 = n+1 k Die k-elementigen Teilmengen von {a1 , . . . , an+1 } zerfallen in zwei Klassen K0 und K1 , wobei K0 alle Teilmengen umfasse, die an+1 nicht enthalten, und K1 alle Teilmengen, die an+1 enthalten. Die Anzahl der Mengen in der Klasse K0 stimmt mitder Anzahl der k-elementigen Teilmengen von {a1 , . . . , an } überein, ist also gleich nk . Jede Menge der Klasse K1 enthält an+1 ; die übrigen k − 1 Elemente sind der Menge n {a1 , . . . , an } entnommen. Nach Induktionsvoraussetzung gibt es k−1 Möglichkeiten dieser Auswahl. Zusammen folgt also mit der Formel aus der vorhergehenden Bemerkung ! ! ! n+1 n n n+1 . = + Ck = k k−1 k 2 Beispiel. ! 49 = 13983816 6-elementige Teilmengen einer Menge von 49 Elementen. Es gibt 6 Also ist die Chance, beim Lotto 6 aus 49 den Hauptgewinn zu erzielen, etwa 1 : 14 Mill. Satz 1.19. (Binomischer Lehrsatz) Es seien a, b ∈ R und n ∈ N, dann gilt mit a0 = b0 := 1: n (a + b) = n X k=0 Beweis: Durch Induktion nach n. 1 (I) Es ist (a + b) = a + b und k=0 für n = 1 richtig. (II) 1 X (a + b) n+1 = (a + b) · (a + b) = n X k=0 = a + n X k=1 n+1 = a + n X n+1 = a + = k=0 n X k=0 ! ! ! ! ! n−1 X n n n+1−k k an−k bk+1 + bn+1 a b + k k k=0 ! !! an+1−k bk + bn+1 n + 1 n+1−k k a b + bn+1 k ! ! n n−k k a b (a + b) k n n n−k k+1 n n+1−k k X a b a b + k k=0 k ! n X k=1 n+1 X ! n n + k−1 k k=1 ! ! ! 1 1 1 1−k k b = a + b; also die Aussage a+ a b = 1 0 k n = n+1 ! n n−k k a b . k n + 1 n+1−k k a b k ! 25 2 Folgerung. Es gilt n X k=0 ! n = 2n k ; also gibt es 2n Teilmengen einer n-elementigen Menge {a1 , . . . , an }. Ferner gilt n X (−1) k=0 k ! n = 0 für n ≥ 1. k Die Binomialkoeffizienten ergeben sich aus dem sog. Pascal’schen Dreieck (a + b)0 : 1 (a + b)1 : 1 (a + b)2 : 1 (a + b)3 : 1 (a + b)4 : 1 (a + b)5 : 1 1 2 1 3 3 1 ց ւ ց ւ ց ւ 4 6 4 5 10 10 · ·· 5 1 1 ·· · Satz 1.20. (Bernoullische Ungleichung) Es seien x ∈ R mit x ≥ −1 und n ∈ N0 gegeben; dann gilt (1 + x)n ≥ 1 + nx. Beweis: Durch Induktion nach n. (I) Für n = 0 ist die Behauptung klar. (II) Es gelte also (1+x)n ≥ 1+nx. Durch Multiplikation dieser Ungleichung mit 1+x ≥ 0 folgt nach Satz 1.7: (1 + x)n+1 ≥ (1 + nx)(1 + x) = 1 + (n + 1)x + nx2 ≥ 1 + (n + 1)x. Ist 1 + x = 0, d.h. x = −1, so gilt die Ungleichung wegen nx = −n ≤ 0, also 1 + nx = −n + 1, und (1 + x)n = 1 für n = 0 bzw. (1 + x)n = 0 für n ≥ 1. 2 Folgerung 1.21. a) Es sei b > 1; dann gibt es zu jedem K > 0 ein n ∈ N mit bn > K. 26 b) Ist 0 < b < 1, so existiert zu jedem ε > 0 ein n ∈ N mit bn < ε. Beweis: Zu a): Sei x := b − 1; Satz 1.20 liefert bn = (1 + x)n ≥ 1 + nx. Nach dem Archimedischen Prinzip existiert zu x > 0 und y = K − 1 ein n ∈ N mit nx > K − 1. Für dieses n gilt: bn > 1 + (K − 1) = K. −1 Zu b): Nach Satz 1.7 ist b Satz 1.7 liefert dann wegen > 1; also existiert nach Teil a) ein n ∈ N mit n 1 b = 1 die Behauptung bn < ε. bn n 1 b > 1 . ε 2 In engem Zusammenhang hiermit ist die Summenformel für die geometrische Reihe zu sehen. Satz 1.22. Es sei x ∈ R \ {1}; dann gilt für jedes n ∈ N0 : n X xk = k=0 1 − xn+1 . 1−x Beweis durch Induktion nach n: (I) n = 0 ergibt: n X xk = x0 = 1 und k=0 (II) n+1 X xk = k=0 n X k=0 = 1 − x0+1 = 1. 1−x xk + xn+1 = 1 − xn+1 + xn+1 1−x 1 − xn+1 + xn+1 − xn+2 1 − xn+2 = . 1−x 1−x 2 Satz 1.23. Zu jedem x ∈ R√mit x > 0 und jedem n ∈ N existiert genau ein y > 0 mit y n = x. Wir schreiben: y = n x oder y = x1/n . √ Bemerkung: Es gilt n x = sup{t > 0 | tn < x}. Dies folgt aus Satz 3.27. Wir geben auch noch einen direkten Beweis an. 27 Beweis: Sei E := {t > 0 | tn < x}; betrachten wir r := x , so ist 0 < r < 1, also 1+x r n ≤ r < x. Damit ist r ∈ E; d.h. E 6= ∅. Für t > 1 + x gilt tn ≥ t > x, also t 6∈ E. Daher ist 1 + x eine obere Schranke von E. Nach Satz 1.11 existiert y = sup E in R. Wir zeigen, dass y n = x gilt. Dazu beweisen wir, dass die Ungleichungen y n > x und y n < x zu Widersprüchen führen. 1. Fall: Sei y > 0 und y n < x; wir wählen h so, dass 0 < h < 1 und h< x − yn n(y + 1)n−1 gilt. Mit b = y und a = y + h > b > 0 folgt dann wegen n n a − b = (a − b) also nan−1 ≥ n−1 X an−1−k bk , k=0 X n−1−k k an − bn n−1 = a b ≥ nbn−1 a−b k=0 für a > b > 0 die folgende Abschätzung: an − bn ≤ nan−1 (a − b) = nan−1 h = nh(y + h)n−1 ≤ nh(y + 1)n−1 < x − y n . Also ist (y + h)n − y n < x − y n oder (y + h)n < x, d.h. y + h ∈ E. Wegen y + h > y widerspricht dies der Tatsache, dass y eine obere Schranke von E ist. 2. Fall: Sei y > 0 und y n > x; wir wählen 0<k< Dann ist k < yn y = ≤ y. n−1 ny n yn − x . ny n−1 28 Mit a := y und b := y − k > 0 folgt wie im ersten Fall an − bn ≤ nan−1 (a − b) = nan−1 k < y n − x. Also ist y n − (y − k)n < y n − x oder (y − k)n > x, d.h. y − k 6∈ E. Also ist y − k eine obere Schranke von E im Widerspruch dazu, dass y die kleinste obere Schranke von E ist. Also muss y n = x gelten; sind y1 , y2 ∈ R, etwa 0 < y1 < y2 , so folgt 0 < y1n < y2n . Also existiert genau ein y mit y n = x. 2 1.5 Endliche, abzählbare und überabzählbare Mengen Definition 1.24. Es sei Nn := {1, 2, . . . , n} für n ∈ N und M irgendeine Menge. Wir schreiben M ∼ N (M gleichmächtig wie N, M äquivalent N), wenn eine bijektive Abbildung f : M → N existiert. M heißt a) endlich, wenn ein n ∈ N mit M ∼ Nn existiert. (∅ wird ebenfalls als endlich betrachtet.) b) unendlich, falls M nicht endlich ist. c) abzählbar, wenn M ∼ N ist. d) überabzählbar, falls M weder endlich noch abzählbar ist. e) höchstens abzählbar, wenn M endlich oder abzählbar ist. Bemerkung. Zwei endliche Mengen M und N sind genau dann gleichmächtig, wenn sie gleichviele Elemente enthalten. Für unendliche Mengen ist der Begriff gleichviele Elemente recht 29 undeutlich, wogegen die Definition mit Hilfe der bijektiven Abbildung eindeutig ist. So ist z.B. Z ∼ N vermöge der Abbildung n für gerades n 2 f : N ∋ n 7→ ∈ Z. n − 1 − für ungerades n 2 Wir konstruieren nun aus gegebenen unendlichen Mengen neue: Satz 1.25. Jede unendliche Teilmenge einer abzählbaren Menge ist abzählbar. Beweis: Sei M abzählbar und N ⊂ M unendlich. Wir ordnen die Elemente von M in der Form f (1), f (2), f (3), . . . , an, wobei f : N → M bijektiv ist. Sei nun n1 ∈ N die kleinste natürliche Zahl mit f (n1 ) ∈ N. Sind nun n1 , . . . , nk−1 schon gewählt, so sei nk ∈ N für k ≥ 2 die kleinste natürliche Zahl mit nk > nk−1 und f (nk ) ∈ N. Wir definieren dann g : N → N durch g(k) = f (nk ); g ist injektiv, da f injektiv ist; außerdem ist g surjektiv: ist nämlich x ∈ N ⊂ M, so existiert ein ℓ ∈ N mit f (ℓ) = x; ist dann k die Anzahl der Elemente in {f (1), . . . , f (ℓ)} mit f (j) ∈ N, so gilt f (ℓ) = g(k). 2 Satz 1.26. Für jedes n ∈ N sei En eine abzählbare Menge. Dann ist auch M := ∞ [ En := n=1 [ En n∈N abzählbar. (D.h.: Die Vereinigung von abzählbar vielen abzählbaren Mengen ist wieder abzählbar.) Beweis: Seien En ∼ N vermöge der Abbildungen fn : N → En , d.h. En = {fn (k) | k ∈ N}. Wir betrachten das folgende unendliche Schema f1 (1) f1 (2) f1 (3) f1 (4) . . . ր ր ր f2 (1) f2 (2) f2 (3) ... ր ր f3 (1) f3 (2) f3 (3) ... ր f4 (1) . . . Das Schema enthält alle Elemente von M. Wir ordnen die Elemente des Schemas gemäß der durch die Pfeile angedeuteten Weise an: f1 (1); f2 (1), f1 (2); f3 (1), f2 (2), f1 (3); f4 (1), . . . 30 Haben zwei der Mengen En gemeinsame Elemente, so treten diese in der Anordnung mehrfach auf. (Wenn wir dies nicht berücksichtigen, so kann genau angegeben werden, an welcher Stelle in dieser Reihenfolge das Element fk (ℓ) steht.) Streichen wir in dieser Anordnung vom zweiten Auftreten an alle Elemente heraus, so wird durch diese Anordnung eine bijektive Abbildung von einer Teilmenge N ⊂ N auf M beschrieben. Also ist M höchstens abzählbar; wegen E1 ⊂ M und E1 ∼ N folgt, dass M abzählbar ist. 2 Satz 1.27. Sei M eine abzählbare Menge und M n für n ∈ N die Menge aller n-Tupel (x1 , . . . , xn ) mit xk ∈ M, also M n := {(x1 , . . . , xn ) | xk ∈ M für 1 ≤ k ≤ n}. Dann ist M n abzählbar. Beweis: Durch Induktion nach n. (I) Für n = 1 ist M 1 = M, also M 1 abzählbar. (II) Sei n > 1 und M n−1 abzählbar; dann ist M n = {(x1 , . . . , xn−1 , xn ) | mit (x1 , . . . , xn−1 ) ∈ M n−1 und xn ∈ M} = {(y, xn ) | mit y ∈ M n−1 , xn ∈ M}, also Mn = [ xn ∈M = [ {(y, xn ) | y ∈ M n−1 } y∈M n−1 {(y, xn ) | xn ∈ M}. Für festes y ∈ M n−1 ist die Menge {(y, xn ) | xn ∈ M} abzählbar. Satz 1.26 liefert dann die Abzählbarkeit von M n . 2 Folgerung 1.28. Q ist abzählbar. n o Beweis: Es ist Q = {0} ∪ m | m, n ∈ Z \ {0} . Die Menge M := Z \ {0} ist abzählbar, n 2 also nach Satz 1.27 auch M , d.h.: dass die Menge aller Paare (m, n) mit m, n ∈ M und m damit die Menge aller Brüche abzählbar ist. 2 n 31 Satz 1.29. Es sei F := {f | f : N → {0, 1}}; dann ist F überabzählbar. (F enthält alle Folgen, die aus Nullen und Einsen gebildet werden können.) Beweis: Sei E ⊂ F eine beliebige abzählbare Teilmenge von F , etwa E = {fk | k ∈ N}; wir konstruieren ein f ∈ F mit f 6∈ E. Dazu sei f (k) := 0 , falls fk (k) = 1 1 , falls fk (k) = 0 . Dann ist f 6= fk für alle k ∈ N, denn es gilt f (k) 6= fk (k). Also ist jede abzählbare Teilmenge von F eine echte Teilmenge von F . Damit ist F überabzählbar, denn andernfalls wäre F eine echte Teilmenge von F . 2 Bemerkung. R und R \ Q sind überabzählbar. 1.6 R als metrischer Raum Aufgrund der Anordnung von R können wir einen Absolutbetrag einführen: Definition 1.30. Für x ∈ R heißt |x| := x für −x für x≥0 x<0 Absolutbetrag von x. Wir können | · | : R ∋ x 7→ |x| ∈ R als Funktion auffassen; diese Funktion erfüllt folgende Eigenschaften: Satz 1.31. Es seien x, y ∈ R; dann gilt: (B1) |x| ≥ 0 und (|x| = 0 ⇔ x = 0). (B2) |xy| = |x| · |y| (B3) |x + y| ≤ |x| + |y| (Dreiecksungleichung) Beweis: (B1) ist klar; durch Diskussion aller möglichen Fälle sieht man (B2) ein. Zu (B3): Wegen x ≤ |x| und y ≤ |y| folgt aus Axiom (O2) bzw. Satz 1.7: x + y ≤ |x| + |y|. 32 Wegen −x ≤ |x| und −y ≤ |y| gilt auch −(x + y) ≤ |x| + |y|. Also ist |x + y| ≤ |x| + |y|. 2 Folgerung 1.32. Für x, y ∈ R gilt a) x y = |x| , falls y 6= 0, und |y| b) ||x| − |y|| ≤ |x − y| ||x| − |y|| ≤ |x + y|. sowie Beweis: Zu a): Wegen x = x · y folgt nach (B2): y |x| = x · |y|, y |x| x d.h. = |y| y Zu b): Sei u := x + y und v := −y; dann gilt nach (B3): |u + v| ≤ |u| + |v|, d.h. |x| ≤ |x + y| + |y| wegen | − y| = |y| oder |x| − |y| ≤ |x + y|. Entsprechend folgt mit u := x + y und v := −x: |y| ≤ |x + y| + |x| oder −(|x| − |y|) ≤ |x + y|. Insgesamt heißt das: ||x| − |y|| ≤ |x + y|. Die erste Ungleichung in b) folgt aus der zweiten wegen | − y| = |y|. 2 Im Zusammenhang mit Abschätzungen sind folgende Aussagen nützlich: Satz 1.33. Seien ε > 0, x0 , x ∈ R; dann gilt: (−) (−) (−) a) |x| < ε ⇔ −ε < x < ε 33 (−) (−) (−) b) |x − x0 | < ε ⇔ x0 − ε < x < x0 + ε. Beweis: Zu a): Folgt sofort aus x ≤ |x| durch die Fallunterscheidung x ≥ 0 bzw. x < 0. Zu b): Nach a) gilt |x − x0 | < ε ⇔ −ε < x − x0 < ε ⇔ x0 − ε < x < x0 + ε. 2 Wir führen an dieser Stelle Abkürzungen für spezielle Mengen in R ein: Definition 1.34. Seien a, b ∈ R mit a < b gegeben; dann sei [a, b] (a, b) :=]a, b[ (a, b] :=]a, b] := {x ∈ R | a ≤ x ≤ b} das abgeschlossene Intervall, := {x ∈ R | a < x < b} das offene Intervall, := {x ∈ R | a < x ≤ b} das links offene bzw. [a, b) := [a, b[ := {x ∈ R | a ≤ x < b} das rechts offene a+b b−a Intervall mit den Randpunkten a und b. Ist x0 := der Mittelpunkt und r := 2 2 der Radius eines Intervalls mit den Randpunkten a und b, so schreiben wir auch Kr (x0 ) :=]a, b[= {x ∈ R | |x − x0 | < r} bzw. Schließlich sei noch K r (x0 ) := [a, b] = {x ∈ R | |x − x0 | ≤ r}. (−∞, a) :=] − ∞, a[:= {x ∈ R | x < a}, (−∞, a] :=] − ∞, a] := {x ∈ R | x ≤ a}, (a, ∞) :=]a, ∞[:= {x ∈ R | x > a}, [a, ∞) := [a, ∞[:= {x ∈ R | x ≥ a}, (−∞, ∞) := ] − ∞, ∞[:= R. Satz 1.35. Eine Menge M ⊂ R ist genau dann nach oben und nach unten beschränkt, wenn ein r > 0 existiert mit M ⊂ K r (0). Beweis: >: Sei a eine untere Schranke und b eine obere Schranke für M, so ist r := max(|a|, |b|) eine obere und −r eine untere Schranke für M; also gilt nach Satz 1.33 für alle x ∈ M : |x| ≤ r. O.B.d.A. können wir r > 0 annehmen. 34 <: Ist M ⊂ K r (0), so gilt für alle x ∈ M: −r ≤ x ≤ r; also ist −r eine untere und r eine obere Schranke von M. 2 Mit Hilfe des Absolutbetrages können wir den Abstand d(x, y) zweier reeller Zahlen x und y definieren durch d(x, y) := |x − y|. Aufgrund der Eigenschaften des Betrages folgt: d(x, y) = 0 ⇔ x = y d(x, y) = d(y, x) sowie d(x, y) ≤ d(x, z) + d(z, y) (|x − y| = |(x − z) + (z − y)| ≤ |x − z| + |z − y|) Diese Eigenschaften fordert man ganz allgemein für eine Abstandsfunktion auf einer beliebigen (nichtleeren) Menge X: Definition 1.36. (i) Ist d : X × X → R eine Abbildung mit den Eigenschaften: (Me 1) (Me 2) (Me 3) d(x, y) = 0 ⇔ x = y d(x, y) = d(y, x) für alle x, y ∈ X d(x, y) ≤ d(x, z) + d(z, y) für alle x, y, z ∈ X (Dreiecksungleichung), so heißt (X, d) ein metrischer Raum; d heißt Metrik oder Abstandsfunktion und d(x, y) der Abstand der Punkte x und y (bzgl. der Metrik d). (Bemerkungen: a) Es gilt stets d(x, z) ≥ 0. Aus (Me 1) bis (Me 3) folgt nämlich für y = x: 0 = d(x, x) ≤ d(x, z) + d(z, x) = 2d(x, z). b) Mit der oben definierten Abbildung ist (R, d) ein metrischer Raum.) (ii) Es sei V ein Vektorraum über K (K = R oder C). Eine Abbildung k · k : V → R heißt Norm (auf V ), wenn gilt: (N1) (N2) (N3) kxk ≥ 0 ∀ x ∈ V , kxk = 0 ⇔ x = 0 ∈ V kλxk = |λ| kxk ∀ x ∈ V, ∀ λ ∈ K kx + yk ≤ kxk + kyk ∀ x, y ∈ V . Ein Vektorraum mit einer Norm heißt normierter Raum . d0 (x, y) := kx − yk heißt Abstand von x und y. Man verifiziere zur Übung, dass d0 : V × V → R eine Metrik auf V definiert; mann nennt d0 die von der Norm induzierte Metrik . 35 Wir wollen weitere Beispiele für metrische Räume kennenlernen. Zuvor halten wir noch eine allgemeine Eigenschaft fest: Satz 1.37. (Vierecksungleichung) Sind x1 , x2 , y1, y2 vier Punkte in einem metrischen Raum (X, d), so gilt: |d(x1 , x2 ) − d(y1 , y2 )| ≤ d(x1 , y1) + d(x2 , y2 ). Beweis: Zweimalige Anwendung von (Me 3) liefert: d(x1 , x2 ) ≤ d(x1 , y1 ) + d(y1, x2 ) ≤ d(x1 , y1 ) + d(y1, y2 ) + d(y2 , x2 ), d.h. (∗) bzw. d(x1 , x2 ) − d(y1 , y2) ≤ d(x1 , y1 ) + d(x2 , y2) d(y1, y2 ) ≤ d(y1 , x1 ) + d(x1 , y2 ) ≤ d(y1 , x1 ) + d(x1 , x2 ) + d(x2 , y2 ) oder (∗∗) d(y1, y2 ) − d(x1 , x2 ) ≤ d(x1 , y1 ) + d(x2 , y2 ). (∗) und (∗∗) ergeben die Behauptung. 2 Wegen 0 ≤ (a − b)2 = a2 − 2ab + b2 d.h. 4ab ≤ a2 + 2ab + b2 = (a + b)2 erhalten wir für a, b ∈ [0, ∞[ folgende Beziehung zwischen dem geometrischen und dem arithmetischen Mittel √ 1 a+b . ab = (ab) 2 ≤ 2 Mit Hilfe dieser Ungleichung beweisen wir Satz 1.38. (Cauchy-Schwarzsche Ungleichung) Für reelle Zahlen a1 , . . . , an , b1 , . . . , bn gilt: n X k=1 |ak bk | ≤ Beweis: Sei A := n X n X k=1 a2k k=1 !1 a2k !1 2 · 2 , B := n X b2k k=1 n X k=1 !1 b2k 2 . !1 2 . 36 Es ist A = 0 ⇔ ak = 0 für 1 ≤ k ≤ n bzw. B = 0 ⇔ bk = 0 für 1 ≤ k ≤ n. In diesen Fällen ist nichts mehr zu beweisen. Deshalb setzen wir A > 0 und B > 0 voraus. Mit |ak | |bk | αk := bzw. βk := erhalten wir nach der obigen Ungleichung: A B n X k=1 |ak bk | = AB ≤ AB n X k=1 αk2 βk2 k=1 n X αk2 + 2 k=1 n X AB = 2 αk2 + k=1 βk2 2 ! n X βk2 k=1 ! n n 1 X 1 X 2 a + b2 A2 k=1 k B 2 k=1 k AB = 2 = αk βk = AB n q X ! AB (1 + 1) = AB. 2 2 Bemerkungen. (i) Aufgrund der Dreiecksungleichung gilt: n X k=1 ak bk ≤ n X ak bk k=1 ≤ n X k=1 |ak bk |. (ii) Setzt man für die Spaltenvektoren a = (a1 , . . . , an )T und b = (b1 , . . . , bn )T aus Rn (sowie analog für n-dimensionale Zeilenvektoren a, b) ha, bi := n X ak bk (Skalarprodukt von a und b) k=1 und kak2 := kak := n X a2k k=1 !1 2 (Euklidische Norm von a), so lautet die Cauchy-Schwarzsche Ungleichung | ha, bi |≤ n X k=1 |ak bk | ≤ n X k=1 a2k !1 2 · n X k=1 b2k !1 2 = kak · kbk. Dass die Euklidische Norm eine Norm im Sinne von Definition 1.36 ist ergibt sich wegen kak ≥ 0 und kλak = |λ| kak ∀ a ∈ Rn , ∀ λ ∈ R aus 37 Satz 1.39. (Minkowski-Ungleichung) Für reelle Zahlen a1 , . . . , an , b1 , . . . , bn gilt: n X ka + bk = (ak + bk )2 k=1 Beweis: O.B.d.A. können wir n X !1 2 ≤ n X a2k k=1 !1 n X 2 + b2k k=1 !1 2 = kak + kbk. (ak + bk )2 > 0 voraussetzen. Dann gilt nach Satz 1.38: k=1 n X (ak + bk )2 = k=1 n X (ak + bk )ak + n X |ak + bk | |ak | + k=1 ≤ k=1 Division durch n X (ak + bk ) k=1 (ak k=1 2 !1 (ak + bk )bk k=1 n X ≤ n X n X k=1 !1 2 + bk )2 |ak + bk | |bk | n X a2k k=1 !1 2 + n X k=1 !1 2 b2 . k 2 ergibt die Behauptung. 2 Als Anwendungsbeispiel erhalten wir die vom R2 bzw. R3 her bekannte Abstandsfunktion: Satz 1.40. Wir definieren auf dem Rn × Rn eine Abbildung d2 durch d2 (x, y) = d2 ((x1 , . . . , xn ), (y1 , . . . , yn )) := n X (xk − yk )2 k=1 !1 2 = kx − yk2; dann ist (Rn , d2 ) ein metrischer Raum und d2 die sog. euklidische Metrik. Beweis: (Me 1) und (Me 2) sind klar. Sind (x1 , . . . , xn )T , (y1, . . . , yn )T und (z1 , . . . , zn )T ∈ Rn , so ergibt sich (Me 3) aus der Minkowski-Ungleichung, wenn wir ak = xk − zk und bk = zk − yk für 1 ≤ k ≤ n setzen: n X (xk − yk ) k=1 2 !1 2 ≤ n X (xk − zk ) k=1 2 !1 2 + n X (zk − yk ) k=1 2 !1 2 , d.h. d2 ((x1 , . . . , xn ), (y1, . . . , yn )) ≤ d2 ((x1 , . . . , xn ), (z1 , . . . , zn )) + d2 ((z1 , . . . , zn ), (y1 , . . . , yn )). 2 38 Bemerkung. Ist n = 2, so erhalten wir d2 ((x1 , x2 ), (y1 , y2)) = q (x1 − y1 )2 + (x2 − y2 )2 , also die nach dem Satz des Pythagoras definierte Entfernung der Punkte (x1 , x2 ) und (y1 , y2 ) im cartesischen Koordinatensystem. Satz 1.41. Auf dem Rn werden durch d1 ((x1 , . . . , xn ), (y1 , . . . , yn )) := n X k=1 bzw. |xk − yk | =: kx − yk1 d∞ ((x1 , . . . , xn ), (y1 , . . . , yn )) := max{ |xk − yk | ; 1 ≤ k ≤ n} =: kx − yk∞ zwei Metriken definiert. Beweis: (Me 1) und (Me 2) sind jeweils klar. Zu (Me 3): Sei x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) und z = (z1 , . . . , zn ); dann folgt d1 (x, y) = n X |(xk − zk ) + (zk − yk )| n X (|xk − zk | + |zk − yk |) = k=1 ≤ k=1 n X k=1 |xk − zk | + n X k=1 |zk − yk | = d1 (x, z) + d1 (z, y) sowie letzteres wegen d∞ (x, y) ≤ d∞ (x, z) + d∞ (z, y), max{|ak + bk | | 1 ≤ k ≤ n} ≤ max{|ak | | 1 ≤ k ≤ n} + max{|bk | | 1 ≤ k ≤ n} angewendet auf ak = xk − zk , bk = zk − yk . 2 Beispiel 1.42. (Französische Eisenbahnmetrik) Wir wählen einen beliebigen, aber festen Punkt P0 aus dem R2 und definieren d : R2 × R2 → R durch d(P1 , P2 ) = d2 (P1 , P2 ), falls P1 und P2 auf einer Geraden durch P0 liegen bzw. d(P1 , P2 ) = d2 (P1 , P0 ) + d2 (P2 , P0 ), falls P1 und P2 nicht auf einer solchen Geraden liegen. Dann ist d eine Metrik auf dem R2 . Beweis als Übung. Um z.B. mit der Eisenbahn von Versailles (P1 ) nach Reims (P2 ) zu kommen, muss man die Entfernungen von Versailles nach Paris (P0 ) und die von Paris nach Reims addieren. Um von Reims nach Chartres zu gelangen, kann man direkt die Entfernung von Reims nach Chartres zurücklegen. 39 Versailles Reims Paris Chartres Abbildung 2: Französische Eisenbahnmetrik 1.7 Komplexe Zahlen Definition 1.43. Eine komplexe Zahl ist ein Paar z = (x, y) reeller Zahlen. Dabei ist z1 = (x1 , y1) gleich z2 = (x2 , y2 ), wenn x1 = x2 und y1 = y2 gilt. Wir definieren Summe bzw. Produkt komplexer Zahlen durch z1 + z2 := (x1 + x2 , y1 + y2 ) und z1 z2 := (x1 x2 − y1 y2 , x1 y2 + x2 y1 ). Dann gilt Abbildung 3: Darstellung und Addition komplexer Zahlen Satz 1.44. Die Menge C aller komplexen Zahlen bildet mit den Verknüpfungen aus Definition 1.43 einen Körper mit dem neutralen Element (0, 0) bzgl. + und (1, 0) bzgl. · . Beweis: Die Axiome (A1) bis (A4) sind für die Tupel (x, y) erfüllt, da R ein Körper ist und die Addition komponentenweise definiert ist. Es gilt −z = −(x, y) = (−x, −y). 40 Zu (M1): (z1 z2 )z3 = (x1 x2 − y1 y2 , x1 y2 + x2 y1 ) · (x3 , y3) = (x1 x2 x3 − x3 y1 y2 − x1 y2 y3 − x2 y1 y3 , x1 x2 y3 − y1 y2 y3 + x1 x3 y2 + x2 x3 y1 ) z1 (z2 z3 ) = (x1 , y1)(x2 x3 − y2 y3 , x2 y3 + x3 y2 ) = (x1 x2 x3 − x1 y2 y3 − x2 y1 y3 − x3 y1 y2 , x1 x2 y3 + x1 x3 y2 + x2 x3 y1 − y1 y2 y3 ) (M2) und (M3) sind klar. Zu (M4): Es ist mit z für z 6= 0: zz −1 = −1 = (x, y) −1 = x y ,− 2 2 2 x +y x + y2 ! y2 −xy xy x2 + , 2 + 2 2 2 2 2 2 x +y x +y x +y x + y2 (D) ergibt sich durch eine ähnliche Rechnung wie bei (M1). ! = (1, 0). 2 Folgerung 1.45. Es gilt für xi ∈ R: (x1 , 0) + (x2 , 0) = (x1 + x2 , 0) sowie (x1 , 0) (x2 , 0) = (x1 x2 , 0). Das zeigt, dass die komplexen Zahlen der Form (x, 0) dieselben arithmetischen Eigenschaften wie die entsprechenden reellen Zahlen x haben. Deshalb können wir (x, 0) als neue Bezeichnung für x ∈ R auffassen. Vermöge dieser Identifikation ist R ein Unterkörper von C oder C eine Erweiterung von R. Setzen wir noch i := (0, 1), so gilt (0, y) = (0, 1) (y, 0) = iy, i2 = (0, 1) (0, 1) = (−1, 0) = −1, also (x, y) = (x, 0) + (0, y) = x + iy. Da wir beim Beweis des Binomischen Lehrsatzes nur die Körperaxiome benutzt haben, gilt dieser auch für komplexe Zahlen, d.h. Satz 1.46. Für a, b ∈ C und n ∈ N gilt mit a0 = b0 := 1: n (a + b) = n X k=0 ! n n−k k a b , k 41 also z.B.: (1 + i)2 = 1 + 2i + i2 = 2i. Definition 1.47. Ist z = x + iy ∈ C, so heißt z := x − iy die zu z konjugiert komplexe Zahl, x der Realteil (x = Re z) und y der Imaginärteil (y = Im z) von z. Folgerung 1.48. Für z, w ∈ C gilt: a) z + w = z + w b) zw = z w c) z + z = 2 Re z, z − z = 2i Im z d) zz = (Re z)2 + (Im z)2 ≥ 0 und (zz = 0 ⇔ z = 0) Beispiele 1.49. Es ist für z = x + iy, w = u + iv ∈ C und w 6= 0 auch w 6= 0, also z zw zw zw = = = 2 . w ww ww u + v2 Das erleichtert häufig die Berechnung von Quotienten komplexer Zahlen, so ist z.B.: 1 1−i 1 1 = = − i 1+i 2 2 2 1 = −i , i und 1 + 2i 1 + 2i (1 + 2i)(−5 − 12i) 19 22 = = = − i. 2 2 2 (2 + 3i) −5 + 12i 5 + 12 169 169 Definition 1.50. 1 Ist z ∈ C, so heißt |z| := (zz) 2 = z = x + iy. √ x2 + y 2 = q (Re z)2 + (Im z)2 der Absolutbetrag von Bemerkung. Im Allgemeinen gilt für komplexe Zahlen: |z|2 6= z 2 . Wähle z.B. z = i; dann ist |z|2 = 1 und z 2 = i2 = −1. Ist z reell, so gilt 1 2 1 2 (zz) = (z 2 ) = z für −z für z≥0 z<0 . Also stimmt dann der reelle Absolutbetrag mit dem komplexen überein. 42 wz y z v w a+b a b x 1 u Abbildung 4: Multiplikation komplexer Zahlen Geometrische Interpretation der Multiplikation komplexer Zahlen Gehen wir vom naiven Verständnis der Sinus- bzw. Cosinus-Funktion aus, so gilt für ein Tupel z = (x, y) ∈ R2 cos α = also x y und sin α = , |z| |z| z = (|z| cos α, |z| sin α) = |z|(cos α + i sin α) =: |z|eiα := reiα . Dies ist die Darstellung von |z| in Polarkoordinaten; hierbei ist r = |z| der Betrag von |z|, α heißt Argument von |z| (und ist nur modulo 2π, d.h. bis auf Vielfache von 2π bestimmt). Hier wollen wir den Winkel zwischen der positiven Realteil-Achse und der Verbindungsgeraden durch z und 0 im Bogenmaß mit 0 ≤ α < 2π gegen den Uhrzeigersinn messen. Ist nun w = (u, v) eine weitere komplexe Zahl, deren Verbindungsgerade durch w und den Nullpunkt mit der positiven Re-Achse den Winkel β einschließt, so folgt aufgrund der Additionstheoreme für die Sinus- bzw. Cosinus-Funktion z w = xu − yv + (yu + xv)i = |z| |w| [(cos α cos β − sin α sin β) + (cos α sin β + sin α cos β)i] = |z| |w|[cos(α + β) + i sin(α + β)] . Zwei komplexe Zahlen werden also miteinander multipliziert, indem man die Absolutbeträge multipliziert und die Argumente, das sind die Winkel mit der positiven RealteilAchse, addiert. Daraus erhalten wir induktiv die sog. Moivresche Formel z n = |z|n [cos nα + i sin nα] = |z|n einα . 43 Abbildung 5: z = eit = cos t + i sin t, t = arg z Auf eine exakte Begründung dieser Sachverhalte (d.h. ohne naives Verständnis der trigonometrischen Funktionen) gehen wir später ein. Weiter ist für z 6= 0 mit r = |z|: 1 z 1 = = 2 (|z| (cos(−α) + i sin(−α)) z zz r 1 (cos α − i sin α) , r woraus sich die Gültigkeit der Moivreschen Formel für n ∈ Z ergibt. = 1 Sowohl für das Produkt zweier komplexer Zahlen als auch für die Kehrwertbildung z lassen sich geometrische Konstruktionen mit Hilfe des Strahlen- und des Kathetensatzes angeben. Wir betrachten zunächst die Multiplikation zweier komplexer Zahlen. zw liegt auf dem vom Nullpunkt ausgehenden Strahl, der mit der positiven Realteilachse den Winkel α + β einschließt. Der Abstand vom Nullpunkt ergibt sich aus dem Strahlensatz: ziehen wir eine Parallele zu der Geraden durch (1, 0) und w durch den Punkt (|z|, 0), so gilt für den Schnittpunkt u dieser Geraden mit der Geraden durch (0, 0) und w: |z| |u| = |w| 1 oder |u| = |w||z| = |wz| . Schlagen wir also einen Kreisbogen um (0, 0) mit Radius |u|, so schneidet dieser Bogen den von (0, 0) ausgehenden Strahl mit Winkel α + β im Punkt zw. w Die Division zweier komplexer Zahlen z, w ∈ C können wir zurückführen auf die Mulz 1 tiplikation von w mit . Deshalb beschäftigen wir uns nun mit der Inversenbildung einer z 44 komplexen Zahl z. Es ist 1 z = 2 , z |z| 1 auf dem vom Nullpunkt (0, 0) ausgehenden Strahl, der mit der positiven Rez alteilachse den Winkel −α einschließt, d.h. der durch (0, 0) und z geht. Wir unterscheiden die Fälle |z| > 1, |z| = 1 und |z| < 1. Sei zunächst |z| > 1 (vgl. Abbildung 6). also liegt z=x+iy s w x-iy Abbildung 6: Inverse komplexer Zahlen (|z| > 1) Wir zeichnen über dem Durchmesser von (0, 0) zu z den Thaleskreis; dieser schneidet den Einheitskreis im Punkt s. Von s fällen wir das Lot auf den Durchmesser; der Lotfußpunkt sei w. Dann gilt nach dem Kathetensatz |w||z| = 12 = 1 , woraus |w| = 1 1 = |z| |z| folgt. Ist |z| < 1 (vgl. Abbildung 7), so errichten wir in z das Lot auf der Geraden durch (0, 0) und z; dieses Lot schneidet den Einheitskreis in s. Wir zeichnen ein rechtwinkliges Dreieck mit den Eckpunkten (0, 0) und s und dem rechten Winkel im Punkt s. Der freie Schenkel schneidet die Gerade durch (0, 0) und z im Punkt w, für den nach dem Kathetensatz gilt: |w||z| = 12 = 1 , woraus wie im ersten Fall die Behauptung folgt. 45 w x-iy z s Abbildung 7: Inverse komplexer Zahlen (|z| < 1) Ist schließlich |z| = 1, so ist 1 = z. z Abschließend halten wir noch einmal die wesentlichen Eigenschaften des Absolutbetrages in C fest: Satz 1.51. Im Folgenden seien z, w ∈ C; dann gilt: a) |z| ≥ 0, |z| = 0 ⇔ z = 0 b) |z| = |z| c) |zw| = |z| |w| d) |Re z| ≤ |z|, |Im z| ≤ |z| e) |z + w| ≤ |z| + |w|. Beweis: a) und b) sind klar. Zu c): Es ist |zw|2 = zw zw = zw z w = zz ww = |z|2 |w|2 . Daraus folgt durch Wurzelziehen |zw| = |z||w|. 46 Zu d): Es ist |Re z| = q (Re z)2 ≤ analog folgt die zweite Relation. q (Re z)2 + (Im z)2 = |z|, Zu e): Es gilt unter Verwendung von d): |z + w|2 = (z + w)(z + w) = zz + zw + wz + ww = |z|2 + zw + zw + |w|2 = |z|2 + 2Re(zw) + |w|2 ≤ |z|2 + 2 |zw| + |w|2 = |z|2 + 2 |z| |w| + |w|2 = |z|2 + 2 |z| |w| + |w|2 = (|z| + |w|)2. 2 Ergänzende Bemerkungen. (i) Betrachten wir auf C die durch den Absolutbetrag induzierte Metrik mit d(z, w) = |z − w|, so erhalten wir gerade den R2 mit der euklidischen Metrik d2 , wenn wir C nur als Menge und nicht als Körper auffassen. Sind a1 , . . . , an , b1 , . . . , bn komplexe Zahlen, so gilt nach Satz 1.51 und Satz 1.38 n X ak bk k=1 ≤ n X k=1 |ak ||bk | ≤ n X k=1 |ak | 2 !1 2 · n X k=1 |bk | 2 k=0 π 4 +π π 4 Abbildung 8: Quadratwurzeln aus a = i, i.e. n = 2 !1 2 . 47 (ii) Multiplikation (in Polarkoordinaten): Sind z1 = r1 eiϕ1 und z2 = r2 eiϕ2 gegeben, so ist z1 · z2 = r1 r2 eiϕ1 eiϕ2 = r1 r2 ei(ϕ1 +ϕ2 ) . Also: Multiplikation der Beträge, Addition der Argumente. Aus der Moivre’schen Formel erhalten wir damit z.B. zwei Zahlen z ∈ C mit z 2 = i. Allgemein kann man zeigen: Sei a = |a|eiα 6= 0. Dann besitzt die Gleichung zn = a genau n verschiedene Lösungen in C, nämlich ζk = q n α 2π |a| ei( n +k n ) , 0 ≤ k ≤ n − 1. Entsprechend gibt es 8 Zahlen z ∈ C mit z 8 = 1, die sog. 8-ten Einheitswurzeln. cw 2 cw w3 c w4 w8 = 1 2π 8 c w5 c c c w7 c w6 Abbildung 9: 8-te Einheitswurzeln Beachte: Es gilt offenbar ζkn = a für 0 ≤ k ≤ n − 1. 2π Im Fall a = 1, d.h. α = 0, ergeben sich mit ζk = eik n die n-ten Einheitswurzeln . 48 1.8 Gleitpunktarithmetik und Rundungsfehler 1.8.1 Darstellungen natürlicher Zahlen Das Rechnen im Dezimalsystem ist uns so vertraut, dass wir uns nicht in jeder Situation klar machen, dass die Zahl 1654 eigentlich die Bedeutung hat 1 · 103 + 6 · 102 + 5 · 101 + 4 · 100 . An Stelle der Potenzen der Zahl 10 können wir auch Potenzen einer anderen natürlichen Zahl p ≥ 2 wählen. Jede natürliche Zahl kann dann mit Hilfe dieser sog. Basen p dargestellt werden, z.B. als Dualzahl Dezimalzahl Oktalzahl Hexadezimalzahl (p = 2), (p = 10), (p = 8), (p = 16). Wir überlegen uns zuerst, welche Zahlen als endliche Linearkombination von Potenzen einer Basis p dargestellt werden können. Ist n= k X i=0 ai · pi eine solche Linearkombination mit 0 ≤ ai < p, so gilt stets 0 ≤ n < pk+1 . Dies ergibt sich sofort aus folgender Abschätzung 0≤ k X i=0 ai · pi ≤ k X i=0 (p − 1) · pi = pk+1 − 1 < pk+1 . Um die Umkehrung dieser Aussage zu beweisen, benutzen wir folgende allgemeingültige Aussage über die ganzzahlige Division mit Rest: Sind a, b ∈ N, so existieren ein x ∈ N0 und ein r ∈ N0 mit 0 ≤ r < b derart, dass a= x·b+r gilt. Unter Verwendung dieser Aussage beweisen wir Satz 1.52. Sei p ∈ N, p > 1 gegeben (sog. Basis) und k ∈ N0 . Dann besitzt jede Zahl n ∈ N0 mit 0 ≤ n < pk+1 eine eindeutig bestimmte Darstellung der Form n= k X i=0 ai · pi mit 0 ≤ ai < p. Die Zahlen ai heißen Ziffern der Zahldarstellung, jede Darstellung einer Zahl n zur Basis p heißt p-adische Darstellung. 49 Beweis: (i) Wir zeigen die Existenz der obigen Darstellung mit Hilfe vollständiger Induktion über k. Induktionsanfang (k = 0): Für k = 0 sind alle Zahlen n mit 0 ≤ n < p Ziffern, d.h. n = 0 ≤ a0 < p. 0 P i=0 ai · pi = a0 mit Induktionsschritt (k → k + 1): Nach der obigen Aussage über die Division mit Rest läßt sich eine Zahl n ∈ N0 mit 0 ≤ n < pk+2 in der Form n = xpk+1 + n′ mit 0 ≤ n′ < pk+1 darstellen. Die Annahme x ≥ p führt wegen n = xpk+1 + n′ ≥ p · pk+1 + n′ ≥ pk+2 zu einem Widerspruch. Also ist x eine Ziffer. Wegen 0 ≤ n′ < pk+1 liefert die Induktionsvoraussetzung: k X n′ = i=0 ai · pi woraus insgesamt n = x · pk+1 + k X i=0 ai · pi = k+1 X i=0 ai · pi mit ak+1 = x folgt. Also gilt die Behauptung für k + 1. (ii) Die Eindeutigkeit beweisen wir ebenfalls mit vollständiger Induktion über k Induktionsanfang (k = 0): Aus n = a0 · p0 = a′0 · p0 folgt direkt a0 = a′0 (= n) Induktionsschritt von k auf k + 1: Seien k+1 X i=0 i ai · p = dann ergibt sich aus der Darstellung n = ak+1 · p k+1 + k X i=0 k+1 X i=0 i a′i · pi = n ; ai · p = a′k+1 ·p k+1 + k X i=0 a′i · pi bei Division durch pk+1 wegen k X i=0 ai · pi < pk+1 und k X i=0 a′i · pi < pk+1 50 zunächst ak+1 = a′k+1 und damit k X i=0 i ai · p = k X i=0 a′i · pi . Die Induktionsvoraussetzung liefert dann ai = a′i für 0 ≤ i ≤ k . Zusammen folgt: ai = a′i , für 0 ≤ i ≤ k + 1 . 2 Korollar 1.53. (Bestimmung der Ziffern einer p-adischen Darstellung) Ist n = k P i=0 ai · pi , 0 ≤ ai < p, so gelten für 0 ≤ i ≤ k die Beziehungen (i) ai = (n div pi ) mod p = ((n div pi−1 ) div p) mod p, (ii) ai = (n mod pi+1 ) div pi . Hierzu bezeichnet mod den Rest bei der ganzzahligen Division und div den ganzzahligen Anteil bei der Division. Ist also a = xb + r mit 0 ≤ r < b, so ist a mod b = r und a div b = x. Beweis: Sei i0 ∈ {0, . . . , k} fest gewählt. Zu (i): Aus n= k X i=0 = ai · pi = iX 0 −1 i=0 iX 0 −1 i=0 ai · pi + ai0 · pi0 + ai · pi + ai0 · pi0 + pi0 · k X i=i0 +1 k X i=i0 +1 ai · pi ai · pi−i0 folgt n div pi0 = ai0 + k X i=i0 +1 ai · pi−i0 = ai0 + p · k X i=i0 +1 ai · pi−i0 −1 mit ai0 < p; also ist (n div pi0 ) mod p = ai0 . Um die zweite Darstellung in (i) zu beweisen gehen wir von n div pi0 −1 = ai0 −1 + k X i=i0 ai · pi−i0 +1 = ai0 −1 + p · aus, woraus sofort (n div pi0 −1 ) div p = k X i=i0 ai · pi−i0 k X i=i0 ai · pi−i0 51 folgt; hieraus ergibt sich wegen k X i=i0 ai · pi−i0 = ai0 + p · k X i=i0 +1 ai · pi−i0 −1 die Behauptung ((n div pi0 −1 ) div p) mod p = ai0 . Zu (ii): Aus n= k X i=0 ai · pi = i0 X i=0 ai · pi + k X i=i0+1 ai · pi folgt n mod pi0 +1 = i0 X i=0 mit ai · pi = iX 0 −1 i=0 Also ist iX 0 −1 i=0 ai · pi + ai0 · pi0 ai · pi < pi0 . (n mod pi0 +1 ) div pi0 = ai0 . 2 Bemerkung Ist die Zahl p vorgegeben, so schreiben wir die p−adische Darstellung einer Zahl n= k X i=0 ai · pi auch in der Form (ak ak−1 . . . a0 )p . Beispiel 1.54. (i) Die Zahl 236 zur Basis p = 8 lässt sich folgendermaßen in das Dezimalsystem umwandeln: 2368 = 2 · 82 + 3 · 81 + 6 · 80 = ((2 · 8) + 3) · 8 + 6) = 15810 . ← Hornerschema (ii) Will man 15810 zur Basis 3 darstellen, so dividieren wir sukzessive nach den Regeln aus Korollar 1.53: a0 = (158 div 30 ) mod 3 = 2, a1 = (158 div 31 ) mod 3 = 52 mod 3 = 1, a2 = (158 div 32 ) mod 3 = ((158 div 31 ) div 3) mod 3 = (52 div 3) mod 3, = 17 mod 3 = 2, 52 a3 = (158 div 33 ) mod 3 = = = 4 a4 = (158 div 3 ) mod 3 = = = 5 a5 = (158 div 3 ) mod 3 = = ((158 div 32 ) div 3) mod 3 (17 div 3) mod 3 5 mod 3 = 2, ((158 div 33 ) div 3) mod 3 (5 div 3) mod 3 1 mod 3 = 1 ((158 div 34 ) div 3) mod 3 (1 div 3) mod 3 = 0. Also ist 2368 = 15810 = 122123 = (((1 · 3 + 2) · 3 + 2) · 3 + 1) · 3 + 2 . (iii) Im Hexadezimalsystem verwendet man üblicherweise die Ziffernsymbole 0, 1, . . . , 9, A, B, C, D, E, F. Dabei ist A16 = 1010 B16 = 1110 .. . E16 = 1410 F16 = 1510 Für 15810 gilt im Hexadezimalsystem für die Ziffern dann a0 = 158 mod 16 (= 1410 ) = E a1 = (158 div 16) mod 16 = 9 Also 15810 = 9E16 = 9 · 16 + 14 . 1.8.2 Die p–al–Bruch–Darstellung der reellen Zahlen Wir betrachten nun bei gegebenem p ≥ 2 Zahlen der Form k X n=1 cn · p−n mit 0 ≤ cn < p, etwa im Fall p = 2 die Zahl 1 1 1 1 53 + + + = = 0.828125 . 2 4 16 64 64 53 Wir gehen der Frage nach, welche Zahlen bei gegebenem p ≥ 2 in der obigen Form 1 dargestellt werden können. Betrachten wir z.B. für p = 10 die Zahl a = , so gilt für jede 3 natürliche Zahl k ≥ 1 mit ak := k X n=1 und bk := k X n=1 die Ungleichung 3 · 10−n = 0.33 . . . 3 3 · 10−n + 4 · 10−(k+1) ak < 1 < bk 3 mit bk − ak = 4 · 10−(k+1) . Je größer wir k wählen, umso kleiner wird die Differenz zwischen ak und bk . Man kann aber für keine endliche Summe der Form k X n=1 cn · 10−n 1 ergibt. Wir erhalten aber eine Folge (ak )k≥1 3 1 von Zahlen, die sich erst in der (k + 1)−sten Stelle von unterscheiden. 3 Wir können uns mit Kenntnissen aus der Zinseszins-Rechnung veranschaulichen, dass wir 1 bei immer größer werdendem k die Zahl beliebig genau annähern können. Es ist nämlich 3 für q 6= 1: 1 − q k+1 , 1 + q + . . . + qk = 1−q also 1 − qk q + . . . + q k = q(1 + . . . + q k−1 ) = q . 1−q Damit lässt sich die Zahl ak folgendermaßen darstellen: mit 0 ≤ cn < 9 erreichen, dass sich der Wert ak = 3 · und wir erhalten k X n=1 1 10 n k 1 3 1 − 10 = · 1 10 1 − 10 1 1 = · 1− 3 10 k ! , 1 1 k 1 − ak = , 3 3 10 also z.B. für k = 6 einen Unterschied von 3-Millionstel. Da wir die Differenz beliebig klein machen können, schreiben wir (was wir später präzisieren werden) ∞ X 1 1 =3· 3 n=1 10 n . 54 Mit diesem intuitiven Verständnis des Zeichens ∞ X beweisen wir folgenden n=0 Satz 1.55 (Entwicklung in p–al–Brüche). Sei p ≥ 2, p ∈ N. Jede nichtnegative reelle Zahl r besitzt eine eindeutige Darstellung der Form r= ∞ X n=0 cn · p−n = c0 + ∞ X n=1 cn · p−n mit (i) 0 ≤ cn < p für n ≥ 1, (ii) c0 ∈ N0 , (iii) cn ≤ p − 2 für unendlich viele n. Beweis: Wir zeigen zuerst die Existenz einer solchen Darstellung; setzen wir c0 = ⌊r⌋ = max{n ∈ N0 : n ≤ r} so ist (ii) erfüllt. Weiter sei r1 := p · (r − c0 ) und c1 = ⌊r1 ⌋ ; wegen r − c0 < 1 ist dann 0 ≤ r1 < p. Wir definieren nun induktiv für n ≥ 1 rn+1 := p(rn − cn ) und cn+1 = ⌊rn+1 ⌋. Wegen 0 ≤ rn − cn < 1 ist 0 ≤ rn+1 = p(rn − cn ) < p , also 0 ≤ cn+1 = ⌊rn+1 ⌋ < p . Damit gilt stets (i). Zu (iii): Annahme: Es existieren nur endlich viele n mit cn ≤ p − 2. Dann gibt es ein N ∈ N mit cn = p − 1 für alle n ≥ N. Sei n ≥ N. Dann ist rn+1 = p · (rn − cn ) = p · (rn − (p − 1)) ; also rn = rn+1 +p−1 p oder p − rn = p − rn+1 . p Stellt man p − rn+1 analog dar, also p − rn+1 = p − rn+2 , p 55 so ergibt sich p − rn = p−rn+2 p = p p − rn+2 , p2 und induktiv erhält man p − rn = p − rn+m pm für alle m ≥ 1 . Wegen 0 ≤ rn+m < p gilt weiter p − rn = p 1 p − rn+m ≤ m = m−1 . m p p p Nun ist für festes n ∈ N stets p − rn > 0, wogegen 1 1 p = pm−1 !m−1 ≤ m−1 1 2 = 1 2m−1 für hinreichend großes m wegen p ≥ 2 beliebig klein gemacht werden kann. Das ist ein Widerspruch . Es ist noch zu zeigen, dass für hinreichend große k die Summe k X n=0 Zahl r beliebig nahe kommt. cn · p−n der gegebenen Dazu beweisen wir durch vollständige Induktion über k, dass gilt r− k X n=0 cn · p−n = rk+1 (≥ 0) . pk+1 Induktionsanfang (k = 0): r − c0 = r1 , p denn Induktionsschritt (k → k + 1): Es ist r− = k+1 X n=0 cn · p−n = r − k X n=0 r1 = p(r − c0 ). cn · p−n − ck+1 · p−(k+1) rk+1 rk+2 − ck+1 · p−(k+1) = (rk+1 − ck+1 ) · p−(k+1) = k+2 k+1 p p Wegen rk+1 < p und p ≥ 2 ist 1 1 rk+1 < k ≤ k , k+1 p p 2 woraus dann wie oben die Behauptung folgt. Die Eindeutigkeit werden wir später zeigen. 2 56 Die p–al–Bruch–Darstellung erweist sich über die folgende Bemerkung für die Erfassung der reellen Zahlen im Rechner als wichtig. Bemerkung 1.56. Jede reelle Zahl r 6= 0 besitzt eine eindeutige Darstellung der Form r = sign (r) · m · pk , wobei 0 < p−1 ≤ m < 1 und k ∈ Z gilt. Hierbei ist 1 sign (r) = 0 −1 falls r > 0 falls r = 0 . falls r < 0 Beweis: Die Beziehung 0 < p−1 ≤ m < 1 ist äquivalent zu 0 < pk−1 ≤ m · pk < pk . Also ist k so zu bestimmen, dass pk−1 ≤ |r| < pk gilt. Dann folgt mit m = |r · p−k | die Behauptung. 2 1.8.3 Gleitpunktzahlen Definition 1.57. Gleitpunktzahlen sind die 0 und alle Zahlen z = ± m · pi , wobei m= t X k=1 ak · p−k ein endlicher p–al–Bruch mit m 6= 0 und i ∈ Z aus dem Intervall I = [−I1 , I2 ] ⊂ Z ist. Die Zahl i sei dabei so gewählt, dass a1 6= 0 ist (d.h. p−1 ≤ m < 1 gilt). m heißt Mantisse, i Exponent von z. Die Menge aller Gleitpunktzahlen mit diesen Parametern bezeichnen wir mit F (p, t, I1, I2 ). Bemerkung 1.58. (i) Gleitpunktzahlen sind spezielle reelle Zahlen (für p = 10: spezielle real-Zahlen) (ii) Für real-Zahlen hat man normalerweise die Normierung schreibt m als m= t2 X k=−t1 ak · p−k , 0 ≤ ak ≤ p − 1, 1 p ≤ m < 1 nicht, sondern ti ∈ N. (daher verschiedene Darstellungen einer Gleitpunktzahl als real-Zahl, 0.23 · 102 = 2.3 · 101 , etc.) 57 (iii) Wir geben die größte positive Gleitpunktzahl zmax in F (p, t, I1 , I2 ) an: Wähle i = I2 , ak = p − 1 für 1 ≤ k ≤ t; dann erhalten wir die größte Mantisse mmax = t X (p − 1) · p−k = k=1 t X k=1 p−k+1 − t X p−k k=1 = 1 − p−t also zmax = +mmax · pI2 = (1 − p−t ) · pI2 . Entsprechend berechnen wir die kleinste positive Gleitpunktzahl zmin in F (p, t, I1, I2 ): Wähle i = −I1 , a1 = 1, ak = 0 für 2 ≤ k ≤ t; dann ist mmin = p−1 , also zmin = +p−1 · p−I1 = p−(I1 +1) (= p−I1 −1 ) . Beispiel 1.59. Sei p = 2, t = 3, I = [−1, 1]; jede Mantisse m hat die Form m = a1 · 2−1 + a2 · 2−2 + a3 · 2−3 , 0 ≤ ai ≤ 1 . Wegen 12 ≤ m < 1 muss stets a1 = 1 gelten. Dann ergeben sich als Möglichkeiten für die Mantissen: 0.100, 0.101, 0.110, 0.111 . Als Exponenten treten auf: −1, 0, 1 . Damit gibt es 4 · 3 + 1 = 13 nichtnegative Gleitpunktzahlen, da die Null ebenfalls eine nichtnegative Gleitpunktzahl ist. Nimmt man die strikt negativen Gleitpunktzahlen hinzu, so erhält man in obigem System insgesamt 2 (4 · 3) + 1 = 25 verschiedene Gleitpunktzahlen in F (2, 3, 1, 1). Eine Veranschaulichung des obigen Beispiel am Zahlenstrahl zeigt, dass die Gleitpunktzahlen nicht äquidistant liegen. Hilfssatz 1.60. Seien t, p, I1 , I2 wie oben gegeben. Dann gilt: (i) Es gibt (p − 1) · pt−1 · (I1 + I2 + 1) + 1 nichtnegative Gleitpunktzahlen. (ii) Für jedes k ∈ I gilt: Es liegen mindestens (p−1)·pt−1 äquidistante Gleitpunktzahlen im Intervall [pk−1 , pk ]. 58 Beweis: (i) a1 kann die Werte 1, . . . , p − 1 annehmen, die restlichen Koeffizienten a2 , . . . , at können p verschiedene Werte annehmen. Also gibt es (p − 1) · pt−1 verschiedene Mantissen. Wegen −I1 ≤ i ≤ I2 gibt es I1 + I2 + 1 verschiedene Exponenten. Nach Hinzunahme der 0 erhält man insgesamt (p−1)·pt−1 (I1 +I2 +1)+1 nichtnegative Gleitpunktzahlen. (ii) Sei k ∈ I = [−I1 , I2 ] fest gewählt. Betrachte {m · pk | m ist Mantisse } ; da es (p−1)·pt−1 verschiedene Mantissen gibt, liegt die gleiche Anzahl äquidistanter Gleitpunktzahlen vor. Ist k ∈ I \ {I2 }, so kann die Zahl pk hinzugenommen werden. 2 Beispiel 1.61. Sei I = {−1, 0, 1}, k=0: t = 3, p = 2; dann erhalten wir folgende Gleitpunktzahlen für 0.100, 0.101, 0.110, 0.111 1 2 5 8 3 4 7 8 Das sind (p − 1) · pt−1 = 1 · 22 = 4 äquidistante Zahlen. Nach Hinzunahme von 1 = ergeben sich (p − 1) · pt−1 + 1 = 5 äquidistante Zahlen k = 1 = I2 : 1 2 · 2 = 1, 5 8 · 2 = 45 , 3 4 · 2 = 32 , 7 8 ·2= 8 8 7 4 Die Hinzunahme von 21 ist nicht möglich, da 2 keine Gleitpunktzahl ist (nur (p−1)·pt−1 = 4 äquidistante Zahlen). k = −1 = I1 : 1 2 · 1 2 Die Hinzunahme von = 14 , 1 2 = 5 8 8 16 · 1 2 = 5 , 16 3 4 · 1 2 = 38 , 7 8 · 1 2 = 7 16 ist möglich; also gibt es 5 äquidistante Zahlen. Das Verfahren der Rundung besteht darin, die reellen Zahlen auf (die im Rechner darstellbaren) Gleitpunktzahlen abzubilden. Dabei sind verschiedene Rundungsmethoden möglich. Definition 1.62. Sei F (t, p, I1, I2 ) ein Gleitpunktzahlensystem und r ∈ R, r 6= 0. Dann gibt es nach Bemerkung 1.56 eindeutig bestimmte k und m mit p−1 ≤ m < 1, so dass r = sign (r) · m · pk . 59 Für −I1 ≤ k < I2 oder k = I2 und m < 1 − 12 p−t sei die gerundete Zahl rR ∈ F (p, t, I1, I2 ) definiert durch |r − rR | = (∗) min r ′ ∈F (p,t,I1 ,I2 ) |r − r ′ | Ist rR nicht eindeutig bestimmt, so wähle man die betragsgrößte unter den Gleitpunktzahlen mit minimalem Abstand. Bemerkung 1.63. (i) Gilt k < −I1 , so spricht man von einem Unterlauf (underflow). Setze in diesem Fall rR = 0. (ii) Gilt k > I2 oder k = I2 und m ≥ 1− 12 p−t , so setzt man rR = Ω (overflow, Überlauf). Hilfssatz 1.64. Sei F (p, t, I1 , I2 ) ein Gleitpunktzahlensystem und r ∈ R mit pk−1 ≤ |r| < pk und k ∈ I = [−I1 , I2 ] bzw. falls k = I2 sei pI2 −1 ≤ |r| < pI2 · (1 − 21 p−t ), (so dass rR = Ω ausgeschlossen ist). Dann gilt: rR = sign (r) · |r|p t−k 1 k−t + p . 2 Beweis: Sei r = sign (r) · m · pl ; aus pk−1 ≤ |r| < pk folgt: pk−1 ≤ m · pl < pk . Wegen m < 1 ergibt sich pk−1 < pl und wegen m ≥ 1 p ist pl = 1 · pl ≤ (mp)pl = p · (mpl ) < p · pk = pk+1 . Demnach ist pk−1 < pl < pk+1 und damit k − 1 < l < k + 1 oder l = k. Also folgt r 1 k−t k − sign (r) · |r|p + p = mp − 2 1 k−t t t ≤ = mp − mp + · p 2 j t−k k t−k mp p 1 k−t p 2 k 1 k−t + p 2 Damit ist sign(r) · |r|pt−k + 21 pk−t eine reelle Zahl, deren Abstand von r kleiner oder gleich 12 pk−t ist. Wir zeigen nun, dass diese Zahl Element von F (p, t, I1 , I2 ) ist. 1. Fall: Ist |r| < pk (1 − 12 p−t ), so gilt: |r|pt−k + 1 1 1 < pk (1 − p−t ) · pt−k + = pt , 2 2 2 60 also t−1 X 1 ⌊|r|pt−k + ⌋ = cj · p j 2 j=0 mit 0 ≤ cj < p und damit t t−1 X X 1 ct−j · p−j . cj · pj−t = sign (r) · pk · sign (r) · ⌊|r|pt−k + ⌋ · pk−t = sign (r) · pk · 2 j=1 j=0 Wegen k ∈ I = [−I1 , I2 ] ist letzteres ein Element von F (p, t, I1 , I2 ). 2. Fall: Für |r| ≥ pk (1 − 21 p−t ) ist k < I2 , d.h. k ≤ I2 − 1. Weiter ist |r|pt−k + 1 1 1 < pk pt−k + = pt + 2 2 2 und |r|pt−k + j d.h. |r|pt−k + 1 2 k 1 1 1 ≥ pk (1 − p−t )pt−k + = pt , 2 2 2 = pt . Daraus folgt sign (r) |r|p t−k 1 k−t + p = sign (r)pk 2 = sign (r)p−1 pk+1 = sign (r) · t X j=1 cj p−j pk+1 mit c1 = 1 und cj = 0 für j > 1 und k + 1 ≤ I2 − 1 + 1 = I2 , d.h. k + 1 ∈ I; also gilt auch in diesem Fall 1 k−t t−k sign (r) |r|p + p ∈ F (p, t, I1 , I2 ) . 2 Aus Hilfssatz 1.60 (ii) folgt: Im Intervall [pk−1 , pk ] liegen für k < I2 genau (p−1)·pt−1 +1 äquidistante Gleitpunktzahlen, die voneinander den Abstand pk−t haben; im Fall k = I2 und m < 1 − 21 p−t sind es (p − 1) · pt−1 äquidistante Gleitpunktzahlen. Also hat die r nächstgelegene Gleitpunktzahl, nämlich rR , einen Abstand zu r, welcher kleiner oder gleich 12 pk−t ist. Offensichtlich gibt es höchstens zwei solche Zahlen. 1. Fall: Ist rR eindeutig bestimmt, so ist rR = sign (r) · |r| · p t−k 1 · pk−t . + 2 2. Fall: Es existieren zwei Gleitpunktzahlen, die von r den Abstand 1 2 · pk−t haben. 61 Wir müssen zeigen, dass in der Behauptung angegebene Gleitpunktzahl die größere der beiden Zahlen ist. Sei o.B.d.A. r > 0; dann ist r= t X aj · p−j · pk j=1 | {z + } kleinere Gleitpunktzahl Wir zeigen nun, dass | t X j=1 aj · p −j k ·p +p k−t {z ! = 1 k−t ·p |2 {z } Abstand rp t−k 1 · pk−t + 2 } größere Gleitpunktzahl gilt. Wir erhalten durch Einsetzen, ausgehend von der rechten Seite: = t X 1 1 1 r · pt−k + · pk−t = aj · p−j · pk + · pk−t · pt−k + · pk−t 2 2 2 j=1 t X aj j=1 = t−1 t X X 1 1 · p−j pt + + · pk−t = aj · pt−j + 1 · pk−t = at−j · pj + 1 · pk−t 2 2 j=0 j=1 t−1 X j=0 at−j · p j + 1 · pk−t = Also ist auch im 2. Fall = t−1 X j=0 t X j=1 at−j · p j+k−t +p k−t = t X j=1 aj · pk−j + pk−t aj · p−j · pk + pk−t rR = sign (r) |r| · p t−k 1 + · pk−t . 2 2 Satz 1.65 (über den relativen Rundungsfehler). Sei r ∈ R und rR 6= Ω. Dann gilt rR = r(1 + δ) mit |δ| ≤ 1 1−t ·p 2 Beweis: Sei o.B.d.A. r > 0 und k so, dass gilt: pk−1 ≤ r < pk . 1. Fall: Ist k < I2 , so liegen im Intervall [pk−1 , pk ] insgesamt (p − 1)pt−1 + 1 äquidistante Gleitpunktzahlen (unter denen pk−1 und pk vorkommen). Jedes Teilintervall hat die Länge pk−t . 62 Da r immer zur nächstliegenden Gleitpunktzahl gerundet wird und benachbarte Gleitpunktzahlen den Abstand pk−t haben, gilt |r − rR | ≤ also 1 k−t ·p , 2 1 · pk−t 1 |r − rR | ≤ 2 k−1 = p1−t r p 2 oder |r − rR | ≤ r · d.h. −r · 1 1−t p 2 1 1 1−t p ≤ rR − r ≤ r · · p1−t . 2 2 Daraus folgt 1 1 rR ≤ r + r · p1−t = r 1 + · p1−t 2 2 Also existiert ein δ mit |δ| ≤ 1 2 1 1 und rR ≥ r − r · · p1−t = r 1 − p1−t 2 2 p1−t derart, dass rR = r(1 + δ) gilt. 2. Fall: Ist k = I2 , dann liegen im Intervall [pk−1 , pk ] nur (p − 1)pt−1 äquidistante Gleitpunktzahlen mit dem Abstand pI2 −t ; die kleinste ist pI2 −1 und die größte ist (1 − p−t ) · pI2 , Wegen rR 6= Ω gilt im Fall r = m · pI2 stets m < 1 − 21 p−t . Ist r ≤ (1 − p−t ) · pI2 , so ergibt sich wie im 1. Fall: |r − rR | ≤ 21 · pI2 −t und damit die Behauptung. Ist dagegen r > (1 − p−t ) · pI2 , d.h. (1 − p−t ) · pI2 < r < (1 − 1 −t · p ) · pI 2 , 2 so folgt 1 1 − p−t pI2 − (1 − p−t ) · pI2 2 1 1 −t I2 · p · p = · pI2 −t = 2 2 |r − rR | ≤ Daraus folgt die Behauptung wie im 1. Fall. 2 Beispiel 1.66 (Relativer Fehler bei Rundung von π). Sei p = 10, t = 4, I1 = 0, I2 = 1; Betrachte π = 3.14159265.... und schreibe π = +.314159265... · 101 Also ist k = 1. Hilfssatz 1.64 liefert πR = |π| · 103 + 1 1 · 10−3 = 3141.5 . . . + · 10−3 2 2 63 = 3142 · 10−3 = 3.142 = +.3142 · 101 . Damit ist .3142 · 101 − .314159265... · 101 πR − π = ≈ 1.28597 · 10−4 = 0.000128597 . 1 π .314159265... · 10 Die Abschätzung von Satz 1.65 liefert 1 1 · 101−4 = · 10−3 = 0.0005. 2 2 |δ| ≤ Bemerkung 1.67. Die Schranke von Satz 1.65 ist fast scharf. Wähle dazu 1 1−t ·p 2 r = pk · 1 + = Dann ist Daraus folgt 1 −t ·p ·pk+1 {z2 } p−1 + | (Gleitpunktdarstellung) =m rR = p−1 + p−t · pk+1 = pk (1 + p1−t ) (vgl. die Mantisse !) . 1 · pk+1−t 1 1 1−t p1−t rR − r 2 = = k · ·p für große t. 1 1 1−t ≈ 1−t r p (1 + 2 · p ) 2 1 + 2p 2 1.8.4 Arithmetik von Gleitpunktzahlen: Ein Ausblick Da arithmetische Grundoperationen mit Gleitpunktoperanden i.a. nicht zu einer Gleitpunktzahl führen, muss dies durch eine Änderung der arithmetischen Operationen erzwungen werden. Definition 1.68. Für x, y ∈ F (p, t, I1 , I2 ) definiert man für jede Operation ω ∈ {+, ·, −, /}: x ω y := (x ω y)R . Bemerkung 1.69. Nach Satz 1.65 gilt für ω ∈ {+, ·, −, /}: x ω y−x ω y 1 1−t ≤ ·p xωy 2 (Je größer t ist, desto kleiner ist der relative Rundungsfehler.) Rechenregeln werden durch Rundung beeinflußt: 64 Beispiel 1.70. Betrachte F (10, 2, 2, 2) und die Gleitpunktzahlen x = + 0.10 · 101 y = − 0.99 · 100 z = + 0.10 · 10−2 Dann ist (x ⊕ y) = (1.0 − 0.99)R = (0.01)R = + 0.10 · 10−1 , (x ⊕ y) ⊕ z = (0.01 + 0.001)R = (0.011)R = 0.11 · 10−1 . Andererseits gilt (y ⊕ z) = (−0.99 + 0.001)R = (−0.989)R = − .99 · 100 , x ⊕ (y ⊕ z) = (1.0 − 0.99)R = (0.01)R = 0.1 · 10−1 . D.h.: Bei der Gleitpunktaddition gilt das Assoziativgesetz nicht. Andere Rechenregeln bleiben erhalten, die wir unten nur auflisten: Hilfssatz 1.71 (Rechengesetze für die Gleitpunktarithmetik). (i) xR = (xR )R , (ii) x ≥ x′ ⇒ xR ≥ x′R (iii) x ⊕ x′ = x′ ⊕ x (iv) x ⊙ x′ = x′ ⊙ x (v) x, x′ ≥ 0 ⇒ (x ⊖ x′ ) ⊕ x′ = x (vi) x ⊖ x′ = x ⊕ (−x′ ) = −(x′ ⊖ x) (−x) ⊙ x′ = x ⊙ (−x′ ) = −(x ⊙ x′ ) (−x) ⊘ x′ = x ⊘ (−x′ ) = −(x ⊘ x′ ) x⊖x= 0 (vii) 0 ≤ x ≤ x1 , 0 ≤ x′ ≤ x′1 ⇒ x ⊕ x′ ≤ x1 ⊕ x′1 x ⊖ x′1 ≤ x1 ⊖ x′ x ⊙ x′ ≤ x1 ⊙ x′1 x ⊘ x′1 ≤ x1 ⊘ x′ , wenn x′1 6= 0 und x′ 6 0 (viii) x′ ≥ 0 ⇒ x ⊕ x′ ≥ x (ix) x ≥ x′ ⇒ x ⊖ x′ ≥ 0 (x) 0 ≤ x und 0 ≤ x′ ≤ 1 ⇒ x ⊙ x′ ≤ x 65 (xi) 0 ≤ x ≤ x′ ⇒ x ⊘ x′ ≤ 1, wenn x′ 6= 0 (xii) x ⊕ 0 = x ⊖ 0 = x ⊙ 1 = x ⊘ 1 = x (xiii) x ⊙ 0 = 0 (xiv) x ⊘ x = 1, wenn x 6= 0 (xv) −(x)R = (−x)R Warnung: Die Assoziativgesetze bzgl. ⊕ und ⊙, die Distributivgesetze und die Kürzungsregeln gelten nicht (Beispiele: Aufgabe). Rundungsfehler können das Ergebnis einer Rechnung ganz erheblich verfälschen. Ein besonders gefährliches Phänomen ist das der sog. Stellenauslöschung bei Differenzen etwa gleich großer Zahlen. Beispiel 1.72. Löse das folgende Gleichungssystem in F (10, 3, 10, 10): (I) 0.100 · 10−3 x1 + 0.100 · 101 x2 = 0.100 · 101 (II) 0.100 · 101 x1 + 0.100 · 101 x2 = 0.200 · 101 Als exakte Lösung erhalten wir: 104 104 − 2 und x = 2 104 − 1 104 − 1 Ein Programm möge folgendermaßen arbeiten: Gleichung (I) werde mit 104 multipliziert, und davon wird Gleichung (II) subtrahiert. Man erhält: x1 = (I’) x1 + 104 · x2 = 104 (II) x1 + x2 = 2 Also (I’) - (II) exakt: (II’) (104 − 1) x2 = 104 − 2 Aber in F (10, 3, 10, 10) wird folgendermaßen gerechnet: (104 − 1)R · x2 = (104 − 2)R , also woraus 0.100 · 105 x2 = 0.100 · 105 (Auslöschung signifikanter Stellen), x2 = 1 folgt. Setzt man in Gleichung (I) ein, so folgt: 0.100 · 10−3 x1 + 0.100 · 101 · 1 = 0.100 · 101 , also x1 = 0 . 66 §2 Folgen und Reihen Häufig werden Größen, die sich nicht durch einen in endlich vielen Schritten berechenbaren Ausdruck angeben lassen, durch Näherungen oder Approximationen ersetzt. Dabei muss z.B. in Abhängigkeit der Stellenzahl eines Rechners mit unterschiedlich vielen Schritten gerechnet werden; man ist dann mit einer Näherung zufrieden, wenn die vom Rechner angezeigten Stellen mit denen der exakten Größe übereinstimmen. Grundlage für die Untersuchung solcher Fragen ist der Begriff des Grenzwertes einer Zahlenfolge. 2.1 Konvergente Folgen. Beispiele Obwohl wir uns im Folgenden fast ausschließlich mit reellen bzw. komplexen Zahlenfolgen beschäftigen, werden wir den Begriff einer (konvergenten) Folge etwas allgemeiner fassen. Definition 2.1. Gegeben sei ein metrischer Raum (X, d); unter einer Folge verstehen wir eine Abbildung f : N → X. Jedem n ∈ N ist also genau ein an := f (n) ∈ X zugeordnet. Statt f schreiben wir auch (an )n∈N , (an )n≥1 oder (a1 , a2 , . . .). Ist n0 ∈ Z, so bezeichnet (an )n≥n0 oder (an0 , an0 +1 , . . .) ebenfalls eine Folge. Wir sprechen auch von einer Folge in X; ist speziell (X, d) = (R, d2 ) bzw. = (C, d2 ), so reden wir von einer reellen bzw. einer komplexen (Zahlen-)Folge. Beispiele 2.2. a) an = a für alle n ∈ N ergibt die konstante Folge (a, a, . . .) in (X, d). b) an = 1 1 1 1 ergibt 1, , , , . . . . n 2 3 4 c) an = (−1)n ergibt (−1, 1, −1, 1, . . .). d) an = in ergibt (i, −1, −i, 1, i, −1, −i, 1, . . .). e) a1 = 1, a2 = 1 und an = an−1 + an−2 für n ≥ 3 ergibt (1, 1, 2, 3, 5, 8, 13, 21, . . .), die sog. Folge der Fibonacci-Zahlen. 1 1 1 1 , (−1)n ergibt in (R2 , d2 ) die Folge (1, −1), , 1 , , −1 , , 1 , . . . . f) an = n 2 3 4 g) Sei b ∈ C beliebig und an = bn für n ∈ N0 , das ergibt die Folge (1, b, b2 , b3 , . . .) in C. Definition 2.3. Eine Folge (an )n≥1 in (X, d) konvergiert gegen a ∈ X (heißt konvergent gegen a ∈ X), wenn Folgendes gilt: 67 Zu jedem ε > 0 existiert ein N(ε) ∈ R derart, dass für alle n ∈ N mit n > N(ε) gilt: d(an , a) < ε. Wir schreiben a = lim an oder an → a für n → ∞; a heißt Grenzwert oder Limes der n→∞ Folge (an )n≥1 . Eine Folge konvergiert oder heißt konvergent, wenn ein a ∈ X existiert, gegen das sie konvergiert; sie heißt divergent, wenn sie nicht konvergiert. Anschaulich bedeutet die Konvergenz, dass in jeder Kugel Kε (a) := {x ∈ X | d(x, a) < ε}, ε > 0, das Endstück (an(ε) , an(ε)+1 , . . .) der Folge (an )n≥1 mit n(ε) ∈ N und n(ε) > N(ε) liegt. Satz 2.4. Ist (an )n≥1 konvergent, so besitzt (an )n∈N genau einen Grenzwert. Beweis: Wir nehmen an → a und an → b für n → ∞ mit a 6= b an; dann ist ε := 1 d(a, b) > 0 und jede der Kugeln Kε (a) bzw. Kε (b) müsste ein Endstück der Folge (an )n≥1 2 enthalten, was unmöglich ist. (Zu ε existieren ein N1 (ε) und ein N2 (ε) mit d(an , a) < ε für alle n > N1 (ε) bzw. d(an , b) < ε für alle n > N2 (ε); für alle n > max(N1 (ε), N2 (ε)) gilt dann mit der Dreiecksungleichung 1 d(a, b) ≤ d(a, an ) + d(an , b) < 2ε = 2 · d(a, b) = d(a, b). 2 Das ist ein Widerspruch.) 2 Definition 2.5. Sei (an )n≥1 eine Folge und n1 < n2 < n3 < . . . eine aufsteigende Folge natürlicher Zahlen; dann heißt (ank )k∈N = (an1 , an2 , . . .) eine Teilfolge der Folge (an )n≥1 . Direkt aus Definition 2.3 folgt der Satz 2.6. Jede Teilfolge einer konvergenten Folge (an )n≥1 konvergiert ebenfalls gegen lim an . n→∞ 68 Definition 2.7. Eine reelle oder komplexe Zahlenfolge (an )n≥1 heißt beschränkt, wenn ein M > 0 existiert mit |an | ≤ M für alle n ≥ 1. Satz 2.8. Jede konvergente Folge in R oder C ist beschränkt. Beweis: Sei (an )n≥1 eine komplexe Zahlenfolge mit lim an = a; dann existiert ein N = n→∞ N(1) ∈ R mit |an − a| < 1 für alle n > N. Daraus folgt für alle n ∈ N |an − a| ≤ max(|a1 − a|, . . . , |aN − a|, 1) =: M ′ , also |an | ≤ |an − a| + |a| ≤ M ′ + |a| =: M. 2 Wir untersuchen nun die Beispiele aus 2.2 auf Konvergenz: Beispiele 2.9. a) (a, a, . . .) konvergiert wegen d(a, a) = 0 gegen a. 1 = 0, da nach dem Archimedischen Prinzip zu jedem ε > 0 ein m = n→∞ n 1 < ε (vgl. Bemerkungen im Anschluß an Satz 1.12). Daraus N(ε) ∈ N existiert mit m 1 1 folgt für alle n > m wegen < n m b) Es ist lim 1 1 d( , 0) = < ε. n n c) Es ist (a2 , a4 , a6 , . . .) = (a2n )n≥1 eine Teilfolge von (an )n≥1 und (a1 , a3 , a5 , . . .) = (a2n−1 )n≥1 eine Teilfolge von (an )n≥1 . Nach Teil a) gilt wegen a2n = 1 und a2n−1 = −1 für alle n ∈ N: lim a2n = 1 n→∞ lim a2n−1 = −1. n→∞ Nach Satz 2.6 kann (an )n≥1 also nicht konvergieren. 69 d) Betrachte die Teilfolgen (a4n+2 )n≥0 = (−1, −1, . . .), (a4n+1 )n≥0 = (i, i, . . .), (a4n+3 )n≥0 = (−i, −i, . . .), (a4n )n≥1 = (1, 1, . . .), die gegen vier verschiedene Grenzwerte konvergieren; also konvergiert auch (in )n≥0 nicht. e) Es gilt an ≥ n für alle n ≥ 5. (Betrachte die Aussagen A(n) an−1 ≥ 1 und an ≥ n für n ≥ 5 und wende das Induktionsprinzip an. A(5) ist richtig wegen a5 = 5 und a4 = 3. Der Induktionsschritt liefert aus der Induktionsvoraussetzung an−1 ≥ 1 und an ≥ n sofort an ≥ 1 und an+1 = an + an−1 ≥ n + 1. ) Also ist die Folge unbeschränkt und damit nach Satz 2.8 divergent. f) Betrachte die Teilfolgen a2n 1 = ,1 2n und a2n−1 Es gilt 1 = , −1 . 2n − 1 lim a2n = (0, 1), n→∞ denn zu jedem ε > 0 existiert ein m ∈ N mit d2 (a2n , (0, 1)) = s 1 2n 2 + Entsprechend folgert man: 02 1 < ε; daraus folgt für alle n ≥ m: m 1 1 1 1 = ≤ < ε<ε. = 2n 2n 2m 2 lim a2n−1 = (0, −1). n→∞ Satz 2.6 liefert die Divergenz von (an )n≥1 in (R2 , d2 ). g) (i) Sei zunächst |b| < 1; dann gilt lim bn = 0. n→∞ (ii) Ist |b| = 1, so ist (bn )n≥1 divergent für b 6= 1 und konvergent für b = 1. (iii) Für |b| > 1 ist (bn )n≥1 divergent. Zu (i): Nach Folgerung 1.21 (b) existiert zu beliebigem ε > 0 ein m = N(ε) ∈ N mit |b|m < ε. Es folgt für alle n ≥ m: |bn − 0| = |b|n = |b|m |b|n−m < |b|m < ε. Zu (ii): Die Konvergenz für b = 1 ist klar; die Divergenz für die anderen b mit |b| = 1 läßt sich anhand der geometrischen Interpretation der Multiplikation komplexer Zahlen veranschaulichen. Wir werden später darauf noch einmal zurückkommen. Zu (iii): Nach Folgerung 1.21 (a) ist die Folge (|b|n )n≥1 = (|bn |)n≥1 unbeschränkt; wegen Satz 2.8 ist (bn )n≥1 somit divergent. 70 Bemerkung 2.10. Eine Folge (an )n≥1 in einem metrischen Raum (X, d) ist genau dann konvergent gegen a, wenn eine Konstante K > 0 und zu jedem ε > 0 ein N(ε) ∈ R existieren mit d(an , a) < K ·ε für alle n > N(ε). Beweis: >: Wähle K = 1. <: Zeige, dass zu jedem ε > 0 ein M(ε) ∈ R mit d(an , a) < ε für alle n > M(ε) existiert. Nach Voraussetzung gibt es zu ε1 := ε > 0 ein N(ε1 ) ∈ R mit K d(an , a) < K ε1 = ε für alle n > N(ε1 ) =: M(ε). 2 Satz 2.11. (n) (n) Es sei (an )n≥1 eine Folge in (Rm , d2 ) und an = (a1 , a2 , . . . , a(n) m ). Es gilt genau dann lim an = (a1 , . . . , am ) =: a ∈ Rm , n→∞ (n) wenn für die m reellen Zahlenfolgen (aj )n≥1 mit 1 ≤ j ≤ m gilt: (n) lim aj n→∞ = aj . Beweis: >: Aus an → a für n → ∞ folgt wegen (n) |aj − aj | = r (n) (aj sofort − aj )2 ≤ (n) lim aj n→∞ v um uX (n) t (a i i=1 − ai )2 = d2 (an , a) = aj für 1 ≤ j ≤ m. <: Umgekehrt existiert zu jedem ε > 0 und jedem j ∈ {1, . . . , m} ein Nj (ε) ∈ R mit (n) |aj − aj | < ε für alle n > Nj (ε). Für alle n > max(N1 (ε), . . . , Nm (ε)) gilt dann m X (n) (aj j=1 1 2 − aj ) 2 Bemerkung 2.10 liefert die Behauptung. < m X j=1 1 2 ε 2 = √ m·ε 2 71 Folgerung 2.12. Ist (an )n≥1 eine komplexe Zahlenfolge, so konvergiert (an )n≥1 genau dann, wenn die beiden reellen Zahlenfolgen (Re an )n≥1 und (Im an )n≥1 konvergieren. Im Falle der Konvergenz gilt: lim an = lim Re an + i lim Im an . n→∞ Beispiel: lim n→∞ n→∞ n 1 2 + n→∞ n i 1 = lim n→∞ 2 n 1 = 0. n→∞ n + i lim 2.2 Das Rechnen mit konvergenten Folgen Satz 2.13. Es seien (an )n≥1 und (bn )n≥1 zwei konvergente (komplexe) Zahlenfolgen mit a = lim an n→∞ und b = lim bn ; dann gilt: n→∞ a) Es ist auch die Folge (an + bn )n≥1 konvergent mit lim (an + bn ) = lim an + lim bn . n→∞ n→∞ n→∞ b) Ist λ ∈ C, so konvergiert auch (λan )n≥1 mit lim (λan ) = λ lim an . n→∞ n→∞ c) Die Produktfolge (an · bn )n≥1 konvergiert mit lim (an bn ) = lim an · lim bn . n→∞ n→∞ n→∞ d) Ist b 6= 0, so existiert ein n0 ∈ N mit bn 6= 0 für alle n > n0 . Dann ist konvergent mit lim an an = n→∞ . n→∞ b lim bn n n→∞ lim Beweis: Zu a): Zu ε > 0 existieren ein N1 (ε) ∈ R mit |an − a| < ε für alle n > N1 (ε), sowie ein N2 (ε) ∈ R mit |bn − b| < ε für alle n > N2 (ε). an bn n≥n0 72 Für alle n > max(N1 (ε), N2(ε)) gilt dann |(an + bn ) − (a + b)| ≤ |an − a| + |bn − b| < 2ε. Zu b): Folgt direkt aus Bemerkung 2.10 mit K = |λ|. Zu c): Nach Satz 2.8 ist (an )n≥1 beschränkt, also |an | ≤ M für alle n ∈ N mit einem geeigneten M > 0. Für ε > 0 seien N1 (ε) ∈ R und N2 (ε) ∈ R so, dass |an − a| < ε für alle n > N1 (ε) und |bn − b| < ε für alle n > N2 (ε) gilt. Dann erhalten wir für alle n > max(N1 (ε), N2(ε)): |an bn − ab| = |an (bn − b) + (an − a)b| ≤ |an | |bn − b| + |an − a| |b| < M ε + |b| ε = (M + |b|)ε. an 1 1 1 = an · genügt es zu zeigen, dass die Folge gegen konverbn bn bn n≥n0 b giert; Teil c) liefert dann die Behauptung. Wegen bn → b für n → ∞ und b 6= 0 existiert ein n0 ∈ N mit |b| |bn − b| < für alle n > n0 . 2 Zu d): Wegen Daraus ergibt sich mit Folgerung 1.32: |bn | ≥ |b| − |bn − b| > |b| 2 für alle n > n0 , also speziell bn 6= 0 für alle n > n0 . Ist nun ε > 0 beliebig und N(ε) ∈ R so gewählt, dass |bn − b| < ε für alle n > N(ε) gilt, so folgt für alle n > max(N(ε), n0 ): 1 1 1 b − bn 2 = − = |bn − b| < 2 ε bbn bn b |b| |bn | |b| 2 Beispiel 2.14. Sei an = 3n2 + 13n für n ≥ 1; dann gilt auch n2 − 2 an = n2 3 + n2 1 − 13 n 2 2 n = 3+ 1− 13 n 2 n2 . 73 2 1 1 Nach Satz 2.13 c) gilt wegen lim = 0 auch lim 2 = 0, Teil b) liefert lim − 2 = 0, n→∞ n n→∞ n n→∞ n 2 Teil a) schließlich lim 1 − 2 = 1 6= 0. Entsprechend folgt n→∞ n lim n→∞ 3+ Teil d) liefert dann lim an = n→∞ 13 = 3. n 3 = 3. 1 Satz 2.15. Konvergiert die komplexe Zahlenfolge (an )n≥1 gegen a, so gilt n→∞ lim |an | = |a|. Beweis: Nach Folgerung 1.31 gilt: ||an | − |a|| ≤ |an − a|. 2 Wir halten noch einige Aussagen fest, die nur für reelle Zahlenfolgen gelten: Satz 2.16. a) Es seien (an )n≥1 und (bn )n≥1 zwei konvergente (reelle) Zahlenfolgen mit a = lim an n→∞ sowie b = lim bn . n→∞ (i) Gilt an ≤ bn für alle n ≥ n0 , so folgt auch a ≤ b. (an < bn impliziert nicht a < b.) (Vergleichssatz) (ii) Ist (cn )n≥1 eine Folge mit an ≤ cn ≤ bn für alle n ≥ n0 und ist a = b, so konvergiert auch (cn )n≥1 mit n→∞ lim cn = a. (Einschnürungs- oder Sandwich-Satz) b) Ist (bn )n≥1 eine Nullfolge, d.h. n→∞ lim bn = 0, (an )n≥1 eine Folge und a ∈ R mit |an − a| ≤ bn für alle n ≥ n0 , so konvergiert auch (an )n≥1 mit lim an = a. n→∞ Beweis: Zu a): 1 (i) Wäre a > b, d.h. ε := (a − b) > 0, so existiert ein N1 (ε) mit 2 |an − a| < ε für alle n > N1 (ε), und es gibt ein N2 (ε) mit |bn − b| < ε für alle n > N2 (ε). Für alle n > max(N1 (ε), N2(ε)) gilt dann (vgl. Satz 1.33 b) bn < b + ε = a+b = a − ε < an . Widerspruch. 2 74 (ii) Aus a − ε < an < a + ε für alle n > N1 (ε) und a − ε < bn < a + ε für alle n > N2 (ε) folgt für alle n > max(N1 (ε), N2 (ε)): a − ε < an ≤ cn ≤ bn < a + ε d.h. |cn − a| < ε. Zu b): Folgt sofort aus dem Einschnürungssatz wegen −bn ≤ an − a ≤ bn . 2 Beispiele. a) Nach dem Einschnürungssatz gilt zum Beispiel 1 lim = 0. n→∞ 2n2 + 3 b) Es gilt für jedes feste a > 0: lim n→∞ 1 =0 n+1 oder √ n a=1 √ √ Beweis: 1. Fall Es sei a > 1; dann gilt auch n a > 1. Also ist n a = 1 + hn mit hn > 0. Daraus folgt mit der Bernoullischen Ungleichung lim n→∞ a = (1 + hn )n ≥ 1 + nhn oder a−1 . n Der Einschnürungssatz liefert die Behauptung. 1 2. Fall Ist a < 1, so ist > 1; also existiert nach Fall 1 ein N(ε) ∈ R mit a 0 ≤ hn ≤ Wegen √ n s n a < 1 folgt somit 1 − 1 < ε für alle n > N(ε). a n 1 − √ √ a n 1 n | a − 1| = a √ < − 1 < ε für alle n > N(ε), n a a √ n s also die Behauptung. 3. Fall Ist a = 1, so ist die Behauptung trivialerweise erfüllt. 2 75 Bemerkung 2.17. Ist (an )n≥1 eine (komplexe) Nullfolge und (bn )n≥1 eine beschränkte (komplexe) Zahlenfolge, so konvergiert auch (an bn )n≥1 gegen Null. 2.3 Prinzipien der Konvergenztheorie Definition 2.18. Eine reelle Folge (an )n≥1 heißt (monoton) wachsend, wenn an+1 ≥ an für alle n ∈ N gilt. Sie heißt (monoton) fallend, wenn an+1 ≤ an für alle n ∈ N gilt. (an )n≥1 heißt streng (monoton) wachsend bzw. fallend, wenn stets an+1 > an bzw. an+1 < an gilt. (an )n≥1 heißt (streng) monoton, wenn sie (streng) monton wächst oder fällt. Satz 2.19. (Monotonieprinzip) Eine monotone Folge konvergiert genau dann, wenn sie beschränkt ist. In diesem Falle konvergiert sie gegen ihr Supremum, wenn sie wächst, und gegen ihr Infimum, wenn sie fällt. sup an =: a a−ǫ an0 } ǫ a3 a2 a1 Abbildung 10: Monotonieprinzip Beweis: Sei (an )n≥1 monoton wachsend und beschränkt; nach Satz 1.11 existiert das Supremum a = sup{an | n ∈ N}. Zu jedem ε > 0 existiert ein n0 ∈ N mit an0 > a − ε (sonst wäre a − ε eine kleinere obere Schranke); für alle n > n0 gilt dann ebenfalls: an ≥ an0 > a − ε. Da außerdem für alle n ∈ N gilt: an ≤ a, haben wir für alle n ≥ n0 : a − ε < an ≤ a. 76 Umgekehrt ist jede konvergente Folge beschränkt (vgl. Satz 2.8). 2 Beispiel 2.20. (Eulersche Zahl) 1 n ist streng monoton wachsend, die Folge Die Folge 1+ n n≥1 streng monoton fallend. 1 1+ n n+1 ! n≥1 (Beweis der Monotonie: Nach der Bernoullischen Ungleichung gilt nämlich 1 1− n n n 1 1+ n 1 = 1− 2 n n 1 , n ≥1− also 1+ 1 n−1 n−1 = n n−1 n−1 = n−1 n 1−n 1 n = 1− 1−n ≤ 1+ 1 n n , und 1 1− n n 1 1+ n n also 1 = 1− 2 n 1 1+ n n+1 Ferner gilt 1 1+ n also n n n2 − 1 n2 = !n n2 n2 + 1 ≤ 1 1 n = 1 + ≤ 1 n−1 1− n 1 < 1+ n 1 2≤ 1+ n n n+1 Folge d.h. 1+ 1 n n 1 1 n ≤ , = 1 1 + n1 1 + n2 .) für alle n ∈ N, 1 < 1+ n n+1 Nach dem Monotonieprinzip konvergiert also die Folge n+1 ! !n ≤ 4. 1 1+ n n und ebenso die n≥1 . Wir nennen den Grenzwert der ersten Folge e (Eulersche Zahl), n≥1 e = lim n→∞ 1+ 1 n n . 1 Wir zeigen, dass die zweite Folge ebenfalls gegen e konvergiert: Wegen 1 + n 1 n ≤ e für alle n ∈ N folgt und 1 + n 0 ≤ 1 1+ n n+1 −e ≤ = 1 1+ n 1+ 1 n n+1 n 1 − 1+ n 1+ n 1 1 1 1+ −1 = n n n n . n+1 ≥e 77 1 = 0 gilt, folgt nach Satz 2.13 c) und dem Einschnürungssatz: n→∞ n Da lim lim 1+ n→∞ Beispiel 2.21. (Heron-Verfahren) Gegeben sei a ∈ R, a > 0; gesucht ist √ 1 n n+1 = e. a. Definieren wir die Folge (an )n≥1 induktiv durch a1 := a an+1 a 1 an + := 2 an für n ≥ 1, so entsteht eine monoton fallende Folge (an )n≥2 mit lauter positiven Gliedern, und es gilt: √ lim an = a. n→∞ Beweis: (α) Mit dem Induktionsprinzip kann man an > 0 für alle n ∈ N zeigen. √ (β) Für alle n ≥ 2 gilt: an ≥ a. Es ist nämlich an+1 − √ √ 1 1 a a 1 √ a = an + − ·2 a= an − 2 a + 2 an 2 2 an = √ 2 √ 1 2 1 an − 2an a + a = an − a ≥ 0. 2an 2an (γ) (an )n≥2 ist monoton fallend wegen an − an+1 = an − a 1 an + 2 an a 1 √ a− √ ≥ 2 a ! = 1 a an − 2 an = 0. (δ) √ Das Monotonieprinzip liefert die Konvergenz der Folge (an )n≥1 gegen g; wegen an ≥ a ist g 6= 0. Die Grenzwertsätze ergeben dann! auch die Konvergenz der Folge a a 1 1 an + g+ . Wegen mit dem Grenzwert 2 an n≥1 2 g lim an+1 = n→∞ lim an n→∞ folgt hieraus 1 a g= g+ 2 g ! oder g 2 = a, d.h. g = √ a. 2 78 Beispiel 2.20 läßt sich verallgemeinern zu einer Aussage, die häufig an Stelle des Supremumprinzips (Satz 1.11) zur Charakterisierung reeller Zahlen tritt. Definition 2.22. Eine Folge abgeschlossener Intervalle In := [an , bn ], n ∈ N, definiert eine Intervallschachtelung, wenn Folgendes gilt: (i) In ⊃ In+1 für alle n ∈ N, d.h. (an )n≥1 ist monoton wachsend und (bn )n≥1 monoton fallend. (ii) lim (an − bn ) = 0. n→∞ Satz 2.23. (Prinzip der Intervallschachtelung) Jede Intervallschachtelung (In )n≥1 definiert genau eine Zahl a, die in allen Intervallen In liegt, d.h. {a} = ∞ \ In . n=1 Beweis: Nach dem Monotonieprinzip existieren a = n→∞ lim an und b = n→∞ lim bn ; Satz 2.13 liefert lim (an − bn ) = a − b und (ii) ergibt a = b. n→∞ 2 Definition 2.24. a heißt Häufungspunkt einer Zahlenfolge (an )n≥1 , wenn eine Teilfolge von (an )n≥1 existiert, die gegen a konvergiert. (a wird auch Häufungswert der Folge (an )n≥1 genannt.) Beispiele 2.25 a) Die Folge (an )n≥1 mit an = (−1)n besitzt die Häufungswerte 1 und −1. b) Die Folge (an )n≥1 = (1, 1, 2, 1, 2, 3, 1, 2, 3, 4, 1, 2, 3, 4, 5, . . .) besitzt jede natürliche Zahl als Häufungswert. Manchmal kann man die Konvergenz einer Folge beweisen, ohne den Grenzwert der Folge zu kennen – so wie bei einigen Anwendungen des Monotonieprinzips (vgl. z.B. das Heronverfahren). Um das entsprechende Konvergenzprinzip zu formulieren, benötigen wir Definition 2.26. Eine Folge (an )n≥1 in einem metrischen Raum (X, d) heißt Cauchy-Folge, wenn zu jedem ε > 0 ein N(ε) ∈ R existiert, so dass für alle m, n ∈ N mit m > N(ε) und n > N(ε) gilt: d(an , am ) < ε . Man kann zeigen, dass folgendes Kriterium gilt: 79 Satz 2.27. (Cauchysches Konvergenzprinzip) a) Jede konvergente Folge (in einem metrischen Raum) ist eine Cauchy-Folge. b) Jede Cauchy-Folge (an )n≥1 in R (oder C) konvergiert. (Eine reelle oder komplexe Zahlenfolge konvergiert also genau dann, wenn sie eine CauchyFolge ist.) Beispiele 2.28. a) Wir betrachten Beispiel 2.9 g): (bn )n≥0 für b ∈ C mit |b| = 1 und b 6= 1. Dann gilt |b − 1| =: ε0 > 0, also für alle n ∈ N |bn+1 − bn | = |bn | |b − 1| = |b|n |b − 1| = ε0 . Also ist (bn )n≥0 keine Cauchy-Folge und damit nach Satz 2.27 nicht konvergent. b) Mit b ∈ C können wir für jedes n ∈ N0 die Summe sn := n X bk k=0 betrachten; dadurch erhalten wir eine Folge (sn )n≥0 . Gemäß Satz 1.22 – der auch in C richtig ist – gilt für b ∈ C \ {1}: sn = Beispiel 2.9 g) liefert damit für |b| < 1: lim sn = n→∞ 1 − bn+1 . 1−b 1 − lim bn+1 n→∞ 1−b = 1 . 1−b 2.4 Reihen Beispiel 2.28 b) wollen wir zum Anlaß nehmen, Folgen zu betrachten, bei denen sich das (n+1)-te Folgenglied sn+1 aus dem n-ten sn durch Addition von an+1 ∈ R (oder C) ergibt. Definition 2.29. Sei (an )n≥0 eine Zahlenfolge in C oder R. Die Folge (sn )n≥0 der Partialsummen n X sn := heißt (unendliche) Reihe und wird mit ak , k=0 ∞ X n ≥ 0, ak bezeichnet. Die Zahlen ak heißen Glieder k=0 der Reihe. Konvergiert (sn )n≥0 gegen s, so nennt man s den Wert der Reihe. Man sagt dann, die Reihe konvergiert (gegen s) und schreibt ∞ X k=0 anderenfalls heißt die Reihe divergent. ak = s; 80 Bemerkung 2.30. Jede Folge (an )n≥0 läßt sich als Reihe schreiben; wir setzen b0 = a0 und bn = an − an−1 für n ≥ 1; dann gilt n X an = bk . k=0 Weil andererseits jede Reihe eine Folge (von Partialsummen) ist, ist klar, dass jeder Satz über Folgen auch als Satz über Reihen formuliert werden kann und umgekehrt. Satz 2.31. Es seien ∞ X ak und k=0 ∞ X die Reihen ∞ X k=0 bk zwei konvergente Reihen und λ ∈ C. Dann konvergieren auch (ak + bk ), k=0 ∞ X (ak − bk ) und k=0 ∞ X ∞ X (ak ± bk ) = k=0 ∞ X λak , und es gilt: k=0 ∞ X k=0 ∞ X ak . ak , tn := n X λak = λ k=0 Beweis: Sei sn := ak ± n X n X (ak + bk ) = k=0 bk , k=0 k=0 k=0 dann ist ∞ X n X bk ; k=0 ak + k=0 n X bk = sn + tn . k=0 Nach Satz 2.13 gilt ∞ X (ak + bk ) = lim (sn + tn ) = lim sn + lim tn = n→∞ k=0 n→∞ n→∞ Analog werden die anderen Aussagen bewiesen. ∞ X k=0 ak + ∞ X bk . k=0 2 Aus Satz 2.27 erhalten wir sofort: Satz 2.32. (Cauchykriterium) Die Reihe ∞ X k=0 ak mit ak ∈ C konvergiert genau dann, wenn für jedes ε > 0 ein N(ε) ∈ R existiert mit |sm − sn | = für alle m > n > N(ε). X m ak k=n+1 <ε 81 Folgerung 2.33 (Notwendiges Konvergenzkriterium für Reihen). Konvergiert die Reihe ∞ X ak , so gilt lim ak = 0 und lim n→∞ k→∞ k=0 ∞ X ak = 0. k=n+1 Beweis: Setze in Satz 2.32 m = n + 1 bzw. betrachte die Folge m X k=n+1 ak . 2 m>n Satz 2.34. Eine Reihe ∞ X k=0 ak mit ak ≥ 0 für alle k ∈ N0 konvergiert genau dann, wenn die Folge der Partialsummen beschränkt ist. Beweis: Wegen ak ≥ 0 ist die Folge (sn )n≥0 der Partialsummen monoton wachsend. Das Monotonieprinzip liefert dann die Behauptung. 2 Satz 2.35 (Leibniz-Kriterium für alternierende Reihen). Es sei (an )n≥0 eine monoton fallende Folge nicht-negativer Zahlen mit lim an = 0. Dann n→∞ konvergiert die Reihe ∞ X (−1)k ak . k=0 Beweis: Wir betrachten die Partialsummen sn = n X (−1)k ak für gerades und ungerades k=0 n. Es gilt s2m+2 − s2m = a2m+2 − a2m+1 ≤ 0 und s2m+1 − s2m−1 = −a2m+1 + a2m ≥ 0 . Also ist (s2m )m≥0 monoton fallend und (s2m+1 )m≥0 monoton wachsend. Wegen s2m − s2m+1 = a2m+1 ≥ 0, also s0 ≥ s2m ≥ s2m+1 ≥ s1 ist (s2m )m≥0 nach unten beschränkt und (s2m+1 )m≥0 nach oben beschränkt. Damit konvergieren die Teilfolgen, d.h. es ist lim s2m = s m→∞ und lim s2m+1 = t . m→∞ Die Grenzwertsätze liefern s − t = lim (s2m − s2m+1 ) = lim a2m+1 = 0 , m→∞ d.h. s = t. m→∞ 2 82 Definition 2.36. Eine Reihe ∞ X ak heißt absolut konvergent, wenn die Reihe k=0 ∞ X k=1 |ak | konvergiert. Bemerkung 2.37. Wegen X m ak k=n+1 ≤ m X k=n+1 |ak | folgt aus der absoluten Konvergenz einer Reihe sofort ihre Konvergenz. Für die Grenzwerte erhalten wir aus dem Vergleichssatz sofort die Abschätzung ∞ ∞ X ak k=0 ≤ X k=0 |ak |. Umgekehrt folgt aus der Konvergenz einer Reihe nicht die absolute Konvergenz, wie das ∞ ∞ X X 1 1 führt. Beispiel (−1)k+1 zeigt, das auf die sog. divergente harmonische Reihe k k=1 k k=1 Es ist nämlich n 2 X 1 1 1 1 1 1 1 1 1 1 = 1 + + + + + + + + . . . + n−1 + ...+ n k 2 |3 {z 4} |5 6 {z 7 8} 2 + 1 {z 2} k=1 | ≥ 2· 41 ≥ 4· 18 ≥ 2n−1 · 21n 1 ≥1+n· , 2 also ist die zugehörige Partialsummenfolge unbeschränkt. Nach Satz 2.34 kann die harmonische Reihe damit nicht konvergieren. Durch die direkte Anwendung von Satz 2.34 erhalten wir einige Konvergenz- bzw. Divergenzkriterien: Satz 2.38 (Majorantenkriterium). Ist ∞ X k=0 ak eine unendliche Reihe mit ak ∈ C, ∞ X k=0 bk eine konvergente Reihe mit bk ≥ 0 für alle k ∈ N0 und gilt für alle k ≥ n0 : |ak | ≤ bk , so konvergiert ∞ X ak absolut. k=0 Satz 2.39 (Minorantenkriterium). Ist ∞ X k=0 ak eine unendliche Reihe mit ak ∈ R, ak ≥ 0 für alle k ∈ N0 und gilt für alle k ≥ n0 : 0 ≤ bk ≤ ak und ist ∞ X k=0 bk divergent, so ist auch ∞ X k=0 ak divergent. 83 Beispiele 2.40. • Untersuche und ∞ X (−1)k k=1 2 −k k 3 − 2k auf Konvergenz bzw. Divergenz. Für k ≥ 2 gilt k 5 + 3k 2 + 1 k 3 − 2k k 2 −k (−1) k 5 + 3k 2 + 1 ∞ X 1 2 k=1 k = k 3 − 2k k3 1 < = 2, 5 2 5 k + 3k + 1 k k ist konvergent mit π2 1 = . 2 6 k=1 k ∞ X Die Konvergenz der letzteren Reihe ergibt sich aus folgender Überlegung: Für n ≥ 2 gilt n n n X X X 1 1 1 1 1 = 1 + ≤ 1 + = 1 + − 2 2 k k=2 k k=2 k(k − 1) k=2 k − 1 k=1 k n X 1 = 1+ 1− ≤2. n Also ist die Partialsummenfolge beschränkt und damit die Reihe konvergent. Den Reihenwert können wir mit den bisher gelieferten Hilfsmitteln nicht berechnen. Das Majorantenkriterium liefert nun die absolute Konvergenz der ursprünglich be∞ X k 3 − 2k 2 trachteten Reihe (−1)k −k 5 . k + 3k 2 + 1 k=1 ∞ X 1 √ k k=1 ∞ X 1 nische Reihe k=1 k • Die Reihe ist divergent, da für alle k ≥ 1 gilt √ k ≤ k und die harmo- divergent ist. Satz 2.41 (Quotientenkriterium). Gegeben sei Zahl q < 1 ∞ X k=0 ak mit ak ∈ C, ak 6= 0 für alle k ≥ k0 . Gilt dann mit einer festen positiven ak+1 ak so ist ∞ X ≤ q für alle k ≥ k0 , ak absolut konvergent. k=0 Ist dagegen ak+1 ak so ist ∞ X k=0 ak divergent. ≥ 1 für alle k ≥ k0 , 84 Beweis: Mittels Induktion erhalten wir für k0 = 0 (dies können wir o.B.d.A. voraussetzen, da ein Abändern endlich vieler Summanden das Konvergenzverhalten nicht ändert): |ak | ≤ |a0 |q k für alle k ∈ N0 . Daraus folgt die Behauptung über die Konvergenz mit dem Majorantenkriterium wegen ∞ X k=0 Aus ist. ak+1 ak k |a0 |q = |a0 | ∞ X qk = k=0 |a0 | . 1−q ≥ 1 folgt, dass |ak+1 | ≥ |ak | > 0 für alle k > k0 gilt, also (ak )k≥0 keine Nullfolge 2 Beispiele 2.42. zk = ez (siehe Beispiel 2.47 unten), denn k! k=0 nach dem Quotientenkriterium gilt für alle k ≥ 2|z|: • Für jedes z ∈ C konvergiert die Reihe • Die Reihe k2 k k=0 2 ∞ X k+1 z (k+1)! zk k! kk k k=0 k!2 ∞ X |z| |z| 1 < = . k+1 2|z| 2 ist absolut konvergent, da für alle k ≥ 4 gilt: (k + 1)2 2k 1 = k+1 2 2 k 2 • Die Reihe = ∞ X k+1 k !2 ≤ 2 1 5 2 4 = 25 = q < 1. 32 divergiert, denn es gilt für alle k ∈ N: (k + 1)k+1 k! 2k (k + 1)k! · k = k+1 (k + 1)! 2 k (k + 1)! k+1 k !k 1 1 1 1+ = 2 2 k k ≥ 1 ·2 2 nach Beispiel 2.20. Satz 2.43 (Wurzelkriterium). Gegeben sei ∞ X k=0 ak mit ak ∈ C. Gilt dann mit einer festen positiven Zahl q < 1 q k |ak | ≤ q für alle k ≥ k0 , 85 so ist ∞ X ak absolut konvergent. k=0 Ist jedoch M ⊂ N0 eine unendliche Menge und gilt für alle k ∈ M q k so ist ∞ X |ak | ≥ 1, ak divergent. k=0 q Beweis: Aus k |ak | ≤ q ergibt sich |ak | ≤ q k für k ≥ k0 und damit die geometrische Reihe als konvergente Majorante. Aus der zweiten Bedingung folgt, dass (ak )k∈N0 keine Nullfolge ist. 2 Bemerkung 2.44. Wir müssen noch zeigen, dass die Entwicklung in p-al-Brüche eindeutig ist (vgl. Satz 1.55). Dazu überlegen wir uns zunächst, dass für eine unendliche Reihe der Form ∞ X an p−n n=1 mit 0 ≤ an ≤ p − 1 für n ≥ 1 und an0 ≤ p − 2 für mindestens ein n0 ≥ 1 gilt: ∞ X an p−n < 1 . n=1 Die Summenformel für die geometrische Reihe liefert nämlich ∞ X an p −n < ∞ X (p − 1)p−n = (p − 1) n=1 n=1 Seien nun r = c0 + ∞ X cn p−n = d0 + ∞ X 1 =1. p−1 dn p−n n=1 n=1 zwei verschiedene p-al-Entwicklungen der nichtnegativen reellen Zahl r gemäß Satz 1.55. Ist m ≥ 0 die kleinste natürliche Zahl mit cm 6= dm , so erhalten wir p−m (cm + ∞ X cn+m p−n ) = p−m (dm + 0≤ ∞ X n=1 cn+m p−n < 1 und 0 ≤ woraus wegen cm , dm ∈ N0 und |cm − dm | = | dn+m p−n ) n=1 n=1 mit ∞ X ∞ X n=1 cn+m p−n − ∞ X dn+m p−n < 1 , n=1 ∞ X n=1 dn+m p−n | < 1 im Widerspruch zur Voraussetzung cm 6= dm folgt. Damit ist Satz 1.55 jetzt vollständig bewiesen. 86 2.5 Multiplikation von Reihen Multipliziert man zwei endliche Summen (a1 + . . . + an ) und (b1 + . . . + bn ) miteinander, so bildet man alle Produkte ai bj und summiert sie in einer beliebigen Reihenfolge auf; will man dieses Verfahren auf Reihen übertragen, so steht man vor dem Problem, dass sich in Abhängigkeit von der Anordnung der Produkte ai bj der Reihenwert ändern kann. Eine spezielle Anordnung dieser Produkte erhält man, wenn man sich an der Multiplikation zweier Polynome P1 : R ∋ x 7→ n X ak xk ∈ R n X bk xk ∈ R k=0 bzw. P2 : R ∋ x 7→ k=0 orientiert. Multipliziert man P1 (x) mit P2 (x) und sortiert anschließend nach den Potenzen von x, so gilt: P1 (x)P2 (x) = 2n X ck xk k=0 mit ck = a0 bk + a1 bk−1 + . . . + ak b0 für 0 ≤ k ≤ 2n, wobei wir noch ak = 0, bk = 0 für n < k ≤ 2n gesetzt haben. Definition 2.45. Sind zwei absolut konvergente Reihen man die Reihe ∞ X ∞ X ak bzw. k=0 ∞ X k=0 bk mit ak , bk ∈ C gegeben, so nennt ck mit k=0 ck = k X ai bk−i i=0 das Cauchy-Produkt der Reihen ∞ X ak und k=0 ∞ X bk . k=0 Man kann zeigen, dass folgende Aussage richtig ist: Satz 2.46. Das Cauchy-Produkt zweier absolut konvergenter Reihen konvergent, und es gilt: ∞ X k=0 ∞ X k=0 ck = ∞ X k=0 ! ak · ∞ X k=0 ! bk . ak und ∞ X k=0 bk ist absolut 87 Abbildung 11: Die reelle Exponentialfunktion Beispiel 2.47 (Die Exponentialfunktion). zk für jedes z ∈ C absolut; den Grenzwert k=0 k! bezeichnen wir mit exp(z) oder ez . Dadurch definieren wir eine Abbildung Nach Beispiel 2.42 konvergiert die Reihe ∞ X exp : C ∋ z 7→ exp(z) = zk ∈ C. k=0 k! ∞ X Wir berechnen das Cauchy-Produkt der Reihen ∞ ∞ X X wk zk und = exp(w). exp(z) = k! k! k=0 k=0 Es gilt nach dem Binomischen Lehrsatz: ! k X k z i w k−i 1 1 X k i k−i ck := zw = (z + w)k , = k! i=0 i k! i=0 i! (k − i)! also ∞ X k=0 ck = ∞ X 1 (z + w)k = exp(z + w). k! k=0 Damit haben wir gemäß Satz 2.46 die Funktionalgleichung der Exponentialfunktion exp bewiesen: exp(z + w) = exp(z) · exp(w) für alle z, w ∈ C. Weiter erhalten wir 88 Folgerung 2.48. a) exp(z) 6= 0 und exp(−z) = (exp(z))−1 für alle z ∈ C. b) exp(z) = exp(z) für alle z ∈ C. c) exp(x) > 0 für alle x ∈ R. d) exp(n) = en für alle n ∈ Z. Beweis: Zu a): Aus der Funktionalgleichung folgt exp(z)exp(−z) = exp(0) = 1. Zu b): Sei sn (z) := dann gilt gemäß §1.7: n X zk ; k=0 k! n X zk zk = = sn (z). sn (z) = k=0 k! k=0 k! n X Grenzübergang n → ∞ liefert die Behauptung. Zu c): Für x ≥ 0 ist exp(x) ≥ 1 + x ≥ 1 > 0; für x < 0 ist −x > 0, also exp(−x) > 0, und nach Teil a) ist dann 1 exp(x) = > 0. exp(−x) Zu d): Für n ∈ N0 beweisen wir die Behauptung durch Induktion: n = 0 ist klar. Um zu zeigen, dass exp(1) = e gilt, betrachten wir 1 an = 1 + n und setzen sn := n n X 1 . k=0 k! Nach Beispiel 2.20 gilt an → e (n → ∞). Weiter konvergiert die Reihe setzen e′ := lim sn und zeigen e′ = e: Nach dem Binomischen Lehrsatz gilt n→∞ an = n X k=0 =1+1+ ! n X n 1 n(n − 1) · . . . · (n − k + 1) = k k n k!nk k=0 n X k=2 k−1 1 · ...· 1 − 1− n n ! 1 ≤ sn ; k! ∞ X 1 k=0 k! ; wir 89 also ist e ≤ e′ gemäß des Vergleichssatzes. Andererseits gilt für m ≥ n ≥ 1 am = 1 + 1 + m X k=2 ≥1+1+ n X k=2 k−1 1 ·...· 1 − 1− m m 1 k−1 1− · ...· 1 − m m ! ! 1 k! 1 k! Für festes n erhalten wir daraus e = lim am ≥ sn , m→∞ also e ≥ e′ . und damit zusammen e = e′ . Nun führen wir den Induktionsschritt von n auf n + 1 durch: exp(n + 1) = exp(n) · exp(1) = en · e = en+1 . Ist n ∈ Z \ N0 , so ist −n ∈ N, also exp(−n) = e−n und damit exp(n) = 1 = en . exp(−n) 2 90 §3 Stetige Funktionen Bevor wir uns mit der Definition der Stetigkeit und den Eigenschaften stetiger Funktionen näher beschäftigen, wollen wir im Folgenden ein paar wichtige Beispiele betrachten. 3.1 Reell- bzw. komplexwertige Funktionen Definition 3.1. Eine Abbildung von einer nichtleeren Menge X in den Bildbereich R bzw. C heißt reellbzw. komplexwertige Funktion. Beispiele 3.2. Falls X nicht näher spezifiziert ist, handelt es sich um eine beliebige nichtleere Menge. a) Ist c ∈ R bzw. c ∈ C fest, dann heißt f : X ∋ x 7→ c ∈ K mit K ∈ {R, C} eine konstante Funktion. b) Ist X = R bzw. X = C und sind a0 , . . . , an ∈ R bzw. a0 , . . . , an ∈ C, so heißt f : X ∋ x 7→ n X ν=0 aν xν ∈ X ein Polynom vom Grad ≤ n mit den Koeffizienten a0 , . . . , an , n ∈ N0 . Ist an = 6 0, so heißt n der Grad von f . Der Funktion X ∋ x 7→ 0 ∈ X wird der Grad −∞ zugeordnet. c) Ist X = R bzw. X = C, so heißt f : X ∋ x 7→ |x| ∈ R die Betragsfunktion. d) Sind p1 : X ∋ x 7→ und p2 : X ∋ x 7→ n X aν xν ∈ X m X bµ xµ ∈ X ν=0 µ=0 mit X = R oder X = C zwei Polynome vom Grad ≤ n bzw. ≤ m und ist D := {x ∈ X | p2 (x) 6= 0}, so wird die rationale Funktion r = p1 durch p2 r : D ∋ x 7→ r(x) = definiert. p1 (x) ∈X p2 (x) 91 e) Es sei [a, b] ein Intervall, d.h. a < b, a, b ∈ R; eine Funktion f : [a, b] → K (mit K = R oder K = C) heißt Treppenfunktion, wenn es eine Unterteilung a = t0 < t1 < . . . < tn−1 < tn = b von [a, b] und Konstanten c1 , . . . , cn ∈ K derart gibt, dass f (x) = ck für x ∈ ]tk−1 , tk [ und 1 ≤ k ≤ n gilt. In den Unterteilungspunkten tk kann der Funktionswert beliebig sein. f) Ist ∅ = 6 Y ⊂ X, so heißt χY : X ∋ x 7→ 1 , falls x ∈ Y 0 , sonst ∈R die charakteristische Funktion der Menge Y . Speziell für X = R und Y = Q erhalten wir die Dirichletsche Funktion (auch Dirichletsche Sprungfunktion genannt). Da der Bildbereich einer reell- bzw. komplexwertigen Funktion ein Körper ist, können wir solche Funktionen additiv und multiplikativ verknüpfen. Definition 3.3. Ist X 6= ∅ eine beliebige Menge, so wird die Menge aller reell- bzw. komplexwertigen Funktionen auf X mit Abb (X, R) bzw. Abb (X, C) bezeichnet. Mit K = R oder K = C können wir für f, g ∈ Abb (X, K) die Summe f + g, das skalare Vielfache αf für α ∈ K und das Produkt f g auf X definieren durch: f + g : X ∋ x 7→ f (x) + g(x) ∈ K αf : X ∋ x 7→ αf (x) ∈ K fg : X ∋ x 7→ f (x)g(x) ∈ K. f definiert man üblicherweise nur auf einer Teilmenge von X, nämlich g auf D = {x ∈ X | g(x) 6= 0} durch Den Quotienten f f (x) : D ∋ x 7→ ∈ K. g g(x) Definition 3.4. Eine reell- bzw. komplexwertige Funktion f ∈ Abb(X, K) heißt beschränkt, wenn eine Konstante K > 0 existiert mit |f (x)| ≤ K für alle x ∈ X, d.h. wenn F (X) ⊂ K eine beschränkte Menge ist. Die Menge aller beschränkten Funktionen aus Abb(X, K) bezeichnen wir mit B(X, K), K = R oder K = C. 92 Definition 3.5. Ist speziell K = R und f : X → R beschränkt, so existiert nach Satz 1.11 das Infimuum und das Supremum von f (X), etwa a = inf f (X) und b = sup f (X). Existiert ein x0 ∈ X mit f (x0 ) = a, so sagen wir, dass a das Minimum von f auf X ist und x0 eine Minimalstelle. Gibt es ein x1 ∈ X mit f (x1 ) = b, so heißt b das Maximum von f auf X und x1 eine Maximalstelle. Wir schreiben auch min f , min f (x) oder min{f (x) | x ∈ X} x∈X bzw. max f , max f (x) oder max{f (x) | x ∈ X}. x∈X Ist speziell X ⊂ R und K = R, so können wir monotone Funktionen auszeichnen: Definition 3.6. Eine Funktion f : R ⊃ X ∋ x 7→ f (x) ∈ R heißt (monoton) wachsend, wenn für alle x1 , x2 ∈ X mit x1 < x2 folgt: f (x1 ) ≤ f (x2 ). Sie heißt (monoton) fallend, wenn für alle x1 , x2 ∈ X mit x1 < x2 folgt: f (x1 ) ≥ f (x2 ). Sie heißt streng (monoton) wachsend bzw. fallend, wenn aus x1 < x2 , x1 , x2 ∈ X, stets f (x1 ) < f (x2 ) bzw. f (x1 ) > f (x2 ) folgt. f heißt (streng) monoton, wenn f (streng) monoton wächst oder fällt. Bemerkung 3.7. Ist f : X → R streng monoton, so ist f injektiv und besitzt damit eine Umkehrabbildung f −1 : f (X) → R. 3.2 Grenzwerte von Funktionen Definition 3.8. Es sei (X, d) ein metrischer Raum und M ⊂ X. (i) p ∈ X heißt Häufungspunkt der Menge M, wenn zu jedem r > 0 ein xr ∈ M \ {p} existiert mit d(xr , p) < r. p ist also genau dann Häufungspunkt von M, wenn eine Folge (pn )n≥1 in M existiert, die gegen p konvergiert, deren Glieder aber alle von p verschieden sind. (ii) p ∈ X heißt Randpunkt der Menge M, wenn in jeder ε-Umgebung Uε (p) := {x ∈ X | d(x, p) < ε} von p (mit ε > 0) sowohl ein Punkt von M als auch ein Punkt von X \ M liegt. Die Menge aller Randpunkte vom M wird mit ∂M bezeichnet. ◦ M := M \ ∂M heißt Menge der inneren Punkte oder Inneres von M und M := M ∪ ∂M heißt abgeschlossene Hülle oder Abschluß von M. 93 Abbildung 12: Umgebungen Uε (y) und Uδ (a) (iii) M ⊂ X heißt offene Menge, wenn für jedes p ∈ M ein ε > 0 existiert mit Uε (p) ⊂ M. M ⊂ X heißt abgeschlossene Menge , wenn X \ M offen ist. Beispiel 3.9. Betrachte das Intervall ]0, 1] im metrischen Raum (R, | · |). 0 und 1 sind Häufungspunkte von ]0, 1]. Der Punkt 2 ist aber kein Häufungspunkt von M :=]0, 1] ∪ {2}, es gilt ◦ M =]0, 1[, M = [0, 1] ∪ {2} und ∂M = {0, 1, 2}. ]0, 1] und auch M sind weder offen noch abgeschlossen. Offenbar ist jedes offene (bzw: abgeschlossene) Intervall aus R eine offene (bzw: abgeschlossene) Menge. Ferner kann man zeigen, dass jede offene Menge aus R abzählbare Vereinigung von offenen Intervallen aus R ist. Definition 3.10. Gegeben seien zwei metrische Räume (X, dX ) und (Y, dY ), eine nichtleere Menge M ⊂ X und eine Abbildung f : M → Y . Sei p ein Häufungspunkt von M; f hat einen Grenzwert q an der Stelle p, wenn für jede Folge (pn )n≥1 in M \ {p} mit lim pn = p gilt: n→∞ lim f (pn ) = q . n→∞ Wir schreiben dann: lim f (x) = q. x→p Beispiele 3.11. Sei X = Y = R und dX (x, y) = |x − y|. a) Ist M = ]0, 1] und f : M ∋ x 7→ c ∈ R, so hat f an der Stelle 0 einen Grenzwert, obwohl 0 6∈ M. Es gilt: lim f (x) = c. x→0 b) Ist M = [0, 1] und g : M ∋ x 7→ ( 0 für x=0 , 1 sonst so hat g an der Stelle 0 einen Grenzwert, nämlich 1, und es ist 1 6= g(0) = 0. 94 Satz 3.12. Es seien nun M eine Teilmenge des metrischen Raumes (X, d), p ein Häufungspunkt von M und f, g ∈ Abb(M, C) mit lim f (x) = a, lim g(x) = b. x→p x→p Dann gilt: a) lim (f + g)(x) = a + b, x→p b) lim (λf )(x) = λa für beliebiges λ ∈ C. x→p c) lim (f g)(x) = ab, x→p f d) lim x→p g ! a (x) = , wenn b 6= 0. b Beweis: Die Behauptungen ergeben sich direkt aus Satz 2.13. Wir demonstrieren dies für Teil c): Nach Definition 3.10 genügt es zu zeigen, dass für jede Folge (pn )n≥1 in M \ {p} mit lim pn = p gilt: n→∞ lim (f g)(pn ) = a · b. n→∞ Nun ist aber nach Definition 3.3: (f g)(pn ) = f (pn ) g(pn ). und lim f (pn ) = a, lim g(pn ) = b. n→∞ n→∞ Satz 2.13 c) liefert dann die Behauptung. 2 Beispiel 3.13. Es seien x0 ∈ R und k ∈ N fest, und f : R \ {x0 } −→ R sei definiert durch f (x) = xk − xk0 . x − x0 Besitzt f an der Stelle x0 einen Grenzwert? Zunächst ist x0 ein Häufungspunkt des Definitionsbereichs von f . Für x 6= x0 ist X xk − xk0 k−1 xj x0k−1−j . = x − x0 j=0 Also gilt nach Satz 3.12 lim f (x) = x→x0 k−1 X j=0 lim xj x0k−1−j = kx0k−1 . x→x0 95 3.3 Stetige Funktionen Definition 3.14. Seien (X, dX ), (Y, dY ) zwei metrische Räume, M ⊂ X, f : M → Y eine Abbildung und p ∈ M. f heißt stetig im Punkt p, wenn zu jedem ε > 0 ein δ = δ(ε) > 0 existiert mit dY (f (x), f (p)) < ε für alle x ∈ M, für die dX (x, p) < δ gilt. f ist also genau dann stetig im Punkt p, wenn für jede Folge (xn )n≥1 in M mit lim xn = p stets lim f (xn ) = f (p) folgt; ist p Häufungspunkt von M, so ist dies n→∞ n→∞ äquivalent zu lim f (x) = f (p). x→p Ist f in allen Punkten aus M stetig, so heißt f stetig auf M. Wie bei der Konvergenzdefinition (vgl. Bem. 2.10) reicht es für die Stetigkeit im Punkt p zu zeigen, dass eine Konstante K = K(p) > 0 und zu jedem ε > 0 ein δ = δ(ε, p) > 0 existieren mit dY (f (x), f (p)) < K ·ε für alle x ∈ M mit dX (x, p) < δ. Wir betrachten nun ein paar Prozesse, mit denen man aus stetigen Funktionen neue gewinnen kann: Satz 3.15. Es seien (X, dX ), (Y, dY ) und (Z, dZ ) metrische Räume, ∅ 6= M ⊂ X, f : M → Y , g : f (M) → Z und h = g ◦ f : M → Z. Ist f stetig im Punkt p ∈ M und g stetig im Punkt f (p), so ist h im Punkt p stetig. Beweis: Sei (xn )n≥1 eine Folge in M mit lim xn = p; wegen der Stetigkeit von f gilt n→∞ lim f (xn ) = f (p). Die Stetigkeit von g im Punkt f (p) liefert dann auch lim g(f (xn )) = n→∞ n→∞ g(f (p)), d.h. n→∞ lim h(xn ) = h(p). 2 Direkt aus Satz 3.12 erhalten wir Satz 3.16. Seien M eine Teilmenge eines metrischen Raumes (X, d) sowie f, g : M → C stetig im Punkt p ∈ M und α ∈ C; dann sind auch die Funktionen f + g, αf und f g im f Punkt p stetig. Ist g(p) 6= 0, so ist auch die Funktion : M ′ → C mit M ′ = {x ∈ g M | g(x) 6= 0} im Punkt p stetig. Die Menge aller stetigen reell- bzw. komplexwertigen Funktionen bezeichnen wir mit C(X, R) bzw. C(X, C); manchmal lassen wir auch den Körper weg, wenn aus dem Zusammenhang hervorgeht, ob es sich um komplex- oder reellwertige Funktionen handelt. 96 Beispiele 3.17. a) Jedes Polynom P : C → C bzw. P : R → R ist auf C bzw. R stetig. b) Jede rationale Funktion ist in ihrem Definitionsbereich stetig. c) Die Dirichlet-Funktion χQ : R → R ist in keinem Punkt x ∈ R stetig. Dagegen ist χQ · idR genau im Nullpunkt stetig. Beweis: Trivialerweise sind π0 : K ∋ x 7→ 1 ∈ K und π1 : K ∋ x 7→ x ∈ K auf K stetig. Dann liefert Satz 3.16 unter Berücksichtigung von πk (x) = xk = π1 (x)k die Behauptungen a) und b). √ ! √ ! 2 2 Zu c): Sei p ∈ Q; dann ist p + eine Folge in R \ Q mit lim p + = p und n→∞ n n≥1 n lim χQ n→∞ √ ! 2 p+ = 0 6= χQ (p). n Ist p ∈ R \ Q, etwa p = p0 + a mit p0 ∈ Z und a ∈ ]0, 1], so existiert nach Satz 1.55 eine Folge rationaler Zahlen an mit a = lim an ; also ist n→∞ p = lim (p0 + an ) und p0 + an ∈ Q n→∞ sowie lim χQ (p0 + an ) = 1 6= χQ (p). n→∞ Entsprechend erhalten wir für p ∈ Q \ {0}: √ ! √ ! 2 2 · p+ =0 lim χ p + n→∞ Q n n und sowie für p ∈ R \ Q χQ (p) · p = p 6= 0 lim χQ (p0 + an )·(p0 + an ) = p 6= 0 n→∞ und χQ (p) · p = 0. Ist dagegen p = 0, (pn )n≥1 eine beliebige Folge in R mit lim pn = 0, so folgt wegen n→∞ χQ (pn )·pn = 0 für pn ∈ R \ Q und χQ (pn )·pn = pn für pn ∈ Q auch lim χQ (pn )·pn = 0 = χQ (0)·0. n→∞ 2 97 3.4 Sätze über stetige Funktionen Satz 3.18 (Nullstellensatz von Bolzano). Es sei f : [a, b] → R stetig auf dem abgeschlossenen Intervall [a, b] mit f (a) < 0 und f (b) > 0 (oder f (a) > 0 und f (b) < 0). Dann existiert ein x0 ∈ ]a, b[ mit f (x0 ) = 0. Beweis: Wir definieren induktiv eine Intervallschachtelung [an , bn ] ⊂ [a, b] mit bn − an = 2−n (b − a) und f (an ) ≤ 0, f (bn ) ≥ 0. f (a) a x0 b f (b) Abbildung 13: Nullstellensatz von Bolzano Dabei haben wir f (a) < 0 und f (b) > 0 vorausgesetzt. Wir setzen [a0 , b0 ] := [a, b]; sei das Intervall [an , bn ] mit obigen Eigenschaften schon definiert. Dann betrachten wir 1 m := (an + bn ); es gibt zwei Fälle: 2 (α) f (m) ≥ 0; dann setzen wir [an+1 , bn+1 ] := [an , m] (β) f (m) < 0; dann setzen wir [an+1 , bn+1 ] := [m, bn ] Offensichtlich sind die geforderten Eigenschaften für [an+1 , bn+1 ] erfüllt. Sei x0 = lim an = lim bn . n→∞ n→∞ Wegen der Stetigkeit von f folgt f (x0 ) = lim f (an ) = lim f (bn ). n→∞ n→∞ Der Vergleichssatz (Satz 2.16) liefert f (x0 ) = lim f (an ) ≤ 0 und f (x0 ) = lim f (bn ) ≥ 0. n→∞ n→∞ 98 Daraus folgt f (x0 ) = 0. 2 Folgerung 3.19 (Zwischenwertsatz). Es sei f : [a, b] → R stetig und c eine reelle Zahl zwischen f (a) und f (b). Dann existiert ein x0 ∈ [a, b] mit f (x0 ) = c. Abbildung 14: Zwischenwertsatz Beweis: O.B.d.A. sei f (a) < c < f (b); wir definieren g : [a, b] → R durch g(x) = f (x) − c. Dann ist g stetig mit g(a) < 0 < g(b). Satz 3.18 liefert die Existenz eines x0 ∈ [a, b] mit g(x0 ) = 0, d.h. f (x0 ) = c. 2 Folgerung 3.20. Ist f : [a, b] → [a, b] stetig, so existiert ein x0 ∈ [a, b] mit f (x0 ) = x0 ; dieser wird Fixpunkt von f genannt. Beweis: Es ist a ≤ f (x) ≤ b für alle x ∈ [a, b]. Im Fall a = f (a) oder b = f (b) sind wir fertig. Sei also a < f (a) und f (b) < b; dann besitzt aber die Funktion g : [a, b] ∋ x 7→ f (x) − x ∈ R wegen g(a) = f (a) − a > 0 und g(b) = f (b) − b < 0 nach Satz 3.18 eine Nullstelle x0 ∈ ]a, b[. Damit hat die Funktion f einen Fixpunkt x0 , d.h. ein x0 mit f (x0 ) = x0 . 2 Bevor wir weitere Sätze formulieren können, benötigen wir noch ein paar Verabredungen: Definition 3.21. Es sei (X, d) ein metrischer Raum und K ⊂ X; K heißt kompakt, wenn jede Folge in K eine konvergente Teilfolge besitzt, deren Grenzwert zu K gehört. 99 Beispiele 3.22. a) K ⊂ X ist genau dann abgeschlossene Menge, wenn der Grenzwert jeder konvergenten Folge in K zu K gehört. Ein reelles Intervall ist genau dann abgeschlossen, wenn es von der Form [a, b] mit a, b ∈ R und a ≤ b, von der Form ] − ∞, b] mit b ∈ R, [a, ∞[ mit a ∈ R oder ] − ∞, ∞[ ist. b) Eine Teilmenge K ⊂ R bzw. K ⊂ C ist genau dann kompakt, wenn K abgeschlossen und beschränkt ist. c) Ein reelles Intervall ist also genau dann kompakt, wenn es von der Form [a, b] mit a ≤ b ist. d) Ist ∅ = 6 A ⊂ R kompakt, so existieren x0 , x1 ∈ A mit x0 ≤ x ≤ x1 für alle x ∈ A. e) Sei (X, d) ein metrischer Raum. Dann ist K ⊂ X genau dann abgeschlossen, wenn K = K ist. Beweis: a), c) und e) sind trivial. Zu b): ⇒: Wäre K unbeschränkt, so existierte eine Folge (xn )n≥1 in K mit |xn | > n. Dann wäre auch jede Teilfolge hiervon unbeschränkt und damit divergent, Widerspruch; also ist K beschränkt. Ist nun (xn )n≥1 mit xn ∈ K eine konvergente Folge mit lim xn = x0 ∈ C, so existiert n→∞ wegen der Kompaktheit von K eine Teilfolge von (xn )n≥1 , die gegen ein Element aus K konvergiert. Da diese Teilfolge ebenfalls gegen x0 konvergiert, folgt: x0 ∈ K, d.h. K ist auch abgeschlossen nach a). ⇐: 1) Sei K ⊂ R und (xn )n≥1 eine Folge in K; als beschränkte Folge besitzt (xn )n≥1 eine konvergente Teilfolge (xnk )k≥1 ; dies läßt sich mit Hilfe des Prinzips der Intervallschachtelung beweisen. Der Grenzwert sei x0 . Wegen der Abgeschlossenheit von K ist x0 ∈ K, d.h. K ist kompakt. 2) Sei K ⊂ C und (zn )n≥1 eine Folge in K; als beschränkte Folge besitzt (Re zn )n≥1 eine konvergente Teilfolge (Re znk )k≥1 mit Grenzwert x0 . Die Folge (Im znk )k≥1 enthält nun eine konvergente Teilfolge (Im zmk )k≥1 ; ihr Grenzwert sei y0 . Als Teilfolge von (Re znk )k≥1 konvergiert (Re zmk )k≥1 ebenfalls gegen x0 , und damit ist nach Folgerung 2.12: lim zmk = (x0 , y0 ) = z0 . k→∞ Wegen der Abgeschlossenheit von K ist z0 ∈ K. Zu d): Als beschränkte Menge besitzt A ein Infimum x0 ∈ R und ein Supremum x1 ∈ R. Dann existieren Folgen (wn )n≥1 und (zn )n≥1 in A mit x0 = n→∞ lim wn und x1 = n→∞ lim zn . 1 (Ist x0 6∈ A, so wähle wn ∈ A mit x0 < wn < x0 + n ; ist x1 6∈ A, so wähle zn ∈ A mit x1 − n1 < zn < x1 .) Wegen der Abgeschlossenheit von A folgt: x0 ∈ A und x1 ∈ A. 2 100 Satz 3.23. Sind (X, dX ) und (Y, dY ) metrische Räume, K ⊂ X kompakt und f : K → Y stetig, so ist auch f (K) kompakt. Beweis: Sei (f (xn ))n≥1 eine Folge in f (K); dann besitzt die Urbildfolge wegen der Kompaktheit von K eine konvergente Teilfolge (xnk )k≥1 mit lim xnk = x0 ∈ K. Die Stetigkeit k→∞ von f liefert: lim f (xnk ) = f (x0 ) ∈ f (K), k→∞ d.h. die Kompaktheit von f (K). 2 Folgerung 3.24. Ist (X, d) ein metrischer Raum, ∅ = 6 K ⊂ X kompakt und f : K → D := f (K) ⊂ R stetig, so nimmt f Maximum und Minimum auf K an, d.h. es existieren eine Minimalstelle x1 ∈ K mit f (x1 ) = min f , und eine Maximalstelle x2 ∈ K mit f (x2 ) = max f . max D = f (x2 ) min D = f (x1 ) a x1 x2 = b Abbildung 15: Maximum und Minimum werden auf K = [a, b] angenommen Beweis: Nach Satz 3.23 und Beispiel 3.22 d) folgt direkt die Behauptung. 2 Folgerung 3.25. Ist K ⊂ R ein kompaktes Intervall und f : K → R stetig, so ist f (K) entweder eine einpunktige Menge oder ein kompaktes Intervall. Beweis: Seien K = [a, b], x0 eine Minimalstelle und x1 eine Maximalstelle von f . Im Fall f (x0 ) = f (x1 ) ist f (K) = {f (x0 )}. Im Fall f (x0 ) < f (x1 ) existiert nach dem Zwischenwertsatz zu jedem c ∈ [f (x0 ), f (x1 )] ein x ∈ [a, b] mit f (x) = c. Also ist f (K) = [f (x0 ), f (x1 )]. 2 101 3.5 Logarithmus und allgemeine Potenzen Bevor wir uns speziellen Funktionen zuwenden, formulieren wir einen Satz über die Umkehrfunktion einer stetigen, streng monotonen Funktion: Satz 3.26. Ist f : [a, b] → R stetig und streng monoton mit A := f (a) und B := f (b), so bildet f das Intervall [a, b] bijektiv auf das Intervall [A, B] bzw. [B, A] ab, und die Umkehrfunktion f −1 : [A, B] → R (bzw. f −1 : [B, A] → R) ist ebenfalls stetig und im selben Sinne streng monoton. Abbildung 16: Umkehrfunktion Beweis: Der erste Teil der Behauptung folgt aus Bemerkung 3.6 und Folgerung 3.25. O.B.d.A. sei nun f streng monoton wachsend. Aus A ≤ y1 < y2 ≤ B folgt dann mit xi ∈ [a, b], f (xi ) = yi sofort x1 < x2 ; also ist f −1 ebenfalls streng monoton wachsend. Bleibt nur noch die Stetigkeit von f −1 zu zeigen. Sei dazu y0 ∈ [A, B] und (yn )n≥1 eine Folge in [A, B] mit lim yn = y0 ; zur Vereinfachung bezeichnen wir f −1 mit g; dann ist zu n→∞ zeigen: lim g(yn ) = g(y0). n→∞ Angenommen, dies gilt nicht. Dann existieren ein ε > 0 und eine Teilfolge (ynk )k≥1 von (yn )n≥1 derart, dass |g(ynk ) − g(y0)| ≥ ε für alle k ∈ N gilt. Wegen a ≤ g(ynk ) ≤ b ist die Folge (g(ynk ))k≥1, beschränkt, besitzt also eine konvergente Teilfolge; o.B.d.A. können wir annehmen, dass (g(ynk ))k≥1 selbst gegen c konvergiert. Der Vergleichssatz liefert |c − g(y0)| ≥ ε. Wegen f (g(ynk )) = ynk folgt aber aus der Stetigkeit von f : y0 = lim ynk = k→∞ lim f (g(ynk )) k→∞ = f lim g(ynk ) = f (c), k→∞ 102 d.h. g(y0) = g(f (c)) = c, im Widerspruch zu |c − g(y0)| ≥ ε. 2 Satz und Definition 3.27. Sei n ∈ N. Die Abbildung πn : [0, ∞[→ R mit πn (x) = xn ist streng monoton wachsend und bildet [0, ∞[ bijektiv auf [0, ∞[ ab. Die Umkehrfunktion πn−1 : [0, ∞[→ R √ mit πn−1 (x) = n x ist ebenfalls stetig und streng monoton wachsend und wird als n-te Wurzel bezeichnet (vgl. Satz 1.23). Beweis: Die Stetigkeit von πn wurde in Beispiel 3.17 a) gezeigt. Die strenge Monotonie folgt direkt aus der Binomischen Formel wegen xn2 = (x1 + h)n = n X k=0 ! n k n−k x h > xn1 k 1 für h > 0. Nach Satz 3.26 bildet πn das Intervall [0, k] für jedes k > 0 bijektiv auf [0, k n ] ab. Deshalb ist πn eine bijektive Abbildung von [0, ∞[ auf sich. πn−1 ist also definiert auf [0, ∞[ mit πn−1 ([0, ∞[) = [0, ∞[. Schließlich ist πn−1 nach Satz 3.26 streng monoton wachsend und stetig auf [0, k n ] für jedes k > 0, also auch stetig in allen Punkten x ≥ 0. 2 Satz und Definition 3.28. Die Exponentialfunktion exp : R → R ist streng monoton wachsend, stetig (sogar als Abbildung von C nach C) und bildet R bijektiv auf ]0, ∞[ ab. Die Umkehrfunktion (exp)−1 wird mit ln bezeichnet, d.h. ln : ]0, ∞[→ R, und ist ebenfalls stetig sowie streng monoton wachsend und heißt der natürliche Logarithmus. Es gilt für alle x, y > 0 die Funktionalgleichung ln(xy) = ln x + ln y. Beweis: Die strenge Monotonie ergibt sich wegen exp(h) = hk >1 k=0 k! ∞ X für h > 0 aus der Funktionalgleichung folgendermaßen: sind x1 < x2 , d.h. x2 = x1 + h mit h > 0, so gilt: exp(x2 ) = exp(x1 + h) = exp(x1 )exp(h) > exp(x1 ). 103 1 1 2 3 e 0 –1 –2 8cm Abbildung 17: Der natürliche Logarithmus Wir beweisen nun die Stetigkeit von exp als Funktion von C nach C. Seien dazu z0 ∈ C fest und h ∈ C; dann gilt |exp(z0 + h) − exp(z0 )| = |exp(z0 )exp(h) − exp(z0 )| = |exp(z0 )(exp(h) − 1)| mit ∞ X ∞ ∞ X X hk |h|k |h|k |exp(h) − 1| = ≤ |h| ≤ |h| ≤ exp(|h|) k=1 k! k=0 (k + 1)! k=0 k! ε Wählen wir zu vorgegebenem ε > 0 die Größe δ(ε) := min 1, , so folgt für alle e |h| < δ(ε) wegen der Monotonie: |h|exp(|h|) < |h|exp(1) = |h|e < ε und damit |exp(z0 + h) − exp(z0 )| < |exp(z0 )|·ε . Nun zeigen wir: exp(R) = ]0, ∞[. Für alle n ∈ N0 gilt exp(n) ≥ 1 + n sowie exp(−n) = 1 1 ≤ und somit, also exp(n) 1+n wegen exp(x) > 0 exp(R) = [ n∈N [exp(−n), exp(n)] ⊃ [ n∈N 1 , 1 + n =]0, ∞[. 1+n Wegen exp(x) > 0 für alle x ∈ R, d.h. exp(R) ⊂ ]0, ∞[, folgt die Behauptung. Also existiert die Umkehrfunktion ln : ]0, ∞[→ R. Nach Satz 3.26 ist ln auf jedem Intervall [exp(−n), exp(n)] und folglich in jedem Punkt aus ]0, ∞[ stetig. 104 Die Funktionalgleichung folgt schließlich aus der für die Exponentialfunktion. Dazu setzen wir v := ln x, w := ln y d.h. exp(v) = x, exp(w) = y; dann folgt exp(v + w) = exp(v)exp(w) = xy und daraus ln(xy) = v + w = ln x + ln y. 2 Satz und Definition 3.29. Für a > 0 definieren wir die Exponentialfunktion zur Basis a durch expa : R ∋ x 7→ exp(x · ln a) ∈ R. expa ist stetig und streng monoton wachsend für a > 1 bzw. streng monoton fallend für 0 < a < 1 und bildet R bijektiv auf ]0, ∞[ ab. Es gilt a) expa (x + y) = expa (x)expa (y) für alle x, y ∈ R, b) expa (n) = an für alle n ∈ Z, c) expa p q ! = √ q ap für alle p ∈ Z und q ∈ N. Aufgrund dieser Eigenschaften nennt man expa auch die allgemeine Potenz zur Basis a, und schreibt ax := expa (x) (Man beachte: expe (x) = exp x = ex .) Ferner gilt für alle a, b ∈ ]0, ∞[ und alle x, y ∈ R d) (ax )y = axy , e) ax bx = (ab)x , f) x 1 a = a−x . Die Umkehrfunktion (expa )−1 : ]0, ∞[→ R ist für a > 0, a 6= 1, ebenfalls stetig und streng monoton. Wir erhalten ln x (expa )−1 (x) = ln a und schreiben dafür loga x. Die Funktion loga heißt Logarithmus zur Basis a. Ist a = 10, so schreiben wir kurz log oder lg statt log10 . 105 2x 4 3 2 1 -3 -2 x -1 1 2 Abbildung 18: Beispiel für allgemeine Potenzen (a > 1), hier a = 2 3-x 3 2 1 -1 x 1 2 3 Abbildung 19: Beispiel für allgemeine Potenzen ( 0 < a < 1), hier a = 1/3 106 3.6 Trigonometrische Funktionen Definition 3.30. Für x ∈ R definieren wir cos x := Re(eix ) = Re(exp(ix)), sin x := Im(eix ) = Im(exp(ix)); es ist also eix = cos x + i sin x (Eulersche Formel). Bemerkung 3.31. Nach Folgerung 2.48 b) gilt für x ∈ R : e−ix = eix = eix = cos x − i sin x, also |eix |2 = eix · eix = e0 = 1. Stellen wir also die komplexe Zahl eix im cartesischen Koordinatensystem dar, so liegt eix auf dem Einheitskreis und cos x ist die Abszisse, sin x die Ordinate des Punktes eix . Ferner ergibt sich daraus und aus der Definition gemäß Folgerung 1.48: 1 a) cos x = (eix + e−ix ), 2 b) cos(−x) = cos x, sin x = 1 ix (e − e−ix ) 2i sin(−x) = − sin x c) sin2 x + cos2 x = 1 d) cos(x + y) = cos x cos y − sin x sin y sin(x + y) = sin x cos y + cos x sin y für alle x, y ∈ R (Additionstheorem) Aussage d) folgt aus ei(x+y) = eix eiy mit der Eulerschen Formel: cos(x + y) + i sin(x + y) = (cos x + i sin x)(cos y + i sin y) = (cos x cos y − sin x sin y) + i(sin x cos y + cos x sin y). Für komplexes z ∈ C wird cos z bzw. sin z in Anlehnung an a) definiert durch 1 1 cos z = (eiz + e−iz ) bzw. sin z = (eiz − e−iz ). 2 2i 107 Satz 3.32. Die Funktionen cos : C → C und sin : C → C sind stetig, und es gilt für alle z ∈ C: cos z = ∞ X (−1)k k=0 bzw. sin z = ∞ X (−1)k k=0 z 2k (2k)! z 2k+1 . (2k + 1)! Beide Reihen konvergieren absolut. Beweis: Die Stetigkeit ergibt sich aus der Stetigkeit der Abbildungen z 7→ iz und z 7→ −iz sowie der der Exponentialfunktion. Wir beweisen die Darstellung für die sin-Funktion: ∞ ∞ (−iz)k 1 X (iz)k X sin z = − 2i k=0 k! k! k=0 ! ∞ zk 1 X (ik − (−i)k ) . = 2i k=0 k! Ist nun k gerade, etwa k = 2n, so folgt ik − (−i)k = i2n − (−1)2n i2n = 0; ist dagegen k ungerade, etwa k = 2n + 1, so folgt 1 k 1 (i − (−i)k ) = 2 · i2n+1 = i2n = (−1)n . 2i 2i Entsprechend folgt die Behauptung für die cos-Funktion. Die absolute Konvergenz ergibt sich direkt aus der der Exponentialreihe (vgl. Beispiel 2.47). 2 Satz 3.33. Die Funktion cos hat im Intervall [0, 2] genau eine Nullstelle. Beweis: • Existenz: Zeige m.H. von Satz 3.32 cos 0 = 1, cos 2 < 0 und verwende den Nullstellensatz, Satz 3.18. • Eindeutigkeit: Zeige sin x > 0 in (0, 2] und damit die strenge Monotonie von cos in [0, 2]; letzteres folgt aus Bemerkung 3.31 d). 2 108 Definition 3.34. π ist die (eindeutig bestimmte) Nullstelle der cos-Funktion im Intervall [0, 2]. 2 Satz 3.35. Wir erhalten spezielle Werte der Exponential-, Sinus- und Cosinus-Funktion, nämlich: π ei 2 = i, eiπ = −1, ei 3π 2 = −i, e2πi = 1 und \\ t \ 0 π 3 π 2 2π 4 2 0 −1 0 0 −1 0 1. π 6 π 4 π 3 π 2 √ √ √ √ \ sin t cos t 1 2 √ 3 2 0 √ 4 2 2 2 √ 2 2 3 2 √ 1 2 π π π = 0 folgt sin2 = 1 − cos2 = 1, also wegen der Überlegungen 2 2 2 π beim Beweis zu Satz 3.33: sin = 1 und damit 2 Beweis: Wegen cos π ei 2 = cos Weiter ist dann in· π2 e Ferner gilt π n i2 = e π π + i sin = i. 2 2 −1 = i = −i 1 n für für für n=2 n=3 n = 4. sin 0 = Im ei0 = 0 und cos 0 = Re ei0 = 1. Die Additionstheoreme (oder die Moivresche Formel) liefern (nachrechnen!) Daraus folgt mit y := cos π 6 cos 3x = 4 cos3 x − 3 cos x. 4y 3 − 3y = cos und daraus wegen y > 0 : π =0 2 √ 3 π . y = cos = 6 2 109 Wegen 0 < π < 2 ist: 6 π π sin = 1 − cos2 6 6 1 2 = s 1 1 = . 4 2 Die Beziehung cos 2x = cos2 x − sin2 x liefert dann: cos und damit wegen sin π π π 1 = cos2 − sin2 = 3 6 6 2 π >0 3 π sin = 3 r 1− cos2 √ 3 π = . 3 2 Schließlich erhalten wir aus cos 2x = 2 cos2 x − 1 mit y = cos 2 2y − 1 = 0 oder y = und daraus π sin = 4 π : 4 √ 2 2 √ π 2 . 1 − cos2 = 4 2 r 2 Folgerung 3.36. Für alle z ∈ C gilt: a) cos(z + 2π) = cos z, b) cos(z + π) = − cos z, c) cos z = sin π −z , 2 sin(z + 2π) = sin z sin(z + π) = − sin z sin z = cos π −z 2 Die Eigenschaften in a) bezeichnet man als 2π-Periodizität der cos- bzw. sin-Funktion. Beweis: Die Beziehungen ergeben sich direkt aus den Additionstheoremen und Satz 3.35. 2 Folgerung 3.37. Die Nullstellenmengen von sin bzw. cos sind: a) {x ∈ C | sin x = 0} = {kπ | k ∈ Z} b) {x ∈ C | cos x = 0} = und π + kπ | k ∈ Z . 2 110 Beweis: Sei zunächst x ∈ R: π und wegen cos(−x) = cos x gilt 2 π π cos x > 0 für alle − < x < . 2 2 Zu a): Wegen der Definition von π Die Beziehung sin x = cos − x liefert damit 2 sin x > 0 für alle 0 < x < π , und wegen sin(x + π) = − sin x gilt dann sin x < 0 für alle π < x < 2π . Also sind 0 und π die einzigen Nullstellen von [0, 2π[. Ist nun x ∈ R sin im Intervall x x x + t mit ∈ Z und t ∈ [0, 1[; daraus = beliebig mit sin x = 0, so schreiben wir 2π 2π 2π folgt x = 2πm + r mit m ∈ Z und mit r ∈ [0, 2π[, also sin r = sin(x − 2πm) = sin x cos 2πm − sin 2πm cos x = sin x · 1 − 0 · cos x = sin x = 0. Also ist r = 0 oder r = π und damit x = 2mπ oder x = (2m + 1)π. π . 2 Ist z ∈ C und cos z = 0, so folgt Re cos z = 0 und Im cos z = 0. Nun ist aber für z = x+iy mit x, y ∈ R: cos z = 21 (eiz + e−iz ) b) folgt aus a) wegen cos x = − sin x − d.h. und = 1 ix−y (e 2 = 1 −y (e (cos x 2 = 1 −y (e 2 + e−ix+y ) + i sin x) + ey (cos x − i sin x)) + ey ) cos x + 21 i(e−y − ey ) sin x , 1 Re cos z = (e−y + ey ) cos x = 0 2 1 Im cos z = (e−y − ey ) sin x = 0 . 2 y Daraus folgt cos x = 0 und e = e−y bzw. y = 0 mit x, y ∈ R. Entsprechend folgt, dass die sin-Funktion nur die angegebenen reellen Nullstellen besitzt. 2 111 sin x 1 x -2 p -p p 2p -1 Abbildung 20: sin-Funktion auf [−2π, 2π] cos x 1 x -2 p -p p -1 Abbildung 21: cos-Funktion auf [−2π, 2π] 2p 112 Definition 3.38. π Für z ∈ C \ + kπ | k ∈ Z definieren wir die Tangens-Funktion tan durch 2 tan z = sin z , cos z und für z ∈ C \ {kπ | k ∈ Z} sei die Cotangens-Funktion cot durch cot z = cos z sin z gegeben. Bemerkung 3.39. a) Wegen Folgerung 3.36 b) gilt für alle z ∈ C \ k ∈ Z}: tan(z + π) = tan z, π + kπ | k ∈ Z bzw. z ∈ C \ {kπ | 2 cot(z + π) = cot z. In ihren Definitionsbereichen sind also der Tangens bzw. der Cotangens π-periodisch. b) Es ist {z ∈ C | tan z = 0} = {kπ | k ∈ Z} c) und {z ∈ C | cot z = 0} = {(2k + 1) π | k ∈ Z} . 2 d) Es ist tan :] − π2 , π2 [→ R stetig, streng monoton wachsend und bildet ] − π2 , π2 [ bijektiv auf R ab. Die zugehörige Umkehrfunktion heißt Arcus tangens; wir schreiben arctan (oder auch Arctan). e) Aufgrund der Additionstheoreme für die sin- bzw. cos-Funktion gilt für alle x, y ∈ C, für die tan x, tan y, tan(x + y) definiert sind mit tan x tan y 6= 1: tan(x + y) = tan x + tan y . 1 − tan x tan y f) Eine entsprechende Aussage gilt für die cot-Funktion, nämlich cot(x + y) = cot x cot y − 1 . cot x + cot y Hier wird auch für x, y ∈ C vorausgesetzt, dass cot x, cot y und cot(x + y) definiert sind mit cot x + cot y 6= 0 113 tan x 1 x -2 p -p p 2p -1 Abbildung 22: tan-Funktion zwischen −2π und 2π cot x 1 x -2 p -p p 2p -1 Abbildung 23: cot-Funktion zwischen −2π und 2π 114 3.7 Uneigentliche Grenzwerte und Grenzwerte im Unendlichen Unter den divergenten Folgen zeichnen wir noch eine Klasse aus in Definition 3.40. Eine reelle Zahlenfolge (an )n≥1 heißt bestimmt divergent gegen +∞ (bzw. −∞), wenn es zu jedem K ∈ R ein N(K) ∈ R gibt, so dass an > K (bzw. an < K) für alle n > N(K) gilt. Wir schreiben an → +∞ oder an → −∞ und nennen lim an = ±∞ einen uneigentn→∞ lichen Grenzwert der Folge (an )n≥1 . Direkt aus der Definition können wir folgende Aussagen herleiten: Satz 3.41. a) Ist (an )n≥1 eine Folge mit an > 0 (bzw. an < 0) und lim an = 0, so besitzt die Folge n→∞ 1 den uneigentlichen Grenzwert +∞ (bzw. −∞). an n≥1 b) Ist (an )n≥1 bestimmt divergent gegen+∞(bzw. −∞), so existiert ein n0 ∈ N mit 1 an 6= 0 für alle n ≥ n0 , und die Folge konvergiert gegen 0. an n≥n0 c) Gegeben seien drei reelle Folgen (an )n≥1 , (bn )n≥1 , (cn )n≥1 mit n→∞ lim an = +∞, lim bn = +∞ und lim cn = c; dann gilt: n→∞ n→∞ an + bn → +∞, αan → +∞ für α > 0 −∞ für α < 0 an bn → +∞ Über das Verhalten von (an − bn )n≥1 und hergeleitet werden. an + cn → +∞ an bn kann keine allgemeine Aussage n≥1 Mit Hilfe der uneigentlichen Grenzwerte erhalten wir Definition 3.42. Sei X ⊂ R nach oben unbeschränkt, (Y, dY ) ein metrischer Raum und f : X → Y eine Funktion. Konvergiert für jede Folge (xn )n≥1 in X mit lim xn = +∞ die Folge n→∞ (f (xn ))n≥1 stets gegen q ∈ Y , so besitzt f für x → +∞ den Grenzwert q. Wir schreiben dann lim f (x) = q. Entsprechend definieren wir lim f (x) = q, wenn X nach unten x→+∞ x→−∞ unbeschränkt ist. 115 Defintion 3.43. (a) Es seien (X, dX ) ein metrischer Raum, M ⊂ X und f : M → R eine Funktion. Ist p ein Häufungspunkt von M und gilt f (xn ) → +∞ (bzw. −∞) für jede Folge (xn )n≥1 in M \ {p} mit xn → p, so heißt +∞ (bzw. −∞) der uneigentliche Grenzwert von f für x → p; wir schreiben f (x) → +∞ (bzw. − ∞) für x → p oder lim f (x) = +∞ (bzw. − ∞). x→p Für +∞ schreiben wir auch einfach ∞. (b) Sei X ⊂ R und p Häufungspunkt von X mit (p, p + ε) ⊂ X für ein ε > 0. Ist (Y, dY ) metrischer Raum, f : X → Y beliebig und existiert ein q ∈ Y , so dass für jede Folge (xn )n≥1 ⊂ (p, p + ε) mit xn → p gilt f (xn ) → q, so heißt q rechtseitiger Grenzwert von f in p und wir schreiben f (x) → q für x → p + oder lim f (x) = q. x→p+ Analog definieren wir den linksseitigen Grenzwert q von f im Punkt p, wenn (p − ε, p) ⊂ X gilt und f (xn ) → q für jede Folge (xn )n≥1 ⊂ (p − ε, p) mit xn → p erfüllt ist; wir schreiben dann f (x) → q für x → p − oder lim f (x) = q. x→p− (c) Schließlich erklären wir für Funktionen f : X ⊂ R → R und einen Häufungspunkt p von X analog zu (a) die uneigentlichen rechts- bzw. linksseitigen Grenzwerte lim f (x) = ±∞ und x→p+ lim f (x) = ±∞. x→p− Ist X ⊂ R nach oben bzw. unten unbeschränkt, so können wir auch noch die uneigentlichen Grenzwert lim f (x) = ±∞ bzw. x→+∞ lim f (x) = ±∞ x→−∞ definieren. Beispiele 3.44. a) Für alle k ∈ N0 gilt: ex = ∞. x→∞ xk (ex wächst für x → ∞ schneller gegen ∞ als jede Potenz von x.) lim 116 b) Für alle k ∈ N0 ist 1 lim xk e−x = 0 und lim xk e x = ∞. x→∞ c) Es ist lim ln x = ∞ lim ln x = −∞. und x→∞ x→0+ x→0+ d) Ist P ein reelles Polynom der Form P (x) = n X ak xk k=0 mit n ∈ N und an 6= 0, so gilt lim P (x) = x→∞ und lim P (x) = x→−∞ e) Für jedes reelle α > 0 gilt ∞, falls an > 0 −∞, falls an < 0 ∞, falls (−1)n an > 0 −∞, falls (−1)n an < 0. lim xα = 0 und x→0+ lim x−α = ∞. x→0+ f) Für alle α ∈ R mit α > 0 ist lim x−α ln x = 0. x→∞ (Der Logarithmus wächst für x → ∞ langsamer gegen ∞ als jede positive Potenz von x.) Beweis: Zu a): Für alle x > 0 gilt ex = also xn xk+1 > , (k + 1)! n=0 n! ∞ X x ex > , k x (k + 1)! woraus die Behauptung folgt. Zu b): Die erste Behauptung folgt mit Satz 3.41 direkt aus a) wegen xk e−x = die zweite folgt ebenfalls aus a) wegen lim f (x) = lim f y→∞ x→0+ k 1 x lim x e = lim x→0+ y→∞ 1 y !k ! 1 , also y ey = ∞. y→∞ y k ey = lim ex xk −1 ; 117 Zu c): Die erste Behauptung ist klar, da ln : ]0, ∞[→ R streng monoton wachsend und bijektiv ist. Daraus folgt dann wie in b): lim ln x = lim ln y→∞ x→0+ n Zu d): Für x 6= 0 gilt: P (x) = an x 1 = − lim ln y = −∞. y→∞ y an−1 a0 1+ ; ist an > 0, + ...+ an x an xn |an−1 | |a0 | K := max 1, 2n , . . . , 2n |an | |an | ! und x ≥ K, so folgt 1 1 P (x) ≥ an xn ≥ an x 2 2 und daraus die Behauptung für x → ∞. Ist an < 0, so betrachte das Polynom Q mit Q(x) = −P (x); dieses hat den positiven Höchtskoeffizienten −an . Satz 3.41 c) liefert dann die Behauptung. Die Behauptung für x → −∞ ergibt sich wegen P (−x) = (−1)n Q(x) mit Q(x) = n X bk xk k=0 und bn = an sowie bk = (−1)k−n ak für 0 ≤ k ≤ n − 1. Zu e): Sei (xn )n≥1 eine reelle Zahlenfolge mit xn > 0 und n→∞ lim xn = 0. Nach Teil c) und Satz 3.41 folgt lim α ln xn = −∞. n→∞ Nach Teil b) ist lim ey = 0, also insbesondere y→−∞ lim xαn = lim eα ln xn = 0, n→∞ n→∞ d.h. lim xα = 0. Die zweite Behauptung folgt wegen x−α = x→0+ 1 aus Satz 3.41. xα Zu f): Sei (xn )n≥1 eine reelle Zahlenfolge mit xn > 0 und lim xn = ∞; dann ist auch n→∞ lim yn = ∞ mit yn := α ln xn . Wegen xαn = eα ln xn = eyn erhalten wir n→∞ lim n→∞ nach Teil b). 1 yn 1 1 ln x = lim = lim yn e−yn = 0 n α y n n→∞ n→∞ xn e α α 2 118 §4 Differentiation In diesem Paragraphen sei der Definitionsbereich X ⊂ R einer reellwertigen Funktion f stets ein Intervall mit den Endpunkten a und b, ein Halbstrahl (also z.B. [a, +∞), (−∞, b), . . . ) oder ganz R. 4.1 Die Ableitung einer differenzierbaren Funktion Definition 4.1. Die Funktion f : X → R heißt differenzierbar im Punkt x0 ∈ X, wenn der Grenzwert f (ζ) − f (x0 ) ζ→x0 ζ − x0 lim existiert und endlich ist. Dieser Limes wird mit f ′ (x0 ) bezeichnet und die Ableitung von f an der Stelle x0 genannt. Ist f in jedem Punkt x0 ∈ X differenzierbar, so heißt f differenzierbar auf X. Abbildung 24: Steigungsdreieck Es ist möglich, rechts- bzw. linksseitige Ableitungen von f an einer Stelle x0 ∈ X zu definieren (vgl. dazu Definition 3.43 (b)). Ist x0 ein Randpunkt von X, so ist in Definition 4.1 der Grenzwert natürlich als einseitiger Grenzwert zu verstehen. Ist f : X → R im Punkt x0 ∈ X differenzierbar, so betrachten wir die Funktion g : R → R mit g(x) = f (x0 ) + f ′ (x0 )(x − x0 ) ; dann ist g affin, d.h. es gilt g(y) − g(x) = c(y − x) für alle x, y ∈ R mit der Konstante c = f ′ (x0 ). Ist ferner die Funktion Fx0 : X → R definiert durch Fx0 : X ∋ x 7→ f (x) − f (x0 ) für x 6= x0 x − x0 ∈R, f ′ (x0 ) für x = x0 119 so ist Fx0 im Punkt x0 stetig, und es gilt für alle x ∈ X: f (x) = f (x0 ) + (x − x0 )Fx0 (x). Daraus erhalten wir f (x) − g(x) = 0. 0 x − x0 lim x→x Deshalb sagt man, dass die Funktion f in x0 durch g linear approximiert wird. Setzen wir r(x) := f (x) − g(x) , so finden wir f (x) = f (x0 ) + f ′ (x0 )(x − x0 ) + r(x) mit r(x) = 0. x→x0 x − x0 lim Aus der Stetigkeit der Abbildung X ∋ x 7→ f (x0 ) + (x − x0 )Fx0 (x) ∈ R erhalten wir: Satz 4.2. Ist f : X → R differenzierbar im Punkt x0 ∈ X, so ist f auch in x0 stetig. Bezüglich der in Definition 3.3 eingeführten Operationen verhält sich der Differenzierbarkeitsprozeß aus Definition 4.1 folgendermaßen: Satz 4.3. (Ableitungsregeln) Es seien f, g : X → R differenzierbar im Punkt x0 ∈ X und c ∈ R. Dann sind auch f + g, c · f, f · g und fg differenzierbar im Punkt x0 . (Dabei ist fg natürlich nur für solche x ∈ X definiert, für die g(x) 6= 0 ist; also muß speziell g(x0 ) 6= 0 sein.) Ferner gilt: a) (f + g)′(x0 ) = f ′ (x0 ) + g ′ (x0 ) b) (cf )′ (x0 ) = cf ′ (x0 ) c) (f · g)′ (x0 ) = f ′ (x0 )g(x0 ) + f (x0 )g ′ (x0 ) d) f g !′ (x0 ) = g(x0 )f ′ (x0 ) − g ′ (x0 )f (x0 ) g 2 (x0 ) (Produktregel) (Quotientenregel) Beweis: a) und b) folgen direkt aus Satz 3.12. Zu c): Es ist unter Beachtung von Satz 4.2 und Satz 3.12: f (x)g(x) − f (x0 )g(x0 ) x − x0 = f (x) g(x) − g(x0 ) f (x) − f (x0 ) + g(x0 ) x − x0 x − x0 → f (x0 )g ′(x0 ) + g(x0 )f ′ (x0 ) für x → x0 . 120 Zu d): Wir erhalten wie in Teil c): f (x) g(x) − f (x0 ) g(x0 ) x − x0 " = f (x) − f (x0 ) 1 g(x) − g(x0 ) g(x0 ) − f (x0 ) g(x)g(x0 ) x − x0 x − x0 → 1 [g(x0 ) · f ′ (x0 ) − g ′ (x0 )f (x0 )] . (g(x0 ))2 # 2 Beispiele 4.4. a) Ist P ein Polynom der Form P (x) = n X k=0 differenzierbar mit P ′(x) = n X ak xk , so ist P in jedem Punkt x ∈ R kak xk−1 = k=1 n−1 X (k + 1)ak+1xk ; k=0 speziell für n = 0 erhalten wir P ′(x) = 0 für alle x ∈ R. In Paragraph 6 werden wir sehen, dass sich konvergente Potenzreihen der Form P (x) = ∞ X ak xk analog differenzieren lassen. k=0 b) Die Funktionen exp, sin, cos : R → R sind in jedem Punkt x ∈ R differenzierbar mit exp′ (x) = exp(x) = ex , sin′ (x) = cos x , cos′ (x) = − sin x , tan′ (x) = 1 + tan2 (x) = 1 . cos2 x c) fn : ]0, ∞[ ∋ x 7→ x−n ∈ R, n ∈ N, ist in jedem Punkt x ∈ ]0, ∞[ differenzierbar mit fn′ (x) = −nx−n−1 . Beweis: Zu a): Wir schreiben πk (x) := xk und erhalten direkt π0′ (x) = 0 sowie nach Beispiel 3.13 πk′ = kπk−1 für k ∈ N . Satz 4.3 a) und b) liefern dann die Behauptung für P . Zu b): Es gilt mit h = x − x0 aufgrund der Funktionalgleichung der e-Funktion ex0 +h − ex0 h→0 h lim ex0 (eh − 1) eh − 1 = ex0 lim h→0 h→0 h h = lim = ex0 · 1 121 wegen |eh − (1 + h)| ≤ ∞ |h|2 X |h| 2 k=0 3 also eh − 1 h Wegen sin x − sin y = sin = sin ∞ X |h|k |h|k = |h|2 ≤ k=2 k! k=0 (k + 2)! ∞ X !k ≤ − 1 3 |h|2 2 für |h| ≤ , 2 2 3 ≤ |h| für |h| ≤ . 2 x+y x−y x+y x−y − sin + − 2 2 2 2 x−y x+y x−y x+y cos + cos sin 2 2 2 2 x+y x−y x+y x−y − sin cos − cos sin 2 2 2 2 = 2 cos x−y x+y sin 2 2 folgt: ! sin(x0 + h) − sin(x0 ) 1 h h lim 2 cos x0 + sin = lim h→0 h→0 h h 2 2 ! ! sin h2 h · lim h = cos(x0 ) · 1 = lim cos x0 + h→0 h→0 2 2 wegen sin x =1, x→0 x lim was sich aus der Reihendarstellung der sin–Funktion (vgl. Satz 3.32) und einer Überlegung zur Fehlerabschätzung bei einer alternierenden Reihe ergibt (siehe aber auch Satz 4.27 unten). Entsprechend erhalten wir ! cos(x0 + h) − cos x0 h h 1 lim 2 sin x0 + sin = lim − h→0 h→0 h h 2 2 !! ! sin h h · lim h 2 = − sin(x0 ). = − lim sin x0 + h→0 h→0 2 2 Alternativ kann man diese Ableitungsregeln durch Differentiation der entsprechenden sin folgt nun aus der Potenzreihen berechnen (vgl. Satz 6.13). Die Formel für tan = cos Quotientenregel. 122 Zu c): Die Quotientenregel liefert nach Teil a): fn′ (x0 ) = xn0 · 0 − nx0n−1 · 1 1 = −n n+1 . 2n x0 x0 2 Ein weiteres Hilfsmittel zur Differentiation von Funktionen liefert Satz 4.5. (Kettenregel) Seien f : X → R und g : X ′ → R Funktionen mit f (X) ⊂ X ′ . Die Funktion f sei im Punkt x0 ∈ X differenzierbar und g sei in y0 := f (x0 ) ∈ X ′ differenzierbar. Dann ist die Komposition g ◦ f : X → R im Punkt x0 differenzierbar, und es gilt: (g ◦ f )′ (x0 ) = g ′ (f (x0 )) · f ′ (x0 ). Beweis: Betrachte die Funktion Gy 0 dann ist für alle y ∈ X ′ : g(y) − g(y0 ) für y 6= y0 y − y0 , : X ′ ∋ y 7→ g ′ (y0 ) für y = y0 g(y) − g(y0) = Gy0 (y)(y − y0 ), und Gy0 ist im Punkt y0 stetig. Daraus folgt: (g ◦ f )′ (x0 ) = = lim x→x0 g(f (x)) − g(f (x0 )) Gy0 (f (x))(f (x) − f (x0 )) = lim x→x 0 x − x0 x − x0 f (x) − f (x0 ) x→x0 x − x0 lim Gy0 (f (x)) lim x→x0 = Gy0 (f (x0 ))f ′ (x0 ) wegen der Stetigkeit von f im Punkt x0 = g ′(f (x0 ))f ′ (x0 ). 2 Beispiel 4.6. Für a > 0 erhalten wir (ax )′ = exp′a (x) = ln a · ax . Beweis: Es ist mit f (x) = x ln a und g(x) = ex nach Satz 4.5 und Beispiel 4.4 b): (ax )′ = (g ◦ f )′ (x) = g ′(f (x)) · f ′ (x) = ex·ln a · ln a = ln a · ax . 2 123 Satz 4.7. Sei f : X → R stetig und streng monoton auf X. Dann existiert die Umkehrfunktion f −1 : f (X) → R und ist stetig (siehe Satz 3.26). Ist f im Punkt x0 ∈ X differenzierbar mit f ′ (x0 ) 6= 0, so ist f −1 in y0 = f (x0 ) differenzierbar mit (f −1 )′ (y0 ) = 1 f ′ (x0 ) 1 = f ′ (f −1 (y 0 )) . Beweis: Für y ∈ f (X) mit y = f (x) gilt gemäß Satz 3.12 wegen der Stetigkeit von f −1 und wegen f ′ (x0 ) 6= 0: lim y→y0 f −1 (y) − f −1 (y0 ) = y − y0 x − x0 f (x)→f (x0 ) f (x) − f (x0 ) lim = 1 lim x→x0 f (x)−f (x0 ) x−x0 = 1 f ′ (x0 ) . 2 Beispiele 4.8. √ n a) Für die n-te Wurzel πn−1 (mit πn−1 (x) = 1 x = x n ) gilt (πn−1 )′ (x) = 1 1 −1 xn . n b) Für x > 0 ist (ln)′ (x) = 1 . x c) Für α ∈ R sei f : ]0, ∞[ ∋ x 7→ xα = eα ln x ∈ R; dann gilt f ′ (x) = α · xα−1 . d) Es ist (arctan)′ (x) = 1 . 1 + x2 Beweis: Zu a): Gemäß Beispiel 4.4 a) und Satz 4.7 gilt (πn−1 )′ (y) = 1 πn′ (πn−1 (y)) = 1 1 = n−1 n(πn−1 (y))n−1 ny n = 1 1−n 1 1 y n = y n −1 . n n Zu b): Nach Beispiel 4.4 b) folgt: ln′ (y) = 1 exp′ (ln y) = 1 1 = . exp(ln y) y 124 Zu c): Die Kettenregel und b) liefern: f ′ (x) = eα ln x (α ln x)′ = αxα 1 = αxα−1 . x Zu d): Nach Satz 4.7 und Beispiel 4.4 b) gilt (arctan)′ (x) = 1 1 1 = = . 2 (tan)′ (arctan x) 1 + tan (arctan x) 1 + x2 2 4.2 Relative Extrema. Mittelwertsätze. Wir wenden den Ableitungsbegriff bei der Kurvendiskussion und hier zunächst bei den lokalen oder relativen Extrema an. Definition 4.9. Wir sagen, dass die Funktion f : X → R ein relatives ( oder lokales) Maximum bzw. Minimum an der Stelle x0 ∈ X besitzt, wenn eine Umgebung Kδ (x0 ) = {x ∈ R | |x−x0 | < δ} von x0 existiert mit f (x) ≤ f (x0 ) (bzw. f (x) ≥ f (x0 )) für alle x ∈ Kδ (x0 ) ∩ X. Lokale Maxima und Minima heißen auch lokale ( oder relative) Extrema. Abbildung 25: Lokale Extrema Satz 4.10. (Notwendiges Kriterium für lokale Extrema) Seien f : X → R eine Funktion und x0 ∈ X ein innerer Punkt von X, d.h. es gebe ein r > 0 mit Kr (x0 ) ⊂ X. Ist f im Punkt x0 differenzierbar und besitzt f in x0 ein lokales Extremum, so ist f ′ (x0 ) = 0. 125 Beweis: O.B.d.A. nehmen wir an, dass f in x0 ein relatives Maximum besitzt. Wir wählen δ > 0 so, dass Kδ (x0 ) ⊂ X gilt und f (x) ≤ f (x0 ) für alle x0 − δ < x < x0 + δ. Dann erhalten wir für x0 − δ < x < x0 : f (x) − f (x0 ) ≥ 0, x − x0 und für x0 < x < x0 + δ: f (x) − f (x0 ) ≤ 0. x − x0 Die Differenzierbarkeit in x0 liefert dann einerseits f ′ (x0 ) ≥ 0 und andererseits f ′ (x0 ) ≤ 0, also f ′ (x0 ) = 0. 2 Satz 4.11. (Satz von Rolle) Es sei f : [a, b] → R (mit a < b) eine stetige Funktion mit f (a) = f (b); ferner sei f in ]a, b[ differenzierbar. Dann exisiert ein x0 ∈]a, b[ mit f ′ (x0 ) = 0. Beweis: Ist f konstant, so ist die Aussage trivial. Ist f nicht konstant, so existiert ein x ∈]a, b[ mit f (x) > f (a) oder f (x) < f (a). Also wird das Maximum oder das Minimum von f in einem Punkt x0 ∈]a, b[ angenommen (Die Existenz ist nach Folgerung 3.24 gesichert.). Satz 4.10 liefert dann die Behauptung. 2 Folgerung 4.12. (Mittelwertsatz der Differentialrechnung) Es sei f : [a, b] → R (mit a < b) eine stetige Funktion; ferner sei f in ]a, b[ differenzierbar. Dann existiert ein x0 ∈]a, b[ mit f (b) − f (a) = f ′ (x0 ). b−a Abbildung 26: Mittelwertsatz Beweis: Betrachte die Funktion ϕ : [a, b] → R mit ϕ(x) = f (x) − f (b) − f (a) (x − a); b−a 126 dann ist ϕ auf [a, b] stetig und auf ]a, b[ differenzierbar mit ϕ(a) = f (a) = ϕ(b). Nach dem Satz von Rolle existiert ein x0 ∈]a, b[ mit ϕ′ (x0 ) = 0, d.h. f ′ (x0 ) − f (b) − f (a) = 0. b−a 2 Folgerung 4.13. Sind fi : [a, b] → R stetige, in ]a, b[ differenzierbare Funktionen mit f1′ (x) = f2′ (x) für alle x ∈ ]a, b[ , so ist f1 = f2 + c mit einer Konstanten c ∈ R. Insbesondere ist f1 konstant, wenn f1′ auf ]a, b[ verschwindet. Beweis: Betrachte ein festes x0 ∈ ]a, b[ und f := f1 − f2 . Ist nun x ∈ [a, b] \ {x0 } beliebig, so erhalten wir aus Folgerung 4.12 mit a = x0 , b = x (oder a = x und b = x0 ): oder f (x) − f (x0 ) = f ′ (ξ) = 0 für ein ξ zwischen x0 und x x − x0 d.h. f (x) = f (x0 ) = f1 (x0 ) − f2 (x0 ) =: c f1 (x) = f2 (x) + c. Mit f2 = 0 erhalten wir die zweite Behauptung. 2 Folgerung 4.14. (Verallgemeinerter Mittelwertsatz) Sind f, g : [a, b] → R stetig und in ]a, b[ differenzierbar, so existiert ein x0 ∈ ]a, b[ mit (f (b) − f (a))g ′(x0 ) = (g(b) − g(a))f ′ (x0 ). Beweis: Betrachte die Funktion ϕ : [a, b] → R mit ϕ(x) = (f (b) − f (a))g(x) − (g(b) − g(a))f (x); dann ist ϕ auf [a, b] stetig und auf ]a, b[ differenzierbar mit ϕ(a) = f (b)g(a) − f (a)g(b) = ϕ(b). Der Satz von Rolle liefert die Behauptung. 2 Folgerung 4.15. Es sei f : [a, b] → R stetig und auf ]a, b[ differenzierbar. a) Ist f ′ (x) ≥ 0 (bzw. f ′ (x) > 0) für alle x ∈ ]a, b[, so ist f monoton (bzw. streng monoton) wachsend. b) Ist f ′ (x) ≤ 0 (bzw. f ′ (x) < 0) für alle x ∈ ]a, b[, so ist f monoton (bzw. streng monoton) fallend. Beweis: Betrachte x1 , x2 ∈ [a, b] mit x1 < x2 ; dann existiert nach Folgerung 4.12 ein x0 ∈ ]x1 , x2 [ mit f (x2 ) − f (x1 ) = (x2 − x1 )f ′ (x0 ). Daraus folgen die Behauptungen. 2 127 Aus Folgerung 4.15 erhalten wir sofort eine hinreichende Bedingung für das Vorliegen eines relativen Extremwertes in einem inneren Punkt des Definitionsbereiches: Satz 4.16. Es sei f : X → R eine Funktion und δ > 0 derart, dass Kδ (x0 ) ⊂ X gilt und f auf Kδ (x0 ) differenzierbar ist mit f ′ (x0 ) = 0. f besitzt an der Stelle x0 ein lokales Maximum bzw. Minimum, wenn gilt: f ′ (x) ≥ 0 für alle x ∈ ]x0 − δ, x0 [ und f ′ (x) ≤ 0 für alle x ∈ ]x0 , x0 + δ[ bzw. f ′ (x) ≤ 0 für alle x ∈ ]x0 − δ, x0 [ und f ′ (x) ≥ 0 für alle x ∈ ]x0 , x0 + δ[. Beweis: Folgerung 4.15 liefert, dass f auf [x0 − δ, x0 ] monoton wachsend bzw. fallend ist und auf [x0 , x0 + δ] monoton fallend bzw. wachsend. Daraus folgt sofort die Behauptung. 2 Beispiel 4.17. Wenden wir das Kriterium aus Satz 4.16 auf die Funktion f : R ∋ x 7→ x4 ∈ R an, so erhalten wir f ′ (0) = 0 und f ′ (x) = 4x3 > 0 für x > 0 sowie f ′ (x) = 4x3 < 0 für x < 0. Also liegt im Punkt x0 = 0 ein relatives Minimum vor. Das sonst häufig benutzte Kriterium mit Hilfe der zweiten Ableitung versagt in diesem Fall. Um dieses Kriterium zu formulieren, benötigen wir den Begriff der höheren Ableitung. 4.3 Höhere Ableitungen. Taylor-Polynome Definition 4.18. Induktiv definieren wir die n-te Ableitung (n ∈ N) einer Funktion f : X → R. f heißt n-mal differenzierbar im Punkt x0 ∈ X, wenn ein δ > 0 derart existiert, dass f : Kδ (x0 ) ∩ X → R auf Kδ (x0 ) ∩ X (n − 1)-mal differenzierbar ist und die (n − 1)-te Ableitung von f in x0 differenzierbar ist. Wir schreiben f (n) dn f (x0 ) (x0 ) = = dxn d dx !n d f (x0 ) = D f (x0 ) := dx n ! dn−1 f (x0 ). dxn−1 f heißt n-mal differenzierbar auf (in) X, wenn f in jedem Punkt x0 ∈ X n-mal differenzierbar ist. Ist die n-te Ableitung f (n) : X → R noch stetig, so heißt f n-mal stetig differenzierbar. Aus formalen Gründen versteht man unter f (0) die Funktion f selbst. In Verallgemeinerung der Produktregel erhalten wir für höhere Ableitungen 128 Satz 4.19. (Leibniz-Regel) Sind f, g : X → R in X n-mal differenzierbar, so ist auch f g n-mal differenzierbar, und es gilt für alle x ∈ X ! n X dn n (n−k) f (x)g (k) (x). (f (x)g(x)) = n k dx k=0 Beweis: Induktion nach n analog zum Beweis des Binomischen Lehrsatzes, Satz 1.19. 2 Beispiele 4.20. a) Für alle n, k ∈ N0 gilt (n) πk (x) = k(k − 1) · . . . · (k − n + 1)xk−n , (k) (n) also speziell πk (x) = k! und πk (x) = 0 für n > k (vollständige Induktion über n). b) Es ist stets exp(n) (x) = exp(x) = ex . c) Es ist d2 2 (2) d d2 (x sin x) = π2 (x) sin x + 2π2′ (x) dx (sin x) + x2 dx 2 (sin x) 2 dx = 2 sin x + 4x cos x − x2 sin x nach Satz 4.19. = (2 − x2 ) sin x + 4x cos x Satz 4.21. (Satz von Taylor) Es seien f : X → R eine Funktion, x0 und x aus X sowie n ∈ N. Mit hx0 , xi =: I bezeichnen wir das kompakte Intervall mit den Eckpunkten x und x0 . Es sei f (n − 1)-mal ◦ stetig differenzierbar auf I und es existiere f (n) für alle z aus dem offenen Intervall I . ◦ Dann existiert ein y0 ∈ I derart, dass gilt: f (x) = n−1 X f (k) (x0 ) f (n) (y0 ) (x − x0 )k + (x − x0 )n . k! n! k=0 ◦ y0 ∈ I läßt sich in der Form y0 = x0 + ϑ(x − x0 ) mit ϑ ∈ ]0, 1[ schreiben. Tn−1 (f, x0 ) : x 7→ n−1 X f (k) (x0 ) (x − x0 )k k! k=0 f (n) (y0 ) heißt Taylorpolynom (n − 1)-ten Grades von f im Punkt x0 und (x − x0 )n heißt n! Lagrange-Restglied. 129 Beweis: Betrachte F : I ∋ y 7→ differenzierbar mit F (x0 ) = und n−1 X ◦ f (k) (y) (x − y)k ; dann ist F auf I stetig und auf I k! k=0 n−1 X f (k) (x0 ) (x − x0 )k , k! k=0 F (x) = f (x) n−1 n−1 X f (k+1) (y) X f (k) (y) d k F (y) = (x − y) − (x − y)k−1 dy k! (k − 1)! k=0 k=1 = f (n) (y) (x − y)n−1 . (n − 1)! ◦ Der verallgemeinerte Mittelwertsatz liefert mit g(y) = (x − y)n die Existenz eines y0 ∈ I mit (F (x) − F (x0 ))g ′(y0 ) = (g(x) − g(x0 ))F ′ (y0 ) d.h. f (x) − n−1 X −(x − x0 )n f (n) (y0) f (k) (x0 ) (x − x0 )k = (x − y0 )n−1 n−1 k! −n(x − y0 ) (n − 1)! k=0 = f (n) (y0 ) (x − x0 )n . n! 2 Wir wenden Satz 4.21 bei einem hinreichenden Kriterium für das Vorliegen eines relativen Extremums an: Satz 4.22. (Hinreichendes Kriterium für lokale Extrema) Sei f : [a, b] → R n-mal stetig differenzierbar auf [a, b], und es gelte für ein x0 ∈ ]a, b[: f ′ (x0 ) = f (2) (x0 ) = . . . = f (n−1) (x0 ) = 0, aber f (n) (x0 ) 6= 0. Dann besitzt f für gerades n ∈ N in x0 ein relatives Extremum, und zwar i) ein lokales Minimum, wenn f (n) (x0 ) > 0 und ii) ein lokales Maximum, wenn f (n) (x0 ) < 0 ist. Ist n ungerade, so ist f in einer Umgebung von x0 streng monoton, besitzt also dort kein relatives Extremum. Beweis: Aus Satz 4.21 folgt: f (x) = f (x0 ) + (x − x0 )n (n) f (x0 + ϑ(x − x0 )) n! mit ϑ ∈ ]0, 1[. Sei nun o.B.d.A. f (n) (x0 ) > 0; dann existiert ein δ > 0 mit f (n) (x) > 0 für alle a ≤ x0 − δ < x < x0 + δ ≤ b 130 (Stetigkeit von f (n) ). Daher ist f (n) (x0 + ϑ(x − x0 )) > 0 für alle x0 − δ < x < x0 + δ. 1. Fall: Ist n gerade, so ist (x − x0 )n ≥ 0 für alle x, also f (x) ≥ f (x0 ) für alle x0 − δ < x < x0 + δ . 2. Fall: Ist n ungerade, so betrachten wir das Taylorpolynom (n − 2)-ten Grades von f ′ im Punkt x0 , d.h. f ′ (x) = n−2 X f (n) (x0 + ϑ(x − x0 )) f (k+1) (x0 ) (x − x0 )k + (x − x0 )n−1 k! (n − 1)! k=0 mit ϑ ∈ ]0, 1[. Daher ist also für alle x0 − δ < x < x0 + δ f (n) (x0 + ϑ(x − x0 )) f ′ (x) = (x − x0 )n−1 (n − 1)! >0 für =0 für x 6= x0 x = x0 . Somit ist f in [x0 − δ, x0 + δ] gemäß Folgerung 4.15 streng monoton wachsend. 2 4.4 Konvexe und konkave Funktionen Definition 4.23. f : X → R heißt (streng) konvex, wenn für alle x1 , x2 ∈ X und alle λ ∈ ]0, 1[ gilt (<) f (λx1 + (1 − λ)x2 ) ≤ λf (x1 ) + (1 − λ)f (x2 ). f heißt konkav, wenn −f konvex ist. Ist x1 < x2 , so bedeutet die Konvexitätsbedingung, dass der Graph von f in [x1 , x2 ] unterhalb der Sekante durch (x1 , f (x1 )) und (x2 , f (x2 )) liegt (vgl. Abbildung). Satz 4.24. ◦ ◦ Es sei f : X → R stetig und im Inneren X differenzierbar. Ist f ′ auf X (streng) monton wachsend bzw. fallend, so ist f auf X (streng) konvex bzw. konkav. Beweis: Seien x1 , x2 ∈ X und λ ∈ ]0, 1[ vorgegeben und o.B.d.A. gelte x1 < x2 . Wir setzen x := λx1 + (1 − λ)x2 und beachten x2 − x1 = (1 − λ)(x2 − x1 ), x2 − x1 = λ(x2 − x1 ). Nach dem Mittelwertsatz existieren nun Punkte y1 ∈ ]x1 , x[ und y2 ∈ ]x, x2 [ mit f (x) − f (x1 ) = f ′ (y1 )(x − x1 ), f (x2 ) − f (x) = f ′ (y2 )(x2 − x). (∗) 131 Abbildung 27: Konvexe Funktion Hieraus und aus (∗) folgt f (x) = λf (x) + (1 − λ)f (x) = λ[f (x1 ) + f ′ (y1 )(x − x1 )] + (1 − λ)[f (x2 ) − f ′ (y2 )(x2 − x)] = λf (x1 ) + (1 − λ)f (x2 ) + λ(1 − λ)(x2 − x1 )[f ′ (y1 ) − f ′ (y2 )]. Aus y1 < y2 folgen nun die Behauptungen. 2 Anwendung von Folgerung 4.15 liefert aus Satz 4.24 sofort Satz 4.25. ◦ Es sei f : X → R stetig und im Inneren X von X zweimal differenzierbar. (>) ◦ a) Ist f ′′ (x) ≥ 0 für alle x ∈ X , so ist f (streng) konvex. (<) ◦ b) Gilt f ′′ (x) ≤ 0 für alle x ∈ X , so ist f (streng) konkav. Beispiele 4.26. ′ (x) = 2nx2n−1 ist dort streng monoton a) π2n , n ∈ N, ist streng konvex auf R, denn π2n wachsend. π2n+1 , n ∈ N, ist streng konkav auf ]−∞, 0[ und streng konvex auf [0, ∞[. b) fα : [0, ∞[ ∋ x 7→ xα ist streng konvex auf [0, ∞[ für α > 1 und streng konkav für 0 < α < 1 wegen (xα )′′ = α(α − 1)xα−2 für x > 0. c) ln : ]0, ∞[ → R ist streng konkav wegen 1 d2 ln(x) = − 2 . 2 dx x 132 4.5 Grenzwertbestimmung mittels Differentiation Satz 4.27. (Regel von de l’Hospital) ◦ ◦ Es seien f, g : X → R differenzierbar auf X mit g ′ (x) 6= 0 für alle x ∈ X = ]a, b[ (evtl. a = −∞ oder b = ∞). Gilt eine der Voraussetzungen: a) lim f (x) = lim g(x) = 0, x→a+ x→a+ b) lim f (x) = ±∞, lim g(x) = ±∞, x→a+ x→a+ dann ist f (x) f ′ (x) = lim ′ , x→a+ g(x) x→a+ g (x) lim falls der rechtsstehende Limes im eigentlichen oder uneigentlichen Sinne existiert. Eine entsprechende Aussage gilt für x → b−. Beweis: 1. Fall: Es treffe a) zu und es sei a ∈ R. Definiere F (x) := f (x) für x>a 0 für x=a , G(x) := g(x) für x>a 0 für x = a, dann sind F und G stetig auf [a, b[ und differenzierbar auf ]a, b[. Der verallgemeinerte MWS liefert für x ∈ ]a, b[ : f (x) F (x) − F (a) F ′ (a + ϑ(x − a)) = = ′ mit ϑ ∈ ]0, 1[ g(x) G(x) − G(a) G (a + ϑ(x − a)) Mit x → a+ gilt auch a + ϑ(x − a) → a+; daraus folgt die Behauptung. Entsprechend folgt die Behauptung für b ∈ R und x → b−. 2. Fall: Es treffe a) zu und es sei a = −∞; wir setzen f1 (y) := f dann gilt mit h(x) = x1 : 1 y und g1 (y) := g 1 y ; − x12 · f1′ x1 f1′ x1 (f1 ◦ h)′ (x) f ′ (x) = = = g ′ (x) (g1 ◦ h)′ (x) − x12 · g1′ x1 g1′ x1 Mit x → −∞ gilt x1 → 0− und die Behauptung folgt dann aus dem 1. Fall. Ist b = ∞, so führt die Transformation h auf x1 → 0+ für x → +∞. 3. Fall: Es treffe b) zu und es sei a ∈ R. O.B.d.A. sei g(x) 6= 0 für alle x ∈ Kδ (a) ∩ X. Dann gilt nach dem verallgemeinerten MWS (∗) f (x0 ) g(x0 ) f (x) = + 1− g(x) g(x) g(x) mit ϑ ∈ ]0, 1[ bei festen x, x0 ∈ Kδ (a) ∩ X. ! f ′ (x0 + ϑ(x − x0 )) g ′(x0 + ϑ(x − x0 )) 133 f ′ (x) = α ∈ R; δ > δ0 > 0 so gewählt, dass zu vorgegebenem ε > 0 x→a+ g ′ (x) f ′ (x) gilt: ′ − α < ε für alle a < x < a + δ0 . Mit x, x0 ∈ ]a, a + δ0 [ ist dann auch g (x) x0 + ϑ(x − x0 ) ∈ ]a, a + δ0 [ für jedes ϑ ∈ ]0, 1[, also wegen (∗): (i) Sei lim f (x0 ) g(x0 ) f (x) −α = + 1− g(x) g(x) g(x) oder f (x) g(x) − α ≤ ! ! f ′ (x0 + ϑ(x − x0 )) g(x0 ) − α − α g ′ (x0 + ϑ(x − x0 )) g(x) f (x ) 0 + 1 − g(x) g(x0 ) ε + |α| g(x) g(x ) 0 g(x) . Bei nun festgehaltenem x0 können wir wegen lim |g(x)| = ∞ ein δ1 > 0 so wählen, x→a+ dass für alle x ∈ ]a, a + δ1 [ gilt: Damit ist für solche x d.h. f (x ) 0 g(x) f (x) g(x) < ε und − α g(x ) 0 g(x) < ε. < ε + (1 + ε)ε + |α|ε, lim x→a+ f (x) = α. g(x) f ′ (x) = ∞, so sei δ > δ0 > 0 so gewählt, dass zu vorgegebenem M > 0 (ii) Ist lim ′ x→a+ g (x) f ′ (x) gilt: ′ > M für alle a > x < a + δ0 . δ1 > 0 wird dann so gewählt, dass für alle g (x) x ∈ ]a, a + δ1 [ gilt: g(x0 ) 1 f (x0 ) > −1 und 1 − > . g(x) g(x) 2 Dann folgt für solche x: f (x) 1 > −1 + M, g(x) 2 also f (x) = ∞. x→a+ g(x) lim Völlig analog wird der Fall a = −∞ behandelt. Ebenso wird der Fall x → b− bewiesen. 2 134 Beispiel 4.28. Betrachte ex − e−x ; x→0 x lim es ist d x (e − e−x ) = ex + e−x dx also und d (x) = 1 , dx ex − e−x ex + e−x = lim =2. x→0 x→0 x 1 lim Damit folgt z.B. ex − e−x ex + e−x − 2 ex − e−x = lim = 2. = lim (1 + x) x→0 1 − 1 x→0 x→0 x − ln(1 + x) x 1+x lim In Ergänzung zu Abschnitt 3.7 betrachten wir die Umkehrfunktionen der trigonometrischen Funktionen: Beispiele 4.29. (Umkehrfunktionen der trigonometrischen Funktionen) (i) Die Funktion sin ist in [− π2 , π2 ] streng monton wachsend und bildet [− π2 , π2 ] bijektiv auf [−1, 1] ab. Für die zugehörige Umkehrfunktion, genannt Arcussinus, gilt 1 d Arc sin y = √ dy 1 − y2 (−1 < y < 1). (ii) Die Funktion cos ist in [0, π] streng monoton fallend und bildet [0, π] bijektiv auf [−1, 1] ab, für die zugehörige Umkehrfunktion, genannt Arcuscosinus, gilt d −1 Arc cos y = √ dy 1 − y2 (−1 < y < 1). Bemerkung. Die in Beispiel 4.29 definierten Funktionen Arcussinus und Arcuscosinus nennt man Hauptzweige von arc sin, arc cos, arc tan. Für beliebige k ∈ Z gilt: a) sin bildet [− π2 + kπ, π2 + kπ] bijektiv auf [−1, 1] ab. b) cos bildet [kπ, (k + 1)π] bijektiv auf [−1, 1] ab. Die zugehörigen Umkehrfunktionen heißen für (festes) k 6= 0 Nebenzweige von arc sin, arc cos. 135 Abbildung 28: Umkehrfunktionen der trigonometrischen Funktionen § 5 Integration Vorbemerkungen Unser nächstes Ziel besteht darin, einer krummlinig begrenzten Fläche eine Flächenmaßzahl zuzuordnen. Dabei wollen wir uns der Einfachheit halber zunächst auf solche Flächen einschränken, die durch die x-Achse, zwei zur y-Achse parallele Geraden durch die Punkte (a, 0) und (b, 0) mit a < b und den Graphen einer beschränkten, auf dem Intervall [a, b] definierten, dort nichtnegativen Funktion f eingeschlossen werden. Sei T ([a, b]) := {ϕ | ϕ : [a, b] → R Treppenfunktion } der Vektorraum aller Treppenfunktionen auf [a, b]; siehe Beispiel 3.2 e). Sei ϕ ∈ T [a, b] := T ([a, b]) sowie Z1 : a = x0 < x1 < . . . < xn = b eine Zerlegung von [a, b] mit ϕ(x) = ck ∀ x ∈ (xk−1 , xk ), 1 ≤ k ≤ n. Dann ist Z Z n ϕ := b a X ϕ(x)dx := k=1 ck (xk − xk−1 ) unabhängig von der Zerlegung Z1 und heißt das Integral von ϕ. Bemerkung: Ist ϕ(x) ≥ 0 ∀ x ∈ [a, b], so ist und Gf . Z b a ϕ(x)dx die Fläche zwischen der x-Achse Sei f : [a, b] → R beschränkt. Dann heißt Z f := Z b a f (x)dx := inf Z b a ϕ(x)dx | ϕ ∈ T [a, b], ϕ ≥ f 136 Abbildung 29: Integral einer Treppenfunktion Oberintegral von f und Z f := Z b f (x)dx := sup a Z b a ϕ(x)dx | ϕ ∈ T [a, b], ϕ ≤ f Unterintegral von f . f heißt (Riemann)-integrierbar (kurz:f ∈ R[a, b]), wenn diesem Fall Z f := Z b a f (x)dx := Z Z b a f = Z b f , und man setzt in a f =: Integral von f (über [a, b]). Man kann zeigen: f : [a, b] → R ist genau dann integrierbar, wenn zu jedem ε > 0 Treppenfunktionen ϕ, ψ ∈ T [a, b] existieren mit ϕ ≤ f ≤ ψ und Z ψ− Z ϕ ≤ ε. 5.1 Integration und Differentiation Definition und Satz 5.1. Im Folgenden sei der Definitionsbereich I einer reellwertigen Funktion f : I → R entweder ein beschränktes Intervall mit den Eckpunkten a und b oder ein Halbstrahl der Form ] − ∞, b] , ] − ∞, b[ , [a, ∞[ bzw. ]a, ∞[ oder ganz R. F : I → R heißt Stammfunktion oder unbestimmtes Integral von f in I, wenn für alle x ∈ I gilt: F ′ (x) = f (x) . R Wir schreiben statt F auch f (x) dx. Besitzt f auf I eine Stammfunktion, so ist f (Riemann)-integrierbar (über jedes Intervall [α, β] ⊂ I); ferner heißt F (β) − F (α), α, β ∈ I beliebig, das bestimmte Integral über f von α bis β , und es gilt (sog. Hauptsatz der Differential- und Integralrechnung) Z β α β f (x) dx = F (β) − F (α) =: F (x) . α Satz 5.2. Ist F eine Stammfunktion zu f auf I, so ist {F + cπ0 | c ∈ R} die Gesamtheit aller Stammfunktionen von f in I. 137 Beweis: Mit F ist auch F +cπ0 eine Stammfunktion zu f . Ist umgekehrt F0 eine beliebige Stammfunktion von f , so gilt gemäß Definition: (F0 − F )′ (x) = 0 für alle x ∈ I. Gemäß Folgerung 4.13 ist dann F0 − F konstant. 2 Bemerkungen 5.3. Sind F, G Stammfunktionen von f in I und sind α, β ∈ I beliebig, so gilt nach Satz 5.2 mit einer geeigneten Konstanten c ∈ R: G(x) = F (x) + c für alle x ∈ I , also Z β α f (x) dx = F (β) − F (α) = (F (β) + c) − (F (α) + c) = G(β) − G(α) . Demnach ist das bestimmte Integral über f von α bis β unabhängig von der speziellen Wahl der Stammfunktion. Mit den Ableitungen der in §3 und §4 betrachteten Funktionen erhalten wir: Beispiele 5.4. Z xr dx = Z 1 dx = ln |x| auf einem Intervall, das 0 nicht enthält, x Z ex dx = ex , Z sin x dx = − cos x, Z cos x dx = sin x, Z 1 π dx = tan x für |x| < , 2 cos x 2 Z 1 dx = − cot x für 0 < x < π, sin2 x Z √ Z 1 dx = Arc tan x, 1 + x2 1 r+1 x für r 6= −1, r+1 1 dx = Arc sin x für |x| < 1, 1 − x2 Z X n k=0 ak xk dx = n X ak k+1 x , k=0 k + 1 138 und damit z.B. Z 1 −1 1 (1 − 2x + 3x2 ) dx = x − x2 + x3 = 4. −1 Wir halten ein paar Eigenschaften des Integrals fest: Satz 5.5. Es sei F eine Stammfunktion von f bzw. G eine Stammfunktion von g auf I; ferner seien c, d ∈ R beliebig sowie α, β, γ ∈ I beliebig. Dann gilt: a) Z und Z β α (cf + dg)(x) dx = c (cf + dg)(x) dx = c Z Z f (x) dx + d β α Z f (x) dx + d g(x) dx Z β g(x) dx α (Linearität des Integrals) b) Z β α Z f (x) dx = γ α f (x) dx + Z β γ f (x) dx (Intervall-Additivität) c) Z β α f (x) dx = − Z α β f (x) dx und Z α α f (x) dx = 0 . Beweis: Zu a): Die Behauptungen folgen aus (cF + dG)′ = cF ′ + dG′ = cf + dg . Zu b) und c): Es ist Z β α f (x) dx = F (β) − F (α) = (F (γ) − F (α)) + (F (β) − F (γ)) = und Z β α Z f (x) dx = F (β) − F (α) = −(F (α) − F (β)) = − γ α Z f (x) dx + α β Z γ β f (x) dx f (x) dx 2 Bemerkung 5.6. Das bestimmte Integral Z β α f (x) dx läßt sich (wie bereits aus den Vorbemerkungen zu §5 folgt) deuten als Inhalt der Fläche, die von der x−Achse, dem Graphen von f und den beiden Geraden x = α und x = β 139 mit α < β berandet wird. Hierbei sind die Maßzahlen der Flächen, die oberhalb der x−Achse liegen, positiv und entsprechend die der Flächen, die unterhalb der x−Achse liegen, negativ. Wir können uns dies auch folgendermaßen klar machen: Ist α < β und f ≥ 0 auf [α, β] integrierbar mit Stammfunktion F , so unterteilen wir [α, β] in Teilintervalle α = x0 < x1 < . . . < xn−1 < xn = β . Dann gilt wegen der Intervalladditivität Z β α f (x) dx = n−1 X Z xk+1 k=0 xk f (x) dx = n−1 X k=0 (F (xk+1 ) − F (xk )) . Da F auf [α, β] differenzierbar ist, gibt es nach dem Mittelwertsatz der Differentialrechnung ein tk ∈]xk , xk+1[ mit F (xk+1 ) − F (xk ) = F ′ (tk )(xk+1 − xk ) = f (tk )(xk+1 − xk ) . Also folgt Z β α f (x) dx = n−1 X k=0 f (tk )(xk+1 − xk ) ; dabei nennt man die rechte Seite dieser Identität eine Riemann-Summe. Liegen die Teilpunkte nahe genug beieinander, so ist der Flächeninhalt der Fläche, die von der x−Achse, dem Graphen von f und den beiden Geraden x = xk und x = xk+1 berandet wird, ungefähr gleich dem Flächeninhalt des Rechtecks der Breite xk+1 − xk und der Höhe f (tk ). Bemerkung 5.7. Man kann zeigen: Ist I = [a, b] und f auf I stetig, so besitzt f auf I eine Stammfunktion F . Mit Hilfe der Überlegungen aus Bemerkung 5.6 läßt sich F als Flächeninhaltsfunktion definieren. Eine weitere Möglichkeit zur Berechnung von Stammfunktionen bietet die Produktregel der Differentiation. Satz 5.8. (Partielle Integration) Es seien f und g auf I = [a, b] stetig differenzierbare Funktionen. Dann gilt für beliebige α, β ∈ I: Z Z β α β f (x)g ′ (x)dx = f (x)g(x) − α β α f ′ (x)g(x)dx. Beweis: Mit h = f · g gilt nach der Produktregel h′ = f ′ g + f g ′ , also Z β α β h′ (x) dx = h(β) − h(α) = f (x)g(x) α und andererseits wegen der Linearität des Integrals Z β α h′ (x) dx = Z β α f ′ (x)g(x) dx + Z β α f (x)g ′(x) dx . 140 2 Beispiele 5.9. Für 0 < a < b gilt mit g ′ = π0 und f = ln Z b a ln x dx = Z b a 1 · ln x dx b = x ln x − a = Für beliebige a, b ∈ R gilt Z b a 2 sin x dx = b x ln x a Z b a 1 dx x x· b b − x = x(ln x − 1) . a a b − sin x cos x a b + = − sin x cos x + a Z b Z b a a b cos2 x dx (1 − sin2 x) dx = (x − sin x cos x) − a in Form einer Stammfunktion also 2 und damit Z Z Z b a sin2 x dx, sin2 x dx = x − sin x cos x 1 sin2 x dx = (x − sin x cos x). 2 2 Als Umkehrung der Kettenregel erhalten wir Satz 5.10. (Substitutionsregel) Es seien I ein Intervall gemäß Definition 5.1, f : I → R stetig und ϕ : [a, b] → R stetig differenzierbar mit ϕ([a, b]) ⊂ I. Dann gilt Z b a ′ f (ϕ(t))ϕ (t)dt = Z ϕ(b) ϕ(a) f (x)dx. Ist ϕ injektiv (z.B. ϕ′ (t) 6= 0 für alle t ∈ ]a, b[ ), so gilt für alle α, β ∈ ϕ([a, b]): Z β α f (x)dx = Z ϕ−1 (β) ϕ−1 (α) f (ϕ(t))ϕ′ (t)dt. 141 Beweis: Ist F eine Stammfunktion von f auf I, so gilt nach der Kettenregel für die Funktion F ◦ ϕ : [a, b] → R: (F ◦ ϕ)′ (t) = F ′ (ϕ(t))ϕ′ (t) = f (ϕ(t))ϕ′(t). Daraus folgt Z b a f (ϕ(t))ϕ′(t)dt = (F ◦ ϕ)(b) − (F ◦ ϕ)(a) = F (ϕ(b)) − F (ϕ(a)) Z = ϕ(b) f (x)dx. ϕ(a) 2 Beispiele 5.11. Ist ϕ : [a, b] → R stetig differenzierbar mit ϕ(t) 6= 0 für alle t ∈ [a, b], so gilt mit f (x) = Z b a 1 x Z ϕ(b) ϕ′ (t) dx ϕ(b) dt = = ln |x| ϕ(a) ϕ(t) ϕ(a) x b = ln |ϕ(t)| . a Z β √ e x dx zu berechnen. Wir setzen x = ϕ(t) = t2 für Für 0 < α < β sei α dann ist wegen der Injektivität von ϕ Z √ Z β α √ e x dx = = β √ α t = 2e α≤t≤ √ β, et 2t dt √β t 2 te √ √ α − Z √ √ √ β (t − 1) √ α α β et dt √ = 2e x β √ ( x − 1) . α Als Merkregel halten wir hier fest: dx = 2t oder dx = 2t dt. Damit folgt Ist x = ϕ(t) = t2 , so gilt dt Z √ e x dx = Z √ et 2t dt = 2et (t − 1) = 2e x √ ( x − 1) . 2 142 5.2 Integration rationaler Funktionen Wir gehen von einer rationalen Funktion D ∋ x 7→ R(x) = P (x) ∈R Q(x) mit Polynomen P und Q sowie D = {x ∈ R | Q(x) 6= 0} aus. Ist Grad P ≥ Grad Q (also R unecht rational ), lässt sich R durch Polynomdivision in der Form R(x) = P1 (x) + P2 (x) Q(x) mit Polynomen P1 , P2 darstellen, wobei Grad P2 < Grad Q ist (P2 /Q ist echt rational ). Zu P1 kann gemäß Beispiel 5.4 eine Stammfunktion berechnet werden. Um für P2 /Q eine Stammfunktion zu finden, stellen wir eine Partialbruchzerlegung von P2 /Q her. Dazu benötigen wir die Nullstellen von Q. In diesem Zusammenhang halten wir die folgenden Sätze fest: Satz 5.12. (Fundamentalsatz der Algebra) a) Ist Q = n X k=0 ak πk mit ak ∈ C und an 6= 0 ein (komplexes) Polynom vom Grad n ≥ 1, so lässt sich Q mit Hilfe seiner verschiedenen Nullstellen z1 , . . . , zm ∈ C in der Form Q(z) = an m Y µ=1 (z − zµ )νµ , z ∈ C, darstellen, wobei die νµ ∈ N eindeutig bestimmt sind mit Vielfachheit der Nullstelle zµ .) m X νµ = n. ( νµ heißt µ=1 b) Sind alle Koeffizienten ak von Q reell mit an 6= 0, so ist mit zµ stets auch z µ eine Nullstelle von Q mit gleicher Vielfachheit. Fassen wir die Produkte mit zµ und z µ zusammen, so erhalten wir für x ∈ R die Darstellung Q(x) = an s Y (x − xj )kj j=1 mit kj , mℓ ∈ N sowie s X j=1 kj + 2 r Y (x2 + Aℓ x + Bℓ )mℓ ℓ=1 r X mℓ = n. ℓ=1 Dabei sind x1 , . . . , xs die verschiedenen reellen Nullstellen von Q, und keines der unter sich verschiedenen Polynome x 7→ x2 + Aℓ x + Bℓ mit Aℓ , Bℓ ∈ R hat eine reelle Nullstelle. 143 Satz 5.13. (Partialbruchzerlegung) Gegeben sei eine rationale Funktion P2 /Q mit reellen Polynomen P2 und Q, es gelte Grad P2 < Grad Q. Hat Q die Darstellung aus Satz 5.12 b), so lässt sich P2 /Q in folgender Form zerlegen: k mℓ j s X r X X P2 (x) X Ajν Bℓµ x + Cℓµ an = + . ν 2 µ Q(x) j=1 ν=1 (x − xj ) ℓ=1 µ=1 (x + Aℓ x + Bℓ ) Die Berechnung der Koeffizienten Ajν , Bℓµ und Cℓµ ist auf (mindestens) drei Arten möglich: i) durch Koeffizientenvergleich, ii) durch Einsetzen spezieller Werte, iii) durch die Grenzwertmethode. Wir werden diese drei Verfahren an Beispielen erläutern. Beispiele 5.14. a) Sei x2 + 2x + 3 ; (x − 1)2 (x + 1)2 dann erhalten wir gemäß Satz 5.13 die Partialbruchzerlegung R(x) = (∗) R(x) = A11 A12 A21 A22 + + + , 2 x − 1 (x − 1) x + 1 (x + 1)2 nach Multiplikation mit dem Hauptnenner N(x) folgt für alle x ∈ R (!) (∗∗) R(x)N(x) = A11 (x−1)(x+1)2 +A12 (x+1)2 +A21 (x−1)2 (x+1)+A22 (x−1)2 . Zum Koeffizientenvergleich wird ausmultipliziert x2 +2x+3 = A11 (x3 +x2 −x−1)+A12 (x2 +2x+1)+A21 (x3 −x2 −x+1)+A22 (x2 −2x+1), es ist also A11 A11 + + A21 = 0 A12 − A21 + A22 = 1 A12 + A21 + A22 = 3 −A11 + 2A12 − A21 − 2A22 = 2 −A11 + Der Gauß-Algorithmus, angewandt auf die erweiterte Koeffizientenmatrix des obigen Gleichungssystems mit den Unbekannten A11 , A12 , A21 , A22 , liefert die Dreiecksgestalt: 1 0 1 0 0 0 1 −2 1 1 0 0 1 −1 0 0 0 0 4 2 144 und damit 1 A22 = , 2 A21 = 3 A12 = , 2 1 A11 = − . 2 1 2 Durch Einsetzen von vier verschiedenen Werten (besonders zu empfehlen sind die Nullstellen des Nenners von R) in (∗∗) erhalten wir ebenfalls vier Gleichungen mit vier Unbekannten und dann nach dem Gauß-Algorithmus wieder die obige Lösung. Um die Grenzwertmethode anzuwenden, multipliziere man (∗) mit (x − 1)2 , d.h. " # A21 A22 A11 x2 + 2x + 3 , = A12 + (x − 1)2 + + 2 (x + 1) x − 1 x + 1 (x + 1)2 und hieraus folgt x2 + 2x + 3 3 = . 2 x→1 (x + 1) 2 A12 = lim Entsprechend folgt x2 + 2x + 3 1 = . x→−1 (x − 1)2 2 A22 = lim Durch Substitution der Terme R∗ (x) = − A22 A12 und von R(x) erhalten wir 2 (x − 1) (x + 1)2 1 A11 A21 = + (x − 1)(x + 1) x−1 x+1 und hieraus A11 = lim − x→1 1 1 =− x+1 2 sowie A21 = lim − x→−1 1 1 = . x−1 2 b) Sei R(x) = nun gilt x3 x−2 ; − 3x2 + 4x − 2 x3 − 3x2 + 4x − 2 = (x − 1)(x − (1 + i))(x − (1 − i)) = (x − 1)(x2 − 2x + 2). Damit lautet die Partialbruchzerlegung R(x) = B11 x + C11 A11 + 2 ; x − 1 x − 2x + 2 145 also gilt x − 2 = A11 (x2 − 2x + 2) + (B11 x + C11 )(x − 1) = (A11 + B11 )x2 + (−2A11 − B11 + C11 )x + 2A11 − C11 . Koeffizientenvergleich liefert A11 + B11 = 0 −2A11 − B11 + C11 = 1 − C11 = −2 2A11 Als Lösung erhalten wir A11 = −1, B11 = 1, C11 = 0. 2 Gemäß Satz 5.13 kann also die Integration (echt) rationaler Funktionen auf die Integration einiger einfacher Funktionen zurückgeführt werden; es gilt i) Z A dx = A · ln |x − xj |, x − xj ii) Z A A dx = (x − xj )−ν+1 für ν > 1, ν (x − xj ) −ν + 1 iii) Z Z Bx + C BZ 2x + 2α dx dx = dx + (C − Bα) , (x2 + 2αx + β)k 2 (x2 + 2αx + β)k (x2 + 2αx + β)k wobei x2 + 2αx + β > 0 ist für alle x ∈ R. Zunächst gilt nach Beispiel 5.11 Z x2 2x + 2α dx = ln(x2 + 2αx + β) + 2αx + β und mittels Substitution y = x2 + 2αx + β folgt Z (x2 2x + 2α 1 dx = (x2 + 2αx + β)−k+1 für k > 1. k + 2αx + β) −k + 1 Es bleibt noch das Integral für x ∈ R folgt Z dx zu bestimmen. Wegen x2 + 2αx + β > 0 (x2 + 2αx + β)k x+α x + 2αx + β = (β − α ) √ β − α2 2 2 !2 + 1 146 mit β − α2 > 0. Wir substituieren x = ϕ(t) = t · d.h. q β − α2 − α x+α ; t= √ β − α2 dann gilt: Z Z Z q 1 dx dt β − α2 dt = K = . 2 k 2 2 k 2 (x + 2αx + β) ((β − α )(t + 1)) (t + 1)k Für das verbleibende Integral lässt sich eine Rekursionsformel herleiten, es gilt für k > 1: Ik := Z Z Z dt t2 dt = − dt (t2 + 1)k (t2 + 1)k−1 (t2 + 1)k = Ik−1 − Z 2t t · 2 dt 2 (t + 1)k (partielle Integration) t 1 1 1 = Ik−1 − (t2 + 1)−k+1 − 2 (−k + 1) 2 (−k + 1) = Z dt 2 (t + 1)k−1 ! ! t 1 1 1 Ik−1 − (t2 + 1)−k+1. 1+ 2 (−k + 1) 2 (−k + 1) Beginn der Rekursion ist I1 = Z t2 Z dx 3 + x−1 2 dt = arctan t. +1 Beispiele 5.15. a) Gemäß Beispiel 5.14 a) gilt: Z x2 + 2x + 3 1 dx = − 2 2 (x − 1) (x + 1) 2 Z dx 1 + 2 (x − 1) 2 Z dx 1 + x+1 2 Z dx (x + 1)2 3 1 1 1 1 1 = − ln |x − 1| − · + ln |x + 1| − · 2 2 x−1 2 2 x+1 1 x + 1 2x + 1 − ln . = 2 x − 1 x2 − 1 b) Für das Beispiel aus 5.14 b) folgt Z Z Z x−2 dx xdx dx = − + 3 2 2 x − 3x + 4x − 2 x−1 x − 2x + 2 = − ln |x − 1| + 1 2 Z 2x − 2 dx + 2 x − 2x + 2 Z dx (x − 1)2 + 1 Z dt 1 2 = − ln |x − 1| + ln(x − 2x + 2) + 2 2 t +1 = − ln |x − 1| + (t = x − 1) 1 ln(x2 − 2x + 2) + arctan(x − 1). 2 147 5.3 Uneigentliche Integrale Ziel: Integration unbeschränkter Funktionen, Integration über unendliche Intervalle. Der Interpretation des bestimmten Integrals als Flächenmaßzahl liegen im Wesentlichen zwei Voraussetzungen zugrunde: Erstens ist der Integrationsbereich [a, b] beschränkt und zweitens ist die zu integrierende Funktion beschränkt. In gewissen Fällen kann auf diese Voraussetzungen verzichtet werden; dann gelangt man zu den sog. uneigentlichen Integralen. Wir betrachten drei Fälle: (i) Eine Integrationsgrenze ist unendlich. (ii) Der Integrand ist an einer Integrationsgrenze nicht definiert. (iii) Beide Integrationsgrenzen sind kritisch. Abbildung 30: Uneigentliche Integrale Wir betrachten zunächst drei Beipiele: Beipiele 5.16. F (x) := Z G(x) := Z aber lim x −t e 0 x Z 1 x→0+ x Definition 5.17. dt = −e = 1 − e−x =⇒ lim F (x) = 1, x→∞ dt √ = t 1 x −t √ 1 2 t x 0 = 2(1 − √ x) =⇒ lim G(x) = 2, x→0+ 1 dt = lim log t = lim (− log x) = +∞. x→0+ x→0+ t x Es sei f : [a, ∞[ → R über jedem Intervall [a, b] mit b > a integrierbar. Existiert der Grenzwert Z b lim f (x)dx, b→∞ a 148 so heißt das Integral Z ∞ a f (x)dx konvergent und man setzt für dessen Wert Z ∞ a f (x)dx := lim Z b b→∞ a f (x)dx. Existiert der Grenzwert nicht, so heißt das uneigentliche Integral Existiert lim Z b b→∞ a Z ∞ a f (x)dx divergent. |f (x)|dx, so heißt das uneigentliche Integral absolut konvergent. Analog definiert man im Fall f : ] − ∞, b] → R das uneigentliche Integral Beispiel 5.18. Z konvergiert genau dann, wenn s > 1 ist. ∞ 1 Z b f (x)dx. −∞ dx xs Beweis: Es gilt für beliebiges b > 1: Z b 1 b1−s 1 − für s 6= 1 dx 1 − s 1 − s = xs ln b für s = 1 Durch Grenzübergang b → ∞ ergibt sich sofort die Behauptung. 2 Zwischen uneigentlichen Integralen und Reihen besteht ein enger Zusammenhang. Satz 5.19. (Integralkriterium für unendliche Reihen) Ist für ein n0 ∈ N die Funktion f : [n0 , ∞[ → R nichtnegativ und monoton fallend und besitzt f auf jedem Intervall [n0 , R] mit R > n0 eine Stammfunktion, so konvergiert das uneigentliche Integral Z ∞ n0 f (x)dx genau dann, wenn die Reihe ∞ X f (k) konvergiert. k=n0 Beweis: Aus f (k) ≤ f (x) ≤ f (k − 1) für k − 1 ≤ x ≤ k folgt f (k) ≤ Z k k−1 f (x)dx ≤ f (k − 1), also N X (∗) k=n0 +1 f (k) ≤ Z N n0 f (x)dx ≤ N −1 X f (k) k=n0 für alle N > n0 . >: Ist gent. Z ∞ n0 f (x)dx konvergent, so ist nach (∗) die Reihe ∞ X k=n0 f (k) beschränkt, also konver- 149 <: Ist ∞ X f (k) konvergent, so folgt aus (∗), dass mit einer Konstanten K > 0 für alle k=n0 t ≥ n0 gilt: Z t n0 f (x)dx ≤ K. Die Funktion F (t) := Z t n0 f (x)dx ist also monoton wachsend und beschränkt. Sei s = sup F (t) und ǫ > 0. Dann existiert t≥n0 ein t0 ∈ R mit s − ǫ < F (t0 ) ≤ s , also gilt für alle t ≥ t0 s − ǫ < F (t) ≤ s , daher ist s = lim F (t). 2 t→∞ Beispiel 5.20. ∞ X 1 auf Konvergenz; zunächst ist f : [2, ∞[ ∋ x 7→ x · ln x n=2 n · ln(n) 1 monoton wachsend, also g = monoton fallend, und wir erhalten f Wir untersuchen Z 2 ∞ dx = x ln x = lim Z b b→∞ 2 b dx = lim ln(ln x) 2 x ln x b→∞ lim ln(ln b) − ln(ln 2) = ∞. b→∞ Also divergiert die obige Reihe. Wir untersuchen nun den oben angegebenen Fall (ii): Definition 5.21. Es sei f : ]a, b] → R eine Funktion, die über jedem Teilintervall [α, b] mit a < α < b integrierbar ist. Existiert der Grenzwert lim Z b α→a+ α so heißt das Integral Z b a f (x)dx, f (x)dx konvergent und man setzt Z b a f (x)dx = lim Z b α→a+ α f (x)dx. ExistiertZder Grenzwert nicht, so heißt das Integral divergent. Analog definiert man das Integral b a f (x)dx für bei b nicht definiertem f . 150 Beispiele 5.22. a) Für α 6= −1 gilt Z 0 1 α x dx = lim 1 ǫ→0+ ǫ = Für α = −1 erhält man Z 1 0 Also konvergiert das Integral Z ǫ→0+ 1 (1 − ǫα+1 ) α+1 1 für α > −1 α+1 Z xα dx = lim ∞ für α < −1. dx = − lim ln ǫ = ∞. ǫ→0+ x 1 0 xα dx genau für α > −1. b) Es ist Z 1 0 √ dx = 1 − x2 Z dx = lim (Arcsin (1 − ǫ) − Arcsin 0) ǫ→0+ 0 1 − x2 ǫ→0+ π = Arcsin 1 = . 2 lim 1−ǫ √ Wir wollen nun auf den vorne erwähnten Fall (iii) näher eingehen: Definition 5.23. Sei f : ]a, b[→ R mit a ∈ R ∪ {−∞}, b ∈ R ∪ {∞} eine Funktion, die auf jedem Intervall [α, β] ⊂ ]a, b[ integrierbar ist, und ferner sei c ∈ [a, b] beliebig. Existieren die uneigentlichen Integrale Z c Z c f (x)dx = lim f (x)dx α→a+ α a und Z b c so heißt das Integral Z b a f (x)dx = lim Z β β→b− c f (x)dx, f (x)dx konvergent , und wir setzen Z b a f (x)dx = Z c a f (x)dx + Z c b f (x)dx. Im Fall a = −∞ bzw. b = ∞ fordern wir natürlich die Existenz von Z c −∞ f (x)dx bzw. Z ∞ c f (x)dx. Wie man sich leicht überlegt, ist diese Definition von der Wahl des Punktes c ∈ ]a, b[ unabhängig. 151 Beispiele 5.24. a) Nach Beispiel 5.18 und 5.22 a) ist Z ∞ 0 dx für jedes s ∈ R divergent. xs b) Es ist Z ∞ −∞ dx = 1 + x2 Z lim 0 R→∞ −R dx + lim 1 + x2 R→∞ Z R 0 dx 1 + x2 = − lim Arctan (−R) + lim Arctan R = R→∞ R→∞ π π + = π. 2 2 Satz und Definition 5.25. Für jedes x > 0 konvergiert das uneigentliche Integral Z ∞ 0 e−t · tx−1 dt =: Γ(x). Die dadurch definierte Funktion Γ : ]0, ∞[→ R heißt Gamma-Funktion . Abbildung 31: Gamma-Funktion Beweis: Wir betrachten die beiden Integrale I1 := Z 0 1 −t x−1 e t dt und I2 := Z ∞ 1 e−t tx−1 dt. α) Für x ≥ 1 ist I1 ein eigentliches Integral, und für 0 < x < 1 und 0 < t ≤ 1 gilt |e−t tx−1 | ≤ tx−1 . Damit ist Z ǫ 1 e−t tx−1 dt ≤ Z 1 ǫ tx−1 dt für 0 < ǫ < 1, und Beispiel 5.22 a) liefert die Konvergenz von I1 . 152 t t β) Wegen lim e− 2 tx−1 = 0 existiert ein t0 > 0 mit e− 2 tx−1 ≤ 1 für alle t ≥ t0 ; damit t→∞ ist t t t |e−t tx−1 | = e− 2 e− 2 tx−1 ≤ e− 2 für alle t ≥ t0 . Da das uneigentliche Integral Z das uneigentliche Integral ∞ −t x−1 e t t0 Z ∞ t0 t e− 2 dt konvergiert, konvergiert auch dt und damit I2 . 2 Satz 5.26. Für alle x > 0 gilt die Funktionalgleichung der Gamma-Funktion: x · Γ(x) = Γ(x + 1); es gilt Γ(1) = 1 und Γ(n + 1) = n! für alle n ∈ N0 . Beweis: Partielle Integration liefert Z ǫ R R −tx e−t ǫ −t x e t dt = +x Z R ǫ tx−1 e−t dt = −Rx e−R + ǫx e−ǫ + x also Γ(x + 1) = lim ǫ→0+ R→∞ = Ferner ist Z R ǫ ǫ R tx−1 e−t dt, e−t tx dt x −R lim −R e R→∞ Z x −ǫ + lim ǫ e ǫ→0+ + x ǫ→0+ lim R→∞ Z R ǫ tx−1 e−t dt = x · Γ(x). Z Γ(1) = lim R R→∞ 0 e−t dt = lim (1 − e−R ) = 1. R→∞ Durch Induktion nach n folgt daraus der Zusammenhang zur Fakultät. 2 Satz 5.27. Für jedes x > 0 gilt: n! · nx . n→∞ x(x + 1) · . . . · (x + n) Γ(x) = lim Wir beweisen zur Vorbereitung des u.a. Satzes 5.29 eine Rekursionsformel für Im (x) := Z sinm xdx, die auch für sich gesehen eine interessante Beziehung liefert. Eine entspre- chende Formel läßt sich auch für Z cosm xdx beweisen. 153 Satz 5.28. Es gilt für alle m ≥ 2: Im (x) = − 1 m−1 cos x · sinm−1 x + Im−2 (x) m m mit I0 (x) = x und I1 (x) = − cos x. Beweis: Partielle Integration liefert Im (x) = − Z sinm−1 x(− sin x)dx = − cos x · sinm−1 x + (m − 1) Z cos2 x sinm−2 x dx = − cos x · sinm−1 x + (m − 1)Im−2 (x) − (m − 1)Im (x). 2 Satz 5.29. (Wallissches Produkt) Es gilt ∞ k Y Y 4n2 π 4n2 = := lim 2 k→∞ 2 n=1 4n2 − 1 n=1 4n − 1 Beweis: Wir erhalten aus Satz 5.28 folgende Rekursionsformel für die bestimmten Intgrale Am := nämlich Am = m−1 Am−2 m Z 0 π 2 sinm x dx, mit A0 = π 2 und A1 = 1. Daraus folgt A2n (2n − 1)(2n − 3) · . . . · 3 · 1 π · = = 2n(2n − 2) · . . . · 4 · 2 2 und A2n+1 = n Y 2k − 1 2k k=1 ! n Y 2n(2n − 2) · . . . · 4 · 2 2k ·1= . (2n + 1)(2n − 1) · . . . · 5 · 3 2k + 1 k=1 h i Wegen sin2n+2 x ≤ sin2n+1 x ≤ sin2n x für x ∈ 0, π2 gilt A2n+2 ≤ A2n+1 ≤ A2n . Also folgt aus lim n→∞ 2n + 1 A2n+2 = lim =1 n→∞ A2n 2n + 2 π 2 154 auch A2n+1 = 1. n→∞ A2n lim Nun ist aber n n Y (2k)2 4k 2 2 2 Y A2n+1 = · = . A2n π k=1 4k 2 − 1 k=1 (2k + 1)(2k − 1) π 2 Als Anwendung liefert das Wallissche Produkt: Satz 5.30. (Gauß’sches Fehlerintegral) Es gilt Z ∞ −x2 e dx = Γ −∞ Beweis: Die Substitution x = √ Z t liefert für ǫ > 0 und R > ǫ: R ǫ √ 1 = π. 2 2 e−x dx = 1 Z R2 − 1 −t t 2 e dt 2 ǫ2 Grenzübergang ǫ → 0+ und R → ∞ ergibt Z ∞ 0 und damit Z ∞ −x2 e −x2 e dx = 2 −∞ 1 1 dx = Γ 2 2 Z ∞ 0 −x2 e dx = Γ 1 . 2 Nun ist nach Satz 5.27: √ √ n! n n! n 1 = lim , = lim 1 Γ 1 1 1 1 1 1 n→∞ n→∞ 2 1 + · . . . · n + 1 − 2 − · . . . · n − n + 2 2 2 2 2 2 2 also nach Satz 5.29 Γ 2 1 2 = n k2 2n Y n→∞ n + 1 k2 − 2 k=1 lim = 2· d.h. Γ 1 4 4k 2 π = 2 · = π, 2 2 k=1 4k − 1 ∞ Y √ 1 = π. 2 2 155 5.4 Näherungsweise Integration Die geometrische Interpretation des bestimmten Integrals führt zu Näherungsverfahren zur Berechnung von Z β α f (x) dx , wenn das Integral nicht geschlossen berechnet werden kann. Hierzu wählen wir eine Schrittweite β−α h := mit n ∈ N n und dann die Punkte xk := α + kh mit k = 0, 1, . . . , n . Wir betrachten drei der häufig eingesetzten Verfahren. (i) Die Mittelpunktsregel: Wir ersetzen im Intervall [xk , xk+1] den Flächeninhalt unter dem Graphen von f durch den Flächeninhalt des Rechtecks mit der Breite xk+1 − xk und der Höhe f (xk + h2 ). So ergibt sich die Mittelpunktsregel ! n−1 X h h h h Mh (f ) := h f (x0 + ) + f (x1 + ) + . . . + f (xn−1 + ) = h f (xk + ) . 2 2 2 2 k=0 Für f ∈ C 2 ([α, β]) gilt für den Fehler folgende Abschätzung: | Z β α f (x) dx − Mh (f )| ≤ (β − α)3 ′′ ||f || . 24n2 Dabei bezeichnet ||.|| die Supremumsnorm, bezogen auf das Intervall [α, β]. (ii) Die Trapez-Regel: Ersetzen wir im Intervall [xk , xk+1 ] den Graphen der Funktion f durch die die Punkte (xk , f (xk )) und (xk+1 , f (xk+1 )) verbindende Gerade, so erhalten wir als Flächeninhalt des sich ergebenden Trapezes 1 h (xk+1 − xk )(f (xk ) + f (xk+1 )) = (f (xk ) + f (xk+1 )) 2 2 und damit die Trapezregel 1 1 f (x0 ) + f (x1 ) + . . . + f (xn−1 ) + f (xn ) . 2 2 Th (f ) := h · Ist f ∈ C 2 ([α, β]), so erhalten wir für den Fehler folgende Abschätzung: Z β α f (x) dx − Th (f ) ≤ (β − α)3 ′′ ||f || . 12n2 156 (iii) Die Simpson-Regel: Ersetzt man den Graphen in [xk , xk+1 ] durch die (eindeutig bestimmte) Parabel h h durch die Punkte (xk , f (xk )), (xk + , f (xk + )) und (xk+1 , f (xk+1 )), so ergibt sich 2 2 die Simpson-Regel als Linearkombination der beiden vorhergenannten Regeln, und zwar folgendermaßen: 1 Sh (f ) := (Th (f ) + 2Mh (f )) . 3 Ausgeschrieben lautet die Simpson-Regel damit Sh (f ) = h h h f (x0 ) + 4f (x0 + ) + 2f (x1 ) + 4f (x1 + ) + 2f (x2 ) + . . . 6 2 2 h . . . + 2f (xn−1 ) + 4f (xn − ) + f (xn ) 2 ! Ist f viermal stetig differenzierbar auf dem Intervall [α, β], so gilt: | Z β α f (x) dx − Sh (f )| ≤ (β − α)5 (4) ||f || . 2880n4 157 § 6 Folgen und Reihen von Funktionen 6.1 Potenzreihen In diesem Paragraphen sei immer K = C oder K = R. Wir betrachten Funktionen, die sich als Reihe von Potenzfunktionen darstellen lassen: Definition 6.1. Eine Reihe der Form p(x) = ∞ X n=0 an (x − x0 )n = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + . . . mit an ∈ K heißt Potenzreihe mit dem Mittelpunkt x0 und den Koeffizienten an . Für x0 = 0 hat eine Potenzreihe die Form p(x) = ∞ X an xn . n=0 Durch die Transformation y := x − x0 kann jede Potenzreihe auf diese Form gebracht werden. Deshalb beschränken wir uns in den meisten Fällen auf Potenzreihen mit dem Mittelpunkt x0 = 0. Wir untersuchen, für welche x ∈ C eine Potenzreihe konvergiert; für x = x0 ist dies stets richtig. Satz 6.2. (Formel von Cauchy-Hadamard) Gegeben sei eine Potenzreihe der Form n=0 durch r := −1 q n lim sup |a | n n→∞ ∞ X an (x − x0 )n ; wir definieren r ∈ [0, ∞[∪{∞} , falls dieser Limes superior existiert und größer als 0 ist. 0 , falls der Limes superior nicht existiert ∞ , falls der Limes superior gleich 0 ist. Dann konvergiert die obige Potenzreihe für alle x ∈ C mit |x − x0 | < r absolut und sie divergiert für alle x ∈ C mit |x − x0 | > r. r heißt Konvergenzradius und K := {x ∈ C | |x − x0 | < r} Konvergenzkreis der Potenzreihe. Bemerkung: Sei (xn )n≥1 eine nach oben beschränkte Folge reeller Zahlen und die Menge der Häufungspunkte sei nicht leer. Dann heißt die Zahl lim sup xn := sup H n→∞ 158 der Limes superior von (xn )n≥1 . Entsprechend erklärt man für nach unten beschränkte Folgen den Limes inferior als lim inf xn := inf H. n→∞ Ist xn ≤ K für alle n ≥ 1 richtig, so gilt offenbar auch lim sup xn ≤ K. n→∞ Umgekehrt folgt aus lim sup xn < K auch xn < K für n ≥ n0 mit geeignetem n0 ∈ R. n→∞ Beweis von Satz 6.2: Sei r ∈]0, ∞[∪{∞} und x ∈ K; nach Satz 2.43 konvergiert die Reihe ∞ X n=0 an (x − x0 )n absolut, denn es gilt: lim sup n→∞ q n |an | |x − x0 |n = lim sup n→∞ q n |an ||x − x0 | = |x − x0 | lim sup n→∞ q n |an | < 1. Ist dagegen |x − x0 | > r ∈ [0, ∞[, so folgt analog lim sup n→∞ q n |an | |x − x0 |n > 1, also gemäß Satz 2.43 Divergenz. 2 Beispiel 6.3. Die Reihen ∞ X xn , n=0 haben wegen lim n→∞ √ n xn n=1 n ∞ X xn 2 n=1 n ∞ X und 1 1 1 = lim √ =1 = lim √ n→∞ n n n→∞ n n2 alle den Konvergenzkreis K = {z ∈ C | |z| < 1}. Die erste divergiert für x = ±1, die zweite konvergiert für x = −1 nach dem Leibniz-Kriterium und divergiert für x = 1 (harmonische Reihe), die letzte konvergiert für x = ±1. Wenden wir das Quotientenkriterium für Reihen an, so folgt Satz 6.4. Ist ∞ X n=0 an (x − x0 )n eine Potenzreihe mit an 6= 0 für alle n ≥ n0 , so gilt für den Konver- genzradius r: lim inf n→∞ n≥n0 |an | |an | ≤ r ≤ lim sup . n→∞ |an+1 | |a | n+1 n≥n 0 159 Beweis: Ist |x − x0 | < lim inf n→∞ reihe wegen |an | , so folgt nach Satz 2.41 die Konvergenz der Potenz|an+1 | n+1 a n+1 (x − x0 ) lim sup n→∞ an (x − x0 )n < 1; also ist x ∈ K und damit gilt die linke Hälfte der behaupteten Ungleichung. Ist dagegen ∞ X |an | an (x − x0 )n und |x − x0 | > lim sup , so folgt analog die Divergenz der Reihe |a | n→∞ n+1 n=0 damit die rechte Hälfte der Ungleichung. 2 6.2 Gleichmäßige Konvergenz An Stelle der Potenzreihen können wir auch allgemeinere Reihen oder Folgen von Funktionen betrachten. Definition 6.5. Es sei X 6= ∅ eine Menge und (fn )n≥1 eine Folge in Abb(X, K); für jedes x ∈ X konvergiere (fn (x))n≥1 in K. Nennen wir den Grenzwert f (x), so erhalten wir dadurch eine Abbildung f : X ∋ x 7→ n→∞ lim fn (x) ∈ K. f heißt Grenzfunktion von (fn )n≥1 und wir sagen (fn ) konvergiert punktweise auf X gegen f . Konvergiert die Reihe ∞ X n=1 fn (x) für jedes x ∈ X, so schreiben wir analog f (x) := ∞ X fn (x) n=1 und nennen f die Summe der Reihe P∞ n=1 fn . Da sich jede Reihe als Folge auffassen lässt und umgekehrt, genügt es häufig, nur für einen Fall die Aussagen zu formulieren oder zu beweisen. Wir untersuchen, ob und wie sich die Eigenschaften Stetigkeit, Differenzierbarkeit und Integrierbarkeit der fn auf die Grenzfunktion bzw. die Summe der Reihe vererben. Dazu führen wir noch einen stärkeren Konvergenzbegriff als den der punktweisen Konvergenz aus Definition 6.5 ein. Unter Zugrundelegung dieser Konvergenz sind dann die gewünschten Vererbungseigenschaften gültig. Definition 6.6. Es sei X 6= ∅ und fn ∈ Abb(X, K) für n ∈ N. (fn )n≥1 konvergiert gleichmäßig auf X gegen ein f ∈ Abb(X, K), wenn zu jedem ǫ > 0 ein N(ǫ) ∈ R derart existiert, dass für alle n ∈ N mit n ≥ N(ǫ) und alle x ∈ X gilt: |fn (x) − f (x)| < ǫ. 160 Eine Reihe ∞ X fn konvergiert gleichmäßig, wenn die Folge der Partialsummen n=1 n X i=1 gleichmäßig konvergiert. fi ! n≥1 }ǫ fn (x) f (x) Abbildung 32: Veranschaulichung der gleichmäßigen Konvergenz Beispiele 6.7. (i) Betrachte fn : D = [0, 1] → R mit D ∋ x 7→ xn ∈ R. Dann gilt fn (x) → ( 0 x ∈ [0, 1) 1 x=1 ) =: f (x), d.h.sfn konvergiert punktweise, aber nicht gleichmäßig gegen f , denn z.B. gilt 1 1 n fn = . 2 2 (ii) Sei ∞ P n=0 an (x−x0 )n eine Potenzreihe mit Konvergenzradius r > 0. D = (x0 −r, x0 +r). n fn (x) := an (x − x0 ) , s(x) := ∞ X n=0 P an (x − x0 )n Dann konvergiert fn auf D punktweise gegen s; auf jeder kompakten Teilmenge von D ist die Konvergenz gleichmäßig, wie sofort aus u.a. Satz 6.8 folgt. (iii) D = [0, ∞), n·x fn (x) = = 1 + n2 x2 für n → ∞ für alle x ∈ D. 1 n2 x n + x2 →0 Also: (fn ) konvergiert auf D punktweise, aber nicht gleichmäßig gegen f ≡ 0, denn 1 1 z.B. gilt fn = . n 2 161 1 f1 (x) f3 (x) f2 (x) 0 1 Abbildung 33: Punktweise aber nicht gleichmäßig konvergente Folge (i) 0.5 f1 (x) f2 (x) f3 (x) 0 1 2 Abbildung 34: Punktweise aber nicht gleichmäßig konvergente Folge (iii) 162 Ein nützliches Kriterium für die gleichmäßige Konvergenz einer Reihe liefert Satz 6.8. (Weierstraß’sches Majorantenkriterium) Es sei (fn )n≥1 eine Folge in Abb(X, K) und es gelte für alle n ∈ N und alle x ∈ X: |fn (x)| ≤ cn . Konvergiert die Reihe ∞ X cn , so konvergiert ∞ X fn gleichmäßig auf X. n=1 n=1 Beweis: Das Cauchy-Kriterium für Reihen liefert zu jedem ǫ > 0 die Existenz eines N(ǫ) ∈ R mit m X fk (x) k=n+1 ≤ m X k=n+1 |fk (x)| ≤ m X ck < ǫ k=n+1 für alle m > n > N(ǫ) und alle x ∈ X. 2 Beispiel 6.9. Konvergiert die Reihe ∞ X cn absolut, so konvergieren die Reihen n=1 ∞ X cn sin nx und ∞ X cn cos nx n=1 m=1 gleichmäßig auf R. Satz 6.10. Es sei (X, d) ein metrischer Raum. Ist (fn )n≥1 eine Folge von stetigen Funktionen auf X und konvergiert (fn )n≥1 gleichmäßig gegen f auf X, so ist f stetig auf X. Beweis. Seien x ∈ X und ε > 0 beliebig. Wir wählen N = N(ε) ∈ N so, dass gilt |fN (z) − f (z)| < ε 3 für alle z ∈ X; vgl. Definition 6.6. Da fN stetig ist, existiert ein δ = δ(ε, x) > 0, so dass gilt |fN (y) − fN (x)| < ε 3 für alle y ∈ X : d(x, y) < δ. Diese beiden Ungleichungen liefern zusammen mit der Dreiecksungleichung: |f (y) − f (x)| ≤ |f (y) − fN (y)| + |fN (y) − fN (x)| + |fN (x) − f (x)| ε ε ε < + + = ε für alle y ∈ X : d(x, y) < δ, 3 3 3 d.h. f ist stetig im beliebig gewählten Punkt x ∈ X. 2 163 Satz 6.11. Die Funktionenfolge fn : [a, b] → R sei differenzierbar auf [a, b] und es existiere ein x0 ∈ [a, b] derart, dass (fn (x0 ))n≥1 konvergiert. Konvergiert die Folge (fn′ )n≥1 gleichmäßig auf [a, b], dann konvergiert auch (fn )n≥1 auf [a, b] gleichmäßig gegen eine auf [a, b] differenzierbare Funktion f , und es gilt für alle x ∈ [a, b]: f ′ (x) = lim fn′ (x) . n→∞ Satz 6.12. Es besitze fn : [a, b] → R für alle n ∈ N eine Stammfunktion, und es konvergiere (fn )n≥1 gleichmäßig auf [a, b] gegen f . Dann besitzt auch f eine Stammfunktion, und es gilt Z b a f (x) dx = Z b a lim fn (x) dx = n→∞ lim n→∞ Z b a fn (x) dx. Wir wollen die Sätze 6.10-12 speziell auf Potenzreihen anwenden und beginnen mit dem Satz 6.13. Besitzt die reelle Potenzreihe ∞ X n=0 an xn einen Konvergenzradius r 6= 0, so können wir für x ∈] − r, r[ die Funktion f definieren durch f (x) := ∞ X an xn . n=0 Dann konvergiert die Potenzreihe auf jedem abgeschlossenen Intervall [−ǫ, ǫ] mit 0 < ǫ < r gleichmäßig; die Funktion f ist stetig und differenzierbar in ] − r, r[, und es gilt f ′ (x) = ∞ X nan xn−1 n=1 für alle x ∈] − r, r[. Beweis. 1. Die gleichmäßige Konvergenz der Potenzreihe auf [−ε, ε] für jedes ε ∈]0, r[ folgt sofort aus dem Majorantenkriterium; Satz 6.10 angewendet auf die Partialsummen fn (x) := n X ak xk , k=0 n ∈ N, liefert dann direkt die Stetigkeit von f in ] − r, r[. 2. Zum Beweis der Differenzierbarkeit beachten wir fn′ (x) = n X k=1 kak xk−1 , n ∈ N. 164 Wegen lim sup k→∞ besitzt die Reihe ∞ X q k k|ak | = lim k→∞ √ k k · lim sup k→∞ q k |ak | = lim sup k→∞ q k |ak | kak xk−1 den gleichen Konvergenzradius r wie die Reihe f . Folg- k=1 lich konvergiert auch diese Reihe auf jedem Intervall [−ε, ε] mit ε ∈]0, r[ gleichmäßig; Satz 6.11 liefert somit die Differenzierbarkeit von f und die Relation ∞ X kak xk−1 = lim fn′ (x) = f ′ (x), n→∞ k=1 wie behauptet. 2 Folgerung 6.14. Mit den Bezeichnungen aus Satz 6.13 ist f beliebig oft differenzierbar in ] − r, r[ mit (∗) f (k) (x) = ∞ X n=k n(n − 1) · . . . · (n − k + 1)an xn−k ; speziell gilt f (k) (0) = k!ak für k ∈ N0 . Die Potenzreihe ist die Taylor-Reihe von f im Punkt 0, d.h. es gilt f (x) = f (k) (0) k x . k! k=0 ∞ X Beweis. Sukzessive Anwendung von Satz 6.13 auf f, f ′ , f ′′, . . . , f (k−1) ergibt die erste Behauptung; Einsetzen von x = 0 in (∗) ergibt die zweite Behauptung; Einsetzen von f (k) (0) ak = in die Potenzreihe ergibt die letzte Behauptung. 2 k! Satz 6.15. Wir übernehmen die Bezeichnungen aus Satz 6.13; f besitzt auf ] − r, r[ eine Stammfunktion. Eine solche ist z.B. F mit F (x) := ∞ X an n+1 x . n=0 n + 1 Beweis. Analog zu Teil 2 des Beweises von Satz 6.13 durch Anwendung von Satz 6.12. 2 165 Beispiel 6.16. Es gilt für alle |x| < 1: ln(1 + x) = ∞ X (−1)n n=0 xn+1 . n+1 Beweis. Für |x| < 1 gilt ∞ X d 1 1 (−1)n xn ; ln(1 + x) = = = dx 1+x 1 − (−x) n=0 nach Satz 6.15 ist F mit F (x) = ∞ X (−1)n n=0 eine Stammfunktion von ∞ X xn+1 n+1 (−1)n xn auf ] − 1, 1[. Also gilt mit einer Konstanten c die n=0 Beziehung ln(1 + x) = F (x) + c für alle x ∈] − 1, 1[. Einsetzen von x = 0 liefert c = 0, also die Behauptung für x ∈] − 1, 1[. 2 Bemerkung 6.17. Für |x| < 1 gilt: ln(1 + x) = x − x2 x3 x4 + − ±... 2 3 4 ln(1 − x) = −x − x2 x3 x4 − − − ... . 2 3 4 Subtraktion ergibt: ! ∞ X 1+x x3 x5 x2n+1 ln =2 x+ + + ... = 2 . 1−x 3 5 n=0 2n + 1 Für x = 1 folgt hieraus 3 ln 2 = 2 · = 2 ∞ X 2n+1 1 1 n=0 2n + 1 3 1 1 1 1 1 + + + ... 3 3 33 5 35 . Um ln 2 mit einer Genauigkeit von 10−6 zu berechnen, benötigt man nur die ersten 6 Glieder; es ergibt sich ln 2 = 0.693147 . . .