MAE1 Mathematik: Analysis für Ingenieure 1 Christoph Kirsch 23. Dezember 2013 Inhaltsverzeichnis 0 Überblick 2 1 Einführung in die mathematische Logik 1.1 Aussagenlogik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Mengenlehre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 7 2 Zahlen und Zahlensysteme 2.1 Zahlen . . . . . . . . . . . . . . . . . . . 2.1.1 Zahlenmengen und Operationen 2.1.2 Ordnungsrelationen auf R . . . . 2.1.3 Intervalle auf R . . . . . . . . . . 2.1.4 Irrationale Zahlen . . . . . . . . 2.2 Zahlensysteme . . . . . . . . . . . . . . 2.2.1 Darstellung natürlicher Zahlen . 2.2.2 Darstellung ganzer Zahlen . . . . 2.2.3 Darstellung rationaler Zahlen . . 2.2.4 Darstellung reeller Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 10 11 11 12 12 14 14 15 15 16 3 Funktionen 3.1 Definition und Darstellung einer Funktion . . . . . . . . 3.2 Allgemeine Funktionseigenschaften . . . . . . . . . . . . 3.3 Rationale Funktionen . . . . . . . . . . . . . . . . . . . 3.3.1 Ganzrationale Funktionen (Polynomfunktionen) 3.3.2 Interpolationspolynome . . . . . . . . . . . . . . 3.3.3 Gebrochenrationale Funktionen . . . . . . . . . . 3.4 Zahlenfolgen und Konvergenz . . . . . . . . . . . . . . . 3.4.1 Reelle Zahlenfolgen . . . . . . . . . . . . . . . . . 3.5 Grenzwert und Stetigkeit einer Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 16 20 22 23 32 39 43 43 49 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 ÜBERBLICK 2 4 Einführung in die Differenzialrechnung 53 4.1 Differenzierbarkeit und Ableitungsfunktion . . . . . . . . . . . . 54 4.2 Ableitung von rationalen Funktionen . . . . . . . . . . . . . . . . 59 4.2.1 Ableitung von ganzrationalen Funktionen . . . . . . . . . 59 4.2.2 Ableitung von gebrochenrationalen Funktionen . . . . . . 60 4.3 Anwendungen der Differenzialrechnung . . . . . . . . . . . . . . . 61 4.3.1 Näherungspolynome einer Funktion . . . . . . . . . . . . 61 4.3.2 Bestimmung von Extremstellen differenzierbarer Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 4.3.3 Der Mittelwertsatz der Differenzialrechnung . . . . . . . . 66 4.3.4 Das Newton-Verfahren zur Bestimmung von Nullstellen differenzierbarer Funktionen . . . . . . . . . . . . . . . . . 66 0 Überblick Dies ist der erste Teil einer viersemestrigen Vorlesung über Analysis für Ingenieure. Wir behandeln in diesem Teil in erster Linie rationale Funktionen, zu denen auch Polynome gehören. Anhand dieser Funktionen führen wir die Differenzialrechnung ein, um Ableitungen berechnen zu können. 1 Einführung in die mathematische Logik In diesem Kapitel werden wir grundsätzliche Regeln der mathematischen “Sprache” und der Aussagenlogik festlegen. Wir benötigen dieses Werkzeug, um klar, unmissverständlich und eindeutig Dinge mathematisch beschreiben und mathematische Aussagen treffen zu können. 1.1 Aussagenlogik Definition 1 (nach Aristoteles, 384–322 v. Chr.) Eine Aussage ist ein sprachliches Gebilde, von dem es sinnvoll ist zu sagen, es sei wahr oder falsch. Bemerkung: Der Wahrheitswert einer Aussage braucht nicht bekannt zu sein. Beispiele: 1. “Äpfel und Quitten sind Apfelfrüchte” (wahr) und “Bananen sind Apfelfrüchte” (falsch) sind Aussagen. 2. “Die Erhu ist kein Musikinstrument” (falsch) und “Die Violine ist ein Streichinstrument” (wahr) sind Aussagen. 3. “Der FC Basel ist Schweizer Fussballmeister 2013” (wahr), “Der FC Basel wird 2014 Schweizer Fussballmeister” (derzeit unbekannt) und “Am 10.10.2013 wird das Wetter sonnig” (derzeit unbekannt) sind Aussagen. 1 EINFÜHRUNG IN DIE MATHEMATISCHE LOGIK 3 4. Ausdrücke ohne Wahrheitswert sind keine Aussagen, so z. B. die Frage “Spieglein, Spieglein an der Wand, wer ist die Schönste im ganzen Land?” oder Ausdrücke wie “Guten Morgen” oder “wassup”. 5. Unentscheidbare Ausdrücke sind keine Aussagen, so z. B. “Morgen wird das Wetter sonnig”, “Der FC Basel wird nächstes Jahr Schweizer Fussballmeister” oder “Dieser Satz ist falsch”. Für eine Aussage P sagen wir in der Mathematik an Stelle von “P ist wahr” oft auch: “Es gilt P ”. Definition 2 (logische Äquivalenz) Zwei Aussagen P und Q heissen logisch äquivalent, wenn sie den gleichen Wahrheitswert besitzen. Bemerkung: Sind die Aussagen P und Q logisch äquivalent, so schreiben wir P ≡ Q. Beispiel: Betrachten wir die Aussagen P := Die Erhu ist kein Musikinstrument, Q := Bananen sind Apfelfrüchte (die Notation := bedeutet “ist definiert als”), so sind diese Aussagen logisch äquivalent (beide sind falsch) und wir schreiben P ≡ Q, obwohl die beiden Aussagen inhaltlich keinen Zusammenhang haben – für die logische Äquivalenz zählt lediglich der Wahrheitswert! Um zwei Aussagen zu einer neuen Aussage verknüpfen zu können, führen wir die folgenden Operationen und Symbole mit Hilfe einer Wahrheitstabelle ein. Definition 3 (Negation, Konjunktion, Disjunktion) Für zwei Aussagen P und Q definieren wir die Negation, Konjunktion und Disjunktion über die folgenden Wahrheitstabellen: Aussage P w f Aussagen P w w f f Q w f w f Negation NICHT ¬P f w Konjunktion UND P ∧Q w f f f Disjunktion ODER P ∨Q w w w f 1 EINFÜHRUNG IN DIE MATHEMATISCHE LOGIK 4 Bemerkungen: • Zwei verknüpfte Aussagen müssen nicht in einem inhaltlichen Zusammenhang stehen. • Die hier definierte Disjunktion ist nicht ausschliessend, also nicht “entweder P oder Q”, sondern “P oder Q (oder beide)”. • Der Wahrheitswert der Verknüpfungen ∧ und ∨ ist unabhängig von der Reihenfolge der verknüpften Aussagen: Q ∧ P ≡ P ∧ Q, Q ∨ P ≡ P ∨ Q. Wir sagen auch, Konjunktion und Disjunktion sind kommutativ. Beispiel: Betrachten wir die zusammenhangslosen Aussagen P := Q := Die Violine ist ein Streichinstrument Am 10.10.2013 wird das Wetter sonnig P ist eine wahre Aussage, aber der Wahrheitswert von Q ist (derzeit) unbekannt. Daher ist ¬P falsch und der Wahrheitswert von ¬Q unbekannt. Die Disjunktion P ∨ Q ist wahr: obwohl wir den Wahrheitswert von Q nicht kennen, so wissen wir doch bereits, dass P und damit mindestens eine der beiden Aussagen wahr ist! Der Wahrheitswert der Konjunktion P ∧ Q ist hingegen unbekannt. Satz 1 (Rechenregeln für Negation, Konjunktion, Disjunktion) Seien P und Q Aussagen. Dann gilt 1. ¬ (¬P ) ≡ P , 2. ¬ (P ∧ Q) ≡ ¬P ∨ ¬Q (“die Negation der Konjunktion ist die Disjunktion der Negationen”), 3. ¬ (P ∨ Q) ≡ ¬P ∧ ¬Q (“die Negation der Disjunktion ist die Konjunktion der Negationen”). Beweis: Direkt mit Hilfe der Wahrheitstabelle (Serie 1, Aufgabe 1). Bemerkungen: • 2. und 3. heissen De Morgansche Gesetze (nach A. De Morgan, 1806–1871). • Aus 1. und 2. folgt, dass die Konjunktion mit Hilfe der Negation und der Disjunktion ausgedrückt werden kann: 1. 2. P ∧ Q ≡ ¬ (¬ (P ∧ Q)) ≡ ¬ (¬P ∨ ¬Q) . (1) Aufgrund dieser logischen Äquivalenz bräuchte man streng genommen kein eigenes Symbol für die Konjunktion; es ist aber praktisch! Auch die Implikation definieren wir mit Hilfe der Negation und der Disjunktion: 1 EINFÜHRUNG IN DIE MATHEMATISCHE LOGIK 5 Definition 4 (Implikation, Konditional) Für zwei Aussagen P und Q ist die Implikation (oder das Konditional) P ⇒ Q definiert durch P ⇒ Q := ¬P ∨ Q. (2) Bemerkungen • Für P ⇒ Q sagen wir “P impliziert Q”, “Aus P folgt Q”, oder “Wenn P , dann Q”. • Weil in dieser Definition die erste Aussage negiert wird, ist die Reihenfolge wesentlich: die Aussagen P ⇒ Q und Q ⇒ P sind logisch nicht äquivalent! • Wir ermitteln die Wahrheitstabelle für die Implikation mit Hilfe der Definitionen 3 und 4: Aussagen P Q w w w f f w f f Negation ¬P f f w w Implikation P ⇒Q w f w w • Es gilt die logische Äquivalenz P ⇒ Q ≡ ¬Q ⇒ ¬P wie man mit Hilfe von Satz 1 beweisen kann: ¬Q ⇒ ¬P 1. Def. 4 = ¬ (¬Q) ∨ ¬P ≡ Q ∨ ¬P Komm. ≡ Def. 4 ¬P ∨ Q = P ⇒ Q (3) Der Ausdruck ¬Q ⇒ ¬P heisst Kontraposition oder Umkehrschluss der Implikation P ⇒ Q. Wir betrachten noch einmal die Wahrheitstabelle für die Implikation, wobei wir die Zeilen nummerieren: 1 2 3 4 Aussagen P Q w w w f f w f f Implikation P ⇒Q w f w w Die Wahrheitstabelle stellt einen Zusammenhang her zwischen den Wahrheitswerten der drei Aussagen P , Q und P ⇒ Q. Ist der Wahrheitswert von zwei dieser drei Aussagen bekannt, so können wir in manchen Fällen Schlüsse über den Wahrheitswert der dritten Aussage ziehen: • Gelten sowohl die Aussage P als auch die Implikation P ⇒ Q (1. Zeile), so muss auch die Aussage Q gelten. Wir sagen, P ist eine hinreichende Bedingung für Q. Ist hingegen die Aussage Q falsch und die Implikation P ⇒ Q wahr (4. Zeile), so muss auch die Aussage P falsch sein. Wir sagen, Q ist eine notwendige Bedingung für P . 1 EINFÜHRUNG IN DIE MATHEMATISCHE LOGIK 6 • Ist die Aussage P falsch, so ist die Implikation P ⇒ Q wahr (3. und 4. Zeile), und zwar unabhängig vom Wahrheitswert von Q (“aus Falschem folgt Beliebiges”). Ist die Aussage Q wahr, so ist auch die Implikation P ⇒ Q wahr (1. und 3. Zeile), und zwar unabhängig vom Wahrheitswert von P (“Wahres folgt aus Beliebigem”). Beispiele: 1. Ein häufig verwendetes Beispiel ist jenes mit der regennassen Strasse. Wir betrachten die Aussagen P := Es regnet, Q := Die Strasse wird nass. Diese Aussagen erfüllen P ⇒ Q, was wir auch sprachlich mittels “wenn . . . dann” ausdrücken können: die Implikation P ⇒ Q lautet “Wenn es regnet, dann wird die Strasse nass”, und die Kontraposition ¬Q ⇒ ¬P lautet “Wenn die Strasse nicht nass wird, dann regnet es nicht.” Beides sind wahre Aussagen (wenn wir einmal annehmen, dass der betrachtete Strassenabschnitt nicht gerade unter einem Baum oder einer Brücke durchführt und damit vor Regen geschützt ist). Die Implikation Q ⇒ P ist hingegen falsch. Sie würde lauten: “Wenn die Strasse nass wird, dann regnet es.” Diese Aussage ist falsch, denn die Strasse kann ja auch nass werden, ohne dass es regnet (z. B. wenn gerade die Strassenreinigung vorbeifährt). Genauso ist die Aussage ¬P ⇒ ¬Q falsch. Sie würde lauten: “Wenn es nicht regnet, dann wird die Strasse nicht nass.” 2. Die Schwierigkeit mit der sprachlichen “wenn . . . dann”-Verknüpfung ist, dass sie einen inhaltlichen Zusammenhang zwischen den beiden Aussagen vortäuscht, der aber in unserer Def. 4 überhaupt nicht gefordert wird; in der Logik ist lediglich der Wahrheitswert der Aussagen wichtig, nicht aber ihr Inhalt! Betrachten wir die Aussagen: P := London ist die Hauptstadt von Frankreich (falsch), Q := Schnee ist weiss (wahr). Gemäss unserer Wahrheitstabelle für die Implikation gelten dann P ⇒ Q und ¬Q ⇒ ¬P , aber mit “wenn . . . dann” ausgedrückt ergeben sich inhaltlich sinnlose Sätze: “Wenn London die Hauptstadt von Frankreich ist, dann ist Schnee weiss”, “Wenn Schnee nicht weiss ist, dann ist London nicht die Hauptstadt von Frankreich”. 1 EINFÜHRUNG IN DIE MATHEMATISCHE LOGIK 7 Dieses Beispiel zeigt, dass Sie in der Logik besser nicht versuchen sollten, Aussagenverknüpfungen intuitiv zu verstehen oder sprachlich zu veranschaulichen. Betrachten Sie stattdessen einfach die Wahrheitswerte der Teilaussagen und wenden Sie “stur” die Definitionen und Sätze an. Definition 5 (Bikonditional) Das Bikonditional zweier Aussagen P und Q ist definiert als P ⇔ Q := (P ⇒ Q) ∧ (Q ⇒ P ) . (4) Bemerkungen: • Wenn P ⇔ Q gilt, so sagen wir, dass P notwendige und hinreichende Bedingung für Q ist (und umgekehrt). Die Reihenfolge der Teilaussagen spielt beim Bikonditional keine Rolle. • Wir berechnen die Wahrheitstabelle für das Bikonditional schrittweise aus der Definition: Aussagen P Q w w w f f w f f Implikationen (Def. 4) P ⇒Q Q⇒P w w f w w f w w Bikonditional P ⇔Q w f f w Aus der Wahrheitstabelle erkennen wir, dass das Bikonditional P ⇔ Q genau dann gilt, wenn P und Q dieselben Wahrheitswerte besitzen, also genau dann, wenn P und Q logisch äquivalent sind. • Die sprachliche Verknüpfung der Aussagen mittels “genau dann, wenn” (“P genau dann, wenn Q”) ist üblich, aber beachten Sie, dass dadurch wie im vorherigen Beispiel inhaltlich sinnlose Sätze entstehen können: “London ist die Hauptstadt von Frankreich genau dann, wenn Schnee schwarz ist” (beide Teilaussagen sind falsch, und daher ist das Bikonditional wahr). Die sprachliche Verknüpfung mittels “genau dann, wenn” suggeriert einen inhaltlichen Zusammenhang zwischen den beiden Teilaussagen, obwohl kein solcher gegeben ist. 1.2 Mengenlehre Definition 6 (nach Georg Cantor, 1895) Eine Menge ist eine Zusammenfassung von bestimmten wohlunterschiedenen Objekten unserer Anschauung oder unseres Denkens zu einem Ganzen. Die Objekte einer Menge heissen Elemente. 1 EINFÜHRUNG IN DIE MATHEMATISCHE LOGIK 8 Bemerkungen: • Für ein Element x einer Menge M schreiben wir x ∈ M und sagen “x ist Element von M ” (das ist eine Aussage im Sinne von Def. 1). • Weil die in einer Menge zusammengefassten Objekte gemäss Definition “wohlunterschieden” sein müssen, kann eine Menge nicht zwei gleiche Elemente enthalten. Definition 7 (Teilmenge) Eine Menge A heisst Teilmenge einer Menge B, wenn jedes Element von A auch Element von B ist. Bemerkungen: • Wir schreiben A ⊆ B, wenn A eine Teilmenge von B ist. • Wenn A ⊆ B, dann gilt die Implikation x ∈ A ⇒ x ∈ B für jedes Element der Menge A (so steht es in Def. 7). • Wir werden Mengen immer als Teilmengen einer Grundmenge G (eines Universums) betrachten. G ist eine Menge aus allen in einem bestimmten Zusammenhang betrachteten Objekten. Alle in diesem Zusammenhang betrachteten Mengen sind dann Teilmengen von G. • Ist x kein Element von M , so schreiben wir x 6∈ M . Beachten Sie aber, dass immer noch x ∈ G gelten muss (das Universum kann nicht verlassen werden)! Beispiele: 1. G: Menge aller Früchte, B : Menge aller Apfelfrüchte, dann gilt für A := {Apfel, Birne, Quitte}: A ⊆ B. Es gelten auch die Aussagen Apfel ∈ A, Birne ∈ B, Vogelbeere ∈ B, Vogelbeere 6∈ A. Insbesondere gilt A 6= B, denn wir haben ein Element von B gefunden, das kein Element von A ist. 2. G: Menge aller Musikinstrumente, Ω : Menge aller Streichinstrumente, dann gilt M := {Violine, Viola, Violoncello, Kontrabass} ⊆ Ω. Es gilt {Violine, Viola} ⊆ M , Erhu ∈ Ω, Erhu 6∈ M , Querflöte 6∈ Ω. 3. Im Beispiel 1 ist der Ausdruck “Violine 6∈ B” unzulässig, weil die Violine kein Element der dort betrachteten Grundmenge aller Früchte ist. Die Aussage “Banane 6∈ B” ist hingegen zulässig, denn die Banane ist eine Frucht. 4. “{Violine, Violine, Kontrabass}” ist keine Menge, weil die beiden Objekte Violine nicht unterscheidbar sind. Dagegen ist {Violine, {Violine} , Kontrabass} eine Menge, denn das Element Violine ist verschieden von der Menge mit dem Element Violine. 5. Die leere Menge, ∅ oder {}, ist eine Menge, die keine Elemente enthält. 1 EINFÜHRUNG IN DIE MATHEMATISCHE LOGIK 9 In diesen Beispielen haben wir bereits zwei Darstellungsformen von Mengen kennen gelernt: • die aufzählende Form, wie z. B. A = {Apfel, Birne, Quitte}. Hier werden die Elemente einer Menge explizit aufgezählt, wobei die Reihenfolge keine Rolle spielt. • die beschreibende Form, wie z. B. “Ω ist die Menge aller Streichinstrumente”. Hier werden die Elemente einer Menge über ihre Eigenschaften beschrieben. Formal schreiben wir auch M = {x ∈ G | x hat die Eigenschaft E} , also z. B. Ω = {x ∈ G | x ist ein Streichinstrument}. Für die Definition der folgenden Mengenoperationen verwenden wir Symbole aus Kap. 1.1: Definition 8 (Mengenoperationen) Seien A und B Mengen. Dann definieren wir die folgenden Mengen über ihre Eigenschaften: • Komplement von A: Ac := {x ∈ G | x 6∈ A}, • Schnittmenge (Durchschnitt) von A und B: A∩B := {x ∈ G | x ∈ A ∧ x ∈ B}, • Vereinigungsmenge (Vereinigung) von A und B: A∪B := {x ∈ G | x ∈ A ∨ x ∈ B}, • Differenz von A und B: A \ B := {x ∈ G | x ∈ A ∧ x 6∈ B} = A ∩ B c . Bemerkungen: • ∩ und ∪ sind kommutativ, \ ist nicht kommutativ. • Weil in Def. 8 die Negation, Konjunktion und Disjunktion aus Def. 3 vorkommen, können wir aus den Rechenregeln für diese Operationen (Satz 1) Rechenregeln für Mengen herleiten (für jedes x ∈ G, definiere die Aussagen P := x ∈ A, Q := x ∈ B). Es gilt c 1. (Ac ) = A, c 2. (A ∩ B) = Ac ∪ B c , c 3. (A ∪ B) = Ac ∩ B c . • Mengenoperationen lassen sich mit Hilfe von Venn-Diagrammen (nach J. Venn, 1834–1923) grafisch darstellen (Serie 1, Aufg. 5). Definition 9 (Mengenprodukt) Für zwei Mengen A und B ist das Mengenprodukt definiert durch A × B := {(a, b) | a ∈ A, b ∈ B} . (5) 2 ZAHLEN UND ZAHLENSYSTEME 10 Bemerkungen: • (a, b) bezeichnet ein geordnetes Paar. Hier ist die Reihenfolge der Elemente wesentlich, und es gilt das Paaraxiom (G. Peano, 1897) (a, b) = (c, d) ⇔ a = c ∧ b = d. • Die Definition des Mengenprodukts lässt sich auf eine beliebige Anzahl von Mengen verallgemeinern: Seien M1 , M2 , . . . , Mn Mengen, dann ist das Mengenprodukt gegeben durch M1 ×M2 ×· · ·×Mn := {(x1 , x2 , . . . , xn ) | x1 ∈ M1 , x2 ∈ M2 , . . . , xn ∈ Mn } . Hierbei bezeichnet (x1 , x2 , . . . , xn ) ein geordnetes n-Tupel. • Für M1 = M2 = · · · = Mn = M schreiben wir auch M n := M × M × · · · × M . | {z } n-mal Beispiele: 1. Das Mengenprodukt der dreielementigen Mengen A := {1, 2, 3} und B := {x, y, z} ist gegeben durch die neunelementige Menge A × B = {(1, x), (1, y), (1, z), (2, x), (2, y), (2, z), (3, x), (3, y), (3, z)} . 2. In der linearen Algebra (Vorlesung MLAE1) werden Sie den Vektorraum Rn antreffen, ein n-faches Mengenprodukt der Menge der reellen Zahlen (Kap. 2). Die Elemente von Rn werden (n-dimensionale) Vektoren genannt. 2 Zahlen und Zahlensysteme In diesem Kapitel definieren wir zunächst einige wichtige Zahlenmengen und führen dann Strukturen ein, z. B. mittels Operationen wie Addition und Multiplikation, oder mittels einer Ordnungsrelation. Zahlensysteme dienen der Darstellung von Zahlen, und wir werden einige wichtige Zahlensysteme kennen lernen, wie das Binär-, das Dezimal- oder das Hexadezimalsystem. 2.1 Zahlen Was sind und was sollen die Zahlen? [. . . ] die Zahlen sind freie Schöpfungen des menschlichen Geistes, sie dienen als ein Mittel, um die Verschiedenheit der Dinge leichter und schärfer aufzufassen. Durch den rein logischen Aufbau der Zahlen-Wissenschaft und durch das in ihr gewonnene stetige Zahlen-Reich sind wir erst in den Stand gesetzt, unsere Vorstellungen von Raum und Zeit genau zu untersuchen, indem wir dieselben auf dieses in unserem Geiste geschaffene Zahlen-Reich beziehen. (Richard Dedekind, 1893) 2 ZAHLEN UND ZAHLENSYSTEME 2.1.1 11 Zahlenmengen und Operationen Die Menge R der reellen Zahlen entspricht der Menge aller Punkte auf der Zahlengeraden. Wichtige Teilmengen von R sind: • die natürlichen Zahlen N := {1, 2, 3, . . . }, N0 := {0, 1, 2, . . . }, • die ganzen Zahlen Z := {. . . , −2, −1, 0, 1, 2, . . . }, o n • die rationalen Zahlen Q := pq p, q ∈ Z, q 6= 0 . Es gibt auch Erweiterungen der reellen Zahlen, z. B. die komplexen Zahlen C := {a + ib | a, b ∈ R} , mit der imaginären Einheit i ∈ C \ R, i2 = −1. Es gilt N ⊆ Z ⊆ Q ⊆ R ⊆ C. Diese Zahlenmengen enthalten im Unterschied zu den in Kap. 1.2 betrachteten Mengen unendlich viele Elemente. Auf den Zahlen können wir die Operationen Addition und Multiplikation mit den bekannten Rechenregeln einführen. Die rationalen und die reellen Zahlen bilden zusammen mit diesen Operationen jeweils einen Körper (vgl. MLAE1). 2.1.2 Ordnungsrelationen auf R Es gibt noch mehr Struktur in den rellen Zahlen, nämlich eine Totalordnung ≤ (“kleiner gleich”). Sie erfüllt, für alle a, b, c ∈ R: • Antisymmetrie: (a ≤ b ∧ b ≤ a) ⇒ a = b, • Transitivität: (a ≤ b ∧ b ≤ c) ⇒ a ≤ c, • Totalität: a ≤ b ∨ b ≤ a. Diese Totalordnung ist zudem verträglich mit den Körperoperationen (Addition und Multiplikation): • a ≤ b ⇒ a + c ≤ b + c, • (0 ≤ a ∧ 0 ≤ b) ⇒ 0 ≤ a · b, für alle a, b, c ∈ R. Die Paare (Q, ≤) und (R, ≤) sind geordnete Körper. Wir verwenden ausserdem die strenge Totalordnung < (“(strikt) kleiner als”): a < b :⇔ ¬ (b ≤ a) . (6) Definition 10 (Beschränktheit von Mengen) Sei M ⊆ R. • a ∈ R heisst untere Schranke von M , wenn a ≤ x ∀ x ∈ M . • b ∈ R heisst obere Schranke von M , wenn x ≤ b ∀ x ∈ M . Wenn eine dieser Schranken existiert, so heisst M nach unten bzw. nach oben beschränkt. Existieren beide Schranken, so heisst M beschränkt, ansonsten heisst M unbeschränkt. 2 ZAHLEN UND ZAHLENSYSTEME 2.1.3 12 Intervalle auf R Intervalle sind wichtige Teilmengen der reellen Zahlen, die mit Hilfe der Ordnungsrelationen definiert werden können. Definition 11 (Intervalle) Für zwei Zahlen a, b ∈ R definieren wir folgende Intervalle: • [a, b] := {x ∈ R | a ≤ x ≤ b}, • [a, b) := {x ∈ R | a ≤ x < b}, • (a, b] := {x ∈ R | a < x ≤ b}, • (a, b) := {x ∈ R | a < x < b}. • (−∞, b] := {x ∈ R | x ≤ b}, • (−∞, b) := {x ∈ R | x < b}, • [a, ∞) := {x ∈ R | a ≤ x}, • (a, ∞) := {x ∈ R | a < x}, Bemerkungen: • [a, b] heisst abgeschlossenes Intervall, (a, b) heisst offenes Intervall, und [a, b), (a, b] heissen halboffene Intervalle. • Gilt a > b, so sind die Intervalle [a, b], [a, b), (a, b], (a, b) leere Mengen. • Die Intervalle [a, b], [a, b), (a, b], (a, b) sind beschränkte Mengen, (−∞, b), (−∞, b], (a, ∞), [a, ∞) sind unbeschränkte Mengen (Def. 10). • ∞ (“Unendlich”) liegt jenseits der Zahlengeraden: −∞ < a < ∞ ∀ a ∈ R. ∞ ist keine reelle Zahl und kann nie zu einem Intervall gehören; die Schreibweise [a, ∞] ist unzulässig! 2.1.4 Irrationale Zahlen Wir haben bereits gesehen, dass C \ R 6= ∅, denn i ∈ C \ R. Die Aussagen Z \ N 6= ∅ und Q \ Z 6= ∅ sind ebenfalls leicht zu beweisen, denn wir können sofort ein Element aus der Differenzmenge angeben: • −1 ∈ Z ∧ −1 6∈ N, also −1 ∈ Z \ N (Def. 8) und damit Z \ N 6= ∅, • 2 3 ∈Q∧ 2 3 6∈ Z, also 2 3 ∈ Q \ Z und damit Q \ Z 6= ∅. Wie aber sieht es aus mit der Menge der irrationalen Zahlen, R\Q? Weil für zwei 2 2 rationale Zahlen r1 , r2 ∈ Q, auch r1 +r ∈ Q und für r1 < r2 auch r1 +r ∈ (r1 , r2 ) 2 2 gilt, so scheint es doch, als ob wir mit Hilfe fortgeschrittener Intervallteilungen jeden Punkt auf der Zahlengeraden erreichen könnten, was Q = R bedeuten würde? 2 ZAHLEN UND ZAHLENSYSTEME 13 Wir werden hier zeigen, dass die Menge der irrationalen Zahlen tatsächlich nicht leer ist (es gibt sogar unendlich viele irrationale Zahlen!). Bekannte irrationale Zahlen sind z. B. √ • 2 ' 1.414 . . . (Irrationalität bewiesen von Euklid, 3. Jh. v. Chr.), • e ' 2.718 . . . (Irrationalität bewiesen von L. Euler, 1737), • π ' 3.141 . . . (Irrationalität bewiesen von J. H. Lambert, 1761). √ Satz 2 2 ist eine irrationale Zahl. Für den Beweis benötigen wir den folgenden Hilfssatz: Lemma 1 Wenn für z ∈ Z die Zahl z 2 gerade ist, dann ist z gerade. Beweis des Lemmas: Für die logischen Aussagen P := z 2 ist gerade, Q := z ist gerade, behauptet der Hilfssatz, dass P ⇒ Q gilt. Wir wollen die nach Kap. 1.1 logisch äquivalente Aussage ¬Q ⇒ ¬P (Kontraposition) beweisen. Weil eine ganze Zahl entweder gerade oder ungerade ist, sind die Negationen von P und Q gegeben durch ¬P = z 2 ist ungerade, ¬Q = z ist ungerade. Es gelte also ¬Q, dann existiert eine Zahl k ∈ Z, so dass z = 2k + 1. Dann gilt 2 z 2 = (2k + 1) = 4k 2 + 4k + 1 = 2 2k 2 + 2k +1. | {z } ∈Z 2 Also ist z ungerade, d. h. es gilt ¬P , und die Kontraposition ist bewiesen. Für den Beweis des Satzes (nach Euklid) nehmen wir an, die Behauptung des Satzes sei falsch und leiten aus dieser Annahme einen Widerspruch her. Daraus folgt, dass die Behauptung des Satzes richtig sein muss. Man nennt dies einen indirekten oder Widerspruchsbeweis. √ Beweis von Satz 2: Sei also die Aussage 2 ∈ Q wahr, d. h. es existieren zwei √ Zahlen p, q ∈ Z, q 6= 0, so dass 2 = pq . Wir dürfen ohne Beschränkung der Allgemeinheit (o. B. d. A.) annehmen, dass ggT(p, q) = 1 (ggf. Kürzen). Durch Quadrieren erhalten wir 2 p p2 2= = 2 ⇒ p2 = 2q 2 , q q also ist p2 gerade und daher, nach dem Lemma, auch p gerade. Es existiert also eine ganze Zahl k ∈ Z, so dass p = 2k. Dann gilt 2 2q 2 = p2 = (2k) = 4k 2 ⇒ q 2 = 2k 2 . 2 ZAHLEN UND ZAHLENSYSTEME 14 Also ist q 2 gerade und daher, nach dem Lemma, auch q gerade. Weil p und q gerade sind, ist 2 ein gemeinsamer Teiler von p und q. Damit gilt aber ggT(p, q) ≥ 2, und dies ist ein Widerspruch zu unserer Annahme, dass ggT(p, q) = 1. Bemerkung: Wir sagen “Q liegt dicht in R”, weil jede reelle Zahl beliebig genau mit einer rationalen Zahl angenähert werden kann (Dirichletscher Approximationssatz; nach P. G. L. Dirichlet, 1805–1859; ohne Beweis). 2.2 Zahlensysteme Zahlensysteme dienen der Darstellung von Zahlen. Wir werden hier die sogenannten Stellenwertsysteme vorstellen, bei denen die Wertigkeit einer Ziffer von ihrer Position abhängt. Dazu gehören z. B. das Dezimal-, das Binär- oder das Hexadezimalsystem. 2.2.1 Darstellung natürlicher Zahlen Wird zur Darstellung einer Zahl ein Ziffernvorrat der Grösse b ∈ N verwendet, so spricht man von einer b-adischen Darstellung der Zahl, und die Zahl b heisst dann Basis des Stellenwertsystems. Der Ziffernvorrat ist typischerweise gegeben durch die Menge Zb := {0, . . . , b − 1}, wobei für b ≤ 10 die bekannten Ziffern 0, 1, 2, . . . , 9 verwendet und für b > 10 noch die Grossbuchstaben A, B, C, . . . , Z (entsprechend den “Ziffern” 10, 11, 12, . . . , 35) und wenn nötig weitere Zeichen hinzugezogen werden. Eine natürliche Zahl wird nun dargestellt durch eine Ziffernfolge an an−1 · · · a2 a1 a0 b , ai ∈ Zb , i = 0, . . . , n, an 6= 0 (das ist kein Produkt der Ziffern ai !), und dieser Ziffernfolge wird die Zahl x := a0 + a1 · b + a2 · b2 + a3 · b3 + · · · + an · bn ∈ N (7) zugeordnet. Man kann zeigen, dass diese Zuordnung eineindeutig ist, d. h. zu jeder Zahl x ∈ N existiert genau eine Ziffernfolge, deren zugeordneter Wert x ist. Beispiele: 1. Wir stellen die Zahl 143 ∈ N in verschiedenen Basen dar: 14310 = 100011112 = 2178 = 8F 16 . Es gilt in der Tat: • 14310 = 3 + 4 · 10 + 1 · 102 = 3 + 40 + 100 = 143 • 100011112 = 1 + 1 · 2 + 1 · 22 + 1 · 23 + 0 · 24 + 0 · 25 + 0 · 26 + 1 · 27 = 1 + 2 + 4 + 8 + 128 = 143, • 2178 = 7 + 1 · 8 + 2 · 82 = 7 + 8 + 128 = 143, • 8F 16 = 15 + 8 · 16 = 15 + 128 = 143. 2 ZAHLEN UND ZAHLENSYSTEME 15 2. Grosse Werte für b eignen sich für die Darstellung von sehr grossen Zahlen, weil die Anzahl benötigter Ziffern n zur Darstellung einer bestimmten Zahl x mit zunehmender Grösse des Ziffernvorrats b abnimmt: 2923465210 = 11011111000010101110111002 = 1BE15DC 16 = HELLO36 . Es gilt HELLO36 = 24 + 21 · 36 + 21 · 362 + 14 · 363 + 17 · 364 = 24 + 756 + 27216 + 653184 + 28553472 = 29234652. Bemerkungen: • Die Berechnung der Zahl x aus der Ziffernfolge an an−1 · · · a2 a1 a0 b ist recht einfach mit Formel (7) (s. Beispiele). Die umgekehrte Richtung, d. h. die Berechnung der Ziffernfolge in einem bestimmten Zahlensystem für eine gegebene Zahl, ist schwieriger und erfordert die Division mit Rest. Dafür sollten Sie ein Computerprogramm verwenden. • In MATLAB können Sie mit den Befehlen dec2base und base2dec natürliche Zahlen zwischen dem Dezimalsystem und einem beliebigen b-adischen System mit 2 ≤ b ≤ 36 umrechnen. Ausserdem gibt es die MATLABBefehle dec2bin, bin2dec, dec2hex und hex2dec für Umrechnungen zwischen Dezimal- und Binär- bzw. Hexadezimalsystem. • Für noch grössere Basen werden weitere ASCII-Zeichen zur Kodierung hinzugenommen, z. B. im Zahlensystem Base62. 2.2.2 Darstellung ganzer Zahlen Weil für x ∈ Z \ {0} entweder x ∈ N oder −x ∈ N gilt, so benötigen wir zur Darstellung von ganzen Zahlen lediglich noch ein Vorzeichen, + oder −, wobei + meistens weggelassen wird; es gilt also z. B. −23710 = −111011012 = −3558 = −ED16 . Damit gibt es für die Zahl 0 ∈ Z mehrere Darstellungen: 0 = −0 = +0. Für alle anderen ganzen Zahlen ist die Darstellung mittels Vorzeichen aber eindeutig. 2.2.3 Darstellung rationaler Zahlen Für x ∈ Q benötigen wir ebenfalls ein Vorzeichen, und wir erlauben in (7) zusätzlich negative Exponenten der Basis, wobei eine solche Darstellung auch unendlich lang sein kann: x := · · · + a−2 · b−2 + a−1 · b−1 + a0 + a1 · b + a2 · b2 + a3 · b3 + · · · + an · bn ∈ Q. (8) Den Wechsel zwischen negativen und nichtnegativen Exponenten bezeichnen wir mit einem “.”, so dass die Ziffernfolge für x so aussieht: an an−1 · · · a2 a1 a0 .a−1 a−2 · · ·b , ai ∈ Zb , i = . . . , −2, −1, 0, . . . , n, an 6= 0. 3 FUNKTIONEN 16 Beispiele: 1. 12.93510 = 5 · 10−3 + 3 · 10−2 + 9 · 10−1 + 2 + 1 · 10 = 2587 200 . 2. 110100.10112 = 1 · 2−4 + 1 · 2−3 + 0 · 2−2 + 1 · 2−1 + 0 + 0 · 2 + 1 · 22 + 0 · 23 + 1 · 24 + 1 · 25 = 843 16 = 52.687510 . 3. Für rationale Zahlen ist jede b-adische Darstellung entweder endlich oder unendlich periodisch. Welcher Fall eintritt, hängt von der Basis ab: 1 = 0.210 = 0.15 = 0.00112 , 5 1 = 0.310 = 0.13 . 3 4. Weil wir für rationale Zahlen unendliche Darstellungen zulassen müssen, ist die Darstellung nicht mehr eindeutig: 1 = 110 = 1.00010 = 1.010 = 0.910 . 2.2.4 Darstellung reeller Zahlen Reelle Zahlen können wir in derselben Weise darstellen wie rationale Zahlen, nur wird für irrationale Zahlen x ∈ R \ Q die Darstellung immer unendlich und nicht periodisch sein: e = 2.718281828459046 . . . , π = 3.141592653589793 . . . Mit Hilfe von Computern wurden mittlerweile bereits mehr als 1012 Nachkommastellen in den Dezimaldarstellungen von e und π berechnet. 3 Funktionen Wir werden hier zunächst allgemeine Funktionen einführen und uns dann auf rationale Funktionen konzentrieren, zu denen insbesondere die Polynomfunktionen gehören. 3.1 Definition und Darstellung einer Funktion Definition 12 (Funktion, Abbildung) Eine Funktion (oder Abbildung) ordnet jedem Element x aus einer Menge D genau ein Element y aus einer Menge W zu: f : D → W, x 7→ y = f (x). Bemerkungen: • Wir nennen D den Definitionsbereich und W den Wertebereich der Funktion f (manchmal schreibt man auch Df und Wf ). Das Element x ∈ D heisst Argument der Funktion oder unabhängige Variable, das Element y = f (x) ∈ W heisst Funktionswert oder abhängige Variable. Wir sagen auch, x werde durch f auf y abgebildet. 3 FUNKTIONEN 17 • Die Menge Gf := {(x, f (x)) | x ∈ D} ⊆ D × W heisst der Graph der Funktion f . Beispiele: 1. D := {1, 2, 3}, W := {a, b, c}, f : D → W definiert durch f (1) := b, f (2) := c, f (3) := b, ist eine Funktion. Beachten Sie, dass a ∈ W kein Funktionswert von f ist und dass b ∈ W der Funktionswert von mehreren Elementen aus D ist: f (1) = f (3) = b. Der Graph von f ist gegeben durch Gf = {(1, b), (2, c), (3, b)}. 2. D := {1, 2, 3}, W := {a, b, c}, f : D → W definiert durch f (1) := b, f (1) := c, f (2) := a ist keine Funktion, weil dem Element 3 ∈ D kein Element in W zugewiesen wird, und weil das Element 1 ∈ D mehreren Elementen in W zugewiesen wird. 3. Durch die Abbildungsvorschrift x 7→ y = x2 wird eine Funktion f : R → R definiert, deren Graph eine Parabel ist. Einige Funktionswerte von f sind x f (x) −3 9 0 0 4 7 16 49 1 1 √ 2 2 2 4 3 9 π π2 (Wertetabelle). f hat bei x = 0 eine sog. Nullstelle: f (0) = 0. 4. Eine Funktion kann abschnittsweise (oder stückweise) definiert werden, wie z. B. die Funktion x − 1, x ≤ 0 g(x) := , x ∈ R. x + 1, x > 0 Diese Funktion hat bei x = 0 eine sog. Sprungstelle. 5. Die Funktion h(x) = x1 ist definiert auf R \ {0}. h hat bei x = 0 eine sog. Polstelle. Der Graph von h ist eine Hyperbel. 6. Die Temperaturabhängigkeit des elektrischen Widerstands in einem Leiter kann näherungsweise durch eine quadratische Funktion der Form 2 R(T ) = R0 1 + a (T − T0 ) + b (T − T0 ) beschrieben werden (vgl. Vorlesung MESO). Hier ist die Temperatur T die unabhängige Variable und der Widerstand R die abhängige Variable. 3 FUNKTIONEN 18 Die Zahlen R0 , T0 , a, b sind Parameter der Funktion. Durch quadratische Ergänzung bringen wir diese Funktion in die sog. Scheitelpunktform: a2 a 2 + R0 1 − R(T ) = bR0 T − T0 − . 2b 4b Daraus lässt sich der Scheitelpunkt des Graphen der Funktion ablesen, und mit dem weiteren bekannten Punkt (T0 , R0 ) ∈ GR können wir schliesslich die Parabel skizzieren. 7. Eine Funktion f braucht nicht explizit in der Form y = f (x) dargestellt zu sein. Funktionen können auch implizit über eine Gleichung mit Unbekannten x und y definiert werden. Beispiele sind die Gleichungen 2x − y = 3, log y + x2 = 0, xy = 2, mit Lösungen y = 2x − 3, 2 y = e−x , y= 2 . x Bemerkung: Nicht jede Gleichung mit Variablen x und y definiert implizit eine Funktion! Z. B. definiert die Gleichung x2 + y 2 = 1 keine Funktion y = f (x), √ denn diese Gleichung hat für jedes x ∈ (−1, 1) zwei Lösungen, y = ± 1 − x2 . In diesen Beispielen haben Sie auch die wichtigsten Darstellungsformen für Funktionen gesehen: • analytisch (explizit, implizit), • als Wertetabelle, • grafisch. Definition 13 (Bild, Urbild) Sei f : D → W eine Funktion. 1. Für eine Menge A ⊆ D heisst die Menge f (A) := {f (x) ∈ W | x ∈ A} ⊆ W das Bild von A unter f . 2. Die Menge im(f ) := f (D) ⊆ W heisst Bild von f (englisch: image). 3. Für eine Menge B ⊆ W heisst die Menge f −1 (B) := {x ∈ D | f (x) ∈ B} ⊆ D das Urbild von B unter f . 3 FUNKTIONEN 19 Beispiele (Forts.): 3. Für die Funktion f : R → R, f (x) := x2 , gelten 4 16 2 f 2, , π = 4, , π , f ((1, 2]) = (1, 4] , im(f ) = [0, ∞) , 7 49 n √ √ o f −1 ({3, 4}) = −2, − 3, 3, 2 , f −1 ({−1}) = ∅. 4. Für die Funktion g : R → R, g(x) := x − 1, x ≤ 0 , gelten x + 1, x > 0 3 7 −1, , e = −2, , e + 1 , g ([1, 2]) = [2, 3], 4 4 1 1 g −1 ({−1, 2}) = {0, 1} , g −1 − , = ∅. 2 2 g im(g) = R \ (−1, 1], 5. Für die Funktion h : R \ {0} → R, h(x) := x1 , gelten 1 1 1 = −3, , h − , π, 5 , h ((0, 1]) = [1, ∞), im(h) = R \ {0} , 3 π 5 1 5 3 1 −1 −1 = −3, ,1 . , h 1, = h − ,3 3 3 3 5 Definition 14 (Einschränkung, Fortsetzung) Sei f : D → W eine Funktion und A ⊆ D, dann heisst die Funktion f |A : A → W, x 7→ y = f |A (x) := f (x), die Einschränkung von f auf A. Kann eine Funktion g : A → W als Einschränkung einer Funktion f : D → W geschrieben werden, g = f |A , so heisst f die Fortsetzung von g auf D. Beispiel: Sei D = R und f (x) = x2 . Sei A := [0, ∞) ⊆ D, dann ist die Funktion f |A : A → R, f |A (x) = x2 , die Einschränkung von f auf A. Definition 15 (Komposition) Für Mengen A, B, C und Funktionen f : A → B, g : B → C ist die Komposition (oder Hintereinanderausführung) g ◦ f : A → C definiert durch x 7→ (g ◦ f ) (x) := g (f (x)) , x ∈ A. (9) Bemerkung: Für den Ausdruck g ◦ f sagen wir “g nach f ” oder etwas salopp einfach “g Kringel f ”. Beachten Sie die Reihenfolge der Funktionsauswertungen von innen nach aussen (erst f , dann g). 3 FUNKTIONEN 20 Beispiele: q 1. Aus Serie 3, Aufgabe 2b, kennen Sie die Funktion f (x) = x2 − 21 x − 3. √ Mit g(x) := x2 − 21 x − 3 und h(y) := y schreiben wir diese als Komposition, f = h ◦ g. In der Aufgabe haben Sie gesehen, dass der Definitionsbereich von g so eingeschränkt werden muss, dass das Bild von g im Definitionsbereich von h enthalten ist. 2. Wir betrachten die linearen Abbildungen f : Rp → Rn , f (x) := Bx und g : Rn → Rm , g(y) := Ay, mit Matrizen A ∈ Rm×n und B ∈ Rn×p . Die Komposition g ◦ f : Rp → Rm ist wieder eine lineare Abbildung, gegeben durch (g ◦ f ) (x) = ABx, mit dem Matrixprodukt AB ∈ Rm×p (vgl. Vorlesung MLAE). 3.2 Allgemeine Funktionseigenschaften In diesem Kapitel werden wir einige Eigenschaften von Funktionen definieren, und diese später für die rationalen Funktionen überprüfen. Definition 16 (Injektivität, Surjektivität, Bijektivität) Eine Funktion f : D → W heisst injektiv genau dann, wenn surjektiv genau dann, wenn bijektiv genau dann, wenn ∀ x1 , x2 ∈ D : x1 6= x2 ⇒ f (x1 ) 6= f (x2 ), ∀y ∈ W ∃x ∈ D : y = f (x), f injektiv und surjektiv ist. Bemerkungen: • Ist f injektiv, so existiert für jedes Element y ∈ W höchstens ein Element x ∈ D, das durch f auf y abgebildet wird. • f ist surjektiv genau dann, wenn im(f ) = W , d. h. alle Werte in W werden auch tatsächlich angenommen. Jede Funktion f : D → W wird surjektiv, wenn ihr Wertebereich auf im(f ) ⊆ W verkleinert wird. • Ist f bijektiv, so existiert für jedes Element y ∈ W genau ein Element x ∈ D, das durch f auf y abgebildet wird. Daher ist eine bijektive Funktion umkehrbar, d. h. es existiert die Umkehrfunktion f −1 : W → D, y 7→ x = f −1 (y). Verwechseln Sie die Umkehrfunktion nicht mit dem Urbild! Das Urbild einer Menge kann für jede Funktion berechnet werden, die Umkehrfunktion dagegen existiert nur für bijektive Funktionen. Beispiel: Sei f (x) = x2 . Dann ist f nicht injektiv auf R, denn wir erhalten z. B. für x ∈ {−3, 3} denselben Funktionswert: f (−3) = f (3) = 9. f ist auch nicht surjektiv auf R, denn es existiert z. B. kein x ∈ R, so dass x2 = −1. f ist jedoch surjektiv auf [0, ∞). Die Einschränkung g := f |[0,∞) ist bijektiv, und die √ Umkehrfunktion ist gegeben durch g −1 (y) = y. 3 FUNKTIONEN 21 Definition 17 (Nullstelle) Sei W = R. Eine Funktion f : D → W besitzt in x0 ∈ D eine Nullstelle, falls f (x0 ) = 0. Bemerkungen: • In einer Nullstelle von f schneidet oder berührt der Graph von f die xAchse. Das Urbild f −1 ({0}) enthält genau die Nullstellen von f . • Jede Gleichung in einer Variablen kann nach einer geeigneten Wahl der Funktion f in die Form f (x) = 0 gebracht werden. Jede Nullstelle der Funktion f ist dann eine Lösung der Gleichung. Hat die Funktion keine Nullstelle, so hat die Gleichung auch keine Lösung. Beispiel: Wir wollen die Gleichung e−x = x2 − 4 lösen. Dieses Problem ist äquivalent dazu, eine Nullstelle der Funktion f : R → R, f (x) := e−x − x2 + 4, zu finden. y = e−x − x2 + 4 10 8 y 6 4 2 0 −2 −3 −2 −1 0 x 1 2 3 Eine Näherung für die Nullstelle, x0 ' 2.032488, kann numerisch bestimmt werden. Definition 18 (Monotonie) Seien D, W ⊆ R. Eine Funktion f : D → W heisst monoton wachsend genau dann, wenn ∀ x1 , x2 ∈ D, x1 < x2 : f (x1 ) ≤ f (x2 ), streng monoton wachsend genau dann, wenn ∀ x1 , x2 ∈ D, x1 < x2 : f (x1 ) < f (x2 ), monoton fallend genau dann, wenn ∀ x1 , x2 ∈ D, x1 < x2 : f (x1 ) ≥ f (x2 ), streng monoton fallend genau dann, wenn ∀ x1 , x2 ∈ D, x1 < x2 : f (x1 ) > f (x2 ). Bemerkung: Streng monotone Funktionen sind injektiv. Dies folgt direkt aus einem Vergleich der Definitionen 16 und 18. Beispiel: Die Funktion f : R → R, f (x) = x2 , ist nicht monoton. Die Einschränkung g := f |[0,∞) : [0, ∞) → [0, ∞) ist hingegen streng monoton wachsend: Seien 0 ≤ x1 < x2 . Dann gilt g(x2 ) − g(x1 ) = x22 − x21 = (x2 − x1 )(x1 + x2 ) > 0, 3 FUNKTIONEN 22 weil beide Klammerausdrücke positive Werte haben. Also gilt g(x1 ) < g(x2 ). Definition 19 (Symmetrie) Seien D, W ⊆ R. Eine Funktion f : D → W heisst gerade genau dann, wenn f (−x) = f (x) ungerade genau dann, wenn f (−x) = −f (x) ∀ x ∈ D, ∀ x ∈ D. Bemerkung: Eine Funktion ist genau dann gerade, wenn ihr Graph achsensymmetrisch zur y-Achse ist. Eine Funktion ist genau dann ungerade, wenn ihr Graph punktsymmetrisch zum Koordinatenursprung ist. Beispiel: Die Funktion f : R → R, f (x) = x3 , ist ungerade: Für x ∈ R gilt f (−x) = (−x)3 = −x3 = −f (x). Definition 20 (Periodizität) Seien D, W ⊆ R. Eine Funktion f : D → W heisst periodisch, falls ∃ P 6= 0 : x + P ∈ D ∧ f (x + P ) = f (x) ∀ x ∈ D. Die Zahl P heisst dann eine Periode der Funktion. Bemerkung: Für eine Funktion mit Periode P gilt f (x + kP ) = f (x + (k − 1)P + P ) = f (x) x ∈ D, k ∈ Z. Eine P -periodische Funktion ist daher auch kP -periodisch für k ∈ Z \ {0}. In der Regel sind wir an der kleinsten positiven Periode interessiert. Beispiel: Die Sinusfunktion sin : R → [−1, 1], y = sin x, ist periodisch mit (kleinster positiver) Periode 2π. Definition 21 (Extrempunkte) Seien D, W ⊆ R. Eine Funktion f : D → W hat in x0 ∈ D ein • lokales Minimum, wenn ein Intervall I mit x0 ∈ I existiert, so dass f (x0 ) ≤ f (x) ∀ x ∈ D ∩ I, • globales Minimum, wenn f (x0 ) ≤ f (x) ∀ x ∈ D, • lokales Maximum, wenn ein Intervall I mit x0 ∈ I existiert, so dass f (x0 ) ≥ f (x) ∀ x ∈ D ∩ I, • globales Maximum, wenn f (x0 ) ≥ f (x) ∀ x ∈ D. Hat f in x0 ∈ D einen Extremwert (Minimum oder Maximum), so heisst der Punkt (x0 , f (x0 )) ∈ Gf ein Extrempunkt des Graphen von f . Bemerkung: Ein globales Extremum (Minimum oder Maximum) ist auch ein lokales Extremum (wähle ein beliebiges Intervall I mit x0 ∈ I). 3.3 Rationale Funktionen Wir beschränken uns im Folgenden auf reellwertige Funktionen einer reellen Variablen, d. h. D, W ⊆ R. 3 FUNKTIONEN 3.3.1 23 Ganzrationale Funktionen (Polynomfunktionen) Definition 22 (Potenzfunktion) Eine Potenzfunktion ist eine Funktion f von der Form f (x) = axr , a, r ∈ R. Definition 23 (ganzrationale Funktion, Polynomfunktion) Eine ganzrationale Funktion oder Polynomfunktion (oder kurz ein Polynom) ist eine Summe von Potenzfunktionen mit natürlichen Exponenten: p(x) = n X ai xi := a0 + a1 x + a2 x2 + · · · + an xn , (10) i=0 mit n ∈ N0 , ai ∈ R, i = 0, 1, . . . , n, und an 6= 0 falls n ≥ 1. Bemerkungen: • Die Zahl n ∈ N heisst der Grad des Polynoms, die n+1 Zahlen a0 , a1 , . . . , an ∈ R seine Koeffizienten. Der Koeffizient an wird als Leitkoeffizient bezeichnet. • Eine Polynomfunktion ist vollständig bestimmt durch ihren Koeffizienten> vektor (a0 , a1 , . . . , an ) ∈ Rn+1 . • Gilt a0 = a1 = · · · = an−1 = 0, so erhalten wir eine Potenzfunktion: y = an xn . • Polynomfunktionen können auf allen reellen Zahlen x ∈ R definiert werden. Beispiele: 1. Eine konstante Funktion hat Grad n = 0 und ist daher von der Form p(x) = a0 ∈ R. Ein Spezialfall ist die Nullfunktion: p(x) = 0 ∀ x ∈ R. 2. Eine lineare Funktion hat Grad n = 1. Lineare Funktionen werden typischerweise in der Form y = mx + q, m, q ∈ R, m 6= 0, geschrieben. 3. Eine quadratische Funktion hat Grad n = 2. Quadratische Funktion werden typischerweise in der Form y = ax2 + bx + c, a, b, c ∈ R, a 6= 0, geschrieben. 4. Eine kubische Funktion hat Grad n = 3. Kubische Funktionen werden typischerweise in der Form y = ax3 + bx2 + cx + d, a, b, c, d ∈ R, a 6= 0, geschrieben. Im Folgenden werden wir die Eigenschaften von Polynomfunktionen mit Grad n = 0, 1, 2, 3 diskutieren. Wir betrachten hier immer D = W = R. Beachten Sie, dass durch Einschränkung des Definitions- oder Wertebereichs zusätzliche Eigenschaften erhalten werden können! 3 FUNKTIONEN 24 Konstante Funktionen Satz 3 (Eigenschaften konstanter Funktionen) Sei p : R → R, x 7→ p(x) = a0 ∈ R, eine konstante Funktion. Dann gelten 1. p ist weder injektiv noch surjektiv (und damit auch nicht bijektiv), 2. p ist sowohl monoton wachsend als auch monoton fallend, 3. p ist gerade und im Fall a0 = 0 (Nullfunktion) auch ungerade, 4. p ist periodisch mit beliebiger Periode P ∈ R \ {0}. Insbesondere hat p keine kleinste positive Periode, 5. p hat in jedem Punkt x ∈ R ein globales Minimum und ein globales Maximum. Der Graph einer konstanten Funktion ist eine zur x-Achse parallele Gerade. Daher hat eine konstante Funktion, abgesehen von der Nullfunktion, keine Nullstelle. Eine konstante Funktion p ist bereits durch einen Punkt (x, y) ∈ Gp eindeutig bestimmt. Lineare Funktionen Satz 4 (Eigenschaften linearer Funktionen) Sei p : R → R, x 7→ p(x) = mx+q, m, q ∈ R, m 6= 0, eine lineare Funktion. Dann gelten 1. p ist bijektiv mit Umkehrfunktion p−1 (y) = (y − q)/m, y ∈ R, 2. p ist streng monoton wachsend genau dann, wenn m > 0 und streng monoton fallend genau dann, wenn m < 0, 3. p ist ungerade genau dann, wenn q = 0, 4. p ist nicht periodisch, 5. der Graph von p hat keine Extrempunkte. Der Graph einer linearen Funktion ist eine Gerade mit Steigung m: p(x2 ) − p(x1 ) mx2 + q − (mx1 + q) mx2 − mx1 = = = m. x2 − x1 x2 − x1 x2 − x1 Die Schnittpunkte mit den Koordinatenachsen sind gegeben durch q − ,0 und (0, q) . m Daher heisst q ∈ R auch der y-Achsenabschnitt. Eine lineare Funktion hat eine Nullstelle bei x = −q/m. 3 FUNKTIONEN 25 Eine lineare Funktion p ist durch zwei Punkte auf dem Graphen eindeutig bestimmt: Seien (x1 , y1 ), (x2 , y2 ) ∈ Gp mit x1 6= x2 gegeben. Dann gelten die Gleichungen p(x1 ) = mx1 + q = y1 , p(x2 ) = mx2 + q = y2 . (11) Wir schreiben (11) als lineares Gleichungssystem für die unbekannten Koeffizienten m und q: x1 1 m y1 = . x2 1 q y2 Die Determinante der Matrix ist gegeben durch x1 − x2 6= 0, und daher hat dieses lineare Gleichungssystem eine eindeutige Lösung: y1 −y2 1 1 −1 y1 m x1 −x2 . = = x1 y2 −x2 y1 −x2 x1 y2 q x1 − x2 x1 −x2 Quadratische Funktionen Satz 5 (Eigenschaften quadratischer Funktionen) Sei p : R → R, x 7→ p(x) = ax2 + bx + c, a, b, c ∈ R, a 6= 0, eine quadratische Funktion. Dann gelten 1. p ist weder injektiv noch surjektiv (und damit auch nicht bijektiv), 2. p ist nicht monoton, 3. p ist gerade genau dann, wenn b = 0, 4. p ist nicht periodisch, b 5. p hat in x = − 2a ein globales Minimum, falls a > 0 und ein globales Maximum, falls a < 0. Der Graph einer quadratischen Funktion ist eine Parabel. Diese ist • nach oben geöffnet genau dann, wenn a > 0, • nach unten geöffnet genau dann, wenn a < 0. Der Schnittpunkt des Graphen mit der y-Achse ist (0, c). Für die Schnittpunkte des Graphen mit der x-Achse müssen wir die quadratische Gleichung ax2 + bx + c = 0 (12) 3 FUNKTIONEN 26 lösen. Diese erhält man durch quadratische Ergänzung: ax2 + bx + c = 0 | · 4a (13) 2 2 4a x + 4abx + 4ac = 0 2 2 2 2 4a x + 4abx + b − b + 4ac = 0 2 (2ax + b) − D = 0 2 (2ax + b) = D √ 2ax + b = ± D √ 2ax = −b ± D √ −b ± D x= . 2a (14) 2 |D := b − 4ac (15) |+D √ | · (16) (17) |−b (18) | : 2a (19) (20) Die quadratische Gleichung hat also zwei Lösungen √ −b ± b2 − 4ac ∈ C. x1,2 = 2a (21) Die Diskriminante D = b2 − 4ac ∈ R erlaubt die folgende Fallunterscheidung für die reellen Nullstellen einer quadratischen Funktion: D > 0: zwei reelle Nullstellen, b D = 0: eine (doppelte) reelle Nullstelle, x1 = x2 = − 2a , D < 0: keine reelle Nullstelle. Beispiel: Finde die Nullstellen der quadratischen Funktion p(x) = −2x2 +4x+6. Die Koeffizienten sind gegeben durch a = −2, b = 4 und c = 6. Wir erhalten die Diskriminante D = b2 − 4ac = 64 > 0, also hat die Funktion zwei reelle Nullstellen: √ √ −b ± b2 − 4ac −4 ± 64 −4 ± 8 x1,2 = = = = 1 ∓ 2 ∈ {−1, 3}. 2a −4 −4 Die beiden Nullstellen x1 , x2 erlauben die Zerlegung der quadratischen Funktion in Linearfaktoren: p(x) = a (x − x1 ) (x − x2 ) = ax2 − a (x1 + x2 ) x + ax1 x2 . Durch Vergleich mit der allgemeinen Form erhalten wir die Gleichungen (F. Vieta, 1540–1603) c b (22) x1 + x2 = − , x 1 x2 = . a a Diese Gleichungen sind nützlich, um Polynomfunktionen mit vorgegebenen Nullstellen zu finden. Beispiel: Finde eine quadratische Funktion mit Nullstellen x1,2 ∈ {2, 3}. Mit (22) erhalten wir die Gleichungen b c 2+3=5=− , 2·3=6= a a ⇔ b = −5a, c = 6a. 3 FUNKTIONEN 27 Also sind die quadratischen Funktionen mit den vorgegebenen Nullstellen von der Form p(x) = ax2 − 5ax + 6a, wobei a ∈ R \ {0} beliebig ist. Die Scheitelpunktform einer quadratischen Funktion ist gegeben durch 2 p(x) = a (x − xs ) + ys , (23) wobei der Punkt (xs , ys ) den Scheitelpunkt des Graphen bezeichnet. Durch Ausmultiplizieren und Vergleich mit der allgemeinen Form einer quadratischen Funktion finden wir b2 b (24) xs = − , y s = c − . 2a 4a Der Graph der quadratischen Funktion ist achsensymmetrisch zur Geraden x = xs . Der Scheitelpunkt (xs , ys ) ist auch der einzige Extrempunkt des Graphen von p. Beispiel: Für die quadratische Funktion p(x) = −2x2 + 4x + 6 (a = −2, b = 4, c = 6) erhalten wir die Scheitelpunktkoordinaten xs = − b 4 =− = 1, 2a 2 (−2) ys = c − b2 42 =6− = 8. 4a 4 (−2) Weil a < 0 hat die Funktion p bei x = 1 ein globales Maximum. Eine quadratische Funktion p(x) = ax2 +bx+c ist durch drei Punkte auf dem Graphen eindeutig bestimmt: Seien (x1 , y1 ), (x2 , y2 ), (x3 , y3 ) ∈ Gp , x1 , x2 , x3 paarweise verschieden, gegeben, dann erhalten wir das folgende lineare Gleichungssystem für die unbekannten Koeffizienten a, b, c: 2 y1 x1 x1 1 a x22 x2 1 b = y2 . y3 x23 x3 1 c Die Lösung ist gegeben durch a = b = c = x1 (y2 − y3 ) − x2 (y1 − y3 ) + x3 (y1 − y2 ) , (x1 − x2 )(x1 − x3 )(x2 − x3 ) x21 (y2 − y3 ) − x22 (y1 − y3 ) + x23 (y1 − y2 ) , (x1 − x2 )(x1 − x3 )(x2 − x3 ) x2 x3 y1 x1 x3 y2 x1 x2 y3 − + . (x1 − x2 )(x1 − x3 ) (x1 − x2 )(x2 − x3 ) (x1 − x3 )(x2 − x3 ) − Weil das Gleichungssystem mit zunehmendem Polynomgrad immer grösser wird, bestimmt man die Koeffizienten im Allgemeinen numerisch. Wir werden bei der Interpolation noch einmal darauf zurück kommen. 3 FUNKTIONEN 28 Kubische Funktionen Satz 6 (Eigenschaften kubischer Funktionen) Sei p : R → R, x 7→ p(x) = ax3 + bx2 + cx + d, a, b, c, d ∈ R, a 6= 0, eine kubische Funktion. Dann gelten 1. p ist surjektiv und im Falle von b2 ≤ 3ac auch injektiv, 2. p ist streng monoton, falls b2 ≤ 3ac: die Funktion ist in diesem Fall streng monoton steigend, wenn a > 0 und streng monoton fallend, wenn a < 0, 3. p ist ungerade genau dann, wenn b = d = 0, 4. p ist nicht periodisch, 5. p hat zwei lokale Extrema bei x = √ −b± b2 −3ac , 3a falls b2 > 3ac. Der Schnittpunkt des Graphen einer kubischen Funktion mit der y-Achse ist (0, d). Für die Schnittpunkte des Graphen mit der x-Achse müssen wir die kubische Gleichung ax3 + bx2 + cx + d = 0 (25) lösen. Diese Gleichung hat drei Lösungen in C. Mit der Variablentransformation b x = z − 3a wird die allgemeine kubische Gleichung reduziert zu z 3 + 3pz + 2q = 0, 3p = c b2 − 2, a 3a 2q = 2b3 bc d − 2+ . 27a3 3a a (26) Diese reduzierte Gleichung kann nun mit den Cardanischen Formeln (G. Cardano, 1545) gelöst werden. Wir zeigen hier nur die Fallunterscheidung anhand der Diskriminante D := q 2 + p3 : D > 0: eine (einfache) reelle Nullstelle, D = 0: entweder eine doppelte und eine einfache relle Nullstelle oder eine dreifache reelle Nullstelle, D < 0: drei verschiedene reelle Nullstellen. Bemerkung: Aus dieser Fallunterscheidung folgt, dass jede kubische Funktion mindestens eine reelle Nullstelle hat! Beispiel: Wir betrachten die kubische Funktion y = −2x3 + x + 4 mit Koeffizienten a = −2, b = 0, c = 1, d = 4. Wir erhalten 3p = 1 4 , 2q = −2 −2 ⇒ 1 p = − , q = −1. 6 1 Damit erhalten wir für die Diskriminante q 2 + p3 = 1 − 216 = 215 216 > 0, also hat die Funktion eine einfache reelle Nullstelle (bei x ' 1.392). Die Formeln von Vieta für die drei Nullstellen x1 , x2 , x3 lauten b x1 + x2 + x3 = − , a x 1 x2 + x1 x3 + x2 x3 = c , a d x 1 x2 x3 = − . a (27) 3 FUNKTIONEN 29 Beispiel: Finde eine kubische Funktion mit Nullstellen x1 , x2 , x3 ∈ −1, 34 , 3 . Mit (27) erhalten wir 4 10 b +3= =− 3 3 a 4 4 1 c (−1) · + (−1) · 3 + · 3 = − = 3 3 3 a d 4 (−1) · · 3 = −4 = − 3 a −1 + 10 a, 3 1 ⇔ c = − a, 3 ⇔ b=− ⇔ d = 4a. Die gesuchte Funktion ist also von der Form p(x) = ax3 − 10 2 1 ax − ax + 4a, 3 3 a ∈ R \ {0} . 4900 Die Diskriminante der zugehörigen kubischen Gleichung ist D = − 2187 < 0, wie erwartet. Allgemeine Polynomfunktionen Satz 7 (Abspaltung eines Linearfaktors) Besitzt eine Polynomfunktion p vom Grad n ∈ N an der Stelle x1 ∈ R eine Nullstelle, gilt also p(x1 ) = 0, so ist p auch in der Form p(x) = (x − x1 )p1 (x) darstellbar. Der Faktor (x − x1 ) heisst ein Linearfaktor, und p1 ist ein Polynom vom Grad n − 1. Bemerkung: Die Funktion p1 kann mittels Polynomdivision bestimmt werden. Hat p1 eine relle Nullstelle, so kann der Satz 7 auf p1 angewendet werden. Beispiele: 1. Die kubische Funktion p(x) = x3 − 2x2 − 5x + 6 hat eine Nullstelle bei x1 = 1: p(1) = 1 − 2 − 5 + 6 = 0. Also können wir den Linearfaktor x − 1 abspalten: x3 x3 − 2x2 − x2 − x2 − x2 − 5x + 6 − 5x + x − 6x − 6x + 6 + + 6 6 0 : x−1 = x2 − x − 6 Also ist die quadratische Funktion p1 gegeben durch p1 (x) = x2 − x − 6. Für p1 finden wir die zwei Nullstellen √ 1 ± 1 + 24 1±5 1 5 x2,3 = = = ± ∈ {−2, 3} . 2 2 2 2 3 FUNKTIONEN 30 Es gilt also p1 (x) = (x + 2)(x − 3) und damit ist die kubische Funktion p vollständig in Linearfaktoren zerlegt: p(x) = (x − 1)(x + 2)(x − 3). 2. Die kubische Funktion p(x) = 3x3 + 4x2 + x + 10 hat eine Nullstelle bei x1 = −2: p(−2) = 3 · (−8) + 4 · 4 + (−2) + 10 = 0. Also können wir den Linearfaktor x + 2 abspalten. Wir klammern zunächst eine 3 aus: p(x) = 3 x3 + 34 x2 + 13 x + 10 und dividieren dann: 3 x3 x3 + + − − 4 2 3x 2 2x 2 2 3x 2 2 3x + 1 3x + 10 3 + − 1 3x 4 3x 5 3x 5 3x + 10 3 + + 10 3 10 3 : x+2 = x2 − 23 x + 5 3 0 Also ist die Funktion p1 gegeben durch p1 (x) = x2 − 23 x + 35 . Mit Hilfe der Diskriminante 4 5 56 D = −4· =− <0 9 3 3 erkennen wir, dass p1 keine reellen Nullstellen hat – die quadratische Funktion ist irreduzibel über R. Die Funktion p kann also in einen linearen und einen irreduziblen quadratischen Faktor zerlegt werden: 2 5 2 p(x) = 3(x + 2) x − x + 3 3 3. Die kubische Funktion p(x) = 2x3 +2x2 −10x+6 hat eine Nullstelle bei x = −3: p(−3) = −54+18+30+6 = 0. Also können wir den Linearfaktor x+3 abspalten. Wir klammern zunächst eine 2 aus: p(x) = 2 x3 + x2 − 5x + 3 und dividieren dann: x3 x3 + + − − x2 3x2 2x2 2x2 − 5x + 3 : x+3 = x2 − 2x + 1 − 5x + 3 − 6x x + 3 x + 3 0 Also ist die Funktion p1 gegeben durch p1 (x) = x2 − 2x + 1. Mit Hilfe der Diskriminante D =4−4=0 erkennen wir, dass p1 eine doppelte reelle Nullstelle hat: x2,3 = 2 = 1. 2 3 FUNKTIONEN 31 Damit gilt p1 (x) = (x − 1)2 , und die kubische Funktion ist vollständig in Linearfaktoren zerlegt: 2 p(x) = 2 (x + 3) (x − 1) . Im Allgemeinen gilt der Satz 8 (C. F. Gauss, 1799) Jede Polynomfunktion vom Grad n ∈ N0 mit reellen Koeffizienten lässt sich in Linearfaktoren und über R irreduzible quadratische Faktoren zerlegen, d. h. j p(x) = an (x − x1 ) 1 · · · (x − x` ) j` mit x1 , . . . , x` , b1 , . . . , bm , c1 , . . . , cm j1 , . . . , j` , k1 , . . . , km ∈ N. x 2 + b1 x + c 1 k 1 · · · x2 + bm x + cm km , (28) ∈ R, b2i − 4ci < 0, i = 1, . . . , m, und mit Bemerkungen: • Dies ist eine Form des Fundamentalsatzes der Algebra. In der Vorlesung MLAE werden Sie noch eine andere Formulierung dieses Satzes kennen lernen. • Die Zahlen x1 , . . . , x` ∈ R sind genau die (verschiedenen) reellen Nullstellen der Polynomfunktion p. Die Exponenten j1 , . . . , j` sind die Vielfachheiten dieser Nullstellen (in Beispiel 3 oben haben wir gesehen, dass Nullstellen mehrfach auftreten können). • Die quadratischen Faktoren von der Form x2 + bi x + ci sind genau dann irreduzibel über R (keine reelle Nullstelle), wenn b2i − 4ci < 0. Diese Faktoren haben je zwei Nullstellen in C \ R. Beispiele (Forts.): 1. Die kubische Funktion p(x) = x3 − 2x2 − 5x + 6 hat die Zerlegung (28) mit ` = 3, m = 0, n = 3, a3 = 1, x1 = 1, x2 = −2, x3 = 3, j1 = j2 = j3 = 1. 2. Die kubische Funktion p(x) = 3x3 + 4x2 + x + 10 hat die Zerlegung (28) mit ` = 1, m = 1, n = 3, a3 = 3, x1 = −2, 2 5 b1 = − , c1 = , 3 3 j1 = k1 = 1. 3. Die kubische Funktion p(x) = 2x3 + 2x2 − 10x + 6 hat die Zerlegung (28) mit ` = 2, m = 0, n = 3, a3 = 2, x1 = −3, x2 = 1, j1 = 1, j2 = 2. 3 FUNKTIONEN 32 Für ein Polynom vom Grad n ∈ N0 mit Zerlegung (28) muss gelten: n = j1 + · · · + j` + 2 (k1 + · · · + km ) . Daraus folgen Korollar 1 (Reelle Nullstellen von Polynomfunktionen mit reellen Koeffizienten) 1. Jede Polynomfunktion vom Grad n ∈ N mit reellen Koeffizienten hat höchstens n reelle Nullstellen. 2. Jede Polynomfunktion von ungeradem Grad mit reellen Koeffizienten hat mindestens eine reelle Nullstelle. Bemerkungen: • Zur Berechnung der Nullstellen von Polynomfunktionen gibt es allgemeine Lösungsformeln mit Wurzelausdrücken bis zum Grad 4: n = 1: x = −q/m n = 2: x1,2 = √ −b± b2 −4ac 2a n = 3: Cardanische Formeln (G. Cardano, 1545) n = 4: L. Ferrari, 1522–1565 (veröffentlicht ebenfalls von Cardano, 1545) n ≥ 5: Es gibt keine allgemeine Lösungsformel mit Wurzelausdrücken (Satz von Abel-Ruffini; nach N. H. Abel, 1823 und P. Ruffini, 1799) • Für Nullstellen spezieller Polynomfunktionen können natürlich Wurzel√ ausdrücke existieren! So ist z. B. 5 2 eine Nullstelle des Polynoms x5 − 2. 3.3.2 Interpolationspolynome Wenn zu gegebenen, diskreten Daten (z. B. Messwerten) eine Funktion gesucht ist, die diese Daten abbildet, dann sprechen wir von einem Interpolationsproblem. Die gesuchte Funktion interpoliert die gegebenen Daten. Wenn wir anstatt beliebigen Funktionen nur Polynomfunktionen zulassen, so erhalten wir die Interpolationspolynome. Vektorraum der Polynomfunktionen vom Grad ≤ n Sei n ∈ N0 , dann definieren wir die Menge Pn := {p : R → R | p Polynomfunktion, deg p ≤ n} , wobei deg p den Grad einer Polynomfunktion p bezeichnet (vgl. Bemerkung nach Def. 23). Pn ist also die Menge aller Polynomfunktionen vom Grad ≤ n. Im Kap. 3.3.1 hatten wir bemerkt, dass eine Polynomfunktion vom Grad n eindeutig durch ihren Koeffizientenvektor in Rn+1 bestimmt ist. Indem wir ggf. diesen Koeffizientenvektor mit Nullen ergänzen, können wir jede Funktion 3 FUNKTIONEN 33 p ∈ Pn mit einem Vektor in Rn+1 darstellen: seien p, q ∈ Pn mit deg p = n und deg q = m < n, so schreiben wir die Funktionen p, q in der Form p(x) = a0 + a1 x + a2 x2 + · · · + an xn , q(x) = b0 + b1 x + b2 x2 + · · · + bm xm + 0 · xm+1 + · · · + 0 · xn , mit (ergänzten) Koeffizientenvektoren a0 a1 a2 .. . an , b0 b1 b2 .. . bm 0 .. . ∈ Rn+1 . 0 Beispiel: Für die Polynomfunktionen p(x) = 2x2 + 4x + 1, q(x) = x − 3 gilt deg p = 2, deg q = 1, und daher p, q ∈ P2 . Die (ergänzten) Koeffizientenvektoren sind gegeben durch −3 1 a = 4 ∈ R3 , b = 1 ∈ R3 . 0 2 Mit Hilfe der Darstellung von Polynomfunktionen über (ergänzte) Koeffizientenvektoren kann die Addition von Polynomfunktionen über eine Vektoraddition beschrieben werden: seien p, q ∈ Pn mit (ergänzten) Koeffizientenvektoren a, b ∈ Rn+1 , dann ist die Summe wieder eine Polynomfunktion vom Grad ≤ n, p + q ∈ Pn , mit (p + q) (x) := p(x) + q(x) = a0 + a1 x + a2 x2 + · · · + an xn + +b0 + b1 x + b2 x2 + · · · + bn xn = a0 + b0 + (a1 + b1 ) x + (a2 + b2 ) x2 + (an + bn ) xn , und der (ergänzte) Koeffizientenvektor c ∈ Rn+1 von p + q ist gegeben durch die Summe der (ergänzten) Koeffizientenvektoren von p und q: a0 + b0 a1 + b1 c = a + b = a2 + b2 ∈ Rn+1 . .. . an + bn Auch die Multiplikation einer Polynomfunktion p ∈ Pn mit einer reellen Zahl λ ∈ R kann mit Hilfe des (ergänzten) Koeffizientenvektors a ∈ Rn+1 von p 3 FUNKTIONEN 34 dargestellt werden: es gilt (λp) (x) := λp(x) = λ a0 + a1 x + a2 x2 + · · · + an xn = λa0 + λa1 x + λa2 x2 + · · · + λan xn , und damit λp ∈ Pn mit (ergänztem) Koeffizientenvektor λa0 λa1 λa = λa2 ∈ Rn+1 . .. . λan Zusammen mit den oben dargestellten Operationen Addition und Skalarmultiplikation wird Pn zu einem (n + 1)-dimensionalen Vektorraum über R. Das neutrale Element ist die Nullfunktion 0 ∈ Pn mit (ergänztem) Koeffizientenvektor 0 ∈ Rn+1 . Die Standardbasis von Pn ist gegeben durch 1, x, x2 , . . . , xn ⊆ Pn , entsprechend der Standardbasis des zientenvektoren: 0 1 0 1 0 0 0 0 , , .. .. . . 0 0 0 0 Vektorraums Rn+1 der (ergänzten) Koeffi0 0 1 0 .. . ,..., 0 0 ⊆ Rn+1 . 0 1 0 0 0 0 .. . Interpolationsproblem Für n ∈ N0 seien n + 1 Stützpunkte (x0 , y0 ) , (x1 , y1 ) , (x2 , y2 ) , . . . , (xn , yn ) ∈ R2 , mit Stützstellen x0 < x1 < x2 < · · · < xn und Stützwerten y0 , y1 , y2 , . . . , yn ∈ R gegeben. Die Stützpunkte können z. B. durch Messungen einer unbekannten Funktion gewonnen werden. Gesucht ist eine Polynomfunktion p ∈ Pn (i. d. R. von möglichst niedrigem Grad), die mit der unbekannten Funktion in den n + 1 Stützstellen übereinstimmt: p(xi ) = yi , i = 0, . . . , n. (29) Jede Lösung p ∈ Pn dieses Interpolationsproblems ist dann eine Näherungsfunktion für die unbekannte Funktion. 3 FUNKTIONEN 35 Lineares Gleichungssystem Seien n + 1 Basisfunktionen fj ∈ Pn , j = 0, . . . , n, gegeben, dann hat die gesuchte Polynomfunktion p ∈ Pn in dieser Basis die Darstellung p(x) = c0 f0 (x) + c1 f1 (x) + · · · + cn fn (x), (30) mit unbekanntem Koeffizientenvektor c ∈ Rn+1 . Durch Einsetzen von (30) in (29) erhalten wir ein lineares Gleichungssystem für c: y0 f0 (x0 ) f1 (x0 ) · · · fn (x0 ) c0 f0 (x1 ) f1 (x1 ) · · · fn (x1 ) c1 y1 (31) .. = .. . .. .. .. .. . . . . . . f0 (xn ) f1 (xn ) · · · yn cn fn (xn ) Die j-te Spalte der (n + 1) × (n + 1)-Matrix in (31) ist also gegeben durch die Werte der Basisfunktion fj an den Stützstellen x0 , . . . , xn , j = 0, . . . , n. Die Wahl der Basisfunktionen bestimmt die Form der Matrix: • In der Standardbasis der Monome, fj (x) := xj , j = 0, . . . , n, gilt fj (xi ) = xji , i, j = 0, . . . , n, und daher ist die Matrix in (31) von der Form 1 x0 · · · xn0 1 x1 · · · xn1 .. .. .. , .. . . . . 1 xn xnn ··· eine sog. Vandermonde-Matrix (A.-T. Vandermonde, 1735–1796). • Die Lagrange-Basis (J.-L. Lagrange, 1736–1813) fj (x) := n Y x − xk , xj − xk k=0 j = 0, . . . , n, k6=j erfüllt n Y xi − xk 1, = fj (xi ) = 0, x − x j k k=0 i = j, , i 6= j k6=j und daher ist die Matrix in (31) von der Form 1 0 1 , .. . 0 1 also die Einheitsmatrix in R(n+1)×(n+1) . i, j = 0, . . . , n, 3 FUNKTIONEN 36 • Die Newton-Basis (I. Newton, 1642–1727) f0 (x) = 1, fj (x) = j−1 Y (x − xk ) , j = 1, . . . , n, k=0 erfüllt f0 (xi ) = 1, fj (xi ) = j−1 Y (xi − xk ) = k=0 Qj−1 k=0 (xi − xk ) , 0, und daher ist die Matrix in (31) von der Form 1 0 1 x1 − x0 .. .. .. . . . Qn−1 1 xn − x0 · · · k=0 (xn − xk ) j≤i , j>i , eine sog. untere Dreiecksmatrix. Beispiel: In Serie 7, Aufgabe 1, hatten wir die Stützpunkte (−2, 13), (3, 18) gegeben, d. h. n = 2 und x0 = −2, x1 = 5 , x2 = 3, 4 y0 = 13, y1 = 5 39 4, 8 und 39 , y2 = 18. 8 • Die Standardbasisfunktionen sind gegeben durch f0 (x) = 1, f1 (x) = x, f2 (x) = x2 . Das lineare Gleichungssystem ist dann von der Form 1 −2 4 13 c0 25 1 5 . c1 = 39 4 16 8 c2 1 3 9 18 Mit dem Gauss-Algorithmus finden wir die Lösung (c0 , c1 , c2 ) = (3, −1, 2) und damit das Interpolationspolynom p(x) = 3 − x + 2x2 . 3 FUNKTIONEN 37 • Für die Lagrange-Basisfunktionen berechnen wir f0 (x) = = f1 (x) = = f2 (x) = = x − 45 x − 3 x − 54 x − 3 x − x1 x − x2 4 5 = = = x− (x − 3) x0 − x1 x0 − x2 −5 65 4 −2 − 54 −2 − 3 − 13 4 4 15 4 2 17 3 17 x2 − x + = x − x+ , 65 4 4 65 65 13 x+2x−3 16 x − x0 x − x2 x+2 x−3 = 13 = 5 7 = − 91 (x + 2) (x − 3) 5 x1 − x0 x1 − x2 + 2 − 3 − 4 4 4 4 16 2 16 96 16 2 x −x−6 =− x + x+ , − 91 91 91 91 x − x0 x − x1 x + 2 x − 54 4 x + 2 x − 45 5 = = = (x + 2) x − 7 x2 − x0 x2 − x1 3 + 2 3 − 54 5 35 4 4 3 5 4 2 3 2 4 x2 + x − = x + x− . 35 4 2 35 35 7 Das lineare Gleichungssystem ist in diesem Fall gegeben durch 13 c0 1 0 0 0 1 0 c1 = 39 , 8 0 0 1 c2 18 mit Lösung (c0 , c1 , c2 ) = 13, 39 8 , 18 . Das Interpolationspolynom ist daher gegeben durch p(x) 39 f1 (x) + 18f2 (x) 8 4 2 17 6 6 36 72 2 54 36 = x − x + 3 − x2 + x + + x + x− 5 5 7 7 7 35 35 7 2 = 2x − x + 3. = 13f0 (x) + • Für die Newton-Basisfunktionen berechnen wir f0 (x) = 1, f1 (x) = x + 2, = 3 5 5 = x2 + x − . (x + 2) x − 4 4 2 f2 (x) Das lineare Gleichungssystem ist in diesem Fall gegeben durch 1 0 0 13 c0 1 13 0 c1 = 39 . 4 8 c2 18 1 5 35 4 Mit dem Gauss-Algorithmus finden wir die Lösung (c0 , c1 , c2 ) = 13, − 25 , 2 . Das Interpolationsproblem ist daher gegeben durch 5 3 5 p(x) = 13 − (x + 2) + 2 x2 + x − = 2x2 − x + 3. 2 4 2 3 FUNKTIONEN 38 Effiziente Lösung des Interpolationsproblems Die Verwendung der Standardoder der Lagrange-Basis zur Lösung des Interpolationsproblems hat einige Nachteile: • Der Gauss-Algorithmus für die Vandermonde-Matrix ist relativ aufwändig (O(n3 ) Operationen). Ausserdem ist für grosse Werte von n die Matrix schlecht konditioniert, so dass kleine Rundungsfehler während der Rechnung einen grossen Einfluss auf die Lösung haben. • Die Lagrange-Basisfunktion sind relativ aufwändig zu berechnen, und insbesondere die Hinzunahme eines zusätzlichen Stützpunktes ist teuer, weil dann alle Basisfunktionen neu berechnet werden müssen. Die Newton-Basis hat diese Nachteile nicht: das lineare Gleichungssystem kann effizient mit sog. dividierten Differenzen (A. C. Aitken, 1895–1967, und E. H. Neville, 1889–1961) gelöst werden (O(n2 ) Operationen) und die Hinzunahme eines Stützpunktes erfordert lediglich die Berechnung eines neuen Koeffizienten: xi 1 2 3 4 yi −10 4 14 0 −4 −3 −3 −9 1 2 19 16 Ausserdem kann das Newton-Interpolationspolynom mit dem Horner-Schema (W. G. Horner, 1786–1837) effizient ausgewertet werden (O(n) Operationen): p(x) = = 19 −10 + 14(x − 1) − 9(x − 1)(x − 2) + (x − 1)(x − 2)(x − 3) 16 19 −10 + (x − 1) 14 + (x − 2) −9 + (x − 3) . 16 Stückweise Interpolation Für grosses n, also bei vielen Stützpunkten, beginnt das Interpolationspolynom in der Regel stark zu oszillieren, wie im folgenden Beispiel mit 10 zufällig generierten Stützpunkten (xi , yi ) ∈ (0, 1)2 : 4 3 2 1 0 −1 −2 −3 −4 −5 −6 −7 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 3 FUNKTIONEN 39 Die Werte des Interpolationspolynoms gehen z. T. weit über das Intervall (0, 1) hinaus. Daher wählt man im Fall von vielen Stützpunkten lieber eine stückweise Interpolation: die interpolierende Funktion ist dann stückweise definiert und auf jedem Stück eine Polynomfunktion. Zur Bestimmung der einzelnen Stücke wird jeweils eine Teilmenge der Stützpunkte verwendet. Wichtige Beispiele sind • die stückweise lineare Interpolation, • der kubische Spline, • der kubisch Hermitesche Spline (nach C. Hermite, 1822–1901). 2 1.5 1 0.5 0 −0.5 stueckweise linear kubischer Spline kubisch Hermitescher Spline −1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 In der Vorlesung MNEU (3. Semester) werden Sie noch mehr über die Interpolation hören. 3.3.3 Gebrochenrationale Funktionen Definition 24 (rationale Funktion, Definitionslücke) Eine rationale Funktion ist eine Funktion f von der Form f (x) = Z(x) , N (x) (32) wobei Z und N Polynomfunktionen sind (und N nicht die Nullfunktion). Bezeichnen wir die Grade der Zähler- und Nennerpolynome Z, N mit deg Z, deg N ∈ 3 FUNKTIONEN 40 N0 , so heisst f ganzrational :⇔ deg N = 0, echt gebrochenrational :⇔ 0 ≤ deg Z < deg N, unecht gebrochenrational :⇔ 0 < deg N ≤ deg Z. Eine rationale Funktion ist nicht definiert an den Nullstellen des Nennerpolynoms N ; dies sind die Definitionslücken der rationalen Funktion f . Bemerkungen: • Im ganzrationalen Fall ist das Nennerpolynom N eine konstante Funktion ungleich Null und daher f eine Polynomfunktion (s. Kap. 3.3.1). • Jede unecht gebrochenrationale Funktion kann durch Polynomdivision (mit Rest) in einen ganzrationalen und in einen echt gebrochenrationalen Anteil zerlegt werden. Beispiele: 1. Seien Z(x) = 2x2 + 6x − 4 und N (x) = 2 mit deg Z = 2, deg N = 0. Dann ist f ganzrational, und es gilt f (x) = Z(x) 2x2 + 6x − 4 = = x2 + 3x − 2, N (x) 2 d. h. f ist eine Polynomfunktion vom Grad 2 (quadratische Funktion). 2. Seien Z(x) = 1 und N (x) = x2 mit deg Z = 0, deg N = 2. Dann ist f echt gebrochenrational, und es gilt f (x) = 1 . x2 3. Sei Z(x) = x3 − 6x2 + 8x und N (x) = x + 1 mit deg Z = 3, deg N = 1. Dann ist f unecht gebrochenrational. Durch Polynomdivision finden wir x3 x3 − 6x2 + x2 − 7x2 − 7x2 + 8x + − 8x 7x 15x 15x + − : x+1 = x2 − 7x + 15 − 15 x+1 15 15 Der ganzrationale Anteil der Funktion f (x) = x3 − 6x2 + 8x 15 = x2 − 7x + 15 − x+1 x+1 ist also die quadratische Funktion x2 − 7x + 15, und der echt gebrochenrationale Anteil ist −15/(x + 1). 3 FUNKTIONEN 41 Sei x0 ∈ R eine Nullstelle des Nennerpolynoms N , N (x0 ) = 0, also eine Definitionslücke der rationalen Funktion f . Nach Satz 7 können wir den Linearfaktor x − x0 von N abspalten – möglicherweise auch mehrfach – so dass gilt: N (x) = (x − x0 ) jN N1 (x), N1 (x0 ) 6= 0, mit jN ∈ N (Vielfachheit der Nullstelle x0 von N ). Wenn wir denselben Linearfaktor auch im Zählerpolynom abspalten, so erhalten wir jZ Z(x) = (x − x0 ) Z1 (x), Z1 (x0 ) 6= 0, mit jZ ∈ N0 . Besitzt Z in x0 keine Nullstelle, so gilt jZ = 0. Definition 25 (Arten von Definitionslücken) Sei f eine rationale Funktion und x0 eine Definitionslücke von f . Der Linearfaktor x − x0 sei sowohl aus dem Nenner- als auch aus dem Zählerpolynom komplett abgespalten, so dass gilt: f (x) = (x − x0 )jZ Z1 (x) , (x − x0 )jN N1 (x) Z1 (x0 ) 6= 0, N1 (x0 ) 6= 0, (33) mit jN , jZ ∈ N0 und jN > 0. Dann heisst die Definitionslücke x0 • stetig hebbar, falls jZ ≥ jN , • eine Polstelle von f , falls jZ < jN . Bemerkungen: • Im Falle einer stetig hebbaren Definitionslücke x0 von f können wir den Faktor x − x0 jN -mal kürzen, es gilt also f (x) = (x − x0 )jZ −jN Z1 (x) , N1 (x) jZ − jN ≥ 0. Weil N1 (x0 ) 6= 0 ist die Definitionslücke damit behoben und f kann stetig fortgesetzt werden auf x0 mit dem Funktionswert ( Z1 (x0 ) N1 (x0 ) , jZ = jN . f (x0 ) = 0, jZ > jN Im Falle von jZ > jN hat also die (erweiterte) Funktion f in x0 eine Nullstelle. • Im Falle einer Polstelle x0 von f können wir den Faktor x − x0 jZ -mal kürzen, es gilt also f (x) = Z1 (x) , (x − x0 )jN −jZ N1 (x) jN − jZ > 0, mit Z1 (x0 ) 6= 0, N1 (x0 ) 6= 0. Die Zahl jN − jZ ∈ N heisst die Ordnung der Polstelle x0 . f wechselt bei einer Polstelle das Vorzeichen genau dann, wenn die Ordnung der Polstelle ungerade ist. 3 FUNKTIONEN 42 • Sind die Zerlegungen der Zähler- und Nennerpolynome nach Satz 8 bekannt, so können durch Kürzen der gemeinsamen Linearfaktoren sämtliche stetig hebbaren Definitionlücken behoben werden. Alle verbleibenden Definitionslücken sind dann Polstellen der rationalen Funktion, wobei der Exponent jedes Linearfaktors die Ordnung der jeweiligen Polstelle angibt. Beispiele: 1. Sei x3 − 3x − 2 x2 − 1 (unecht gebrochenrational) mit Z(x) = (x − 2)(x + 1)2 und N (x) = (x − 1)(x + 1). f hat Definitionslücken bei x = ±1: N (±1) = 0. f (x) := • Für die Definitionslücke x0 = 1 erhalten wir nach Abspaltung des Linearfaktors x − 1 im Zähler- und im Nennerpolynom: f (x) = Z(x) , (x − 1)(x + 1) also jZ = 0, Z1 (x) = x3 − 3x − 2 und jN = 1, N1 (x) = x + 1. Es gilt jZ < jN , also ist 1 eine Polstelle von f , und zwar mit Ordnung jN − jZ = 1. • Für die Definitionslücke x0 = −1 erhalten wir nach Abspaltung des Linearfaktors x + 1 im Zähler- und im Nennerpolynom: f (x) = (x + 1)2 (x − 2) , (x + 1)(x − 1) also jZ = 2, Z1 (x) = x − 2 und jN = 1, N1 (x) = x − 1. Es gilt jZ > jN , also ist −1 eine stetig hebbare Definitionslücke von f , und die erweiterte Funktion f hat bei −1 eine Nullstelle: f (x) = (x + 1)(x − 2) , x−1 3 f (−1) = 0. 2 y = (x −3x−2)/(x −1) 25 20 15 10 y 5 0 −5 −10 −15 −20 −25 −1 −0.5 0 0.5 x 1 1.5 3 FUNKTIONEN 43 2. Sei f (x) = = x5 − 6x4 + 11x3 − 2x2 − 12x + 8 x7 − 2x6 − 12x5 + 42x4 − 33x3 − 24x2 + 44x − 16 (x − 1)(x + 1)(x − 2)3 (x + 4)(x + 1)(x − 2)2 (x − 1)3 (echt gebrochenrational). Durch Kürzen der gemeinsamen Linearfaktoren beheben wir sämtliche hebbaren Definitionslücken (bei −1 und 2). Die erweiterte Funktion f ist dann gegeben durch x−2 x−2 = 3 . f (x) = (x + 4)(x − 1)2 x + 2x2 − 7x + 4 f hat eine Polstelle erster Ordnung bei x = −4 und eine Polstelle zweiter Ordnung bei x = 1. Bei den stetig hebbaren Definitionslücken erhalten wir −1 − 2 1 2−2 f (−1) = = − , f (2) = = 0. 2 (−1 + 4)(−1 − 1) 4 (2 + 4)(2 − 1)2 y = (x5−6x4+11x3−2x2−12x+8)/(x7−2x6−12x5+42x4−33x3−24x2+44x−16) 2 1.5 1 y 0.5 0 −0.5 −1 −1.5 −2 −5 3.4 3.4.1 −4 −3 −2 −1 x 0 1 2 3 Zahlenfolgen und Konvergenz Reelle Zahlenfolgen Definition 26 (reelle Zahlenfolge) Eine reelle Zahlenfolge (kurz: Folge) ist eine Funktion a : N → R, n 7→ an . 3 FUNKTIONEN 44 Bemerkungen: • Die Zahlen a1 , a2 , a3 , · · · ∈ R heissen Glieder der Folge. Die Zahl an ∈ R, n ∈ N, ist das n-te Folgenglied. • Für die reelle Zahlenfolge mit den Gliedern a1 , a2 , a3 , · · · ∈ R schreiben wir symbolisch han i = a1 , a2 , a3 , . . . Wir schreiben die Glieder nicht einfach in eine Menge, {a1 , a2 , a3 , . . . }, weil bei einer reellen Zahlenfolge die Reihenfolge der Glieder wesentlich ist, während bei einer Menge die Reihenfolge der Elemente keine Rolle spielt. • Sind die Glieder an explizit gegeben als Funktion von n, so nennt man dies das Bildungsgesetz der Folge. Beispiele: 1 1. an = − 2n , han i = − 12 , − 41 , − 16 , . . . 2. an = n3 , han i = 13 , 23 , 33 , . . . 3. an = n−1 n , han i = 0, 12 , 23 , 34 , . . . Der Abstand zweier reeller Zahlen x, y ∈ R ist definiert als x − y, x ≥ y |x − y| = ∈ R. y − x, x < y Dies definiert eine sog. Metrik auf R. Es gelten, für alle x, y, z ∈ R: • Definitheit: |x − y| ≥ 0 und |x − y| = 0 ⇔ x = y • Symmetrie: |x − y| = |y − x| • Dreiecksungleichung: |x − y| ≤ |x − z| + |z − y| Definition 27 (Grenzwert einer Zahlenfolge) Die Zahl g ∈ R heisst Grenzwert oder Limes der Zahlenfolge han i, wenn ∀ε > 0 ∃N ∈ N : |an − g| < ε ∀ n ≥ N. Bemerkungen: • Dies bedeutet, dass der Abstand zwischen den Folgengliedern an und dem Grenzwert g für genügend grosse n beliebig klein wird. • Beachten Sie, dass die Zahl N ∈ N im Allgemeinen von ε abhängt. • Eine Folge kann höchstens einen Grenzwert besitzen. Beweis: Nehme an, die Folge han i hätte zwei Grenzwerte g1 , g2 ∈ R. Dann gilt nach der Dreiecksungleichung: |g1 −g2 | = |g1 −an +an −g2 | ≤ |g1 −an |+|an −g2 | = |an −g1 |+|an −g2 |, ∀ n ∈ N. Beide Terme auf der rechten Seite werden beliebig klein für genügend grosse n, also gilt |g1 − g2 | = 0 und daher g1 = g2 . 3 FUNKTIONEN 45 Definition 28 (Konvergenz, Divergenz) Eine Folge han i heisst konvergent, wenn sie einen Grenzwert g ∈ R besitzt. Andernfalls heisst die Folge divergent. Bemerkung: Falls han i konvergent ist mit Grenzwert g, so schreiben wir symbolisch: limn→∞ an = g. Beispiele: 1. Die Folge h n1 i = 1, 12 , 13 , 14 , . . . ist konvergent mit Grenzwert limn→∞ n1 = 0. Beweis: Sei ε > 0 gegeben. Wähle N ∈ N mit N > 1/ε > 0, dann gilt 1 − 0 = 1 ≤ 1 < 1 ∀ n ≥ N, n n N ε und nach Def. 27 ist 0 ∈ R der Grenzwert der Folge h n1 i. 2. Die Folge h1 − n1 i = 0, 12 , 23 , 34 , . . . ist konvergent mit Grenzwert limn→∞ h1 − n1 i = 1. Beweis: Sei ε > 0 gegeben. Wähle N ∈ N mit N > 1/ε > 0, dann gilt 1 − 1 − 1 = − 1 = 1 ≤ 1 < 1 ∀ n ≥ N, n n n N ε also ist nach Def. 27 1 ∈ R der Grenzwert der Folge h1 − n1 i. Bemerkung: In diesen Beispielen war der Grenzwert jeweils angegeben und konnte mit Hilfe von Def. 27 nachgeprüft werden. Wir wollen aber die Konvergenz einer Folge auch beweisen können, ohne dass ihr Grenzwert bekannt sein muss. Definition 29 (Beschränktheit von Folgen) Sei han i eine reelle Zahlenfolge. • a ∈ R heisst untere Schranke von han i, wenn a ≤ an ∀ n ∈ N. • b ∈ R heisst obere Schranke von han i, wenn an ≤ b ∀ n ∈ N. Wenn eine dieser Schranken existiert, so heisst han i nach unten bzw. nach oben beschränkt. Existieren beide Schranken, so heisst han i beschränkt, ansonsten heisst han i unbeschränkt. Bemerkung: Vgl. mit Def. 10 (Beschränktheit von Mengen). Satz 9 Jede konvergente reelle Zahlenfolge ist beschränkt. Bemerkung: Beschränktheit der Folge ist also eine notwendige Bedingung für Konvergenz. Sie ist jedoch nicht hinreichend! Beschränkte Folgen können auch divergent sein. Beispiele: 1. Die Folge hn3 i = 13 , 23 , 33 , 43 , . . . ist unbeschränkt, also divergent. 3 FUNKTIONEN 46 2. Die Folge h(−1)n ni = −1, 2, −3, 4, . . . ist unbeschränkt, also divergent. 3. Die Folge h(−1)n i = −1, 1, −1, 1, . . . ist beschränkt und divergent. Beweis: Nehme an, die Folge h(−1)n i sei konvergent mit Grenzwert g ∈ R. Wähle ε := 1, dann existiert ein N ∈ N, so dass 2 = |(−1)n+1 −(−1)n | ≤ |(−1)n+1 −g|+|(−1)n −g| < 1+1 = 2 ∀ n ≥ N. Die Ungleichung 2 < 2 ist aber ein Widerspruch, also ist die Folge h(−1)n i divergent. Wir suchen jetzt nach sog. Konvergenzkriterien, also hinreichenden Bedingungen für die Konvergenz einer Folge. Damit können wir die Existenz eines Grenzwerts nachweisen, ohne dass dieser genau bekannt sein muss. Definition 30 (Monotonie von Zahlenfolgen) Eine reelle Zahlenfolge han i heisst monoton wachsend genau dann, wenn monoton fallend genau dann, wenn an ≤ an+1 ∀ n ∈ N, an ≥ an+1 ∀ n ∈ N. Bemerkung: Nach Def. 26 ist eine reelle Zahlenfolge eine Funktion. Daher ist Def. 30 nur ein Spezialfall von Def. 18 (Monotonie von Funktionen). Satz 10 (Monotoniekriterium) • Eine monoton wachsende reelle Zahlenfolge han i ist genau dann konvergent, wenn sie nach oben beschränkt ist. Ist b ∈ R eine obere Schranke von han i, so gilt limn→∞ an ≤ b. • Eine monoton fallende reelle Zahlenfolge han i ist genau dann konvergent, wenn sie nach unten beschränkt ist. Ist a ∈ R eine untere Schranke von han i, so gilt limn→∞ an ≥ a. Beispiele: 1 i ist monoton 1. Die Folge h− 2n wachsend und nach oben beschränkt, also 1 konvergent (limn→∞ − 2n = 0). 2. Die Folge hn3 i ist monoton wachsend aber nicht nach oben beschränkt, also divergent. 3. Die Folge h1 − n1 i ist monoton wachsend und nach oben beschränkt, also konvergent (limn→∞ 1 − n1 = 1). 4. Die Folge h n1 i ist monoton fallend und nach unten beschränkt, also konvergent (limn→∞ n1 = 0). 5. Die Folgen h(−1)n i und h(−1)n ni sind nicht monoton, und daher ist das Monotoniekriterium nicht anwendbar. 3 FUNKTIONEN 47 Definition 31 (Cauchy-Folge; nach A. L. Cauchy, 1789–1857) Eine reelle Zahlenfolge han i heisst Cauchy-Folge, wenn ∀ε > 0 ∃N ∈ N : |am − an | < ε ∀ m, n ≥ N. Bemerkung: In einer Cauchy-Folge wird der Abstand zweier Folgenglieder am und an für genügend grosse m, n beliebig klein. Satz 11 (Cauchy-Kriterium) Eine reelle Zahlenfolge ist genau dann konvergent, wenn sie eine Cauchy-Folge ist. Beispiele: Mit dem Cauchy-Kriterium können wir auch nicht-monotone Folgen behandeln. 1. Die Folge h(−1)n i ist keine Cauchy-Folge, denn es gilt |(−1)n+1 − (−1)n | = 2 ∀ n ∈ N. Daher ist die Folge divergent. 2. Die Folge h(−1)n ni ist keine Cauchy-Folge, denn es gilt |(−1)n+1 (n + 1) − (−1)n n| = |2n + 1| ≥ 3 ∀ n ∈ N. Daher ist die Folge divergent. E D n = −1, 12 , − 13 , 14 , . . . ist eine Cauchy-Folge. Sei ε > 0 3. Die Folge (−1) n gegeben. Wähle N ∈ N mit N > 2ε . Dann gilt (−1)m (−1)n (−1)m (−1)n 1 1 2 m − n ≤ m + n = m + n ≤ N < ε ∀ m, n ≥ N. E D n n = 0). konvergent (limn→∞ (−1) Also ist die Folge (−1) n n Satz 12 (Rechenregeln für Grenzwerte von Zahlenfolgen) Sei han i eine konvergente reelle Zahlenfolge mit limn→∞ an = a ∈ R und c ∈ R. Dann gelten 1. lim (can ) = c lim an = ca, n→∞ n→∞ 2. lim (c + an ) = c + lim an = c + a, n→∞ n→∞ 3. lim (c − an ) = c − lim an = c − a. n→∞ n→∞ Falls a 6= 0, so gilt auch c c c 4. lim = = . n→∞ an lim an a n→∞ Sie hbn i eine weitere konvergente Zahlenfolge mit limn→∞ bn = b ∈ R. Dann gelten 3 FUNKTIONEN 48 5. lim (an + bn ) = lim an + lim bn = a + b, n→∞ n→∞ n→∞ 6. lim (an − bn ) = lim an − lim bn = a − b, n→∞ n→∞ 7. lim (an bn ) = n→∞ lim an n→∞ n→∞ lim bn = ab. n→∞ Falls b 6= 0, so gilt auch lim an an a = n→∞ = . n→∞ bn lim bn b 8. lim n→∞ Beispiel: Mit Hilfe dieses Satzes können wir auch kompliziertere Grenzwerte 2 leicht berechnen. Für die Folge mit Bildungsgesetz an := 2n n+3n+2 erhalten 2 +1 wir: 2 3 + lim 2 + 2 + n3 + n22 8. n→∞ 2n2 + 3n + 2 n n2 lim = lim = 1 2 n→∞ n→∞ 1 n +1 1 + n2 lim 1 + 2 n→∞ n 3 2 2 + lim + lim 2 1.,7. 2 + 0 + 0 2.,5. n→∞ n n→∞ n = = = 2. 1 1+0 1 + lim 2 n→∞ n Die Zahlenfolge han i ist also konvergent mit Grenzwert limn→∞ an = 2. Deswegen müssen gemäss Def. 27 die Zahlen |an − 2| beliebig klein werden für genügend grosse n ∈ N. Ausserdem muss die Folge nach dem Cauchy-Kriterium (Satz 11) eine Cauchy-Folge sein, so dass gemäss Def. 31 auch die Zahlen |an+1 − an | beliebig klein werden müssen für genügend grosse n ∈ N. Wir überprüfen dies in der folgenden Grafik anhand der ersten 100000 Glieder der Folge han i: an = (2n2 + 3n + 2)/(n2 + 1) 5 10 0 10 −5 |an − 2| 10 |an+1 − an| −10 10 0 10 1 10 2 3 10 10 n 4 10 5 10 3 FUNKTIONEN 49 Beachten Sie, dass wir mit einer solchen Grafik nicht beweisen können, dass die Folge konvergent ist mit Grenzwert 2, oder dass sie eine Cauchy-Folge ist, denn wir können ja nur endlich viele Folgenglieder zeichnen. 3.5 Grenzwert und Stetigkeit einer Funktion Wir betrachten Funktionen f : D → R, D ⊆ R, und wollen deren Verhalten in der Nähe einer Stelle x0 ∈ R untersuchen, an der f möglicherweise nicht definiert ist. Definition 32 (Umgebung) Die Menge U ⊆ R ist eine Umgebung von x0 ∈ R, wenn ∃ ε > 0 : (x0 − ε, x0 + ε) ⊆ U. Beispiele: 1. Das Intervall U := [0, 2] ist eine Umgebung von 1: wähle z. B. ε = 1/2, dann gilt 21 , 32 ⊆ U . 2. Das Intervall V := [1, 2) ist keine Umgebung von 1: für jedes ε > 0 enthält das offene Intervall (1 − ε, 1 + ε) auch Zahlen kleiner als 1, und diese liegen nicht in V . Bemerkung: Für eine Umgebung U von x0 ∈ R nennen wir die Menge U̇ := U \ {x0 } eine punktierte Umgebung von x0 . U̇ enthält Punkte beliebig nahe an x0 , aber nicht x0 selbst. Für eine Funktion f : D → R und Zahlenfolgen hxn i mit xn ∈ D, n ∈ N, betrachten wir nun die Zahlenfolgen der Funktionswerte hf (xn )i: Definition 33 (Grenzwert einer Funktion) Sei f : D → R eine Funktion, und D ⊆ R enthalte eine punktierte Umgebung von x0 ∈ R. Die Zahl g ∈ R heisst der Grenzwert der Funktion f an der Stelle x0 genau dann, wenn für jede reelle Zahlenfolge hxn i mit xn ∈ D \ {x0 }, n ∈ N, und limn→∞ xn = x0 gilt: limn→∞ f (xn ) = g. Bemerkungen: • Ist g ∈ R der Grenzwert der Funktion f an der Stelle x0 , so schreiben wir symbolisch: limx→x0 f (x) = g. • Wenn D eine punktierte Umgebung von x0 enthält, so kann x0 nicht auf dem Rand von D liegen, sondern die Funktion muss auf beiden Seiten von x0 noch definiert sein. An der Stelle x0 kann die Funktion f definiert sein, muss aber nicht. Beispiele: 1. Der Grenzwert der Funktion f (x) := 2x2 + 1 an der Stelle x0 = 1 ist limx→1 f (x) = 3: Sei hxn i eine reelle Zahlenfolge mit xn 6= 1, n ∈ N und limn→∞ xn = 1. Dann gilt 2 Satz 12 lim f (xn ) = lim 2x2n + 1 = 2 lim xn + 1 = 2 · 12 + 1 = 3. n→∞ n→∞ n→∞ 3 FUNKTIONEN 50 2. Die unecht gebrochenrationale Funktion f (x) = 3x2 − 6x x−2 ist an der Stelle x0 = 2 nicht definiert, besitzt dort aber einen Grenzwert: Sei hxn i eine reelle Zahlenfolge mit xn 6= 2, n ∈ N und limn→∞ xn = 2. Dann gilt lim f (xn ) n→∞ 3x2n − 6xn 3xn (xn − 2) = lim n→∞ n→∞ xn − 2 xn − 2 = lim Satz 12 = 3 lim xn = 3 · 2 = 6. n→∞ 3. Die Sprungfunktion σ(x) := 0, 1, x<0 x≥0 ist an der Stelle x0 = 0 definiert (σ(0) = 1), besitzt dort aber keinen Grenzwert: betrachte die beiden Zahlenfolgen hxn i und hyn i mit Bildungsgesetzen 1 1 xn := − , yn := , n ∈ N. n n Diese Folgen sind konvergent (Monotoniekriterium) mit xn 6= 0, yn 6= 0, n ∈ N, und mit Grenzwerten lim xn = lim yn = 0, n→∞ n→∞ aber die Grenzwerte der Folgen der Funktionswerte sind nicht gleich: 1 − n1 <0, n∈N = lim 0 = 0, lim σ(xn ) = lim σ − n→∞ n→∞ n→∞ n 1 1 n >0, n∈N lim σ(yn ) = lim σ = lim 1 = 1. n→∞ n→∞ n→∞ n Also besitzt die Sprungfunktion σ an der Stelle 0 keinen Grenzwert. n betrachAlternativ können wir auch die Zahlenfolge hxn i mit xn := (−1) n ten. Diese Folge erfüllt xn 6= 0, n ∈ N, und limn→∞ xn = 0. Die Folge der Funktionswerte ist gegeben durch 0, n ungerade σ(xn ) = . 1, n gerade Die Folge hσ(xn )i ist keine Cauchy-Folge, weil |σ(xn+1 ) − σ(xn )| = 1, n ∈ N, also ist sie divergent nach dem Cauchy-Kriterium und besitzt daher keinen Grenzwert. 3 FUNKTIONEN 51 4. Die echt gebrochenrationale Funktion f (x) = 1 x−1 ist an der Stelle x0 = 1 (Polstelle der Ordnung 1) nicht definiert und besitzt dort auch keinen Grenzwert: Wir betrachten die Zahlenfolge hxn i mit xn := n−1 n < 1, n ∈ N, und Grenzwert limn→∞ xn = 1. Die Funktionswerte der Glieder dieser Zahlenfolge erfüllen f (xn ) = 1 = xn − 1 1 = −n −1 n−1 n Die Folge hf (xn )i = h−ni ist unbeschränkt und daher nach Satz 9 divergent. Satz 13 (Rechenregeln für Grenzwerte von Funktionen) Seien f, g : D → R zwei Funktionen, die an der Stelle x0 ∈ R einen Grenzwert besitzen, und sei c ∈ R. Dann gelten 1. lim (cf (x)) = c lim f (x), x→x0 x→x0 2. lim (f (x) ± g(x)) = lim f (x) ± lim g(x), x→x0 x→x0 3. lim (f (x) · g(x)) = x→x0 x→x0 lim f (x) · lim g(x) . x→x0 x→x0 Falls limx→x0 g(x) 6= 0, so gilt auch 4. lim x→x0 lim f (x) f (x) x→x0 = . g(x) lim g(x) x→x0 Definition 34 (Stetigkeit von Funktionen) Sei f : D → R eine Funktion, und D enthalte eine Umgebung von x0 ∈ R. Die Funktion f ist stetig an der Stelle x0 , falls der Grenzwert von f an der Stelle x0 existiert und mit dem dortigen Funktionswert übereinstimmt: limx→x0 f (x) = f (x0 ). Bemerkungen: • Eine Funktion f : D → R, die an jeder Stelle x0 ∈ D stetig ist, heisst stetige Funktion. • Eine Funktion f : D → R ist nicht stetig (unstetig) bei x0 ∈ R in den folgenden drei Fällen: – f ist bei x0 nicht definiert, hat dort also eine Definitionslücke, – f besitzt bei x0 keinen Grenzwert, – f ist bei x0 definiert und besitzt dort einen Grenzwert, aber dieser stimmt nicht mit dem Funktionswert überein: limx→x0 f (x) 6= f (x0 ). 3 FUNKTIONEN 52 Beispiele: 1. Polynomfunktionen (ganzrationale Funktionen) sind stetig. 2. Gebrochenrationale Funktionen sind an jeder Stelle ihres Definitionsbereichs stetig. Für die Definitionslücken gilt: • Bei einer stetig hebbaren Definitionslücke ist die Funktion nicht definiert, besitzt dort aber einen Grenzwert. Die Unstetigkeit an dieser Stelle kann behoben werden (vgl. Kap. 3.3.3), indem der Wert der (erweiterten) Funktion gleich diesem Grenzwert gesetzt wird. • Bei einer Polstelle ist die Funktion nicht definiert und sie besitzt dort auch keinen Grenzwert, also lässt sich die Unstetigkeit an einer Polstelle nicht beheben. 3. Endliche Sprünge treten bei rationalen Funktionen nicht auf, wohl aber bei stückweise rationalen Funktionen, wie z. B. bei der Sprungfunktion σ. Eine Funktion kann auch unendlich viele Sprungstellen besitzen. 4. Die Dirichlet-Funktion (P. G. L. Dirichlet, 1805–1859) 1, x ∈ Q f (x) = , x ∈ R, 0, x 6∈ Q ist eine nirgends stetige Funktion, d. h. sie ist an keiner Stelle x0 ∈ R stetig. Die Dirichlet-Funktion hat überabzählbar unendlich viele Sprungstellen. 5. Die Funktion f (x) = x2 , x 6= 1 , 0, x=1 x ∈ R, ist an der Stelle x0 = 1 unstetig: f ist bei x0 = 1 definiert, f (1) = 0, und f besitzt an der Stelle x0 = 1 einen Grenzwert, limx→1 f (x) = 1. Es gilt aber limx→1 f (x) 6= f (1). Satz 14 (Zwischenwertsatz) Sei f : D → R eine stetige Funktion und [a, b] ⊆ D ein abgeschlossenes Intervall. Dann ist das Bild von [a, b] unter f ein abgeschlossenes Intervall und es gilt [f (a), f (b)] ⊆ f ([a, b]) ∨ [f (b), f (a)] ⊆ f ([a, b]). Bemerkung: Dies bedeutet, dass eine stetige Funktion auf dem Intervall [a, b] jeden Wert zwischen f (a) und f (b) annimmt. Falls f (a) und f (b) unterschiedliche Vorzeichen haben, so folgt daraus, dass f eine Nullstelle in [a, b] besitzen muss (B. P. J. N. Bolzano, 1781–1848). Beispiel/Anwendung: Die Polynomfunktion f (x) = x5 − 3x2 − 2x + 1 ist stetig, und sie erfüllt f (0) = 1 > 0 und f (1) = 1 − 3 − 2 + 1 = −3 < 0. Nach dem Zwischenwertsatz muss f im Intervall [0, 1] eine Nullstelle haben. Die Nullstelle kann jetzt z. B. durch Bisektion weiter eingegrenzt werden: 4 EINFÜHRUNG IN DIE DIFFERENZIALRECHNUNG 53 1. Wir halbieren das Intervall [0, 1] und werten f an der Stelle 21 aus: f 21 = 1 − 23 32 < 0. Weil f (0) > 0, muss die Nullstelle von f im Intervall 0, 2 liegen. 321 > 0. 2. Wir halbieren weiter und werten f an der Stelle 14 aus: f 14 = 1024 1 1 1 Weil f 2 < 0, muss die Nullstelle von f im Intervall 4 , 2 liegen. 5389 3. Wir halbieren weiter und werten f an der Stelle 83 aus: f 83 = − 32768 < 0. 1 1 3 Weil f 4 > 0, muss die Nullstelle von f im Intervall 4 , 8 liegen. Dieses Verfahren können wir fortsetzen, und wir erhalten eine Folge von Intervallen 1 1 1 1 3 [0, 1] , 0, , , , , ,..., 2 4 2 4 8 deren Länge sich in jedem Schritt halbiert: 1, 21 , 14 , 18 , . . . . Damit können wir die Nullstelle von f bei x ' 0.3344 beliebig genau eingrenzen. y = x5 − 3 x2 − 2 x + 1 2 1 y 0 −1 −2 −3 −4 −0.5 4 0 0.5 x 1 1.5 Einführung in die Differenzialrechnung Aus Kap. 3.3.1 wissen wir, dass die Steigung des Graphen einer linearen Funktion p(x) = mx + q, m, q ∈ R, m 6= 0, gegeben ist durch m: p(x2 ) − p(x1 ) = m, x2 − x1 x1 , x2 ∈ R, x1 6= x2 . Wir wollen jetzt für eine beliebige Funktion f : D → R, D ⊆ R, die “Steigung” des Graphen an einer Stelle x0 ∈ R bestimmen. Dazu nehmen wir an, dass D eine Umgebung von x0 enthält und betrachten eine reelle Zahlenfolge hxn i mit xn ∈ D \ {x0 }, n ∈ N, und mit limn→∞ xn = x0 . Für n ∈ N ist die Sekante des 4 EINFÜHRUNG IN DIE DIFFERENZIALRECHNUNG 54 Graphen von f durch die Punkte (x0 , f (x0 )) , (xn , f (xn )) ∈ Gf gegeben durch die lineare Funktion sn (x) f (xn ) − f (x0 ) (x − x0 ) xn − x0 f (xn ) − f (x0 ) f (xn ) − f (x0 ) = x + f (x0 ) − x0 xn − x0 x − x0 | {z } {zn } | = f (x0 ) + =:mn =:qn x∈R = mn x + qn , (x0 ) (Interpolationspolynom, Kap. 3.3.2), mit Steigung mn = f (xxnn)−f . Die Zahl −x0 mn ∈ R wird auch als Differenzenquotient von f im Intervall [x0 , xn ] bezeichnet. Falls die reelle Zahlenfolge hmn i konvergent ist, so ist der Grenzwert limn→∞ mn ∈ R ein Kandidat für die Steigung des Graphen von f an der Stelle x0 . Weil diese Steigung aber nicht von der Wahl der Zahlenfolge hxn i abhängen darf, muss sie als Grenzwert einer Funktion definiert werden: 4.1 Differenzierbarkeit und Ableitungsfunktion Definition 35 (Differenzierbarkeit) Sei f : D → R eine Funktion, und D enthalte eine Umgebung von x0 ∈ R. Die Funktion f ist differenzierbar an der Stelle x0 ∈ D, falls der Grenzwert der Differenzenquotienten, lim x→x0 f (x) − f (x0 ) , x − x0 existiert. In diesem Fall bezeichnet man den Grenzwert als die Ableitung von f an der Stelle x0 oder als den Differenzialquotienten von f an der Stelle x0 . Bemerkungen: • Symbolische Schreibweisen für die Ableitung von f an der Stelle x0 : f 0 (x0 ) df (J.-L. Lagrange, 1797), dx (x0 ) (G. W. Leibniz, 1675). Für zeitabhängige Funktionen wird für Ableitung oft mit einem Punkt über der Funktion dargestellt. So ist z. B. ṡ(t0 ) die Ableitung der zeitabhängigen Funktion s an der Stelle t0 (I. Newton, 1666). • Der Vorgang zur Bestimmung der Ableitung heisst “Differenzieren” oder “Differenziation” • Der Differenzialquotient kann mit Hilfe von Variablentransformation auch auf die folgenden gebräuchlichen Arten geschrieben werden: lim x→x0 f (x) − f (x0 ) x − x0 h:=x−x0 = ∆x:=h = f (x0 + h) − f (x0 ) h f (x0 + ∆x) − f (x0 ) lim . ∆x→0 ∆x lim h→0 4 EINFÜHRUNG IN DIE DIFFERENZIALRECHNUNG 55 • Ist f an der Stelle x0 differenzierbar, so ist der Graph der linearen Funktion t(x) := f (x0 ) + f 0 (x0 )(x − x0 ) (34) die Tangente an den Graphen von f im Punkt (x0 , f (x0 )): Es gilt t(x0 ) = f (x0 ) und die Steigung des Graphen von t ist gleich der Ableitung von f an der Stelle x0 : t(x2 ) − t(x1 ) x2 − x1 = = f (x0 ) + f 0 (x0 )(x2 − x0 ) − (f (x0 ) + f 0 (x0 )(x1 − x0 )) x2 − x1 f 0 (x0 ) (x2 − x0 − x1 + x0 ) = f 0 (x0 ), x2 − x1 für x1 , x2 ∈ R, x1 6= x2 . Daher kann die Ableitung von f an der Stelle x0 als die Steigung der Tangente an den Graphen von f im Punkt (x0 , f (x0 )) interpretiert werden. • f differenzierbar an der Stelle x0 ⇒ f stetig an der Stelle x0 : lim f (x) x→x0 = Satz 13 = = (f (x) − f (x0 ) + f (x0 )) (x − x0 ) lim x − x0 f (x) − f (x0 ) lim lim (x − x0 ) + f (x0 ) x→x0 x→x0 x − x0 f 0 (x0 ) · 0 + f (x0 ) = f (x0 ). x→x0 • Ist die Funktion f an jeder Stelle x0 ∈ D differenzierbar, so ist f eine differenzierbare Funktion. Die Funktion f 0 : D → R, x 7→ f 0 (x), heisst dann die Ableitungsfunktion (oder Ableitung) von f . • Ist die Ableitungsfunktion f 0 stetig, so heisst f stetig differenzierbar. • Ist die Ableitungsfunktion f 0 differenzierbar, so ist die zweite Ableitung von f gegeben durch die Ableitung von f 0 usw. für höhere Ableitungen. n Symbolische Schreibweisen: f 00 , s̈, f 000 , f (5) , f (n) , ddxnf . Beispiele: 1. Sei f (x) = mx + q, m, q ∈ R, m 6= 0, eine lineare Funktion. Sei x0 ∈ R, dann gilt für x 6= x0 : f (x) − f (x0 ) mx + q − (mx0 + q) m (x − x0 ) = = = m. x − x0 x − x0 x − x0 Für den Grenzwert erhalten wir daher lim x→x0 f (x) − f (x0 ) =m x − x0 ⇒ f 0 (x0 ) = m. 4 EINFÜHRUNG IN DIE DIFFERENZIALRECHNUNG 56 Dies gilt für jedes x0 ∈ R, also ist f differenzierbar, und die Ableitung von f ist gegeben durch die konstante Funktion f 0 (x) = m. Die Tangente an den Graphen der linearen Funktion im Punkt x0 ∈ R ist gegeben durch t(x) = f (x0 ) + f 0 (x0 )(x − x0 ) = mx0 + q + m(x − x0 ) = mx + q = f (x). Die zweite und alle höheren Ableitungen einer linearen Funktion sind gleich der Nullfunktion: f (n) (x) = 0, n ∈ N, n ≥ 2. 2. Sei f (x) = x2 und x0 ∈ R. Dann gilt für x, x0 ∈ R, x 6= x0 : f (x) − f (x0 ) x2 − x20 (x + x0 ) (x − x0 ) = = = x + x0 . x − x0 x − x0 x − x0 Für den Differenzialquotienten (Grenzwert) erhalten wir daher lim x→x0 f (x) − f (x0 ) = lim (x + x0 ) = 2x0 x→x0 x − x0 ⇒ f 0 (x0 ) = 2x0 . Dies gilt für jedes x0 ∈ R, daher ist f differenzierbar, und die Ableitung von f ist gegeben durch die lineare Funktion f 0 (x) = 2x. DieTangente an den Graphen der quadratischen Funktion im Punkt x0 , x20 ist gegeben durch t(x) = f (x0 ) + f 0 (x0 )(x − x0 ) = x20 + 2x0 (x − x0 ) = 2x0 x − x20 . Im globalen Minimum der Funktion f bei x0 = 0 (Satz 5) ist die Tangente waagrecht: f 0 (0) = 2 · 0 = 0. Die zweite Ableitung der quadratischen Funktion ist eine konstante Funktion, f 00 (x) = 2, und alle Ableitungen ab der dritten sind gleich der Nullfunktion: f (n) (x) = 0, n ∈ N, n ≥ 3. 3. Die Betragsfunktion f (x) := |x| ist stetig (Serie 12, Aufg. 2), aber an der Stelle x0 = 0 nicht differenzierbar. Wir betrachten die Zahlenfolge hxn i n mit Bildungsgesetz xn := (−1) n , n ∈ N. Sie erfüllt xn 6= 0, n ∈ N, und limn→∞ = 0. Für die Differenzenquotienten im Intervall [0, xn ] gilt (−1)n 1 n − |0| f (xn ) − f (x0 ) 1 n = (−1)n = (−1) = (−1)n , n ∈ N. n = n xn − x0 (−1) − 0 n n (x0 ) Die Folge h f (xxnn)−f i = h(−1)n i ist keine Cauchy-Folge, also divergent −x0 nach dem Cauchy-Kriterium (Satz 11). Daher existiert der Differenzialquotient an der Stelle x0 = 0 nicht. An jeder Stelle x0 ∈ R \ {0} ist die Betragsfunktion jedoch differenzierbar, und es gilt −1, x0 < 0 f 0 (x0 ) = . 1, x0 > 0 Im Allgemeinen ist eine Funktion an einer “Knickstelle” nicht differenzierbar. 4 EINFÜHRUNG IN DIE DIFFERENZIALRECHNUNG 57 4. Es gibt stetige Funktionen, die nirgends differenzierbar sind, weil sie überabzählbar unendlich viele Knickstellen haben. Viele dieser Funktionen sind Fraktale, so z. B. die Koch-Kurve (N. F. H. von Koch, 1870–1924). Satz 15 (Ableitungsregeln) Die Funktionen f, g : D → R seien an der Stelle x0 ∈ D differenzierbar und c ∈ R. Dann gelten die folgenden Regeln: 1. Faktorregel: Die Funktion h(x) := cf (x) ist differenzierbar an der Stelle x0 und es gilt h0 (x0 ) = cf 0 (x0 ), 2. Summenregel: Die Funktion h(x) := f (x) + g(x) ist differenzierbar an der Stelle x0 und es gilt h0 (x0 ) = f 0 (x0 ) + g 0 (x0 ), 3. Produktregel: Die Funktion h(x) := f (x)g(x) ist differenzierbar an der Stelle x0 und es gilt h0 (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ). 4 EINFÜHRUNG IN DIE DIFFERENZIALRECHNUNG 58 Falls g(x0 ) 6= 0, so gilt auch die (x) 4. Quotientenregel: Die Funktion h(x) := fg(x) ist differenzierbar an der 0 0 f (x )g(x ) − f (x 0 0 0 )g (x0 ) . Stelle x0 und es gilt h0 (x0 ) = 2 g(x0 ) Seien f : Df → R und g : Dg → R zwei Funktionen. Die Funktion g sei an der Stelle x0 ∈ Dg differenzierbar und die Funktion f sei an der Stelle g(x0 ) ∈ Df differenzierbar. Dann gilt die 5. Kettenregel: Die Funktion h(x) := (f ◦ g) (x) = f (g(x)) ist differenzierbar an der Stelle x0 und es gilt h0 (x0 ) = f 0 (g(x0 ))g 0 (x0 ). Sei f : D → R eine umkehrbare Funktion und x0 ∈ R. Die Funktion f sei an der Stelle f −1 (x0 ) ∈ D differenzierbar mit f 0 f −1 (x0 ) 6= 0. Dann gilt die 6. Umkehrregel: Die Funktion f −1 ist differenzierbar an der Stelle x0 und 0 1 es gilt f −1 (x0 ) = 0 −1 f (f (x0 )) Bemerkung: In der folgenden Kurzschreibweise lassen sich die Ableitungsregeln einfacher merken: 0 1. Faktorregel: (cf ) = cf 0 , 0 2. Summenregel: (f + g) = f 0 + g 0 , 0 3. Produktregel: (f g) = f 0 g + f g 0 , 0 f f 0 g − f g0 4. Quotientenregel: = , g g2 0 5. Kettenregel: (f ◦ g) = (f 0 ◦ g) g 0 , 6. Umkehrregel: f −1 0 = f0 1 . ◦ f −1 Beispiele: Die Ableitungsregeln 1.–4. werden für rationale Funktionen nützlich sein (nächstes Kapitel). Hier bringen wir zwei Beispiele zu den Regeln 5. und 6. 2 1. Die Funktion h(x) := (2x − 3) ist von der Form f ◦ g mit g(x) := 2x − 3 und f (x) := x2 . Es gilt f 0 (x) = 2x und g 0 (x) = 2, also ist die Ableitung der Funktion h gegeben durch h0 (x) 0 = (f ◦ g) (x) = (f 0 ◦ g) (x)g 0 (x) = f 0 (g(x)) g 0 (x) = 2g(x)g 0 (x) = 2 (2x − 3) · 2 = 4 (2x − 3) = 8x − 12. 2. Sei D := [0, ∞) und√f (x) := x2 . Die Funktion f ist bijektiv mit Umkehrfunktion f −1 (x) = x. Für die Ableitung von f gilt f 0 (x) = 2x. Nach der Umkehrregel ist also die Ableitung der Wurzelfunktion gegeben durch 0 f −1 (x) = 1 1 1 1 = 0 −1 = −1 = √ . (f 0 ◦ f −1 ) (x) f (f (x)) 2f (x) 2 x 4 EINFÜHRUNG IN DIE DIFFERENZIALRECHNUNG 4.2 59 Ableitung von rationalen Funktionen 4.2.1 Ableitung von ganzrationalen Funktionen Sei n ∈ N und p eine Polynomfunktion vom Grad n, d. h. p(x) = a0 + a1 x + a2 x2 + a3 x3 + · · · + an xn = n X ai xi , i=1 mit Koeffizienten a0 , a1 , . . . , an ∈ R, an 6= 0. Nach der Faktor- und nach der Summenregel (Satz 15, 1. und 2.) erhalten wir für p die Ableitung 0 0 p0 (x) = a0 (1) + a1 (x) + a2 x2 0 + a3 x3 0 0 + · · · + an (xn ) = n X 0 ai xi , i=0 i 0 wobei x die Ableitungsfunktion der i-ten Standardbasisfunktion von Pn (also von xi , i = 0, . . . , n) bezeichnet. Aus Bsp. 1 im letzten Kapitel wissen wir bereits, 0 0 dass (1)0 = 0 und (x) = (1 · x + 0) = 1. Durch wiederholte Anwendung der Produktregel (Satz 15, 3.) erhalten wir für i ≥ 2: xi 0 = xxi−1 = i−1 0 Satz 15 = 0 (x) xi−1 + x xi−1 |{z} 0 =1 Satz 15 = = = .. . = i−1 0 = xi−1 + x xxi−2 0 0 xi−1 + x (x) xi−2 + x xi−2 |{z} =1 0 i−1 i−2 x +x x + x xi−2 0 2xi−1 + x2 xi−2 x +x x 0 0 0 (i − 1)xi−1 + xi−1 xi−(i−1) = (i − 1)xi−1 + xi−1 (x) |{z} =1 = (i − 1) x i−1 +x i−1 = ix i−1 . Damit haben wir die Potenzregel bewiesen: 0 Satz 16 (Potenzregel) Für n ∈ N gilt (xn ) = nxn−1 . 0 Beispiel: n = 5: x5 = 5x4 . Also gilt für die Ableitung der Polynomfunktion p: p0 (x) = a1 + 2a2 x + 3a3 x2 + · · · + nan xn−1 = n−1 X (i + 1)ai+1 xi , i=0 4 EINFÜHRUNG IN DIE DIFFERENZIALRECHNUNG 60 und dies ist eine Polynomfunktion vom Grad n − 1. Die zweite Ableitung von p ist gegeben durch p00 (x) = 2a2 + 6a3 x + · · · + n(n − 1)an xn−2 = n−2 X (i + 2)(i + 1)ai+2 xi , i=0 also eine Polynomfunktion vom Grad n − 2. Für die Ableitungen allgemeiner Ordnung gilt Satz 17 (Ableitung von Polynomfunktionen) Polynomfunktionen sind beliebig oft differenzierbar. Für eine Polynomfunktion vom Grad n ∈ N von der Form p(x) = n X ai xi = a0 + a1 x + a2 x2 + · · · + an xn i=0 ist die m-te Ableitung, m ∈ N, gegeben durch n−m X (i + m)(i + m − 1) · · · (i + 1)ai+m xi , m ≤ n . p(m) (x) = i=0 0, m>n Bemerkung: Die m-te Ableitung einer Polynomfunktion vom Grad n ist eine Polynomfunktion vom Grad n − m für m ≤ n, und die Nullfunktion für m > n. Beispiel: Wir betrachten die quadratische Funktion p(x) = −3x2 + 2x + 1. Die Ableitungen von p sind gegeben durch p0 (x) = −6x + 2 p00 (x) = −6 (m) p (x) = 0, m ≥ 3 4.2.2 (lineare Funktion), (konstante Funktion), (Nullfunktion). Ableitung von gebrochenrationalen Funktionen Ein Spezialfall der Quotientenregel ist die Reziprokenregel: 0 0 1 Satz 15, 4. (1) g − 1 · g 0 0 · g − g0 g0 = = = − . g g2 g2 g2 (35) Kombinieren wir die Reziprokenregel (35) und die Potenzregel (Satz 16), so erhalten wir die Ableitung der Kehrwerte der Monome: 0 0 (xn ) Satz 16 nxn−1 n 1 (35) = − = − 2n = − n+1 , n ∈ N, 2 xn x x (xn ) oder auch x−n 0 = −nx−n−1 , n ∈ N. 4 EINFÜHRUNG IN DIE DIFFERENZIALRECHNUNG 61 Bemerkung: Die Potenzregel (Satz 16) gilt also auch für negative ganzzahlige Exponenten. Beispiel: Die Ableitung der echt gebrochenrationalen Funktion f (x) = x1 ist gegeben durch f 0 (x) = − x12 (n = 1). Im Allgemeinen müssen wir für rationale Funktionen die Quotientenregel (Satz 15, 4.) anwenden. Die benötigten Ableitungen der Zähler- und Nennerpolynome können jeweils mit Satz 17 bestimmt werden. Satz 18 (Ableitung von gebrochenrationalen Funktionen) Rationale Funktionen sind an jeder Stelle ihres Definitionsbereichs beliebig oft differenzierbar. Für eine rationale Funktion von der Form f (x) = Z(x) , N (x) wobei Z und N Polynomfunktionen sind, ist die Ableitung gegeben durch die rationale Funktion f 0 (x) = Z 0 (x)N (x) − Z(x)N 0 (x) , N (x)2 mit denselben Definitionslücken wie f . Beispiel: Z(x) := 3x2 − x + 2, N (x) := −2x2 + 4x + 5. Für die Ableitung der unecht gebrochenrationalen Funktion f (x) := 3x2 − x + 2 Z(x) = N (x) −2x2 + 4x + 5 werden die Ableitungen von Z und von N benötigt. Mit Satz 17 berechnen wir Z 0 (x) = 6x − 1, N 0 (x) = −4x + 4 und daher nach Satz 18: f 0 (x) = = = 4.3 4.3.1 Z 0 (x)N (x) − Z(x)N 0 (x) N (x)2 (6x − 1) −2x2 + 4x + 5 − 3x2 − x + 2 (−4x + 4) (−2x2 + 4x + 5) 10x2 + 38x + 13 . 4 4x − 16x3 − 4x2 + 40x + 25 2 Anwendungen der Differenzialrechnung Näherungspolynome einer Funktion Sei n ∈ N, und die Funktion f : D → R sei an der Stelle x0 ∈ D n-mal differenzierbar. Dann betrachten wir das folgende Problem: 4 EINFÜHRUNG IN DIE DIFFERENZIALRECHNUNG 62 Bestimme ein Polynom Tn ∈ Pn , das die Gleichungen Tn (x0 ) = f (x0 ), Tn0 (x0 ) Tn00 (x0 ) Tn(3) (x0 ) = f 0 (x0 ), = f 00 (x0 ), = .. . f (3) (x0 ), Tn(n) (x0 ) = f (n) (x0 ) erfüllt. An der Stelle x0 ∈ D sollen also das Polynom Tn und seine ersten n Ableitungen mit der Funktion f und mit ihren ersten n Ableitungen übereinstimmen. Dies führt auf ein System von n + 1 linearen Gleichungen für die n + 1 unbekannten Koeffizienten des Polynoms Tn , und die Lösung des Problems ist gegeben durch das n-te Taylorpolynom der Funktion f an der Stelle x0 (B. Taylor, 1685–1731): Satz 19 (Taylor-Formel) Sei n ∈ N, und die Funktion f : D → R sei an der Stelle x0 ∈ D n-mal differenzierbar. Dann existiert eine Funktion hn : D → R, so dass n X f (k) (x0 ) k f (x) = (x − x0 ) + hn (x)(x − x0 )n (36) k! k=0 und limx→x0 hn (x) = 0. Bemerkungen: • In (36) gelten f (0) (x0 ) := f (x0 ) und k! := k(k − 1)(k − 2) · · · 2 · 1 ∈ N (“k Fakultät”) mit 0! := 1. • Die Polynomfunktion Tn (x) = n X f (k) (x0 ) k=0 k! (x − x0 ) k ist die Lösung des oben gestellten Problems. Die Funktion Rn (x) := hn (x)(x − x0 )n heisst das n-te Restglied. • Beachten Sie, dass wir nicht f (n) (x0 ) 6= 0 vorausgesetzt haben; daher gilt im Allgemeinen deg Tn ≤ n. • Das n-te Taylorpolynom kann als Näherungsfunktion für die Funktion f in der Nähe von x0 ∈ D verwendet werden, denn der Approximationsfehler ist gegeben durch das n-te Restglied: f (x) − Tn (x) = Rn (x) = hn (x)(x − x0 )n , mit lim hn (x) = 0 x→x0 (Peano-Form des Restglieds nach G. Peano, 1858–1932). Je grösser n und je kleiner |x − x0 | ist, desto besser ist also die Näherung. 4 EINFÜHRUNG IN DIE DIFFERENZIALRECHNUNG 63 Beispiele: 1. Für n = 1 erhalten wir als lineare Näherungsfunktion die Tangente an den Graphen von f im Punkt (x0 , f (x0 )): T1 (x) = f (x0 ) + f 0 (x0 )(x − x0 ) (vgl. Kap. 4.1). Wir nennen die Funktion T1 auch die Linearisierung oder 1. Näherung von f bei x0 . 2. Für n = 2 erhalten wir als quadratische Näherungsfunktion die Schmiegeparabel an den Graphen von f im Punkt (x0 , f (x0 )): f 00 (x0 ) (x − x0 )2 . 2 Wir nennen die Funktion T2 auch die 2. Näherung von f bei x0 . T2 (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + 3. Für die kubische Funktion f (x) := x3 − 2x + 5 wollen wir die ersten beiden Taylorpolynome an der Stelle x0 := 1 berechnen. Für die Ableitungen von f erhalten wir f (x) = x3 − 2x + 5, f (1) = 4, f 0 (x) = 3x2 − 2, f 0 (1) = 1, f 00 (x) = 6x, f 00 (1) = 6. Damit erhalten wir für die ersten beiden Taylorpolynome von f an der Stelle x0 = 1: = f (1) + f 0 (1)(x − 1) = 4 + 1(x − 1) = x + 3, f 00 (1) T2 (x) = f (1) + f 0 (1)(x − 1) + (x − 1)2 2 = 4 + 1(x − 1) + 3(x − 1)2 = 3x2 − 5x + 6. T1 (x) 7 f(x) = x3 − 2 x + 5, x0 = 1 6.5 T (x) = x + 3 1 T (x) = 3 x2 − 5 x + 6 6 2 y 5.5 5 4.5 4 3.5 3 −1 −0.5 0 0.5 x 1 1.5 2 4 EINFÜHRUNG IN DIE DIFFERENZIALRECHNUNG 64 Für diese Näherungen können wir auch die Restglieder explizit berechnen: R1 (x) = f (x) − T1 (x) = x3 − 3x + 2 = (x − 1)(x + 2)(x − 1), | {z } =h1 (x) R2 (x) = 3 2 f (x) − T2 (x) = x − 3x + 3x − 1 = (x − 1)(x − 1)2 . | {z } =h2 (x) Bemerkung: Weil f eine Polynomfunktion vom Grad 3 ist, sind die Ableitungen f (n) konstante Funktionen für n ≥ 3 (Satz 17). Daher werden die n-ten Taylorpolynome von f für n ≥ 3 mit f übereinstimmen: Tn ≡ f , n ≥ 3, d. h. Rn ≡ 0, n ≥ 3. 4.3.2 Bestimmung von Extremstellen differenzierbarer Funktionen Sei f : D → R eine differenzierbare Funktion, die an der Stelle x0 ∈ D ein lokales Minimum besitzt. Gemäss Def. 21 existiert dann ein Intervall I mit x0 ∈ I, so dass f (x0 ) ≤ f (x) ∀ x ∈ D ∩ I. (37) Mit der Ableitung von f an der Stelle x0 erhalten wir als erste Näherung von f: f (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + h1 (x)(x − x0 ), lim h1 (x) = 0. | {z } | {z } x→x0 =T1 (x) =R1 (x) Für x ∈ D ∩ I, x 6= x0 , gilt nun: f (x) − f (x0 ) = f 0 (x0 ) + h1 (x), x − x0 Weil nach (37) f (x) − f (x0 ) ≥ 0, so gelten f (x) − f (x0 ) ≤ 0, ≥ 0, x − x0 lim h1 (x) = 0. x→x0 x < x0 . x > x0 Der Grenzwert an der Stelle x0 (Differenzialquotient) kann also nur Null sein, und daraus folgt f 0 (x0 ) = 0. Satz 20 (Bedingungen für ein lokales Extremum) 1. (notwendige Bedingung) Die Funktion f : D → R besitze an der Stelle x0 ∈ D ein lokales Extremum (Minimum oder Maximum), und f sei an der Stelle x0 ∈ D differenzierbar. Dann gilt f 0 (x0 ) = 0. 2. (hinreichende Bedingung) Die Funktion f : D → R sei an der Stelle x0 ∈ D zweimal differenzierbar. Falls f 0 (x0 ) = 0 und f 00 (x0 ) 6= 0, dann hat f an der Stelle x0 ein lokales Extremum. Dabei handelt es sich um ein • lokales Minimum, falls f 00 (x0 ) > 0, 4 EINFÜHRUNG IN DIE DIFFERENZIALRECHNUNG 65 • lokales Maximum, falls f 00 (x0 ) < 0. Bemerkungen: • Die Nullstellen der Ableitung f 0 sind also Kandidaten für Extremstellen von f . • In einem lokalen Minimum von f ist die Schmiegeparabel an den Graphen von f nach oben geöffnet, in einem lokalen Maximum nach unten. Beispiel: Wir betrachten die echt gebrochenrationale Funktion f (x) := (x − 1)(x − 2) x2 − 3x + 2 = 3 . 3 (x + 1) x + 3x2 + 3x + 1 Mit Satz 18 berechnen wir die Ableitungen f 0 (x) = − x2 − 8x + 9 , (x + 1)4 f 00 (x) = 2(x2 − 13x + 22) . (x + 1)5 Die Nullstellen von f 0 sind gegeben durch die Lösungen der quadratischen Gleichung x2 − 8x + 9 = 0, also √ √ √ 8 ± 64 − 36 7±5 7 00 √ x1,2 = = 4 ± 7, mit f (x1,2 ) = − 2 6550 ± 2462 7 √ √ Wir erhalten f 00√ (4 + 7) < 0 und f 00 (4 − 7) > 0, und daher hat die √ Funktion f bei x1 = 4 + 7 ' 6.646 ein lokales Maximum und bei x2 = 4 − 7 ' 1.354 ein lokales Minimum. Wir zeichnen die Tangenten und die Schmiegeparabeln an den Graphen von f in diesen Extrempunkten: 0.07 0.06 0.05 0.04 0.03 y = (x−1)(x−2)/((x+1)3) Tangente am Tiefpunkt Tangente am Hochpunkt Schmiegeparabel am Tiefpunkt Schmiegeparabel am Hochpunkt 0.02 0.01 0 −0.01 −0.02 −0.03 0 1 2 3 4 5 6 7 8 9 10 4 EINFÜHRUNG IN DIE DIFFERENZIALRECHNUNG 4.3.3 66 Der Mittelwertsatz der Differenzialrechnung Satz 21 (Mittelwertsatz der Differenzialrechnung) Sei f : D → R eine stetige Funktion und [a, b] ⊆ D ein abgeschlossenes Intervall. Ausserdem sei die Funktion f im offenen Intervall (a, b) differenzierbar. Dann ∃ x0 ∈ (a, b) : f 0 (x0 ) = f (b) − f (a) . b−a Korollar 2 Sei f : D → R eine differenzierbare Funktion und I ⊆ D ein Intervall. 1. f ist genau dann monoton wachsend (fallend) auf I, wenn f 0 (x) ≥ 0 (f 0 (x) ≤ 0) ∀ x ∈ I. 2. Falls f 0 (x) > 0 (f 0 (x) < 0) ∀ x ∈ I, so ist f streng monoton wachsend (fallend) auf I. 3. f ist genau dann konstant auf I, wenn f 0 (x) = 0 ∀ x ∈ I. Beispiele: • Auf dem Intervall I := (0, ∞) ⊆ R ist die Ableitung der Funktion f (x) := x2 gegeben durch f 0 (x) = 2x > 0, also ist die Funktion f streng monoton wachsend auf I. • Die Bedingung f 0 (x) > 0 ∀x ∈ I ist hinreichend für streng monoton wachsend, aber nicht notwendig: Die Funktion f (x) := x3 ist streng monoton wachsend auf jedem Intervall I ⊆ R, aber f 0 (x) = 3x2 erfüllt f 0 (0) = 0. 4.3.4 Das Newton-Verfahren zur Bestimmung von Nullstellen differenzierbarer Funktionen Sei f : D → R eine differenzierbare Funktion. Wir suchen eine Nullstelle von f , also ein x∗ ∈ D mit f (x∗ ) = 0. Ein bekanntes Verfahren zur Berechnung von Nullstellen ist das Newton-Verfahren (I. Newton, 1643–1727): Sei n ∈ N und xn ∈ D. Wir linearisieren die Funktion f an der Stelle xn und suchen die Nullstelle der 1. Näherung von f bei xn , T1 (x) = f (xn ) + f 0 (xn )(x − xn ). Die Nullstelle der linearen Funktion T1 ist gegeben durch xn+1 := xn − f (xn ) . f 0 (xn ) (38) Für einen gegebenen Startwert x1 ∈ D definiert (38) eine Zahlenfolge hxn i. Falls diese Zahlenfolge konvergent ist, so ist x∗ := limn→∞ xn eine Nullstelle der Funktion f . Ob die Zahlenfolge hxn i konvergiert und wenn ja, gegen welche Nullstelle von f , hängt vom Startwert x1 ab. LITERATUR 67 Beispiel: Wir betrachten die echt gebrochenrationale Funktion aus Kap. 4.3.2 mit Nullstellenmenge {1, 2}. In der folgenden Grafik zeichnen wir einige Glieder der Folge hxn i für verschiedene Startwerte x1 ∈ R \ {−1}: in diesem Beispiel konvergieren einige der Folgen gegen die Nullstelle x1 = 1, andere gegen die Nullstelle x2 = 2, und wieder andere divergieren. 0.1 4 3.5 3 y = (x−1)(x−2)/((x+1) ) 3 2.5 0.05 y xn 2 1.5 1 0 0.5 0 −0.5 −0.05 0 0.5 1 1.5 x 2 2.5 3 −1 1 2 3 4 5 6 7 8 9 10 n Literatur [1] R. Axthelm: Analysis für Ingenieure I & II. Skript zu MAE1 und MAE2 im Schuljahr 2011/2012 [2] R. Courant: Vorlesungen über Differential- und Integralrechnung (2 Bände); Springer [3] K. Jänich: Mathematik (2 Bände); Springer [4] K. Meyberg, P. Vachenauer: Höhere Mathematik (2 Bände); Springer [5] L. Papula: Mathematik für Ingenieure und Naturwissenschaftler (3 Bände); Vieweg & Teubner