Grundlagen der Analysis Skript zur Vorlesung Sommersemester 2010 von Dr. Dominik Faas Institut für Mathematik Fachbereich 7: Natur- und Umweltwissenschaften Universität Koblenz-Landau Literatur zur Vorlesung (1) Neunzert, Eschmann, Blickendörfer-Ehlers, Schelkes: Analysis I (2) Walter: Einführung in die Analysis I (3) Barner, Flohr: Analysis I (4) Heuser: Lehrbuch der Analysis, Teil I (5) Forster: Analysis I (6) Andelfinger: Mathematik S-2, Analysis L Inhaltsverzeichnis Inhaltsverzeichnis 1. Die reellen Zahlen 7 2. Folgen 29 3. Reihen 65 4. Grenzwerte und Stetigkeit 87 5. Differentialrechnung 123 A. Anhang 173 5 1. Die reellen Zahlen Einleitung Der dieser Vorlesung zugrunde liegende Zahlenraum ist der Raum R der reellen Zahlen. In diesem einführenden Kapitel studieren wir seine grundlegenden Eigenschaften. Grundideen der Analysis Die reellen Zahlen — Einleitung Beispiele für reelle Zahlen N⊂Z⊂Q⊂R 0 ∈ N: die Zahl, mit 0 + x = x ∀x ∈ R. 1 ∈ N: die Zahl, mit 1 · x = x ∀x ∈ R. Jede natürliche Zahl ist als Summe von 1en gegeben: 5 = 1 + 1 + 1 + 1 + 1. Die ganzen Zahlen bestehen aus den natürlichen Zahlen und deren additiv Inversen (Gegenzahlen): −5 ∈ Z ist die Zahl, die zu 5 addiert 0 ergibt. 37 Rationale Zahlen sind Quotienten aus ganzen Zahlen, etwa 14 , − 25 ∈ Q. Allgemein n Q= ; n, m ∈ Z, m , 0 . m Beispiele für irrationale Zahlen sind (die meisten) Wurzeln: √ 2 ist die Zahl, deren Quadrat 2 ist. r 5 √ 2, q 5 2 9 ∈R\Q 2 2 ist die Zahl, deren 5-te Potenz ist. 9 9 Weitere reelle Zahlen: e , π ∈ R. Grundideen der Analysis Die reellen Zahlen — Einleitung Verknüpfungen reeller Zahlen Bei einer Verknüpfung entsteht eine neue Zahl aus zwei gegebenen Zahlen. Addition: (x , y ) 7→ x + y (x , y ∈ R) additive Inversenbildung: x 7→ −x (x ∈ R) Substraktion: (x , y ) 7→ x − y = x + (−y ) (x , y ∈ R) (zusammengesetzt aus additiver Inversenbildung und Addition) Multiplikation: (x , y ) 7→ x · y (x , y ∈ R) multiplikative Inversenbildung: x 7→ x −1 (x ∈ R \ {0}) Division: (x , y ) 7→ xy = x · y −1 (x , y ∈ R, y , 0) (zusammengesetzt aus multiplikativer Inversenbildung und Multiplikation) 7 1. Die reellen Zahlen Grundideen der Analysis Die reellen Zahlen — Einleitung (Rechen-)Regeln für diese Verknüpfungen Beispielsweise: ∀x , y ∈ R : x +y =y +x (K+) ∀x , y , z ∈ R : (x · y ) · z = x · (y · z ) (A·) ∀x , y , z ∈ R : x · (y + z ) = x · y + x · z (D) ∀a , c ∈ R, b , d ∈ R∗ : a b ∀x , y ∈ R x ·y =0 ⇔ x =0 ∨ y =0 (Nullprodukt) ∀x , y ∈ R, a ∈ R∗ : x =y ⇔ x ·a =y ·a (Äquivalenzumformung) ∀a , b ∈ R : (a + b )2 = a 2 + 2ab + b 2 (binomische Formel) + c d = ad +bc bd (Addition von Quotienten) Grundideen der Analysis Die reellen Zahlen — Einleitung Ordnungsrelation Zwei reelle Zahlen lassen sich der Größe nach vergleichen: a < b : a ist kleiner als b Zahlenstrahl: Größere Zahlen befinden sich weiter rechts. Regeln: a<b ∧ b<c ⇒ a<c c < a2 ⇔ a<− c ∨ 0<a ∧ 0<b ⇒ 0<a·b √ √ c<a Grundideen der Analysis Die reellen Zahlen — Einleitung Vergleich: Q und R Grundrechenarten und Größenrelation auch in Q vorhanden. In R gibt es irrationale Zahlen, man kann sie aber durch rationale Zahlen ’annähern’. In R existieren Wurzeln aus allen nichtnegativen Zahlen. Rationale Zahlen haben immer eine abbrechende oder periodische Dezimalbruchentwicklung. Im Gegensatz dazu haben irrationale Zahlen eine Dezimalbruchentwicklung, die weder abbricht noch periodisch wird. 8 Ziel dieses Kapitels ist es, diese Sachverhalte mathematisch präzise zu untersuchen (einige Aspekte können allerdings erst später studiert werden). Wir betrachten zunächst Verknüpfungen (Addition und Multiplikation) und die Ordnungsrelation ≤ auf R. Anschließend widmen wir uns ausführlich dem Vollständigkeitsbegriff. Grundsätzlich gehen wir dabei axiomatisch vor, das heißt wir nehmen gewisse (grundlegende) Eigenschaften von R (sogenannte Axiome) als gültig an und überlegen uns, wie daraus weitere Regeln abgeleitet werden können. Verknüpfungen reeller Zahlen In diesem Abschnitt untersuchen wir grundlegende Verknüpfungen reeller Zahlen. Der Umgang mit den Grundrechenarten basiert auf dem folgenden Axiom. 1.1. Körperaxiome Zwei reelle Zahlen x, y können durch Addition + bzw. Muliplikation · zu weiteren reellen Zahlen x+y bzw. x·y verknüpft werden. Es gelten die folgenden Rechenregeln: (K+) ∀x, y ∈ R x+y =y+x (Kommutativgesetz der Addition) (A+) ∀x, y, z ∈ R (x + y) + z = x + (y + z) (Assoziativgesetz der Addition) (N+) ∃! 0 ∈ R ∀x ∈ R 0+x=x (Existenz eines neutralen Elements für die Addition) (I+) ∀x ∈ R ∃! − x ∈ R x + (−x) = 0 (Existenz eines inversen Elements für die Addition) (K·) ∀x, y ∈ R 1 1 x·y =y·x (Kommutativgesetz der Multiplikation) (A·) ∀x, y, z ∈ R (x · y) · z = x · (y · z) (Assoziativgesetz der Multiplikation) (N·) ∃! 1 ∈ R \ {0} ∀x ∈ R 1·x=x (Existenz eines neutralen Elements für die Multiplikation) (I·) ∀x ∈ R \ {0} ∃! x−1 ∈ R x · x−1 = 1 (Existenz eines inversen Elements für die Multiplikation) (D) ∀x, y, z ∈ R 1 1 x · (y + z) = x · y + x · z (Distributivgesetz) Man sagt: Zusammen mit den Verknüpfungen + und · ist R ein Körper.2 1 Die Eindeutigkeit der neutralen und inversen Elemente muss hier nicht unbedingt gefordert werden, man kann sie auch mit Hilfe der anderen Axiome zeigen. Wichtig ist ihre Existenz. 2 Weitere Körper bilden beispielsweise die rationalen Zahlen Q, die komplexen Zahlen C oder die Menge der Restklassen Rp modulo einer Primzahl p. 9 1. Die reellen Zahlen Aus den gegebenen Verknüpfungen + und · (und der Inversenbildung) erhält man nun weitere Verknüpfungen durch x − y = x + (−y) (x, y ∈ R) und x = x · (y −1 ) y (x, y ∈ R, y 6= 0). Aus den Körperaxiomen lassen sich zahlreiche weitere (bekannte) Rechenregeln ableiten. Einige davon sind in der folgenden Liste zusammengefasst. Sie können alle ausgehend von den Körperaxiomen bewiesen werden. Dies soll hier aber nur an einigen Beispielen vorgeführt werden. Folgerung 1.2. • Für alle x, y ∈ R gilt: −0 = 0, −(−x) = x, 0 · x = 0, −(x + y) = (−x) + (−y), (−1) · x = −x, 1−1 = 1, (−x) · (−y) = x · y, (−1)−1 = −1. Sind x, y 6= 0, so gilt auch x−1 6= 0, x−1 −1 (x · y)−1 = x−1 · y −1 . = x, • Es gilt auch das zweite Distributivgesetz: Für alle x, y, z ∈ R ist (x + y) · z = x · z + y · z. Ausgehend davon folgt, dass man Klammern wie gewohnt ausmultiplizieren kann, beispielsweise ist (a + b) · (c + d) = ac + ad + bc + bd (a, b, c, d ∈ R). • In R kann man folgende Äquivalenzumformungen durchführen: x=y ⇔ x+z =y+z x=y ⇔ x·z =y·z x=y ⇔ x=y ⇔ x−1 = y −1 (falls z 6= 0) −x = −y (falls x, y 6= 0) x · y = 0 ⇔ x = 0 oder y = 0 • Für das Rechnen mit Brüchen gilt (es sind a, b, c, d ∈ R beliebig, wobei alle auftretenden Nenner 6= 0 sein müssen): a −1 b 10 = b , a a c ac · = , b d bd a c ad ± cb ± = , b d bd a b c d = ad . bc • Für ganzzahlige Exponenten n, m ∈ Z und reellwertige Basen x, y ∈ R \ {0} gelten die Potenzgesetze: 1 xn = xn−m , (xn )m = xnm , xm n x xn xn · y n = (x · y)n , = n. y y xn · xm = xn+m , • Es gelten die binomischen Formeln: Für alle a, b ∈ R gilt (a + b)2 = a2 + 2ab + b2 , (a + b)(a − b) = a2 − b2 . Damit folgt die Äquivalenz a2 = b2 ⇔ a = b oder a = −b. Beweis. (exemplarisch) • Wegen 0 + 0 = 0 gilt −0 = 0, denn −x ist die Zahl, die zu x addiert 0 ergibt. • Es gilt (D) (N+) 0 · x + 0 · x = (0 + 0) · x = 0 · x. Addiert man auf beiden Seiten −(0 · x), so folgt mit (A+), (I+) und (N+) die behauptete Gleichheit 0 · x = 0. • Es ist s.o. (I+) (D) (N·) 0 = 0 · x = (1 + (−1)) · x = 1 · x + (−1) · x = x + (−1) · x. Addiert man −x auf beiden Seiten, so folgt −x = (−1) · x. • Wir zeigen die Äquivalenz: x · y = 0 ⇔ x = 0 oder y = 0. ⇐: Wir haben schon gezeigt, dass 0 · y = 0 ist. Nach (K+) ist auch x · 0 = 0. ⇒: Gelte x · y = 0. Ist x 6= 0, so folgt durch Multiplikation mit x−1 , dass (A·) 0 = x−1 · (x · y) = (I·) (N·) x−1 · x · y = 1 · y = y. Vergleichbarkeit reeller Zahlen 1.3. Anordnungsaxiome Es gibt eine Relation ≤ auf R so, dass die folgenden Bedingungen für alle x, y, z ∈ R erfüllt sind: 1 Für x ∈ R und n > 0 sei xn = x · x . . . · x und x−n = (xn )−1 (für x 6= 0). Außerdem sei x0 = 1. | {z } n−mal 11 1. Die reellen Zahlen (OR1) x≤x (Reflexivität) (OR2) x ≤ y ∧ y ≤ x =⇒ x = y (Antisymmetrie) (OR3) x ≤ y ∧ y ≤ z =⇒ x ≤ z (Transitivität) (T) x≤y ∨ y≤x (Totalität) (A1) x ≤ y =⇒ x + z ≤ y + z (1. Anordnungsaxiom) (A2) 0 ≤ x ∧ 0 ≤ y =⇒ 0 ≤ x · y (2. Anordnungsaxiom) Die Bedingungen (OR1) - (OR3) besagen, dass ≤ eine Ordnungsrelation ist, die Bedingung (T) bedeutet, dass es sich um eine totale Ordnungsrelation handelt. Man sagt: Durch die Relation ≤ wird R zu einem angeordneten Körper.1 Aus der ≤ -Relation lassen sich nun auch die weiteren bekannten vergleichenden Relationen ableiten. Im einzelnen definiert man für x, y ∈ R x<y falls x ≤ y und x 6= y x>y falls x 6≤ y x≥y falls x = y oder x 6≤ y Man kann sich die Anordnung der reellen Zahlen am Zahlenstrahl vorstellen. Dort sind größere Zahlen weiter rechts zu finden. Wir könnten nun die Anordnungsaxiome benutzen, um die gewohnten Regeln für den Umgang mit diesen Relationen herzuleiten. Folgerung 1.4. • Für x, y ∈ R gilt genau eine der drei Alternativen x<y · ∨ x=y · ∨ x > y. • Es ist 1 > 0. Folglich ist n > 0 für alle n ∈ N∗ . • Für x, y, z, w ∈ R gelten die folgenden Implikationen: ( x<y ∧ z ≤w ⇒ x+z <y+w -) Es gilt: x≤y ∧ z ≤w ⇒ x+z ≤y+w ( x<y ∧ z ≤w ⇒ x·z <y·w -) Falls x, y, z, w > 0: x≤y ∧ z ≤w ⇒ x·z ≤y·w 1 Auch 12 die Menge der rationalen Zahlen Q bildet mit der Relation ≤ einen angeordneten Körper. ( -) Falls x, y > 0 oder x, y < 0: ( -) Es gilt: x<y ⇔ x≤y ⇔ 1 x 1 x > ≥ 1 y 1 y x<y ⇔ x+z <y+z x≤y ⇔ ( x<y -) Falls z > 0: x≤y ( x<y -) Falls z < 0: x≤y x+z ≤y+z ⇔ x·z <y·z ⇔ x·z ≤y·z ⇔ x·z >y·z ⇔ x·z ≥y·z In bekannter Weise sind offenen, halboffenen und abgeschlossenen Intervalle definiert: Für a, b ∈ R sei [a, b] = {x ∈ R; a ≤ x ≤ b} , (a, b) = {x ∈ R; a < x < b} [a, b) = {x ∈ R; a ≤ x < b} , (a, b] = {x ∈ R; a < x ≤ b} [a, ∞) = {x ∈ R; a ≤ x} , (a, ∞) = {x ∈ R; a < x} (−∞, b] = {x ∈ R; x ≤ b} , (−∞, b) = {x ∈ R; x < b} Bemerkung 1.5. Man beachte, dass zu zwei Zahlen a, b ∈ R mit a < b stets eine Zahl c ∈ (a, b) . In (a, c) bzw. in (c, b) liegen weitere Elemente und dies existiert etwa c = a+b 2 kann man beliebig fortführen. Daher enthält jedes Intervall (a, b) mit a < b unendlich viele Elemente. 1.6. Betragsfunktion Für die Analysis ist die Betragsfunktion von grundlegender Bedeutung. Für x ∈ R definieren wir den Betrag von x durch ( x , |x| = −x , falls x ≥ 0 falls x < 0. Der Graph der Betragsfunktion: Für zwei reelle Zahlen x, y gibt |x − y| den Abstand von x zu y an, insbesondere ist |x| der Abstand von x zu 0. Für alle x, y ∈ R gilt: |x| ≥ 0, |x| = 0 ⇔ x = 0, |x · y| = |x| · |y|, | − x| = |x| 13 1. Die reellen Zahlen |x−1 | = |x|−1 (falls x 6= 0), |x + y| ≤ |x| + |y|, |x|2 = x2 |x − y| ≥ |x| − |y| (Dreiecksungleichungen) Zum Auflösen von Gleichungen oder Ungleichungen in denen die Betragsfunktion auftritt, sind die folgenden Äquivalenzen hilfreich: |x| < c ⇔ −c < x < c |x| ≤ c ⇔ −c ≤ x ≤ c |x| > c ⇔ x < −c ∨ x > c |x| ≥ c ⇔ x ≤ −c ∨ x ≥ c |x| = c ⇔ x = c ∨ x = −c |x| = |y| (falls c ≥ 0) ⇔ x = y ∨ x = −y Alle angeführten Regeln lassen sich leicht (durch Fallunterscheidung) prüfen. Beispiel 1.7. Wir wollen einige (Un-)Gleichungen lösen, in denen die Betragsfunktion vorkommt: • |x + 3| = |2x| ⇔ x + 3 = 2x ⇔ x=3 ⇔ x ∈ {−1, 3} ⇔ −3 ≤ 2x − 5 ⇔ 1≤x ⇔ x ∈ [1, 4] ∧ ∧ x + 3 = −2x x = −1 • |2x − 5| ≤ 3 ∧ ∧ 2x − 5 ≤ 3 x≤4 • x − |3 − x| < 1 ⇔ |3 − x| > x − 1 ⇔ 3 − x < −(x − 1) ⇔ 3<1 ⇔ x ∈ (−∞, 2) ∨ ∨ 3−x>x−1 x<2 • Seien a ∈ R, ε > 0 fest. |x−a| < ε 14 ⇔ −ε < x−a < ε ⇔ a−ε < x < a+ε ⇔ x ∈ (a − ε, a + ε) • Seien a, b ∈ R mit a < b fest. |x − a| ≤ |x − b| beide Seiten>0 ⇐⇒ |x − a|2 ≤ |x − b|2 ⇔ (x − a)2 ≤ (x − b)2 ⇔ −2ax + a2 ≤ −2bx + b2 ⇔ a2 − b2 ≤ 2(a − b)x Da a < b ist, erhalten wir mittels Division durch a − b: a + b ≥ 2x ⇔ x≤ a+b . 2 Zum Abschluss dieses Abschnitts zeigen wir noch die folgende Ungleichung, die wir später brauchen. Satz 1.8 (Bernoullische Ungleichung). Für alle x ∈ [−1, ∞) und alle n ∈ N gilt: (1 + x)n ≥ 1 + nx. Beweis. Wir führen für festes x ∈ [−1, ∞) einen Induktionsbeweis: 1. Induktionsanfang: n = 0 (1 + x)n = (1 + x)0 = 1 und 1 + nx = 1 + 0x = 1 2. Induktionsschritt: Sei n ∈ N. (IV) zu zeigen: (IS) (1 + x)n ≥ 1 + nx (1 + x)n+1 ≥ 1 + (n + 1)x (1 + x)n+1 = (1 + x)n · (1 + x) (IV) ≥ (1 + nx)(1 + x) = 1 + (n + 1)x + nx2 ≥ 1 + (n + 1)x 15 1. Die reellen Zahlen Für x ≥ 0 und n ≥ 1 folgt die Behauptung auch einfacher aus dem binomischen Lehrsatz A.9: (1 + x)n = n 1 X n k n−k X n k x 1 ≥ x = 1 + nx. k k k=0 k=0 Vollständigkeit von R Die bisher eingeführten Axiome reichen noch nicht ganz aus, um die reellen Zahlen zu beschreiben. Da sie allesamt auch in Q gelten, stellen wir uns die Frage, worin sich die Zahlenräume Q und R unterscheiden. Beobachtung 1.9. Es gibt keine rationale Zahl q ∈ Q mit q 2 = 2. Beweis. Wir führen hier einen Widerspruchsbeweis. Angenommen es gibt eine solche Zahl q ∈ Q. Dann lässt sich q in der Form q = n m mit n, m ∈ Z, m 6= 0 schreiben. Durch vollständiges Kürzen kann zusätzlich erreicht werden, dass n und m teilerfremd sind. Damit sind n2 und m2 ebenfalls teilerfremd1 und (wegen n2 m2 = 2 ∈ N) ist 2 folglich m = 1, also m = ±1 und somit q ∈ Z. Dies kann aber nicht sein, da es keine ganze Zahl gibt, deren Quadrat 2 ist. Bemerkung 1.10. Dieser Beweis lässt sich auf eine allgemeinere Situation übertragen. Man kann zeigen, dass für k, n ∈ N mit n ≥ 2 keine Zahl q ∈ Q \ Z mit q n = k existiert. Anders √ gesagt: Wenn n k in Z nicht existiert, dann auch nicht in Q. Man kann sich aber mit geometrischen Überlegungen klarmachen, dass die Existenz solcher Zahlen durchaus sinnvoll ist: 1 Dies 16 folgt aus der Existenz der Primfaktorzerlegung für ganze Zahlen. Länge der Hypotenuse im rechtwinkligen Dreieck, Länge der Höhe zur Hypotenuse in dem beide Katheten Länge 1 haben mit Höhenabschnitten 1 und 3 Nach dem Satz des Pythagoras gilt √ c>0 c2 = 12 + 12 = 2 ⇔ c = 2. Nach dem Höhensatz gilt √ h>0 h =1·3=3 ⇔ h = 3. 2 Die Menge der reellen Zahlen soll also unter anderem die (n-ten) Wurzeln aus positiven Zahlen enthalten. Ein Unterschied zwischen Q und R besteht also darin, dass in R Gleichungen der Form xn = y mit y ∈ [0, ∞) und n ∈ N, n ≥ 2 stets lösbar sind. Wir brauchen nun also ein (möglichst einfaches) Axiom, das die Existenz dieser Lösungen garantiert. Ein Versuch wäre das folgende Axiom: ’Für alle y ∈ [0, ∞) und alle n ∈ N mit n ≥ 2 gibt es ein x ∈ [0, ∞) mit xn = y.’ Es stellt sich aber heraus, dass dies immer noch unzureichend wäre, denn mit diesem Axiom lässt sich etwa die Frage nach der Existenz der Zahlen e und π nicht beantworten.1 Daher gehen wir anders vor und benutzen ein stärkeres Axiom, das die reellen Zahlen eindeutig beschreibt. Zur Formulierung brauchen wir noch einige Begriffe. Definition 1.11. Eine nichtleere Teilmenge ∅ = 6 M ⊂ R von R heißt . . . . . . nach oben beschränkt, . . . nach unten beschränkt, falls: ∃C ∈ R ∀x ∈ M : x ≤ C falls: ∃c ∈ R ∀x ∈ M : x ≥ c Eine solche Zahl C bzw. c heißt dann obere bzw. untere Schranke für M . Man nennt M beschränkt, falls M nach oben und nach unten beschränkt ist. Das ist genau dann der Fall, wenn es eine Zahl γ ∈ [0, ∞) gibt, so dass |x| ≤ γ für alle x ∈ M ist (man wähle γ als die größere der beiden Zahlen C und −c). 1 Bei den Zahlen e und π handelt es sich um sogenannte transzendente Zahlen über Q, das heißt, sie treten niemals als Nullstellen eines Polynoms mit rationalen Koeffizienten auf. Im Gegensatz nennt man Zahlen, die Nullstelle eines rationalen Polynoms sind, algebraisch über √ n k Nullstelle von xn − k. Q, beispielsweise ist 17 1. Die reellen Zahlen Beispiel 1.12. • Intervalle der Form [a, b], [a, b), (a, b] oder (a, b) mit a, b ∈ R, a ≤ b sind stets beschränkt. In allen Fällen ist a eine obere und b eine untere Schranke. • Die natürlichen Zahlen N sind nicht nach oben beschränkt. Sie sind aber nach unten beschränkt, eine untere Schranke ist etwa c = 0. Genauer betrachtet ist jede Zahl c ∈ (−∞, 0] eine untere Schranke für N, allerdings ist 0 eine besondere untere Schranke, nämlich die größte. • Wir betrachten die Menge M = x ∈ [0, ∞); x2 ≤ 2 . Offensichtlich ist M durch 0 nach unten beschränkt (und 0 ist die größtmögliche untere Schranke). Auch eine obere Schranke ist leicht zu finden, beispielsweise C = 2 (oder C = 3 2 oder . . .). Es ist zunächst nicht klar, ob für M eine kleinste obere Schranke existiert. Definition 1.13. Sei ∅ = 6 M ⊂ R. (a) Eine Zahl S ∈ R heißt Supremum (= kleinste obere Schranke) von M , falls die folgenden beiden Bedingungen gelten: • Die Zahl S ist eine obere Schranke für M . • Für jede (beliebige) obere Schranke S 0 für M gilt S ≤ S 0 . Schreibweise: sup M = S. Ist M nicht nach oben beschränkt, so ist sup M = ∞. (b) Eine Zahl s ∈ R heißt Infimum (= größte untere Schranke) von M , falls die folgenden beiden Bedingungen gelten: • Die Zahl s ist eine untere Schranke für M . • Für jede (beliebige) untere Schranke s0 für M gilt s ≥ s0 . Schreibweise: inf M = s. Ist M nicht nach unten beschränkt, so ist inf M = −∞. Bemerkung 1.14. Falls M eine obere Schranke S mit S ∈ M hat, so ist automatisch S = sup M . In diesem Fall bezeichnet man S auch als das Maximum von M (schreibe S = max M ). Analog: Falls M eine untere Schranke s mit s ∈ M hat, so ist s = inf M . In diesem Fall bezeichnet man s auch als das Minimum von M (schreibe s = min M ). Für M = [−1, 3) ist beispielsweise inf M = min M = −1 Die Menge M hat kein Maximum. Beispiel 1.15. 18 und sup M = 3. • Betrachte A = 1 n; n ∈ N∗ . -) Für alle n ∈ N∗ ist 1 n ≤ 1, also ist 1 eine obere Schranke für A. Wegen 1 ∈ M ist sup A = max A = 1. -) Für alle n ∈ N∗ ist 1 n ≥ 0, also ist 0 eine untere Schranke für A. Um zu zeigen, dass tatsächlich inf A = 0 ist, müssen wir begründen, dass keine Zahl S > 0 eine untere Schranke für A sein kann. Dazu: Sei S > 0. Dann gibt es ein n ∈ N∗ mit A 3 1 n < S (genau genommen, begründen wir dies erst später, für den Moment nehmen wir es als gültig an). Also ist S keine untere Schranke für A. Also ist inf A = 0. Wegen 0 ∈ / A, hat A kein Minimum. • Betrachte B = −2 + (−1)n · n−1 n ; n ∈ N∗ = −2 − 21 , −2 + 23 , −2 − 43 , −2 + 56 , . . . . 19 1. Die reellen Zahlen Ohne formalen Beweis stellen wir fest, dass inf B = −3 und sup B = −1 gilt und dass weder Maximum und Minimum existieren. Es bleibt die Frage, ob jede nach oben beschränkte Menge in R ein Supremum besitzt (bzw. jede nach unten beschränkte Menge ein Infimum). 1.16. Vollständigkeitsaxiom Zu jeder nach oben beschränken Menge M ⊂ R existiert ein S ∈ R mit S = sup M . Beispiel 1.17. Betrachte die Menge A = x ∈ R; x3 − 4x < 2 . Wir zeigen, dass A nach oben beschränkt ist, indem wir begründen, dass C = 3 eine obere Schranke für A ist: zu zeigen: x∈A ⇒ x≤3 wir zeigen: x>3 ⇒ x∈ /A Beweis: x > 3 ⇒ x3 − 4x = x(x2 − 4) > 3 · (32 − 4) = 15 ≥ 2 ⇒ x ∈ /A Genauso hätte man zeigen können, dass 5 2 eine obere Schranke für A ist, die ent- sprechende Rechnung ist: 5 5 x> ⇒ x3 − 4x = x(x2 − 4) > · 2 2 Auch (zum Beispiel) 9 4 ! 2 5 45 −4 = ≥2 ⇒ x∈ /A 2 8 ist wegen ! 2 9 9 153 · −4 = ≥ 2. 4 4 64 noch eine obere Schranke für A, aber für 17 8 funktioniert dies nicht mehr, denn: ! 2 17 17 561 · −4 = 6≥ 2. 8 8 512 20 Die kleinste obere Schranke für A ist nicht so einfach zu bestimmen, nach dem Vollständigkeitsaxiom existiert sie aber auf jeden Fall in R. Wir werfen nochmals einen Blick auf A: Man erkennt, dass sup A auf der positiven x-Achse an der Stelle zu finden sein muss, an der der Graph von R → R, x 7→ x3 − 4x die Parallele zur x-Achse mit der Gleichung y = 2 schneidet. Anders gesagt: sup A ist die positive Lösung der Gleichung x3 − 4x = 2. Auch wenn wir diese Gleichung nicht lösen können (und damit sup A nicht explizit berechnen können), garantiert uns das Vollständigkeitsaxiom, dass A eine kleinste obere Schranke hat und dass folglich die Gleichung x3 − 4x = 2 eine positive Lösung in R hat. Man könnte auch sagen: An der Stelle, an der die Menge A nach oben ’begrenzt’ ist, befindet sich auch tatsächlich eine reelle Zahl (genannt sup A). Die reellen Zahlen füllen den Zahlenstrahl (oder die x-Achse) vollständig aus. So erklärt sich auch der Name des Axioms. Bemerkung 1.18. Es folgt nun auch sofort, dass auch jede nach unten beschränke Menge ein Infimum besitzt. Ist nämlich M ⊂ R nach unten beschränkt, so ist die Menge −M = {−x; x ∈ M } ⊂ R nach oben beschränkt, und somit existiert S = sup(−M ) ∈ R. Man rechnet leicht nach, dass nun −S = inf M gilt. Um nun aus dem Vollständigkeitsaxiom die Existenz von Wurzeln in R folgern zu können, benötigen wir noch den folgenden Hilfssatz. Hilfssatz 1.19. (a) Ist n ∈ N∗ mit n ≥ 2 und sind x, y ∈ [0, ∞) mit xn < y, so existiert eine Zahl ε > 0 mit (x + ε)n < y. 21 1. Die reellen Zahlen (b) Ist n ∈ N∗ mit n ≥ 2 und sind x, y ∈ [0, ∞) mit xn > y, so existiert eine Zahl ε > 0 mit (x − ε)n > y. Die Aussage von Teil (a) dieses Hilfssatzes kann man wie folgt beschreiben: Wenn x eine (nichtnegative) reelle Zahl ist, von der bekannt ist, dass ihre n-te Potenz kleiner ist als eine andere Zahl y, so kann man x immer noch ein wenig vergrößern (indem man eine positive Zahl ε hinzuaddiert), so dass die n-te Potenz (x + ε)n immer noch kleiner als y ist. Teil (b) beschreibt analog eine Verkleinerung von x. Wir kommen nun zum Beweis des Hilfssatzes. Dabei kommen wir noch ohne das Vollständigkeitsaxiom aus (d.h. der Hilfssatz gilt auch in Q). Beweis. Wir zeigen Teil (a), der Beweis für (b) funktioniert ähnlich. Seien also n ≥ 2 und x, y ∈ [0, ∞) mit xn < y gegeben. Für ein beliebiges ε > 0 gilt nach dem binomischen Lehrsatz A.9 n n X X n k n−k n k n−k n n (x + ε) = ε x =x + ε x . k k k=0 k=1 Wir müssen also nun eine Zahl ε > 0 mit n X n k n−k ε x < y − xn k k=1 ’finden’. Die beiden Zahlen c1 = 1 y − xn und c2 = P n n n−k k x k=1 sind positiv, also ist auch c = min{c1 , c2 } > 0 und nach Bemerkung 1.5 gibt es eine Zahl ε ∈ (0, c). Damit gilt nun ε < 1 und folglich εk ≤ ε für k = 1, . . . , n sowie ε< y−xn n P k=1 (nk)xn−k . Es folgt n n X X n k n−k n n−k ε x ≤ε· x < y − xn k k k=1 k=1 und somit ist (x + ε)n < y, wie behauptet. Mit dem Hilfssatz und dem Vollständigkeitsaxiom können wir nun wie angekündigt, die Existenz von Wurzeln in R beweisen. Folgerung 1.20 (Existenz von Wurzeln). Zu jeder positiven reellen Zahl y ∈ [0, ∞) und zu jeder natürlichen Zahl n ≥ 2 existiert (genau) eine positive reelle Zahl x ∈ [0, ∞) mit xn = y. Man nennt x die √ √ n-te Wurzel aus y und schreibt x = n y (im Fall n = 2 auch kürzer x = y). 22 Beweis. Die Eindeutigkeit ist leicht einzusehen: Für zwei verschiedene Zahlen x, x̃ ∈ [0, ∞) ist x < x̃ oder x̃ < x. Folglich ist auch xn < x̃n oder x̃n < xn . Damit können xn und x̃n nicht beide = y sein. Zur Existenz: Sei n ≥ 2 und zunächst y ∈ [1, ∞). Die Menge M = {a ∈ [0, ∞); an ≤ y} . ist nichtleer (da 1 ∈ M ) und nach oben beschränkt (eine obere Schranke ist zum Beispiel y). Nach dem Vollständigkeitsaxiom 1.16 existiert also x = sup M ∈ [1, ∞). Wir zeigen nun, dass tatsächlich xn = y gilt. • Angenommen es gilt xn < y. Dann existiert nach Hilfssatz 1.19 (a) eine Zahl ε > 0 mit (x + ε)n < y. Damit ist x + ε ∈ M , im Widerspruch dazu, dass x eine obere Schranke für M ist. • Angenommen es gilt xn > y. Dann existiert nach Hilfssatz 1.19 (b) eine Zahl ε > 0 mit (x − ε)n > y. Für alle a ∈ M gilt damit an ≤ y < (x − ε)n ⇒ a < x − ε. Folglich ist x − ε eine obere Schranke für M , im Widerspruch dazu, dass x die kleinste obere Schranke für M ist. Für y ∈ (0, 1) ist Y = y −1 ∈ [1, ∞) und damit existiert (wie wir gerade gezeigt haben) X ∈ [1, ∞) mit X n = Y . Mit x = X −1 folgt xn = X −1 n −1 = (X n ) = Y −1 = y. Ist schließlich y = 0, so kann man einfach x = 0 wählen. Wir fassen an dieser Stelle einige Regeln für das Rechnen mit Wurzeln zusammen (ohne Beweis). 1.21. Rechenregeln (a) Die Wurzeln erfüllen die folgenden Regeln: √ √ √ • Für alle x, y ∈ [0, ∞) und n ≥ 2 gilt n x · y = n x · n y. √ √ −1 n • Fur alle x ∈ (0, ∞) und n ≥ 2 gilt x−1 = ( n x) . √ √ • Für x, y ∈ [0, ∞) und n ≥ 2 ist: x = y ⇔ n x = n y. √ • Für alle x ∈ R ist x2 = |x|. √ √ • Für c > 0 und n ≥ 2 gerade ist xn = c ⇔ x = n c ∨ x = − n c. √ • Für c > 0 und n ≥ 3 ungerade ist xn = c ⇔ x = n c. • Für c < 0 und n ≥ 2 gerade ist xn = c unerfüllbar. 23 1. Die reellen Zahlen √ • Für c < 0 und n ≥ 3 ungerade ist xn = c ⇔ x = − n −c. (b) Weiterhin gilt: • Für n ≥ 2 ist die Funktion √ n · : [0, ∞) → [0, ∞), x 7→ √ n x streng monoton wachsend, das heißt, für x, y ∈ [0, ∞) gilt ⇔ x<y √ n x< √ n y. • Ist 2 ≤ n < m, so gelten x>1 0≤x<1 ⇒ x> √ n ⇒ x< √ n x> x< √ m √ m x>1 x<1 • Graphen einiger Wurzelfunktionen (c) Für rationale Exponenten q = n m (n, m ∈ Z mit m > 0) und positive reelle Basen x ∈ (0, ∞) definiert man die Potenz ’x hoch q’ durch m xq = x n = √ m xn . Diese Definition ist nicht von der Wahl von n und m abhängig1 und erweitert die bekannte Definition von Potenzen mit ganzzahligen Exponenten. Die Rechenregeln für Potenzen aus 1.2 gelten damit für beliebige rationale Exponenten (und positive Basen). Um das Rechnen mit Wurzeln zu üben, lösen wir einige (Un-)Gleichungen, in denen die Wurzeln vorkommen. Beispiel 1.22. 1 Das 24 heißt, ist q = n m = n0 , m0 so ist √ m xn = √ m0 xn0 . • r 32 x = 81 32 x4 = − 81 32 x5 = 81 4 x5 = − ⇔ x= r 32 2 √ 2 √ 4 4 4 32 = · 2 ∨x=− =− · 2 81 3 81 3 ist unerfüllbar r 2 5 32 x= = √ 5 81 81 r 2 5 32 x=− = −√ 5 81 81 ⇔ 32 81 4 ⇔ • Das Quadrieren einer Gleichung ist eine Äquivalenzumformung, wenn man weiß, dass beide Seiten nichtnegativ sind. Beispielsweise ist bei √ x−2=3 ⇔ x−2=9 ⇔ x = 11 alles korrekt. • Die Gleichung dass √ x − 2 = −3 hat aber offenbar keine Lösung, man beachte, √ x − 2 = −3 x−2=9 ⇔ √ x−2=4−4 x+x ⇔ < x = 11 nicht funktioniert. • Die Rechnung √ √ x−2=2− ⇒ x √ x= 3 2 ⇔ x= 9 4 ist korrekt (im 1.Schritt steht ja nur ’⇒’), zeigt aber lediglich, dass 49 als √ √ einzige Lösung für x − 2 = 2 − x in Frage kommt. Eine Probe bestätigt r r 9 9 1 1 −2= und 2 − = . 4 2 4 2 Folglich ist 9 4 tatsächlich eine Lösung. • Zum Vergleich betrachten wir √ x−3=1− √ √ x−3=1−2 x+x ⇒ x Als einzige Lösung für √ √ hat die Gleichung √ x−3=1− 4−3=1 x−3=1− √ √ ⇔ √ x=2 ⇔ x = 4. x kommt also x = 4 in Frage. Wegen und 1− √ 4 = −1 x keine Lösung. Zum Abschluss dieses Kapitels stellen wir fest, dass die reellen Zahlen, die sogenannte Archimedische Eigenschaft haben. 1.23. Archimedische Eigenschaft1 Für alle x, y ∈ [0, ∞) gibt es ein n ∈ N∗ mit nx > y. 1 Diese Eigenschaft wird manchmal auch als ’Archimedisches Axiom’ formuliert. 25 1. Die reellen Zahlen Beweis. Seien x, y > 0. Angenommen es gibt kein n ∈ N∗ wie gefordert. Dann ist y eine obere Schranke für die Menge M = {nx; n ∈ N∗ } . Nach dem Vollständigkeitsaxiom 1.16 existiert S = sup M ∈ R. Es gilt nx ≤ S für alle n ∈ N∗ und folglich kx = (k + 1)x − x ≤ S − x für alle k ∈ N∗ . Damit ist S − x eine obere Schranke für M . Dies kann aber nicht sein, denn S ist die kleinste obere Schranke für M . Bemerkung 1.24. Geometrisch lässt die Archimedische Eigenschaft sich derart interpretieren: Hat man zwei Strecken auf einer Geraden, so kann man die größere von beiden übertreffen, wenn man die kleinere nur oft genug abträgt. Mit der Archimedischen Eigenschaft kann man sich nun überlegen, wie sich Terme der Form 1 n oder q n ’für großes n ∈ N verhalten’. Wir werden dies später präzisie- ren, wenn wir Folgenkonvergenz behandeln. Zunächst beschränken wir uns auf die nachstehende Folgerung. Folgerung 1.25. (a) Zu jedem ε > 0 existiert ein n ∈ N mit 1 n < ε. (b) Ist q ∈ (1, ∞), so existiert zu jedem C > 0 ein n ∈ N mit q n > C. (c) Ist q ∈ (0, 1), so existiert zu jedem ε > 0 ein n ∈ N mit q n < ε. Beweis. (a) Wähle (mit 1.23 zu x = 1 und y = 1ε ) ein n ∈ N mit n · 1 > 1ε . 26 (b) Wähle (mit 1.23 zu x = q − 1 und y = C) ein n ∈ N mit n · (q − 1) > C. Mit der Bernoullischen Ungleichung 1.8 folgt: n q n = (1 + (q − 1)) > 1 + n(q − 1) > 1 + C > C. (c) Wir wenden (b) auf 1 q ∈ (1, ∞) und 1 ε an und finden ein n ∈ N mit n 1 q > 1ε . 27 2. Folgen Definition 2.1. • Eine (reelle) Folge ist eine Abbildung a von den natürlichen Zahlen N nach R. Statt a : N → R, n 7→ a(n) schreiben wir Folgen meist in der Form (an )n∈N . • Es ist auch zulässig, dass die Folgenglieder an nur für n ≥ N definiert sind (mit einem festen N ∈ N). Schreibe dann (an )n≥N . • Wir benutzen auch die Abkürzung (an )n , wenn klar ist, ab welchem N die Folgenglieder definiert sind. Beispiel 2.2. (a) die Folge (n)n∈N der natürlichen Zahlen (b) die Folge n1 n≥1 der Stammbrüche (c) die Folge (n2 )n∈N der Quadratzahlen (d) die Folge (q n )n∈N der Potenzen einer reellen Zahl q (e) die Folge (pn )n∈N der Primzahlen, also p0 = 2, p1 = 3, p2 = 5, p3 = 7, . . . ( −2 , falls n gerade (f ) die Folge (an )n≥4 mit an = n , falls n ungerade n−3 2.3. Graphen von Folgen Eine Folge (an )n lässt sich graphisch darstellen, indem man im Koordinatensystem den Wert von an gegen n abträgt, das heißt, für n ≥ N werden die Punkte (n/an ) eingetragen. Beispielsweise: • Betrachte (an )n∈N mit an = a0 = −9, n2 −9 n+1 . a1 = −4, Also werden die Punkte (0/−9), Es ist 5 a2 = − , 3 (1/−4), a3 = 0, 2/ − 5 3 a4 = , 7 , 5 (3/0) , ... 4/ 57 , ... in das Koordinatensystem eingetragen. 29 2. Folgen • Für die Folge n5 2n sieht der Graph folgendermaßen aus: n∈N 2.4. Rekursiv definierte Folgen Es ist möglich, eine Folge (an )n≥N durch folgende Angaben zu definieren: 1. Gib ein oder mehrere Folgenglieder aN , . . . , aM konkret an. 2. Gib eine Vorschrift (Rekursion) an, wie man an (für n > M ) aus aN , . . . , an−1 bestimmen kann. Beispielsweise: • Setze a0 = 2 und an = an−1 − 5 für n ≥ 1. Man kann die Folgenglieder nun sukzessive berechnen: a0 = 2, a1 = −3, a2 = −8, a3 = −13, . . . Man kann sich hier leicht klar machen, dass an = −5n + 2 (n ∈ N) gilt. • Setze b0 = 1 und bn = n−1 P bi für n ≥ 1. Man berechnet: i=0 b0 = 1, b1 = 1, b2 = 1 + 1 = 2, b3 = 1 + 1 + 2 = 4, b4 = 1 + 1 + 2 + 4 = 8, . . . Offenbar ist bn = 2n (n ∈ N). • Setze f0 = 1, f1 = 1 und fn = fn−1 + fn−2 für n ≥ 2. Man berechnet: f0 = 1, f1 = 1, f2 = 2, f3 = 3, f4 = 5, f5 = 8, f6 = 13, . . . 1 1 Es handelt sich bei (fn )n um die Folge der sogenannten Fibonacci-Zahlen. Sie können durch eine geschlossene Formel ausgedrückt werden, was wir hier allerdings nicht zeigen wollen. Es gilt 1 fn = √ 5 30 √ !n 1+ 5 − 2 √ !n ! 1− 5 2 (n ∈ N) Konvergenz 2.5. Konvergenz von Folgen Wir wollen uns dem Begriff der Konvergenz von Folgen zunächst durch einige Beispiele nähern: • Betrachte die Folge 1 n n. Mit wachsendem n werden die Folgenglieder immer kleiner und kommen dabei der Zahl 0 beliebig nahe. • Sei c ∈ R eine feste Zahl und an = c für alle n ∈ N. Die Folge (an )n∈N ist dann konstant mit dem Wert c. Insbesondere kommen sie dem Wert c beliebig nahe. • Betrachte die Folge (an )n = a1 = n+2 2n n . Wir berechnen einige Folgenglieder: 3 5 11 51 , a2 = 1, a3 = , . . . , a20 = , . . . , a100 = , ... 2 6 20 100 Die Folgenglieder werden mit wachsendem n immer kleiner und nähern sich der Zahl 21 . ( • Betrachte die Folge (an )n mit an = 0 , falls n gerade 1 , falls n ungerade. Die Folgenglieder ’wechseln ständig’ zwischen den Zahlen 0 und 1. Es gibt keine feste Zahl, der sie sich annähern. • Betrachte die Folge (n2 )n . Die Folgenglieder werden mit wachsendem n immer größer und wachsen dabei über jede vorgegebene Zahl hinaus. Sie nähern sich sozusagen dem Wert ∞ an. Eine exakte Definition des Konvergenzbegriffs für Folgen (mit Grenzwert in R) ist: Eine Folge (an )n in R heißt konvergent gegen einen Wert a ∈ R, falls: ∀ε > 0 ∃n0 ∈ N ∀n ≥ n0 : |an − a| < ε Die Zahl a heißt dann Grenzwert der Folge (an )n . Wir schreiben in diesem Fall n→∞ a = lim an oder an −→ a. n→∞ Eine Folge, die nicht konvergent ist, heißt divergent. Als Beispiel betrachten wir nochmals die Folge (an )n mit an = (mutmaßlich) 1 2 n+2 2n , deren Grenzwert ist. 31 2. Folgen Die Folgenglieder an liegen in jedem (noch so kleinem) vorgegebenem Intervall 1 1 2 − ε, 2 + ε , wenn n ’groß genug’ ist. Mit anderen Worten: Zu jedem ε > 0 existiert eine Stelle n0 ∈ N, ab der die Folgenglieder an (n ≥ n0 ) allesamt im Intervall 1 1 1 2 − ε, 2 + ε liegen bzw. die Ungleichung an − 2 < ε erfüllen. Ein weiteres Beispiel: 32 Die Folge konvergiert (vermutlich) gegen −3. Für Konvergenz gegen die Werte ±∞ gilt die folgende Definition: Eine Folge (an )n in R heißt konvergent gegen ∞, falls: ∀R ∈ R ∃n0 ∈ N ∀n ≥ n0 : an > R Entsprechend heißt (an )n konvergent gegen −∞, falls: ∀R ∈ R ∃n0 ∈ N ∀n ≥ n0 : an < R Falls (an )n gegen ±∞ konvergiert, schreibt man n→∞ lim an = ±∞ oder auch an −→ ±∞. n→∞ Man nennt (an )n dann bestimmt divergent (oder auch uneigentlich konvergent). Als Beispiel betrachten wir die Folge (bn )n mit bn = n3 −6n2 4n+3 , deren Grenzwert (mut- maßlich) ∞ ist. Zu jeder Zahl R ∈ R (und sei sie noch so groß), findet man eine Stelle n0 , ab der die Folgenglieder größer als R sind Wir halten schließlich fest, dass der Grenzwert a ∈ R ∪ {±∞} einer Folge (an )n (sofern er existiert) eindeutig bestimmt ist, dass heißt eine Folge kann nicht gegen zwei verschiedene Werte a, b ∈ R ∪ {±∞} konvergieren. Im folgenden Beispiel prüfen wir die Konvergenz einiger Folgen mit dieser Definition. Beispiel 2.6. 1 n→∞ n (a) Es gilt lim = 0. Beweis. Sei ε > 0. Nach 1.25 (a) gibt es ein n0 ∈ N mit 1 n0 < ε. Für alle n ≥ n0 gilt 33 2. Folgen dann 1 − 0 = 1 ≤ 1 < ε. n n n0 Dieses Beispiel ist wichtig, da wir es später sehr oft verwenden werden, um die Konvergenz vieler weiterer Folgen zu prüfen. (b) Für an = c ∈ R (n ∈ N) gilt lim an = c. n→∞ Beweis. Sei ε > 0. Wähle n0 = 1. Für alle n ≥ n0 gilt dann |an − c| = |c − c| = 0 < ε. Dieses Beispiel ist zwar trivial aber dennoch für später wichtig. n+2 n→∞ 2n (c) Es gilt lim = 12 . Beweis. Zunächst stellen wir fest, dass n + 2 2n − 1 2 1 = = 2 2n n (n ∈ N) gilt. Sei nun ε > 0. Wähle (mit 1.25 (a)) ein n0 ∈ N mit 1 n0 < ε. Für alle n ≥ n0 gilt dann n + 2 1 1 1 2n − 2 = n ≤ n0 < ε. n+2 n→∞ 2n Nehmen wir nun einmal an, man hätte (falsch) vermutet, dass lim =1 sei. Ein (zu obigem Beweis analoger) Beweisversuch wäre wie folgt gescheitert: Der Abstand zwischen einem Folgenglied und dem mutmaßlichen Grenzwert wird berechnet n + 2 −n + 2 n − 2 2n − 1 = 2n = 2n (n ≥ 2) und dann < ε gesetzt fallsε< 21 n−2 2 < ε ⇔ n(1 − 2ε) < 2 ⇔ n< 2n (1 − 2ε) n+2 Die zu erfüllende Ungleichung 2n − 1 < ε ist hier (zumindest im Fall ε < 12 ) nur für alle n bis zu einer geeigneten Stelle erfüllt, sie sollte aber (nach der Definition von Konvergenz) ab einer geeigneten Stelle erfüllt sein. (d) Wir betrachten die Folge 4n−3 . Wir berechnen einige Folgenglieder: 5−n n≥6 a10 = − 37 = −7.4, 5 a50 = − 197 ≈ −4.378, 45 a1000 = − 4n−3 n→∞ 5−n Damit kommen wir zu der Vermutung, dass lim 34 3997 ≈ −4.017 995 = −4 gilt. Beweis. Zunächst stellen wir fest, dass 4n − 3 4n − 3 + 20 − 4n = 17 5 − n − (−4) = n−5 5−n (n ≥ 6) gilt. Sei nun ε > 0. Wir überlegen uns nun, dass: 17 <ε n−5 17 <n−5 ε ⇔ Wähle (mit 1.23) ein n0 ∈ N mit n0 > n> 17 ε 17 ε +5. ⇔ 17 +5<n ε Für alle n ≥ n0 gilt dann ebenfalls + 5 und folglich ist (nach unseren Vorüberlegungen) 4n − 3 < ε (n ≥ n0 ). − (−4) 5−n Dieser Beweis versetzt uns in die Lage zu einem gegebenen ε > 0 tatsächlich eine Stelle n0 ∈ N (wie in der Definition der Folgenkonvergenz gefordert) angeben zu können: Zu ε = 1 5 ist etwa n0 > zu wählen. Das bedeutet, dass 4n−3 5−n 17 1 5 + 5 = 90 vom Grenzwert −4 um weniger als weicht, falls n ≥ 91 ist. (Entsprechend ist die Abweichung sogar kleiner als 1 5 ab- 1 1000 , falls n ≥ 1706 ist.) Wir werden später sehen, dass man in den letzten beiden Beispielen die Konvergenz der Folge leichter hätte zeigen können. Die direkte Anwendung der Definition ist im allgemeinen recht umständlich und nur selten erforderlich. ( 0 , falls n gerade (e) Die Folge (an )n mit an = ist divergent. 1 , falls n ungerade. Beweis. Wenn a = lim an ∈ R existieren würde, so würde zu ε = n→∞ existieren, so dass |an − a| < |0 − a| < 1 2 1 2 1 2 ein n0 ∈ N für alle n ≥ n0 gilt. Das liefert und gleichzeitig |1 − a| < also 1 = −(0 − a) + (1 − a) ≤ |0 − a| + |1 − a| < 1 2 1 , 2 + 12 = 1. Das kann nicht sein. Also existiert kein solches a. Da die Folgenglieder niemals größer als 1 und niemals kleiner als −1 sind, kann (an )n auch nicht uneigentlich konvergieren. (f ) Es gilt lim n = ∞. n→∞ 35 2. Folgen Beweis. Sei R > 0. Wähle n0 ∈ N mit n0 > R. Dann gilt für alle n ≥ n0 : n ≥ n0 > R. √ −n+ √ 12n 3n n→∞ (g) Es gilt lim = −∞. Beweis. Sei R < 0. Wir suchen n0 ∈ N mit √ −n+ √ 12n 3n < R für alle n ≥ n0 . Man beachte dazu: −n + √ √ 12n <R ⇔ − 3n r n < R−2 ⇔ 3 r n n > −R+2 ⇐ > (−R+2)2 ⇔ n > 3(−R+2)2 3 3 Es genügt also, n0 > 3(−R + 2)2 zu wählen. (h) Bei konvergenten Folgen müssen die Folgenglieder nicht immer alle größer oder (−1)n −n . allle kleiner sein als der Grenzwert. Betrachten wir dazu (hn )n = 3n Die Folge konvergiert gegen − 31 , denn zu gegebenem ε > 0 ist n hn − − 1 = (−1) = 1 < ε, 3 3n 3n falls n ≥ n0 ≥ − 13 1 ε ist. Allerdings sind unendlich viele Folgenglieder größer als und auch unendlich viele kleiner als − 31 . Zur Veranschaulichung betrachten wir den Folgengraph: 36 n∈N∗ Um die Konvergenz von Folgen nicht jedesmal mit der Definition prüfen zu müssen, erarbeiten wir uns im Folgenden die Grenzwertsätze. Diese versetzen uns in die Lage aus der (bekannten) Konvergenz einfacher Folgen, die Konvergenz ’zusammengesetzter’ Folgen ableiten zu können. Wir wollen dies zunächst an einfachen Beispielen veranschaulichen. Beispiel 2.7. (a) Wir betrachten die Folgen 3n (xn )n = n + 1 n∈N und (yn )n = n+2 2n . n∈N∗ Dann konvergiert (xn )n gegen 3, denn (für ε > 0) gilt 3n 3 3 n + 1 − 3 = n + 1 < ε ⇔ n > ε − 1. (Zu gegebenem ε > 0 wählt man daher n0 ∈ N mit n0 > Beispiel 2.6 (c) wissen, konvergiert (yn )n gegen 3 ε − 1.) Wie wir nach 1 2. Nun betrachten wir Summe, Differenz, Produkt und Quotient der beiden Folgen: Für n ∈ N∗ gilt: xn + yn = 3n n+1 + n+2 2n = 7n2 +3n+2 2n2 +2n xn − yn = 3n n+1 − n+2 2n = 5n2 −3n−2 2n2 +2n xn · yn = = 3(n+2) 2(n+1) xn yn = = 6n2 n2 +3n+2 3n n+1 3n n+1 · n+2 2n n+2 2n Wir berechnen einige Glieder dieser ’kombinierten’ Folgen und kommen damit zu einer Vermutung für ihre Grenzwerte. n 10 xn + yn 732 220 xn + yn 100 ≈ 3.327 70302 20200 468 220 ≈ 2.227 49698 20200 xn · yn 36 22 ≈ 1.636 306 202 xn yn 600 132 ≈ 4.545 60000 10302 1000 Vermutung für n → ∞ ≈ 3.480 7003002 2002000 ≈ 3.498 7 2 =3+ 1 2 ≈ 2.460 4996998 2002000 ≈ 2.496 5 2 =3− 1 2 ≈ 1.515 ≈ 5.824 3006 2002 ≈ 1.501 6000000 1003002 ≈ 5.982 3 2 =3· 6=3 1 2 1 2 Es ergibt sich die folgende Vermutung: Konvergieren zwei Folgen in R, so konvergieren auch ihre Summen/Differenzen/Produkte/Quotienten und der jeweilige Grenzwert ist Summe/Differenz/Produkt/Quotient der Grenzwerte der ursprünglichen Folgen. Wir werden sehen, das dies richtig ist. Man muss dabei 37 2. Folgen allerdings den Sonderfall, dass bei einer Quotientenfolge der Nenner gegen 0 konvergiert, ausschließen. (b) Wir betrachten nun den Fall, dass die Folge (yn )n im Nenner gegen 0 konvergiert, wir betrachten yn = 1 n. Für den Zähler untersuchen wir verschiedene Folgen: • Sei an = n+1 n . • Sei bn = 1−2n n . Dann konvergiert (an )n gegen 1 und an n→∞ = n + 1 −→ ∞. yn Dann konvergiert (bn )n gegen −2 und bn n→∞ = 1 − 2n −→ −∞. yn 1 • Sei cn = − 3n+3 . Dann konvergiert (cn )n gegen 0 und 1 n cn n→∞ −→ − . =− yn 3n + 3 3 • Sei dn = 1 n2 . Dann konvergiert (dn )n gegen 0 und dn 1 n→∞ −→ 0. = yn n • Sei en = − √1n . Dann konvergiert (en )n gegen 0 und √ n→∞ en = − n −→ −∞. yn Man kommt zu folgender Vermutung, für die Konvergenz von Quotienten, falls die Folge im Nenner gegen 0 konvergiert: • Konvergiert die Zählerfolge gegen eine positive reelle Zahl, so konvergiert die Quotientenfolge gegen +∞. (?) • Konvergiert die Zählerfolge gegen eine negative reelle Zahl, so konvergiert die Quotientenfolge gegen −∞. (?) • Konvergiert die Zählerfolge auch gegen 0, so wissen wir nichts über die Konvergenz der Quotientenfolge. (Es kann in diesem Fall auch passieren, dass die Quotientenfolge überhaupt nicht konvergiert.) Auch die ersten beiden Punkte in dieser Liste sind nicht in voller Allgemeinheit richtig (sie stimmen allerdings, wenn man zusätzlich voraussetzt, dass die Glieder der Nennerfolge ab einer geeigneten Stelle positiv sind) . Ersetzt man die Nennerfolge beispielsweise durch die Nullfolge − n1 n∈N∗ , so drehen sich die Vorzeichen beim Grenzwert der Quotientenfolge gerade um. Falls man im n Nenner eine alternierende Nullfolge, wie zum Beispiel − 12 (wir werden n∈N später zeigen, dass dies tatsächlich eine Nullfolge ist) ansetzt, so divergiert die Quotientenfolge, falls die Zählerfolge gegen eine Zahl a ∈ R∗ konvergiert. 38 Wir geben nun einen umfassenden Überblick für Konvergenzuntersuchungen bei zusammengesetzten Folgen. 2.8. Grenzwertsätze Die folgenden Regeln ermöglichen das Rechnen mit Grenzwerten. Man beachte, das einige dieser Regeln nur unter bestimmten Zusatzvoraussetzungen gelten. Es gibt auch Sitiuationen, in denen keine allgemeine Aussage möglich ist. Diese Fälle sind mit ’?’ gekennzeichnet. Tabelle 1 (Summen und Differenzen) Voraussetzungen mögliche Folgerungen (an )n (bn )n (an + bn )n (an − bn )n konvergiert gegen konvergiert gegen konvergiert gegen konvergiert gegen a∈R b∈R a+b a−b ±∞ b∈R ±∞ ±∞ a∈R ±∞ ±∞ ∓∞ ∞ ∞ ∞ ? ∞ −∞ ? ∞ −∞ ∞ ? −∞ −∞ −∞ −∞ ? Tabelle 2 (skalare Vielfache) Voraussetzungen mögliche Folgerungen (an )n λ∈R (λ · an )n konvergiert gegen fest konvergiert gegen a∈R λ·a ±∞ >0 ±∞ ±∞ <0 ∓∞ Tabelle 3 (Produkte) Voraussetzungen mögliche Folgerungen (an )n (bn )n (an · bn )n konvergiert gegen konvergiert gegen konvergiert gegen a∈R b∈R a·b ±∞ b ∈ R, b > 0 ±∞ ±∞ b ∈ R, b < 0 ∓∞ ±∞ 0 ? ∞ ∞ ∞ ∞ −∞ −∞ −∞ ∞ −∞ −∞ −∞ ∞ 39 2. Folgen Tabelle 4 (Quotienten) Hier wird immer vorausgesetzt, dass bn 6= 0 (n ∈ N) ist. Voraussetzungen (an )n (bn )n konvergiert gegen konvergiert gegen a∈R b ∈ R \ {0} mögliche Folgerungen an bn n konvergiert gegen a b ∞ , falls ∃n0 ∈ N ∀n ≥ n0 bn > 0 a>0 0 a<0 0 0 0 ? a∈R ±∞ 0 ±∞ b>0 ±∞ ±∞ b<0 −∞ , falls ∃n0 ∈ N ∀n ≥ n0 bn < 0 ist divergent , sonst −∞ , falls ∃n0 ∈ N ∀n ≥ n0 bn > 0 ∞ , falls ∃n0 ∈ N ∀n ≥ n0 bn < 0 ist divergent , sonst ∓∞ ±∞ 0 ±∞ ±∞ ±∞ , falls ∃n0 ∈ N ∀n ≥ n0 bn > 0 ∓∞ , falls ∃n0 ∈ N ∀n ≥ n0 bn < 0 ist divergent , sonst ? Tabelle 5 (Wurzeln) Hier wird immer vorausgesetzt, dass an ≥ 0 (n ∈ N) ist. Es sei k ∈ N mit k ≥ 2 fest. Voraussetzungen (an )n konvergiert gegen mögliche Folgerungen √ k a n n a≥0 konvergiert gegen √ k a ∞ ∞ Wir wollen hier nicht alle dieser Regeln beweisen, sondern nur einige wenige Beweise ausführen, um anzudeuten, wie man vorgehen kann. • Es gelte lim an = a und n→∞ lim bn = b mit a, b ∈ R. n→∞ Wir wollen zeigen: lim (an + bn ) = a + b und n→∞ lim (an · bn ) = a · b n→∞ Zur ersten Behauptung: Sei ε > 0. Wir wählen zu für alle n ≥ n1 und ein n2 ∈ N mit |an −a| < 40 ε 2 ε 2 ein n1 ∈ N mit |an −a| < ε 2 für alle n ≥ n2 . Dann setzen wir n0 = max{n1 , n2 }. Für alle n ≥ n0 gilt dann (wir benutzen an entscheidender Stelle die Dreiecksungleichung, siehe 1.6) |an + bn − (a + b)| = |an − a + bn − b| ≤ |an − a| + |bn − b| < ε ε + = ε. 2 2 Für die zweite Behauptung betrachten wir zunachst folgende Vorüberlegung: Wir versuchen |an bn − ab| nach oben abzuschätzen, so dass (neben festen, d.h. von n unabhängigen Werten) Terme der Form |an −a| und |bn −b| vorkommen. Die Rechnung ist nicht einfach und erfordert einige kleine Tricks. Für alle n ∈ N gilt: |an bn − ab| = |an bn − an b + an b − ab| (Addition einer ’komplizierten 0’) ≤ |an bn − an b| + |an b − ab| (Dreiecksungleichung, siehe 1.6) = |an | · |bn − b| + |b| · |an − a| (Multiplikativität des Betrags, siehe 1.6) ≤ |an − a| · |bn − b| + |a| · |bn − b| + |b| · |an − a|, denn es ist |an | = |an −a+a| ≤ |an −a|+|a|. Falls wir (für ein δ > 0) erreichen können, dass |an − a| < δ und |bn − b| < δ gilt, so folgt also |an bn − ab| < δ 2 + |a| · δ + δ · |b| = δ (δ + |a| + |b|) . o n ε , 1 , damit Sei nun ε > 0 gegeben. Wir setzen zunächst δ = min 1+|a|+|b| erhalten wir δ (δ + |a| + |b|) ≤ ε · (1 + |a| + |b|) = ε 1 + |a| + |b| gilt. Nun wählen wir n1 ∈ N mit |an − a| < δ für alle n ≥ n1 und n2 ∈ N mit |bn − b| < δ für alle n ≥ n2 . Wir setzen n0 = max{n1 , n2 } und erhalten für alle n ≥ n0 : |an bn − ab| < δ (δ + |a| + |b|) ≤ ε. Dies zeigt die Behauptung, es gilt lim an bn = ab. n→∞ • Es gelte bn > 0 (n ∈ N) und lim an = a ∈ (0, ∞) n→∞ und lim bn = 0. n→∞ Wir wollen zeigen: an = +∞ bn Sei dazu R > 0. Zunächst wählen wir ein n1 ∈ N mit |a − an | < lim n→∞ n ≥ n1 (beachte: wegen a > 0 ist a 2 a 2 für alle > 0). Für alle n ≥ n1 gilt dann auch: a a an = (an − a) + a ≥ −|an − a| + a > − + a = (> 0) 2 2 Nun wählen wir außerdem ein n2 ∈ N mit bn = |bn − 0| > a 2R für alle n ≥ n2 und setzen dann n0 = max{n1 , n2 }. Für alle n ≥ n0 gilt nun an a a > > a = R. bn 2bn 2 · 2R 41 2. Folgen Im folgenden Beispiel wird gezeigt, wie die Grenzwertsätze angewendet werden können. Beispiel 2.9. (a) Wir betrachten nochmals die Folge 4n−3 5−n . Es gilt n 4 − 3 n→∞ 4 − 0 4n − 3 = 5 n −→ = −4 5−n 0−1 n −1 nach den Grenzwertsätzen und Beispiel 2.6 (a) und (b). Dies bestätigt das Ergebnis aus 2.6 (d). (b) Betrachte die Folge r 6 8n2 + 3n + 1 = 2n2 + 2 (c) Betrachte q 6 s 6 −n3 +3n−5 n2 +3 8n2 +3n+1 2n2 +2 n2 8 + n3 + n12 n2 2 + n12 . Es gilt n s = 6 8 + n3 + n12 2 + n12 n→∞ −→ r 6 √ 8+0+0 3 = 2. 2+0 . Es gilt n −2 + n3 − −2n3 + 3n − 5 n3 = · 8n2 + 4 n2 8 + n42 |{z} | {z =n→∞ 5 n3 n→∞ −→ −∞. } → −2+0−0 =− 14 8+0 (d) Manchmal muss man zunächst geschickt umformen, bevor man die Grenzwertsätze √ √ n + 1 − n n kann man die Grenzwertsätze anwenden kann. Bei der Folge nicht direkt anwenden (keine Aussage bei ∞ − ∞). Man erkennt aber durch √ √ Erweitern mit n + 1 + n, dass √ n+1− √ √ n = = = √ √ √ n+1− n · n+1+ n √ √ n+1+ n 1 √ √ n+1+ n r 1 1 1 n→∞ ·q −→ 0 · √ = 0. n 1+0+1 1+ 1 +1 n (e) Betrachte die Folge (−1)n n . Schreibt man n (−1)n n = 1 n · (−1)n um, so konver- giert der erste Faktor gegen 0, der zweite Faktor ist jedoch divergent. Man kann hier also die Grenzwertsätze nicht anwenden. In manchen Situationen ist der folgende sogenannte ’Einschließungsssatz’ hilfreich. Wenn wir eine Folge (ab einer geeigneten Stelle) zwischen zwei neue Folgen einschachteln können, die beide gegen den gleichen Grenzwert konvergieren, so konvergiert auch die ursprüngliche Folge gegen denselben Wert. 42 Hilfssatz 2.10. Seien (an )n , (bn )n und (xn )n Folgen in R. Es gelte lim an = x und n→∞ (mit einem x ∈ R) lim bn = x n→∞ und es existiere ein N ∈ N mit an ≤ xn ≤ bn ∀n ≥ N. Dann gilt auch lim xn = x. n→∞ Beweis. Sei ε > 0. Wir wählen ein n0 ∈ N mit n0 ≥ N , so dass |an − x| < ε und |bn − x| < ε für alle n ≥ n0 gilt. (Genauer: Wähle n1 ∈ N mit |an − x| < ε für alle n ≥ n1 und n2 ∈ N mit |bn − x| < ε für alle n ≥ n2 . Setze dann N = max{N, n1 , n2 }.) Dann gilt auch −ε < an − x ≤ xn − x < bn − x < ε und damit |xn − x| < ε für alle n ≥ n0 . Beispiel 2.11. (a) Betrachte die Folge (xn )n∈N mit xn = n−4 n−(−1)n . n−4 n−4 ≤ xn ≤ n+1 n−1 n−4 n→∞ n+1 Wegen lim n−4 n→∞ n−1 = 1 = lim Wegen −1 ≤ (−1)n ≤ 1 gilt (n ≥ 4). (benutze dazu die Grenzwertsätze wie in 2.9 (a)) folgt mit 2.10, dass auch lim xn = 1 ist. n→∞ (b) Ist ωn (für n ≥ 1) die n-te Nachkommastelle von xn = n + ωn 2 n + (ωn ) √ 2 und ist (n ∈ N∗ ), so gilt (man benutze für die Grenzwerte rechts und links die Grenzwertsätze): n→∞ 1 ←− n n + 9 n→∞ ≤ xn ≤ −→ 1 n + 99 n Nach dem Einschließungssatz 2.10 konvergiert auch die eingeschlossene Folge (xn )n gegen 1. Wir können aus dem Einschließungsssatz ein verwandtes Konvergenzkriterium ableiten, das oftmals leichter anwendbar ist. Folgerung 2.12. (a) Eine Folge (yn )n ist genau dann eine Nullfolge, wenn die Betragsfolge (|yn |)n eine Nullfolge ist. 43 2. Folgen (b) Ist (xn )n eine beliebige Folge und (an )n eine Nullfolge in R und gilt für ein x ∈ R und ein N ∈ N die Abschätzung |xn − x| ≤ an ∀n ≥ N, so folgt lim xn = x. n→∞ Beweis. (a) Das ist wegen |yn − 0| = ||yn | − 0| klar. (b) Durch die Abschätzung 0 ≤ |xn − x| ≤ an (n ≥ N ) können wir |xn − x| n zwischen zwei Nullfolgen ’einschließen’. Mit 2.10 folgt daraus lim |xn − x| = 0. Nach (a) ist damit auch lim (xn − x) = 0. Mit den n→∞ n→∞ Grenzwertsätzen folgt n→∞ xn = (xn − x) + x −→ 0 + x = x. Beispiel 2.13. (a) Wir betrachten nochmals die Folge (−1)n n (siehe Beispiel 2.9). Es gilt n (−1)n 1 n→∞ n − 0 = n −→ 0. n Nach Folgerung 2.12 gilt damit auch lim (−1) = 0. n n→∞ n (b) Auch die Folge (hn )n = (−1)3n −n aus Beispiel 2.6 (h) kann man auf n∈N∗ diese Art untersuchen. Es ist hn − − 1 = 1 n→∞ −→ 0. 3 3n Nach Folgerung 2.12 konvergiert (hn )n gegen − 31 . n−4 (c) Betrachte nochmals n−(−1) (vergleiche 2.11 (a)). Wegen n n n−4 −4 + (−1)n 4 − (−1)n 5 n→∞ n − (−1)n − 1 = n − (−1)n = n − (−1)n ≤ n − 1 −→ 0 (⇐ GWS’e) n−4 konvergiert n−(−1) nach Folgerung 2.12 gegen 1. n n Wir schließen diesen Abschnitt mit einigen einfachen Feststellungen über konvergente Folgen. 44 Bemerkung 2.14. Sei (xn )n eine Folge mit Limes x ∈ R. (Es ist hier also schon vorausgesetzt, dass die Folge in R konvergiert.) Dann gilt für jede Zahl C ∈ R: • Ist x < C, so existiert eine Stelle n0 ∈ N mit xn < C für alle n ≥ n0 . • Ist x > C, so existiert eine Stelle n0 ∈ N mit xn > C für alle n ≥ n0 . • Falls es eine Stelle n0 ∈ N gibt mit xn ≤ C für alle n ≥ n0 , so ist auch x ≤ C. • Falls es eine Stelle n0 ∈ N gibt mit xn ≥ C für alle n ≥ n0 , so ist auch x ≥ C. • Ersetzt man ≤ durch < (bzw. ≥ durch >), so stimmen die vorigen beiden Aussagen nicht mehr. Einige spezielle Folgen Dieser Abschnitt widmet sich der Konvergenzuntersuchung für einige spezielle Folgen, bei denen man nicht ’auf den ersten Blick’ erkennen kann, ob und wogegen sie konvergieren. Wir beginnen mit geometrischen Folgen (Folgen der Form (q n )n∈N mit einer festen Zahl q ∈ R) und betrachten zunächst einige Graphen solcher Folgen: Graph von ((0.9)n )n 45 2. Folgen Graph von ((1.2)n )n 46 Graph von − 23 n Graph von − 43 n n n Dies führt uns zu folgendem Satz über die Konvergenz geometrischer Folgen. Satz 2.15. Für eine feste Zahl q ∈ R ist die Folge (q n )n konvergent gegen 0 , falls |q| < 1 konvergent gegen 1 , falls q = 1 bestimmt divergent gegen ∞ divergent , falls q > 1 , falls q ≤ −1 Beweis. • Sei zunächst 0 < |q| < 1. Sei ε > 0. Nach 1.25 (c) existiert ein n0 ∈ N mit |q|n0 < ε. Für alle n ≥ n0 gilt nun |q n − 0| = |q|n ≤ |q|n0 < ε. n • Für q = 0 ist q n = 0 (n ≥ 1) und somit q n −→ 0. n • Für q = 1 ist q n = 1 (n ∈ N) und somit q n −→ 1. • Für q = −1 ist q n = (−1)n (n ∈ N) und somit ist (q n )n divergent. n n • Für |q| > 1 ist q −1 < 1 und somit gilt q −1 −→ 0. Nach den Grenz- 1 bestimmt gegen wertsätzen (Tabelle 4) divergiert damit (q n )n = (q−1 )n n −1 n ∞, falls q > 1 ist (dann ist immer q > 0) und ist divergent, falls q < −1 −1 n ist (dann wechselt q unendlich oft das Vorzeichen). Beispielsweise ist also lim (0.99)n = 0, n→∞ lim n→∞ − 2 3 n =0 und n 5 = ∞. n→∞ 4 lim Wir wissen nun, dass Folgen der Form (q n )n mit |q| < 1 gegen 0 konvergieren. Außerdem ist für festes k ∈ N∗ ist die Folge (nk )n bestimmt divergent gegen ∞. Die Frage nach der Konvergenz der Folge q n · nk n∈N (|q| < 1, k ∈ N∗ ) lässt sich mit den Grenzwertsätzen also nicht beantworten. Der Graph der Folge 1 n · n5 n (siehe 2.3) deutet an, dass diese Folge eine Nullfolge ist. Um dies zu 2 beweisen, benutzen wir den folgenden nützlichen Hilfssatz. Hilfssatz 2.16. Sei (an )n≥N eine Folge. 47 2. Folgen (a) Falls eine Zahl r ∈ (0, 1) und eine Stelle n0 ≥ N existieren mit an+1 ≤ r, ∀n ≥ n0 : an 6= 0 und an so ist lim an = 0. n→∞ (b) Falls an 6= 0 (n ≥ N ) und lim aan+1 = r ∈ [0, 1) existiert, so ist lim an = 0. n n→∞ n→∞ Beweis. (a) Induktiv folgt: ∀n ≥ n0 : |an | ≤ rn · |an0 | . r n0 Der Induktionsanfang ist klar, im Induktionsschritt beachte man: (IV) an+1 ≤ r · |an | ≤ rn+1 · |an0 | |an+1 | = |an | · an r n0 |a | Nach 2.15 ist rn · rnn00 eine Nullfolge. Also können wir (|an |)n durch n 0 < |an | ≤ rn · |an0 | rn0 (n ≥ n0 ) zwischen zwei Nulfolgen einschließen. Nach dem Einschließungssatz 2.10 ist (|an |)n damit auch eine Nullfolge. Aus 2.12 (a) folgt schließlich, dass (an )n eine Nullfolge ist. (b) Zunächst beachte man, dass r < n0 ∈ N mit r+1 2 < 1 gilt. Nach 2.14 existiert eine Stelle an+1 r + 1 an < 2 Nach Teil (a) (angewendet auf r+1 2 (n ≥ n0 ). statt r) folgt die Behauptung. Nun folgt der angestrebte Satz über die Konvergenz von Folgen der Form q n · nk n . Satz 2.17. Ist q ∈ R mit |q| < 1 und ist k ∈ N∗ , so gilt lim q n · nk = 0. Für q > 1 und qn k n→∞ n k ∈ N∗ gilt folglich lim n→∞ = ∞. (Dies zeigt uns also, dass q n (für beliebiges festes q > 1) ’schneller’ gegen ∞ konvergiert als nk für ein festes k ∈ N∗ .) Beweis. Wir setzen an = q n · nk . Mit den Grenzwertsätzen folgt k k an+1 |q|n+1 · (n + 1)k n+1 1 n→∞ = = |q| · = |q| · 1 + −→ |q| ∈ [0, 1). an |q|n · nk n n Nach 2.16 (b), folgt, dass (an )n eine Nullfolge ist. 48 Beispielsweise ist also n 1 10 ·n =0 lim n→∞ 2 und (1.01)n = ∞. n→∞ n3 lim Bemerkung 2.18. Die letzten Sätze bringen uns neue Informationen über die Konvergenz bestimmter Folgen, die wir benutzen können, um die Grenzwertsätze in neuen Situationen anzuwenden. Beispielsweise ist: • 2 3 n + 10 · 5nn 3n + 10n2 0 + 10 · 0 n→∞ 5 = −→ = 0, n n n+4 2 n 5 −2 + 8n 1 − 16 · 0 + 8 · 0 1 − 16 · 5 + 8 · 5n n n 2 denn nach 2.15 und 2.17 konvergieren 53 , 5nn , 52 und 5nn gegen 0. • 2n + n4 √ = n3 + 3 n Wegen n3 3n r 4n + 2 · 2n · n4 + n8 = n3 + 3 n s 4 n 3 +2· n3 3n 2 n 3 · n4 + n8 3n +1 → 0 konvergiert der Nenner gegen 1. Wegen n n 2 4 n8 → ∞, · n4 → 0 und →0 3 3 3n konvergiert der Zähler gegen ∞. Insgesamt konvergiert der Bruch (und damit auch die Wurzel daraus) gegen ∞. Es gilt also: 2n + n4 lim √ =∞ n→∞ n3 + 3 n Im nächsten Beispiel betrachten wir einige Folgen, bei denen der Exponent gegen 0 konvergiert. Satz 2.19. Es gilt: lim n→∞ √ n c = 1 (c > 0 fest), und lim n→∞ √ n n = 1. Beweis. • Wir beginnen mit der zweiten Behauptung: Sei ε > 0. Für n ∈ N gilt: n √ 1 n n − 1 < ε ⇔ n < (1 + ε)n ⇔ n · < 1. 1+ε n 1 1 Da 1+ε < 1 ist, gilt lim n · 1+ε = 0 nach 2.15 (b). Insbesondere gibt es n→∞ n 1 eine Stelle n0 ∈ N mit n · 1+ε < 1 ∀n ≥ n0 . Wie wir nachgerechnet haben, √ n gilt damit auch | n − 1| < ε ∀n ≥ n0 . √ √ • Die erste Behauptung folgt nun wegen 1 ≤ n c ≤ n n (n ≥ n0 ≥ c) unmittelbar aus dem Einschließungsssatz 2.10. Um dieses Ergebnis zu bestätigen, schauen wir auf einige Folgengraphen: 49 2. Folgen Graph von Graph von √ n 0.4 √ n 30 n n √ Graph von ( n n )n 50 Beschränkte und monotone Folgen In diesem Abschnitt untersuchen wir die Konvergenzeigenschaften von beschränkten und monotonen Folgen. Wir erhalten ein wichtiges Konvergenzkriterium, das auf der Vollständigkeit der reellen Zahlen beruht. Zunächst definieren wir die benötigten Begriffe und stellen einfache Zusammenhänge klar. Definition 2.20. Man nennt eine Folge (an )n≥N nach oben (bzw. unten) beschränkt, falls die Menge {an ; n ≥ N } nach oben (bzw. unten) beschränkt ist, also genau dann wenn eine Zahl C ∈ R existiert, so dass an ≤ C (bzw. an ≥ C) für alle n ≥ N gilt. Außerdem nennt man die Folge (an )n≥N beschränkt, wenn sie nach oben und nach unten beschränkt ist. Das ist genau dann der Fall, wenn es eine Zahl C > 0 gibt mit |an | ≤ C für alle n ≥ N . Beispiel 2.21. • Die Folge 1 n n≥1 • Die Folge −n3 ist beschränkt, denn es ist 0 ≤ n∈N 1 n ≤ 1 für alle n ≥ 1. ist nach oben beschränkt (−n3 ≤ 0), aber nicht nach unten. • Die Folge ((−n)n )n∈N ist weder nach oben, noch nach unten beschränkt. ist nach oben durch das erste Folgenglied 8 und nach • Die Folge 5n+3 n n∈N∗ unten durch ihren Grenzwert 5 beschränkt, denn es ist 5n + 3 3 = 5 + ∈ (5, 8]. n n 51 2. Folgen • Die Folge (hn )n = (−1)n −n 3n n∈N∗ (vergleiche 2.6) konvergiert gegen − 13 aber der Grenzwert ist weder eine obere noch eine untere Schranke. Dennoch ist die Folge beschränkt, es gilt inf {hn ; n ∈ N∗ } = min {hn ; n ∈ N∗ } = h1 = − und 2 3 1 sup {hn ; n ∈ N∗ } = max {hn ; n ∈ N∗ } = h2 = − . 6 Bemerkung 2.22. (a) Konvergente Folgen mit Grenzwert in R sind immer beschränkt. Beweis. Ist (an )n≥N eine Folge in R mit lim an = a ∈ R, so existiert zu ε = 1 n→∞ eine Zahl n0 ∈ N mit |an − a| < 1 für alle n ≥ n0 . Setzt man C = max{|aN |, . . . , |an0 −1 |, |a| + 1}, so folgt |an | ≤ C für alle n ≥ N . Umgekehrt muss nicht jede beschränkte Folge konvergent sein, man betrachte etwa die Folge ((−1)n )n . (b) Ist (an )n eine beschränkte Folge und (bn )n eine Nullfolge, so ist (an · bn )n ebenfalls eine Nullfolge. Dies folgt aus 2.12, denn es ist (für geeignetes C > 0) n→∞ |an · bn | ≤ C · bn −→ 0. 52 (c) Folgen, die gegen +∞ konvergieren sind stets nach unten aber niemals nach oben beschränkt. (d) Folgen, die gegen −∞ konvergieren sind stets nach oben aber niemals nach unten beschränkt. Definition 2.23. Man nennt eine Folge (an )n≥N monoton wachsend (bzw. fallend), falls an+1 ≥ an (bzw. an+1 ≤ an ) für alle n ≥ N gilt. Beispiel 2.24. • Die Folge (an )n = 5n+3 n n (vergleiche 2.21) ist monoton fallend. Beweisen kann man das zum Beispiel wie folgt:: an+1 = 5 + • Die Folge (bn )n = n3 n 3 3 ≤ 5 + = an n+1 n (n ∈ N∗ ) ist wegen bn+1 = (n + 1)3 ≥ n3 = bn (n ∈ N) monoton wachsend. • Die Folge ((−1)n )n ist weder monoton wachsend noch monoton fallend. • Betrachte die Folge (an )n∈N mit an = n2 − 10n. Dann gilt: an+1 ≥ an ⇔ (n + 1)2 − 10(n + 1) ≥ n2 − 10n ⇔ n ≥ 9 2 n∈N ⇔ n≥5 Also ist die Folge (an )n∈N nicht monoton wachsend, jedoch ist die Folge (an )n≥5 monoton wachsend. Man sagt auch: (an )n ist ab der Stelle 5 monoton wachsend. Wir versuchen nun, die Frage nach der Konvergenz monotoner Folgen zu beanworten. Offenbar konvergiert jede monoton wachsende Folge, die nicht nach oben beschränkt ist, uneigentlich gegen +∞. (Analog: Jede monoton fallende Folge, die nicht nach unten beschränkt ist, konvergiert uneigentlich gegen −∞.) Die Antwort für beschränkte monotone Folgen liefert der folgende Satz. Satz 2.25. Ist (an )n≥N eine nach oben beschränkte, monoton wachsende Folge, so ist (an )n konvergent mit lim an = sup {an ; n ≥ N } . n→∞ (Analog: Jede nach unten beschränkte, monoton fallende Folge konvergiert gegen das Infimum der Menge aller Folgenglieder.) Beweis. Nach dem Vollständigkeitsaxiom 1.16 existiert a = sup {an ; n ≥ N } ∈ R. Sei ε > 0. 53 2. Folgen Dann kann a − ε keine obere Schranke für {an ; n ≥ N } sein, folglich gibt es ein n0 ∈ N mit an0 > a − ε. Für alle n ≥ n0 gilt nun |an − a| = a − an ≤ a − an0 < a − (a − ε) = ε. Beispiel 2.26. Wir betrachten die Folge (an )n≥1 mit an = 1 + 1 n . n Der Folgengraph legt die Vermutung nahe, dass die Folge gegen eine Zahl im Intervall [2.5 , 3] konvergiert: Um zu beweisen, dass (an )n tatsächlich konvergiert, zeigen wir zunächst, dass (an )n monoton wachsend und nach oben beschränkt ist. Dies erfordert einige trickreiche Rechnungen: (1) Mit dem binomischen Lehrsatz folgt an = 1+ 1 n n = n k X n 1 k=0 k n 1n−k = 2 + n X n k=2 k n−k (n ≥ 2). (2) Ist 2 ≤ k ≤ n, so gilt k−1 n k k k Y Y 1 n −k Y n + 1 − i Y 1 n+1−i 1 ≤ n = · = = k i n i · n 2 2 {z } i=1 i=1 | i=2 i=1 ≤ 12 ,falls i≥2 Man beachte dabei: n+1−i 1 ≤ i·n 2 54 ⇔ i≥ 2m + 2 m+2 ⇐ i≥2 Setzt man dies in (1) ein, so folgt mit der geometrischen Summenformel (siehe A.4 (b)) für alle n ≥ 2 an ≤ 2 + n k−1 X 1 k=2 2 =2+ n−1 X k=1 1 2 k n 1 − 21 =2+ − 1 ≤ 3. 1 − 21 Da auch a1 ≤ 3 ist, ist 3 eine obere Schranke für (an )n . (3) Seien nun n, m ∈ N mit 2 ≤ m ≤ n. Wie in (2) berechnet man k k Y n −k m m+1−i Y n+1−i −k ≤ = n . m = i·m i·n k k i=1 i=1 Man beachte dabei: n+1−i m+1−i ≤ i·m i·n ⇔ n(1 − i) ≤ m(1 − i) (stets erfüllt) Setzt man dies in (1) ein, so folgt m m n X X X m n −k n −k am = 2 + m−k ≤ 2 + n ≤2+ n = an . k k k k=2 k=2 k=2 Da auch a1 ≤ a2 ist, folgt dass die Folge (an )n monoton wachsend ist. Nach 2.25 existiert e = lim an . Man nennt e die Eulersche Zahl. Es ist e ≈ 2.7182. n→∞ Konvergenz rekursiv definierter Folgen Beispiel 2.27. (a) Wir betrachten die durch a0 = 1 , 4 an = a2n−1 + 1 4 (n ≥ 1) rekursiv definierte Folge. Angenommen (an )n konvergiert gegen eine Zahl a ∈ R. Dann gilt auch lim an−1 = a und nach den Grenzwertsätzen folgt n→∞ 2 1 1 1 a2n−1 + = lim an−1 + = a2 + . n→∞ n→∞ 4 4 4 a = lim an = lim n→∞ Löst man diese (quadratische) Gleichung nach a auf, so folgt a = 12 . Wir wissen nun also: Wenn (an )n konvergiert, dann gegen 12 . Wegen an − an−1 = a2n−1 1 − an−1 + = 4 a2n−1 1 − 2 2 ≥0 (n ≥ 1) ist (an )n monoton wachsend. Induktiv zeigen wir nun, dass an ≤ 1 2 für alle n ∈ N gilt (wenn die Folge konvergiert, so ist der Grenzwert eine obere Schranke (vergleiche 2.25): 55 2. Folgen 1. Induktionsanfang (n = 0): Es ist a0 = 1 4 ≤ 21 . 2. Induktionsschritt: Sei n ≥ 1 fest und an−1 ≤ 1 2 vorausgesetzt. Dann ist (beachte auch an−1 ≥ 0) an = a2n−1 + 1 ≤ 4 2 1 1 1 + ≤ . 2 4 2 Also ist (an )n auch nach oben beschränkt und folglich (nach 2.25) konvergent. Es gilt also lim an = 12 . n→∞ (b) Wir betrachten die durch b0 = 1, 1 4 bn = b2n−1 + (n ≥ 1) rekursiv definierte Folge. Genau wie in (a) zeigt man, dass (bn )n monoton wachsend ist und dass als Grenzwert nur nicht konvergieren, denn wegen b1 ≥ 1 2 1 2 in Frage kommt. Damit kann (bn )n aber ist 1 2 keine obere Schranke für die Folge. (c) Wir betrachten die durch x0 = 1, xn = 1 2 xn−1 + 3 xn−1 (n ≥ 1) rekursiv definierte Folge. Zunächt stellen wir fest, dass xn > 0 (n ∈ N) gilt (dies folgt induktiv). Angenommen (xn )n konvergiert gegen eine Zahl x ∈ R. Dann ist x ≥ 0 und es gilt auch lim xn−1 = x. Nach den Grenzwertsätzen folgt x 6= 0 n→∞ n n (mit xn−1 −→ 0 folgt xn −→ ∞, was nicht sein kann) und √ √ 3 1 x>0 x+ ⇔ x=± 3 ⇔ x = 3. x= 2 x √ Also: Wenn (xn )n konvergiert, dann gegen 3. Wir berechnen einige Folgenglieder, es gilt x0 = 1, x1 = 2, x2 = 7 , 4 x3 = 97 , 56 ... Für n ≥ 2 vermuten wir xn ≤ xn−1 . Um dies zu beweisen, ersetzen wir xn mit Hilfe der Rekursion durch einen Term, der von xn−1 abhängt und lösen die entstehende Gleichung dann nach xn−1 auf. Es gilt: √ 1 3 xn−1 >0 xn ≤ xn−1 ⇔ xn−1 + ≤ xn−1 ⇔ 3 ≤ xn−1 2 xn−1 √ Wir müssen nun also noch zeigen, dass xn−1 ≥ 3 (n ≥ 2) ist, beziehungsweise, √ dass xn ≥ 3 (n ≥ 1) ist. Tatsächlich gilt √ 2 √ √ √ xn−1 − 3 x2n−1 − 2 3 + 3 1 3 xn − 3 = xn−1 + − 3= = ≥0 2 xn−1 2xn−1 2xn−1 für n ≥ 1. Wir haben nun gezeigt, dass die Folge (xn )n≥1 monoton fallend und nach unten beschränkt ist, somit ist sie konvergent. Damit ist natürlich auch √ die Folge (xn )n∈N konvergent, wegen der Vorüberlegung gilt lim xn = 3. n→∞ 56 (d) Sei y0 ∈ R beliebig und yn = 4 − 3 yn−1 für n ≥ 1. Falls die Folge (yn )n gegen eine Zahl y ∈ R konvergiert, so gilt y 6= 0 und y =4− 3 y y 2 − 4y + 3 = 0 ⇔ ⇔ y=1 ∨ y=3 Als Grenzwerte kommen also nur y = 1 oder y = 3 in Frage. In den vorangegangenen Beispielen sind wir nach folgendem Schema vorgegangen, um eine rekursiv definierte Folge auf Konvergenz zu prüfen: 1. Wir nehmen an, dass die Folge konvergiert und nutzen dann die Rekursionsvorschrift, um eine Gleichung für den Grenzwert zu erhalten. Diese lösen wir dann auf und erhalten so einen (oder mehrere) Kandidaten für den Grenzwert. 2. Wir zeigen, dass die Folge (zumindest ab einer geeigneten Stelle) monoton ist. 3. Wir prüfen, ob die Folge nach oben bzw. nach unten (je nach Monotonie) beschränkt ist (es ist oft sinvoll, als obere bzw. untere Schranke den vermuteten Grenzwert anzusetzen). Damit können wir nun auf die Konvergenz schließen. Dieses Vorgehen funktioniert natürlich nur bei monotonen Folgen. Wir schauen uns ein weiteres Beispiel an, bei dem keine Monotonie vorliegt. Beispiel 2.28. Sei a0 = 1 und an+1 = 1 + 1 1+an (n ∈ N). Falls lim an = a ∈ R existiert, so ist n→∞ a 6= −1 und damit √ 1 ⇔ a = ± 2. 1+a Da offenbar an ≥ 0 für alle n ∈ N gilt, kann (an )n also (wenn überhaupt) nur gegen √ 2 konvergieren. Wir berechnen einige Folgenglieder a=1+ a0 = 1, a1 = 2, a2 = 4 , 3 a3 = 10 , 7 a4 = 24 ,... 17 und stellen fest, dass keine Monotonie vorzuliegen scheint. Tatsächlich gilt √ √ 1 2+ 2 √ 1 √ = √ = 2 an > 2 ⇒ an+1 = 1 + <1+ 1 + an 1+ 2 1+ 2 und analog an < √ 2 ⇒ an+1 > √ 2. Damit sind die Folgenglieder also immer abwechselnd größer und kleiner als √ 2, die Folge kann also nicht monoton sein. Die Frage nach der Konvergenz der Folge verschieben wir auf einen späteren Zeitpunkt. Mehr zur Vollständigkeit von R Wir sind nun in der Lage, die Vollständigkeitseigenschaft der reellen Zahlen auf verschiedene Arten zu charakterisieren. Eine Möglichkeit besteht darin, die Gültigkeit des folgenden Prinzips zu verlangen. 57 2. Folgen 2.29. Intervallschachtelungsprinzip Eine Folge von abgeschlossenen Intervallen (In )n∈N = [an , bn ] n∈N heißt Intervallschachtelung (IVS), falls die folgenden Bedingungen erfüllt sind: (i) Für alle n ∈ N ist an ≤ bn , d.h. [an , bn ] ist ein nichtleeres Intervall. (ii) Die Folge (an )n ist monoton wachsend und die Folge (bn )n ist monoton fallend, d.h. für alle n ∈ N∗ ist [an , bn ] ⊂ [an−1 , bn−1 ] . (iii) Es gilt lim (bn − an ) = 0, d.h. die Intervalllängen bilden eine Nullfolge. n→∞ Es stellt sich nun die Frage, ob es Zahlen x ∈ R gibt, die in allen Intervallen In enhalten sind. Zunächst ist klar, dass höchstens eine solche Zahl existieren kann, denn für x 6= y gibt es ein Intervall In = [an , bn ] mit bn − an < |x − y| und damit ist es nicht möglich, dass x und y beide in In liegen. Das Intervallschachtelungsprinzip1 lautet nun wie folgt: Zu jeder Intervallschachtelung (In )n existiert (genau) ein x ∈ R mit x ∈ In für alle n ∈ N. Beweis. Nach 2.25 sind die Folgen (an )n und (bn )n konvergent mit a = lim an = sup {an ; n ∈ N} und b = lim bn = inf {bn ; n ∈ N} . n→∞ n→∞ Wegen lim (bn −an ) = 0 folgt a = b aus den Grenzwertsätzen. Wir setzen x = a = b. n→∞ Für alle n ∈ N ist x = a ≥ an und x = b ≤ bn , folglich x ∈ In . Beispiel 2.30. √ (a Wir wollen 2 möglichst gut durch Brüche annähern, deren Nenner 10er-Potenzen sind2 . Dazu gehen wir wie folgt vor. 1. Bestimme zwei natürliche Zahlen a0 , b0 = a0 + 1 ∈ N mit a20 ≤ 2 ≤ b20 . Man berechnet: 02 = 0 < 2, 12 = 1 < 2, 22 = 4 > 2. Also ergibt sich a0 = 1 und b0 = 2. Damit: 2. Setze a1 = a0 + d1 10 √ 2 ∈ I0 = [a0 , b0 ] = [1, 2] und b1 = a0 + d1 +1 10 , wobei d1 die Zahl aus {0, . . . , 9} mit 2 2 d1 d1 + 1 a0 + ≤ 2 ≤ a0 + 10 10 1 Um dieses Prinzip zu beweisen, benötigen wir auf jeden Fall das Vollständigkeitsaxiom oder ei- ne Folgerung daraus. Umgekehrt hätte man auch das Intervallschachtelungsprinzip als Axiom nehmen können und damit (zusammen mit dem Archimedischen Axiom) ’unser’ Vollständigkeitsaxiom herleiten können. 2 Dies sind genau die abbrechenden Dezimalzahlen 58 ist (d1 ist die erste Nachkommastelle von Man berechnet: 11 10 √ 2 < 2, . . . , 3. Setze a2 = a1 + d2 100 √ a1 + d2 100 d2 +1 100 , 2 a1 + 141 100 15 10 2 >2 15 10 . 14 15 10 , 10 √ d2 + 1 100 2 2). 2 < 2, Es ergibt sich also d2 = 1 und damit a2 = √ < 2, b1 = ≤2≤ Man berechnet: wobei d2 die Zahl aus {0, . . . , 9} mit ist (d2 ist die zweite Nachkommastelle von Damit: 2 2 ∈ I1 = [a1 , b1 ] = und b2 = a1 + 14 10 14 10 , Es ergibt sich also d1 = 4 und damit a1 = Damit: 2). 141 100 , b2 = 2 ∈ I2 = [a2 , b2 ] = 2 142 100 >2 142 100 . 141 142 100 , 100 ••• n. Setze an = an−1 + dn 10n und bn = an−1 + dn +1 10n , wobei dn die Zahl aus {0, . . . , 9} mit 2 2 dn dn + 1 an−1 + n ≤ 2 ≤ an−1 + 10 10n ist (dn ist die n-te Nachkommastelle von Damit: √ √ 2). 2 ∈ In = [an , bn ] = ∗ ∗+1 10n , 10n Man erhält auf diese Weise eine Intervallschachtelung (In )n∈N = [an , bn ] n∈N . Man beachte insbesondere, dass die Intervalllängen eine Nullfolge bilden, denn −n bn − an = 10 = 1 10 n n→∞ −→ 0. Es gibt genau eine reelle Zahl, die in allen In (n ∈ N) enthalten ist, nämlich √ 2. Analog zum Vorgehen in diesem Beispiel kann man eine Intervallschachtelung √ für n x mit k ≥ 2 und x ∈ (0, ∞) bestimmen und so den Wert dieser Wurzel näherungsweise bestimmen.1 1 Es ist dabei auch möglich, die auftretenden Nenner der den Wert der Wurzel annähernden Brüche als Potenzen einer beliebigen natürlichen Zahl ≥ 2 zu wählen. 59 2. Folgen (b Intervallschachtelungen können auch benutzt werden, um Nullstellen von bestimmten Funktionen näherungsweise zu bestimmen. Wir betrachten etwa die Funktion f : R → R, f (x) = x3 + 2x2 + x + 5. Man stellt fest, dass f (0) = 5 > 0 ist und f (−8) = −387 < 0 ist. Die Funktionswerte an den Stellen 0 und −8 haben also unterschiedliche Vorzeichen. Es sei I0 = [a0 , b0 ] = [−8, 0]. Nun betrachten wir den Mittelpunkt m0 = a0 +b0 2 von I0 (man beachte dabei, dass m0 − a0 = b0 − m0 gilt). Wir berechnen den Funktionswert von f an der Stelle m0 = −4 und stellen fest, dass f (−4) = −31 < 0 gilt. Wir erhalten nun I1 = [a1 , b1 ] aus I0 , indem wir eine Grenze beibehalten und die andere durch m0 ersetzen. Dabei sollen die Vorzeichen von f (a1 ) und f (b1 ) immer noch unterschiedlich sein. Also: a1 = m1 = −4, b1 = b0 = 0 und damit I0 = [−4, 0] Der nächste Schritt verläuft analog und ergibt: m1 = −2, f (m1 ) = 3 < 0, a2 = a1 = −4, b2 = m1 = −2, Man verfährt auf diese Art immer weiter und erhält: 5 9 5 I3 = [−3, −2], I4 = − , −2 , I5 = − , − , 2 2 4 Es handelt sich bei der so entstehenden Folge (In )n∈N I2 = [−4, −2] 5 19 I6 = − , − , ... 2 8 = [an , bn ] n∈N um eine Intervallschachtelung, denn es gilt: (i) Für alle n ∈ N ist an ≤ bn . (ii) Es gilt an+1 ≥ an und bn+1 ≤ bn für alle n ∈ N. (iii) Wie man induktiv sieht ist n→∞ bn − an = 8 · 2−n −→ 0. Nun folgt nach dem Intervallschachtelungsprinzip, dass genau eine reelle Zahl x in allen Intervallen In enthalten ist. Wir begründen nun, dass f (x) = 0 ist: Die Folgen der oberen bzw. unteren Intervallgrenzen (an )n und (bn )n konvergieren beide gegen x. Mit den Grenzwertsätzen folgt n→∞ f (an ) = (an )3 + 2(an )2 + an + 5 −→ a3 + 2a2 + a + 5 = f (a) n→∞ und ebenso f (bn ) −→ f (b). Wegen f (an ) < 0 (n ∈ N) können wir schließen, dass f (x) ≤ 0 ist (vergleiche 2.14) . Entsprechend ist wegen f (bn ) > 0 (n ∈ N) auch f (x) ≥ 0. 60 Zum Vorgehen in diesem Beispiel wollen wir noch einige Anmerkungen machen: • Das Intervall In+1 = [an+1 , bn+1 ] geht aus In = [an , bn ] hervor, indem man eine der Intervallgrenzen beibehält und die andere durch den Mittelpunkt mn = an +bn 2 ersetzt. Die Intervalllängen halbieren sich dadurch bei jedem Schritt (Intervallhalbierungsmethode) und bilden daher eine Nullfolge. Man erhält mit diesem Verfahren also auf jeden Fall eine Intervallschachtelung. • Um am Ende folgern zu können, dass f (x) = 0 ist, benötigen wir den Schluß n→∞ xn −→ x ⇒ n→∞ f (xn ) −→ f (x). Dies ist hier mit den Grenzwertsätzen möglich (denn die Funktion f ist ein Polynom). Die Frage, ob das auch für allgemeinere Klassen von Funktionen richtig ist, beschäftigt uns dem Kapitel ’Grenwerte und Stetigkeit’. • Das Vorgehen liefert uns keine Aussage darüber, ob f noch weitere Nullstellen hat. Die Vollständigkeit von R erlaubt es uns, ein weiteres nützliches Konvergenzkriterium herzuleiten. Man kann damit die Konvergenz einer Folge nachweisen, ohne den Grenzwert zu kennen. Definition 2.31. Eine Folge (an )n≥N in R heißt Cauchy-Folge, falls: ∀ε > 0 ∃n0 ≥ N ∀n, m ≥ n0 : |an − am | < ε Äquivalent dazu ist: ∀ε > 0 ∃n0 ≥ N ∀n ≥ m ≥ n0 : |an − am | < ε 61 2. Folgen Bemerkung 2.32. Diese Definition erinnert an die der Folgenkonvergenz (vgl. 2.5). Allerdings wird der Abstand zwischen Folgenglied und Grenzwert |an − a| durch den Abstand zwischen zwei Folgengliedern |an − am | ersetzt. Es stellt sich nun die Frage nach dem Zusammenhang zwischen konvergenten Folgen und Cauchy-Folgen. Die Antwort ist denkbar einfach, es gilt das Cauchy-Kriterium: Eine Folge in R ist genau dann konvergent, wenn sie eine Cauchy-Folge ist. Beim Beweis dieser Äquivalenz stellt man fest, dass eine Implikation leicht mit der Dreicksungleichung gezeigt werden kann. Für die andere (schwierigere) Richtung benötigt man wieder die Vollständigkeit. Wir schauen uns dies genauer an: Beweis. ⇒: Sei (an )n eine konvergente Folge in R mit lim an = a. Sei ε > 0. Zu n→∞ (nach Definition der Konvergenz) ein n0 ∈ N mit |an − a| < ε 2 ε 2 existiert für alle n ≥ n0 . Für alle n ≥ n0 gilt dann auch: ε ε + = ε. 2 2 |an − am | = |an − a + a − am | ≤ |an − a| + |a − am | < ⇐: • Sei (an )n≥N nun eine Cauchy-Folge. Wir betrachten die Folge (xn )n≥N mit xn = inf{ak ; k ≥ n} ∈ R (n ≥ N ). Man beachte dabei, dass Cauchy-Folgen stets beschrankt sind (dies kann man wie in 2.22 (a) zeigen). Offensichtlich ist (xn )n monoton wachsend und somit nach 2.25 konvergent. Sei x = lim xn . n→∞ • Analog ist die Folge (yn )n≥N mit yn = sup{ak ; k ≥ n} ∈ R (n ≥ N ) monoton fallend und nach unten beschränkt und damit nach 2.25 ebenfalls konvergent. Sei y = lim yn . n→∞ • Um zu zeigen, dass x = y ist, beweisen wir nun, dass lim (xn − yn ) = 0 n→∞ ist (und nutzen dann die Grenzwertsätze): Sei ε > 0 beliebig. Da (an )n eine Cauchy-Folge ist, können wir ein n0 ≥ N wählen, so dass |an − am | < alle n, m ≥ n0 gilt. Für alle n ≥ n0 ist dann xn ≤ an0 + ε 2 ε ε − an0 − =ε 2 2 (n ≥ n0 ). • Wegen yn ≤ an ≤ xn (n ≥ N ), folgt nun aus dem Einschließungsssatz 2.10, dass lim an = x gilt. n→∞ 62 für und yn ≥ an0 − 2ε . Folglich gilt |xn − yn − 0| = xn − yn ≤ an0 + ε 2 Aus dem Cauchy-Kriterium lässt sich ein weiteres Konvergenzkriterium ableiten. Falls der Abstand zweier aufeinanderfolgender Folgenglieder sich immer um eine festen Faktor verkleinert, muss die Folge konvergent sein. Genauer gilt: Folgerung 2.33. Sei (an )n≥N eine Folge in R. Falls eine Zahl q ∈ [0, 1) und eine Stelle n0 ≥ N existiert, so dass |an+2 − an+1 | ≤ q · |an+1 − an | (n ≥ n0 ) gilt, so ist (an )n konvergent. Wir verzichten hier auf einen Beweis, wollen aber anmerken, dass der Beweis mit Hilfe des Cauchy-Kriteriums aus 2.32 durchgeführt werden kann. Bemerkung 2.34. In 2.33 ist es wichtig, dass q unabhängig von n gewählt werden kann. Es genügt nicht, zu zeigen, dass |an+2 − an+1 | < |an+1 − an | (n ≥ n0 ) gilt. Beispielsweise ist √ dies für die Folge ( n)n∈N der Fall (nachrechnen!), diese Folge ist aber divergent. Beispiel 2.35. Wir betrachten nochmals die in Beispiel 2.28 durch a0 = 1, an+1 = 1 + 1 an + 2 = 1 + an an + 1 (n ∈ N) rekursiv definierte Folge. Wir wissen bereits, dass an ≥ 0 (n ∈ N) ist und dass die √ Folge, wenn sie konvergiert, nur den Grenzwert 2 haben kann. Für alle n ∈ N gilt 2 an + 2 −an + 2 a2n − 2 = |an+1 − an | = − an = an + 1 an + 1 an + 1 und damit |an+2 − an+1 | = 2 an+1 − 2 an+1 + 1 = a +2 2 n an +1 − 2 an +2 an +1 +1 = 2 an − 2 (an + 1)(2an + 3) . Somit folgt 1 1 · |an+1 − an | ≤ · |an+1 − an | 2an + 3 3 √ Nach 2.33 ist daher (an )n konvergent, also ist lim an = 2. |an+2 − an+1 | = (n ∈ N). n→∞ 63 3. Reihen Definition und einfache Eigenschaften Aufgabe 3.1. Die folgende Geschichte ist bekannt als das Paradoxon von Achilles und der Schildkröte. Die Aufgabe ist es, herauszufinden, worin dabei der Trugschluss besteht: Achilles, ein schneller Läufer, soll einen Wettkampf gegen eine Schildkröte austragen. Da er zehnmal so schnell läuft, bekommt die Schildkröte einen Vorsprung von 100m. Wenn Achilles die 100m gelaufen ist, hat sie einen Vorsprung von 10m. Nachdem er auch diese 10m geschafft hat, hat die Schildkröte immer noch einen Vorsprung von 1m. Zwar schrumpft der Vorsprung der Schildkröte, aber Achilles wird sie nicht einholen. Wir versuchen den von Achilles zurückgelegten Weg nun Schritt für Schritt zu berechnen (alle Angaben in Metern): 1. Zunächst läuft Achilles die Strecke a1 = 100. Der Vorsprung der Schildkröte beträgt nun 10. 2. Nun läuft Achilles die Strecke a2 = 10. Insgesamt hat er die Strecke s2 = a1 + a2 = 110 zurückgelegt. Der Vorsprung beträgt nun noch 1. 3. Nun läuft Achilles die Strecke a3 = 1. Insgesamt hat er die Strecke s3 = a1 + a2 + a3 = 111 zurückgelegt. Der Vorsprung beträgt nun noch 1 10 . ••• 65 3. Reihen n. Im n-ten Schritt läuft Achilles noch an = 10−n+4 und hat dann die Gesamtstrecke sn = n X ak = k=1 n X 10−k+4 k=1 hinter sich gebracht. Die Schildkröte liegt noch immer knapp vor ihm (nämlich genau um die Strecke 10−n+5 ). Die Folge der einzelnen Strecken (an )n≥1 mit n 1 −n+4 an = 10 = 1000 · 10 (n ≥ 1) ist eine Nullfolge. Uns interessiert hier aber mehr die Folge (sn )n≥1 der Gesamtstrecken. Sie ist offensichtlich monoton wachsend, wir wissen aber (noch) nicht, ob sie nach oben beschränkt ist. Eine genauere Untersuchung mit Hilfe der geometrischen Summenformel A.4 (b) liefert aber: sn = n X ak n X k 1 10 k=1 ! k n X 1 1000 · −1 10 k=0 ! 1 n+1 1 − 10 −1 1000 · 1 1 − 10 n+1 ! 10 1 1000 · · 1− − 1000 9 10 = k=1 = = = 1000 · 1000 = 111, 1̄ 9 n→∞ −→ Dieser Grenzwert entspricht genau der Strecke, die Achilles benötigt, um die Schildkröte einzuholen. Nachdem er s = also 100 9 1000 9 zurückgelegt hat, hat sie ein Zehntel davon, 1 geschafft. Wir schreiben nun formal ∞ X ak = k=1 1000 . 9 Dies kann man so verstehen, dass sich die Summe der unendlich vielen positiven Zahlen ak (k ≥ 1) den endlichen Wert n P lim ak = 1000 ist. 9 1000 9 ergibt. Präziser gesagt, bedeutet es, dass n→∞ k=1 Beispiel 3.2. n P Wir wollen nun für weitere Folgen (an )n≥N herausfinden, ob mit sn = ak der k=N Grenzwert lim sn existiert. In den Beispielen, in denen wir keine geschlossene n→∞ Formel für sn angeben können, sind wir zunächst auf Vermutungen angewiesen. • Die Zahlen an = s1 = 1, 1 Natürlich 66 1 n2 (n ≥ 1) sind alle positiv und bilden eine Nullfolge. Es ist s2 = 1 + 1 5 = , 4 4 s3 = 1 + 1 1 49 + = , 4 9 36 hätte man s auch als Lösung der Gleichung s = 100 + s 10 s4 = 205 , 144 finden können. ... Man berechnet (mit Hilfe des Computers) die folgenden (gerundeten) Werte für sn . n 5 10 20 50 100 500 1000 10000 sn 1,4636 1,5498 1,5962 1,6251 1,6349 1,6429 1,6439 1,6448 Diese Tabelle legt die Vermutung nahe, dass die Folge (sn )n gegen eine Zahl s zwischen 1, 6 und 1, 7 konvergiert, und dass damit die unendliche Summe ∞ P 1 2 k2 = s ist. k=1 • Sei ãn = 1 n (n ≥ 1). Auch (ãn )n ist eine Nullfolge positiver Zahlen. Es ist s̃1 = 1, s̃2 = 1 + 3 1 = , 2 2 s̃3 = 1 + 1 1 11 + = , 2 3 6 s̃4 = 25 , 12 ... Man berechnet die folgenden (gerundeten) Werte für s̃n . n 5 10 20 50 100 500 1000 10000 s̃n 2,28 2,93 3,60 4,50 5,19 6,79 7,49 9,79 Man kann anhand dieser Tabelle vermuten, dass die Folge (s̃n )n nicht in R ∞ P 1 konvergiert, und dass damit die unendliche Summe k keine reelle Zahl k=1 ergibt. Ziel dieses Kapitels ist es, Methoden zu erarbeiten, mit denen man mit Blick auf die Folge der Summanden (an )n prüfen kann, ob die unendliche Summe (genannt ∞ P ’Reihe’) ak einen Wert in R hat. k=N Ausgehend von den untersuchten Beispielen kommen wir zu folgender Definition für die Konvergenz von Reihen. Definition 3.3. Sei (an )n≥N eine Folge in R. Falls die Folge (sn )n der sogenannten Partialsummen n ∞ P P sn = ak gegen eine Zahl s ∈ R konvergiert, so sagt man, dass die Reihe ak k=N konvergiert und den Wert s hat. Man schreibt dafür kurz ∞ P k=N ak = s. Ansonsten k=N nennt man die Reihe divergent. Wir halten zunächst einige einfache Eigenschaften konvergenter Reihen fest. Hilfssatz 3.4. (a) Die Frage, ob eine Reihe ∞ P ak konvergiert, hängt nicht von der unteren Grenze k=N der Summe ab. (b) (’Grenzwertsätze für Reihen’) Seien ∞ P k=N 2 Tatsächlich ist s = π2 , 6 ak und ∞ P bk konvergente Reihen und k=N was wir hier jedoch nicht zeigen wollen. 67 3. Reihen sei λ ∈ R eine feste Zahl. Dann gilt ∞ X ∞ X (ak ± bk ) = k=N ∞ X ak ± k=N bk 1 ∞ X und k=N (λ · ak ) = λ · k=N ∞ X ak , k=N wobei alle auftretenden Reihen konvergieren. ∞ P ak konvergiert, so muss (an )n eine Nullfolge sein. (c) Falls k=N Beweis. (a) Die Partialsummen n P n P ak und k=N ak unterscheiden sich nur um einen kon- k=M stanten (d.h. von n unabhängigen) Summanden. Genauer: Es gilt n X ak = k=N n X ak + k=M M −1 X ak falls n ≥ M > N. k=N n P Damit konvergieren entweder beide Partialsummenfolgen ak k=N oder sie konvergieren beide nicht. ∞ ∞ P P (b) Seien a = ak und b = bk . Wir wissen also, dass k=N und n n P k=M k=N n X n→∞ ak −→ a und k=N n X n→∞ bk −→ b k=N gilt. • Es folgt: n X (ak + bk ) = k=N n X ak + k=N n X n→∞ bk −→ a + b k=N nach den Grenzwertsätzen. Folglich konvergiert ∞ P (ak + bk ) und hat den k=N Reihenwert a + b. • Man kann in dieser Argumentation auch überall + durch − ersetzen. • Ebenso sieht man, dass n X (λ · ak ) = λ · k=N und damit gilt ∞ P (c) Sei ∞ P n→∞ ak −→ λ · a k=N (λ · ak ) = λ · k=N n X ∞ P ak , wie behauptet. k=N ak konvergent mit Reihenwert a. Dann ist k=N lim n→∞ 1 Es 68 n X k=N ak = a und lim n→∞ n−1 X ak = a. k=N gilt keine solche Regel für Produkte und/oder Quotienten. Warum nicht ? ak n Folglich: n X an = ak − k=N n−1 X n→∞ ak −→ a − a = 0. k=N Bemerkung 3.5. Teil (c) von Hilfssatz 3.4 bringt uns eine erste Erkenntnis darüber, ob eine Reihe n P ak die Folge (ak )k konvergent ist oder nicht. Da bei jeder konvergenten Reihe k=N n P eine Nullfolge sein muss, folgt: Ist (ak )k keine Nullfolge, so ist ak auf jeden k=N Fall divergent. Beispielsweise sind folglich die Reihen ∞ X k=0 k 10k + 1 ∞ X und (−1)k k=0 divergent. Der direkte Weg, um eine Reihe auf Konvergenz zu testen, besteht darin, die Partialsummen sn so umzuformen, dass man mit den Grenzwertsätzen erkennen kann, ob sie eine konvergente Folge bilden. Obwohl dies nur in wenigen Fällen mit vertretbarem Aufwand möglich ist, wollen wir kurz auf einige Beispiele eingehen. Zunächst betrachten wir die sogenannte geometrische Reihe. Beispiel 3.6. Sei q ∈ R. Falls |q| < 1 ist, so gilt ∞ P qk = k=0 1 1−q (zur Klarstellung: Diese Gleichung bedeutet zwei Dinge: 1.Die Reihe konvergiert. 2.Der Reihenwert ist ∞ P Ist |q| ≥ 1, so ist q k divergent. 1 1−q .) k=0 Beweis. Sei zunächst |q| < 1. nach der geometrischen Summenformel A.4 (b) gilt sn = n X qk = k=0 1 − q n+1 1−q Wegen lim q n = 0 folgt somit lim sn = n→∞ Im Fall |q| ≥ 1 ist q k n→∞ k 1 1−q . (n ∈ N). Also ist ∞ P qk = k=0 keine Nullfolge, nach 3.4 (c) ist daher 3.7. Teleskopsummen Die Partialsummen sn = 1 1−q . ∞ P q k divergent. k=0 n P ak zu einer Folge (ak )k≥N lassen sich leicht berech- k=N nen, wenn man die Folgenglieder ak in der Form ak = bk − bk+1 (k ≥ N ) 69 3. Reihen mit einer geeigneten Folge (bk )k≥N schreiben kann. In diesem Fall gilt nämlich sn = n X ak = k=N n X bk − k=N Damit konvergiert n X ∞ P n X bk+1 = k=N n+1 X bk − k=N bk = bN − bn+1 (n ≥ N ). k=N +1 ak genau dann, wenn (bn )n konvergiert und dann gilt k=N ∞ X ak = lim sn = bN − lim bn . n→∞ k=N n→∞ Wir schauen uns dazu einige Beispiele an: ∞ P 1 • Wir untersuchen die Reihe k(k+1) . Für alle k ≥ 1 ist k=1 1 k(k+1) = 1 k − 1 k+1 und somit folgt für die Partialsummen n X k=1 n n n n+1 k=1 k=1 k=1 k=2 X1 X 1 X1 X1 1 n→∞ 1 = − = − =1− −→ 1. k(k + 1) k k+1 k k n+1 ∞ P Also konvergiert die Reihe k=1 1 k(k+1) ∞ √ P • Wir untersuchen die Reihe und hat den Reihenwert 1. k+1− √ k . Es gilt k=0 n X √ k+1− k=0 n n √ n+1 n √ X X√ X √ X √ √ n→∞ k = k + 1− k= k− k = n + 1−0 −→ ∞. k=0 k=0 Folglich divergiert die Reihe ∞ P √ k=1 k=0 √ k+1− k . k=0 Es folgen noch einige kompliziertere Beispiele, für die man das Verfahren der Partialbruchzerlegung (siehe Anhang) einsetzen kann. • Wir untersuchen die Reihe ∞ P k=1 1 k2 +4k . Mittels Partialbruchzerlegung erkennt man, dass 1 1 = k 2 + 4k 4 1 1 − k k+4 (k ≥ 1) gilt. Damit folgt für die Partialsummen (ab n ≥ 4) ! n n n X 1 X1 X 1 1 = − k 2 + 4k 4 k k+4 k=1 k=1 k=1 ! n n+4 1 X1 X1 = − 4 k k k=1 k=5 ! 4 n+4 X 1 1 X1 = − 4 k k k=1 k=n+1 1 1 1 1 1 1 1 1 = 1+ + + − + + + 4 2 3 4 n+1 n+2 n+3 n+4 Also konvergiert die Reihe ∞ P k=1 70 1 k(k+4) und hat den Reihenwert 25 48 . n→∞ −→ 25 48 • Wir untersuchen die Reihe ∞ P ν=1 1 ν 3 +3ν 2 +2ν . Mittels Partialbruchzerlegung er- kennt man, dass 1 1 = 3 2 ν + 3ν + 2ν 2 1 2 1 − + ν ν+1 ν+2 (ν ≥ 1) gilt. Damit folgt für die Partialsummen (ab n ≥ 2) n X 1 3 ν + 3ν 2 + 2ν ν=1 = = = ! n n n X X 1 X 2 1 − + ν ν=1 ν + 1 ν=1 ν + 2 ν=1 ! n n+1 X 1 n+2 X1 1 X1 −2· + 2 ν=1 ν ν ν=3 ν ν=2 1 1 1 1 1 1 1 n→∞ 1 + −2· + + + −→ 2 1 2 2 n+1 n+1 n+2 4 1 2 ∞ P Also konvergiert die Reihe ν=1 1 ν 3 +3ν 2 +2ν und hat den Reihenwert 14 . In den bisher behandelten Beispielen war es immer möglich eine geschlossene Formel für die Partialsummen herzuleiten und damit dann auf die Konvergenz der Reihe zu schließen. Man sollte sich jedoch klar machen, dass dies in den meisten Fällen nicht funktioniert. (Insbesondere sind die Reihen in 3.7 von sehr spezieller Gestalt.) Im nächten Abschnitt erarbeiten wir daher einige Kriterien dafür, ob eine Reihe konvergiert oder nicht. Kriterien für Reihenkonvergenz Wenn man die Konvergenz einer Reihe prüfen will, sollte man sich zuerst fragen, ob die Folge der Summanden eine Nullfolge ist. Wir haben in 3.4 (c) gezeigt: Falls ∞ P eine Reihe ak konvergiert, so muss (ak )k eine Nullfolge sein. k=N Das bedeutet: Falls (ak )k keine Nullfolge ist, so kann man sofort schließen, dass ∞ P ak divergent ist. Ist (ak )k aber eine Nullfolge, so kommen wir hiermit nicht k=N weiter. Beispiel 3.8. (a) Die Reihen ∞ √ X k=0 k, ∞ X ∞ X (−1)k , k=0 k=10 k2 k 2 − 9k √ 2 sind allesamt divergent, da die Folgen k , (−1)k k , k2k−9k keine Nullk k folgen sind. ∞ P (b) Als Beispiel dafür, dass nicht für jede Nullfolge (ak )k , die Reihe ak konk=N ∞ √ √ √ √ P vergiert, dient etwa k + 1 − k . Obwohl lim k + 1 − k = 0 ist k=0 k→∞ 71 3. Reihen (siehe Beispiel 2.9 (d)), ist die Reihe nach 3.7 aber divergent. Als weiteres ∞ P 1 Beispiel betrachten wir k . In Beispiel 3.2 vermuteten wir bereits (anhand k=1 einiger Werte der Partialsummen), dass diese Reihe divergiert. Wir wollen dies nun beweisen. Beweis. Nach Bemerkung 2.22 (a) genügt es zu zeigen, dass die Folge (sn )n der Partin P 1 alsummen sn = k unbeschränkt ist. Dazu zeigen, wir dass keine natürliche k=1 Zahl M ∈ N∗ eine obere Schranke für (sn )n sein kann: Für M ∈ N∗ gilt s(2M −1) = M 2X −1 k=1 1 k = M −1 2m+1 X X−1 m=0 k=2m 1 k > 2m+1 X−1 M −1 X m=0 1 m+1 2 k=2m {z } | =(2m+1 −1−2m +1)· 1 2m+1 = = 12 und folglich (mit 2M statt M ) ist s(22M −1) > M . Bei Konvergenzuntersuchungen spielt der Begriff der absoluten Konvergenz eine wichtige Rolle. Definition 3.9. ∞ ∞ P P Eine Reihe ak heißt absolut konvergent, falls die Reihe |ak | konvergent ist. k=N k=N Es stellt sich nun die Frage nach dem Zusammenhang zwischen Konvergenz und absoluter Konvergenz (dabei ist klar, dass es keinen Unterschied zwischen Konvergenz und absoluter Konvergenz gibt, wenn alle ak ≥ 0 sind). Die Antwort geben wir im nachfolgenden Satz, der auf dem Cauchy-Kriterium für Folgen (siehe 2.32) und damit letzlich auf der Vollständigkeit der reellen Zahlen beruht. Um den Beweis etwas übersichtlicher zu gestalten, leiten wir zunächst aus dem Cauchy-Kriterium für Folgen eines für Reihen ab. 3.10. Cauchy-Kriterium für Reihen ∞ P Eine Reihe ak ist definitionsgemäß genau dann konvergent, wenn die Folge k=N (sn )n der Partialsummen sn = n P ak konvergent ist. Dies ist nach 2.32 genau k=N dann der Fall, wenn (sn )n eine Cauchy-Folge ist, was definitionsgemäß bedeutet: ∀ε > 0 ∃n0 ≥ N ∀n ≥ m ≥ n0 : |sn − sm | < ε. Für n ≥ m ≥ n0 gilt n n m X X X |sn − sm | = ak − ak = ak . k=N 72 k=N k=m+1 M 2 Damit folgt das Cauchy-Kriterium für Reihen: ∞ P P n ak < ε ∀ε > 0 ∃n0 ≥ N ∀n ≥ m ≥ n0 : k=m+1 ⇔ ak ist konvergent k=N Es folgt der angekündigte Satz. Satz 3.11. Jede absolut konvergente Reihe ist konvergent. Beweis. ∞ P Sei |ak | konvergent. Wir benutzen das Cauchy-Kriterium für Reihen 3.10, um k=N ∞ P die Konvergenz der Reihe ak nachzuweisen: k=N Sei ε > 0. Indem wir 3.10 auf die konvergente Reihe |ak | anwenden, finden wir k=N n P ein n0 ≥ N mit ∞ P |ak | < ε für alle n, m ≥ n0 . Für alle n ≥ m ≥ n0 gilt dann k=m+1 (nach der Dreiecksungleichung für den Betrag, vergleiche 1.6) auch n n X X ak ≤ |ak | < ε. k=m+1 k=m+1 Aus 3.10 folgt die behauptete Konvergenz von ∞ P ak . k=N Die Umkehrung dieses Satzes ist falsch. Wir werden später Beispiele für Reihen sehen, die zwar konvergieren aber nicht absolut konvergieren. Bemerkung 3.12. Falls alle ak ≥ 0 (k ≥ N ) sind, so ist die Partialsummenfolge n P ak k=N mon≥N noton wachsend, denn es ist dann n+1 X ak − k=N n X ak = an ≥ 0 (n ≥ N ). k=N Wir wissen, dass eine monoton wachsende Folge genau dann konvergiert, wenn sie nach oben beschränkt ist (vergleiche 2.22 und 2.25). Damit ist gezeigt: ∞ P • Sind alle ak ≥ 0 (k ≥ N ), so ist ak genau dann konvergent, wenn die k=N n P Partialsummenfolge ak nach oben beschränkt ist. k=N n≥N Angewendet auf |ak | statt ak folgt daraus: ∞ P • Eine (beliebige) Reihe ak ist genau dann absolut konvergent, wenn die k=N n P Folge |ak | nach oben beschränkt ist. k=N n≥N 73 3. Reihen Diese Beschreibung der absoluten Konvergenz ist zur Herleitung der nachfolgenden Konvergenzkriterien sehr nützlich. Kann man die Summanden einer Reihe nach oben gegen die einer (bekannten) konvergenten Reihe abschätzen, so folgt die Konvergenz der Reihe. Genauer gilt das folgende Kriterium: Satz 3.13 (Majoranten-/Minorantenkriterium). (a) Seien (ak )k≥N1 und (bk )k≥N2 Folgen, es gelte bk ≥ 0 und ∃ n0 ≥ max{N1 , N2 } ∞ P Dann gilt: Falls |ak | ≤ bk mit k=N2 ∞ P somit insbesondere konvergent). Die Reihe ∞ P zu ∞ P bk konvergent ist, so ist ∀k ≥ n0 . ak absolut konvergent (und k=N1 bk heißt konvergente Majorante k=N2 ak . k=N1 (b) Seien (ak )k≥N1 und (bk )k≥N2 Folgen, es gelte ∃ n0 ≥ max{N1 , N2 } ∞ P Dann gilt: Falls mit bk divergent ist, so ist auch k=N2 ∞ P ak ≥ bk ≥ 0 bk heißt divergente Minorante zu k=N2 ∞ P ∞ P ∀k ≥ n0 . ak divergent. Die Reihe k=N1 ak . k=N1 Beweis. (a) Ist ∞ P bk konvergent, so ist k=N2 n P ! bk k=N2 nach oben beschränkt, es existiert n≥N also eine obere Schranke C ∈ R für diese Folge. Für n ≥ n0 gilt n X k=N1 mit C̃ = nP 0 −1 |ak | ≤ nX 0 −1 |ak | + k=N1 n X bk ≤ C̃ k=n0 |ak | + C. Nach Bemerkung 3.12 ist folglich k=N1 ∞ P ak absolut kon- k=N1 vergent. ∞ ∞ P P (b) Wäre ak konvergent, so müsste bk nach (a) auch konvergent sein. k=N1 k=N2 Beispiel 3.14. (a) Die Reihe ∞ P 1 k2 k=1 ∞ P nach 3.7 ist k=1 74 konvergiert, denn es gilt 2 k(k+1) konvergent. 1 k2 ≤ 2 k(k+1) für alle k ∈ N∗ , und (b) Die Reihe ∞ P 1 k4 k=1 zeigt man, dass die Reihe ∞ P k=1 (c) Die Reihe ∞ P √1 k k=1 1 k4 ist konvergent, denn es gilt 1 kα ∞ P k=1 1 k 1 k2 für alle k ∈ N∗ . Genauso für ein festes α ∈ Q mit α ≥ 2 konvergent ist. ist divergent, denn es gilt Beispiel 3.8(b) ist ≤ √1 k ≥ 1 k für alle k ∈ N∗ , und nach divergent. Genauso zeigt man, dass die Reihe ∞ P k=1 1 kα für ein festes α ∈ Q mit α ≤ 1 divergent ist. ∞ P 5k2 −3k+10 (d) Wir betrachten die Reihe 2k4 +k3 −25 . Durch ’geschicktes Abschätzen’ erkennt k=1 man, dass gilt. Da ∞ P k=1 15 k2 15 5k 2 − 3k + 10 5k 2 − 0 + 10k 2 = 2 (k ≥ 3) ≤ 2k 4 + k 3 − 25 2k 4 + 0 − k 4 k ∞ P 5k2 −3k+10 konvergiert, konvergiert auch 2k4 +k3 −25 . k=1 (e) Wir betrachten die Reihe ∞ P k=1 3 5k −3k+10 2k4 +k3 −25 . Durch ’geschicktes Abschätzen’ erkennt man, dass 5k 3 − 3k + 10 5k 3 − 3k 2 + 0 2 1 ≥ = · 4 3 4 4 2k + k − 25 2k + k − 0 3 k gilt. Da ∞ P k=1 2 3 · 1 k divergiert, divergiert auch ∞ P k=1 (k ≥ 1) 5k3 −3k+10 2k4 +k3 −25 . Bemerkung 3.15. (a) Bei Anwendung des Majorantenkriteriums erhält man keine Aussage über den ∞ P 1 Wert einer Reihe. Nach 3.14 wissen wir zwar, dass die beiden Reihen k2 und ∞ P k=1 k=1 1 k4 konvergieren, allerdings können wir keine Angabe über die Reihenwerte machen. Tatsächlich gilt ∞ P k=1 1 k2 = π2 6 und ∞ P k=1 1 k4 = π4 90 . Dies ist allerdings nicht so einfach zu zeigen, so dass wir hier auf einen Beweis verzichten. ∞ P 1 (b) Die Frage, für welche α ∈ Q die Reihe kα konvergiert ist noch nicht vollständig k=1 beantwortet. Wie wir gesehen haben, konvergiert sie für α ≥ 2 und divergiert für α ≤ 1. Allerdings wissen wir noch nicht, ob sie für α ∈ Q ∩ (1, 2) konvergiert. In 3.14 (d) und (e) sieht man, dass die Anwendung des Majorantenkriteriums in manchen Fällen recht kompliziert sein kann. Man kann jedoch aus dem Majorantenkriterium ein weiteres Kriterium folgern, das in vielen Fällen einfacher anwendbar P P ist. Es zeigt, dass zwei Reihen ak und bk das gleiche Konvergenzverhalten aufweisen, wenn ak bk gegen eine positive reelle Zahl konvergiert. Satz 3.16 (Vergleichskriterium). Seien (ak )k≥N1 und (bk )k≥N2 Folgen in (0, ∞), so dass lim abkk ∈ (0, ∞) existiert. k→∞ ∞ ∞ P P Dann konvergiert ak genau dann, wenn bk konvergiert. k=N1 k=N2 75 3. Reihen Beweis. ak k→∞ bk Sei C = lim ∈ (0, ∞). Dann findet man eine Stelle n0 ∈ N mit n0 ≥ N1 und n0 ≥ N2 , so dass Ist ∞ P C ak ≤ ≤ 2C 2 bk (k ≥ n0 ). bk konvergent, so ist (wegen ak ≤ 2Cbk für k ≥ n0 ) nach dem Majoranten- k=N2 kriterium 3.13 auch ∞ P ak konvergent. Umgekehrt funktioniert die Argumentation k=N1 2 C ak analog, man nutze dabei die Abschätzung bk ≤ (k ≥ n0 ). Es folgen einige typische Anwendungen des Vergleichskriteriums. Beispiel 3.17. Wir betrachten hier nochmals die beiden Reihen aus 3.14 (d) und (e). Ziel ist es, P P zu der gegebenen Reihe ak eine ’Vergleichsreihe’ bk zu finden, so dass ak k→∞ bk ∈ (0, ∞) existiert. P 2.) bekannt ist, ob bk konvergiert oder nicht. 1.) lim In vielen Fällen eignet sich für P ∞ P bk eine Reihe der Form k=1 ∞ P • Für ak mit ak = k=1 5k2 −3k+10 2k4 +k3 −25 1 k2 wählen wir bk = 1 kα . (k ≥ 1). Dann ist 5 − 3k −1 + 10k −2 k→∞ 5 ak 5k 4 − 3k 3 + 10k 2 = ∈ (0, ∞). = −→ 4 3 bk 2k + k − 25 2 + k −1 − 25k −4 2 ∞ P Da k=1 ak . k=1 ∞ P • Für ∞ P bk konvergiert, konvergiert auch ak mit ak = k=1 5k3 −3k+10 2k4 +k3 −25 wählen wir bk = 1 k (k ≥ 1). Dann ist ak 5 − 3k −2 + 10k −3 k→∞ 5 5k 4 − 3k 2 + 10k = ∈ (0, ∞). = −→ bk 2k 4 + k 3 − 25 2 + k −1 − 25k −4 2 Da ∞ P bk divergiert, divergiert auch k=1 ∞ P ak . k=1 • Wir betrachten die Reihe ∞ P k4 +2k+3 . 3k +2k ak mit ak = k=0 Mit bk = 2 k 3 (k ∈ N) erhält man mit 2.15 (b) 4 k ak k + 8 k→∞ = 2 2k −→ 8 ∈ (0, ∞). bk 1 + 3k Da ∞ P bk konvergiert, konvergiert auch k=0 ∞ P √ k+1 k2 +2 . ak mit ak = k=0 3 1 3 Mit bk = k − 2 (k ≥ 1) erhält ak k + k2 1 + k − 2 k→∞ = = 2 −→ 1 ∈ (0, ∞). bk k +2 1 + 2k −2 2 76 ak . k=0 • Wir betrachten die Reihe man ∞ P Die Reihe ∞ P ak konvergiert also genau dann, wenn k=0 ∞ P 1 konvergiert. Ob 3 k=1 k 2 dies der Fall ist, wissen wir (noch) nicht. Um das Vergleichskriterium auch in diesem letzten Beispiel sinnvoll anwenden zu ∞ P 1 können, müssen wir die Reihe kα auch für α ∈ Q ∩ (1, 2) untersuchen. Dazu k=1 benutzen wir das folgende Cauchysche Verdichtungskriterium. Satz 3.18 (Verdichtungskriterium). Ist (ak )k≥1 eine monoton fallende Folge in (0, ∞), so gilt: ∞ X ak konvergent ⇔ ∞ X 2m a(2m ) konvergent m=0 k=1 Beweis. Wir benutzen Bemerkung 3.12, in der gezeigt wurde, dass eine Reihe mit nichtnegativen Summanden genau dann konvergent ist, wenn die zugehörige Partialsummenfolge beschränkt ist: ⇐: Sei ∞ P 2m a(2m ) konvergent. Dann existiert ein C > 0 mit m=0 M P m=0 M für alle M ∈ N. Für K ≥ 1 wählen wir nun ein M ∈ N mit 2 2m a(2m ) ≤ C − 1 ≥ K und erkennen, dass K X ak ≤ k=1 M 2X −1 ak = M −1 X m=0 k=1 ∞ P Folglich hat auch 2m+1 X−1 ak ≤ k=2m M −1 X 2m+1 X−1 a(2m ) = k=2m m=0 M −1 X 2m a(2m ) ≤ C. m=0 ak eine beschränkte Partialsummenfolge und ist damit k=1 konvergent. ⇒: Sei ∞ P ak konvergent. Dann existiert ein C > 0 mit k=1 K P ak ≤ C für alle K ≥ 1. k=1 Für alle M ∈ M gilt nun M X 2m a(2m ) = 2· m=0 M X 2m−1 a(2m ) m=0 = 2· ≤ 2· = 2· M X m 2X −1 m=0 k=2m−1 M X m 2X −1 m=0 k=2m−1 M 2X −1 ! a(2m ) ! ak ak k=1 ≤ 2C Folglich hat auch M P 2m a(2m ) eine beschränkte Partialsummenfolge und ist m=0 damit konvergent. 77 3. Reihen Bemerkung 3.19. Nun können wir Reihen der Form ∞ P ak mit ak = k=1 1 kα für α ∈ Q∩(1, 2) untersuchen. Für solche α gilt: −α 2m a(2m ) = 2m (2m ) ∞ P Damit konvergiert = (2m ) 1−α = 21−α m (m ∈ N). 2m a(2m ) genau dann, wenn 21−α < 1 ist (vergleiche 3.6), m=0 also genau dann, wenn α > 1 ist. Mit dem Verdichtungskriterium 3.18 (beachte: (ak )k monoton fallend) folgt: ∞ P k=1 1 kα konvergent ⇔ α>1 Damit folgt nun schließlich auch, dass die letzte Reihe in 3.17 konvergent ist. Ein weiteres wichtiges Kriterium ist das folgende Quotientenkriterium, bei dem man sich den Betrag des Quotienten zweier aufeinanderfolgender Summanden der Reihe anschauen muss. Satz 3.20 (Quotientenkriterium). Sei (ak )k≥N eine Folge in R \ {0}. Falls es eine Zahl q ∈ (0, 1) und eine Stelle n0 ≥ N gibt, so dass ak+1 ak ≤ q ∞ P gilt, so ist die Reihe (k ≥ n0 ) ak absolut konvergent. k=N Beweis. Induktiv folgt, dass ak ≤ q k−n0 an0 = gilt. Da ∞ P an0 k=0 q n0 · qk an0 k ·q q n0 (k ≥ n0 ) konvergent ist, folgt die Behauptung aus dem Majoranten- kriterium 3.13 (a). Bemerkung 3.21. (a) Einen alternativen Beweis des Quotientenkriteriums erhält man, wenn man Folgerung 2.33 auf die Partialsummenfolge anwendet. (b) Um das anwenden zu können, genügt es nicht, zu zeigen, Quotientenkriterium ak+1 dass ak < 1 (k ≥ n0 ) ist. Es ist wichtig, dass eine feste Zahl q ∈ (0, 1) unabhängig von k gefunden werden kann. Beispielsweise ist für ak = ∞ P ak divergent, obwohl die Reihe k=1 ak+1 k ak = k + 1 < 1 78 (k ∈ N∗ ). 1 k (k ∈ N∗ ) (c) Das Quotientenkriterium lässt sich in der folgenden Form einfacher an oftmals ak+1 wenden: Ist (ak )k≥N eine Folge in R \ {0}, so dass lim ak ∈ [0, 1) existiert, k→∞ ∞ P ak absolut konvergent. so ist k=N Beweis. Falls q = lim aak+1 ∈ [0, 1) existiert, so gibt es sicher ein n0 ∈ N mit k k→∞ ak+1 1 + q ak ≤ 2 < 1 (k ≥ n0 ). ∞ P ak sicherlich divergiert, wenn lim aak+1 ∈ (1, ∞) k k→∞ k=N existiert (dann kann (ak )k keine Nullfolge sein). Falls jedoch lim aak+1 =1 k k→∞ ∞ P ak ist, so lässt sich damit keine Aussage über die Konvergenz der Reihe Man beachte auch, dass k=N treffen. Es folgen einige Beispiele zur Anwendung des Quotientenkriteriums. Beispiel 3.22. (a) Sei ak = k5 2k ∞ P Also ist (k ∈ N). Dann ist 5 ak+1 (k + 1)5 · 2k k+1 1 1 = = · −→ ∈ [0, 1) . ak k+1 5 2 ·k 2 k 2 ak (absolut) konvergent. k=0 (b) Sei bk = 10k k! ∞ P Also ist (k ∈ N). Dann ist k+1 bk+1 · k! 10 = 10 bk 10k · (k + 1)! = k + 1 −→ 0 ∈ [0, 1) . bk (absolut) konvergent. k=0 (c) Sei ck = k! kk (k ∈ N). Dann ist k k ck+1 k = (k + 1)! · k = = ck (k + 1)k+1 · k! k+1 nach Beispiel 2.26. Also ist ∞ P k !−1 1 1+ −→ e−1 ∈ [0, 1) k ck (absolut) konvergent. k=0 Bemerkung 3.23. Genau wie in Beispiel 3.22 (a) kann man zeigen, dass die Reihe ∞ P q k · k α für fe- k=0 ste Zahlen |q| < 1 und α ∈ Q (absolut) konvergiert. Nach dem Quotientenkriterium gilt nämlich k+1 α q · (k + 1)α k+1 −→ |q| ∈ [0, 1) . = |q| · qk · kα k 79 3. Reihen Um zu begründen, dass es Reihen gibt, die zwar konvergieren, aber nicht absolut konvergieren, benötigen wir noch ein weiteres Konvergenzkriterium. Es eignet sich für Reihen, deren Summanden abwechselnd positiv und negativ sind. Satz 3.24 (Leibnizkriterium). Ist (ak )k≥N eine monotone Nullfolge, so ist die Reihe ∞ P (−1)k ak konvergent. k=N Wir verzichten hier auf einen Beweis. Es folgen einige Beispiele zur Anwendung des Leibnizkriteriums. Dabei sehen wir, dass die alternierende harmonische Reihe konvergent, aber nicht absolut konvergent ist. Beispiel 3.25. ∞ P (−1)k k ist nach 3.24 konvergent, denn k1 k≥1 ist eine monoton k=1 fallende Nullfolge. Wegen (−1)k k1 = k1 ist sie nicht absolut konvergent. (a) Die Reihe (b) Wir betrachten ∞ P (−1)k ak mit ak = k=5 2k−2 k2 −2k−8 (k ≥ 5). Nach den Grenz- wertsätzen gilt ak = 2k −1 − 2k −2 k→∞ 0 − 0 = 0. −→ 1 − 2k −1 − 8k −2 1−0−0 Durch Partialbruchzerlegung stellt man weiterhin fest, dass ak = 1 1 1 1 + ≥ + = ak+1 k+2 k−4 (k + 1) + 2 (k + 1) − 4 (k ≥ 5) gilt, folglich ist (ak )k≥5 monoton fallend. Mit dem Leibnizkriterium 3.24 folgt, ∞ P dass (−1)k k22k−2 −2k−8 konvergiert. k=5 (c) Wir betrachten ∞ P (−1)k bk mit bk = k=0 √ −k k3 +1 1 (k ∈ N). Wegen bk = − √−k 2 1+k−3 ist (bk )k eine Nullfolge. Außerdem ist: bk+1 ≥ bk ⇔ ⇔ p p k 3 + 1 ≤ k (k + 1)3 + 1 (k + 1)2 k 3 + 1 ≤ k 2 k 3 + 3k 2 + 3k + 2 (k + 1) ↑ denn: ⇔ beide Seiten sind > 0 0 ≤ k 4 + 4k 3 + k 2 − 2k − 1 Dies ist für k ≥ 1 sicherlich erfüllt, also konvergiert Leibnizkriterium 3.24. Also konvergiert auch ∞ P (−1)k √k−k nach dem 3 +1 k=1 (−1)k √k−k . 3 +1 k=0 80 ∞ P Dezimalbruchentwicklung Eine Möglichkeit reelle Zahlen zu beschreiben, ist es ihre Dezimalbruchentwicklung anzugeben. Beispielsweise ist 151.37044 = 151 + 3 · 10−1 + 7 · 10−2 + 0 · 10−3 + 4 · 10−4 + 4 · 10−5 eine Zahl mit abbrechender Dezimalbruchentwicklung. Wir können sie auf einfache Art und Weise als endliche Summe schreiben: es gilt 151.37044 = M + 5 X zk · 10−k , k=1 wobei M = 151 ∈ N der ganzzahlige Anteil ist und die Zahlen z1 , . . . , z5 ∈ {0, . . . , 9} die Nachkommastellen angeben. Es gilt hier z1 = 3, z2 = 7, z3 = 0, z4 = z5 = 4. Es ist auch möglich, dass die Dezimalbruchentwicklung einer reellen Zahl nicht abbricht. Sie entspricht in diesem Fall einer (konvergenten) Reihe. Beispielsweise ist 2.136 = 2.13636363636 . . . = 2 + ∞ X zk · 10−k k=1 mit ( z1 = 1, zk = 3 , falls k ≥ 2 gerade 6 , falls k ≥ 3 ungerade. In jedem Fall ist durch eine natürliche Zahl M ∈ N und eine beliebige (nicht unbedingt periodisch werdende Folge) (zk )k≥1 in {0, . . . , 9} stets eine reelle Zahl M.z1 z2 z3 z4 . . . = M + ∞ X zk · 10−k k=1 gegeben. Umgekehrt hat jede nichtnegative reelle Zahl solch eine Darstellung. Beispielsweise ist e = 2.718281828459... = M + ∞ X zk · 10−k k=1 mit M = 2, z1 = 7, z2 = 1 und so weiter. Wir wollen diese Ideen nun präzisieren. Wir beginnen damit zu zeigen, dass die oben betrachteten Reihen stets konvergieren. Der Einfachheit beschränken wir uns auf ’die Zahlen hinter dem Komma’. Satz 3.26. Sei (zk )k≥1 eine (beliebige) Folge in {0, . . . , 9}. Dann konvergiert ∞ P zk · 10−k und k=1 der Reihenwert liegt in [0, 1]. Beweis. Nach der geometrischen Summenformel A.4 (b) gilt ! ! k n n 1 n+1 X X 1 − 10 1 1−0 n→∞ −k 9·10 = 9 − 1 = 9· − 1 −→ 9· − 1 = 1. 1 1 10 1 − 10 1 − 10 k=1 k=0 81 3. Reihen Also konvergiert n P 9 · 10−k mit dem Reihenwert 1 und nach dem Majorantenkri- k=1 terium konvergiert dann auch ∞ P zk · 10−k . Der Reihenwert liegt in [0, 1], denn: k=1 0= ∞ X 0≤ k=1 ∞ X zk · 10−k ≤ k=1 ∞ X 9 · 10−k = 1 k=1 3.27. Existenz einer Dezimalbruchentwicklung (a) Wir wollen nun umgekehrt auch zeigen, dass zu einer gegebenen Zahl x ∈ [0, 1) ∞ P stets eine Folge (zk )k≥1 in {0, . . . , 9} mit x = zk · 10−k existiert. Dazu gehen k=1 wir ähnlich vor wie bei der Bestimmung einer Intervallschachtelung (vergleiche Beispiel 2.30): 1.) Wähle z1 ∈ {0, . . . , 9} mit x ∈ z 2.) Wähle z2 ∈ {0, . . . , 9} mit x ∈ z 3.) Wähle z3 ∈ {0, . . . , 9} mit x ∈ z 1 10 1 10 1 10 , z1 +1 10 + z2 100 , z1 10 + z2 100 + z3 1000 . + z2 +1 100 , z1 10 . + z2 100 + z3 +1 1000 . ••• " k.) Wähle zk ∈ {0, . . . , 9} mit x ∈ k−1 P j=1 Nun gilt tatsächlich x = ∞ P zj 10j + zk 10k , k−1 P j=1 ! zj 10j + zk +1 10k . zj · 10−j , denn (beachte Folgerung 2.12 (b)): j=1 k−1 k k k−1 X zj X X X zj zk + 1 z 1 k→∞ k x − + − + k = k −→ 0 zj · 10−j = x− zj ·10−j ≤ j k j 10 10 10 10 10 j=1 j=1 j=1 j=1 (b) Ist nun x ∈ [0, ∞) gegeben, so findet man immer eine natürliche Zahl M ∈ N ∞ P mit x − M ∈ [0, 1). 1 Nach (a) kann man nun x − M = zk · 10−k mit k=1 geeigneten zk ∈ {0, . . . , 9} schreiben. Insgesamt folgt: ∀x ∈ [0, ∞) ∃M ∈ N, zk ∈ {0, . . . , 9} (k ∈ N) mit: x = M + ∞ P zk · 10−k k=1 Jede nichtnegative reelle Zahl hat also eine Dezimalbruchentwicklung (für negative Zahlen kann man natürlich einfach ein Minuszeichen davorsetzen). (c) Daraus folgt auch, dass man jede reelle Zahl durch rationale Zahlen beliebig gut ∞ P approximieren kann. Ist x ≥ 0 gegeben, so kann man x = M + zk · 10−k wie k=1 n P oben schreiben und folglich ist M + zk · 10−k eine Folge rationaler k=1 n≥1 Zahlen, die gegen x konvergiert. Man sagt: Q ist dicht in R 1 Man 82 bezeichnet M als den ganzzahligen Anteil von x und schreibt M = bxc das heißt, zu jeder Zahl x ∈ R gibt es eine Folge (qn )n in Q mit lim qn = x. n→∞ (d) Man beachte, dass die Entwicklung in (b) nicht immer eindeutig ist, beispielsweise lässt sich die Zahl 1 auf zwei verschiedene Arten darstellen, nämlich 1.0 = 1 = 0.9 bzw. 1+ ∞ X 0 · 10−k = 1 = 0 + k=1 ∞ X 9 · 10−k . k=1 3.28. Dezimalbruchentwicklung rationaler Zahlen ∞ P zk · 10−k mit M ∈ N und zk ∈ {0, . . . , 9} (k ∈ N), so gilt Ist x = M + k=1 x ∈ Q ⇔ (zk )k≥1 wird periodisch (d.h. ∃p, k0 ∈ N∗ : zk+p = zk ∀k ≥ k0 ) Wir verzichten hier auf einen formalen Beweis und betrachten stattdessen einige Beispiele. Wir beginnen mit dem Umwandeln von rationalen Zahlen (=Brüche natürlicher Zahlen) in Dezimalbrüche: • Wir betrachten den Bruch x = 71 15 . Das folgende Rechenverfahren entspricht dem schriftlichen Dividieren: Es gilt x Einsetzen ⇒ Einsetzen ⇒ Einsetzen ⇒ x x x 71 11 = 4 + 15 15 11 1 110 1 5 Rest: = · = · 7+ 15 10 15 10 15 1 5 1 5 7 = 4+ · 7+ = 4 + 10 + · 10 15 10 15 5 1 50 1 5 Rest: = · = · 3+ 15 10 15 10 15 7 1 5 1 5 7 3 = 4+ + · 3+ = 4 + 10 + 100 + · 10 100 15 100 15 Rest bereits berechnet 1 5 7 3 3 = 4 + 10 + 100 + 1000 + · 1000 15 und so weiter = Durch fortlaufendes Einsetzen erhält man 71 15 = 4.73. 83 3. Reihen 25 66 • Wir betrachten y = y Einsetzen ⇒ Einsetzen ⇒ Einsetzen ⇒ = x = x = x = und gehen genauso vor wie oben: 25 25 = 0 + 66 66 25 1 250 1 52 Rest: = · = · 3+ 66 10 66 10 66 1 52 52 1 3 + · 3+ = 0 + 10 · 0+ 10 66 10 66 52 1 520 1 58 Rest: = · = · 7+ 66 10 66 10 66 1 58 1 58 3 3 7 + + · 7+ = 0 + 10 + 100 · 0+ 10 100 66 100 66 58 1 580 1 52 Rest: = · = · 8+ 66 10 66 10 66 3 1 7 1 52 52 3 7 8 0+ + + + · 8+ = 0 + 10 + 100 + 1000 · 10 100 1000 66 1000 66 Rest bereits berechnet Durch fortlaufendes Einsetzen erhält man Betrachten wir einen beliebigen Bruch p q 25 66 = 0.378. ∈ Q mit p, q ∈ N∗ . Da die Zähler der auftretenden Reste stets kleiner sind als der Nenner q, kommen nur die (endlich vielen) Zahlen 0q , 1 q, ..., p−1 q als Reste in Frage. Wenn man lange genug rechnet, wird irgendwann ein Rest auftreten, der schon berechnet wurde (spätestens beim qten Schritt). Daher muß der berechnete Dezimalbruch periodisch werden. Umgekehrt kann man jeden periodisch werdenden Dezimalbruch in einen Bruch natürlicher Zahlen umwandeln. Auch hierzu betrachten wir Beispiele: • Sei α = 0.7. Dann gilt 10 · α = α = 9·α = - - 7 .7 0 .7 7 Folglich ist α = 79 . • Sei β = 2.01774. Dann gilt - 100000 · β = 100 · β = 99900 · β = - 201774 .774 201 .774 201573 Folglich ist β= 201573 22397 = . 99900 11100 Wir schließen diesen Abschnitt mit einigen Anmerkungen zur Dezimalbruchentwicklung. Bemerkung 3.29. 84 (a) Eine häufig gestellte Frage ist, ob tatsächlich 0.9 = 1 gilt. Schon im Beweis ∞ P zu Satz 3.26 haben wir gezeigt, dass die Reihe 9 · 10−k mit Reihenwert 1 k=1 konvergiert. Es folgen einige weitere ’Argumente’ für die Identität 0.9 = 1. • Offenbar ist 1 3 = 0.3. Demnach ist 0.9 = 3 · 0.3 = 3 · 1 = 1. 3 • Angenommen es ist 0.9 < 1. Dann ist α = 1−0.9 > 0. Die Zahl α hat daher ∞ P eine Dezimalbruchentwicklung α = zk · 10−k , in der an irgendeiner k=1 Stelle eine positive Nachkommastelle zk > 0 auftritt. Addiert man nun α + 0.9, so erhält man durch Übertrag eine Zahl, die echt größer als 1 ist. Das kann nicht sein, da α + 0.9 = 1 gilt. • Angenommen es ist 0.9 < 1. Nach Bemerkung 1.5 müssten dann unendlich viele Elemente im Intervall 0.9, 1 liegen. Solche Zahlen sind aber nicht zu finden. • Die Folge 1 − 10−k k∈N = (0 , 0.9 , 0.99 , 0.999 , . . .) konvergiert gegen 1, denn wir wissen, dass 10−k = 1 k k→∞ −→ 10 0. Auch wissen wir nach 2.25 (da die Folge monoton wachsend ist), dass sie gegen ihr Supremum konvergiert. Da Grenzwerte eindeutig sind, folgt also, dass 1 = sup 1 − 10−k ; k ∈ N . Also ist die Zahl 1 die kleinste obere Schranke für diese Menge. Da aber 0.9 offenbar auch eine obere Schranke ist, kann 0.9 nicht kleiner als 1 sein. (b) Die Basis 10 kann ohne weiteres durch jede beliebige natürliche Zahl b ≥ 2 ersetzt werden. Zu x ≥ 0 existieren dann M ∈ N und zk ∈ {0, . . . , b−1} (k ∈ N∗ ) mit x=M+ ∞ X zk · b−k = [M.z1 z2 z3 . . .]b (b − adische Entwicklung) k=1 Es ist hierbei sinnvoll, die Zahl M auch im b-er System anzugeben. Beispiels weise für α = 4.235 7 ist 73 · α = [4235 .35 7 7·α = [42 .35 7 73 − 7 · α = [4163 ]7 = 4 · 73 + 1 · 72 + 6 · 71 + 3 · 70 336 · α Folglich ist α = 1466 336 = 1466 (im Dezimalsystem) = 733 168 . 85 4. Grenzwerte und Stetigkeit Der Grenzwertbegriff für Funktionen In diesem Abschnitt beschäftigen wir uns mit Funktionen f : D → R. Wir stellen uns die Frage, wie man feststellen kann, ob sich die Funktionswerte f (x) einem Wert c ∈ R ∪ {±∞} annähern, wenn sich die Werte von x ∈ D einem gegebenen Wert a ∈ R ∪ {±∞} nähern. Also: ∃? c so dass: (x → a ⇒ f (x) → c) Wir beginnen mit Beispielen, die einige Phänomene aufzeigen, die auftreten können. Beispiel 4.1. (a) Betrachte die Funktion f : R → R, f (x) = x4 . Wir nähern uns (versuchsweise) mit x der Zahl a = 3 an und beobachten, welche Werte der Funktionswert annimmt. x= 2 2.5 2.9 2.99 2.999 2.9999 3 3.0001 3.001 3.01 3.1 3.5 4 f (x) ≈ 16 39.06 70.73 79.93 80.90 80.99 81 81.01 81.11 82.09 92.35 150.06 256 Wir vermuten also: x→3 =⇒ f (x) → 81 (= f (3)) Es stellen sich folgende Fragen: 1.) Kann man dies (für diese Funktion f ) für alle a ∈ R verallgemeinern? ∀a ∈ R : (x → a =⇒ f (x) → f (a)) (?) 2.) Gilt die Aussage in 1.) für jede beliebige Funktion f ? (b) Wir betrachten die Funktion x−1 g : [0, ∞) \ {1} → R, f (x) = √ . x−1 • Falls wir eine Zahl a ∈ [0, ∞)\{1} betrachten, so kommen wir zu ähnlichen Vermutungen wie in (a): ∀a ∈ [0, ∞) \ {1} : x→4 =⇒ g(x) → g(4) = 3 x→0 =⇒ g(x) → g(0) = 1 x → a =⇒ g(x) → g(a) 87 4. Grenzwerte und Stetigkeit • Man kann sich mit x auch der Zahl a = 1 annähern (diese liegt zwar nicht im Definitionsbereich von g, man kommt ihr aber darin beliebig nahe) und beobachtet Folgendes: x= g(x) ≈ 0.5 0.9 0.99 0.999 1 1.001 1.01 1.1 1.5 0.585 0.513 0.501 0.5001 nicht def. 0.4999 0.499 0.488 0.450 Wir vermuten also: x → 1, x 6= 1 1 2 g(x) → =⇒ • Bei der Funktion g macht es aber keinen Sinn, sich (zum Beispiel) der Zahl a = −5 anzunähern, da dies im Definitionsbereich [0, ∞) nicht möglich ist. (c) Wir betrachten die Funktion 1 sgn(x) : R → R, x 7→ 0 −1 , falls x > 0 (sgn : Signum = V orzeichen) , falls x = 0 , falls x < 0 Hier macht es einen Unterschied, ob man sich der Zahl a = 0 ’von oben’ oder ’von unten’ annähert. Es gilt sgn(0.1) = sgn(0.01) = . . . = 1 Also: sgn(−0.1) = sgn(−0.01) = . . . = −1 Also: x ↓ 0 =⇒ sgn(x) → 1 6= sgn(0) x ↑ 0 =⇒ sgn(x) → −1 6= sgn(0) Eine allgemein formulierte Aussage bei Annäherung an 0 ist hier nicht möglich: @c ∈ R mit: (x → 0 ⇒ sgn(x) → c) (d) Wir betrachten die Funktion h : (0, ∞) → R, h(x) = cos 1 x und untersuchen die Annäherung x ↓ 0. Die Tabelle x= 10−1 10−2 10−3 10−4 10−5 10−6 10−7 10−8 0 h(x) ≈ −0.84 0.86 0.56 −0.95 −0.99 0.94 −0.90 −0.36 nicht def. bringt uns nicht weiter. Bei ganz bestimmten Annäherungsverfahren kann man auch für h(x) einen ’Grenzwert’ finden, beispielsweise: x= 1 2π 1 4π 1 6π 1 8π ... ↓0 h(x) = 1 1 1 1 ... →1 x= 2 1π 2 3π 2 5π 2 7π ... ↓0 h(x) = 0 0 0 0 ... →0 oder 88 Man kann (mit etwas mehr Aufwand) jede Zahl c ∈ [−1, 1] als Annäherungswert von h(x) erhalten, wenn man sich mit x auf eine ganz bestimmte Art von oben der 0 nähert. Eine generelle Annäherung an 0 von oben ist hier nicht möglich: @c ∈ R mit: (x ↓ 0 ⇒ sgn(x) → c) (e) Wir betrachten die Funktion i : R \ {0} → R; x 7→ sin x x und untersuchen die Annäherung an (die kritische Stelle) 0: −0.5 −0.1 −0.01 0 0.01 0.1 0.5 0.9588 0.9983 0.99998 nicht def. 0.99998 0.9983 0.9588 x= i(x) ≈ Vermutung: x→0 i(x) → 1 =⇒ (f ) Wir betrachten die Funktion x2 − 1 x2 j : R \ {0} → R, j(x) = und untersuchen die Annäherung an verschiedene Werte a: • a = 0: x= j(x) = −0.5 −0.1 −0.01 −0.001 0 0.001 0.01 0.1 0.5 −3 −99 −9999 −999999 nicht def. −999999 −9999 −99 −3 Vermutung: x→0 j(x) → −∞ =⇒ • a = ∞: x= j(x) = 10 100 1000 10000 ∞ 0.99 0.9999 0.999999 0.99999999 nicht. def. Vermutung: x→∞ =⇒ j(x) → 1 Es stellt sich nun die Frage nach einer allgemeinen Defintion für den Grenzwertbegriff von Funktionen. Eine Möglichkeit besteht darin, dies auf den Begriff der Folgenkonvergenz zurückzuführen. Definition 4.2. Sei D ⊂ R eine Teilmenge und f : D → R eine Funktion. (a) Ein Wert a ∈ R ∪ {±∞} heißt in D approximierbar, wenn es mindestens eine Folge (xn )n in D gibt (d.h. xn ∈ D ∀n), so dass lim xn = a gilt. n→∞ (b) Ist a ∈ R ∪ {±∞} in D approximierbar, so heißt ein Wert c ∈ R ∪ {±∞} Grenzwert von f für x → a, falls: Für jede Folge (xn )n in D mit lim xn = a gilt lim f (xn ) = c. n→∞ n→∞ 89 4. Grenzwerte und Stetigkeit Man schreibt dafür auch: lim f (x) = c oder x→a x→a f (x) −→ c. Bemerkung 4.3. Die Notation lim f (x) = c bedeutet also, dass für jede beliebige Folge (xn )n in D x→a mit xn → a folgt, dass f (xn ) → c. Falls nichts weiter dazu gesagt wird, ist dabei D dabei der maximale Definitionsbereich der Funktion f . Man kann aber durch geeignete Notationen, den Bereich D, in dem die Folgenglieder (xn )n liegen dürfen, weiter einschränken. Ist f : D → R eine Funktion und a approximierbar in D, so schreiben wir beispielsweise: lim f (x) = c x↓a def ⇔ für alle Folgen (xn )n in D mit xn > a ∀n und xn → a gilt auch f (xn ) → c (man nennt c dann auch rechtsseitigen Grenzwert von f für x → a) lim f (x) = c x↑a def ⇔ für alle Folgen (xn )n in D mit xn < a ∀n und xn → a gilt auch f (xn ) → c (man nennt c dann auch linkssseitigen Grenzwert von f für x → a) lim f (x) = c lim f (x) = c x→a,x6=a x→a,x∈Q def ⇔ für alle Folgen (xn )n in D mit xn 6= a ∀n und xn → a gilt auch f (xn ) → c def für alle Folgen (xn )n in D mit xn ∈ Q ∀n und xn → a gilt auch f (xn ) → c ⇔ Wir sind nun in der Lage, Grenzwerte von Funktionen präziser zu untersuchen. Unser wichtigstes Werkzeug sind dabei zunächst die Grenzwertsätze für Folgen. Beispiel 4.4. (a) Sei f : R → R, f (x) = x4 . Im Definitionsbereich von f sind hier alle Werte a ∈ R ∪ {±∞} approximierbar. Für jede Zahl a ∈ R gilt lim f (x) = f (a), denn x→a für jede Folge (xn )n in R gilt: xn → a GWS’e ⇒ 4 f (xn ) = (xn ) → a4 = f (a). Weiterhin gilt lim f (x) = +∞, denn: x→−∞ xn → −∞ GWS’e ⇒ 4 f (xn ) = (xn ) = xn · xn · xn · xn → +∞. |{z} |{z} |{z} |{z} →−∞ →−∞ →−∞ →−∞ Ebenso zeigt man, dass lim f (x) = +∞ gilt. x→∞ (b) Sei g : R \ {5} → R, g(x) = −8x+1 x−5 . Für a betrachten wir verschiedene Werte: • Sei a ∈ R \ {5}. Für jede Folge (xn )n in R \ {5} mit xn → a gilt nach den Grenzwertsätzen −8xn + 1 −→ −8a + 1 und xn − 5 −→ a − 5 6= 0 und somit g(xn ) = −8xn + 1 −8a + 1 → = g(a). xn − 5 a−5 Also gilt lim g(x) = g(a) für alle a ∈ R \ {5}. x→a 90 • Sei a = 5. Ist (xn )n eine Folge in R \ {5} mit xn → 5, so gilt nach den Grenzwertsätzen −8xn + 1 −→ −39 und xn − 5 −→ 0. Damit folgt −∞ , falls xn > 5 (n ≥ n0 ) −8xn + 1 g(xn ) = −→ ∞ , falls xn < 5 (n ≥ n0 ) xn − 5 divergent , sonst Somit existiert der Grenzwert lim g(x) nicht, aber es ist x→5 lim g(x) = −∞ x↓5 und lim g(x) = +∞. x↑5 • Sei a = ∞. Ist (xn )n eine Folge in R \ {5} mit xn → ∞, so gilt nach den Grenzwertsätzen −8xn +1 −→ −∞ und xn −5 −→ ∞. Damit kommen wir nicht weiter. Wir können aber zunächst eine Polynomdivision durchführen und erhalten g(x) = −8x + 1 39 = −8 − . x−5 x−5 Man erkennt nun, dass für xn −→ ∞ immer g(xn ) −→ −8 gelten muss. Folglich ist lim g(x) = −8. x→∞ • Analog zeigt man, dass auch lim g(x) = −8 gilt. x→−∞ Man kann diese Ergebnisse am Graph der Funktion g nachvollziehen: 91 4. Grenzwerte und Stetigkeit (c) Wir betrachten erneut die Signumfunktion sgn : R → R und untersuchen den Grenzwert für x → 0. Für eine Folge (xn )n in R mit xn → 0 kann (sgn(xn ))n gegen −1, +1 oder 0 konvergieren oder divergent sein. Somit existiert lim sgn(x) x→0 nicht. Es ist aber (wie man leicht sieht) lim sgn(x) = 1 lim sgn(x) = −1. und x↓0 x↑0 (d) Wir wollen zeigen, dass für die Funktion h : R \ {0} → R, h(x) = cos 1 x der rechtsseitige Grenzwert lim h(x) nicht existiert. Dazu genügt es, zwei Folgen x↓0 (xn )n und (yn )n mit xn , yn > 0 zu finden, die beide gegen 0 konvergieren, so dass aber die Folgen (h(xn ))n und (h(yn ))n gegen zwei verschiedene Werte konvergieren. Man kann dafür etwa xn = 1 2nπ und yn = 1 2nπ + π 2 (n ∈ N∗ ) wählen, denn es ist xn , yn > 0 und xn , yn −→ 0 aber h(xn ) = cos(2nπ) = 1 −→ 1 92 und π h(yn ) = cos 2nπ + = 0 −→ 0. 2 (e) Bei der Funktion i : R \ {0} → R; x 7→ sin x x vermuteten wir in Beispiel 4.1 (e), dass lim i(x) = 1 ist. Dies können wir im x→0 Moment noch nicht zeigen, da wir keinen Grenzwertsatz für die Sinusfunktion kennen. Auch für den Grenzwert lim i(x) können wir die Grenzwertsätze nicht direkt x→∞ anwenden. Aber der Einschließungssatz 2.10 hilft uns weiter, denn für jede Folge (xn )n in R \ {0} mit xn −→ ∞ gilt (wegen −1 ≤ sin(xn ) ≤ 1) 0 ←− − 1 1 ≤ i(xn ) ≤ −→ 0 xn xn und somit auch i(xn ) → 0. Somit ist gezeigt, dass lim i(x) = 0 gilt. x→∞ Analog kann man zeigen, dass auch lim i(x) = 0 ist. x→−∞ 93 4. Grenzwerte und Stetigkeit Bemerkung 4.5. Wir betrachten den Fall, dass der angenäherte Wert a im Definitionsbereich von f ist. Man beachte, dass in der Definition des Grenzwerts lim f (x) auch Folgen x→a zugelassen sind, deren Folgenglieder = a sind, also etwa die konstante Folge (xn )n mit xn = a (n ∈ N). Für diese Folge ist offensichtlich f (xn ) = f (a) → f (a). Der Grenzwert lim f (x) kann in diesem Fall also (wenn er existiert) nur den Wert f (a) x→a haben. Beispielsweise betrachten wir die Funktion ( x2 − 2x − 3 f : R → R, f (x) = 3 , x 6= 4 , x=4 Nach unserer Definition existiert lim f (x) nicht, denn wir haben die Folgen (xn )n x→4 94 und (yn )n mit 2 1 1 1 −2 4+ ⇒ f (xn ) = 4 + − 3 −→ 42 − 2 · 4 − 3 = 5 n n n yn = 4 ⇒ f (yn ) = f (4) = 3 −→ 3 xn = 4 + Schränkt man den Definitionsbereich auf R \ {4} ein, so existiert der Grenzwert. Es ist f (xn ) lim f (x) = 5, denn für jede Folge (xn )n in R \ {4} mit xn −→ 4 gilt x→4, x6=4 = x2n − 2xn − 3 −→ 5. Man findet manchmal auch eine Grenzwertdefinition, die von unserer insofern abweicht, als dass nur Folgen zugelassen sind, deren Folgenglieder den Wert a nicht annehmen. Dadurch wird die Argumentation an einigen Stellen jedoch unnötig verkompliziert, daher halten wir uns im Folgenden strikt an die in 4.2 angegebene Definition. Stetige Funktionen Wir werfen einen erneuten Blick auf die Beispiele in 4.4. Wir haben gesehen, dass es zahlreiche Funktionen f : D → R gibt, bei denen für a ∈ D der Schluss x −→ a ⇒ f (x) −→ f (a) zulässig ist. Beispielsweise wissen wir bei der Funktion f : R → R, f (x) = x4 , dass für jede Folge (xn )n in R mit xn → a ∈ R auch f (xn ) → f (a) gilt. Wir schreiben dafür auch lim f (x) = f (a) (a ∈ R). Auch bei der Funktion x→a g : Dg → R, g(x) = −8x + 1 x−5 mit Dg = R \ {5} gilt lim f (x) = f (a) für alle a ∈ Dg . Aber es gibt auch Funktionen, die diese x→a Eigenschaft nicht besitzen, etwa bei der Signumfunktion sgn : R → R existiert der Grenzwert lim sgn(x) nicht. Wir führen daher die folgende Definition ein. x→0 Definition 4.6. Sei f : D → R eine Funktion und a ∈ D. Man nennt die Funktion f stetig in a, falls für jede Folge (xn )n in D mit xn → a auch f (xn ) → f (a) gilt. Man nennt f stetig, falls f stetig in jedem Punkt a ∈ D ist. Bemerkung 4.7. (a) Eine Funktion f ist definitionsgemäß genau dann stetig in einem Punkt a ∈ D, wenn lim f (x) = f (a) gilt. Dies ist schon erfüllt, wenn man lediglich weiß, dass x→a der Grenzwert lim f (x) existiert, denn nach Bemerkung 4.5 kann dieser nur x→a den Wert f (a) haben. 95 4. Grenzwerte und Stetigkeit (b) Man beachte, dass die Stetigkeit nur in den Punkten aus dem Definitionsbereich der Funktion untersucht wird. Beispielsweise ist die Funktion f : R \ {0}, f (x) = 1 x stetig, denn für jeden Punkt a ∈ R \ {0} und jede Folge (xn )n in R \ {0} mit xn → a gilt auch 1 1 −→ = f (a). xn a Der Punkt a = 0 ist auch approximierbar in R\{0} und der Grenzwert lim f (x) f (xn ) = x→0 existiert nicht. (Zum Beispiel ist xn = 1 n → 0 mit f (xn ) = n → ∞ und x̃n = − n1 → 0 mit f (x̃n ) = −n → −∞.) Da 0 ∈ / Df ist, wirkt sich dies aber nicht auf die Stetigkeit von f aus. Die Funktion f ist stetig. Wir wollen nun eine verschiedene Funktionsklassen auf Stetigkeit untersuchen und auch Grenzwertuntersuchungen für approximierbare Werte a außerhalb des Definitionsbereiches anstellen. Wir beginnen mit den rationalen Funktionen. 4.8. Rationale Funktionen Jede rationale Funktion ist stetig. Wir betrachten zwei Polynome p, q mit q 6= 0 und die Funktion f : R \ Nq → R, f (x) = p(x) q(x) mit Nq = {x ∈ R; q(x) = 0}.1 Dann gilt lim f (x) = f (a) für jeden Punkt a ∈ R \ Nq . Dies folgt unmittelbar aus x→a den Grenzwertsätzen für Folgen. Exemplarisch begründen wir dies an der Funktion: f : R \ {−1, 4} → R, f (x) = 2x2 − 8x − 19 x2 − 3x − 4 Ist a ∈ R \ {−1, 4} und (xn )n eine Folge in R \ {−1, 4} mit xn → a, so gilt f (xn ) = 2xn 2 − 8xn − 19 2a2 − 8a − 19 −→ 2 = f (a). 2 xn − 3xn − 4 a − 3a − 4 Also gilt lim f (x) = f (a). (Dies funktioniert ganz genauso für jede beliebige ratiox→a nale Funktion.) Wir wollen nun zusätzlich auch noch die Grenzwerte für x gegen ±∞ und gegen die Definitionslücken −1 und 4 (hierbei auch gegebenenfalls die einseitigen Grenzwerte) untersuchen. Eine Partialbruchzerlegung gemäß A.25 ergibt 9 19 2x2 − 8x − 19 5 5 =2+ − (x ∈ R \ {−1, 4}) . f (x) = 2 x − 3x − 4 x+1 x−4 Damit ergibt sich: • Für xn → ∞ folgt 9 5 x+1 19 5 x−4 → 0 und f (xn ) = 2 + → 0 und damit 9 19 5 x+1 − 5 x−4 −→ 2. Also ist lim f (x) = 2. x→∞ 1 Dabei 96 ist auch zugelassen, dass q = 1 ist. In dem Fall ist f = p einfach ein Polynom. • Analog folgt, dass auch lim f (x) = 2 gilt. x→−∞ • Betrachten wir nun Folgen (xn )n in R \ {−1, 4} mit xn → 4. In jedem Fall 9 5 x+1 9 5 → 2 + 4+1 = 59 25 . Weiterhin gilt +∞ , falls xn > 4 (n ≥ n0 ) 1 −→ −∞ , falls xn < 4 (n ≥ n0 ) xn − 4 ist divergent , sonst folgt dann 2 + Zusammen ergibt sich: f (xn ) = 2 + 9 5 x+1 − 19 5 x−4 −→ −∞ , falls xn > 4 (n ≥ n0 ) +∞ , falls xn < 4 (n ≥ n0 ) ist divergent , sonst Damit erhalten wir: lim f (x) = −∞, x↓4 lim f (x) = +∞ x↑4 und lim f (x) existiert nicht x→4 • Analog ergibt sich (man beachte das Vorzeichen beim Term lim f (x) = +∞, x↓−1 lim f (x) = −∞ x↑−1 und ∗ x+1 ): lim f (x) existiert nicht x→−1 Zum Vergleich hier noch der Graph der Funktion f : 97 4. Grenzwerte und Stetigkeit Wir betrachten noch zwei weitere Beispiele: Zunächst sei: g : R \ {2} → R, g(x) = −x4 + 6x3 − 12x2 + 3x + 11 x2 − 4x + 4 Die Funktion g ist (als rationale Funktion) stetig, es gilt also lim g(x) = g(a), falls x→a a ∈ R \ {2} ist. Eine Partialbruchzerlegung ergibt: 5 1 + x − 2 (x − 2)2 g(x) = −x2 + 2x − • Für xn → ∞ folgt − xn5−2 + −xn 2 1 (xn −2)2 (x ∈ R \ {2}) → 0. Außerdem ist 2 −→ −∞ + 2xn = xn · −1 + |{z} xn {z } →∞ | 2 →−1 und damit folgt lim g(x) = −∞. x→∞ • Analog sieht man, dass lim g(x) = −∞ gilt (man beachte, dass xn 2 → ∞, x→∞ falls xn → −∞). • Betrachten wir nun den Grenzwert für x → 2: Falls xn → 2 (xn 6= 2), so gilt −xn 2 + 2xn → −22 + 2 · 2 = 0 und − 5 1 1 + = · (−5(xn − 2) + 1) −→ +∞ {z } xn − 2 (xn − 2)2 (xn − 2)2 | | {z } →1 →+∞ (Man beachte dabei, dass 1 > 0 (n ∈ N) ist.) (xn − 2)2 Insgesamt folgt: g(xn ) → +∞. Folglich ist: lim g(x) = ∞ x→2 und somit auch lim g(x) = lim g(x) = ∞ x↓2 x↑2 Der Graph der Funktion g sieht wie folgt aus (zusätzlich ist auch noch die durch x 7→ −x2 + 2x gegebene ’Asymptote’ dargestellt) : 98 Nun betrachten wir noch die Funktion: h : R \ {−3, 0} → R, h(x) = 3x2 + x − 24 x3 + 3x2 Die Funktion h ist stetig. Mit Partialbruchzerlegung folgt: h(x) = 3x2 + x − 24 3 8 = − 2 x3 + 3x2 x x Dabei fällt der Term der Form ∗ x+3 (x ∈ R \ {−3, 0}) weg. Das liegt daran, dass −3 auch eine Null- stelle des Zählers ist. Analog zu den vorigen Beispielen erkennt man, dass lim h(x) = 0, x→∞ lim h(x) = 0 x→−∞ und lim h(x) = −∞ x→0 Ist (xn )n eine Folge in R \ {−3, 0} mit xn → −3, so gilt h(xn ) = 3 8 3 8 17 − 2 −→ − =− . 2 xn xn −3 (−3) 9 Folglich ist lim h(x) = − 17 9 . Der Graph der Funktion h (man beachte, dass h an x→−3 der Stelle −3 nicht definiert ist): 99 4. Grenzwerte und Stetigkeit Es macht Sinn, statt h die Funktion 8 3 h0 : R \ {0} → R, h0 (x) = − 2 x x 3x − 8 = x2 zu betrachten. Diese stimmt auf Dh = R \ {−3, 0} mit h überein (d.h es gilt h0 (x) = h(x) für alle x ∈ Dh ), ist zusätzlich an der Stelle 3 definiert und dort stetig. Man sagt: h0 ist eine (stetige) Fortsetzung von h. An der Stelle 0 kann die Funktion h nicht stetig fortgesetzt werden. Im Anhang haben wir einige Funktionen eingeführt (Potenz- und Logarithmusfunktionen sowie die trigonometrischen Funktionen). Es stellt sich die Frage nach der Stetigkeit dieser Funktionen (und den Grenzwerten an den Rändern des jeweiligen Definitionsbereiches). Wir studieren dies ausführlich am Beispiel der Exponentialfunktion. 4.9. Stetigkeit der Exponentialfunktion Die Exponentialfunktion wurde in A.31 durch eine Reihendarstellung definiert. Wir wollen nun beweisen, dass sie stetig ist und beginnen damit, die Stetigkeit im Punkt a = 0 zu zeigen. Dazu benutzen wir die folgende Ungleichung: ∀x ∈ R : |exp(x) − 1| ≤ |x| · exp |x| (Beweis als Zusatzaufgabe in den Übungen) 100 Nun betrachten wir eine beliebige Folge (xn )n in R mit xn → 0. Dann existiert eine Stelle n0 ∈ N mit |xn | ≤ 1 (n ≥ n0 ). Für n ≥ n0 gilt nun |exp(xn ) − 1| ≤ |xn | · exp |xn | ≤ |xn | · e −→ 0. | {z } ≤exp 1=e Nach einer Folgerung aus dem Einschließungssatz (siehe 2.12 (b)), folgt nun, dass exp(xn ) → 1. Somit haben wir gezeigt, dass lim exp(x) = 1 = exp(0) ist. Dies x→0 bedeutet, dass exp im Punkt 0 stetig ist. Nun betrachten wir einen beliebigen Punkt a ∈ R und dazu eine Folge (xn )n in R mit xn → a. Dann folgt xn − a → 0 und somit (wie wir gerade gezeigt haben) auch exp(xn − a) → exp(0) = 1. Aufgrund der Funktionalgleichung für die Exponentialfunktion (siehe A.31) folgt daraus schließlich: exp(xn ) = exp((xn − a) + a) = exp(xn − a) · exp a −→ 1 · exp(a) = exp(a) Also gilt lim exp(x) = exp(a) für alle a ∈ R. Die Exponentialfunktion ist stetig. x→a Wir untersuchen nun zusätzlich noch die Grenzwerte für x → ±∞. Für x > 0 gilt exp(x) = ∞ X xk k=0 k! =1+x+ ∞ X xk k=2 k! > x. Ist (xn )n eine Folge in R mit xn → ∞, so gilt exp(xn ) > xn (n ≥ n0 ) und folglich konvergiert auch (exp(xn ))n gegen ∞. Also ist lim exp(x) = ∞. x→∞ Ist andererseits (xn )n eine Folge in R mit xn → −∞, so gilt −xn → ∞ und somit auch exp(−xn ) → ∞. Folglich ist dann exp(xn ) = Dies zeigt, dass 1 −→ 0 exp(−xn ) lim exp(x) = 0 ist. x→−∞ Bemerkung 4.10. Auch die im Anhang untersuchten Funktionen ln : (0, ∞) → R, sin, cos : R → R und tan : R \ 1 k+ π ; k∈Z →R 2 sind allesamt stetig. Außerdem besitzen sie die folgenden Grenzwerte: • Es gilt lim ln x = −∞ und lim ln x = ∞. x→∞ x→0 • Die Grenzwerte lim sin x und lim cos x existieren nicht (dies sieht man leicht, wenn man etwa die Folgen ±n · π2 n∈N betrachtet). x→±∞ • Für alle k ∈ Z gilt lim x→±∞ tan x = ∞ und x↑(k+ 12 π ) lim tan x = −∞. Die Grenz- x↓(k+ 21 π ) werte lim tan x existieren nicht. x→±∞ Wir wollen dies hier nicht beweisen. 101 4. Grenzwerte und Stetigkeit Rechnen mit Grenzwerten Um von einfachen auf kompliziertere Grenzwerte schließen zu können, geben wir nun die folgenden Grenzwertsätze für Funktionen an. Sie entsprechen ganz genau den Grenzwertsätzen für Folgen (dies liegt natürlich daran, dass sie direkt aus diesen abgeleitet werden können). 4.11. Grenzwertsätze für Funktionen Die folgenden Regeln ermöglichen das Rechnen mit Grenzwerten von Funktionen. Man beachte, das einige dieser Regeln nur unter bestimmten Zusatzvoraussetzungen gelten. Es gibt auch Sitiuationen, in denen keine allgemeine Aussage möglich ist. Diese Fälle sind mit ’?’ gekennzeichnet. Wir gehen in allen Fällen davon aus, dass f : D → R und g : D → R Funktionen auf einem gemeinsamen Definitionsbereich D sind (gegebenenfalls schränke man die beiden Funktionen auf ihren gemeinsamen Definitionsbereich ein) und dass der Wert a ∈ R ∪ {±∞} in D approximierbar ist. Alle Regeln gelten auch für einseitige Grenzwerte x ↑ a bzw. x ↓ a. Tabelle 1 (Summen und Differenzen) Voraussetzungen lim f (x) = x→a mögliche Folgerungen lim g(x) = x→a lim (f (x) + g(x)) = x→a c∈R d∈R c+d c−d ±∞ d∈R ±∞ ±∞ c∈R ±∞ ±∞ ∓∞ ∞ ∞ ∞ ? ∞ −∞ ? ∞ −∞ ∞ ? −∞ −∞ −∞ −∞ ? Tabelle 2 (skalare Vielfache) Voraussetzungen lim f (x) = x→a λ∈R c∈R 102 lim (f (x) − g(x)) = x→a mögliche Folgerungen lim λ · f (x) = x→a λ·c ±∞ >0 ±∞ ±∞ <0 ∓∞ Tabelle 3 (Produkte) Voraussetzungen lim f (x) = x→a mögliche Folgerungen lim (f (x) · g(x)) = lim g(x) = x→a x→a c∈R d∈R c·d ±∞ d ∈ R, d > 0 ±∞ ±∞ d ∈ R, d < 0 ∓∞ ±∞ 0 ? ∞ ∞ ∞ ∞ −∞ −∞ −∞ ∞ −∞ −∞ −∞ ∞ Tabelle 4 (Quotienten) Hier wird immer vorausgesetzt, dass g(x) 6= 0 (x ∈ D) ist. Voraussetzungen lim f (x) = x→a c∈R mögliche Folgerungen lim f (x) x→a g(x) c d lim g(x) = x→a d ∈ R \ {0} ∞ , falls ∃δ > 0 ∀x ∈ D ∩ (a − δ, a + δ) : g(x) > 0 c>0 0 c<0 0 0 0 ? c∈R ±∞ 0 ±∞ d>0 ±∞ ±∞ d<0 ±∞ 0 ±∞ ±∞ = −∞ , falls ∃δ > 0 ∀x ∈ D ∩ (a − δ, a + δ) : g(x) < 0 existiert nicht , sonst −∞ , falls ∃δ > 0 ∀x ∈ D ∩ (a − δ, a + δ) : g(x) > 0 ∞ , falls ∃δ > 0 ∀x ∈ D ∩ (a − δ, a + δ) : g(x) < 0 existiert nicht , sonst ∓∞ ±∞ , falls ∃δ > 0 ∀x ∈ D ∩ (a − δ, a + δ) : g(x) > 0 ∓∞ , falls ∃δ > 0 ∀x ∈ D ∩ (a − δ, a + δ) : g(x) < 0 existiert nicht , sonst ? Tabelle 5 (Wurzeln) Hier wird immer vorausgesetzt, dass f (x) ≥ 0 (x ∈ D) ist. Es sei k ∈ N mit k ≥ 2 fest. Voraussetzungen c≥0 mögliche Folgerungen p lim k f (x) = x→a √ k c ∞ ∞ lim f (x) = x→a 103 4. Grenzwerte und Stetigkeit Wie wir das auch schon bei Folgen an vielen Beispielen durchgeführt haben, kann man nun auch die Grenzwerte von ’zusammengesetzten’ Funktionen mit Hilfe dieser Regeln berechnen. Wir wollen dazu einige Beispiele angeben. Beispiel 4.12. (a) Sei f : R \ {−1, 4} → R, f (x) = 2x2 − 8x − 19 x2 − 3x − 4 (vergleiche 4.8). • Wir untersuchen nochmals den Grenzwert für x → ∞: Es gilt f (x) = 8 x 3 x 2− 1− − − 19 x2 4 x2 (x ∈ R \ {−1, 4} mit x 6= 0) (da wir den Grenzwert für x → ∞ betrachten, ist die Einschränkung x 6= 0 1 x→∞ x hier kein Problem) und wegen lim = 0 folgt: −19 8 19 = 0 und folglich lim 2 − − = 2−0−0 = 2. x→∞ x2 x→∞ x x2 Ebenso ist lim 1 − x3 − x42 = 1. Zusammen folgt lim f (x) = 12 = 2. −8 = 0, x→∞ x lim lim x→∞ x→∞ 1 x→−∞ x • Da auch lim = 0 ist, erhält man genauso auch lim f (x) = x→−∞ 2 1 = 2. • Für x → 4 schreiben wir f (zum Beispiel) in der Form: f (x) = 1 2x2 − 8x − 19 · x+1 x−4 (x ∈ R \ {−1, 4}) Es gilt 2x2 − 8x − 19 2 · 42 − 8 · 4 − 19 19 = =− <0 x→4 x+1 4+1 5 lim und lim (x−4) = 0. x→4 Da aber x−4 ’in der Nähe der Zahl 4 verschiedene Vorzeichen hat’ (genauer: für ein beliebiges δ > 0 ist weder x−4 > 0 für alle x ∈ (4−δ, 4+δ)\{4} noch x − 4 < 0 für alle x ∈ (4 − δ, 4 + δ) \ {4}), existiert der Grenzwert lim f (x) nicht. Betrachtet man jedoch die einseitigen Grenzwerte, so stellt x→4 man fest, dass x − 4 > 0 für x ∈ (4, 5) und x − 4 < 0 für x ∈ (3, 4). Damit folgt (vergleiche Tabelle 4): lim f (x) = −∞ x↓4 und lim f (x) = ∞ x↑4 (b) Betrachten wir die Funktion: g : R → R, g(x) = exp x x2 + 1 Für a ∈ R wissen wir, dass lim exp x = exp a und lim (x2 + 1) = a2 + 1 6= 0 x→a x→a gilt. Daher ist auch lim g(x) = lim x→a 104 x→a exp x exp a = 2 = g(a) x2 + 1 a +1 (d.h. g ist stetig). Weiterhin ist lim exp x = 0 und lim (x2 +1) = ∞. Also ist lim g(x) = 0. x→−∞ x→−∞ x→−∞ Es ist lim exp x = ∞ und lim (x2 +1) = ∞. Mit den Grenzwertsätzen erhalten x→∞ x→∞ wir keine Aussage über die Existenz und den Wert von lim g(x). Anhand des x→∞ Graphen der Funktion g vermuten wir, dass lim g(x) = ∞ ist. x→∞ Es gibt noch eine weitere wichtige Rechenregel für den Umgang mit Grenzwerten. Sie besagt, dass man den Grenzwert x → a einer Hintereinanderausführung g◦f von Funktionen erhält, wenn man zunächst b = lim f (x) und dann lim g(x) bestimmt. x→a x→b Grenzwerte können also ’von innen nach außen’ berechnet werden. Genauer gilt der folgende Satz. Satz 4.13. Seien f : D → R und g : D0 → R Funktionen mit f (D) ⊂ D0 . Dann ist die Funktion g ◦ f definiert durch g ◦ f : D → R, (g ◦ f )(x) = g ( f (x) ) . Falls a ∈ R∪{±∞} approximierbar in D ist und b = lim f (x) ∈ R∪{±∞} existiert und approximierbar in D0 ist, dann ist lim (g ◦ f )(x) = lim g(x) x→a x→b oder x→a beide Grenzwerte existieren nicht. 105 4. Grenzwerte und Stetigkeit Wir geben einige Beispiele für die Anwendung dieses Satzes. Beispiel 4.14. (a) Betrachte die Funktion: h : R → R, f (x) = exp −x3 + x2 Dann ist h = g ◦ f mit f : R → R, f (x) = −x3 + x2 und g = exp : R → R. Für a ∈ R ist lim f (x) = f (a) und x→a lim g(x) = g(f (a)) = h(a). x→f (a) Also folgt lim h(x) = h(a) für alle a ∈ R, die Funktion h ist also stetig. Wegen x→a lim f (x) = −∞ (beachte dazu f (x) = −x2 · (x − 1)) und lim g(x) = 0 folgt: x→∞ x→−∞ lim h(x) = 0 x→∞ Entsprechend ist lim f (x) = ∞ und lim g(x) = ∞. Es folgt: x→−∞ x→∞ lim h(x) = ∞ x→−∞ (b) Betrachte die Funktion: i : (3, ∞) → R, i(x) = ln x−3 x r − 12x 3x + 1 • Wir untersuchen x → ∞. Es gilt x−3 3 x→∞ =1− −→ 1, x x y→1 ln y −→ ln 1 = 0 √ 12 x→∞ 12x = −→ 4, 3x + 1 3 + x1 y→4 y −→ √ ⇒ ln r ⇒ 4=2 x−3 x x→∞ −→ 0 12x x→∞ −→ 2 3x + 1 Zusammen folgt, dass lim i(x) = −2 ist. x→∞ • Wir untersuchen x → 3. Im Definitionsbereich ist nur eine Annäherung von oben möglich. Es gilt x − 3 x→∞ ln y −→ −∞ ⇒ ln −→ −∞ x r r r 12x x→3 18 18 12x x→3 18 √ y→ 18 −→ , y −→5 ⇒ −→ 3x + 1 5 5 3x + 1 5 Zusammen folgt, dass lim i(x) = −∞ ist. x − 3 x→3 −→ 0, x y→0 x→3 • Ist a ∈ (3, ∞), so erhält man: a−3 x − 3 x→a a−3 ln y −→ ln ⇒ ln −→ ln a x a r r r 12a 12x x→a 12a 12a 12x x→a 12a √ y→ 3a+1 −→ , y −→ ⇒ −→ 3x + 1 3a + 1 3a + 1 3x + 1 3a + 1 Zusammen folgt, dass lim i(x) = i(a) ist. Die Funktion i ist also stetig. x − 3 x→a a − 3 −→ , x a y→ a−3 a x→a 106 Wie in diesem letzten Beispiel folgt, dass eine ’aus stetigen Funktionen zusammengesetzte’ Funktion ebenfalls stetig ist. Genauer gilt der folgende Satz. Satz 4.15. Durch Summen, Differenzen, Produkte, Quotienten und Hintereinanderausführungen (allgemein Komposition) stetiger Funktionen (in beliebiger Kombination) erhält man eine Funktion, die (dort, wo sie definiert ist) stetig ist. Beispielsweise ist also etwa die Funktion 2 f : D → R, f (x) = exp(cos x) · (x + 3) − ln √ sin x x+2+ 2 x auf ihrem gesamten Definitionsbereich stetig. Wir schließen diesen Abschnitt mit einer Bemerkung über Potenz- und Exponentialfunktionen. Man vergleiche dies auch mit den Graphen in A.35. Bemerkung 4.16. (a) Ist a > 0 fest, so ist die (Exponential-)Funktion R → R, x 7→ ax = exp(x · ln a) als Komposition stetiger Funktionen stetig. Für a > 1 gilt ln a > 0 und damit x→∞ ax = exp (x · ln a) −→ ∞ | {z } x→−∞ ax = exp (x · ln a) −→ 0 | {z } und x→∞ x→−∞ −→ ∞ −→ −∞ Für a < 1 ist analog (beachte, dass dann ln a < 0 ist): x→∞ ax −→ 0 und x→−∞ ax −→ ∞ (b) Ist r ∈ R fest, so ist die (Potenz-)Funktion (0, ∞) → R, x 7→ xr = exp(r · ln x) als Komposition stetiger Funktionen stetig. Für r > 0 gilt x→∞ xr −→ ∞ und x→0 xr −→ 0 def Damit wird (im Fall r > 0) durch 0r = 0 die Potenzfunktion zu einer stetigen Funktion [0, ∞) fortgesetzt. Ist r < 0, so ist x→∞ xr −→ 0 und x→0 xr −→ ∞ Stetigkeit abschnittsweise definierter Funktionen Wir untersuchen nun abschnittsweise definierte Funktionen auf Stetigkeit. Diese Funktionen sind in verschiedenen Teilen ihres Definitionsbereiches durch jeweils 107 4. Grenzwerte und Stetigkeit andere Funktionsgleichungen definiert. Die Stetigkeit hängt dann davon ab, wie sich die Graphen der einzelnen Abschnitte ’zusammenfügen’. Wir betrachten zunächst ein Beispiel. Beispiel 4.17. (a) Wir betrachten die Funktion: ( f : R → R, x 7→ x2 + 3 , falls x ≤ 1 exp(2 − x) , falls x > 1 Vermutung: Die Funktion f ist an allen Stellen a ∈ R \ {1} stetig. An der Schnittstelle a = 1 ist sie unstetig. (b) Wir betrachten die Funktion: g : R → R, x 7→ 5x + 11 , falls x < −2 −2 , falls x = −2 exp(x + 2) x−3 x2 sin π · x 3 108 , falls − 2 < x ≤ 0 , falls 0 < x < 3 , falls 3 ≤ x Vermutung: Die Funktion g ist an allen Stellen a ∈ R \ {−2, 0, 3} stetig. An der Stelle a = 3 ist sie ebenfalls stetig, an den Stellen a = 0 bzw. a = −2 ist sie unstetig. Es stellt sich die Frage, wie wir solche Funktionen systematisch auf Stetigkeit überprüfen können. Die Antwort liefert der folgende Satz. Satz 4.18. Sei f : D → R eine Funktion und a ∈ D ein Punkt im Inneren von D, das heißt es gibt eine Zahl r > 0 mit (a − r, a + r) ⊂ D. (a) Falls es eine Zahl δ > 0 gibt, so dass f im Bereich (a − δ, a + δ) mit einer stetigen Funktion übereinstimmt, so ist auch f an der Stelle a stetig.1 (b) Die Funktion f ist genau dann stetig an der Stelle a, wenn rechtsseitiger und linksseitiger Grenzwert existieren und beide gleich dem Funktionswert von f an der Stelle a sind, also genau dann wenn: lim f (x) = f (a) = lim f (x) x↑a x↓a Wir untersuchen damit nochmals die Funktionen aus Beispiel 4.17. • Sei ( f : R → R, x 7→ x2 + 3 , falls x ≤ 1 exp(2 − x) , falls x > 1 Nach Satz 4.18 (a) ist f stetig an an allen Stellen a ∈ R \ {1}. An der Stelle a = 1 gilt: lim f (x) = lim x2 + 3 = 12 +3 = 4, x↑1 1 Man x↑1 f (1) = 4, lim f (x) = lim exp(2−x) = exp(2−1) = e 6= 4 x↓1 x↓1 sagt: Stetigkeit ist eine lokale Eigenschaft. Das bedeutet, dass es beim Überprüfen der Stetigkeit an einer Stelle a nur auf die Funktionswerte ’in der Nähe der Stelle a’ ankommt. 109 4. Grenzwerte und Stetigkeit Damit ist zwar der linksseitige Grenzwert gleich dem Funktionswert, aber der rechtsseitige Grenzwert weicht davon ab. Nach Satz 4.18 (b) ist die Funktion an der Stelle 1 somit nicht stetig. • Sei g : R → R, x 7→ 5x + 11 , falls x < −2 −2 , falls x = −2 exp(x + 2) x−3 x2 sin π · x 3 , falls − 2 < x ≤ 0 , falls 0 < x < 3 , falls 3 ≤ x Nach Satz 4.18 (a) ist f stetig an an allen Stellen a ∈ R \ {−2, 0, 3}. Wir untersuchen die ’Schnittstellen’: a = −2 : x↑−2 x↓−2 lim g(x) = 1, g(−2) = −2 a=0 : lim g(x) = e2 , lim g(x) = −∞, g(0) = e2 a=3 : lim g(x) = 0, lim g(x) = 1, x↑0 x↑3 x↓0 lim g(x) = 0, x↓3 g(3) = 0 Folglich ist g stetig an der Stelle 3, aber nicht stetig an den Stellen −2 und 0. Das ε-δ-Kriterium der Stetigkeit Unsere Definition für Stetigkeit beruht auf dem Begriff der Folgenkonvergenz : f stetig in x, wenn: xn → x ⇒ f (xn ) → f (x) In diesem Abschnitt untersuchen wir eine andere Möglichkeit die Stetigkeit in einem Punkt zu charakterisieren. Eine Funktion f : D → R ist genau dann stetig in einem (festen) Punkt x ∈ D, wenn die Abstände von f (x) zu f (y) klein sind, falls y ∈ D ein Punkt mit kleinem Abstand zu x ist. Genauer gesagt: Gibt man eine (kleine) Zahl ε > 0 vor und verlangt, dass der Abstand von f (x) zu f (y) kleiner als ε sein soll, dann kann man dies immer erreichen, wenn man y ’nahe genug’ an die vorgegebene Zahl x heranbringt, das heißt es gibt eine Zahl δ > 0 (die von ε und von x abhängig sein darf), so dass alle y ∈ D mit |x − y| < δ die geforderte Bedingung |f (x) − f (y)| < ε erfüllen. Noch genauer ist dies im folgenden Satz formuliert: Satz 4.19. (ε-δ-Kriterium) Sei f : D → R eine Funktion auf einem Definitionsbereich D ⊂ R und sei x ∈ D. Dann ist f genau dann stetig in x, wenn ∀ε > 0 ∃δ > 0 so dass: ∀y ∈ D mit |x − y| < δ gilt |f (x) − f (y)| < ε Wir verzichten auf einen Beweis1 , wollen das Kriterium aber an Beispielen veranschaulichen. 1 Es ist nicht allzu schwer, aus dem ε-δ-Kriterium die Stetigkeit zu folgern, aber die umgekehrte Richtung benötigt den Begriff der Teilfolge und den Satz von Bolzano-Weierstraß. 110 Beispiel 4.20. (a) Wir betrachten die Funktion f : R → R, f (x) = −x2 − 3x + 10 (der Graph ist eine nach unten geöffnete Parabel). Wir wissen bereits, dass die Funktion auf ganz R stetig ist. Wir überprüfen die Gültigkeit des ε-δ-Kriteriums an der Stelle x = 3. Der Funktionswert ist f (x) = −8. Zu jedem ε > 0 muss nun ein δ > 0 existieren, so dass f (y) ∈ (−8 − ε , −8 + ε) ist, wenn y ∈ (3 − δ , 3 + δ) ist. Wir testen zwei verschiedene ε-Werte: • Zunächst betrachten wir ε = 2. Durch genaue Betrachtung des Graphen stellt man fest, dass δ = 0.1 auf jeden Fall ausreichend ist. • Nun betrachten wir ε = 0.5. Dazu kann man zum Beispiel δ = 0.05 wählen. 111 4. Grenzwerte und Stetigkeit Selbst wenn man ε weiter verkleinert, findet man immer wieder ein geeignetes δ dazu. Dies kann man beweisen, indem man die Unleichung | − 8 − f (y)| < ε studiert und zeigt, dass sie erfüllt ist, wenn |3 − y| < δ mit einem geeignet gewählten δ > 0 ist. In der Tat gilt: | − 8 − f (y)| < ε ⇔ | − 8 − (−y 2 − 3y + 10)| < ε ⇔ | y 2 + 3y − 18 | < ε | {z } ⇔ |y − 3| · |y + 6| < ε =(y−3)·(y+6) Wählt man δ ≤ min ε 10 , 1 , so gilt ε |y − 3| < und |y + 6| ≤ |y − 3| + 9 < 10 10 für alle y ∈ R mit |3 − y| < δ. Damit gilt für diese y auch |y − 3| · |y + 6| < ε und damit (siehe oben) auch | − 8 − f (y)| < ε. Zu jedem ε > 0 kann man also ein geeignetes δ > 0 finden, es genügt δ ≤ ε 1 1 min 10 , 1 zu wählen. (Also kann man zu ε = 1000 einfach δ = 10000 wählen, und so weiter.1 ) (b) Wir betrachten die Funktion ( g : R → R, g(x) = 1 Zu cos 0 1 x , falls x 6= 0 , falls x = 0 ε = 2 haben wir δ = 0.1 gewählt. Die Rechnung zeigt, dass es auch mit δ = 0.2 auf jeden Fall noch funktioniert hätte. Dies wäre aber am Graph nur noch sehr schwierig zu erkennen gewesen. 112 Die Funktion ist unstetig in 0 (denn wir haben in Beispiel 4.4 (d) gesehen, dass lim f (x) nicht existiert). In der Tat stellt man am Graphen fest, dass es x↓0 unmöglich ist, zu ε = 1 2 ein passendes δ zu finden: Wir ziehen aus dem ε-δ-Kriterium noch eine Folgerung, die wir später brauchen. Folgerung 4.21. Sei f : D → R eine stetige Funktion, x ∈ D und C ∈ R. Dann gilt: • Ist f (x) > C, so existiert ein δ > 0 mit f (y) > C für alle y ∈ D mit |x−y| < δ. • Ist f (x) < C, so existiert ein δ > 0 mit f (y) < C für alle y ∈ D mit |x−y| < δ. Beweis. Wir beweisen die erste Aussage, die zweite lässt sich analog zeigen. Es gelte also f (x) > C. Zu ε = f (x) − C > 0 existiert man nach dem ε-δ-Kriterium 4.19 ein δ > 0, so dass für alle y ∈ D mit |x − y| < δ gilt: |f (x) − f (y)| < ε ⇒ f (x) − f (y) < ε ⇔ f (x) − f (y) < f (x) − C ⇔ f (y) > C 113 4. Grenzwerte und Stetigkeit Stetigkeitssätze Wir haben uns in den vorangegangenen Abschnitten mit der Definition der Stetigkeit befasst und sind darauf eingegangen, wie man eine Funktion auf Stetigkeit überprüfen kann. Nun wollen wir die Eigenschaften stetiger Funktionen untersuchen. Es stellt sich heraus, dass die Stetigkeit einer Funktion eine Reihe von bemerkenswerten Konsequenzen für die Funktion hat. Dies gilt insbesondere dann, wenn der Definitionsbereich der Funktion ein (abgeschlossenes) Intervall ist. Wir beginnen mit dem sogenannten Zwischenwertsatz, und betrachten dabei zunächst einen Spezialfall, den Nullstellensatz. Dieser ergibt sich, indem man die Methode, mit der wir in 2.30 eine Nullstelle einer Funktion mit Hilfe einer Intervallschachtelung bestimmt haben, auf beliebige stetige Funktionen verallgemeinert. Satz 4.22. (Nullstellensatz) Sei f : D → R eine stetige Funktion und seien a, b ∈ D mit a > b und [a, b] ⊂ D. Falls f (a) ≤ 0 und f (b) ≥ 0 (oder f (a) ≥ 0 und f (b) ≤ 0) ist, so hat f (mindestens) eine Nullstelle. Beweis. Wir betrachten den Fall, dass f (a) < 0 und f (b) > 0 (umgekehrt analog und falls f (a1 ) = 0 oder f (b1 ) = 0, so hat man bereits eine Nullstelle gefunden). Man kann nun eine Intervallschachtelung wie folgt definieren: 1.) Setze I1 = [a, b] = [a1 , b1 ]. 1 und setze I2 = [a2 , b2 ] mit 2.) Betrachte m1 = a1 +b 2 ( a2 = m1 und b2 = b1 , falls f (m1 ) < 0 a2 = a1 und b2 = m1 , falls f (m1 ) > 0 (im Fall f (m1 ) = 0 ist eine Nullstelle gefunden) 2 3.) Betrachte m2 = a2 +b und setze I3 = [a3 , b3 ] mit 2 ( a3 = m2 und b3 = b2 , falls f (m2 ) < 0 a3 = a2 und b3 = m2 , falls f (m2 ) > 0 (im Fall f (m2 ) = 0 ist eine Nullstelle gefunden) ••• Auf diese Art findet man entweder irgendwann eine Nullstelle (wenn f (mn ) = 0 für ein m ∈ N∗ ist) oder man erhält eine Intervallschachtelung (In )n∈N∗ , denn: an ≤ bn , (an )n mo.wa., (bn )n mo. fa., `(In ) = bn − an = b−a −→ 0 2n−1 Nach dem Intervallschachtelungsprinzip (siehe 2.29) gibt es genau ein x ∈ R mit x ∈ In für alle n ∈ N∗ . Weiterhin konvergieren die Folgen (an )n und (bn )n beide 114 gegen x. Zusätzlich gilt hier f (an ) < 0 und f (bn ) > 0 (n ∈ N∗ ). Es folgt: an −→ x f stetig ⇒ f (an ) −→ f (x) bn −→ x f stetig f (bn ) −→ f (x) ⇒ f (an )<0 ⇒ f (bn )>0 ⇒ f (x) ≤ 0 f (x) ≥ 0 Zusammen folgt, dass f (x) = 0 ist. Bemerkung 4.23. (a) Man beachte, dass das Vorgehen in diesem Beweis genau dem in Beispiel 2.30 (b) entspricht. Die Stetigkeit wird dabei benötigt, um den Schluß xn → x ⇒ f (xn ) → f (x) machen zu können. Man kann Nullstellen stetiger Funktionen also mit Hilfe von Intervallschachtelungen näherungsweise berechnen. (b) Der Nullstellensatz (und auch der nachfolgende Zwischenwertsatz) können nur mit Hilfe der Vollständigkeit der reellen Zahlen gezeigt werden (unser Beweis nutzt das Intervallschachtelungsprinzip). Ersetzt man die Menge der reellen Zahlen durch die Menge der rationalen Zahlen Q, so ist der Satz falsch. Beispielsweise ist die Funktion f : Q → Q, f (x) = x2 − 2 stetig und es gilt f (1) < 0 und f (2) > 0, aber f hat keine Nullstelle in Q. (c) Man kann im Nullstellensatz auf keine der Voraussetzungen verzichten. Dies wollen wir an (Gegen-)Beispielen aufzeigen: • Die Funktion ( f : R → R, f (x) = 1 , falls x ≤ 0 −1 , falls x > 0 erfüllt f (−2) > 0 und f (2) < 0. Außerdem ist [−2, 2] ⊂ Df = R. Aber f hat keine Nullstelle. (Der Nullstellensatz ist nicht anwendbar, weil f nicht stetig ist.) • Die Funktion g : R \ {0} → R, g(x) = 1 x ist stetig und es gilt g(−1) < 0 und g(1) > 0. Trotzdem hat g keine Nullstelle. (Der Nullstellensatz ist nicht anwendbar, denn [−1, 1] ( Dg = R \ {0}. 115 4. Grenzwerte und Stetigkeit Graph von g Graph von f (d) Die nach dem Nullstellensatz existierende Nullstelle ist nicht unbedingt eindeutig bestimmt. Betrachte beispielsweise die Funktion: h : R → R, h(x) = cos(3x) + x 4 Um ein Startintervall zu finden, betrachten wir a1 = −5 und b1 = 5. Dann ist h(a1 ) = cos(−15) − 5 4 < 0 und h(a2 ) = cos(15) + 5 4 > 0 (wir brauchen dazu den Kosinuswert nicht auszurechnen). Da die Funktion h stetig ist, hat sie mindestens eine Nullstelle in I1 = [−5, 5]. Der Graph zeigt uns aber, dass es in der Tat mehrere Nullstellen gibt. Nun berechnen wir: ⇒ Setze a2 = a1 = −5 und b2 = m1 = 0 5 ⇒ Setze a3 = m2 = − und b3 = b2 = 0 2 5 ⇒ Setze a4 = m3 = − und b4 = b3 = 0 4 Es folgt nun, dass h (mindestens) eine Nullstelle in I4 = − 25 , 0 hat. Ein m1 = 0, h(m1 ) = 1 > 0 5 m2 = − , h(m2 ) ≈ −0.28 < 0 2 5 m3 = − , h(m3 ) ≈ −1.13 < 0 4 Blick auf den Graphen verrät uns, dass diese Nullstelle nun auch eindeutig ist (man könnte sie mit weiteren Intervallhalbierungen noch näher bestimmen). 116 Dies wissen wir aber nur dank der (vom Computer angefertigten) Zeichnung des Graphen. Der Nullstellensatz kann leicht verallgemeinert werden, indem man die Zahl 0 durch eine beliebige Zahl λ ersetzt. Satz 4.24. (Zwischenwertsatz) Sei f : D → R eine stetige Funktion und seien a, b ∈ D mit a > b und [a, b] ⊂ D. Falls λ ∈ R ist und f (a) ≤ λ und f (b) ≥ λ (oder f (a) ≥ λ und f (b) ≤ λ) gilt, so gibt es (mindestens) eine Stelle x ∈ [a, b] mit f (x) = λ. Beweis. Die Hilfsfunktion g : D → R, g(x) = f (x) − λ erfüllt alle Voraussetzungen des Nullstellensatzes 4.22. Sie hat daher eine Nullstelle x ∈ [a, b]. Es ist aber: g(x) = 0 ⇔ f (x) − λ = 0 ⇔ f (x) = λ Der Zwischenwertsatz hat zahlreiche Konsequenzen und kann in vielen Situationen sinnvoll eingesetzt werden. Wir stellen im Folgenden einige Anwendungen des Satzes vor. 4.25. Lösbarkeit von Gleichungen (a) Die Gleichung exp(x) = 2x + 2 hat mindestens zwei Lösungen.1 Dies können wir begründen, indem wir die Funktion f : R → R, f (x) = exp(x) − 2x betrachten. Dann gilt: exp(x) = 2x + 2 ⇔ f (x) = 2 Außerdem ist f stetig und es gilt f (−1) = 1 + 2 > 2, e f (0) = 1 < 2 und f (4) = e4 − 8 > 24 − 8 > 2 Da die Intervalle [−1, 0] und [0, 4] beide ganz im Definitionsbereich der Funktion f liegen, können wir in beiden Fällen den Zwischenwertsatz 4.24 anwenden und können schließen, dass es Zahlen x1 ∈ [−1, 0] und x2 ∈ [0, 4] gibt, so dass f (x1 ) = 2 und f (x2 ) = 2 gilt. Damit sind x1 und x2 zwei (verschiedene) Lösungen der Gleichung exp(x) = 2x + 2. (b) Der Wertebereich der Funktion g : (0, ∞) → R, g(x) = 1 Man −x3 + 12x2 + 1 x(x + 1) beachte, dass es nicht möglich ist, die Gleichung nach x aufzulösen. 117 4. Grenzwerte und Stetigkeit ist gleich R (d.h. die Funktion g ist surjektiv). Anders ausgedrückt bedeutet das, dass für jedes λ ∈ R die Gleichung g(x) = λ (mindestens) eine Lösung haben muss. Wir wollen dies nun zeigen und betrachten dazu eine feste Zahl λ ∈ R. Um den Zwischenwertsatz anwenden zu können, müssen wir wissen, dass es sowohl Funktionswerte g(a) > λ als auch g(b) < λ gibt. Dazu betrachten wir die Grenzwerte für x → 0 und x → ∞: • Wegen lim g(x) = ∞ gibt es eine Zahl a ∈ (0, ∞) mit g(a) > λ. x→0 • Wegen lim g(x) = −∞ gibt es eine Zahl b ∈ (0, ∞) mit g(b) < λ. x→∞ Die Funktion g ist stetig, das Intervall [a, b] (bzw. das Intervall [b, a]) liegt ganz in (0, ∞), es sind also alle Voraussetzungen des Zwischenwertsatzes 4.24 erfüllt. Folglich gibt es (mindestens) eine Zahl x ∈ (0, ∞) mit g(x) = λ. Der Graph von g Beispiel 4.26. Man kann den Zwischenwertsatz (bzw. den Nullstellensatz) auch benutzen, um Fixpunktaussagen zu beweisen. (Ist f : D → R eine Funktion, so heißt ein x ∈ D Fixpunkt von f , falls f (x) = x gilt.) Zum Beispiel gilt: Jede stetige Funktion f : [0, 1] → [0, 1] mit f (0) = 0 und f (1) = 1 hat einen Fixpunkt. Beweis. Betrachte g : [0, 1] → R, g(x) = f (x) − x. Dann gilt: f (x) = x ⇔ g(x) = 0 Die Funktion g ist stetig (da f stetig ist) und wegen f (x) ∈ [0, 1] gilt: g(0) = f (0) − 0 ≥ 0 118 und g(1) = f (1) − 1 ≤ 0 Nach dem Nullstellensatz 4.22 hat g eine Nullstelle in [0, 1], diese ist Fixpunkt von f . Aus dem Zwischenwertsatz ergibt sich eine weitere Folgerung, die den Wertebereich stetiger Funktionen beschreibt. Folgerung 4.27. (Intervallsatz) Ist I ein Intervall und f : I → R eine stetige Funktion, so ist der Wertebereich von f ebenfalls ein Intervall.1 Beweis. Für den Beweis beachte man die folgende Charakterisierung von Intervallen: Eine Teilmenge J ⊂ R ist genau dann ein Intervall, wenn für alle x, y ∈ J mit x < y auch [x, y] ⊂ J ist. Nun betrachten wir den Wertebereich J = f (I) der Funktion f und fixieren daraus zwei Punkte x, y ∈ J mit x < y. Dazu gibt es Urbilder a, b ∈ I mit f (a) = x und f (b) = y. Wir behandeln den Fall, dass a < b ist (für b < a funktioniert der Beweis analog). Jeder Punkt z ∈ [x, y] liegt nun zwischen x = f (a) und y = f (b), folglich existiert nach dem Zwischenwertsatz eine Stelle t ∈ [a, b] mit f (t) = z. Somit liegt z im Bild von I (also in J). Dies zeigt, dass [x, y] ⊂ J ist und folglich ist J ein Intervall, wie behauptet. Eine Konsequenz aus dieser Folgerung ist zum Beispiel, dass der Wertebereich der Exponentialfunktion tatsächlich (wie in A.33 behauptet) das komplette Intervall (0, ∞) ist. Ebenso ergibt sich (zusammen mit den Grenzwerten aus Bemerkung 4.10): ln (0, ∞) = R, sin R = cos R = [−1, 1] und tan Dtan = R Wir betrachten nun stetige Funktionen f : D → R, deren Definitionsbereich ein abgeschlossenes Intervall D = [a, b] ist. Für solche Funktionen gilt der folgende Satz von Minimum und Maximum. Satz 4.28. (Satz von Minimum und Maximum) Sind a, b ∈ R mit a < b und ist f : [a, b] → R eine stetige Funktion, so existieren max{f (x), x ∈ [a, b]} und min{f (x), x ∈ [a, b]}. Anders formuliert: Es existieren Stellen xm und xM mit f (xm ) ≤ f (x) ≤ f (xM ) für alle x ∈ [a, b]. Beweis. Wir zeigen zunächst mit einem Widerspruchsbeweis, dass das Bild {f (x); x ∈ [a, b]} 1 Intervalle können auch gleich R sein, denn R = (−∞, +∞). 119 4. Grenzwerte und Stetigkeit von f nach oben beschränkt ist. Angenommen dies wäre nicht der Fall. Dann wäre für jedes n ∈ N die Menge An = {x ∈ [a, b]; f (x) ≥ n} nicht leer und hätte damit nach dem Vollständigkeitsaxiom 1.16 (da sie nach oben durch b beschränkt ist) ein Supremum. Wir bezeichnen xn = sup An (n ∈ N) und stellen fest: • Es ist f (xn ) ≥ n. Denn wäre f (xn ) < n, so gäbe es nach Folgerung 4.21 ein δ > 0, so dass f (x) < n für alle x ∈ (xn − δ , xn + δ) ist. Dann wäre aber xn − δ eine obere Schranke für An , im Widerspruch zu xn = sup An . • Für alle n ∈ N ist xn+1 ≤ xn . Denn es ist An+1 ⊂ An und folglich ist xn = sup An auch ein obere Schranke für An+1 . Die Folge (xn )n ist somit monoton fallend und (durch a) nach unten beschränkt. Also existiert (nach Satz 2.25) der Grenzwert x = lim xn ∈ [a, b]. Aufgrund der n→∞ Stetigkeit von f folgt daraus, dass lim f (xn ) = f (x) ∈ R existiert. Dies kann aber n→∞ nicht sein, da die Folge (f (xn ))n wegen f (xn ) ≥ n unbeschränkt ist (vergleiche Bemerkung 2.22 (a)). Wir wissen nun, dass das die Menge {f (x); x ∈ [a, b]} nach oben beschränkt ist, es existiert also s = sup{f (x); x ∈ [a, b]} ∈ R. Es ist nun zu zeigen, dass eine Stelle xM ∈ [a, b] existiert mit f (xM ) = s. Dazu definieren wir die Mengen Bn = x ∈ [a, b]; f (x) ≥ s − n1 und betrachten dazu tn = sup Bn (n ∈ N∗ ). Wie oben zeigt man, dass f (tn ) ≥ s − 1 n für alle n ∈ N∗ gilt, dass (tn )n monoton fallend und dass folglich xM = lim tn ∈ [a, b] existiert. Wegen n→∞ der Stetigkeit von f folgt, dass f (tn ) → f (t). Andererseits ist aber s− 1 ≤ f (tn ) ≤ s (n ∈ N∗ ) n und nach dem Einschließungssatz 2.10 gilt daher f (tn ) → s. Also gilt f (xM ) = s, was wir zeigen wollten. Analog kann man zeigen, dass f nach unten beschränkt ist und das Bild von f ein Minimum besitzt. Es folgen noch einige Anmerkungen zu diesem Satz. Bemerkung 4.29. (a) Satz 4.28 bedeutet, dass für jede stetige Funktion f : [a, b] → R 1.) das Bild von f beschränkt ist (nach oben und nach unten). 2.) es einen größten und einen kleinsten Funktionswert gibt (diese Funktionswerte werden jeweils an mindestens einer Stelle angenommen. 120 Der Graph könnte etwa so aussehen: (b) Der Satz garantiert zwar die Existenz von Stellen, an denen das Minimum bzw. das Maximum angenommen wird. Allerdings ist zunächst nicht klar, wie man solche Stellen im konkreten Fall bestimmen kann. Dazu werden wir später (im Kapitel über Differentialrechnung) weitere Untersuchungen vornehmen (allerdings für eine kleinere Klasse von Funktionen, nämlich die differenzierbaren Funktionen). (c) Es ist wichtig, dass der Definitionsbereich ein abgeschlossenes Intervall ist. Für offene oder halboffene Intervalle ist der Satz falsch. Dazu einige Beispiele: 1 x g : [−1, 4) → R, g(x) = x − 3 h : − π2 , π2 → R, h(x) = tan x nach unten beschränkt, nach unten und weder nach unten aber nicht nach oben, nach oben beschränkt, noch nach oben beschränkt, weder Min.noch Max. Min. kein Max. weder Min. noch Max. f : (0, ∞) → R, f (x) = Aus dem Satz von Minimum und Maximum 4.28 folgt schließlich unmittelbar (zusammen mit dem Intervallsatz 4.27), dass das Bild eines abgeschlossenen Intervalls 121 4. Grenzwerte und Stetigkeit unter einer stetigen Funktion wieder ein abgeschlossenes Intervall ist. Genauer gilt: Folgerung 4.30. Sind a, b ∈ R mit a < b und ist f : [a, b] → R eine stetige Funktion. Dann ist f [a, b] = [xm , xM ] mit xm = min f [a, b] 122 und xM = max f [a, b] . 5. Differentialrechnung Einleitung Gegeben sei eine Funktion f : D → R (D ⊂ R). Wir beschäftigen uns mit der Frage nach der Änderungsrate des Funktionswerts f (x). Dabei lässt sich zwischen der durchschnittlichen Änderungsrate (in einem Intervall [a, b] ⊂ D) und der momentanen Änderungsrate (an einer Stelle a ∈ D) unterscheiden. Die Differentialrechnung bietet ein überzeugendes Konzept für die Untersuchung des momentanen (d.h. an einer gegebenen Stelle betrachteten) Änderungsverhaltens des Funktionswertes. Wir beginnen mit einigen Beispielen: Beispiel 5.1. (a) Ein 100-Meter-Läufer benötigt 11,5 Sekunden. Um auszurechnen, welche Durchschnittsgeschwindigkeit er beim Lauf hat, teilt man einfach die Strecke durch die Zeit, also v(0 → 100) = 100m 11,5s ≈ 8.696 m s . Nun interessiert man sich für die Geschwindigkeit, die er an der 50-MeterMarke hat. Da die Laufgeschwindigkeit nicht konstant ist (beim Start ist er zunächst langsam, später schneller), entspricht diese nicht unbedingt der Durchschnittsgeschwindigkeit. Man könnte nun die Zeiten nach 45 und 50 Metern messen, beispielsweise erhält man dabei 5, 3s (nach 45m) und 5.85s (nach 50m). Damit berechnet man eine Durchschnittsgeschwindigkeit von v(45 → 50) = 50 − 45 m ≈ 9.091 5.85 − 5.3 s auf dem Stück zwischen 45−50 Metern. Ebenso berechnet man (wenn man nach 55 Metern eine Zeit von 6.35s gemessen hat) v(50 → 55) = 55 − 50 m = 10 . 6.35 − 5.85 s Diese Geschwindigkeiten sind (vermutlich) wesentlich bessere Annäherungen an die Momentangeschwindigkeit an der 50-Meter-Marke. Man könnte dies noch weiter verbessern, indem man den zweiten Messpunkt noch näher an die 50Meter-Marke heranlegt, also etwa bei 49m die Zeit nimmt. (Dem Verfahren sind natürlich Grenzen gesetzt, da sich bei sehr kurzen Zwischenpunkten, die Ungenauigkeit der Messung sehr stark auswirkt.) (b) Ein Stein fällt aus einer Höhe von 20 Metern herab. Mit welcher Geschwindigkeit trifft er auf dem Boden auf ? Aus der Physik kennt man die Funktion, die jedem Zeitpunkt t ∈ [0, T ] bis dahin die gefallene Strecke F (t) zuordnet. Es ist: F : [0s, T ] → R[m], F (t) = 1 2 g·t 2 (freier Fall: Luftwiderstand wird vernachlässigt) 5. Differentialrechnung T : Zeitpunkt des Auftreffens, g = 10m/s2 : Erdschwerebeschleunigung 1 Wir berechnen zunächst T : 1 F (T ) = 20m ⇔ gT 2 = 20m ⇔ T = 2 s 40m = 2s 10m/s2 Insgesamt ist die Durchschnittsgeschwindigkeit des Steins beim Fall also: F (2s) − F (0s) 20m − 0m v [0s, 2s] = = = 10m/s 2s − 0s 2s − 0s Die Endgeschwindigkeit wird aber sicherlich höher sein, da der Stein ja immer schneller wird. Zum Beispiel ist die Durchschnittsgeschwindigkeit zwischen 1−2 Sekunden: F (2s) − F (1s) 20m − 5m = = 15m/s v [1s, 2s] = 2s − 1s 2s − 1s Noch bessere Annäherungen findet man durch: F (2s) − F (1.9s) 20m − 18.05m v [1.9s, 2s] = = = 19, 5m/s 2s − 1.9s 2s − 1.9s F (2s) − F (1.99s) 20m − 19, 8005m v [1.99s, 2s] = = = 19, 95m/s 2s − 1.99s 2s − 1.99s Wir können die Geschwindigkeit v [t, 2s] (für beliebiges t ∈ [0s, 2s)) wie folgt berechnen: F (2s) − F (t) v [t, 2s] = = (2s) − t 1 2g · (2s)2 − 12 g · t2 1 (2s)2 − t2 1 = g· = g·((2s)+t) (2s) − t 2 (2s) − t 2 Nähert man sich mit t ↑ 2s, so nähert sich v [t, 2s] = F (2s)−F (t) (2s)−t der gesuchten (End-)geschwindigkeit an. Es gilt also: vend = v(2s) = lim t↑(2s) F (2s) − F (t) 1 1 = lim g·((2s)+t) = g·(2s+2s) = g·(2s) = 20m/s (2s) − t 2 t↑(2s) 2 Die berechnete Durchschnittsgeschwindigkeit v [t, 2s] (für t ∈ [0s, 2s)) entspricht dabei der Steigung der Geraden durch die Punkte (t, F (t)) und (2s, F (2s)). 1 In Wahrheit ist die Erdschwerebeschleunigung etwa 9, 81m/s2 . Wir vereinfachen den Zahlenwert zu 10. 124 (c) Wir betrachten die Funktion f : R → R, f (x) = x3 − 4x2 + 2x − 1 und interessieren uns für die ’Änderungsrate’ des Funktionswerts an der Stelle a = 3. Zunächst untersuchen wir die mittleren Änderungsraten in den Intervallen [x, 3] (für x < 3) bzw. [3, x] (für x > 3). Diese sind gegeben durch: f (x) − f (3) x−3 f (3) − f (x) = 3−x : Steigung der Geraden durch (x, f (x)) und (3, f (3)) Es ist dabei sinnvoll, x möglichst nahe bei 3 zu wählen. Man berechnet etwa: x 2 2.9 2.99 3 3.01 3.1 4 f (x) −5 −4.451 −4.049501 −4 −3.949499 −3.449 7 f (x)−f (3) x−3 1 4.51 4.9501 nicht def. 5.0501 5.51 3 Der Graph der Funktion f und einige der betrachteten Geraden (Sekanten). 125 5. Differentialrechnung Die Steigung einer solchen Sekante entspricht der mittleren Steigung von f im Intervall [x, 3] bzw. [3, x]. Eigentlich suchen wir aber die Steigung von f an der Stelle 3. Diese entspricht der Steigung der Tangenten an den Graphen von f im Punkt (3, f (3)). Man beachte dabei auch, dass die Tangente an f im Punkt (a, f (a)) die Gerade ist, die die Funktion f ’in der Nähe der Stelle a’ am besten approximiert. 126 Diese Tangentensteigung können wir bestimmen, indem wir die Stelle x beliebig nahe an a = 3 heranbringen. Genauer gesagt, es ist: mtang = lim x→3 f (x) − f (3) x−3 (falls dieser Grenzwert existiert)) Die Berechnung dieses Grenzwerts ist hier nicht allzu schwierig (man benötigt eine Polynomdivision). Es gilt: f (x) − f (3) x3 − 4x2 + 2x − 1 − (−4) x3 − 4x2 + 2x + 3 x→3 = = = x2 −x−1 −→ 5 x−3 x−3 x−3 Also ist die Tangentensteigung (also die momentane Änderungsrate) an der Stelle a = 3 gerade mtang = 5. Definition der Ableitung und erste Methoden zur Berechnung Wir wollen diese Ideen nun präziser formulieren und die momentane Änderungsrate für verschiedene Funktionen einfacher berechnen können. Zunächst geben wir eine exakte Definition an und verwenden dabei den Begriff der Ableitung. Definition 5.2. Sei f : D → R eine Funktion (D ⊂ R) und a ∈ D eine Stelle, die in D \ {a} approximierbar ist. Man sagt: f ist differenzierbar an der Stelle a, falls der Grenzwert f 0 (a) = lim x→a f (x) − f (a) ∈R x−a existiert. Man nennt dann f 0 (a) die Ableitung von f an der Stelle a. Die Funktion f heißt differenzierbar, wenn sie in allen Punkten ihres Definitionsbereiches differenzierbar ist. Bemerkung 5.3. Ist f : D → R differenzierbar in einem Punkt a ∈ D, so ist f 0 (a) die Steigung der Tangenten an den Graphen von f im Punkt (a, f (a)). Die Funktionsgleichung der Tangenten ist also (Punkt-Steigungs-Form): t(x) = f (a) + f 0 (a) · (x − a) (x ∈ R) Man beachte dabei: Die Tangente ist das Polynom vom Grad 1, das die Funktion f ’in der Nähe’ von a am besten annähert. Wir betrachten nun einige Beispiele, dabei befassen wir uns unter anderem mit einigen bestimmten Potenzfunktionen x 7→ xα (α ∈ R fest). Beispiel 5.4. (a) Sei f : R → R, f (x) = c und a ∈ R beliebig. Dann gilt: f (x) − f (a) c−c x→a = = 0 −→ 0 x−a x−a Also ist f differenzierbar und es gilt f 0 (a) = 0 für alle a ∈ R. 127 5. Differentialrechnung (b) Sei f : R → R, f (x) = x und a ∈ R beliebig. Dann gilt: f (x) − f (a) x−a x→a = = 1 −→ 1 x−a x−a Also ist f differenzierbar und es gilt f 0 (a) = 1 für alle a ∈ R. (c) Die Beispiele in (a) und (b) können folgendermaßen verallgemeinert werden: Seien n, m ∈ R fest und f : R → R, f (x) = mx+n. Dann ist f eine Gerade mit Steigung m und y-Achsenabschnitt n. Die Tangente in einem beliebigen Punkt ist die Funktion selbst. Man erwartet also eine Ableitung (Tangentensteigung) von m an jeder Stelle a ∈ R. Tatsächlich gilt: f (x) − f (a) mx + n − (ma + n) x→a = = m −→ m x−a x−a Also ist f differenzierbar und es gilt f 0 (a) = m für alle a ∈ R. (d) Sei f : R → R, f (x) = x2 und a ∈ R beliebig. Dann gilt: x2 − a2 (x − a)(x + a) f (x) − f (a) x→a = = = x + a −→ 2a x−a x−a x−a Also ist f differenzierbar und es gilt f 0 (a) = 2a für alle a ∈ R. (e) Sei f : R → R, f (x) = xn (mit n ∈ N∗ fest) und a ∈ R beliebig. Um die Ableitung zu berechnen, benötigen wir die Formel: n X xn − a n = xk−1 · an−k x−a (x, a ∈ R, x 6= a) k=1 Diese lässt sich wie folgt nachrechnen: Es gilt (x−a)· n X k=1 128 xk−1 ·an−k = n X k=1 xk ·an−k − n X k=1 xk−1 ·an−k+1 = n X k=1 xk ·an−k − n−1 X k=0 xk ·an−k = xn −an und wenn man nun durch (x − a) dividiert, folgt die behauptete Formel. Nun erhalten wir: n X f (x) − f (a) xn − an = = x−a x−a k−1 x · an−k} {z | x→a −→ n · an−1 k=1 x→a k−1 n−k −→ a ·a =an−1 Also ist f differenzierbar und es gilt f 0 (a) = n · an−1 für alle a ∈ R. (f ) Sei f : R \ {0} → R, f (x) = 1 x und a ∈ R \ {0} beliebig. Dann gilt: a−x 1 −1 f (x) − f (a) 1 x→a 1 = x a = xa = − −→ − 2 x−a x−a x−a xa a Also ist f differenzierbar und es gilt f 0 (a) = − a12 für alle a ∈ R \ {0}. √ (g) Sei f : [0, ∞) → R, f (x) = x und a ∈ R beliebig. Dann gilt: √ √ √ √ √ √ f (x) − f (a) x− a x−a 1 ( x − a) · ( x + a) 1 x→a √ √ √ √ =√ √ −→ √ , = = = x−a x−a (x − a) · ( x + a) (x − a) · ( x + a) x+ a 2· a falls a > 0 ist. Also ist f in allen Punkten a ∈ (0, ∞) differenzierbar und es gilt f 0 (a) = 1 √ 2· a für alle a ∈ (0, ∞). Im Punkt a = 0 ist die Wurzelfunktion nicht differenzierbar, denn es gilt: √ 1 x→0 f (x) − f (0) x = = √ −→ ∞ ∈ /R x−0 x x (Die Wurzelfunktion hat eine senkrechte Tangente an den Graphen in 0.) (h) Betrachte die Funktion f : R → R, f (x) = |x|. Wir untersuchen die Differenzierbarkeit an der Stelle a = 0. Für x ∈ R \ {0} gilt ( 1 , falls x > 0 |x| − 0 f (x) − f (0) = = x−0 x−0 −1 , falls x < 0 129 5. Differentialrechnung Der Grenzwert lim x→0 f (x)−f (0) x−0 existiert daher nicht. Entsprechend gibt es keine sinnvolle Tangente an den Graphen der Betragsfunktion in 0. Man kann aber leicht zeigen, dass die Betragsfunktion an allen anderen Stellen a ∈ R \ {0} differenzierbar ist mit: ( f 0 (a) = 1 , falls a > 0 −1 , falls a < 0 Bemerkung 5.5. Es stellt sich auch die Frage nach dem Zusammenhang zwschen Stetigkeit und Differenzierbarkeit einer Funktion. Für eine Funktion f : D → R und a ∈ D gilt: f differenzierbar in a ⇒ f stetig in a Beweis. Ist f differenzierbar in a, so existiert der Grenzwert lim x→a f (x)−f (a) x−a = f 0 (a). Damit folgt für alle x ∈ D \ {a}: f (x) − f (a) = f (x) − f (a) x→a · (x − a) −→ f 0 (a) · (a − a) = 0 x−a Folglich ist: f (x) = f (x) − f (a) + f (a) Somit ist lim x→a, x6=a x→a, x6=a −→ 0 + f (a) = f (a) f (x) = f (a) und damit auch lim f (x) = f (a). Die Stetigkeit von x→a f ist also gezeigt. Somit wissen wir, dass jede differenzierbare Funktion auch stetig ist. Die Umkehrung ist falsch, wie man an Beispiel 5.4 (h) erkennen kann. 130 Nach Beispiel 5.4 sind wir in der Lage, einige elementare Funktionen zu differenzieren (abzuleiten). Unter anderem sind dies die Monome x 7→ xn (n ∈ N). Nun erarbeiten wir uns einige Rechenregeln, um damit auf ’zusammengesetzte’ Funktionen schließen zu können. 5.6. Summen- und Faktorregel (a) Sind f : Df → R und g : Dg → R Funktionen und ist a ∈ Df ∩ Dg eine Stelle, an der sowohl f als auch g differenzierbar sind, so ist auch die Funktion f + g : Df ∩ Dg → R, x 7→ f (x) + g(x) an der Stelle a differenzierbar und es gilt: (f + g)0 (a) = f 0 (a) + g 0 (a) (b) Ist f : Df → R eine Funktion, α ∈ R und ist a ∈ Df eine Stelle, an der f differenzierbar ist, so ist auch die Funktion α · f : Df → R, x 7→ α · f (x) an der Stelle a differenzierbar und es gilt: (α · f )0 (a) = α · f 0 (a) Beweis. (a) Für alle x ∈ Df ∩ Dg mit x 6= a gilt (f + g)(x) − (f + g)(a) x−a = = f (x) + g(x) − f (a) − g(a) x−a f (x) − f (a) g(x) − g(a) + x−a x−a x→a −→ f 0 (a) + g 0 (a) (b) Für alle x ∈ Df mit x 6= a gilt (α · f )(x) − (α · f )(a) α · f (x) − α · f (a) f (x) − f (a) x→a = =α· −→ α · f 0 (a) x−a x−a x−a Mithilfe dieser Regeln kann man nun die Ableitung beliebiger Polynomfunktionen berechnen: Beispiel 5.7. (a) Die Funktion f : R → R, f (x) = −2x10 + 4x8 + 5 ist differenzierbar mit: f 0 (a) = −2 · 10a9 + 4 · 8a7 + 0 = −20a9 + 32 · 7a7 (a ∈ R) 131 5. Differentialrechnung (b) Die Funktion g : R → R, f (x) = x3 + 3x2 − 7x + 2 ist differenzierbar mit: g 0 (a) = 3a2 + 3 · 2a − 7 · 1 + 0 = 3a2 + 6a − 7 (c) Die Funktion p : R → R, p(x) = n P (a ∈ R) ak xk ist differenzierbar mit: k=0 p0 (a) = n X ak · k · ak−1 = k=1 n−1 X ak+1 · (k + 1) · ak k=0 Ist p ein Polynom vom Grad n ≥ 1, so ist also p0 : R → R, x 7→ p0 (x) ein Polynom vom Grad n − 1. Um auch die Ableitung beliebiger rationaler Funktionen berechnen zu können, müssen wir wissen wie man einen Quotienten aus zwei differenzierbaren Funktionen ableiten kann. Dazu benutzt man die sogenannte Quotientenregel, die wir zusammen mit der Produktregel im folgenden Satz angeben. 5.8. Produkt- und Quotientenregel (a) Sind f : Df → R und g : Dg → R Funktionen und ist a ∈ Df ∩ Dg eine Stelle, an der sowohl f als auch g differenzierbar sind, so ist auch die Funktion f · g : Df ∩ Dg → R, x 7→ f (x) · g(x) an der Stelle a differenzierbar und es gilt: (f + g)0 (a) = f 0 (a) · g(a) + f (a) · g 0 (a) (b) Sind f : Df → R und g : Dg → R \ {0} Funktionen und ist a ∈ Df ∩ Dg eine Stelle, an der sowohl f als auch g differenzierbar sind, so ist auch die Funktion f f (x) : Df ∩ Dg → R, x 7→ g g(x) an der Stelle a differenzierbar und es gilt: 0 0 (a)·g 0 (a) f (a) = f (a)·g(a)−f g (g(a))2 Beweis. (a) Für alle x ∈ Df ∩ Dg mit x 6= a gilt (f · g)(x) − (f · g)(a) x−a = = = x→a −→ f (x) · g(x) − f (a) · g(a) x−a f (x) · g(x) − f (x) · g(a) + f (x) · g(a) − f (a) · g(a) x−a g(x) − g(a) f (x) − f (a) f (x) · + g(a) · x−a x−a 0 0 f (a) · g (a) + g(a) · f (a) (man beachte die Stetigkeit von f , vergleiche Bemerkung 5.5) 132 (b) Zunächst untersuchen wir die Funktion 1 g : Dg → R, x 7→ barkeit. Für a ∈ Dg und alle x ∈ Dg mit x 6= a gilt 1 1 1 1 g (x) − g (a) g(x) − g(a) = x−a x−a g(a) − g(x) 1 · = g(x) · g(a) x−a 1 g(x) − g(a) = − · g(x) · g(a) x−a 1 g(x) x→a auf Differenzier- −→ − 1 2 (g(a)) · g 0 (a) (man beachte die Stetigkeit von g) Damit ist gezeigt, dass die Funktion 1 g differenzierbar ist mit: 0 g 0 (a) 1 (a) = − 2 g (g(a)) Nun ist f g folgt, dass = f· f g 1 g (a ∈ Dg ) und wir können die Produktregel (Teil (a)) anwenden. Es differenzierbar ist mit: 0 f (a) g 0 1 1 = f (a) · (a) + f (a) · (a) g g f 0 (a) f (a) · g 0 (a) = − 2 g(a) (g(a)) 0 = f 0 (a) · g(a) − f (a) · g 0 (a) (g(a)) 2 (a ∈ Df ∩ Dg ) Beispiel 5.9. (a) Sei f : R → R, f (x) = (x2 − 4) · (−3x + 2). Wir können die Ableitung nun auf zwei verschiedene Arten berechnen: • Ausmultiplizieren: f (x) = −3x3 + 2x2 + 12x − 8 ⇒ f 0 (a) = −9a2 + 4a + 12 (a ∈ R) • Produktregel: f 0 (a) = 2a · (−3a + 2) + (a2 − 4) · (−3) = −9a2 + 4a + 12 (a ∈ R) (b) Sei g : R → R, g(x) = 1 x2 +x+5 . Mit der Quotientenregel (bzw. mit dem Spezial- fall aus dem Beweis) folgt: g 0 (a) = − (c) Sei h : R \ {−1} → R, h(x) = h0 (a) = 2a + 1 (a2 + a + 5)2 6x2 −3 x3 +1 . (a ∈ R) Mit der Quotientenregel folgt: 12a · (a3 + 1) − (6a2 − 3) · 3a2 −6a4 + 9a2 + 12 = (a3 + 1)2 (a3 + 1)2 (a ∈ R \ {−1}) 133 5. Differentialrechnung (d) Ist α ∈ Z mit α < 0, so ist die Funktion f : R \ {0} → R, f (x) = xα = 1 x−α nach der Quotientenregel differenzierbar mit f 0 (a) = − −α · x−α−1 (x−α ) Beispielsweise ist für f (x) = 1 x6 2 = α · xα−1 (x ∈ R \ {0}) = x−6 die Ableitung gegeben durch: f 0 (x) = −6x−7 = − 6 x7 (x ∈ R \ {0}) Wir wollen nun auch die Ableitung für weitere uns bekannte Funktionen bestimmen. Für die Exponentialfunktion führen wir dazu eine explizite Rechnung durch. 5.10. Ableitung der Exponentialfunktion Wir berechnen zunächst die Ableitung der Exponentialfunktion an der Stelle a = 0. Dazu benutzen wir die folgende Ungleichung (die wir hier nicht beweisen wollen). Es gilt: exp(x) − 1 − 1 ≤ |x| · exp |x| x (x ∈ R \ {0}) Wegen lim (|x| · exp |x|) = |0| · exp |0| = 0 (die Funktion x 7→ |x| · exp |x| ist stetig) x→0 folgt aus dieser Ungleichung, dass auch lim exp(x)−1 − 1 = 0 sein muss (man x x→0 benutze dazu den Einschließungssatz 2.10 bzw. Folgerung 2.12). Also ist lim x→0 exp(x) − exp(0) =1 x−0 und somit ist exp in a = 0 differenzierbar mit exp0 (0) = 1. Nun betrachten wir eine beliebige Stelle a ∈ R. Dann gilt für alle x ∈ R \ {a} (man beachte: für x → a hat man y = x − a → 0): exp(x) − exp(a) x−a = x→a −→ exp(x − a) − exp(0) x−a−0 exp(y) − exp(0) exp(a) · lim = exp(a) · exp0 (0) = exp(a) y→0 y−0 exp(a) · Somit ist die Exponentialfunktion differenzierbar und es gilt: exp0 (a) = exp(a) (a ∈ R) Wir wollen nun auch die trigonometrischen Funktionen auf Differenzierbarkeit prüfen. Die Logarithmusfunktion sowie allgemeine Potenz und Logarithmusfunktionen studieren wir später im Zusammenhang mit der Kettenregel. 5.11. Ableitungen der trigonometrischen Funktionen Ohne Beweis geben wir die Ableitung von sin und cos an. Beide Funktionen sind differenzierbar und es gilt: sin0 (a) = cos(a) 134 und cos0 (a) = − sin(a) (a ∈ R) Mit der Quotientenregel können wir nun auch die Ableitung von tan = sin cos berech- nen. Die Tangensfunktion ist differenzierbar und es gilt: tan0 (a) = sin2 (a) + cos2 (a) 1 sin0 (a) · cos(a) − sin(a) · cos0 (a) = = 2 2 cos (a) cos (a) cos2 (a) (a ∈ Dtan ) Durch die Kenntnis dieser Ableitungen können wir nun schon für relativ viele Funktionen die Ableitung berechnen. Wir geben einige kompliziertere Beispiele an. Beispiel 5.12. (a) Sei f : R → R, f (x) = exp(x) · x3 . Nach der Produktregel ist f differenzierbar: f 0 (a) = exp(a) · a3 + exp(a) · 3a2 = exp(a) · (a3 + 3a2 ) (b) Sei g : R \ {0} → R, g(x) = sin(x) x . (a ∈ R) Nach der Quotientenregel ist g differenzier- bar: g 0 (a) = cos(a) · a − sin(a) · 1 cos(a) sin(a) = − a2 a a2 (a ∈ R \ {0}) Kettenregel und Ableitung der Umkehrfunktion Zur Berechnung von Ableitungen fehlt uns noch die sogenannte Kettenregel. Sie gibt an, wie die Ableitung einer Hintereinanderausführung zweier Funktionen bestimmt werden kann. 5.13. Kettenregel Seien f : D → R und g : D0 → R Funktionen mit f (D) ⊂ D0 . Ist a ∈ D, so dass f in a differenzierbar ist und g in f (a) differenzierbar ist. Dann ist g ◦ f in a differenzierbar und es gilt: 0 (g ◦ f ) (a) = g 0 (f (a)) · f 0 (a) Sind f und g differenzierbar, so ist also g ◦ f ebenfalls differenzierbar und es gilt: (g ◦ f )0 = (g 0 ◦ f ) · f 0 Beweis. (Skizze) Für x ∈ D mit x 6= a gilt (falls f (x) 6= f (a) ist1 ): (g ◦ f )(x) − (g ◦ f )(a) g(f (x)) − g(f (a)) g(f (x)) − g(f (a)) f (x) − f (a) = = · x−a x−a f (x) − f (a) x−a Für x → a hat man: • 1 Dies f (x)−f (a) x−a → f 0 (a) ist nicht unbedingt immer der Fall, denn f muss ja nicht injektiv sein. Ein ausführlicher Beweis müsste dies berücksichtigen 135 5. Differentialrechnung • f (x) → f (a) (denn f ist stetig) ⇒ (Satz 4.13) lim x→a g(f (x)) − g(f (a)) g(y) − g(f (a)) = lim = g 0 (f (a)) f (x) − f (a) y − f (a) y→f (a) Zusammen folgt die Behauptung. Mithilfe der Kettenregel können wir weitere Funktionen differenzieren. Wir betrachten einige Beispiele: Beispiel 5.14. (a) Sei f : R → R, f (x) = cos(3x + 5). Nach der Kettenregel ist f differenzierbar: f 0 (a) = − sin(3a + 5) · 3 = −3 sin(3a + 5) (a ∈ R) (b) Sei g : R → R, g(x) = exp(−x2 ). Nach der Kettenregel ist g differenzierbar: g 0 (a) = exp(−a2 ) · (−2a) (a ∈ R) 5.15. Ableitung der Umkehrfunktion Wir betrachten eine bijektive Funktion f : D → W (mit D, W ⊂ R) und eine Stelle a ∈ D, an der f differenzierbar ist. Es stellt sich die Frage nach der Differenzierbarkeit der Umkehrfunktion f −1 : W → D an der Stelle f (a) ∈ W . Falls f −1 in f (a) differenzierbar ist, so gilt nach der Kettenregel: 0 0 f −1 (f (a)) · f 0 (a) = f −1 ◦ f (a) = 1 (denn es ist ja f −1 ◦ f (x) = x für x ∈ D) Damit ist klar, dass f −1 nicht in a differenzierbar sein kann, wenn f 0 (a) = 0 ist. Ist jedoch f 0 (a) 6= 0, so kann man in der Tat zeigen, dass dann f −1 tatsächlich in a differenzierbar ist und dass damit die Formel 0 f −1 (f (a)) = 1 f 0 (a) (a ∈ D mit f 0 (a) 6= 0) gilt. Man beachte, dass man dies (mit b = f (a)) wie folgt umformulieren kann: 0 f −1 (b) = 1 f 0 (f −1 (b)) b ∈ W mit f 0 f −1 (b) 6= 0 Wir wollen den Beweis hier (formal) nicht ausführen, die Formel aber wie folgt begründen: Der Graph von f −1 geht aus dem Graphen von f durch Spiegelung an der ersten Winkelhalbierenden hervor. Falls f an einer Stelle a differenzierbar mit Ableitung f 0 (a) 6= 0 ist, so hat f im Punkt (a, f (a)) die Tangentensteigung m = f 0 (a). Die Tangente an den gespiegelten Graphen im Punkt (f (a), a) ist natürlich die gespiegelte Tangente. Wenn man aber eine Gerade mit Steigung m 6= 0 an der ersten Winkelhalbierenden spiegelt, erhält man eine Gerade mit Steigung 136 1 m. Daher ist 0 f −1 (f (a)) = 1 m = 1 f 0 (a) . Wir veranschaulichen dies an der Funtkion f : R → (0, ∞), f (x) = exp(2x−4) und f −1 : (0, ∞) → R, f −1 (y) = ln y +2 2 Dann ist f (x) = 2 exp(2x − 4) (Kettenregel). Wir betrachten die Stelle a = 2. Dann 0 ist f (a) = 1 und f 0 (a) = 2. Im Punkt (2, 1) hat f also eine Tangente mit Steigung m = f 0 (a) = 2 6= 0. Somit hat f −1 im Punkt (1, 2) eine Tangente mit Steigung 1 m = 12 . Es folgen einige weitere Beispiele: • Die Funktion f : [0, ∞) → [0, ∞), f (x) = x2 ist bijektiv und differenzierbar (in allen Stellen des Definitionsbereiches). Die Umkehrfunktion ist die Wurzelfunktion: √ √ f −1 = · : [0, ∞) → [0, ∞), f −1 (y) = y Für x ∈ [0, ∞) gilt f 0 (x) = 2x. Für y ∈ (0, ∞) gilt damit f 0 f −1 (y) = 6 0 und folglich: 1 1 1 = 0 √ = √ f 0 (f −1 (y)) 2 · y f y f −1 (y) = 0 und damit ist f −1 an der Stelle 0 nicht 0 f −1 (y) = Für y = 0 ist jedoch f 0 differenzierbar (dies entspricht dem Ergebnis aus Beispiel 5.4 (g)). • Die Logarithmusfunktion ln : (0, ∞) → R ist die Umkehrfunktion der Exponentialfunktion exp : R → (0, ∞). Wegen exp0 (x) = exp(x) 6= 0 (x ∈ R) 137 5. Differentialrechnung ist ln auf (0, ∞) differenzierbar und es gilt: ln0 (y) = 1 1 1 = = exp0 (ln(y)) exp (ln(y)) y (y ∈ (0, ∞)) Da wir nun auch die Ableitung der Logarithmusfunktion kennen, können wir (mit der Kettenregel) auch die Ableitung allgemeiner Potenz- und Exponentialfunktionen bestimmen. Beispiel 5.16. (a) Sei r ∈ R fest und sei f : (0, ∞) → R, x 7→ xr = exp (r · ln x) . Nach der Kettenregel ist f differenzierbar mit: f 0 (x) = exp (r · ln x) · r r = xr · = r · xr−1 x x (x ∈ (0, ∞)) 5 Beispielsweise hat also die Funktion f1 (x) = x 2 an einer Stelle x ∈ (0, ∞) die Ableitung f1 0 (x) = 5 2 3 · x2 . 7 Entsprechend hat die Funktion f2 (x) = x− 3 an einer Stelle x ∈ (0, ∞) die 10 Ableitung f2 0 (x) = − 73 · x− 3 . (b) Sei a ∈ (0, ∞) fest und sei g : R → R, x 7→ ax = exp (x · ln a) . Nach der Kettenregel ist g differenzierbar mit: g 0 (x) = exp (x · ln a) · ln a = ax · ln a (x ∈ R) Beispielsweise hat also die Funktion g1 (x) = (8e)x an einer Stelle x ∈ R die Ableitung g1 0 (x) = (8e)x · ln(8 · e) = (8e)x · (ln 8 + 1). (c) Die Funktion h : (0, ∞) → R, h(x) = xx = exp (x · ln x) ist nach Ketten- und Produktregel differenzierbar mit 1 h0 (x) = exp (x · ln x) · 1 · ln x + x · = xx · (ln x + 1) x Es gilt also insbesondere h0 1 e = 0. Die Funktion h hat also an der Stelle eine zur x-Achse parallele Tangente. 138 (x ∈ (0, ∞)) 1 e Hier sieht man bereits, dass die Funktion an der Stelle, an der die Ableitung = 0 ist, ein Extremum (hier Minimum) annimmt. Dies muss jedoch nicht immer so sein. Die genauen Zusammenhänge erarbeiten wir im folgenden Abschnitt. Wir schließen diesen Abschnitt mit der Bemerkung, dass die Ableitung einer differenzierbaren Funktion selbst wieder eine Funktion ist, die man gegebenenfalls wieder ableiten kann. 5.17. Höhere Ableitungen Ist f : D → R, x 7→ f (x) differenzierbare, so ist f 0 : D → R, x 7→ f 0 (x) ebenfalls eine Funktion. Falls f 0 wiederum differenzierbar ist, so sagt man, dass f zweimal differenzierbar ist und schreibt f 00 (x) für die Ableitung von f 0 an einer Stelle a ∈ D. Dies lässt sich beliebig fortführen, falls die mehrfachen Ableitungen von f immer wieder differenzierbar sind. Man schreibt auch f (k) für die k-te Ableitung von f (k ∈ N∗ ). Beispielsweise betrachten wir f : R → R, f (x) = exp(−x2 ). Dann gilt für alle x ∈ R: f 0 (x) = exp(−x2 ) · (−2x) f 00 (x) = exp(−x2 ) · (4x2 − 2) f 000 (x) = exp(−x2 ) · (−8x3 + 12x) f (4) (x) = exp(−x2 ) · (16x4 − 48x2 + 12) ••• 139 5. Differentialrechnung Extremstellen und Monotonieverhalten Wir kommen nun zu einigen der (vielfältigen) Anwendungen der Differentialrechnung. Wir behandeln in diesem Abschnitt Kriterien für das Vorhandensein von lokalen Extremstellen und kommen dann (über den sogenannten Mittelwertsatz) zur Bestimmung der Monotonieintervalle für differenzierbare Funktionen. Wir beginnen mit der Definition des Begriffs der (globalen/lokalen) Extremstelle. Definition 5.18. Sei D ⊂ R und f : D → R eine Funktion. Eine Stelle a ∈ D heißt • globale Maximumstelle von f , falls f (a) ≥ f (x) für alle x ∈ D gilt. • globale Minimumstelle von f , falls f (a) ≤ f (x) für alle x ∈ D gilt. • lokale Maximumstelle von f , falls ein δ > 0 existiert mit f (a) ≥ f (x) für alle x ∈ D mit |x − a| < δ. • lokale Minimumstelle von f , falls ein δ > 0 existiert mit f (a) ≤ f (x) für alle x ∈ D mit |x − a| < δ. • globale/lokale Extremstelle von f , falls a eine globale/lokale Maximumstelle oder eine globale/lokale Minimumstelle von f ist. Bemerkung 5.19. (a) Sagt man einfach Extremstelle (bzw. Minimumstelle oder Maximumstelle), so ist normalerweise eine globale Extremstelle gemeint. (b) Ist a eine lokale/globale Extremstelle von f , so nennt man den Punkt (a, f (a)) auch lokales/globales Extremum (Minimum bezw. Maximum). (c) Jede globale Extremstelle ist natürlich auch eine lokale Extremstelle. (d) Eine lokale Extremstelle a von f ist eine globale Extremstelle der eingeschränkten Funktion D ∩ (a − δ, a + δ) → R, x 7→ f (x) für ein geeignetes δ > 0. (e) Im allgemeinen muss eine Funktion nicht unbedingt Extremstellen haben. Wir wissen allerdings nach Satz 4.28, dass jede stetige Funktion f : [a, b] → R (minestens) eine globale Minimumstelle und (mindestens) eine globale Maximumstelle besitzt. (f ) Ist f : I → R streng monoton auf einem Intervall I, so befinden sich im Inneren von I keine lokalen Extremstellen von f . Gehören die Randpunkte von I zum Intervall dazu, so sind sie globale Extremstellen. Beispiel 5.20. (a) Die Funktion f : R → R, f (x) = x4 hat ein globales Minimum in (0, 0) (denn es ist f (x) ≥ f (0) für alle x ∈ R). Es existieren keine weiteren lokalen Extrem- 140 stellen, insbesondere gibt es kein globales Maximum. (b) Die Funktion g : R → R, g(x) = −|x2 − 4| + x 2 hat folgenden Graphen: Man erkennt, dass −2 eine lokale (aber keine globale) Maximumstelle ist (man kann zum Beispiel δ = 3 (oder kleiner) wählen, δ = 4 wäre aber ungeeignet). Weiterhin ist − 41 eine lokale (keine globale) Minimumstelle (δ = 2 ist möglich) und 2 ist eine globale Maximustelle. Eine globale Minimumstelle existiert nicht. √ (c) Die Funktion h : [0, ∞), h(x) = x · cos(πx) hat folgenden Graphen: 141 5. Differentialrechnung Man erkennt, dass die Funktion in allen ungeraden a ∈ N∗ lokale Minimumstellen hat und in allen geraden a ∈ N∗ lokale Maximumstellen hat. Außerdem ist 0 eine weitere lokale Minimumstelle und im Intervall (0, 0.5) befindet sich eine weitere lokale Maximustelle. Globale Extremstellen existieren nicht. Wir betrachten nun die Tangenten an den Funktionsgraphen in den lokalen Extremstellen a aus den vorigen Beispielen. Dies ist nur dann möglich, wenn die Funktion an der Stelle a differenzierbar ist. Ist dies der Fall, so beobachtet man stets (wenn a kein Randpunkt des Definitionsbereiches ist), dass die Tangente parallel zur xAchse verläuft. Dies bedeutet, dass die Steigung der Tangenten = 0 sein muss, oder (anders gesagt) dass f 0 (a) = 0 gilt. Dies führt uns zu folgendem Satz. Satz 5.21. (Notwendiges Kriterium für lokale Extremstellen) Sei D ⊂ R und f : D → R eine Funktion. Falls a ∈ D eine Stelle im Inneren von D ist (d.h. es existiert ein δ > 0 mit (a − δ, a + δ) ⊂ D) und f in a differenzierbar ist, so gilt das folgende (notwendige) Kriterium für das Vorhandensein einer lokalen Extremstelle: a ist lokale Extremstelle von f ⇒ f 0 (a) = 0 Beweis. Nehmen wir an, dass a eine lokale Maximumstelle von f ist. Dann gibt es also eine Zahl δ > 0 mit f (x) ≤ f (a) für alle (a − δ, a + δ). Da f differenzierbar ist, gilt außerdem: lim x↑a f (x) − f (a) = f 0 (a) x−a und lim x↓a f (x) − f (a) = f 0 (a) x−a Nun gilt: • Für den Grenzwert x ↑ a betrachtet man x ∈ (a − δ, a). Für diese x gilt: f (x) ≤ f (a) und x < a ⇒ f (x) − f (a) ≤0 x−a (a) Folglich ist auch f 0 (a) = lim f (x)−f ≤ 0. x−a x↑a • Für den Grenzwert x ↓ a betrachtet man x ∈ (a, a + δ). Für diese x gilt: f (x) ≤ f (a) und x > a ⇒ f (x) − f (a) ≥0 x−a (a) Folglich ist auch f 0 (a) = lim f (x)−f ≥ 0. x−a x↑a 0 Zusammen folgt f (a) = 0, wie behauptet. Bemerkung 5.22. (a) Die Umkehrung von Satz 5.21 ist im allgemeinen falsch. Beispielsweise hat die Funktion f : R → R, x 7→ x3 keine lokalen Extremstellen (denn die Funktion 142 ist auf ganz R streng monoton wachsend). Allerdings ist f 0 (x) = 3x2 (x ∈ R) und damit ist f 0 (0) = 0. Im Punkt (0, 0) liegt daher eine waagerechte Tangente vor, der Punkt ist aber kein Extrempunkt.1 (b) Es ist durchaus möglich, dass eine Funktion an einer lokalen Extremstelle a ∈ D nicht differenzierbar ist (und demzufolge kann auch f 0 (a) = 0 nicht gelten). Man betrachte beispielsweise die Betragsfunktion, die an der Stelle a = 0 sogar ein globales Minimum hat (es ist |x| ≥ |0| für alle x ∈ R), dort aber nicht differenzierbar ist. (c) Für Randpunkte ist das Kriterium aus Satz 5.21 ebenfalls nicht anwendbar. Man betrachte beispielsweise die Funktion f : [0, ∞) → R, x 7→ −2x − 5. Dann hat f ein globales Maximum im Punkt (0, −5), es gilt allerdings f 0 (0) = −2 6= 0. Satz 5.21 ist sehr gut geeignet, um mögliche Extremstellen zu bestimmen. Der Satz garantiert, dass lokale (und damit auch globale) Extremstellen differenzierbarer Funktionen (wenn überhaupt) nur an Stellen mit Ableitung = 0 oder an Randstellen liegen können. Wir geben dazu einige Beispiele: Beispiel 5.23. (a) Betrachte die Funktion: f : R → R, h(x) = 1 5 7 4 1 3 27 2 x + x + x − x + 18x − 4 5 4 3 2 Dann ist f auf ganz R differenzierbar mit: f 0 (x) = x4 + 7x3 + x2 − 27x + 18 = (x − 1)2 · (x + 3) · (x + 6) 1 Einen (x ∈ R) solchen Punkt bezeichnet man als Sattelpunkt. 143 5. Differentialrechnung Es gilt also: f 0 (x) = 0 ⇔ x ∈ {−6, −3, 1} An den Stellen −6, −3, 1 hat die Funktion f also eine waagerechte Tangente. Damit kommen nur diese Stellen überhaupt als Extremstellen in Frage (Randstellen gibt es hier nicht). Betrachtet man den Graphen von f , so stellt man fest, dass −6 eine lokale Maximustelle, −3 eine lokale Minimumstelle und 1 keine lokale Extremstelle ist. (b) Die Funktion g : R → R, g(x) = exp(x) x2 + 34 ist auf ganz R differenzierbar mit g 0 (x) = exp(x) · (x2 + 34 − 2x) 2 x2 + 34 (x ∈ R) Damit ist g 0 (x) = 0 ⇔ x2 + Damit kommen nur die Stellen 1 3 3 − 2x = 0 ⇔ x = ∨ x= 4 2 2 1 2 und 3 2 als lokale Extremstellen in Frage. Be- trachtet man den Graphen der Funktion, so stellt man fest, dass Maximumstelle ist und 144 3 2 eine lokale Minimumstelle ist: 1 2 eine lokale Wir sind nun in der Lage für differenzierbare Funktionen alle (inneren) Stellen, an denen die Ableitung 6= 0 ist, als Extremstellen auszuschließen (damit sind im Normalfall nur noch wenige mögliche Extremstellen zu untersuchen). Falls jedoch f 0 (a) = 0 ist, so brauchen wir weitere Kriterien, um festzustellen, ob es sich tatsächlich um eine lokale Extremstelle handelt. Dazu wollen wir Monotonieuntersuchungen mit Hilfe der Ableitung anstellen. Dafür brauchen wir zunächst den Mittelwertsatz, der auch an sich interessant ist. Er besagt, dass zu jeder Sekante einer differenzierbaren Funktion eine parallele Tangente existiert (wenn das Intervall zwischen den ’Sekantenpunkten’ ganz zum Definitionsbereich gehört). Satz 5.24. (Mittelwertsatz) Sei f : D → R eine differenzierbare Funktion und seien a, b ∈ D mit a < b und [a, b] ⊂ D. Dann gilt: (a) Ist f (a) = f (b), so existiert eine Stelle x ∈ [a, b] mit f 0 (x) = 0. (b) Es existiert immer eine Stelle x ∈ [a, b] mit: f 0 (x) = f (b) − f (a) b−a Bevor wir den Satz beweisen, wollen wir ihn kurz in der folgenden Bemerkung erläutern. Bemerkung 5.25. (a) Die Aussage in Teil (a) von Satz 5.24 ist ein Spezialfall von Teil (b) und wird zum Beweis benötigt. Man bezeichnet Teil (a) als den Satz von Rolle und Teil (b) als den (ersten) Mittelwertsatz. 145 5. Differentialrechnung (b) Der Mittelwertsatz besagt, dass man (wenn [a, b] ⊂ Df ist) immer eine zur Sekante durch (a, f (a)) und (b, f (b)) parallele Tangente im Bereich [a, b] an den Graphen von f legen kann. Wir veranschaulichen dies an folgendem Graphen: (c) Der Mittelwertsatz kann verallgemeinert werden, indem man die Voraussetzung der Differenzierbarkeit wie folgt abschwächt: Es genügt, dass f in allen Punkten aus (a, b) differenzierbar ist und in den Punkten a und b noch stetig ist. Der √ Satz ist also beispielsweise auch für die Wurzelfunktion · und die Punkte a = 0 √ und b > 0 anwendbar, obwohl · in 0 nicht differenzierbar ist. Beweis. (von Satz 5.24) (a) Nach Bemerkung 5.5 ist f auch stetig und folglich nimmt f auf [a, b] Minimum und Maximum an (siehe Satz 4.28). • Falls beide in den Randpunkten a und b angenommen werden, ist f wegen f (a) = f (b) auf [a, b] konstant und dann ist die Ableitung sogar in allen Punkten aus (a, b) konstant = 0. • Ansonsten werden Minimum oder Maximum von f auf [a, b] (oder beide) in (a, b) angenommen. Damit gibt es auf jeden Fall eine lokale Extremstelle von f im Inneren, dort muss die Ableitung (nach Satz 5.21) den Wert 0 haben. (b) Es sei λ = f (b)−f (a) b−a die Sekantensteigung. Man betrachte die Hilfsfunktion: g : D → R, g(x) = f (x) − λx 146 Nach Summen- und Faktorregel ist auch g differenzierbar mit: g 0 (x) = f 0 (x) − λ (x ∈ D) Außerdem gilt g(b) − g(a) = f (b) − λ · b − (f (a) − λ · a) = f (b) − f (a) − λ · (b − a) = 0 und folglich ist g(a) = g(b). Wir können also Teil (a) auf die Funktion g anwenden und somit folgern, dass eine Stelle x ∈ (a, b) mit g 0 (x) = 0 existiert. Damit ist aber f 0 (x) = λ, wie behauptet. Der Mittelwertsatz hat zahlreiche Anwendungen. Man kann damit beispielsweise zeigen, dass nur die konstante Funktion die Ableitung 0 hat. Wir leiten auch (exemplarisch) einige Ungleichungen mit dem Mittelwertsatz her, und führen Monotonieuntersuchungen für differenzierbare Funktionen durch. Folgerung 5.26. Ist I ⊂ R ein Intervall und f : I → R eine differenzierbare Funktion mit f 0 (x) = 0 für alle x ∈ I, so ist die Funktion f konstant. Beweis. Wäre f nicht konstant, so gäbe es a, b ∈ I mit f (a) 6= f (b). Nach dem Mittelwertsatz (beachte [a, b] ⊂ I) gäbe es dann aber eine Stelle x ∈ (a, b) bzw. x ∈ (b, a) mit f 0 (x) = f (b) − f (a) 6= 0, b−a was nach Voraussetzung nicht sein kann. Folgerung 5.27. • Es gilt ln(y) ≤ y − 1 für alle y ∈ (0, ∞) Beweis. Falls y = 1 ist, so ist die Ungleichung klar (0 ≤ 0). Ist y > 1, so wenden wir den Mittelwertsatz auf die Funktion ln und die Stellen a = 1 und b = y an und folgern: Es gibt eine Stelle x ∈ (1, y) mit: 1 ln(y) − ln(1) = ln0 (x) = ≤ 1 y−1 x Durch Multiplikation mit y − 1 (> 0) folgt (beachte ln(1) = 0) die behauptete Ungleichung. Es bleibt der Fall, dass 0 < y < 1 ist. Wir verwenden erneut den Mittelwertsatz mit der Funktion ln, diesmal mit a = y und b = 1 und erhalten eine Stelle x ∈ (y, 1) mit: ln(1) − ln(y) 1 = ln0 (x) = ≥ 1 1−y x 147 5. Differentialrechnung Durch Multiplikation mit y − 1 (< 0) folgt die behauptete Ungleichung. • Es gilt | sin y| ≤ |y| für alle y ∈ R. Beweis. Ist y 6= 0 (für y = 0 ist die Ungleichung klar), so existiert nach dem Mittelwertsatz eine Stelle x ∈ R (genauer x ∈ (0, y) bzw. x ∈ (y, 0)) mit: sin(y) − sin(0) = sin0 (x) = cos(x) y−0 Wegen sin(0) = 0 folgt: sin(y) y = |cos(x)| ≤ 1 und durch Multiplikation mit |y| folgt die behauptete Ungleichung. • Es gilt: exp(x)(y − x) < exp(y) − exp(x) < exp(y) · (y − x) (x, y ∈ R mit x < y) Beweis. Nach dem Mittelwertsatz existiert eine Stelle t ∈ (x, y) mit: exp(y) − exp(x) = exp0 (t) = exp(t) y−x Wegen der (strengen) Monotonie der Exponentialfunktion folgt nun aber: exp(x) < exp(t) < exp(y) und folglich exp(x) < exp(y) − exp(x) < exp(y) y−x Durch Multiplikation mity − x folgt die behauptete Ungleichung. Mit Hilfe des Mittelwertsatzes folgt ein bekanntes Kriterium über das Monotonieverhalten von Funktionen mit Hilfe der Ableitung. Satz 5.28. (Kriterium für Monotonie) Ist f : D → R eine differenzierbare Funktion und I ⊂ D ein Intervall. Wir bezeichnen mit I ◦ das Innere von I, also das offene Intervall, mit denselben Grenzen, die auch I hat. Dann gilt: • Ist f 0 (x) > 0 für alle x ∈ I ◦ , so ist f streng monoton wachsend auf I. • Ist f 0 (x) < 0 für alle x ∈ I ◦ , so ist f streng monoton fallend auf I. Beweis. Gelte f 0 (x) > 0 für alle x ∈ I ◦ . Angenommen f Wäre nicht streng monoton wachsend auf I. Dann gäbe es a, b ∈ I mit a < b und f (a) ≥ f (b). Nach dem Mittelwertsatz gibt es aber eine Stelle x ∈ (a, b) (damit gilt auch x ∈ I ◦ ) mit: 0≥ 148 f (b) − f (a) = f 0 (x) > 0 b−a Dies kann nicht sein, also muss f doch streng monoton wachsend sein. (Die zweite Aussage lässt sich analog beweisen). Nun können wir Monotonieintervalle differenzierbarer Funktionen bestimmen (sofern wir das Vorzeichen der Ableitung bestimmen können). Es betrachten erneut die Beispiele aus 5.23 (und einige weitere). Beispiel 5.29. (a) Für f : R → R, h(x) = 1 5 7 4 1 3 27 2 x + x + x − x + 18x − 4 5 4 3 2 ist: f 0 (x) = x4 + 7x3 + x2 − 27x + 18 = (x − 1)2 · (x + 3) · (x + 6) (x ∈ R) Nun stellen wir fest: • Für x ∈ (−∞, −6) ist f 0 (x) > 0. Folglich ist f streng monoton wachsend auf (−∞, −6]. • Für x ∈ (−6, −3) ist f 0 (x) < 0. Folglich ist f streng monoton fallend auf [−6, −3]. • Für x ∈ (−3, 1) ist f 0 (x) > 0. Folglich ist f streng monoton wachsend auf [−3, 1]. • Für x ∈ (1, ∞) ist f 0 (x) > 0. Folglich ist f streng monoton wachsend auf [1, ∞). • Aus den letzten beiden Aussagen lässt sich folgern, dass f streng monoton wachsend auf [−3, ∞) ist (denn 1 gehört zu beiden Intervallen). Man erkennt hier also bereits, dass es in einem Intervall, in dem eine differen zierbare Funktion streng monoton ist hier [−3, ∞) durchaus (isolierte) Stellen geben kann, an denen die Ableitung = 0 ist hier die Stelle 1 . In Satz 5.28 gelten also die Umkehrungen nicht. (Wir werden dies später nochmals präzisieren.) (b) Für g : R → R, g(x) = exp(x) x2 + 43 ist: g 0 (x) = exp(x) · (x2 + 34 − 2x) exp(x) 1 3 = · x − · x − 2 2 2 2 x2 + 34 x2 + 43 (x ∈ R) Damit folgt: • Für x ∈ −∞, 12 ist g 0 (x) > 0. Folglich ist g streng monoton wachsend auf (−∞, 12 ]. 149 5. Differentialrechnung • Für x ∈ 1 3 2, 2 ist g 0 (x) < 0. Folglich ist g streng monoton fallend auf [ 12 , 32 ]. • Für x ∈ 32 , ∞ ist g 0 (x) > 0. Folglich ist g streng monoton wachsend auf [ 23 , ∞). (c) Für die Funktion h : R \ {0} → R, x 7→ 1 x gilt h0 (x) = − x12 < 0 (x ∈ R \ {0}). Folglich ist h streng monoton fallend auf (−∞, 0) und auch streng monoton fallend auf (0, ∞). Man beachte, dass h nicht streng monoton auf R\{0} ist. Die Voraussetzung, dass I ein Intervall und eine Teilmenge des Definitionsbereich ist, ist in Satz 5.28 also unverzichtbar. (d) Für i : R \ {−1, 1} → R, i(x) = x5 x4 − 1 ist (nach der Quotientenregel): i0 (x) = x8 − 5x4 5x4 · (x4 − 1) − 4x3 · x5 = (x4 − 1)2 (x4 − 1)2 (x ∈ R \ {−1, 1}) Das Vorzeichen von i0 (x) wird durch den Zähler bestimmt, da der Nenner immer positiv ist. Man berechnet: √ √ √ √ √ 4 4 x8 −5x4 = x4 ·(x4 −5) = x4 · x2 − 5 · x2 + 5 = x4 · x − 5 · x + 5 · x2 + 5 Es ist also: n √ o √ 4 4 i0 (x) = 0 ⇔ x ∈ − 5, 0, 5 Weiterhin folgt: √ • Für x ∈ −∞, − 4 5 ist i0 (x) > 0. √ Folglich ist i streng monoton wachsend auf (−∞, − 4 5]. √ • Für x ∈ − 4 5, −1 ist i0 (x) < 0. √ Folglich ist i streng monoton fallend auf [− 4 5, 1). • Für x ∈ (−1, 0) ist i0 (x) < 0. Folglich ist i streng monoton falllend auf (−1, 0]. • Für x ∈ (0, 1) ist i0 (x) < 0. Folglich ist i streng monoton falllend auf [0, 1). • Aus den letzten beiden Punkten folgt, dass i streng monoton falllend auf (−1, 1) ist. • Für x ∈ 1, √ 4 5 ist i0 (x) < 0. Folglich ist i streng monoton fallend auf (1, √ • Für x ∈ 4 5, ∞ ist i0 (x) > 0. √ 4 5]. √ Folglich ist i streng monoton wachsend auf [ 4 5, ∞). 150 √ Damit können wir auch schließen, dass − 4 5 eine lokale Maximustelle, 0 keine √ lokale Extremstelle und 4 5 eine lokale Minimumstelle ist. Zusammen mit den Grenzwerten: lim i(x) = −∞, x→−∞ lim i(x) = −∞, x↑1 lim i(x) = −∞, x↑−1 lim i(x) = ∞, x↓1 lim i(x) = ∞ x↓−1 lim i(x) = ∞ x→∞ ergibt sich schon eine (qualitativ) recht genaue Vorstellung vom Graphen der Funktion: Bemerkung 5.30. (a) Wir hatten zuvor die Frage gestellt, wie man für eine Nullstelle der Ableitung entscheiden kann, ob tatsächlich eine lokale Extremstelle vorliegt. Die einfachste Möglichkeit besteht darin, die Monotonieintervalle zu untersuchen. Für eine Funktion f : D → R und eine Stelle a ∈ D◦ im Inneren von D mit f 0 (a) = 0 gilt: • Falls f in einem Intervall (u, a] monoton wachsend ist und in einem Intervall [a, v) monoton fallend ist (für u, v ∈ R∪{±∞} geeignet mit u < a < v und (u, v) ⊂ D), so ist a eine lokale Maximumstelle. • Falls f in einem Intervall (u, a] monoton fallend ist und in einem Intervall [a, v) monoton wachsend ist (für u, v ∈ R ∪ {±∞} geeignet mit u < a < v und (u, v) ⊂ D), so ist a eine lokale Minimumstelle. • Falls f in einem Intervall (u, v) streng monoton ist (für u, v ∈ R ∪ {±∞} geeignet mit u < a < v und (u, v) ⊂ D), so ist a keine lokale Extremstelle. 151 5. Differentialrechnung Diese Art der Untersuchung haben wir bereits in Beispiel 5.29 (d) erfolgreich durchgeführt. Da die Frage nach den Monotonieintervallen durch eine Vorzeichenuntersuchung der Ableitung beantwortet werden kann, kann man obiges Ergebnis auch folgendermaßen formulieren: • Falls f 0 an der Stelle a einen Vorzeichenwechsel von + nach − macht, so ist a eine lokale Maximumstelle. • Falls f 0 an der Stelle a einen Vorzeichenwechsel von − nach + macht, so ist a eine lokale Minimumstelle. • Falls f 0 an der Stelle a keinen Vorzeichenwechsel macht, so ist a keine lokale Extremstelle. Wir betrachten nochmals die Funktion i : R \ {−1, 1} → R, i(x) = x5 x4 − 1 aus Beispiel 5.29 (b) zusammen mit ihrer Ableitung i0 : R \ {−1, 1} → R, i0 (x) = x8 − 5x4 (x4 − 1)2 Es gibt allerdings noch ein weiteres bekanntes (hinreichendes) Kriterium für das Vorhandensein lokaler Extremstellen. Dazu benötigt man die zweite Ableitung f 00 einer Funktion f : D → R. Ist f zweimal differenzierbar, so gilt für eine Stelle a ∈ D◦ im Inneren des Definitionsbereichs: • Ist f 0 (a) = 0 und f 00 (a) < 0, so ist a eine lokale Maximumstelle von f . • Ist f 0 (a) = 0 und f 00 (a) > 0, so ist a eine lokale Minimumstelle von f . 152 • Die Umkehrungen dieser beiden Kriterien sind falsch. Allein mit der Information, dass f 0 (a) = 0 und f 00 (a) = 0 kann man nicht entscheiden, ob a eine lokale Extremstelle von f ist. (Daher ist die Vorzeichenuntersuchung von f 0 im allgemeinen vorzuziehen.) (b) Wir hatten in Satz 5.28 gesehen, dass für eine differenzierbare Funktion f : D → R und ein Intervall I ⊂ D gilt: (f 0 (x) > 0 für alle x ∈ I ◦ ) ⇒ (f % auf I) (analog natürlich für ’streng monoton fallend’) Wir wissen schon (siehe Beispiel 5.29 (a)), dass die Umkehrung falsch ist (die Ableitung kann an einigen isolierten Stellen auch = 0 sein). Wir können das Kriterium also wie folgt verbessern: Für eine differenzierbare Funktion f : D → R und ein Intervall I ⊂ D gilt: f 0 (x) ≥ 0 für alle x ∈ I und f 0 (x) = 0 nur an isolierten Stellen1 x ∈ I ! ⇒ (f % auf I) Auch hier gilt im allgemeinen nicht die Umkehrung. Entsprechende Gegenbeispiele sind aber nicht ohne Weiteres anzugeben, so dass wir uns hiermit begnügen wollen. Im Gegensatz zur strengen Monotonie gibt es aber ein einfaches Kriterium für Monotonie, das sowohl notwendig als auch hinreichend ist. Es gilt (wie zuvor f : D → R differenzierbar, I ⊂ D ein Intervall): (f 0 (x) ≥ 0 für alle x ∈ I) ⇔ (f monoton wachsend auf I) und (f 0 (x) ≤ 0 für alle x ∈ I) ⇔ (f monoton fallend auf I) Gibt es in I also sowohl Stellen an denen die Ableitung positiv ist, als auch Stellen, an denen sie negativ ist, so kann die Funktion auf I nicht streng monoton sein. Die Grenzwertregel von l’Hospital Viele Grenzwerte von Funktionen können mit den bisherigen Methoden nicht berechnet werden, da die Grenzwertsätze in manchen Fällen keine Aussage machen. ∞ ’ und ’ 00 ’ problematisch. Beispielsweise wissen wir Speziell ist oftmals die Fälle ’ ∞ nicht, was lim x→∞ exp(x) x ist (bzw. ob der Grenzwert überhaupt existiert). Die Grenz- wertregel von l’Hospital bietet eine Lösungmöglichkeit für dieses Problem an, die in vielen Fällen funktioniert. 1 Das bedeutet, dass es zu jeder Stelle x ∈ I mit f 0 (x) = 0 ein δ > 0 existiert mit f 0 (y) 6= 0 für alle y ∈ (x − δ, x + δ) \ {x}. 153 5. Differentialrechnung 5.31. Grenzwertregel von l’Hospital Seien a, b ∈ R ∪ {±∞} mit a < b und f, g : (a, b) → R differenzierbare Funktionen mit g(x) 6= 0 und g 0 (x) 6= 0 für alle x ∈ (a, b). Dann gilt: • Wenn die Grenzwerte lim f (x) und lim f (x) beide = 0 sind oder beide in x↓a x↓a {±∞} sind und wenn lim x↓a f 0 (x) = c ∈ R ∪ {±∞} g 0 (x) existiert, dann ist auch: lim x↓a f (x) =c g(x) • Wenn die Grenzwerte lim f (x) und lim f (x) beide = 0 sind oder beide in x↑b x↑b {±∞} sind und wenn lim x↑b f 0 (x) = c ∈ R ∪ {±∞} g 0 (x) existiert, dann ist auch: lim x↑b f (x) =c g(x) Wir verzichten hier auf einen Beweis, da wir hauptsächlich an der Anwendung der Regel interessiert sind. Dazu geben wir einige Beispiele. • Zu berechnen ist lim x→∞ exp(x) x . Für x → ∞ gilt: exp(x) → ∞ und x → ∞ Damit sind wir im Fall, dass Zähler und Nenner beide gegen ∞ konvergieren, es liegt also eine Situation vor, in der die Regel von l’Hospital möglicherweise anwendbar ist. Weiterhin gilt exp(x) (exp(x))0 x→∞ = = exp(x) −→ ∞ (x)0 1 Aus der Regel von l’Hospital folgt nun, dass auch lim x→∞ x x→∞ exp(x) • Folglich ist lim exp(x) x = ∞ ist. = 0 (dies folgt nun aus obigem Beispiel mit den Grenz- wertsätzen, könnte aber auch mit der Regel von l’Hospital hergeleitet werden). • Es ist lim (exp(x) · x) = 0, denn mit x → −∞ ist −x → ∞ und somit x→−∞ exp(x) · x = − • Zu berechnen ist lim x→0 sin x x . −x → −0 = 0 exp(−x) Für x → 0 gilt: sin(x) → 0 154 und x → 0 Damit sind wir im Fall, dass Zähler und Nenner beide gegen 0 konvergieren, es liegt also eine Situation vor, in der die Regel von l’Hospital möglicherweise anwendbar ist. Weiterhin gilt cos(x) (sin(x))0 x→0 = = cos(x) −→ 1 0 (x) 1 Aus der Regel von l’Hospital folgt nun, dass auch lim x→0 sin x x = 1 ist. (Dies entspricht einer Vermutung, die wir schon in Beispiel 4.1 hatten, bislang aber nicht begründen konnten.) ln x . x→∞ x • Zu berechnen ist lim Für x → ∞ gilt: ln x → ∞ und x → ∞ Damit sind wir im Fall, dass Zähler und Nenner beide gegen ∞ konvergieren, es liegt also eine Situation vor, in der die Regel von l’Hospital möglicherweise anwendbar ist. Weiterhin gilt 1 (ln x)0 1 x→∞ x = = −→ 0 0 (x) 1 x ln x x→∞ x Aus der Regel von l’Hospital folgt nun, dass auch lim = 0 ist. • Daraus folgt, dass lim (ln x · x) = 0 gilt. x→0 • Zu untersuchen ist lim x→0 cos(x)−1 . x2 Für x → 0 gilt: cos(x) − 1 → 0 und x2 → 0 Damit sind wir im Fall, dass Zähler und Nenner beide gegen 0 konvergieren, es liegt also eine Situation vor, in der die Regel von l’Hospital möglicherweise anwendbar ist. Weiterhin gilt (cos(x) − 1)0 − sin x 1 sin x x→0 1 = =− · −→ − 2 0 (x ) 2x 2 x 2 (wir haben ja lim x→0 sin x x schon ausgerechnet (siehe oben)). Aus der Regel von l’Hospital folgt nun, dass auch lim x→0 (cos(x)−1)0 (x2 )0 = − 21 ist. (Insgesamt war zur Be- rechnung dieses Grenzwert eine zweimalige Anwendung der Regel von l’Hospital notwendig.) • Zu untersuchen ist lim x→∞ exp(x) x3 . Für x → ∞ gilt: exp(x) → ∞ und x3 → ∞ Damit sind wir im Fall, dass Zähler und Nenner beide gegen ∞ konvergieren, es liegt also eine Situation vor, in der die Regel von l’Hospital möglicherweise anwendbar ist. Weiterhin gilt (exp(x))0 exp(x) = (x4 )0 3x2 155 5. Differentialrechnung Nun konvergieren immer noch Zähler und Nenner gegen ∞, wir müssen also eine Untersuchung des Grenzwerts lim x→∞ exp(x) 3x2 vornehmen. Auch dazu wollen wir die Regel von l’Hospital benutzen und rechnen: (exp(x))0 exp(x) 1 exp(x) x→∞ = = · −→ ∞ 2 0 (3x ) 6x 6 x wie wir auch erst nach einer Anwendung von l’Hospital (siehe oben) wissen. Insgesamt können wir nun aber folgendermaßen schließen: lim x→∞ exp(x) =∞ 6 l’Hospital ⇒ l’Hospital ⇒ exp(x) =∞ 6x exp(x) =∞ lim x→∞ 3x2 lim x→∞ l’Hospital ⇒ lim x→∞ exp(x) =∞ x3 Man kann zahlreiche weitere Grenzwerte aus der Regel von l’Hospital herleiten. Wir wollen einige Verallgemeinerungen, der oben ausgerechneten Grenzwerte festhalten. • Für alle α > 0 gilt: lim x→∞ exp(x) =∞ xα und lim (xα · exp x) = 0, falls α ∈ N x→−∞ • Für alle α > 0 gilt: lim x→∞ ln x =0 xα und lim (xα · ln x) = 0 x→0 Konsequenzen aus den Monotonie-Untersuchungen Wir sind in der Lage, für viele differenzierbare Funktionen die Monotonieintervalle und die lokalen Extremstellen zu bestimmen. Außerdem können wir (meistens) die Grenzwerte an den Rändern des Definitionsbereiches berechnen. Damit können wir die Funktionsgraphen gut skizzieren. In diesem Abschnitt beschäftigen wir uns mit weiteren (darauf aufbauenden) Anwendungen. Wir gehen darauf ein, wie man die Anzahl der Lösungen bestimmter Gleichungen angeben kann und beschäftigen uns auch mit der Bestimmung globaler Extrema (dies ist Bestandteil sogenannter ’Extremwertaufgaben’). 5.32. Anzahl der Lösungen bestimmter Gleichungen Im Kapitel über Stetigkeit hatten wir den Zwischenwertsatz 4.24 benutzt, um zu begründen, dass bestimmte Gleichungen (die man nicht ohne weiteres lösen kann) Lösungen haben müssen (vergleiche 4.25). Mit Hilfe von Monotonieuntersuchungen können wir nun (zusammen mit Grenzwertuntersuchungen) mehr zur Eindeutigkeit (bzw. zur Anzahl) der Lösungen sagen. Wir betrachten einige Beispiele: (a) Wieviele Lösungen x ∈ R hat die Gleichung exp(x) = 2x + 2 ? Bringt man alle Terme mit x auf eine Seite, so stellt man fest, dass exp(x) = 2x + 2 156 ⇔ f (x) = 2, wobei: f : R → R, f (x) = exp(x) − 2x Wir untersuchen nun das Monotonieverhalten und die Grenzwerte von f . Die Funktion f ist differenzierbar mit f 0 (x) = exp(x) − 2 (x ∈ R), es gilt also: f 0 (x) = 0 ⇔ exp(x) − 2 = 0 ⇔ x = ln 2 Außerdem gilt ∀x ∈ (−∞, ln 2) f 0 (x) < 0 0 ∀x ∈ (ln 2, ∞) f (x) > 0 ⇒ f & auf (−∞, ln 2] ⇒ f % auf [ln 2, ∞) Folglich ist ln 2 eine (globale) Minimumstelle von f , es ist f (ln 2) = 2 − 2 ln 2 < 2. Weiterhin ist lim f (x) = ∞ (klar) und lim f (x) = ∞, denn es ist x→−∞ x→∞ f (x) = exp(x) · 1 − 2 x x→∞ −→ ∞ exp x | {z } →0 Der Graph der Funktion sieht also folgendermaßen aus: Man erkennt nun: • Es gibt genau eine Stelle x1 ∈ (−∞, ln 2) mit f (x1 ) = 2. • Es gibt genau eine Stelle x2 ∈ (ln 2, ∞) mit f (x2 ) = 2. Die Gleichung exp(x) = 2x+2 hat also genau zwei Lösungen in R. Dabei garantiert der Zwischenwertsatz 4.24 zusammen mit den Grenzwerten x → ±∞ und dem Funktionswert f (ln 2) an der (Minimum-)Stelle die Existenz der Lösungen, aufgrund des Monotonieverhaltens der Funktion kann man schließen, dass 157 5. Differentialrechnung keine weiteren Lösungen existieren. Man überlegt sich genauso: Die Gleichung exp(x) = 2x + λ mit λ ∈ R fest, hat: • genau zwei Lösungen in R, falls λ > f (ln 2) = 2 − 2 ln 2 ist. • genau eine Lösung in R, falls λ = f (ln 2) = 2 − 2 ln 2 ist (nämlich die Lösung x = ln 2). • keine Lösung in R, falls λ < f (ln 2) = 2 − 2 ln 2 ist. (b) Zur Gleichung x2 = 4 cos(x) betrachten wir g : R → R, g(x) = x2 − 4 cos(x). Damit ist: x2 = 4 cos(x) ⇔ g(x) = 0 Es gilt g 0 (x) = 2x + 4 sin(x) (x ∈ R). Wir interessieren uns nun für die Nullstellen bzw. das Vorzeichen von g 0 (x) (damit wir auf das Monotonieverhalten von g schließen können). Wir stellen fest: • Es ist g 0 (0) = 0. • Für x ∈ (−∞, −2) ist 2x < −4 und 4 sin(x) < 4, also: g 0 (x) < 0. • Für x ∈ [−2, 0) ist 2x < 0 und sin(x) < 0, also: g 0 (x) < 0. • Zusammen sieht man, dass g 0 (x) < 0 für alle x ∈ (−∞, 0) ist, somit ist g streng monoton fallend auf (−∞, 0]. • Für x ∈ (2, ∞) ist 2x > 4 und 4 sin(x) > −4, also: g 0 (x) > 0. • Für x ∈ (0, 2] ist 2x > 0 und sin(x) > 0, also: g 0 (x) > 0. • Zusammen sieht man, dass g 0 (x) > 0 für alle x ∈ (0, ∞) ist, somit ist g streng monoton wachsend auf [0, ∞). • Folglich ist 0 eine lokale Minimumstelle der Funktion g. Es gilt g(0) = −4. Zusammen mit den Grenzwerten lim g(x) = ∞, folgt nun, dass g genau zwei x→±∞ Nullstellen x1 , x2 ∈ R hat, es ist x1 ∈ (−∞, 0) und x2 ∈ (0, ∞). Diese sind genau die Lösungen der Gleichung x2 = 4 cos(x). Hier noch der Graph der Funktion g im Vergleich mit der Normalparabel. 158 Wir gehen nun der Frage nach, wie man globale Extremstellen von Funktionen bestimmen kann. Wir wissen, dass jede stetige Funktion f : [a, b] → R Minimum und Maximum annimmt (vergleiche Satz 4.28). Ist die Funktion differenzierbar, so können die Extremstellen nur Randstellen oder Nullstellen der Ableitung sein. Dies schränkt die Auswahl an zu untersuchenden Stellen stark ein (vergleiche Satz 5.21). Falls der Definitionsbereich kein abgeschlossenes Intervall mehr ist, ist die Existenz der globalen Extrema nicht mehr garantiert. Man kann dann aber in manchen Fällen mit Grenzwertbetrachtungen weiterkommen. Wir betrachten dazu einige Beispiele: Beispiel 5.33. (a) Gesucht sind: m = min x3 − 12x − 5; x ∈ [−3, 1] M = max x3 − 12x − 5; x ∈ [−3, 1] und Da die Funktion f : [−3, 1] → R, f (x) = x3 − 12 − 5 stetig ist, existieren Minimum und Maximum auf jeden Fall. Es gibt also Stellen xm , xM ∈ [−3, 1] mit f (xm ) = m und f (xM ) = M . Weiterhin gilt f 0 (x) = 3x2 − 12 (x ∈ [−3, 1]) und folglich: f 0 (x) = 0 x∈[−3,1] ⇔ x = −2 Also kommen für xm und xM nur die Stellen −3, −2, 1 in Frage. Wegen f (−3) = 4, f (−2) = 11, f (1) = −16 folgert man (durch Vergleich der Werte): xm = 1 und xM = −2 Damit ist m = f (xm ) = −16 und M = f (xM ) = 11 159 5. Differentialrechnung (b) Gesucht sind Minimum und Maximum der Funktion: g : (0, ∞) → R, g(x) = ln x + 1 x Hierbei ist nicht klar, ob diese Extremwerte existieren (der Definitionsbereich ist kein abgeschlossenes Intervall, somit ist Satz 4.28 nicht anwendbar). Wir müssen in unseren Überlegungen auch noch die Grenzwerte für x ↓ 0 und x → ∞ berücksichtigen. Es gilt: lim g(x) = −∞ (klar) und x→0 lim g(x) = 0 (l’Hospital) x→∞ Weiterhin gilt: g 0 (x) = − ln x x2 <0 , falls 0 < x < 1 = 0 , falls x = 1 < 0 , falls 1 < x Also ist g streng monoton wachsend auf (0, 1] und streng monoton fallend auf [1, ∞). Die Stelle 1 ist folglich eine globale Maximustelle, das Maximum der Funktion ist g(1) = 1. Die Funktion hat kein Minimum. (c) Wir betrachten die Funktion: h : R → R, h(x) = exp x x2 + 4 Da die Exponentialfunktion streng monoton wachsend ist, kann man (wenn man an Minimima und Maxima der Funktion h interessiert ist) auch die Extremstellen der (einfacheren) Funktion h̃ : R → R, h̃ = 160 x x2 + 4 bestimmen. Wegen <0 =0 −x2 + 4 h̃0 (x) = 2 >0 (x + 4)2 =0 <0 , falls − ∞ < x < −2 , falls x = −2 , falls − 2 < x < 2 , falls x = 2 , falls x > 2 erkennt man, dass h̃ & auf (−∞, −2] , h̃ % auf [−2, 2] , h̃ & auf [2, ∞) , h % auf [−2, 2] , h & auf [2, ∞) und folglich auch h & auf (−∞, −2] Damit ist −2 eine lokale Minimumstelle und 2 eine lokale Maximumstelle von h (und auch von h̃). Man berechnet 1 1 h̃(−2) = − , h̃(2) = 6 6 bzw. 1 h(−2) = exp − 6 1 , h(2) = exp 6 Weiterhin ist: lim h̃(x) = 0 x→±∞ und damit lim h(x) = exp(0) = 1 x→±∞ Daraus folgt, dass −2 und 2 sogar globale Extremstellen der Funktionen h, h̃ sind. Somit ist: max{h(x); x ∈ R} = exp 1 6 und 1 min{h(x); x ∈ R} = exp − 6 161 5. Differentialrechnung Man beachte: Die beiden Graphen gehen nicht durch eine Verschiebung auseinander hervor. Die Funktion h ergibt sich aus h̃ durch Anwendung der Exponentialfunktion. Da exp streng monoton wachsend ist, haben beide Funktionen dieselben Monotonieintervalle und dieselben Extremstellen. Wir fassen die Erkenntnisse aus diesen Beispielen zusammen und halten fest, wie die Suche nach globalen Extremstellen für auf Intervallen definierte differenzierbare Funktionen funktionieren kann. 5.34. Globale Extremstellen (a) Für eine auf einem abgeschlossenen Intervall definierte differenzierbare Funktion f : [a, b] → R (mit a, b ∈ R, a < b) gilt: • Die Funktion f nimmt ihr (globales) Maximum und Minimum an (dazu reicht schon die Stetigkeit der Funktion aus). • Minimum und Maximum von f werden in einem oder mehreren Punkten der Menge E = {a, b} ∪ {x ∈ (a, b); f 0 (x) = 0} angenommen. Außerhalb der Menge E liegen keine Extremstellen (nicht einmal lokale). (b) Ist f : (a, b) → R differenzierbar und nicht konstant auf einem offenen Intervall ist (mit a, b ∈ R ∪ {±∞}, a < b), so können lokale (und damit natürlich auch globale) Extremstellen von f nur in den Punkten der Menge E = {x ∈ (a, b); f 0 (x) = 0} liegen. Es ist aber nicht klar, ob überhaupt Extremstellen existieren. Wir nehmen nun zusätzlich an, dass lim f (x) und lim f (x) existieren. Dann: x→a x→b • Falls lim f (x) > f (x0 ) oder lim f (x) > f (x0 ) für alle x0 ∈ E gilt, so x→a x→b hat die Funktion f kein (globales) Maximum. Ansonsten nimmt sie es in einem oder mehreren Punkten aus E an. • Falls lim f (x) < f (x0 ) oder lim f (x) < f (x0 ) für alle x0 ∈ E gilt, so hat x→a x→b die Funktion f kein (globales) Minimum. Ansonsten nimmt sie es in einem oder mehreren Punkten aus E an. (c) Falls das Definitionsintervall halboffen ist, so muss man analog zu (b) vorgehen, dabei aber nur einen Grenzwert betrachten. Eine gute Übung ist es ein zu (b) analoges Resultat aufzuschreiben, wenn der Definitionsbereich ein halboffenes Intervall ist. Der Definitionsbereich kann natürlich auch kein Intervall sein, etwa R\{0}. Dann müssen weitere Grenzwerte (an den Definitionslücken) betrachtet werden. 162 Die Suche nach globalen Extremstellen ist wesentlicher Bestandteil sogenannter ’Extremwertaufgaben’. Bestimmte Probleme aus verschiedenen Bereichen (z.B. Geometrie, Umwelt) können dadurch gelöst werden, dass man das Maximum oder das Minimum einer geeigneten Funktion bestimmt. Wir geben dazu einige Beispiele: 5.35. Extremwertaufgaben: (a) Wir suchen das Rechteck, das bei vorgegebenem Umfang U > 0 maximalen Flächeninhalt hat. Ist x eine Seite des Rechtecks, so ist die andere Seite durch ⇔ 2x + 2y = U y= U −x 2 gegeben. Außerdem muss x ∈ 0, U2 gelten. Die Funktion U U U → R, x 7→ x · − x = −x2 + x F : 0, 2 2 2 beschreibt den Flächeninhalt des Rechtecks in Abhängigkeit von x. Wir suchen nun das globale Maximum dieser Funktion. Es ist U F (x) = − 2x 2 0 U x ∈ 0, 2 und folglich F 0 (x0 ) = 0 ⇔ x= U . 4 Das globale Maximum von F kann also nur in Punkten der Menge 0, U4 , U2 angenommen werden. Wegen U 4 wird das Maximum von F im Punkt U 4 F (0) = 0, F U2 = , 16 F U 2 =0 angenommen und hat den Wert U2 16 . (Anmerkung: Das Rechteck maximalen Flächeninhalts bei gegebenem Umfang ist ein Quadrat.) (b) Ein Boot startet im Punkt A = (1/0) (Angaben in km) mit der Geschwindigkeit von 3km/h in negative x-Richtung. Ein anderes Boot startet in B = (0/3) mit 4km/h in negative y-Richtung. Wir berechnen die Positionen, an denen sich die Boote möglichst nahe sind. 163 5. Differentialrechnung Zunächst wählen wir als geeignete Variable, von der die zu minimierende Abstandsfunktion abhängen soll, die Zeit t. Die x-Koordinate von Boot 1 in Abhängigkeit von t ist x(t) = 1 − 3t (dabei wird alles in km und h angegeben). Ebenso ist die y-Koordinate von Boot 2 gegeben durch y(t) = 3 − 4t. Der Abstand der beiden Boote zum Zeitpunkt t ist also gegeben durch d(t) = p (1 − 3t)2 + (3 − 4t)2 (t ≥ 0). Um die Rechnung zu vereinfachen, minimieren wir stattdessen die Funktion f = d2 (man beachte, dass eine Funktion mit nichtnegativen Werten genau dann minimal wird, wenn ihr Quadrat minimal wird). Also betrachten wir: f : [0, ∞[→ R, f (t) = (1 − 3t)2 + (3 − 4t)2 = 25t2 − 30t + 10. Es gilt f 0 (t) = 50t − 30 (t ≥ 0) und damit ist f 0 (t0 ) = 0 ⇔ t0 = 3 . 5 Wir vergleichen nun die in Frage kommenden Werte: f (0) = 10, Der kleinste dieser Werte ist f Zeitpunkt t0 = 3 5 h (= f 3 = 1, 5 3 5 lim f (t) = ∞. t→∞ = 1. Damit wird auch der Abstand d(t) zum 36min) minimal. Dieser minimale Abstand beträgt 3 d = 1km. 5 Wegen x Wegen y 164 3 5 3 5 = − 45 befindet sich Boot 1 zum dem Zeitpunkt im Punkt − 45 /0 . = − 53 befindet sich Boot 2 zum dem Zeitpunkt im Punkt 0/ − 35 . Taylorpolynome Zum Abschluss soll noch eine weitere Anwendung der Differentialrechnung vorgestellt werden. Ist f : D → R eine differenzierbare Funktion und a ∈ D, so ergibt sich die Gleichung der Tangente an den Graphen von f im Punkt (a, f (a)) durch t(x) = f 0 (a)(x − a) + f (a) = f 0 (a) · x + (f (a) − f 0 (a) · a) (x ∈ R) Die Tangente ist ’in der Nähe’ der Stelle a eine gute Anäherung an die Funktion f . Daher stellt sich die Frage nach den Gemeinsamkeiten von f und t. Es gilt: t(a) = f (a) und t0 (a) = f 0 (a) Also stimmen für t und f sowohl der Funktionswert an der Stelle a als auch die Ableitung (Steigung bzw. lokale Änderungsrate) an der Stelle a überein. Beispielsweise betrachten wir die Logarithmusfunktion f : (0, ∞) → R, f (x) = ln(x) an der Stelle a = 1. Es ist f (1) = ln(1) = 0 und f 0 (1) = 1 1 = 1, die Tangente ist also gegeben durch die Gleichung t(x) = f 0 (1)(x − 1) + f (1) = x − 1 Nun betrachten wir auch die zweite Ableitung von f und t. Es gilt: f 00 (x) = − 1 , also f 00 (1) = −1 x2 und t00 (x) = 0 Die zweiten Ableitungen stimmen also nicht mehr überein. Es ist klar, dass dies auch nicht möglich ist, falls t eine lineare Funktion (Gerade) ist. Um eine noch 165 5. Differentialrechnung bessere Annäherung an f in der Nähe von 1 zu erhalten, suchen wir eine Funktion p2 mit p2 (1) = f (1) = 0, p02 (1) = f 0 (1) = 1, und p002 (1) = f 00 (1) = −1 Die Funktion sollte gegenüber f den Vorteil haben, dass sie ’einfacher’ ist (wir wollen dies hier nicht genauer vertiefen). Man könnte es nun (statt mit einer linearen Funktion) mit einer quadratischen Funtion versuchen. Mit dem Ansatz p2 (x) = α2 · (x − 1)2 + α1 · (x − 1) + α0 (α2 , α1 , α0 ∈ R) erhält man (durch Ausrechnen der Ableitungen und Einsetzen): p2 (1) = α0 , p02 (1) = α1 , und p002 (1) = 2 · α2 Damit die Ableitungen (von der 0-ten1 bis zur 2-ten) von p2 an der Stelle 1 mit denen von f an der Stelle 1 übereinstimmen, muss gelten: α0 = f (1) = 0, α1 = f 0 (1) = 1, und α2 = 1 f 00 (1) =− 2 2 Also ist 1 1 3 p2 (x) = − · (x − 1)2 + 1 · (x − 1) + 0 = − · x2 + 2x − (x ∈ R) 2 2 2 Man sieht, dass p2 eine noch bessere Näherung für f (in der Nähe der Stelle 1) ist. Dieses Verfahren kann man nun immer weiter verbessern. Mit einem Polynom p3 dritten Grades kann man erreichen, dass zusätzlich auch die dritte Ableitung an der Stelle 1 mit der von f übereinstimmt. Es gilt: 2 f (3)(x) = f 000 (x) = 3 , also f (3) (1) = 2 x 1 Die 166 0-te Ableitung entspricht der Funktion selbst. Wir betrachten nun den Ansatz: p3 (x) = α3 · (x − 1)3 + α2 · (x − 1)2 + α1 · (x − 1) + α0 (α0 , . . . , α3 ∈ R) und stellen fest, dass: p3 (1) = α0 , (1) p3 (1) = α1 , (2) (3) p3 (1) = 2 · α2 und p3 (1) = 6 · α3 Durch einen Vergleich der Ableitungen von p3 und f erhält man: α0 = f (1) = 0, α1 = f (1) (1) = 1, α2 = 1 f (2) (1) =− 2 2 und α3 = f (3) (1) 1 = 6 3 und somit ergibt sich p3 als: p3 (x) = = 1 1 · (x − 1)3 − · (x − 1)2 + 1 · (x − 1) + 0 3 2 11 1 3 3 2 x − · x + 3x − (x ∈ R) 3 2 6 Wir wollen diese Idee nun in einer Definition erfassen. Definition 5.36. Sei f : D → R eine Funktion und a ∈ D. Falls f (mindestens) k-mal differenzierbar ist, so nennt man (f,a) pk = pk : R → R, pk (x) = k X f (j) (a) j=0 j! · (x − a)j das k-te Taylorpolynom der Funktion f mit Entwicklungszentrum a. Beispiel 5.37. 167 5. Differentialrechnung (a) Wir betrachten die Tangensfunktion tan : Dtan → R und das Entwicklungszentrum a = 0. Für alle x ∈ Dtan gilt: 1 , cos2 (x) tan(2) (x) = 2· tan(0) = 0, tan(1) (0) = 1, tan(1) (x) = sin(x) , cos3 (x) tan(3) (x) = 2· cos2 (x) + 3 sin2 (x) cos4 (x) Somit ist: tan(2) (0) = 0, tan(3) (0) = 2 Damit können wir die folgendenTaylorpolynome berechnen: p0 (x) p1 (x) p2 (x) p3 (x) = = = = tan(0) 0! (x tan(0) 0! (x tan(0) 0! (x tan(0) 0! (x − 0)0 = 0 − 0) + 0 − 0) + 0 − 0) + 1 1 1! (x − 0) (1) tan (0) (x − 1! tan(1) (0) (x − 1! = x 1 0) + 1 0) + tan(2) (0) (x 1! tan(2) (0) (x 1! − 0) 2 2 = x − 0) + tan(3) (0) (x 3! (b) Wir betrachten die Funktion P : R → R, P (x) = 2x4 − 3x3 + 5x + 1 und das Entwicklungszentrum a = −1. Wir berechnen die Ableitungen: P (x) P (1) P (2) P (3) P (4) P (5) (x) (x) (x) (x) = = = = = 2 8x − 9x + 5 2 24x − 18x 48x − 18 48 P (−1) = 1 P (1) (−1) = −12 P (2) (−1) = 42 P (3) (−1) = −66 P (4) (−1) = 48 (5) (x) = 0 P (−1) = 0 P (6) (x) = 0 P (6) (−1) = 0 ••• 168 2x4 − 3x3 + 5x + 1 3 0 ••• − 0) 3 = x+ 1 3 · x3 (P,−4) Damt erhalten wir die folgenden Taylorpolynome pk = pk p0 (x) = p1 (x) = p2 (x) = p3 (x) = : 1 −12(x + 1) + 1 2 21(x + 1) − 12(x + 1) + 1 −11(x + 1)3 + 21(x + 1)2 − 12(x + 1) + 1 4 3 2 = 1 = −12x − 11 = 21x2 + 30x + 10 = −11x3 − 12x2 − 3x − 1 p4 (x) = 2(x + 1) − 11(x + 1) + 21(x + 1) − 12(x + 1) + 1 = 2x4 − 3x3 + 5x + 1 p5 (x) = 0(x + 1)5 + 2(x + 1)4 − 11(x + 1)3 + 21(x + 1)2 − 12(x + 1) + 1 = 2x4 − 3x3 + 5x + 1 ••• Man stellt fest, dass die Taylorpolynome pk für k ≥ 4 mit der Funktion P übereinstimmen. Dies ist der Fall, da P selbst ein Polynom vom Grad 4 ist. Generell gilt: Ist P ein Polynom vom Grad n, so gilt (P,a) P (x) = pk (x) (k ≥ n, a ∈ R) (c) Wir betrachten die Funktion f : [0, ∞) → R, f (x) = √ 3 x und das Enwicklungszentrum a = 8. Wir berechnen zunächst einige Ableitungen. Für alle x ∈ (0, ∞) gilt: f (1) (x) = 1 −2 ·x 3 , 3 5 2 f (2) (x) = − ·x− 3 , 9 f (3) (x) = 10 − 8 ·x 3 , 27 f (4) (x) = − 80 − 11 ·x 3 81 Damit gilt f (8) = 2, f (1) (8) = 1 , 12 f (2) (8) = − 1 , 144 f (3) (8) = 5 , 3456 f (4) (8) = − Die Taylorpolynome ergeben sich durch: p0 (x) = 2 1 (x − 8) 12 1 p2 (x) = 2 + (x − 8) − 12 1 p3 (x) = 2 + (x − 8) − 12 1 p4 (x) = 2 + (x − 8) − 12 p1 (x) = 2+ 1 (x − 8)2 288 1 5 (x − 8)2 + (x − 8)3 288 20736 1 5 5 (x − 8)2 + (x − 8)3 − (x − 8)4 288 20736 248832 169 5 10368 5. Differentialrechnung Mit p4 (x) hat man nun eine gute Annäherung für f (x) in der Nähe von a = 8. Bespielsweise ist: 1 1 5 5 517591 − + − = 12 288 20736 248832 248832 √ 3 Dies stimmt mit f (9) = 9 bis auf 5 Nachkommastellen überein. Weiterhin p4 (9) = 2 + haben wir: p4 (5) = 425655 ≈ 1.7106119 248832 und f (5) = √ 3 5 ≈ 1.70997 Zum Vergleich noch: p4 (18) = 628624 ≈ 2.5263 248832 und f (18) = √ 3 18 ≈ 2.6207 Man stellt fest, dass die Näherungen bei wachsender Entfernung zum Entwicklungszentrum schnell deutlich schlechter werden. (d) Wir betrachten die Exponentialfunktion exp : R → R und das Entwicklungszentrum a = 0. Für alle k ∈ N gilt: exp(k) (x) = exp(x) und folglich exp(k) (0) = 1 Somit sind die Taylorpolynome gegeben durch: (exp,0) pk (x) = pk (x) = k X 1 · xj j! j=0 (k ∈ N) Dies entspricht den Partialsummen der Reihe, durch die exp(x) definiert ist. Für jedes (feste) x ∈ R gilt also: (exp,0) pk 170 k→∞ (x) −→ exp(x) Zum Abschluss wollen wir dazu noch einige Bemerkungen machen. Bemerkung 5.38. (a) Mit dieser Methode können ’komplizierte’ Funktionen sehr gut durch einfachere Funktionen (Polynome) angenähert werden. Damit lassen sich viele Probleme, die in den Naturwissenschaften auftreten, einfacher mathematisch behandeln. (f,a) Man stellt fest, dass die Näherung für f (x) durch pk (x) (in den meisten Fällen) besser wird, wenn • x näher an a ist. • der Grad k des Polynoms größer ist. (b) In vielen Fällen kann man genauere Untersuchungen darüber anstellen, ob das (f,a) Taylorpolynom pk = pk eine gute Näherung für die Funktion f in der Nähe von a ist. Dazu betrachtet man das sogenannte ’Restglied’: (f,a) Rk (x) = Rk (x) = f (x) − pk (x) (x ∈ Df ) Es gibt mehrere Möglichkeiten, dieses zu beschreiben. In vielen Fällen ist die Restgliedform nach Lagrange nützlich. Ist f mindestens (k + 1)-mal differenzierbar und gehört das Intervall I = [x, a] bzw. I = [a, x] ganz zum Definitionsbereich von f (d.h. I ⊂ Df ), so gibt es eine Stelle ξ ∈ I ◦ mit: Rk (x) = f (k+1) (ξ) · (x − a)k+1 (k + 1)! (Dies lässt sich unter Benutzung des Mittelwertsatzes 5.24 mit Induktion nach k beweisen.) (tan,0) Beispielsweise wollen wir wissen, wie gut die durch p3 (x) = x + 1 3 · x3 (vergleiche Beispiel 5.37 (a)) gegebene Näherung für tan(x) ist. • Wir untersuchen x = 31 . Nach Lagrange gibt es eine Stelle ξ ∈ 0, 13 mit 4 1 tan(4) (ξ) 1 tan(4) (ξ) R3 (x) = tan (x) − x + · x3 = · −0 = 3 4! 3 1944 Nun versuchen wir etwas über die 4-te Ableitung des Tangens an der Stelle ξ herauszufinden. Es gilt tan(4) (ξ) = Wegen ξ ∈ 0, 31 16 sin(ξ) cos2 (ξ) + 24 sin3 (ξ) cos5 (ξ) sind Zähler und Nenner beide positiv. (Relativ grobe) Abschätzungen ergeben nun, dass 2 3 16 sin(ξ) cos (ξ)+24 sin (ξ) ≤ 40 und 5 cos (ξ) ≥ cos beachte, dass ξ ≤ 5 π 6 = √ 5 1 √ 9· 3 15 · 3 = ≥ 2 32 32 1 π < gilt 3 6 171 5. Differentialrechnung Damit ergibt sich: 0 ≤ tan(4) (ξ) ≤ 40 15 32 und folglich 0 ≤ R3 (x) ≤ 1 32 40 · 15 = ≈ 0.026 1944 1215 32 Somit beträgt die Abweichung zwischen tan mehr als 32 1215 1 3 und p3 1 3 = 28 81 also nicht ≈ 0.026. (c) Falls eine Funktion f : D → R unendlich oft differenzierbar ist, kann man auch die sogenannte ’Taylorreihe’ mit Entwicklungszentrum a ∈ D aufstellen. Diese ist gegeben durch: T (f,a) (x) = ∞ X f (j) (x) j=0 j! · (x − a)j (x ∈ R) Dies wirft allerdings verschiedene Fragen auf: • Für welche x ∈ R konvergiert diese Reihe überhaupt ? Zur Beantwortung dieser Frage müssten wir in die Theorie der ’Potenzreihen ’ einsteigen. Dies ist im Rahmen dieser Vorlesung nicht möglich. • Falls die Reihe für ein x ∈ D konvergiert, ist dann der Reihenwert = f (x) ? Wir haben im Fall f = exp und a = 0 gesehen, dass die Taylorreihe in allen Punkten x ∈ R konvergiert und den Reihenwert exp(x) hat. Es gibt aber auch Funktionen, bei denen die Taylorreihe zwar konvergiert, der Reihenwert aber nicht gleich dem Funktionswert ist. Ein Beispiel dafür ist die unendlich oft differenzierbare (!) Funktion ( exp − x12 f : R → R, f (x) = 0 , falls x 6= 0 , falls x = 0 Man kann zeigen, dass f (j) (0) = 0 für alle j ∈ N gilt. Also ist T (f,0) (x) = 0 für alle x ∈ R. 172 A. Anhang An dieser Stelle werden grundlegende Sachverhalte behandelt, die keinem bestimmten Kapitel direkt zugeordnet werden können, jedoch für die Vorlesung insgesamt von Bedeutung sind. Bezeichnungen Wir benutzen die folgenden Symbole: ∀ : für alle ∃ : es existiert (mindestens ein) ∃! : es existiert genau ein ∧ : und ∨ : oder : entweder oder · ∨ Wichtig für uns sind (unter anderem) die folgenden Mengen: N = {0, 1, 2 . . .} Menge der natürlichen Zahlen ∗ N = N \ {0} = {1, 2, 3, . . .} Menge der natürlichen Zahlen ohne die 0 Z = {. . . , −2, −1, 0, 1, 2, . . .} n o Q = pq ; p, q ∈ Z, q 6= 0 Menge der ganzen Zahlen Menge der rationalen Zahlen Menge der rellen Zahlen R Summen- und Produktzeichen Um schnell und einfach mit Summen (mit endlich vielen Summanden) oder Produkten (mit endlich vielen Faktoren) rechnen zu können, führen wir die folgenden abkürzenden Schreibweisen ein. Definition A.1. Für k, n ∈ Z mit k ≤ n und ak , . . . , an ∈ R definiert man n X ai = ak + . . . + an und i=k n Y ai = ak · . . . · an . i=k Beispielsweise ist 4 X i2 = 1 + 4 + 9 + 16 = 30 i=1 und 5 Y i 2 3 4 5 1 = · · · = . i + 1 3 4 5 6 3 i=2 Die Summe der Zahlen 1, . . . , 100 lässt sich durch 100 X j=1 j = 1 + 2 + 3 + . . . + 99 + 100 A. Anhang beschreiben. Das Produkt aller ungeraden Zahlen zwischen 50 und 100 entspricht 49 Y (2m + 1) = (2 · 25 + 1) · (2 · 26 + 1) · . . . · (2 · 48 + 1) · (2 · 49 + 1) = 51 · 53 · . . . · 97 · 99. m=25 Ergänzend definiert man für den Fall, dass n < k ist: n X ai = 0 (Neutrales der Addition) n Y und i=k ai = 1 (Neutrales der Multiplikation) i=k Es gelten die folgenden Rechenregeln: A.2. Rechenregeln Für k, l, n ∈ Z mit k ≤ l ≤ n und ai , bi , α ∈ R gilt: n P n P ai + bi = n P i=k i=k i=k n P n P n P ai − i=k bi = i=k (ai + bi ) n Q n Q ai · i=k i=k n Q (ai − bi ) i=k bi = ai i=k n Q = n Q (ai · bi ) i=k n Q bi i=k n Q α ai bi (bi 6= 0) i=k n P α· ai = i=k n P (α · ai ) i=k ai = i=k n Q (ai ) α i=k (falls α ∈ Z) n P α = (n − k + 1) · α i=k n P n Q α = α(n−k+1) gleicher Summand/Faktor i=k ai = i=k l−1 P ai + i=k n P ai i=l n+l P ai = n P ai−l n Q ai = i=k l−1 Q ai · i=k n Q ai = n+l Q i=k+l i=k i=k+l n P n P n Q n Q i=k i=k an+k−i i=k ai = Aufspalten ai i=l i=k ai = n Q ai−l an+k−i Indexverschiebung Umdrehen der Reihenfolge i=k Beispiel A.3. Die folgenden Beispiele sollen die obigen Regeln veranschaulichen: • 4 P i=2 174 i− 4 P i=2 i2 = (2 + 3 + 4) − (4 + 9 + 16) = (−2) + (−6) + (−12) = 4 P (i − i2 ) i=2 4 Q • j4 j=1 4 Q = j 1·16·81·256 1·2·3·4 = 1 1 · 16 2 81 3 · 256 4 · = 4 Q j=1 j4 j 4 Q = j3 j=1 j=1 • 4 Q 3 3 3 3 j = 1 · 2 · 3 · 4 = (1 · 2 · 3 · 4) = j=1 • 67 P 15 Q i=1 • 5 P j j=1 k=54 • !3 4 Q 3 3 11 = (67−54+1)·11 = 14·11 11 + |{z} 11 + . . .+ |{z} 11 = |{z} 11 + |{z} 3 i zu k=54 = 3 1 · 3 2 3 9 · ... · · zu k=67 zu k=66 zu k=55 3 10 3 11 · 3 15 · ... · = 9 Q i=1 3 i · 15 Q i=10 3 i 3 P k 2 = 22 +32 +42 +52 = (0+2)2 +(1+2)2 +(2+2)2 +(3+2)2 = k=2 • 30 Q (k +2)2 k=0 Am = A20 ·A21 ·. . .·A29 ·A30 = A30 ·A29 ·. . .·A21 ·A20 = m=20 30 Q A(30+20−m) m=20 Im Folgenden wollen wir die Regeln für den Umgang mit Summen- und Produktzeichen allerdings sinnvoller und zielgerichteter einsetzen. Wir benutzen sie zunächst, um zwei interessante Formeln herzuleiten. Beispiel A.4. (a) (Gaußsche Summenformel)1 n P Für n ∈ N soll die Summe i der ersten n natürlichen Zahlen berechnet i=1 werden. Es gilt 2· n X i= i=1 n X i+ i=1 n X (n + 1 − i) = i=1 n X (n + 1) = n(n + 1). i=1 Folglich ist n X i= i=1 n(n + 1) . 2 (b) (Geometrische Summenformel) Sei x ∈ R eine (feste) reelle Zahl. Wir suchen einen Ausdruck für n P xk . Es k=0 gilt (1 − x) · n X k=0 xk = n X xk − k=0 n X xk+1 = k=0 n X k=0 xk − n+1 X xk = x0 − xn+1 = 1 − xn+1 k=1 Falls x 6= 1 ist, folgt daraus n X xk = k=0 Im Fall x = 1 ist offenbar n P k=0 1 Die xk = n P 1 − xn+1 . 1−x 1 = n + 1. k=0 Formel war bereits in der vorgriechischen Mathematik bekannt. Gauß entdeckte sie als 9-jähriger Schüler wieder. 175 A. Anhang A.5. Fakultäten und Binomialkoeffizienten Für n ∈ N sei n! = n Y i (beachte 0! = 1). i=1 Offenbar gilt (n + 1)! = (n + 1) · n! für alle n ∈ N. Ist n ∈ N und k ∈ {0, . . . , n}, so sei k n n! n · (n − 1) · . . . · (n − k + 1) Y n + 1 − i = = = . k k! · (n − k)! 1 · 2 · ... · k i i=1 Beispielsweise ist 5 5·4 = 10 = 1·2 2 Für k > n ist n k 10 10 · 9 · 8 · 7 = 210. = 4 1·2·3·4 und n k = 0.1 Damit entspricht der Anzahl der k-elementigen Teil- mengen einer n-elementigen Menge. Grundideen der Analysis Summen- und Produktzeichen Anzahl der k -elementigen Teilmengen einer n-elementigen Menge Wieviele 2-elementige Teilmengen hat {A , B , C , D , E } ? 1.Element: 5 Möglichkeiten , {B , A } {C , A } {D , A } {E , A } {A , B } {C , B } {D , B } {E , B } 2.Element: 4 Möglichkeiten {A , C } {B , C } {D , C } {E , C } {A , D } {B , D } {C , D } {E , D } {A , E } {B , E } {C , E } {D , E } Insgeamt: 5 · 4 = 20 Möglichkeiten Da hierbei aber jede Menge doppelt gezählt wurde (beachte {A , B } = {B , A }), gibt es genau 1 Der = 10 = (52) 2-elementige Teilmengen von {A , B , C , D , E }. Binomialkoeffizient lässt sich durch definieren. 176 5·4 2 x k = k Q i=1 x+1−i i für beliebige Zahlen x ∈ R (und k ∈ N) Grundideen der Analysis Summen- und Produktzeichen Anzahl der k -elementigen Teilmengen einer n-elementigen Menge Wieviele 4-elementige Teilmengen hat {A , B , C , D , E , F , G , H , I , J } ? (geordnete) Auswahl von 4 verschiedenen Elementen: 10 · 9 · 8 · 7 Möglichkeiten Wie oft wurde jede Teilmenge gezählt ? Überlegung am Beispiel {A , C , G , H }: {A , C , G , H } {A , G , C , H } {A , H , C , G } {A , C , H , G } {A , G , H , C } {A , H , G , C } {C , A , G , H } {C , G , A , H } {C , H , A , G } {C , A , H , G } {C , G , H , A } {C , H , G , A } {G , A , C , H } {G , C , A , H } {G , H , A , C } {G , A , H , C } {G , C , H , A } {G , H , C , A } {H , A , C , G } {H , C , A , G } {H , G , A , C } {H , A , G , C } {H , C , G , A } {H , G , C , A } Jede Menge wurde 4 · 3 · 2 · 1 mal gezählt. Also gibt es insgesamt 4-elementige Teilmengen von {A , B , C , D , E , F , G , H , I, J }. 10·9·8·7 4·3·2·1 ) = (10 4 Die folgenden Rechenregeln gelten für beliebige n, k ∈ N: n n = = 1, 0 n n n = = n, 1 n−1 k· n n−1 =n· (k ≥ 1). k k−1 Weiterhin gilt n+1 n n = + k+1 k k+1 (n, k ∈ N). Beweis. • über die Anzahl von Teilmengen geeigneter Mengen: Die Zahl n+1 k+1 entspricht der Anzahl der (k + 1)-elementigen Teilmengen einer (n + 1)-elementigen Menge, zum Beispiel der Menge {1, . . . , n + 1}. Diese (k + 1)-elementigen Teilmengen teilen wir in 2 Gruppen auf: 1.) Die Teilmengen, die das Element n + 1 enthalten: Von diesen gibt es genau nk viele, denn es müssen noch k Elemente aus den verbleibenden n Elementen ausgewählt werden. 2.) Die Teilmengen, die das Element n + 1 nicht enthalten: n Von diesen gibt es genau k+1 viele, denn es müssen noch k +1 Elemente aus den verbleibenden n Elementen ausgewählt werden. n Folglich gibt es nk + k+1 (k + 1)-elementige Teilmengen von {1, . . . , n + 1}. 177 A. Anhang • durch nachrechnen mit der Definition: n n n! + = k k+1 k! · (n − k)! n! = k! · (n − k)! n! = k! · (n − k)! n! = k! · (n − k)! n+1 = k+1 n! (k + 1)! · (n − k − 1)! n! n−k + · k! · (n − k)! k + 1 n−k · 1+ k+1 n+1 · k+1 + Dies bedeutet, dass die Binomialkoeffizienten genau die Zahlen sind, die im Pascalschen Dreieck auftreten. n k n k+1 & . + ↓ n+1 k+1 0 0 1 0 2 0 3 0 5 0 5 1 4 3 5 2 1 3 3 4 2 3 2 4 1 1 2 2 3 1 4 0 2 1 1 1 1 5 3 1 4 4 5 4 1 5 5 1 2 3 4 5 1 1 3 6 10 1 4 10 1 5 1 Eine weitere Eigenschaft der Binomialkoeffizienten ist die folgende Symmetrie: n n = (n ∈ N, k ∈ {0, . . . , n}) k n−k Vollständige Induktion A.6. Das Prinzip der vollständigen Induktion Sei A(n) eine von n ∈ N abhängige Aussageform und n0 ∈ N eine gegebene natürliche Zahl. Will man die Aussage ∀n ≥ n0 gilt A(n) 178 beweisen, so kann man sich das folgende Prinzip zunutze machen: Falls A(n0 ) gültig ist und für jedes n ≥ n0 die Implikation A(n) ⇒ A(n + 1) gilt, so gilt A(n) für alle n ≥ n0 . Man kann also wie folgt vorgehen: 1. Induktionsanfang (IA): Man zeigt A(n0 ). 2. Induktionsschritt (IS): Man fixiert ein (beliebiges) n ≥ n0 und setzt voraus, dass A(n) gilt (Induktionsvoraussetzung). Dann folgert man daraus A(n + 1) (Induktionsschluss). Das Prinzip kann wie folgt veranschaulicht werden (hier für n0 = 0): (IS) (IS) (IS) (IS) (IA) ⇒ A(0) ⇒ A(1) ⇒ A(2) ⇒ A(3) ⇒ . . . Beispiel A.7. Wir geben neue Beweise für die Gaußsche Summenformel und die geometrische Summenformel (vgl. A.4) durch vollständige Induktion. (a) Zu zeigen ist: ∗ ∀n ∈ N gilt n X i= i=1 n(n + 1) . 2 1. Induktionsanfang: Für n = 1 gilt n X i= 1 X 1=1 n(n + 1) 1(1 + 1) = = 1, 2 2 und i=1 i=1 die zu zeigende Aussage gilt also in diesem Fall. 2. Induktionsschritt: Sei n ∈ N∗ . Wir nehmen an (Induktionsvoraussetzung), n P dass i = n(n+1) gilt (für dieses eine feste n). Zu zeigen ist nun (Indukti2 i=1 n+1 P onsschluss), dass i= i=1 n+1 X i= i=1 n X (n+1)(n+2) 2 (IV) i + (n + 1) = i=1 folgt. Dazu rechnen wir (n + 1)(n + 2) n(n + 1) +n+1= . 2 2 (b) Sei x ∈ R \ {1}. Zu zeigen ist: ∀n ∈ N gilt n X xk = k=0 1 − xn+1 . 1−x 1. Induktionsanfang: n = 0 n X k=0 xk = 0 X k=0 xk = x0 = 1 und 1 − xn+1 1 − x0+1 = = 1. 1−x 1−x 179 A. Anhang 2. Induktionsschritt: Sei n ∈ N. n X (IV) xk = 1 − xn+1 1−x xk = 1 − xn+2 1−x k=0 n+1 X zu zeigen: k=0 n+1 X (IS) xk = k=0 n X (IV) xk + xn+1 = k=0 1 − xn+1 1 − xn+2 + xn+1 = 1−x 1−x Bemerkung A.8. Ziel ist es nun, eine Formel für den Ausdruck (x + y)n zu erhalten. Für n = 0, . . . , 5 stellt man durch Ausmultiplizieren fest: (x + y)0 = 1 1 (x + y) = x + y (x + y)2 = x2 + 2xy + y 2 (x + y)3 = x3 + 3x2 y + 3xy 2 + y 3 (x + y)4 = x4 + 4x3 y + 6x2 y 2 + 4xy 3 + y 4 (x + y)5 = x5 + 5x4 y + 10x3 y 2 + 10x2 y 3 + 5x4 y + y 5 Verschiebt man die rechten Seiten dieser Gleichungen geeignet, so findet man dort das Pascalsche Dreieck wieder. 1l x + 1l y 1l (x + y)0 = (x + y)1 = x2 + 2l xy + 1l y2 1l x3 + 3l x2 y + 3l xy 2 + 1l y3 1l (x + y)2 = (x + y)3 = (x + y)4 = (x + y)5 = x4 + 4l x3 y + 6l x2 y 2 + 4l xy 3 + 1l y4 1l x5 + 5l x4 y +10l x3 y 2 +10l x2 y 3 + 5l x4 y + 1l y5 1l Wir stellen fest: • Multipliziert man (x + y)n aus, so erhält man einen Term mit n + 1 Summann P den, wir numerieren diese mit k = 0, . . . , n durch, also (x + y)n = . . .. k=0 • Im k-ten Summanden tritt x zur Potenz k auf (beachte: der 0-Summand steht in obiger Berechnung ganz hinten, der n-te Summand ganz vorne). Die Potenz bei y addiert sich mit der von x zu n, hat also den Wert n − k. Als Vorfaktor zu xk y n−k tritt immer der Binomialkoeffizient nk auf. Es scheint also zu gelten: n (x + y) = n X n k=0 k xk y n−k . Mit Induktion können wir nun diese verallgemeinerte binomische Formel beweisen. 180 Satz A.9 (Binomischer Lehrsatz). Für alle x, y ∈ R und alle n ∈ N gilt (x + y)n = n X n k=0 Im Spezialfall x = y = 1 erhält man 2n = k n P k=0 xk y n−k . n k . Diese Formel erhält man auch, durch Betrachtung aller Teilmengen einer n-elementigen Menge. Einerseits ist diese Anzahl genau 2n (für eine Teilmenge gibt es pro Element zwei Möglichkeiten, sie kann das Element enthalten oder nicht), andererseits ergibt sie sich als Summe der Anzahlen der k-elementigen Teilmengen (k = 0, . . . , n). Beweis. Seien x, y ∈ R fest. 1. Induktionsanfang: n = 0 (x + y)n = 1 und n X n k n−k x y = 1. k k=0 2. Induktionsschritt: Sei n ∈ N. (IV) (x + y)n = zu zeigen: (x + y)n+1 n X n xk y n−k k k=0 n+1 X n + 1 xk y n+1−k = k k=0 Zum Induktionsschluss rechnen wir (x + y)n+1 = (IV) = = = = = A.5 = = (x + y) · (x + y)n n X n k n−k (x + y) · x y k k=0 n n X X n k+1 n−k n k n−k+1 x y + x y k k k=0 k=0 n−1 n X n X n k n−k+1 k+1 n−k n+1 x y +x + x y + y n+1 k k k=0 k=1 n n X X n n k n−k+1 xk y n−k+1 + x y + xn+1 + y n+1 k−1 k k=1 k=1 n X n n + xk y n−k+1 + xn+1 + y n+1 k−1 k k=1 n X n + 1 k n−k+1 x y + xn+1 + y n+1 k k=1 n+1 X n + 1 xk y n+1−k . k k=0 181 A. Anhang Beispiel A.10. Es ist (x + y)100 100 X 100 k n−k = x y k k=0 100 0 100 100 1 99 100 2 98 100 3 97 = x y + x y + x y + x y + ... 0 1 2 3 100 50 50 ... + x y + ... 50 100 97 3 100 98 2 100 99 1 100 100 0 ... + x y + x y + x y + x y 97 98 99 100 = y 100 + 100 · xy 99 + 4950 · x2 y 98 + 161700 · x3 y 97 + . . . . . . + 100891344545564193334812497256 · x50 y 50 + . . . . . . + 161700 · x97 y 3 + 4950 · x98 y 2 + 100 · x99 y + x100 . Polynome In diesem Abschnitt wollen wir uns in erster Linie nochmals anschauen, wie man Nullstellen von Polynomfunktionen bestimmen kann. Definition A.11. Sind n ∈ N∗ und a0 , . . . , an ∈ R, so nennt man die Funktion p : R → R, p(x) = n X ai xi i=0 Polynom (oder Polynomfunktion). Die Zahlen a0 , . . . , an heißen Koeffizienten von p und man nennt (falls an 6= 0 ist) n = deg p den Grad von p. Falls an = 1 ist, nennt man p normiert. Eine Nullstelle von p ist eine Zahl x ∈ R mit p(x) = 0. Bemerkung A.12. Für zwei Polynome p, q gilt deg(p · q) = deg p + deg q und deg(p + q) ≤ max (deg p, deg q) . Bei der Bestimmung der Nullstellen von Polynomen behandeln wir zunächst den Fall deg p ≤ 2. • Ein Polynom p(x) = a0 ∈ R \ {0} vom Grad 0 hat offensichtlich keine Nullstellen. • Ein Polynom p(x) = a0 + a1 x vom Grad 1 (also mit a1 6= 0) hat genau eine Nullstelle, nämlich x = − aa10 . 182 • Für Polynome vom Grad 2 hilft das folgende Verfahren. A.13. Quadratische Ergänzung Gegeben seien reelle Zahlen a, b, c mit a 6= 0. Zur Bestimmung der Nullstellen des Polynoms p(x) = ax2 +bx+c formen wir die Gleichung p(x) = 0 wie folgt äquivalent um: p(x) = 0 ⇔ ⇔ ⇔ c b ·x+ =0 a a 2 2 c b b b 2 =− + x + ·x+ a 2a a 2a 2 b b2 − 4ac x+ = 2a 4a2 x2 + Nun sind 3 Fälle zu unterscheiden: • Ist b2 − 4ac < 0, so hat p keine Nullstellen. b • Ist b2 − 4ac = 0, so ist − 2a die einzige Nullstelle von p. b • Ist b2 − 4ac > 0, so hat p genau zwei Nullstellen, nämlich − 2a ± q b2 −4ac 4a2 . Beispiel A.14. (a) Wir betrachten p(x) = −2x2 + 3x − 7. Dann ist: 7 3 ·x+ =0 2 2 3 7 2 ⇔ x − ·x=− 2 2 2 3 3 47 2 ⇔ x − ·x+ − =− 2 4 16 2 3 47 ⇔ x− =− 4 16 p(x) = 0 ⇔ x2 − Diese Gleichung hat keine Lösungen, p hat also keine Nullstellen. (b) Wir betrachten p(x) = 2x2 + 3x − 7. Dann ist: 3 7 ·x− =0 2 2 3 7 2 x + ·x= 2 2 2 3 65 3 = x2 + · x + 2 4 16 2 3 65 x+ = 4 16 √ x + 3 = 65 4 4 √ √ 3 65 3 65 x+ = ∨ x+ =− 4√ 4 4√ 4 65 − 3 − 65 − 3 x= ∨ x= 4 4 p(x) = 0 ⇔ x2 + ⇔ ⇔ ⇔ ⇔ ⇔ ⇔ 183 A. Anhang (c) Mit diesem Verfahren kann man auch quadratische Ungleichungen lösen. Etwa: −3x2 − 9x + 12 ≤ 0 ⇔ ⇔ ⇔ beide Seiten >0 ⇔ ⇔ ⇔ x2 + 3x − 4 ≥ 0 2 3 25 x2 + 3x + ≥ 2 4 2 3 25 x+ ≥ 2 4 x + 3 ≥ 5 2 2 3 5 3 5 x+ ≥ ∨ x+ ≤− 2 2 2 2 x ≥ 1 ∨ x ≤ −4 (d) Schließlich: 1 x + x < −2 2 2 ⇔ 1 x + x+ 2 2 2 1 7 <− 2 4 ⇔ 2 1 7 x+ <− 2 4 Die Ungleichung ist unerfüllbar. Für Polynome höheren Grades können wir im Rahmen dieser Vorlesung kein solches Verfahren zur Nullstellenberechnung vorstellen.1 Wir konzentrieren uns daher auf einige Spezialfälle, in denen es möglich ist, die Nullstellen auf einfachere Art und Weise zu bestimmen. Dies funktioniert in den meisten Fällen so, dass eine Nullstelle durch ’geschicktes Raten’ ermittelt und dann der Grad des zu betrachtenden Polynoms mittels Polynomdivision um 1 verringert wird. Der folgende Satz besagt, dass diese immer möglich ist. Satz A.15. Ist p ein Polynom mit deg p = n ≥ 1 und λ eine Nullstelle von p, so existiert ein Polynom q mit deg q = n − 1, so dass p(x) = (x − λ) · q(x) (x ∈ R) gilt. Damit gilt für x ∈ R die Äquivalenz: p(x) = 0 ⇔ q(x) = 0 ∨ x = λ Wir verzichten hier auf einen formalen Beweis und überlegen uns stattdessen an einigen Beispielen, dass (und wie) es funktioniert. Beispiel A.16. 1 In den Fällen deg p = 3 und deg p = 4 ist es theoretisch möglich, die Nullstellen von p mit Hilfe von Formeln zu bestimmen (Cardanische Formeln für Polynome 3.Grades). Allerdings ist dies sehr kompliziert. Für deg p ≥ 5 gibt es kein allgemeines Lösungsverfahren mehr. 184 (a) Betrachte p(x) = x3 − 2x2 − x − 6. Eine Nullstelle von p ist λ = 3. Gesucht ist also nun ein Polynom q(x) = ax2 + bx + c mit a, b, c ∈ R und a 6= 0, so dass p(x) = q(x) · (x − 3) gilt. Ausmultipliziert bedeutet das: x3 − 2x2 − x − 6 = ax2 + bx + c · (x − 3) = ax3 + (b − 3a)x2 + (c − 3b)x + (−3c) Durch Koeffizientenvergleich erhält man nun: a = 1 a b − 3a = −2 b ⇔ c − 3b = −1 c −3c = −6 c = −2 + 3a = 1 = −1 + 3b = 2 = 2 = 1 Also ist q(x) = x2 + x + 2 wie gewünscht. Den Grund dafür, dass dieses Gleichungssystem (in den Unbekannten a, b, c) lösbar ist, erkennt man, wenn man sich überlegt, warum die letzte Gleichung mit den vorangegangenen ’verträglich’ ist. Wir schauen uns dies a = 1 a = 1 b = −2 + λ · a b − λ · a = −2 ⇔ c = −1 + λ · b c − λ · b = −1 0 = −6 + λ · c −λ · c = −6 nochmals an: Setzt man in die letzte Gleichung nun sukzessive die voranstehenden Gleichungen ein, so erhält man: 0 = −6 + λ · c = −6 + λ · (−1 + λ · b) = −6 + λ · (−1 + λ · (−2 + λ · a)) = −6 + (−1) · λ + (−2) · λ2 + λ3 = p(λ) Dies ist aber immer erfüllt, wenn λ eine Nullstelle von p ist. (b) Ein bekanntes Verfahren, um das gesuchte Polynom q zu finden, ist die sogenannte Polynomdivision. Es erinnert an das schriftliche Dividieren von Zahlen. Der Unterschied zu dem Vorgehen in (a) ist aber rein formaler Natur.1 Sei beispielsweise p(x) = x3 − 47 x + 3 4 und λ = 1 (tatsächlich ist dies eine Nullstelle). Man erhält: − 47 x + 34 x2 − 47 x + 34 (x2 −x) x3 − − − (x3 : (x − 1) = x2 + x − 3 4 −x2 ) − 43 x + 34 (− 43 x + 34 ) 0 1 Man kann das Polynom q auch mit einer Anwendung des Horner-Schemas bestimmen. Wir wollen hier aber nicht näher darauf eingehen. 185 A. Anhang Hier erhalten wir also q(x) = x2 + x − 43 . Bemerkung A.17. (a) Sei p ein Polynom mit deg p = n. Hat p eine Nullstelle λ1 , so kann man Satz A.15 anwenden und findet eine Zerlegung p(x) = (x − λ1 ) · p1 (x) mit deg p1 = n − 1. Entweder ist p1 nun nullstellenfrei oder hat eine Nullstelle λ2 . In diesem Fall kann man Satz A.15 erneut anwenden und findet p1 (x) = (x − λ2 ) · p2 (x) mit deg p2 = n − 2. Zusammen ergibt sich nun p(x) = (x − λ1 ) · (x − λ2 ) · p2 (x). Dies kann man solange fortführen bis das verbleibende Polynom pk keine Nullstellen mehr hat (dies ist spätestens dann der Fall, wenn k = n ist, dann ist nämlich pk konstant). Es gilt also das Folgende: Es existieren Nullstellen λ1 , . . . , λk von p und ein nullstellenfreies Polynom q, so dass p(x) = k Y (x − λi ) · q(x). i=1 Fasst man gleiche Faktoren (x − λi ) zusammen, so kann man dies auch so formulieren: Es existieren paarweise verschiedene Nullstellen λ1 , . . . , λk von p und Zahlen e1 , . . . , ek ∈ N∗ sowie ein nullstellenfreies Polynom q, so dass p(x) = k Y (x − λi )ei · q(x). i=1 Man nennt ei dann die Vielfachheit der Nullstelle λi . Es ist klar, dass die Sumk P me aller Vielfachheiten ei ≤ n ist. Insbesondere hat p maximal n Nullstellen. i=1 Im Fall, dass das verbleibende nullstellenfreie Polynom q konstant = 1 ist, sagt man, dass p vollständig in Linearfaktoren zerfällt. (b) Um Satz A.15 anwenden zu können, ist es notwendig bereits eine Nullstelle des ursprünglichen Polynoms p zu kennen. In manchen Fällen hilft dabei die folgenden Erkenntnis: n P Ist p(x) = ak xk ein Polynom, dessen Koeffizienten ak ∈ Z (k = 0, . . . , n) k=0 sind, und ist λ ∈ Z eine ganzzahlige Nullstelle von p, so ist λ ein Teiler von a0 . Dies folgt leicht aus A.15, denn man kann in der Gleichung p(x) = (x−λ)·q(x) für x den Wert 0 einsetzen und erhält a0 = p(0) = (0 − λ) · q(λ) = −q(λ) · λ. 186 • Sucht man für p(x) = x4 − 4x3 − 3x2 + 13x − 4 eine ganzzahlige Nullstelle, so kommen dafür nur die Teiler von 4 in Frage, also ±1, ±2, ±4. Man berechnet: p(1) = 3, p(−1) = −15, p(2) = −6, p(−2) = 6, p(4) = 0, p(−4) = 408. Damit ist 4 die einzige ganzzahlige Nullstelle von p. • Das Polynom p(x) = x5 + x2 + 1 hat keine ganzzahlige Nullstelle, denn es kämen nur ±1 in Frage, es ist aber p(1) = 3 und p(−1) = 1. Das folgende Beispiel stellt noch einen weiteren Spezialfall dar, in dem man die Nullstellen bestimmter Polynome geraden Grades mit dem Verfahren der quadratischen Ergänzung bestimmen kann. Beispiel A.18. Ist p(x) = ax2k + bxk + c mit k ≥ 2 und Koeffizienten a, b, c ∈ R (a 6= 0), so kann man wie in A.13 vorgehen, um die Gleichung p(x) = 0 nach xk aufzulösen. Anschließend kann man dann die Lösungen für x daraus bestimmen. Beispiele: • Sei p(x) = x4 + x2 − 12. Dann gilt: p(x) = 0 ⇔ ⇔ ⇔ ⇔ ⇔ 2 1 1 = 12 + x +x + 2 4 2 1 49 x2 + = 2 4 1 7 1 7 x2 + = ∨ x2 + = − 2 2 2 2 x2 = 3 ∨ x2 = −4 √ √ x= 3 ∨ x=− 3 2 2 2 • Sei p(x) = x10 − 4x5 + 4. Dann gilt: p(x) = 0 ⇔ ⇔ x5 2 + 4x5 + 22 = −4 + 4 2 x5 + 2 = 0 ⇔ x5 = −2 √ 5 ⇔ x=− 2 Partialbruchzerlegung In diesem Abschnitt stellen wir eine Technik vor, mit der man rationale Funktionen (Quotienten von Polynomen) in eine Form bringen kann, die für manche Zwecke der Vorlesung (z.B. Summation, Integration) günstiger ist. Definition A.19. Sind p, q Polynome mit q 6= 0 und ist Nq = {x ∈ R; q(x) = 0} die Nullstellenmenge 187 A. Anhang von q, so nennt man p p(x) : R \ Nq → R, x 7→ q q(x) eine rationale Funktion. Unser Ziel ist es nun, eine rationale Funktion p q als Summe von rationalen Funktio- nen darzustellen, deren Zähler- und Nennergrade möglichst klein sind. Wir beginnen mit einem einfachen Fall. Satz A.20 (Partialbruchzerlegung, 1.Variante). Seien p, q Polynome (q normiert) mit deg p < deg q und seien λ1 , . . . , λm ∈ R m Q paarweise verschiedene reelle Zahlen, so dass q(x) = (x − λj ) ist. (Wir setzen j=1 also voraus, dass q vollständig in Linearfaktoren zerfällt und alle Nullstellen von q Ordnung 1 haben.) Dann gilt: m ∃(!) a1 , . . . , am ∈ R mit p(x) X aj = q(x) j=1 x − λj für x ∈ R \ Nq Wir verzichten auch hier auf einen Beweis und betrachten stattdessen einige Beispiele, an denen man die Vorgehensweise erkennt. Beispiel A.21. (a) Betrachte p(x) q(x) = −x+5 x2 +3x−4 . Zunächst faktorisieren wir den Nenner und erhalten q(x) = (x − 1)(x + 4). Wir sind also in der Sitiuation von Satz A.20. Wir bringen nun den Term a1 x−1 + a2 x+4 (mit noch zu bestimmenden a1 , a2 ∈ R) auf den Hauptnenner und sortieren dann den Zähler nach Potenzen von x. Es gilt: a1 a2 a1 (x + 4) + a2 (x − 1) (a1 + a2 )x + (4a1 − a2 ) + = = x−1 x+4 (x − 1)(x + 4) q(x) Nun vergleichen wir die Koeffizienten im Zähler mit denen von p und erhalten ein (lineares) Gleichungssystem für a1 und a2 , das wir dann lösen: ( a1 + a2 4a1 − a2 = −1 = 5 ) ( ⇔ a1 = a2 = 4 5 − 59 ) Also gilt: 4 − 59 −x + 5 5 = + x2 + 3x − 4 x−1 x+4 (b) Wir betrachten −3x+10 x3 −4x für x ∈ R \ {−4, 1} und faktorisieren den Nenner: x3 −4x = x(x−2)(x+2). Es gilt: a1 a2 a3 + + x x−2 x+2 = = 188 a1 (x − 2)(x + 2) + a2 x(x + 2) + a3 x(x − 2) x(x − 2)(x + 2) (a1 + a2 + a3 )x2 + (2a2 − 2a3 )x + (−4a1 ) x3 − 4x Koeffizientenvergleich liefert: a1 + a2 + a3 = 2a2 − 2a3 = −4a1 = 0 −3 10 ⇔ a1 a2 a 3 = − 52 1 = 2 = 2 Also gilt: 5 1 2 −3x + 10 =− + + x3 − 4x 2x 2(x − 2) x + 2 für x ∈ R \ {−2, 0, 2} Die Voraussetzung in Satz A.20, dass die Nullstellen von q Vielfachheit 1 haben, hat zur Folge, dass das auftretende lineare Gleichungssystem lösbar ist. Im Fall höherer Vielfachheiten muss ein anderer Ansatz verwendet werden. Es gilt die folgende allgemeinere Version des Satzes über die Partialbruchzerlegung. Satz A.22 (Partialbruchzerlegung, 2.Variante). Seien p, q Polynome (q normiert) mit deg p < deg q und q(x) = m Q (x − λj )ei . j=1 (Wir setzen also nach wie vor voraus, dass q vollständig in Linearfaktoren zerfällt. Allerdings dürfen die (paarweise verschiedenen) Nullstellen λ1 , . . . , λm ∈ R von q nun mit beliebigen Vielfachheiten e1 , . . . , em ∈ N∗ auftreten.) Dann gilt: ej m ∃(!) aj,k ∈ R mit aj,k p(x) X X = q(x) j=1 (x − λj )k für x ∈ R \ Nq k=1 Auch hierzu einige Beispiele. Beispiel A.23. (a) Betrachte x3 −3x+1 (x+2)4 . Wir setzen nun a1 a2 a3 a4 + + + x + 2 (x + 2)2 (x + 2)3 (x + 2)4 mit a1 , . . . , a4 ∈ R an. (In der Notation von Satz A.22 wären die gesuchten Zahlen mit a1,1 , . . . , a1,4 bezeichnet.) Nun verfahren wir wie zuvor (zusammenfassen, nach Potenzen von x sortieren und Koeffzientenvergleich): a2 a3 a4 a1 + + + 2 3 x + 2 (x + 2) (x + 2) (x + 2)4 = a1 (x + 2)3 + a2 (x + 2)2 + a3 (x + 2) + a4 (x + 2)4 = a1 x3 + (6a1 + a2 )x2 + (12a1 + 4a2 + a3 )x + (8a1 + 4a2 + 2a3 + a4 ) (x + 2)4 Koeffizientenvergleich liefert: a1 6a1 + a2 12a1 + 4a2 + a3 8a1 + 4a2 + 2a3 + a4 = = 1 0 = −3 = 1 ⇔ a1 a 2 a3 a4 1 = −6 = 9 = −1 = 189 A. Anhang Also gilt : x3 − 3x + 1 1 9 1 6 = + − − (x + 2)4 x + 2 (x + 2)2 (x + 2)3 (x + 2)4 (b) Betrachte 2x2 −3x+5 x3 +x2 −5x+3 . für x ∈ R \ {−2} Zunächst faktorisieren wir den Nenner, es gilt x3 + x2 − 5x + 3 = (x − 1)2 (x + 3). Gemäß Satz A.22 suchen wir nun a1,1 = u, a1,2 = v, a2,1 = w ∈ R (die Umbenennung dient lediglich der übersichtlicheren Notation) und betrachten w v u + + x − 1 (x − 1)2 x+3 = u(x − 1)(x + 3) + v(x + 3) + w(x − 1)2 (x − 1)2 (x + 3) = (u + w)x2 + (2u + v − 2w)x + (−3u + 3v + w) x3 + x2 − 5x + 3 Koeffizientenvergleich liefert: u+w 2u + v − 2w −3u + 3v + w Also: 2 = −3 = 5 = ⇔ u = v w = = 0 1 2 2x2 − 3x + 5 1 2 = + x3 + x2 − 5x + 3 (x − 1)2 x+3 Es ist nun noch offen, ob es noch eine Version der Partialbruchzerlegung gibt, wenn das Polynom im Nenner nicht vollständig in Linearfaktoren zerfällt oder wenn der Zählergrad größer oder gleich dem Nennergrad ist. Zumindest den zweiten Teil der Frage können wir leicht mit Hilfe der Polynomdivision beantworten.1 Bemerkung A.24. Sind p, q Polynome mit deg q ≥ 1, so gibt es Polynome s, r mit deg r < deg q und p(x) = s(x) · q(x) + r(x) und folglich r(x) p(x) = s(x) + q(x) q(x) für x ∈ R \ Nq . Man findet die Polynome r und s, indem man die Polynomdivision p(x) q(x) solan- ge durchführt bis der Zählergrad kleiner ist als der Nennergrad. Sei beispielsweise p(x) = 3x3 − 2x2 + 3x − 4 und q(x) = x2 − x. Man erhält: − − 3x3 −2x2 (3x3 −3x2 ) +3x −6 x2 +3x 2 −x) (x 4x 1 Für : (x2 − x) = 3x + 1 + 4x−6 x2 −x −6 −6 den ersten Teil der Frage muss man wissen, dass (und wie) man ein Polynom stets in Linear- faktoren mit Nullstellen in den komplexen Zahlen C zerlegen kann. Da wir diesen Zahlenraum hier nicht behandeln, können wir darauf nicht eingehen. 190 Also ist 3x3 − 2x2 + 3x − 4 = (3x + 1) · (x2 − x) + 4x − 6 | {z } | {z } =s(x) =r(x) beziehungsweise 4x − 6 3x3 − 2x2 + 3x − 4 = 3x + 1 + 2 . x2 − x x −x Auf den letzten Summanden r(x) q(x) können wir nun das schon bekannte Verfahren der Partialbruchzerlegung anwenden. Man erhält dabei 4x − 6 6 2 = − x2 − x x x−1 und folglich 3x3 − 2x2 + 3x − 4 6 2 = 3x + 1 + − 2 x −x x x−1 für x ∈ R \ {0, 1}. Der nächste Satz beschreibt die Partialbruchzerlegung in der (für diese Vorlesung) allgemeinsten Version. Satz A.25 (Partialbruchzerlegung). Seien p, q Polynome (q normiert) mit q(x) = m Q (x − λj )ei . (Es sind λ1 , . . . , λm ∈ R j=1 die (paarweise verschiedenen) Nullstellen von q und e1 , . . . , em ∈ N∗ ihre Vielfachheiten.) Dann gilt: ∃(!) Polynom s und aj,k ∈ R mit ej m X X p(x) aj,k = s(x)+ q(x) (x − λj )k j=1 für x ∈ R\Nq k=1 Abbildungen und Funktionen A.26. Abbildungen Eine Abbildung Φ kann wie folgt beschrieben werden: 1.) Angabe einer Definitionsmenge A 2.) Angabe einer Zielmenge B 3.) Angabe einer Vorschrift x 7→ f (x), wie jedem Element x ∈ A ein Element Φ(x) ∈ B (Funktionswert von Φ an der Stelle x) zugeordnet werden kann Man schreibt: Φ : A → B, x 7→ Φ(x). Die Wertemenge der Funktion besteht aus allen Elementen Φ(x) mit x ∈ A, also: WΦ = {Φ(x); x ∈ A} = {y ∈ B; ∃x ∈ A mit Φ(x) = y} ⊂ B • Beispielsweise ist L : {Hans, Franz, Fritz} → {rot, gelb, grün, blau, schwarz, weiß} , Hans 7→ rot Franz 7→ blau Fritz 7→ rot 191 A. Anhang die Abbildung, die drei Personen ihre Lieblingsfarbe zuordnet. Die Wertemenge ist WL = {rot, blau}. • Auch f : R \ {1} → R, x 7→ x+3 x−1 ist eine Abbildung, beispielsweise wird x = 5, die Zahl f (5) = 2 zugeordnet. A.27. Umkehrabbildung Eine Abbildung Φ : A → B heißt • injektiv, falls zwei verschiedene Werte aus A stets auch verschiedene Funktionswerte haben, also: def Φ injektiv ⇔ (x, y ∈ A, x 6= y ⇒ Φ(x) 6= Φ(y)) ⇔ (x, y ∈ A, Φ(x) = Φ(y) ⇒ x = y) • surjektiv, falls zu jedem Wert y ∈ B ein Wert x ∈ A existiert, der auf y abgebildet wird, also def Φ surjektiv ⇔ ∀y ∈ B ∃x ∈ A mit Φ(x) = y ⇔ WΦ = B • bijektiv, falls Φ injektiv und surjektiv ist. Dies ist genau dann der Fall, wenn jedem Element y ∈ B genau ein x ∈ A zugeordnet wird. Also: Φ bijektiv ⇔ (∀y ∈ B ∃!x ∈ A mit Φ(x) = y) Falls Φ bijektiv ist, existiert die sogenannte Umkehrabbildung Φ−1 : B → A von Φ. Diese erfüllt: Φ−1 ( Φ(x) ) = x (x ∈ A) und Φ Φ−1 (y) = y (y ∈ B) Ist Φ injektiv (aber nicht unbedingt surjektiv), so kann man immer noch eine Umkehrfunktion angeben, die dann aber nicht auf ganz B, sondern nur auf der Wertemenge WΦ definiert ist. Dann ist Φ−1 : WΦ → A die Funktion mit: Φ−1 ( Φ(x) ) = x (x ∈ A) und Φ Φ−1 (y) = y (y ∈ WΦ ) Wir untersuchen Abbildungen, bei denen sowohl Definitions- als auch Zielmenge Teilmengen von R sind (und benutzen dann den Begriff ’Funktion’). Meist ist der Zielbereich sogar ganz R, also haben wir D ⊂ R, f : D → R, x 7→ f (x) Wir wollen den Begriff der Umkehrfunktion an einigen Beispielen klar machen. Beispiel A.28. • Die Funktion f : R → R, x 7→ x2 ist weder injektiv noch surjektiv, denn es ist f (2) = f (−2) mit 2 6= −2 und @x ∈ R mit f (x) = −1. 192 • Die Funktion g : [0, ∞) → [0, ∞), x 7→ x2 ist bijektiv, die Umkehrfunktion ist √ g −1 : [0, ∞) → [0, ∞), x 7→ x. • Die Funktion g0 : [0, ∞) → R, x 7→ x2 ist injektiv, aber nicht surjektiv, die Wertemenge ist Wg0 = [0, ∞). Die Umkehrfunktion ist: (g0 )−1 : [0, ∞) → [0, ∞), x 7→ √ x • Die Funktion h : (−∞, 0] → [0, ∞), x 7→ x2 ist bijektiv, die Umkehrfunktion √ ist h−1 : [0, ∞) → (−∞, 0], x 7→ − x. A.29. Strenge Monotonie Sei D ⊂ R und f : D → R eine Funktion. Man nennt f • streng monoton wachsend, falls: ∀x, y ∈ D mit x < y gilt f (x) < f (y) • streng monoton fallend, falls: ∀x, y ∈ D mit x < y gilt f (x) > f (y) Beispielsweise ist die Funktion [0, ∞) → R, x 7→ x2 streng monoton wachsend, die Funktion (−∞, 0] → R, x 7→ x2 ist streng monoton fallend und die Funktion R → R, x 7→ x2 ist nicht streng monoton. Man beachte: Streng monotone Funktionen sind immer injektiv. Potenzen und Logarithmen Mithilfe von Reihen lassen sich einige wichtige Funktionen definieren, die in der Analysis studiert werden. Wir untersuchen dies am Beispiel der Exponentialfunktion. A.30. Frage nach der Definition allgemeiner Potenzen Wir haben schon in Kapitel 1 Potenzen ax definiert, falls die Basis a ∈ (0, ∞) und der Exponent x ∈ Q liegt (vergleiche 1.21 (d)). Es stellt sich die Frage, ob man diese Definition sinnvoll für beliebige Exponenten x ∈ R verallgemeinern kann (unter anderem soll dabei die Gültigkeit der Potenzgesetze erhalten bleiben). Es stellt sich heraus, dass dies gar nicht so einfach ist. Eine Möglichkeit besteht darin, (für festes a > 0) die Funktion R → R, x 7→ ax als die stetige Funktion zu definieren, die die schon bekannte Funktion Q → R, x 7→ ax fortsetzt. Allerdings ist dabei nicht klar, ob es solch eine (eindeutig bestimmte) stetige Fortsetzung überhaupt gibt. Wir werden daher einen anderen Weg einschlagen, um verallgemeinerte Potenzen 193 A. Anhang zu definieren. Im ersten Schritt definieren wir dazu den Funktionswert der Exponentialfunktion an der Stelle x ∈ R als den Wert einer bestimmten (von x abhängigen) konvergenten Reihe. A.31. Die Exponentialfunktion Für ein (beliebiges) x ∈ R ist die Reihe ∞ P k=0 xk k! nach dem Quotientenkriterium 3.20 absolut konvergent, denn es gilt k+1 x (k+1)! k = |x| k→∞ x k + 1 −→ 0 ∈ [0, 1). k! Man schreibt exp(x) = ∞ X xk k=0 k! für den Reihenwert. Die Funktion exp : R → R, x 7→ exp(x) heißt Exponentialfunktion auf R. Von fundamentaler Bedeutung ist die Gültigkeit der folgenden Funktionalgleichung: Für alle x, y ∈ R gilt exp(x + y) = exp(x) · exp(y). Beweis. als Zusatzaufgabe in den Übungen Mit Hilfe dieser Gleichung können nun weitere Eigenschaften der Exponentialfunktion leicht abgeleitet werden. (i) Es ist exp(0) = 1. (ii) Für alle x ∈ R ist exp(x) 6= 0 und exp(−x) = 1 exp(x) . (iii) Es ist exp(x) > 0 für alle x ∈ R. (iv) Für alle q ∈ Q und alle x ∈ R ist exp(x)q = exp (q · x). (v) Die Exponentialfunktion ist streng monoton wachsend, das heißt für x, y ∈ R mit x < y gilt exp(x) < exp(y). Beweis. (i) Es ist exp(0) = ∞ P k=0 0k k! =1+ ∞ P 0 = 1. k=1 (ii) Sei x ∈ R. Dann ist exp(x) · exp(−x) = exp(x + (−x)) = exp(0) = 1. Damit folgt die Behauptung. 194 (iii) Ist x > 0, so sind alle Summanden in der Reihe exp(x) = ∞ P k=0 xk k! positiv, also ist auch exp(x) > 0. Falls x < 0 ist, so ist −x > 0 und damit ist exp(−x) > 0. Wegen (ii) ist dann auch exp(x) > 0. (iv) Wir betrachten zunächst den Fall, dass q ∈ N ist. Dann gilt wegen der Funktionalgleichung q q X Y exp (q · x) = exp x = exp(x) = exp(x)q . j=1 j=1 Ist q ∈ Z mit q < 0, so gilt (ii) exp (q · x) = exp (−|q| · x) = Ist schließlich q = n m 1 1 = exp(x)q . = exp (|q| · x) exp(x)|q| mit n, m ∈ Z, m 6= 0, so gilt exp (q · x) m n = exp (m · q · x) = exp (n · x) = exp (x) . Zieht man auf beiden Seiten die m-te Wurzel, so folgt wie behauptet: exp (q · x) = exp(x)q . (v) Ist z > 0, so gilt exp(z) = 1 + ∞ P k=1 zk k! > 1. Ist x < y, so ist also exp(y − x) > 1 und folglich exp(y) = exp (x + (y − x)) = exp(x) · exp(y − x) > exp(x). Der Graph der Exponentialfunktion: 195 A. Anhang Bemerkung A.32. Die Zahl e = exp(1) = ∞ X 1 k! k=0 nennt man die Eulersche Zahl1 . Sie ist damit der Grenzwert der Partialsum auch n P 1 . Wir berechnen einige Folgenglieder: menfolge k! k=0 1 0! 1 0! 1 0! 1 0! 1 0! 1 0! 1 0! n∈N =1 + + + + + + 1 1! 1 1! 1 1! 1 1! 1 1! 1 1! =1 =1+1 + + + + + 1 2! 1 2! 1 2! 1 2! 1 2! =1+1+ + + + + 1 3! 1 3! 1 3! 1 3! =1+1+ + + + 1 4! 1 4! 1 4! =1+1+ + + 1 5! 1 5! =1+1+ + 1 6! =1+1+ =2 1 2 1 2 1 2 1 2 1 2 = 2.5 + + + + 1 6 1 6 1 6 1 6 ≈ 2.6667 + + + 1 24 1 24 1 24 ≈ 2.7083 + + 1 120 1 120 ≈ 2.7166 + 1 720 ≈ 2.7181 ••• Die Partialsummen bilden also schon relativ schnell eine sehr gute Näherung. A.33. Die (natürliche) Logarithmusfunktion Die Exponentialfunktion exp ist injektiv (denn sie ist streng monoton wachsend). Nach A.31 (iii) gilt für ihren Wertebereich exp(R) ⊂ (0, ∞). Man kann zeigen, dass jeder Wert in (0, ∞) auch tatsächlich von der Exponentialfunktion angenommen wird (wir wollen dies in Kapitel 4 tun, denn wir benötigen dazu den Stetigkeitsbegriff und den Zwischenwertsatz). Folglich existiert die Umkehrfunktion ln = exp−1 : (0, ∞) → R, x 7→ ln x. Man nennt diese Umkehrfunktion den natürlichen Logarithmus (oder auch Logarithmus zur Basis e). Es folgen einige elementare Eigenschaften: • Für alle x ∈ (0, ∞) gilt exp (ln(x)) = x. Für alle y ∈ R gilt ln (exp y) = y. (Dies folgt unmittelbar aus der Definition des Logarithmus’ als Umkehrfunktion von exp.) • Für alle x, y ∈ (0, ∞) gilt ln(x · y) = ln x + ln y. Beweis. Für alle x, y ∈ (0, ∞) gilt: exp (ln(x · y)) = x · y = exp(ln x) · exp(ln y) = exp (ln x + ln y) Aus der Injektivität der Exponentialfunktion folgt die Behauptung. • Es ist ln(1) = 0 und ln(e) = 1 (klar, denn exp(0) = 1 und exp(1) = e). 1 Wir wollen hier nicht beweisen, dass diese Zahl mit der in Beispiel 2.26 definierten Zahl e übereinstimmt. Dies ist aber in der Tat der Fall 196 • Für alle x ∈ (0, ∞) und alle q ∈ Q ist ln(xq ) = q · ln x. Beweis. Für alle x, y ∈ (0, ∞) und alle q ∈ Q gilt: exp (ln(xq )) = xq = (exp(ln x)) q A.31 (iv) = exp (q · ln x) Aus der Injektivität der Exponentialfunktion folgt die Behauptung. • Nun folgt: 1 = − ln(y) ln y und folglich ln x = ln x − ln y y (x, y ∈ (0, ∞)) • Da die Exponentialfunktion streng monoton wachsend ist, ist auch die Logarithmusfunktion streng monoton wachsend. Es gilt also: 0 < x < y ⇒ ln x < ln y Folglich ist ln x < 0 für x ∈ (0, 1) und ln x > 0 für x ∈ (1, ∞). Der Graph der Logarithmusfunktion: Mit Hilfe der Funktionen exp und ln können wir nun allgemeine Potenzen ax mit a ∈ (0, ∞) und x ∈ R definieren. Dazu beachte man, dass wir aq für q ∈ Q auch wie 197 A. Anhang folgt umschreiben können: aq = exp (ln (aq )) = exp (q · ln a) Daher ist die folgende Definition eine Verallgemeinerung der uns bereits aus 1.2 und 1.21 bekannten Potenzen: Definition A.34. Für a ∈ (0, ∞) und x ∈ R sei ax = exp (x · ln a). Mit dieser Definition gelten die Rechenregeln für Potenzen aus 1.2 nun für beliebige reelle Exponenten x, y (und positive Basen a, b): ax = ax−y , ay ax · ay = ax+y , ax · bx = (a · b)x , a x b = (ax )y = axy , ax , bx 1x = 1. A.35. Exponential- und Potenzfunktionen Ist a > 0 mit a 6= 1 fest, so heißt die Funktion R → R, x 7→ ax Exponentialfunktion zur Basis a. Ist a = e, so entspricht diese Funktion der Exponentialfunktion (d.h. es ist ex = exp x (x ∈ R)). Die Exponentialfunktion zur Basis a ist streng monoton wachsend, falls a > 1 ist und streng monoton fallend, falls a < 1 ist. Hier die Graphen einiger Exponentialfunktionen: 198 Ist r ∈ R fest, so heißt die Funktion (0, ∞) → R, x 7→ xr Potenzfunktion. Im Fall r ∈ N kann der Definitionsbereich auf ganz R erweitert werden. Ist r ∈ Z mit r < 0, so ist die Funktion noch auf R \ {0} definiert. Ist def schließlich r ∈ (0, ∞) \ N, so kann man die Funktion durch 0r = 0 noch sinnvoll auf [0, ∞) fortsetzen. Hier einige Beispiele mit den entsprechenden Graphen: 199 A. Anhang • R → R, x 7→ xn mit n ∈ N • R \ {0} → R, x 7→ xz 7 mit z ∈ Z, z < 0 • [0, ∞) → R, x 7→ x 4 = (0, ∞) → R, x 7→ x 200 − 23 √ 4 = x7 , 1 √ 3 2 x 1 [0, ∞) → R, x 7→ x 4 = √ 8 x, A.36. Logarithmusfunktion zur Basis a Sei a > 1 gegeben. Die Exponentialfunktion R → R, 7→ ax ist streng monoton wachsend und damit injektiv. Ihr Wertebereich ist (0, ∞). Daher existiert eine Umkehrfunktion: loga : (0, ∞) → R, x 7→ loga x Diese Funktion wird Logarithmus zur Basis a genannt. Definitionsgemäs ist loga x die Zahl, mit der man a potenzieren muss, um x zu erhalten, es gilt also aloga x = x für x ∈ (0, ∞). Auch hierfür gelten die Logarithmengesetze: x = loga x−loga y, loga (xr ) = r·loga x loga (x·y) = loga x+loga y, loga y loga 1 = 0, (x ∈ (0, ∞), r ∈ R) loga a = 1 Der Logarithmus zur Basis e ist der natürliche Logarithmus (also loge = ln). Der Logarithmus zur Basis 10 wird auch als dekadischer Logarithmus bezeichnet. Graphen von Logarithmusfunktionen: Die trigonometrischen Funktionen Die Definition von Sinus und Kosinus erfolgt in der Schule üblicherweise am Einheitskreis: Ein Strahl, der im Nullpunkt beginnt und mit der positiven x-Achse den 201 A. Anhang (gegen den Uhrzeigersinn gemessenen) Winkel α bildet, schneidet den Einheitskreis im Punkt (cos α, sin α). Damit diese Beschreibung der trigonometrischen Funktionen mit der in A.37 folgenden Reihendarstellung übereinstimmt, muss der Winkel α im Bogenmaß angegeben werden.1 A.37. Reihendarstellung Analog zur Exponentialfunktion können auch Sinus- und Kosinusfunktion durch eine Reihendarstellung definiert werden. Man setzt: sin(x) = ∞ X (−1)k (2k+1) x (2k + 1)! und k=0 cos(x) = ∞ X (−1)k k=0 (2k)! x(2k) (x ∈ R) (Die Reihen konvergieren nach dem Quotientenkriterium 3.20.) Aus diesen Definitionen ließen sich nun alle Eigenschaften der trigonometrischen Funktionen, die in diesem Abschnitt aufgeführt werden, herleiten. Da dies aber nur mit großem technischem Aufwand zu bewältigen ist, verzichten wir hier auf die Beweise und geben stattdessen eine Auflistung einiger (bekannter) Tatsachen. • Die Funktion sin hat eine kleinste positive Nullstelle. Sie ist irrational und wird mit mit π bezeichnet. Es gilt π ≈ 3.14159 . . .. In der Geometrie beschreibt diese sogenannte Kreiszahl das Verhältnis des Umfangs eines Kreises zu seinem Durchmesser. • Die Funktionen sin : R → R und cos : R → R sind 2π-periodisch. Das bedeutet: sin(x) = sin (x + 2π) 1 Zur 202 und cos(x) = cos (x + 2π) Erinnerung: Ein Winkel von 360◦ hat das Bogenmaß 2π. (x ∈ R) • Die Sinusfunktion ist symmetrisch zum Nullpunkt, die Kosinusfunktion ist symmetrisch zur y-Achse. Es gilt also: sin(−x) = − sin(x) und cos(−x) = cos(x) (x ∈ R) • Der Graph der Sinusfunktion geht durch Verschiebung um π 2 in +x-Richtung aus dem Graphen der Kosinusfunktion hervor. In einer Gleichung ausgedrückt bedeutet das: π sin(x) = cos x − 2 (x ∈ R) • Eine Verschiebung des Graphen der Sinus- bzw. der Kosinusfunktion um π in ±x-Richtung entspricht einer Spiegelung an der x-Achse, das heißt: sin(x−π) = sin(x+π) = − sin(x) und cos(x−π) = cos(x+π) = − cos(x) (x ∈ R) Zusammen mit der Periodizität folgt daraus für alle x ∈ R und alle k ∈ Z: ( sin(x) , falls k gerade sin (x + kπ) = − sin(x) , falls k ungerade • Es gelten die Additionstheoreme: sin(x + y) = sin x · cos y + sin y · cos x cos(x + y) = cos x · cos y − sin x · sin y (x, y ∈ R) • Außerdem ist: sin2 (x) + cos2 (x) = 1 (x ∈ R) • Im Bereich 0, π2 haben sin und cos (unter anderem) folgende Funktionswerte: α 0 30◦ √ 1 2 1= √ 1 2 3 π 4 π 3 π 2 60◦ 90◦ √ √ 1 1 1 sin α 2 2 3 2 4=1 √ √ 1 1 1 cos α 2 1= 2 2 0=0 Entsprechende Funktionswerte (außerhalb von 0, π2 ) kann man sich nun mit Gradmaß 0◦ √ 1 2 0=0 √ 1 2 4=1 π 6 45◦ √ 1 2 2 √ 1 2 2 Hilfe obiger Gleichungen leicht überlegen. Beispielsweise: 1 1 1 -) sin − 17 3 π = sin 3 π − 6π = sin 3 π = 2 √ 1 1 1 -) cos 31 6 π = cos 6 π + 5π = − cos 6 π = − 2 3 3 3 1 π -) sin 19 4 π = sin 4 π + 4π = sin 4 π = sin 4 π + 2 = cos 1 4π = 1 2 √ 2 • Für alle x ∈ R sind sin(x), cos(x) ∈ [−1, 1]. Immer im Abstand von π nehmen die Funktionen sin bzw. cos die Funktionswerte ±1 (immer im Wechsel) an, dazwischen sind sie jeweils streng monoton. Genau in der Mitte der Monotonieintervalle befinden sich die Nullstellen. Genauer gilt: 203 A. Anhang x − 3π 2 ... sin(x) . . . % x −π cos(x) . . . & π 2 0 3π 2 π 2π 5π 2 3π −π − π2 π 2 0 3π 2 π 2π 5π 2 3π ... & −1 % 0 % 1 & 0 & −1 % 0 % 1 & 0 & −1 % . . . 0 • Graphen von sin und cos: A.38. Die Tangensfunktion Man definiert Dtan = R \ nπ 2 o + kπ; k ∈ Z = {x ∈ R; cos(x) 6= 0} und tan(x) = sin(x) cos(x) (x ∈ Dtan ). Die Tangensfunktion ist π-periodisch: Für x ∈ Dtan ist auch x + π ∈ Dtan und es gilt tan(x + π) = tan(x). Desweiteren ist tan symmetrisch zum Nullpunkt (also tan(−x) = − tan(x) für alle x ∈ Dtan ) und hat in 0, π2 folgende Funktionswerte: α 0 π 6 π 4 π 3 π 2 Gradmaß 0◦ 30◦ 45◦ 90◦ tan α 0 √1 3 1 60◦ √ 3 nicht def. Zwischen zwei Definitionslücken ist die Tangensfunktion immer streng monoton wachsend. Ihr Graph sieht wie folgt aus: 204 ... & 0 & −1 % 0 % 1 & 0 & −1 % 0 % 1 & 0 & . . . 1 − 3π 2 ... − π2 A.39. Die Umkehrfunktionen der trigonometrischen Funktionen Betrachtet man die Funktionen sin, cos und tan als Funktionen auf ihrem gesamten Definitionsbereich mit Wertebereich R, so sind sie weder injektiv noch surjektiv (ausgenommen die Tangensfunktion, die immerhin surjektiv ist). Damit sie Umkehrfunktionen haben, muss man daher die Definitionsmenge geeignet einschränken. Dies kann man auf verschiedene Arten sinnvoll machen, wir verfolgen den üblichen (jedoch nicht einzig möglichen) Weg. Die Funktionen sin : π π −2, 2 → [−1, 1] [0, π] → → [−1, 1] cos : tan : − π2 , π2 R sind bijektiv und haben daher Umkehrfunktionen: π π −2, 2 arcsin : [−1, 1] → arccos : [−1, 1] → [0, π] arctan : R → − π2 , π2 . Die Graphen der Umkehrfunktionen: 205 A. Anhang Bemerkung A.40. In einem rechtwinkligen Dreieck, das einen weiteren Winkel mit Maß α ∈ 0, π2 besitzt, gilt (wenn A die Ankathete, G die Gegenkathete und H die Hypotenuse bezeichnet): sin(α) = G , H cos(α) = A H und tan(α) = G . A Die trigonometrischen Funktionen finden in der Geometrie noch vielfältige weitere Anwendungen. In dieser Vorlesung interessieren uns allerdings mehr ihre analytischen Eigenschaften. 206