Analysis MA S430 HS 2015 Dr. C. Albertini ii Inhaltsverzeichnis 1 Konvergenz und Grenzwerte von Folgen 1.1 Konvergenz und Grenzwerte von Folgen . 1.1.1 Reihen . . . . . . . . . . . . . . . . 1.2 Die Vollständigkeit von R . . . . . . . . . 1.2.1 Etwas Geschichte... . . . . . . . . . √ 1.2.2 Die Zahl 2 . . . . . . . . . . . . . 1.2.3 Die Vollständigkeit . . . . . . . . . 1.2.4 Supremum und Infimum . . . . . . 2 Grenzwerte von Funktionen und 2.1 Grenzwerte von Funktionen . . 2.2 Uneigentliche Grenzwerte . . . . 2.3 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 10 13 13 17 19 22 Stetigkeit 27 . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 3 Zum Begriff der Ableitung 3.1 Das Änderungsverhalten einer Funktion . . . . 3.2 Die lokale Änderungsrate - ein Beispiel . . . . 3.3 Die Idee von Weierstrass . . . . . . . . . . . . . 3.3.1 Die Ableitung: Der von h unabhängige – Faktor . . . . . . . . . . . . . . . . . . 3.3.2 Grafische Interpretation . . . . . . . . . 3.3.3 Die lineare Approximation . . . . . . . 3.4 Stetigkeit und Differenzierbarkeit . . . . . . . . . . . – . . . . 4 Monotonie und Ableitung 4.1 Das Monotoniekriterium . . . . . . . . . . . . . . 4.2 Der Schrankensatz . . . . . . . . . . . . . . . . . . 4.3 Der Mittelwertsatz . . . . . . . . . . . . . . . . . . 4.4 Kettenregel und Ableitung der Umkehrfunktion 4.5 Globale und lokale Extrema . . . . . . . . . . . . . . . . . . in . . . . . . . . . . . . . . . . . . . . Bezug . . . . . . . . . . . . . . . . 51 . . . . . . . . . . . 51 . . . . . . . . . . . 56 . . . . . . . . . . . 60 auf h constante . . . . . . . . . . . 61 . . . . . . . . . . . 62 . . . . . . . . . . . 63 . . . . . . . . . . . 69 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 73 82 83 85 89 5 Integralrechnung 93 5.1 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 5.1.1 Nochmals das ICE Beispiel . . . . . . . . . . . . . . . . . . . . . . . . . 93 5.1.2 Die Verallgemeinerung des ICE-Beispiels . . . . . . . . . . . . . . . . . 96 iv INHALTSVERZEICHNIS 5.2 5.3 5.4 5.1.3 Integrieren heisst Rekonstruieren . . . . . . . . . . . . . . . 5.1.4 Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.5 Flächeninhalt . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.6 Volumen von Rotationskörpern . . . . . . . . . . . . . . . . Das bestimmte Integral und die Integralfunktion . . . . . . . . . . 5.2.1 Der orientierte Flächeninhalt . . . . . . . . . . . . . . . . . 5.2.2 Das Prinzip von Cavalieri . . . . . . . . . . . . . . . . . . . Der Hauptsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4.1 Näherungsverfahren zur Integration . . . . . . . . . . . . . 5.4.2 Der natürliche Logarithmus und die Exponentialfunktion A Voraussetzungen aus der Mittelschule A.1 Arithmetische und geometrische Folgen A.2 Ableitungsregeln . . . . . . . . . . . . . . A.3 Integrationsregeln . . . . . . . . . . . . . A.4 Zusammenfassung wichtiger Funktionen und einer Stammfunktion F . . . . . . . A.5 Zusammenfassung Ableitungsregeln und Integrationsregeln . . . . . . . . . . A.6 Formelsammlung . . . . . . . . . . . . . . . . . f . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 99 100 102 103 110 112 113 116 116 120 125 . . . . . . . . . . . . . . . . . . . . . 125 . . . . . . . . . . . . . . . . . . . . . 128 . . . . . . . . . . . . . . . . . . . . . 130 mit ihrer Ableitungsfunktion f ′ . . . . . . . . . . . . . . . . . . . . . 131 . . . . . . . . . . . . . . . . . . . . . . 133 . . . . . . . . . . . . . . . . . . . . . . 134 B Ergänzungen 137 B.1 Die Betragsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 Bibliographie 141 Sachregister 141 Einführung Bekanntlich ist der Funktionsbegriff eine der tragenden Säulen des Gebäudes der Mathematik. In der Analysis wird das lokale Verhalten von reellen1 Funktionen untersucht. Das Leitmotiv ist die Frage, wie man lokale und globale Änderungen einer Funktion verstehen, beschreiben und präzis bestimmen kann. Das Besondere daran ist, dass in der Analysis das Änderungsverhalten einer Funktion wiederum mit einer Funktion beschrieben wird. Man betrachtet also immer Paare von Funktionen: Die eine beschreibt das Änderungsverhalten der anderen, welches wir in der Differentialrechnung untersuchen. Umgekehrt kann man aus dem Änderungsverhalten die ursprüngliche Funktion (bis auf eine Konstante) rekonstruieren. Dies führt zur Integralrechnung. Um ein alltägliches Beispiel zu nennen: Wenn ein Objekt sich bewegt, so können wir seine Geschwindigkeit (d.h. seine ”momentane” Geschwindigkeit) bestimmen, wenn wir zu jedem Zeitpunkt den zurückgelegten Weg kennen. Kennen wir umgekehrt zu jedem Zeitpunkt seine Momentangeschwindigkeit, so können wir seinen Bewegungsverlauf “im Grossen” rekonstruieren (d.h. den seit Beginn der Bewegung von ihm zurückgelegten Weg). Die Differentialrechnung ist entstanden aus einer Anzahl physikalischer und geometrischer Probleme, die eines gemeinsam haben: Es geht dabei stets um die Änderungsrate einer zeit- oder ortsabhängigen Grösse, also um Fragen wie Was ist die Steigung der Tangente an eine Kurve in einem ihrer Punkte? Was versteht man unter der (momentanen) Geschwindigkeit eines nicht gleichförmig bewegten Körpers? Was ist seine (momentane) Beschleunigung? Was ist die (momentane) Stromstärke eines Flüssigkeitsstromes oder eines elektrischen Stromes? Was versteht man unter der Dichte eines inhomogenen Körpers in einem seiner Punkte? 1 Wir sprechen von einer reellen Funktion f ∶ A → B, wenn sowohl der Definitionsbereich A als auch die Zielmenge B Teilmengen von R sind. vi INHALTSVERZEICHNIS In dieser Vorlesung setze ich Analysis-Kenntnisse aus der Mittelschule voraus. Im Anhang A finden Sie eine Zusammenfassung der Inhalte, welche ich als bekannt annehme. ******* Ein besonderer Dank geht an Martin Huber, der dieses Skript mit viel Geduld und unter grosser Sorgfalt gegengelesen hat und mir viele wertvolle Ideen und Hinweise gegeben hat. Kapitel 1 Konvergenz und Grenzwerte von Folgen Der Grenzwert ist der wichtigste Begriff der Analysis1 . Wir werden diesen Begriff zunächst für Folgen einführen. Dies erlaubt uns u.a., die Vollständigkeit der reellen Zahlen zu beschreiben und untersuchen. Die Vollständigkeit von R ist eine der wesentlichen Eigenschaften, welche R von Q unterscheidet und für den Aufbau der Analysis unabdingbar ist. 1.1 Konvergenz und Grenzwerte von Folgen Im Modul “Grundbegriffe der Mathematik” [HAG, S.102] haben wir Folgen als Funktionen (linkstotal und rechtseindeutig) mit Definitionsbereich N0 definiert. In diesem Modul werden wir ausschliesslich Zahlenfolgen (d.h. die Werte f (n) sind (reelle) Zahlen) betrachten und den Funktionswert f (n) häufig kürzer mit fn bezeichnen. Also: Definition 1.1 Eine Zahlenfolge (kurz Folge) ist eine Funktion a ∶ N0 → R ∶ n ↦ an oder a ∶ N → R ∶ n ↦ an Wir nennen an das n-te Glied der Folge a. Wie in [HAG] erwähnt, werden Folgen meist explizit oder rekursiv 2 definiert. 1 [HA1, S.5] sagt: “Als das mächtigste und unverzichtbare Hilfsmittel für jede in die Tiefe dringende Untersuchung” des lokalen Verhaltens einer Funktion “wird sich der Begriff des Grenzwertes in seinen vielfältigen Formen und Anwendungen erweisen. Es ist das Herzstück und der Kraftquell der Analysis...” 2 Aus [HAG, S.103] wissen Sie, dass jede rekursiv definierte Folge tatsächlich eine Folge (Funktion) ist. 2 1. Konvergenz und Grenzwerte von Folgen Beispiele 1.2 • Die Folge der natürlichen Zahlen 0, 1, 2, 3, ... wird explizit definiert durch a ∶ N0 → R ∶ n ↦ n. • Die Folge der geraden Zahlen 0, 2, 4, 6, ... wird definiert durch b ∶ N0 → R ∶ n ↦ 2n. • Die Folge der ungeraden Zahlen 1, 3, 5, 7, ... wird definiert durch c ∶ N0 → R ∶ n ↦ 2n + 1. • Die Folge der Quadratzahlen 0, 1, 4, 9, 16, ... wird definiert durch q ∶ N0 → R ∶ n ↦ n2 . • Die Fibonacci Folge 0, 1, 1, 2, 3, 5, ... wird rekursiv definiert durch f0 = 0, f1 = 1 und fn = fn−1 + fn−2 . • Die harmonische Folge ist gegeben durch h ∶ N → R ∶ n ↦ 1 n . √ √ √ • Die Folge der Quadratwurzeln 0, 1, 2, 3, 4, ... ist gegeben durch r ∶ N0 → R ∶ n ↦ √ n. Sie kann als “Wurzelschnecke” [SSAA, S. 183] dargestellt werden. Figur 1: Die Folge der Quadratwurzeln 1.1. Konvergenz und Grenzwerte von Folgen 3 Und noch eine Notation... Anstatt a ∶ N0 → R ∶ n ↦ an werden wir häufig einfach (an )n∈N0 oder auch nur (an ) schreiben. Bemerkung Wie im Beispiel der harmonischen Reihe, kann eine Folge erst ab einem bestimmten n > 0 definiert sein. In diesem Fall ist der Definitionsbereich der Folge eine Teilmenge von N0 . Wie bei jeder Funktion [HAG, S.64], können wir auch bei Folgen den Graph definieren: Definition 1.3 Der Graph der Folge (an )n∈N0 besteht aus den Punkten (n, an ) für n ∈ N0 . Beispiele 1.4 Im Folgenden sind einige Graphen von Folgen abgebildet: Figur√2: an = 4n2 + 8n − 2n Figur√3: bn = n Figur 4: cn = n1 Figur√5: d0 = 1, dn = dn−1 + 5 Figur 6: en = (−1)n+1 (1 + 10 n) Figur 7: gn = sin( n3 ) Wenn wir diese Graphen betrachten, sehen wir, dass in einigen Fällen die Punkte bei wachsendem n sich immer mehr einer horizontalen Gerade nähern. Die Punkte (n, an ) nähern sich immer mehr der Geraden y = 2, die Punkte des Graphen der harmonischen Folge (n, cn ) schmiegen sich immer mehr an die x-Achse an und die Punkte 4 1. Konvergenz und Grenzwerte von Folgen (n, dn ) nähern sich immer mehr der Geraden3 y = Figur 8: lim an = 2 √ 1+ 21 2 : Figur 9: lim cn = o n→∞ Figur 10: √ 1 + 21 lim dn n→∞ 2 n→∞ Definition 1.5 Die Folge (an )n∈N0 konvergiert gegen a für n gegen unendlich, geschrieben4 lim an = a n→∞ wenn für jede noch so kleine reelle Zahl ϵ > 0 ein Index nϵ existiert, sodass ∣an − a∣ < ϵ für alle n ⩾ nϵ gilt. Die Zahl a wird dann Grenzwert der Folge (an ) genannt. Formal können wir diese Definition wie folgt aufschreiben: lim an = a n→∞ :gdw. ∀ϵ > 0 ∃nϵ ∈ N0 ∀n ⩾ nϵ (∣an − a∣ < ϵ) . Man kann die Konvergenz von Folgen in den Graphen auch mit Hilfe von ϵ-Streifen veranschaulichen und untersuchen. Für jedes ϵ > 0 und jede Zahl a ∈ R können wir im Koordinatensystem den ϵ-Streifen um die Zahl a definieren: {(x, y) ∈ R∣ ∣y − a∣ < ϵ} (1.1) Wir bemerken, dass ∣y − a∣ < ϵ bedeutet, dass y eine Element des Intervalls ]a − ϵ, a + ϵ[ ist: ∣y − a∣ < ϵ ⇐⇒ −ϵ < y − a < ϵ ⇐⇒ a − ϵ < y < a + ϵ ⇐⇒ y ∈ ]a − ϵ, a + ϵ[ . 3 √ Das diese Folge gegen 1+ 2 21 konvergiert werden wir im Beispiel 1.21 auf Seite 21 zeigen. 4 Lies: “Der Limes von an für n gegen ∞ ist a.” (1.2) 1.1. Konvergenz und Grenzwerte von Folgen 5 Figur 11: ϵ-Streifen5 um a Definition der Konvergenz mit ϵ-Streifen: Eine Folge (an ) konvergiert genau dann gegen a, wenn für jedes noch so kleines ϵ > 0 ein Index nϵ existiert, sodass alle Punkte (n, an ) zum ϵ-Streifen um die Zahl a gehören, sobald n ⩾ nϵ . Figur 12: Ab n ⩾ 15 liegen alle Punkte (n, an ) im ϵ-Streifen. Beispiel 1.6 Wir wollen die Folge an = 5n 2n+8 auf Konvergenz untersuchen. Zunächst überlegen wir uns, welche Zahl der Grenzwert sein könnte. Dafür betrachten wir an für einige Zahlen n: a10 ≈ 1.78571, a100 ≈ 2.40385, a1000 ≈ 2.49004 und a1000000 ≈ 2.49999. Dies führt zur Vermutung, dass die Folge an gegen 2.5 konvergieren könnte. 5 Es ist zu beachten, dass die Punkte auf dem Rand y = a ± ϵ nicht zum ϵ-Streifen um a gehören. 6 1. Konvergenz und Grenzwerte von Folgen Falls unsere Vermutung richtig ist, sollten wir zu einem gegebenen noch so kleinen ϵ > 0 eine Zahl nϵ finden können, ab der ∣an − 2.5∣ < ϵ gilt: ∣an − 2.5∣ = ∣ −20 10 5n − 2.5∣ = ∣ ∣= . 2n + 8 2n + 8 n + 4 Also: 10 10 10 <ϵ⇔ <n+4⇔n> −4 n+4 ϵ ϵ Zu jedem ϵ können wir ein nϵ bestimmen: Falls zum Beispiel ϵ = 10−4 ist, dann können wir nϵ = 105 wählen (wir könnten auch nϵ = 107 wählen, denn bei der Konvergenz geht es nur um die Existenz eines nϵ , nicht um die Bestimmung eines “optimalen” nϵ ). ∣an − 2.5∣ < ϵ ⇔ Dass die harmonische Folge cn = n1 konvergiert, ist anschaulich klar und wird meistens als Axiom betrachtet (vgl. Satz des Eudoxus und Archimedisches Axiom S. 16). An dieser Folge beobachten wir eine sehr wichtige Tatsache: Zwar gilt cn > 0, ∀n ∈ N0 , aber lim cn = 0. D.h. n→∞ Aus an > a, ∀n ∈ N0 folgt nur: lim an ⩾ a . n→∞ Dass in diesem Fall limn→∞ an nicht kleiner als a sein kann, folgt unmittelbar aus der Definition des Grenzwerts. In der Vorlesung werden wir zeigen, dass die Folge (en ) mit en = (−1)n+1 (1 + 10 n ) (vgl. Figur 6) divergent ist und in den Übungen werden Sie die Divergenz der harmonischen Reihe untersuchen. Definition 1.7 Eine Folge, die nicht konvergiert, heisst divergent. Zum Beispiel sind die Folgen (bn ) der Quadratwurzeln (vgl. Figur 3) und die Folge (en ) (vgl. Figur 6) divergent. 1.1. Konvergenz und Grenzwerte von Folgen 7 Andere Darstellung der Konvergenz Wenn eine Folge (an ) gegen a konvergiert, dann befinden sich alle Folgenglieder ab anϵ im Intervall ]a − ϵ, a + ϵ[: hier höchstens endlich viele Glieder der Folge 142 hier fast alle Glieder der Folge 4 Mathematische Grundlagen der Analy Figur 13: Konvergenz einer Folge 1. Die Diagonale im Einheitsquadrat hat – wie die Pythagoräer leidvoll erfahr √ haben – die Länge 2 ≈ 1,4. In Abb. 4.27 sind im Einheitsquadrat diagona Beispiele: Grenzen der Anschauung (aus [BHA S.142]) Treppen zunehmender Stufenanzahl gezeichnet. Wenn die Stufenanzahl geg √ 1. Die Diagonale im Einheitsquadrat hat die Länge 2. In Figur 14 sind im Einheitsunendlich geht die Treppe in die Diagonale über.dieNun ist aber die Län quadrat diagonalegeht, Treppen zunehmender Stufenzahl gezeichnet. Wenn Stufenzahl gegenjeder unendlich geht, unabhängig geht die Treppevon in die Diagonale ist aberimmer die Länge Treppe, der Anzahlüber. ihrerNun Stufen, gleich 2! jeder Treppe, unabhängig von der Anzahl ihrer Stufen, immer gleich 2! Figur 14: Treppen im Einheitsquadrat Abb. 4.27: Treppen im Einheitsquadrat 2. Wenden wir nun in Figur 14 dieselbe Idee auf den Flächeninhalt der beiden Flächenstücke an, in diewir unsere Je feiner die Treppe ist, 2. Wenden beiTreppe Abb. das 4.27Einheitsquadrat dieselbe Ideezerlegt. auf den Flächeninhalt der beiden Fl desto weniger unterscheiden sich die beiden Flächenstücke. Das kann man genauer an,istindas dieobere unsere Treppe das Einheitsquadrat zerlegt. Je feiner d sagen:chenstücke Im linken Bild Flächenstück um vier Quadrate der Seitenlänge 2 1 ( 14 ) = 41 des Einheitsquadrats. als das um 4 ⋅ unterscheiden Im mittleren Treppe ist,untere, destoalso weniger sich die beiden Flächenstücke. D 4 grösser 1 obere also um Bild sind sechs genauer Quadrate der Seitenlänge 6 , das kannes man sagen: Im linken Bild istFlächenstück das obere ist Flächenstück um vi 1 ! " des Einheitsquadrats grösser. Und so geht das weiter: Je feiner die Treppe ist, 2 6 1 als das untere, also um n4 der · 14 = 14 d der Seitenlänge destoQuadrate weniger unterscheiden sich die beiden Flächenstücke; wenn die Anzahl 4 größer Einheitsquadrats. Im mittleren Bild sind es sechs Quadrate der Seitenlän 1 1 6 , das obere Flächenstück ist also um 6 des Einheitsquadrats größer. Und geht das weiter: Je feiner die Treppe ist, desto weniger unterscheiden sich d beiden Flächenstücke; wenn die Anzahl n der Treppenstufen gegen unendli 8 1. Konvergenz und Grenzwerte von Folgen Treppenstufen gegen unendlich geht, werden beide Flächenstücke gleich gross. Wieso scheint die Anschauung bei den Flächen ein sinnvolles Ergebnis zu ergeben, bei der Länge aber nicht? Satz 1.8 Grenzwert von Summe, Differenz, Produkt und Betrag von Folgen Gegeben seien zwei konvergente Folgen (an ) und (bn ) mit lim an = a und lim bn = b. n→∞ n→∞ Dann konvergieren auch die Folge der Summen (an + bn ), die Folge der Differenzen (an − bn ) und die Folge der Produkte (an ⋅ bn ) und es gilt: 1. lim (an + bn ) = a + b , n→∞ 2. lim (an − bn ) = a − b , n→∞ 3. lim (an ⋅ bn ) = ab , n→∞ 4. lim ∣an ∣ = ∣a∣ . n→∞ Satz 1.9 Grenzwert des Quotienten und der Quadratwurzel von Folgen Gegeben seien zwei konvergente Folgen (an ) und (bn ) mit lim an = a und lim bn = b. n→∞ n→∞ 1. Falls bn ≠ 0, ∀n ∈ N0 und b ≠ 0, so existiert und konvergiert auch die Folge an a lim der Quotienten ( abnn ) und es gilt: = , n→∞ bn b 2. Falls an ⩾ 0, ∀n ∈ N0 so existiert auch die Folge der Quadratwurzeln und √ √ es gilt: lim an = a . n→∞ Beispiele 1.10 1. Figur 8 (S.4) legt es nahe, dass limn→∞ können wir das nun zeigen: √ √ 4n2 + 8n − 2n = 2. Mit den obigen Sätzen √ √ 2 + 8n − 2n)( 4n2 + 8n + 2n) ( 4n 8n 8 √ 4n2 + 8n − 2n = =√ =√ . 4n2 + 8n + 2n 4n2 + 8n + 2n 4 + n8 + 2 1.1. Konvergenz und Grenzwerte von Folgen 9 Da die Folge der Quadratwurzeln und die Folge der Quotienten konvergiert, gilt: lim √ n→∞ Also: lim 8 4 + n8 + 2 √ n→∞ =√ 8 = 2. 4+2 4n2 + 8n − 2n = 2. 2. Für ∣q∣ < 1 konvergiert die geometrische Folge (an )n∈N0 mit an = q n gegen Null: lim q n = 0 n→∞ für ∣q∣ < 1 . (1.3) Um dies zu zeigen, brauchen wir die Bernoulli Ungleichung6 , welche besagt, dass für jede natürliche Zahl n ⩾ 2 und alle von Null verschiedenen x > −1 die folgende Ungleichung gilt: (1 + x)n > 1 + nx . (1.4) Im Fall q = 0 ist nichts zu zeigen. Wir dürfen also 0 < ∣q∣ < 1 annehmen. Dann ist gilt nach der Bernoullischen Ungleichung: ∣q n ∣ = ∣q∣n = 1 ∣q∣ = 1 + h mit einem h > 0 und somit 1 1 1 < < . n (1 + h) 1 + nh nh Sei ϵ > 0. Da die natürlichen Zahlen unbeschränkt sind (Satz des Eudoxos S.16) existiert eine natürliche Zahl nϵ mit 0< 1 < nϵ . ϵh Für alle n ⩾ nϵ gilt 1 <n ϵh und damit 1 <ϵ. nh Also gilt für alle n ⩾ nϵ ∣q n − 0∣ = ∣q n ∣ < 1 <ϵ. nh Damit haben wir gezeigt, dass die Folge (q n ) konvergent ist mit lim q n = 0. n→∞ 6 Sie haben die Bernoulli Ungleichung per vollständiger Induktion in den Übungen bewiesen. 10 1. Konvergenz und Grenzwerte von Folgen 1.1.1 Reihen Häufig interessieren wir uns nicht nur für eine Folge, sondern auch für ihre Summenfolge. Zum Beispiel interessieren wir uns für Summen von natürlichen Zahlen, geraden Zahlen, ungeraden Zahlen, Quadratzahlen, usw.: Definition 1.11 Addiert man endlich viele Glieder einer Folge, so erhält man für jedes n ∈ N0 eine Summe sn = a0 + a1 + a2 + a3 + ... + an . Dadurch entsteht aus einer gegebenen Folge (an )n∈N0 wieder eine Folge (sn )n∈N0 gegeben durch n sn = ∑ ak k=0 Die Folge (sn )n∈N0 heisst die zur Folge (an )n∈N0 gehörige Summenfolge oder Reihe. e Begriffe und Beispiele 185 ese Formel für die Summe der ersten n natürlichen Zahlen vereine Formel für die Summe s1.12 n Quadratzahlen zu n der ersten Beispiel Wie gross ist die Reihe also s0 := 0 und der Quadratzahlen: sn = 02 + 12 + 22 + 32 + 42 + ... + n2 ? sn = sn−1 + n2 + 32 + . . . + n2 fürWir n ∈ IN. Hierfür einen wollen wir einen Term machen Umweg und finden, berechnen Berechnung von snzahlen etwas leichter fällt als mit (8). Auf arabische [SSAA S.185]: telalters geht folgende Überlegung zurück (Fig. 2): t ) · (2n + 1), 2 ! n(n + 1) − n = n2 ! Figur 15: Geometrische Darstellung der dreifachen Summe der Quadratzahlen. " n2 2n + 1 )(2n + 1) . 6 eispiel benöormel zur Beolumens einer yramide. zuerst das Dreifache der Summe der Quadrat- n2 # 1 + 2 + ... + n = n(n + 1) 2 $ " Fig. 2: Berechnung der Quadratsumme Es gilt: 1)auf die der Berechnung des Volumens von Körpern ist n(n man +oft 3s = ⋅ (2n + 1) n durch Folgen angewiesen, selbst wenn der Körper durch ebene 2 d.h sn = n(n + 1)(2n + 1) . 6 (1.5) grenzt wird. Wir behandeln als Beispiel den einfachen Fall einer ischen Pyramide. In der Schule lernt man die Volumenformel ei G der Inhalt der Grundfläche und h die Höhe der Pyramide l kann man aber Beispiele nicht, wie die analoge Flächeninhaltsformel 1.13 eiecke mit der Grundseite g und der Höhe h, durch Zerschneiden volumengleiche Teile erhalten; sie lässt sich vielmehr nur mit • schließen Schreiben die Reihe, welche Methoden gewinnen: Wir die Sie Pyramide zwischen einen zur konstanten Folge 3, 3, 3, 3, ... gehört, auf. DieTreppenkörper “Reihen” der und einen einbeschriebenen ein,Primarschulen wie es Fig. 3 als können also als Reihen von konstanten Folgen ellt. terpretiert werden. " !" ! !x : a = ih : h n ! " ! " =⇒ ! " i · nh ! " x = ai n ! " h in- 1.1. Konvergenz und Grenzwerte von Folgen 11 • Es sei (an ) die Folge der Quadrate der Fibonacci-Folge (vgl. S.2). D.h. an = (fn )2 , ∀n ∈ N0 . Berechnen Sie die ersten 6 Glieder der Reihe, welche zu (an ) gehört. Im folgenden Satz werden geometrische Folgen und Reihen (vgl. Anhang A.1, S.125) auf ihre Konvergenz untersucht: Satz 1.14 Konvergenz und Divergenz von geometrischen Folgen und Reihen Sei a ∶ N0 → R ∶ n ↦ a0 ⋅ q n , q ≠ 0, eine geometrische Folge. 1. Für ∣q∣ < 1 haben geometrische Folgen den Grenzwert 0 (vgl. Anhang Abbildung A.2 und A.3, S.127) und die geometrische Reihe hat in diesem Fall den Grenzwert a0 ⋅ 1 . 1−q 2. Für q = 1 ist die geometrische Folge eine konstante Folge und die dazugehörige geometrische Reihe ist divergent. 3. Für q = −1 und für ∣q∣ > 1 sind geometrische Folgen und Reihen divergent. Beweis 1 (Beweis vom Satz 1.14) Wir beweisen nur dass die geometrische Reihe für ∣q∣ < 1 konvergiert. Nach Satz A.2 im Anhang A (S.126) gilt n sn = ∑ ak = a0 ⋅ k=0 also ist ∣sn − a0 ⋅ 1 − q n+1 , 1−q 1 ∣q∣n+1 ∣ = ∣a0 ∣ ⋅ . 1−q ∣1 − q∣ Zu beliebigen noch so kleinen ϵ > 0 kann man nun, wegen Beispiel 1.10.2 ein nϵ1 so bestimmen, dass ∣q∣n < ϵ1 ∶= ∣sn − a0 ⋅ ∣1−q∣⋅ϵ ∣a0 ∣∣q∣ für alle n > nϵ1 ist. Für diese n gilt dann 1 ∣a0 ∣ ∣a0 ∣ ∣1 − q∣ ⋅ ϵ ∣= ⋅ ∣q∣n ∣q∣ < ∣q∣ ⋅ = ϵ. 1−q ∣1 − q∣ ∣1 − q∣ ∣a0 ∣∣q∣ 12 1. Konvergenz und Grenzwerte von Folgen Definition 1.15 Eine Folge heisst monoton wachsend, wenn an+1 ⩾ an für alle n ∈ N0 gilt. Gilt jedes Mal sogar “>”, so heisst die Folge streng monoton wachsend. Analog sind monoton fallend und streng monoton fallend definiert. Eine Folge heisst beschränkt, wenn es eine positive reelle Zahl c gibt mit ∣an ∣ < c für alle n ∈ N0 . Beispiele 1.16 Wenn wir die Graphen auf Seite 3 betrachten, sehen wir, dass die Folge (bn ) streng monoton wachsend ist und dass die Folge (cn ) streng monoton fallend ist. Die Folgen (an ) und (dn ) sind monoton wachsend.7 Die Folgen (en ) und (gn ) sind weder monoton wachsend noch monoton fallend. Die Folge (bn ) ist nicht beschränkt, alle anderen Folgen im Beispiel auf Seite 3 sind beschränkt. Satz 1.17 Konvergente Folgen sind beschränkt Wenn eine Folge (an ) konvergent ist, dann ist sie beschränkt. Wie das Beispiel en = (−1)n+1 (1 + 10 n ) (S.3) zeigt, gilt die Umkehrung dieses Satzes nicht. Zum Schluss dieses Abschnittes definieren wir Cauchy-Folgen. Diese Definition steht im Zusammenhang mit der Vollständigkeit von R (siehe nächster Abschnitt). Definition 1.18 Eine Folge (an ) ist eine Cauchy-Folge, wenn für jede noch so kleine reelle Zahl ϵ > 0 ein Index nϵ existiert, sodass ∣an − am ∣ < ϵ für alle m, n mit n, m > nϵ gilt. Formal: ∀ϵ > 0 ∃nϵ ∈ N0 ∀n, m > nϵ (∣an − am ∣ < ϵ) (1.6) In den Übungen werden Sie zeigen, dass jede konvergente Folge eine Cauchy-Folge ist. Im nächsten Abschnitt werden wir sehen, dass die Charakterisierung der Vollständigkeit von R (vgl. Satz 1.2.3, S.19) die Eigenschaft ist, dass jede Cauchy-Folge konvergent ist. 7 Man kann nachweisen, dass beide Folgen sogar streng monoton wachsend sind, aber das ist im Graph nicht eindeutig ersichtlich. 1.2. Die Vollständigkeit von R 13 1.2 Die Vollständigkeit von R Den Umgang mit reellen Zahlen haben wir bisher als bekannt √ vorausgesetzt und deren Existenz ebenfalls. Wenn wir irrationale Zahlen wie π oder 2 brauchen, dann tippen wir sie in den Taschenrechner (oder im Computer) ein und erhalten eine rationale Annäherung der gewünschten Zahl in Form einer Dezimalzahl (und wir können auch mehr oder weniger angeben auf wie vielen Stellen genau diese Annäherung angegeben werden soll). D.h. wir arbeiten numerisch8 immer mit rationalen Zahlen. In der Mathematik werden neue Objekte in der Regel aus schon vorhandenen konstruiert. In der Schule gewinnt man z. B. die Brüche und die negativen Zahlen aus den natürlichen Zahlen. In Verallgemeinerung der Darstellung der rationalen Zahlen als endliche oder periodische Dezimalbrüche werden in der Schule die irrationalen (nicht-rationalen) Zahlen als unendliche, nichtperiodische Dezimalzahlen verstanden. Wieso reichen die rationalen Zahlen nicht aus, obwohl sie dicht auf dem Zahlenstrahl liegen, d. h. obwohl man zwischen zwei verschiedenen rationalen Zahlen immer unendlich viele weitere rationale Zahlen finden kann?9 Ein Grund ist sicher die Tatsache, dass es inkommensurable Strecken10 und damit auf dem Zahlenstrahl irrationale Punkte gibt11 . Der für uns wichtigere Grund ist, dass wir die reellen Zahlen brauchen, um sicher zu stellen, dass gewisse Grenzwerte von Folgen oder von Funktionen existieren d.h., dass es in R eben keine Lücken gibt. 1.2.1 Etwas Geschichte... Der folgende historische Überblick ist mehr oder weniger wörtlich aus [BHA] zitiert: Pythagoras von Samos (570 - 497v.Chr.) und seine Schüler glaubten in ihrer “rationalen Auffassung” der Natur, dass die natürlichen Zahlen das Mass aller Dinge sind und dass sich alles auf Verhältnisse natürlicher Zahlen zurückführen lässt. Aus der philosophischen Lehre des Pythagoras ergab sich zwingend, dass zwei beliebige Strecken a und b immer kommensurabel sein müssen, d.h. sich als ganzzahlige Vielfache einer kleineren Strecke e darstellen lassen: a = n ⋅ e und b = m ⋅ e Pythagoras von Samos (570 - 497 v. Chr.) 8 CAS-Taschenrechner arbeiten mit symbolischen Ausdrücken. 9 Wenn s < t zwei rationale Zahlen sind, dann besteht zum Beispiel die Folge (qn = s + t−s ) aus n unendlich vielen rationalen Zahlen, welche für alle n > 1 zwischen s und t liegen. 10 vgl. nächster Abschnitt √ 11 ... und wenn man einen einzigen irrationalen Punkt gefunden hat, wie z.B. 2, dann hat man unendlich √ viele irrationale Punkten gefunden, da für alle q ∈ Q auch q 2 irrational ist. 14 1. Konvergenz und Grenzwerte von Folgen eudoxus-1.jpg (JPEG-Grafik, 253x311 Pixel) mit natürlichen Zahlen n und m. Anders ausgedrückt müssen die Längen von a und b in einem rationalen n Verhältnis stehen: ab = m . Die Entdeckung inkommensurabler Strecken (d.h. irrationaler Zahlen) wurde von dem Pythagoräer Hippasos von Metapont im 5. Jahrhundert v. Chr. gemacht, der damit die Grundlage der pythagoräischen Philosophie erschütterte. Dass Hyppasos von einer Seereise nicht mehr zurückkam, deuteten seine “Sektenbrüder” als Strafe der Götter. Mit diesem Ereignis war aber das Problem der irrationalen Zahlen nicht aus der Welt geschaffen... Mit der Entdeckung von irrationalen Zahlen steckte die Mathematik, kurz nach ihrer Geburt, in ihrer “ersten Grundlagenkrise”: Alle Beweise, die auf der Grundlage kommensurabler Strecken geführt worden waren, brachen auf einmal zusammen. Ein Jahrhundert später entwickelte Eudoxos von Knidos (408 - 355 v. Chr.) den pythagoräischen Ansatz in seiner Grössen- und Proportionenlehre sowie mit der Exhaustionsmethode weiter und hat damit den ersten Schritt zu einer Theorie der reellen Zahlen gemacht: Eudoxos wusste, dass es inkommensurable Strecken gibt. Er verwendete daher die nach Archimedes benannte, aber auf ihn zurückgehende Idee, dass man bei zwei gegebenen Strecken auf einer Geraden stets mit der kleineren die grössere übertreffen kann, wenn man sie nur oft genug abträgt. Dies ist die adäquate Verallgemeinerung der ursprünglichen pythagoräischen Idee der Kommensurabilität! Wir sprechen dabei heute vom Archimedischen Axiom, das auch wir bei unserem Theorieaufbau häufig verwenden werden: Archimedisches Axiom Zu zwei positiven reellen Zahlen x > y > 0 gibt es eine natürliche Zahl n mit n ⋅ y > x. In seiner Grössenlehre subsumierte Eudoxos u. a. die Konzepte Länge und Zeit, die jeweils ein Kontinuum darstellten und nach Hippasos’ Entdeckung auch nichtrationale Masszahlen umfassten. Seine Proportionenlehre umfasste dementsprechend auch nichtrationale Grössenverhältnisse. Die Exhaustionsmethode ist aus heutiger Sicht Grundlage jeder Messung. Insbesondere für die Integralrechnung ist die Exhaustionsmethode (von exhaurire - lat. “herausnehmen”, “ausschöpfen”, “vollenden”) besonders interessant. http://www.nndb.com/people/ Eudoxus von Knidos (408-355 v. Chr.) archimedes.jpg (JPEG-Grafik, 300x404 Pixel) Archimedes newton2.jpg (JPEG-Grafik, 268x366 (287-212 v.Pixel) Chr.) http://crysta.physik.hu-berlin.de/~ines/Experimente/VL_ http://www.mschaad.ch/math 1 von 1 1 von 1 Isaac Newton (1643-1727) leibniz.png (PNG-Grafik, 1286x1677 Pixel) - Skaliert (48%) 01.09 http://www.bence10.com/wp-content/uploads/2010/09/leibniz.png Gottfried Willhelm Leibniz (1646-1716) 1 von 1 1 von 1 01.09.11 16:25 1.2. Die Vollständigkeit von R Sie umfasst z. B. das “Ausschöpfen” von nicht elementar bestimmbaren Flächeninhalten mithilfe von (immer kleiner werdenden) bekannten Figuren. In einer Weiterentwicklung dieses Ansatzes hat Archimedes (287 - 212v.Chr.) bei der “Parabelquadratur” die Fläche unter einer Parabel durch “Ausschöpfen mit Dreiecken” exakt bestimmt - und damit bereits eine wesentliche Kernidee der Integralrechnung in die Welt gesetzt. Simon Stevin (1548 - 1620) entwickelte dann im 16. Jahrhundert die Vorstellung, dass jedem Punkt der Zahlengeraden genau eine reelle Zahl zugeordnet werden kann. Er führte 1585 die Dezimalschreibweise ein. Diese wurde für die in derselben Epoche entwickelten Logarithmen verwendet. Aufbauend auf den Arbeiten vieler Vorläufer wurde im 17. Jahrhundert durch Isaac Newton (1643 - 1727) und Gottfried Wilhelm Leibniz (1646 - 1716) unabhängig voneinander die Differential- und Integralrechnung entwickelt und gleich mit grossem Erfolg angewandt. Ein bekanntes Beispiel ist Newtons Theorie der Planetenbewegung. Newton war die Natur der Grundbegriffe wohl nicht bekannt; daher auch der Name “Calculus”: Es funktioniert, aber keiner wusste so richtig, warum. Von Leibniz lässt sich das wohl nicht mehr sagen; er nutzte im Prinzip schon den Cauchyschen Grenzwertbegriff (auch wenn er es so nicht publiziert hat). Die Analysis entwickelte sich im 18. und 19. Jahrhundert sehr schnell und äusserst erfolgreich, ohne dass ihre Grundlagen (reelle Zahlen, Grenzwerte) geklärt wurden. Insbesondere Leonhard Euler (1707 - 1783) ging souverän mit Grenzwerten und unendlichen Reihen um. Die Vollständigkeit der reellen Zahlen wurde naiv verwendet, anschauliche, graphisch motivierte Zwischenwertargumente wurden angewandt. Erst Ende des 19. Jahrhunderts wurde (insbesondere anhand von Funktionen mit höchst unanschaulichen Eigenschaften) klar, dass eine Weiterentwicklung der Theorie nur nach Klärung ihrer fundamentalen Grundbegriffe möglich war. Nach Vorarbeiten von Carl Friedrich Gauss (1777 1855), Bernhard Bolzano (1781 - 1848) und Augustin Louis Cauchy (1789 - 1857) lieferten vor allem Eduard Heine (1821 - 1881), Richard Dedekind (1831 1916), Georg Cantor (1845 - 1918) und David Hilbert (1882 - 1943) wichtige Beiträge zu einer Theorie der reellen Zahlen und zu den Grundlagen der Analysis. So entstand die auch heutigen Ansprüchen genügende Grundlegung der Analysis. 15 Leonhard Euler (1707-1783) johann_carl_friedrich_gauss.jpg (JPEG-Grafik, 299x349 Pixel) http://www.rare-earth-magnets.com/images2/johann Carl Friedrich Gauss (1777-1855) Bernard_Bolzano.jpg (JPEG-Grafik, 599x689 Pixel) http://upload.wikimedia.org/wikipedia/commons/9/9b/Bernard_... Bernhard Bolzano Augustin-Louis_Cauchy_1901.jpg (JPEG-Grafik, 280x388 Pixel) (1781-1848) 1 von 1 http://en.citizendium.org/images/d/d3/Augustin 01.09.11 16:28 1 von 1 0 Augustin Louis Cauchy (1789-1857) 16 1. Konvergenz und Grenzwerte von Folgen Heine_2.jpeg (JPEG-Grafik, 272x326 Pixel) http://www.learn-math Die wesentliche mathematische Leistung war die “Arithmetisierung der Analysis”: Die Grundbegriffe der Analysis wurden auf den Grenzwertbegriff reduziert. Konvergenz und Grenzwert, bisher anschaulich und dynamisch mit “geht gegen” gesehen, wurden durch die Formulierung exakter, mit Mitteln der Arithmetik formulierbarer (statischer) Konvergenzkriterien präzisiert. Entsprechend wurde der Stetigkeitsbegriff formalisiert. Grundlegend hierfür war die exakte Begründung der reellen Zahlen. Eduard Heine Dedekind.jpg (JPEG-Grafik, 160x212 Pixel) image_resize.php (JPEG-Grafik, 265x400 Pixel)http://2.bp.blogspot.com/_Rjp6yFmygYk/TN5b3jLdqSI/AAA... http://images.ewins.com/digital_asset_manager/image_resize.ph... 225px-Hilbert1912.jpg (JPEG-Grafik, 225x303 Pixel) http://web.math.hr/~ne ((1821 - 1881) Richard Dedekind (1831-1916) Georg Cantor (1845-1918) David Hilbert (1882-1943) Der Satz des Eudoxus und das Archimedische Axiom 1 von 1 Als Konsequenz des archimedischen Axioms gilt, dass die harmonische Folge ( n1 ) mit wachsendem n beliebig klein wird, also gegen 0 konvergiert. Es sei nämlich ϵ > 0. Dann existiert nach dem archimedischen Axiom für 1 > ϵ > 0 ein n ∈ N mit n ⋅ ϵ > 1. Das ist aber dazu äquivalent, dass n1 < ϵ. Für alle m > n ist dann erst recht 1 1 m < ϵ. (Wenn ϵ ⩾ 1 ist, ist schon 2 kleiner als ϵ.) Die Eigenschaft, dass die harmonische Folge ( n1 ) gegen 0 konvergiert wird auch Satz des Eudoxus genannt. Das archimedische Axiom (S. 14) und der Satz des Eudoxus sind äquivalente Aussagen. Satz des Eudoxus Für jede reelle Zahl r > 0 gibt es eine natürliche Zahl m mit 1 m < r. 1 von 1 1 von 1 07.09.11 13:38 1.2. Die Vollständigkeit von R 17 Definition von Konvergenz mit Hilfe der harmonischen Folge ( n1 ) Als Konsequenz aus dem Satz des Eudoxus12 , können wir die Konvergenz von Folgen anstatt mit ϵ auch wie folgt definieren: Eine Folge (an ) konvergiert genau dann gegen a, wenn für jedes N ∈ N0 ein Index nN existiert, sodass 1 für alle n ⩾ nN . ∣a − an ∣ < N 1.2.2 Die Zahl √ 2 Schon vor mehr als 2000 Jahren benutzten die Babylonier ein Verfahren zur Berechnung von Quadratwurzeln, das noch heute in einigen √ Rechnern benutzt wird [DVA S. 187 ff.]. √ Wir werden dieses Verfahren am Beispiel der 2 kennenlernen. Unser Ziel ist also, die 2 zu approximieren. √ √ Als erste, grobe Abschätzung von 2 wählen wir a1 = 1. Sicher ist 2 etwas grösser als 1: √ 2 = 1 + α2 , (1.7) wo α2 für den noch fehlenden Betrag steht. Um α2 anzunähern, quadrieren wir die Gleichung (1.7) und erhalten: 2 = 1 + 2α2 + α22 (1.8) oder α22 + 2α2 − 1 = 0. Die Lösungen dieser Gleichung sind: √ √ 4+4 = −1 ± 2. 2 √ √ D.h. um α2 zu bestimmen, brauchen wir wieder 2. Für die Berechnung von 2 brauchen wir α2 ... −2 ± Die folgende Idee bringt uns weiter: Der Fehler α2 ist bestimmt kleiner als 1 und sein Quadrat α22 noch kleiner. Deshalb vernachlässigen wir in (1.8) den Summanden α22 und schätzen α2 aus 2 ≈ 1 + 2α2 . (1.9) √ 1 a1 = 1 war unsere erste (grobe) Approximation von 2. Aus (1.9) ergibt sich α2 ≈ 2−1 2 = 2. 1 Wir setzen a2 ∶= 2 und damit ist s2 = a1 + a2 = 1 + 12 Für jedes ϵ > 0 gibt es ein N ∈ N mit 1 N < ϵ. 1 3 = 2 2 (1.10) 18 1. Konvergenz und Grenzwerte von Folgen √ √ ein nächster Näherungswert für 2. Da s22 = 2.25 ist diese Annäherung von 2 schon etwas besser √ als s1 = a1 = 1. Um 2 noch besser zu approximieren, wiederholen wir das Spiel nochmals mit s2 als Anfangswert: √ 2 = s2 + α3 . (1.11) Wenn wir nun (1.11) quadrieren und auch hier α32 weglassen, erhalten wir: 2 ≈ s22 + 2s2 α3 , woraus α3 ≈ 2 − s22 1 =− 2s2 12 (1.12) 2−s2 1 . folgt. Nun setzen wir a3 ∶= 2s22 = − 12 √ Auf diese Weise finden wir als dritte Annäherung für 2 s3 = a1 + a2 + a3 = 1 + 1 1 17 − = . 2 12 12 (1.13) Wir halten hier auch noch fest, dass s3 = s2 + a3 = s2 + 2 − s22 2 + s22 1 2 = = (s2 + ) 2s2 2s2 2 s2 (1.14) 2 Da ( 17 12 ) = 2.00694 ist, ist diese Annäherung wieder besser als die Vorangehende. Man kann zeigen, dass wenn man so weiterfährt, die Glieder dieser Reihe rekursiv durch sn+1 = 2 + s2n 1 2 = (sn + ) , 2sn 2 sn ∀n ∈ N (1.15) bestimmt werden können und dass diese Reihe konvergiert [DVA S. 189]. Die Reihe 1, 3 , 2 17 , 12 577 , 408 665857 ... 470832 besteht also ausschliesslich aus rationalen Zahlen und approximiert (1.16) √ 2 beliebig gut. √ Aus der Vorlesung “Grundbegriffe der Mathematik” [vgl. HAG, S. 27] wissen wir, dass 2 irrational ist. Wir haben also eine Folge, welche aus Elementen von Q besteht aber deren Grenzwert in der Menge Q nicht existiert! Genau um die Existenz solcher Grenzwerte geht es im nächsten Abschnitt. 1.2. Die Vollständigkeit von R 1.2.3 19 Die Vollständigkeit Es gibt verschiedene Möglichkeiten R zu beschreiben13 . Wir können leider in dieser Veranstaltung aus Zeitgründen nicht auf dieses spannende Gebiet der Mathematik eingehen. Die für uns wichtigste Eigenschaft von R ist das Axiom der Vollständigkeit: Vollständigkeit von R Jede Cauchy-Folge hat einen Grenzwert. Mit der Vollständigkeit von R können wir zeigen, dass monotone und beschränkte Folgen konvergent sind: Satz 1.19 Konvergenz von monotonen und beschränkten Folgen 1. Jede monoton wachsende, beschränkte Folge hat einen Grenzwert. 2. Jede monoton fallende, beschränkte Folge hat einen Grenzwert. Beweis 2 Sei (an ) eine monoton wachsende beschränkte Folge. Wir werden zeigen, dass (an ) eine Cauchy-Folge ist. Da die Folge beschränkt ist, ∃M ∈ R mit an ⩽ M für alle n ∈ N0 . Wir führen diesen Beweis per Widerspruch: wir nehmen an, dass (an ) keine Cauchy-Folge ist. D.h.: ∃ϵ > 0 ∀N ∈ N0 ∃n, m ⩾ N (∣an − am ∣ > ϵ). (1.17) Die Idee dieses Beweises ist, dass wir eine Teilfolge (bm ) von (an ) konstruieren, welche nicht beschränkt ist. Dann ist aber auch die Folge (an ) nicht beschränkt, was ein Widerspruch ist. Nach (1.17) gibt es für N = 0 natürliche Zahlen n1 , n0 ⩾ 0 mit ∣an1 − an0 ∣ > ϵ . Ohne Einschränkung der Allgemeinheit können wir n1 > n0 annehmen. Da (an ) monoton wachsend ist, ist dann an1 > an0 und somit gilt ∣an1 − an0 ∣ = an1 − an0 > ϵ . Wir setzen b0 ∶= an0 und b1 ∶= an1 und halten fest b1 − b0 > ϵ . Auch für N = n1 gibt es nach (1.17) natürliche Zahlen n3 > n2 ⩾ n1 mit an3 − an2 > ϵ . 13 Z.B. mit Dedekindsche Schnitte [HA1, S. 30-32] oder mit Intervallschachtelung [BHA, S.105] oder man kann R auch axiomatisch definieren [HA1, S. 35-37]. 20 1. Konvergenz und Grenzwerte von Folgen Wir setzen b2 ∶= an2 und b3 ∶= an3 und es gilt: b3 − b2 > ϵ . Wir konstruieren auf diese Weise rekursiv weitere Glieder der Folge (bm ) bis zu einem14 ungeraden k ∈ N0 mit k ⩾ 2ϵ (M − b0 ). Dann gilt: bk = bk − bk−1 + bk−1 − bk−2 +bk−2 − ... + ... + b3 − b2 + b2 − b1 + b1 − b0 +b0 ´¹¹ ¹ ¹ ¹ ¹ ¹¸¹ ¹ ¹ ¹ ¹ ¹ ¹¶ ´¹¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¸¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¶ ´¹¹ ¹ ¸ ¹ ¹ ¶ ´¹¹ ¹ ¸ ¹ ¹ ¶ ´¹¹ ¹ ¸ ¹ ¹ ¶ >ϵ ⩾0 > k ⋅ ϵ + b0 2 ⩾ 2 1 ⋅ ϵ ⋅ (M − b0 ) + b0 2 ϵ >ϵ ⩾0 >ϵ = M. Also ist bk = ank > M und das ist ein Widerspruch zur Beschränktheit der Folge (an ). (an ) ist also eine Cauchy-Folge und damit konvergent. Der Beweis für monoton fallende Folgen ist analog. Bemerkung Man kann zeigen: wenn jede monoton wachsende beschränkte Folge konvergiert, dann konvergiert auch jede Cauchy-Folge. D.h. man kann zeigen, dass diese Eigenschaft äquivalent zur Vollständigkeit von R ist. Im Folgenden werden wir zeigen, dass die Vollständigkeit von R auch mit Intervallschachtelungen charakterisiert werden kann15 . Eine Intervallschachtelung ([ak , bk ])k∈N0 ist eine Folge von Intervallen [a0 , b0 ] ⊇ [a1 , b1 ] ⊇ [a2 , b2 ] ⊇ ... , 14 Da die Folge der natürlichen Zahlen unbeschränkt ist (Satz des Eudoxos S.16) ist es möglich ein solches k zu finden. 15 Sogar R selber kann als �quivalenzklasse von Intervallschachtelungen beschrieben werden. 1.2. Die Vollständigkeit von R 21 wobei die Intervallenden an und bn für jedes n ∈ N0 reelle Zahlen sind und die Intervalllängen bn − an gegen 0 konvergieren. Es gilt also a0 ⩽ a1 ⩽ a2 ⩽ ... ⩽ b2 ⩽ b1 ⩽ b0 . Da (an ) und (bn ) monotone beschränkte Folgen sind, sind sie nach dem vorherigen Satz konvergent. Da die Intervalllängen gegen Null konvergieren müssen beide Folgen gegen denselben Grenzwert c konvergieren16 . Es gilt: an ⩽ c und c ⩽ bn für alle n ∈ N0 sowie lim an = c = lim bn . n→∞ n→∞ Diesen gemeinsamen Grenzwert c nennen wir Grenzwert der Intervallschachtelung ([ak , bk ])k∈N0 . Damit haben wir gezeigt: Satz 1.20 Grenzwerte von Intervallschachtelungen Jede Intervallschachtelung in R hat einen Grenzwert. Bemerkung Auch diese Eigenschaft ist äquivalent zur Vollständigkeit von R. Man kann zeigen, dass wenn das archimedische Axiom gilt und jede Intervallschachtelung einen Grenzwert hat, dann ist jede Cauchy-Folge konvergent. Beispiel 1.21 √ In Figur 10 S. 4√wird behauptet, dass die rekursiv durch d0 = 1 und dn+1 = dn + 5 definierte Folge gegen 1+ 2 21 konvergiert. Erst jetzt sind wir in der Lage dies zu zeigen. Zuerst zeigen wir mit √ vollständiger Induktion, dass (dn ) eine monoton wachsende Folge ist. Da d0 = 1 und d1 = 6 ist die Verankerung richtig. Nun nehmen wir an, dass dn ⩾ dn−1 für ein beliebiges aber festes n ∈ N0 ist. 16 Dies kann man per Widerspruch zeigen. Annahme: die zwei Folgen konvergieren gegen verschiedenen Zahlen a = limn→∞ an und b = limn→∞ bn . Da 0 = limn→∞ (bn − an ) ist und nach der Definition von a und b, existiert für ϵ = ∣b − a∣ > 0 ein Nϵ mit ∣an − a∣ < 3ϵ , ∣b − bn ∣ < ϵ = ∣b − a∣ ≤ ∣b − bn ∣ + ∣bn − an ∣ + ∣an − a∣ < 3 ⋅ ϵ 3 ϵ 3 und ∣an − bn ∣ < ϵ 3 = ϵ. Also ϵ < ϵ, was ein Widerspruch ist. für alle n ⩾ Nϵ . D.h. 22 1. Konvergenz und Grenzwerte von Folgen Da die Quadratwurzelfunktion monoton wachsend ist17 , gilt nach der Induktionsannahme: √ √ dn + 5 ⩾ dn−1 + 5. Also gilt: dn+1 = √ dn + 5 ⩾ √ dn−1 + 5 = dn . Wir zeigen nun, ebenfalls per vollständiger Induktion, dass (dn ) beschränkt ist und zwar zeigen wir, dass dn < 3 gilt, ∀n ∈ N0 . Da d0 = 1, ist die Verankerung bestimmt richtig. Wir nehmen an, dass dn < 3 sei für ein beliebiges aber festes n ∈ N0 . Nach der Induktionsannahme ist √ √ √ dn+1 = dn + 5 ⩽ 3 + 5 = 8 < 3. Nach dem Satz über die Konvergenz von monotonen und beschränkten Folgen (Satz 1.19) gibt es ein d ∈ R mit d = limn→∞ dn . Aber natürlich gilt auch d = limn→∞ dn+1 . Also: √ d = lim dn = lim dn+1 = lim dn + 5. n→∞ n→∞ n→∞ Nach Satz 1.8 S. 8 gilt d2 = lim Die positive Lösung d = der Folge (dn ). 1.2.4 √ n→∞ √ 1+ 1+20 2 √ dn + 5 dn + 5 = lim (dn + 5) = d + 5. n→∞ der quadratischen Gleichung d2 −d−5 = 0 ist der Grenzwert Supremum und Infimum Wir wollen noch eine weitere Eigenschaft, die aus der Vollständigkeit von R folgt, untersuchen. Dazu brauchen wir einige Begriffe. Sei M eine nicht-leere Teilmenge von R. Man nennt M nach oben beschränkt wenn es ein w ∈ R gibt, so dass x ⩽ w für alle x ∈ M gilt. Jedes derartige w heisst dann obere Schranke von M . Entsprechend heisst M nach unten beschränkt wenn es ein v ∈ R gibt, so dass x ⩾ v für alle x ∈ M gilt. Jedes derartige v heisst dann untere Schranke von M . M heisst beschränkt, wenn es sowohl nach oben als auch nach unten beschränkt ist. Eine Zahl S ∈ R heisst Supremum von M oder kleinste obere Schranke von M , falls x ⩽ S ⩽ w für alle x ∈ M und für jede obere Schranke w von M . 17 Um zu zeigen, dass die Quadratwurzelfunktion monoton wachsend ist, nehmen wir an, dass es zwei √ √ √ Zahlen 0 < a < b gibt, mit a > b. Wenn man diese Ungleichung mit a multipliziert, erhält man √ √ √ √ √ √ √ √ √ a ⋅ a > a ⋅ b und wenn man sie mit b multipliziert a ⋅ b > b ⋅ b. Aber dann wäre a > b, denn √ √ √ √ √ √ a = a ⋅ a > a ⋅ b > b ⋅ b = b und das ist ein Widerspruch. 1.2. Die Vollständigkeit von R 23 In Zeichen: S = sup M . Analog definieren wir: Eine Zahl s in R heisst Infimum von M oder grösste untere Schranke von M , falls v ⩽ s ⩽ x für alle x ∈ M und für jede untere Schranke v von M gilt. In Zeichen: s = inf M . Das sup M bzw. inf M müssen nicht zu M gehören. Gilt jedoch sup M ∈ M , so ist dies das grösste Element von M und wird mit max M bezeichnet. Gilt inf M ∈ M , so handelt es sich entsprechend um das kleinste Element von M und wird mit min M bezeichnet. Satz 1.22 Satz vom Supremum und Infimum beschränkter Mengen 1. Jede nicht-leere nach oben beschränkte Menge reeller Zahlen besitzt ein Supremum. 2. Jede nicht-leere nach unten beschränkte Menge reeller Zahlen besitzt ein Infimum. Dieser Satz gilt nicht für eine Menge M rationaler Zahlen. Die Menge M = {x ∈ Q ∣ x2 ⩽ 2} besitzt kein Supremum in Q. Beweis 3 (Beweis des Satzes vom Supremum und Infimum beschränkter Mengen) Sei M eine nicht-leere Teilmenge von R, a ∈ M und w eine obere Schranke von M . Auch diesmal konstruieren wir eine Intervallschachtelung: Ist die Mitte von [a, w] eine obere Schranke von M , so nehmen wir die linke Intervallhälfte und setzen a0 = a und b0 = a+w , 2 sonst die rechte und setzen a+w und b0 = w . 2 Nach dieser Vorschrift entsteht durch fortgesetzte Intervallhalbierung eine Folge ineinander a0 = geschachtelter Intervalle [an , bn ], wobei bn für jedes n ∈ N eine obere Schranke von M ist 24 1. Konvergenz und Grenzwerte von Folgen und jedes dieser Intervalle Elemente aus M enthält. Da die Intervalllänge immer halbiert wird, konvergiert diese Folge der Intervallängen gegen Null. Diese Intervallschachtelung besitzt, da R vollständig ist, einen Grenzwert x mit an ⩽ x ⩽ bn und x = lim an = lim bn . n→∞ n→∞ Nun müssen wir zeigen, dass x das Supremum von M ist. D.h. wir müssen zeigen, dass (i) x eine obere Schranke von M ist und dass (ii) x die kleinste obere Schranke von M ist . Zu (i): Wäre x keine obere Schranke, gäbe es ein c ∈ M mit c > x. Da bn − an beliebig klein wird, gäbe es dann ein bn < c, im Widerspruch zur Konstruktion der Intervallschachtelung, nach der bn obere Schranke von M ist. Zu (ii): Sei x′ < x, dann gibt es, da bn − an gegen Null konvergiert, ein an mit x′ < an ⩽ x und da es in jedem Intervall [an , bn ] nach Konstruktion Elemente aus M gibt, gibt es ein a′ ∈ M welches zu [an , bn ] gehört. Dann ist aber x′ < an ⩽ a′ und dann ist x′ keine obere Schranke von M . Bemerkung Auch diese Eigenschaft ist äquivalent zur Vollständigkeit von R. Ich möchte nun eine Eigenschaft von R erwähnen, die insbesondere zeigt, wieso wir uns “im Alltag” mit den rationalen Zahlen meistens zufrieden geben: 1.2. Die Vollständigkeit von R 25 Satz 1.23 Die rationalen Zahlen sind dicht in R Sei r eine reelle Zahl (insbesondere kann r also auch eine irrationale Zahl sein). Dann gibt es zu jedem auch noch so kleinen ϵ > 0 eine rationale Zahl q, die zwischen r − ϵ und r + ϵ liegt. D.h. ∃ q ∈ Q mit q ∈]r − ϵ, r + ϵ[ bzw. ∣r − q∣ < ϵ. Bemerkungen Man sagt dafür, dass Q dicht in R liegt oder, dass jede reelle Zahl sich beliebig gut durch rationale Zahlen approximieren lässt. “Beliebig gut” ist eine Kurzfassung für “bis auf einen Fehler, der kleiner ist als eine beliebige, fest vorgegebene (positive) Fehlerschranke ϵ > 0”. Aus diesem Satz folgt insbesondere, dass zwischen zwei verschiedenen reellen Zahlen immer mindestens eine rationale Zahl liegt. Wenn s und t zwei beliebige reelle Zahlen sind, t−s mit t > s und wir r = s+t 2 und ϵ = 2 setzen, dann gilt s = r − ϵ und t = r + ϵ und nach dem obigen Satz existiert eine rationale Zahl zwischen s und t. Beweis 4 (Beweis vom Satz 1.23) Sei ϵ > 0. Wir wählen gemäss Satz des Eudoxus zunächst eine natürliche Zahl m mit 1 m < ϵ. Wir betrachten zuerst den Fall, dass r ⩾ 0 ist. Die Idee dieses Beweises ist nun, dass wir das Intervall [r − m1 , r + m1 ] “aufblasen”, d.h. mit m ∈ N multiplizieren: [rm − 1, rm + 1]. Zu diesem “aufgeblasenen” Intervall der Länge 2 gehören18 zwei ganze Zahlen k und k − 1 mit der Eigenschaft rm − 1 < k − 1 ⩽ rm < k ⩽ rm + 1 . Dann dividieren wir wieder alles durch m und es gilt: 1 k−1 k 1 r− < ⩽r< ⩽r+ . m m m m k Für q = m ∈ Q gilt somit: 1 1 q ∈ [r − , r + ] ⊂]r − ϵ, r + ϵ[ . m m Im Beweis haben wir sogar gezeigt, dass es im Intervall ]r − ϵ, r + ϵ[ eine rationale Zahl q1 = k m gibt mit q1 > r, sowie eine rationale Zahl q2 = k−1 m mit q2 ⩽ r. Falls r < 0 ist, können wir −r betrachten und es gibt nach dem eben Bewiesenen eine rationale Zahl q welche im Intervall ] − r − ϵ, −r + ϵ[ liegt, aber dann ist −q ∈]r − ϵ, r + ϵ[ die gesuchte rationale Zahl. 18 Nach dem archimedischen Axiom, gibt es natürliche Zahlen n, welche grösser als rm sind. Nach dem Wohlordnungsprinzip hat die Menge dieser Zahlen ein kleinstes Element k. 26 1. Konvergenz und Grenzwerte von Folgen Ist r reell, so gibt es, da die rationalen Zahlen dicht in R sind (Satz 1.23), für jedes n ∈ N eine rationale Zahl qn mit ∣qn − r∣ < n1 . Die so konstruierte rationale Folge (qn ) konvergiert gegen r. Wir haben damit gezeigt, dass: Satz 1.24 Jede reelle Zahl ist Grenzwert einer Folge rationaler Zahlen. Man könnte nach diesem Satz auf die Idee kommen, dass es “wenige” irrationalen Zahlen gibt, aber: Satz 1.25 Die irrationalen Zahlen sind dicht in R Sei r eine reelle Zahl (insbesondere kann r also auch eine rationale Zahl sein). Dann gibt es zu jedem auch noch so kleinen ϵ > 0 eine irrationale Zahl s, die zwischen r − ϵ und r + ϵ liegt: D.h. s ∈]r − ϵ, r + ϵ[ bzw. ∣r − s∣ < ϵ. Beweisidee: Der Beweis erfolgt analog dem Beweis vom Satz 1.23. Man “bläst” das Intervall mit einer geeigneten natürlichen Zahl auf und findet im aufgeblasenen Intervall eine √ √ 2 2 irrationale Zahl (z.B. ein Vielfaches von 2 , da 0 < 2 < 1). Dann lässt man das Intervall wieder “schrumpfen”. Da auch die irrationalen Zahlen dicht in R sind, gilt auch für irrationale Zahlen der analoge Satz zu Satz 1.24: Satz 1.26 Jede reelle Zahl ist Grenzwert einer Folge irrationaler Zahlen. Nun könnte man auf die Idee kommen, dass es gleich viele rationale wie irrationalen Zahlen gibt: dem ist nicht so. Die rationalen Zahlen sind abzählbar (d.h. man kann eine Folge angeben, welche alle rationalen Zahlen enthält), die irrationalen Zahlen sind hingegen überabzählbar (es ist unmöglich eine Folge anzugeben, welche alle irrationalen Zahlen enthält). Beispiele von √ irrationalen Zahlen sind bekanntlich π, die Eulersche Zahl e19und die Quadratwurzel n jeder natürlichen Zahl n ∈ N0 , welche keine Quadratzahl ist . 19 Eine Zahl n ∈ Z ist genau dann keine Quadratzahl, wenn in der Primfaktorzerlegung von n = pn1 1 pn2 2 pn3 3 pn4 4 ... (alle pi verschieden) mindestens ein Exponent ni ungerade ist. Kapitel 2 Grenzwerte von Funktionen und Stetigkeit In dieser Veranstaltung werden wir grundsätzlich nur reelle Funktionen f ∶ A → B betrachten, d.h. Funktionen bei denen sowohl der Definitionsbereich A als auch die Zielmenge B Teilmengen von R sind [vgl. HAG, Kap. 3]. Zudem werden wir uns auf reelle Funktionen beschränken bei denen der Definitionsbereich ein Intervall ist oder als Vereinigung endlich vieler Intervalle dargestellt werden kann. Einige der wenigen Ausnahmen diesbezüglich sind die Folgen, welche N0 als Definitionsbereich haben. Vereinbarung: Wenn in diesem Skript eine Funktion f ∶ A → B betrachtet wird, dann ist damit wenn nicht explizit anders erwähnt - immer eine reelle Funktion gemeint und A ist ein Intervall oder eine Vereinigung endlich vieler Intervalle. 2.1 Grenzwerte von Funktionen Wir haben bei Folgen nur untersucht, was geschieht wenn n immer grösser wird (limn→∞ ). Bei reellen Funktionen f ∶ A → B wird es insbesondere auch von Interesse sein, was mit f (x) geschieht, wenn x sich einer bestimmten Zahl a nähert1 . Als Nächstes betrachten wir vier Beispiele, die solche Untersuchungen nahe legen: Beispiele 2.1 Die folgenden vier Funktionen haben Definitionslücken: 1. f ∶ R ∖ {−1} → R ∶ x ↦ 1 x2 − 1 , x+1 a kann zu A gehören oder auch ”Randpunkt” des Definitionsbereiches A sein. 28 2. Grenzwerte von Funktionen und Stetigkeit 1 , (x − 2)3 √ x2 3. h ∶ R ∖ {0} → R ∶ x ↦ , x √ 1 − 1 − x2 4. k ∶ [−1, 1] ∖ {0} → R ∶ x ↦ . x2 2. g ∶ R ∖ {2} → R ∶ x ↦ Es ist schwierig, sich vorzustellen wie sich diese Funktionen verhalten, insbesondere ist es sehr schwierig herauszufinden was in der Nähe der Definitionslücken geschieht. Um eine erste Vorstellung zu erhalten wie die Funktionen sich dort verhalten, können wir die Graphen betrachten2 . 2 Figur 16: Graph der Funktion f Figur 17: Graph der Funktion g Figur 18: Graph der Funktion h Figur 19: Graph der Funktion k Figur 27 S.49 zeigt uns allerdings, dass man sich nicht ausschliesslich auf die Anschauung verlassen kann. 2.1. Grenzwerte von Funktionen 29 • Die Funktion f ist an der Stelle x = −1 nicht definiert. Für x ≠ −1 kann die Funkti2 −1 onsgleichung xx+1 = (x−1)(x+1) = x − 1 gekürzt werden. Nähert sich x irgendeiner Zahl x+1 a ≠ −1, so nähert sich f (x) der Zahl a − 1. Nähert sich x der Zahl a = −1, wobei x ungleich −1 ist, so nähert sich f (x) der Zahl −1 − 1 = −2. Eigentlich kann man also den Graphen über die Definitionslücke hinweg zeichnen und diese künstliche Lücke beseitigen! Egal, welcher Zahl sich x nähert, es gibt immer einen (anschaulich klaren) 2 −1 Grenzwert. Die Funktionen f ∶ R ∖ {−1} → R ∶ x ↦ xx+1 und f˜ ∶ R → R ∶ x ↦ x − 1 sind aber zwei verschiedene Funktionen, da sie zwei verschiedene Definitionsbereiche haben (vgl. [HAG, S.79]). • Die Definitionslücke der Funktion g ist wesentlich. Nähert sich x der Zahl 2 von rechts, so wächst der Wert g(x) über alle Grenzen. Nähert sich x der Zahl 2 von links, so wird der Wert g(x) immer kleiner genauer: g(x) wächst über alle Grenzen. • Auch in h ist die Definitionslücke bei 0 wesentlich. Für positives x ist h(x) = 1, für negatives x ist h(x) = −1. Ist x nahe einer Zahl a ≠ 0 und nähert sich dieser, dann ist je nach Vorzeichen von a stets h(x) = 1 bzw. h(x) = −1. Nähert sich dagegen x der Zahl a = 0, so tritt verschiedenes Verhalten auf: Bei Annäherung von rechts ist h(x) stets 1, bei Annäherung von links ist h(x) stets −1, bei wechselseitiger Annäherung3 springt h(x) zwischen 1 und −1 hin und her. Man kann in diesem Fall für x gegen Null nicht von einem Grenzwert sprechen. • Anhand des Graphen sehen wir, dass an der Stelle der Definitionslücke, egal ob wir uns von links oder rechts dieser Stelle annähern, sich der Wert von k(x) der Zahl 0.5 annähert. Es fällt uns aber schwerer, im Gegensatz zur Funktion f , eine Termumformung zu finden, die uns das zeigt. Wie wir an diesen Beispielen gesehen haben, ist es nicht immer einfach, das Verhalten einer Funktion an einer bestimmten Stelle zu untersuchen. Wir haben uns auf die Graphen gestützt, aber das ist nicht immer möglich und wie wir später sehen werden auch oft trügerisch. Wir wollen nun die anschaulich-dynamische Redewendung “f (x) strebt gegen b, wenn x gegen a geht” mathematisch sauber definieren. Wir stützen uns dabei zunächst auf die Idee der Konvergenz von Folgen: 3 ) mit den Gliedern −1, 12 , − 13 , 14 , ... springt die Folge h ( (−1) ) von −1 zu 1. Z.B. für die Folge ( (−1) n n n n 30 2. Grenzwerte von Funktionen und Stetigkeit Definition 2.2 Die Funktion f ∶ A → B hat für x → a den Grenzwert b, wenn es zu jedem noch so kleinen ϵ > 0 ein δ > 0 gibt, so dass4 ∣f (x) − b∣ < ϵ für alle x ∈ A mit 0 < ∣x − a∣ < δ . Für diesen Sachverhalt schreiben wir: lim f (x) = b . x→a Bemerkungen 1. Zunächst versuchen wir diese Definition geometrisch zu verstehen und illustrieren Sie an einem Graphen. Anschaulich ist in diesem konkreten Beispiel klar, dass lim f (x) = b gilt. x→a Figur 20: ϵ-Streifen um b und δStreifen um a. Wir sehen, dass für δ1 die Bedingung erfüllt ist: für alle x ∈ ]a − δ1 , a − δ1 [ gilt ∣g(x) − b∣ < ϵ. Der δ-Streifen hätte sogar etwas grösser gewählt werden können, wie δ2 in der folgenden Figur zeigt. δ3 ist hingegen zu gross gewählt worden. 4 Ganz formal kann man diese Definition wie folgt aufschreiben: ∀ϵ > 0 ∃δ > 0 ∀x ∈ A (0 < ∣x − a∣ < δ Ð→ ∣f (x) − b∣ < ϵ) 2.1. Grenzwerte von Funktionen 31 Figur 21: δ2 - und δ3 -Streifen Dass es in hier mit δ3 nicht geht, heisst nicht, dass die Funktion nicht konvergiert. Verlangt wird nur ein δ. Für δ = δ1 oder δ = δ2 ist die Bedingung für das vorgegebene ϵ erfüllt. 2. Als zweites wollen wir uns Gedanken machen, welches die Beziehung von a zur Menge A ist. In der Definition des Grenzwertes einer Funktion: ∣f (x) − b∣ < ϵ für alle x ∈ A mit 0 < ∣x − a∣ < δ müssen die x-Werte zu A gehören, die betrachtete Stelle a aber nicht unbedingt. Wir haben zu Beginn des Kapitels gesagt, dass wir uns auf reelle Funktionen beschränken werden, deren Definitionsbereich ein Intervall ist oder als Vereinigung endlich vieler Intervalle dargestellt werden kann. Wie im obigen Beispiel kann a ein Element von A sein. Aber a kann auch ein Randpunkt eines der Intervalle sein, aus denen der Definitionsbereich besteht. Das ist zum Beispiel der Fall bei der Funktion √ 1 − 1 − x2 k ∶ [−1, 1] ∖ {0} → R ∶ x ↦ x2 im einführenden Beispiel 4, S. 28. Hier ist die Funktion k an der Stelle 0 nicht definiert, 0 ist aber ein Randpunkt beider Intervalle, aus denen der Definitionsbereich von f zusammengesetzt ist: [−1, 1] ∖ {0} = [−1, 0[ ∪ ]0, 1] 32 2. Grenzwerte von Funktionen und Stetigkeit 3. Für die Funktion f ∶ R Ð→ R ∶ x ↦ { x − 1 für x ⩽ 0 x + 1 für x > 0 . gehört a = 0 zum Definitionsbereich von f , aber diese Funktion hat für lim keinen Grenzx→a wert. Denn für irgend eine reelle Uahl b ∈ R und z.B. für ϵ = 12 gibt es kein δ > 0, so dass ∣f (x) − b∣ < ϵ für alle 0 < ∣x∣ < δ gilt. Figur 22: Graph der Funktion f . Beispiel 2.3 Wir möchten nun anhand der Definition des Grenzwertes einer Funktion zeigen, dass lim x2 = 1, was anschaulich klar ist. x→1 Sei also ϵ > 0. Wir müssen versuchen ein δ zu finden mit ∣x2 − 1∣ < ϵ, falls 0 < ∣x − 1∣ < δ. Es gilt: ∣x2 − 1∣ = ∣x − 1∣∣x + 1∣. Wir wissen ∣x − 1∣ < δ. Nun müssen wir versuchen auch eine Abschätzung von ∣x + 1∣ zu finden: ∣x + 1∣ = ∣x + 1 − 1 + 1∣ ⩽ ∣2∣ + ∣x − 1∣ < 2 + δ (Dreiecksungleichung, vgl. Anhang B S.137). Also ist ∣x2 − 1∣ = ∣x − 1∣∣x + 1∣ < δ(2 + δ). Da δ eine kleine Zahl ist, können wir verlangen, dass δ < 1 gilt. Dann haben wir: ∣x2 − 1∣ = ∣x − 1∣∣x + 1∣ < 3δ. Jetzt sehen wir, wie δ gewählt werden kann: Es muss einerseits gelten, dass δ < 1 ist und anderseits, dass 3δ < ϵ ist. Also: sei δ < min {1, 3ϵ }, dann gilt: ∣x2 − 1∣ = ∣x − 1∣∣x + 1∣ < 3δ < ϵ. Das Rechnen mit Grenzwerten wird einfacher, wenn wir die nachkommende Sätze zur Verfügung haben. Für die folgenden Sätze erinnere ich daran, dass der Definitionsbereich A eine Vereinigung endlich vieler Intervalle ist, und a entweder zu A gehört oder ein Randpunkt von A ist. 2.1. Grenzwerte von Funktionen 33 Satz 2.4 Grenzwerte bei Summen, Differenzen, Produkten und Beträgen von Funktionen Seien f ∶ A Ð→ R und g ∶ A Ð→ R Funktionen.Gilt nun: lim f (x) = b und lim g(x) = x→a x→a c, so gilt: 1. lim(f (x) + g(x)) = b + c , x→a 2. lim(f (x) − g(x)) = b − c , x→a 3. lim(f (x) ⋅ g(x)) = bc , x→a 4. lim(k ⋅ f (x)) = k ⋅ b für jede Konstante k , x→a 5. lim ∣f (x)∣ = ∣b∣ . x→a Bemerkung Die Eigenschaften 1. und 4. besagen, dass die Limesbildung ein lineares Operator ist. Satz 2.5 Grenzwerte bei Quotienten und Quadratwurzeln von Funktionen Seien f ∶ A Ð→ R und g ∶ A Ð→ R Funktionen mit lim f (x) = b und lim g(x) = c. x→a x→a 1. Falls c ≠ 0 und g(x) ≠ 0 für alle x in einer Umgebung von a ist, dann gilt f (x) b lim ( )= . x→a g(x) c √ √ 2. Falls f (x) ⩾ 0 für alle x ∈ A ist, dann ist die Funktion f ∶ A → R; x ↦ f (x) √ √ definiert und es gilt: lim f (x) = b . x→a Unter einer Umgebung oder genauer einer ϵ-Umgebung von a in A verstehen wir eine Teilmenge ]a − ϵ, a + ϵ[ ∩ A des Definitionsbereichs A (ϵ > 0). 34 2. Grenzwerte von Funktionen und Stetigkeit Beispiel 2.6 1− √ 1 − x2 Im Beispiel 2 S.31 haben wir die Funktion k ∶ [−1, 1] ∖ {0} → R ∶ x ↦ betrachtet x2 √ 1 − 1 − x2 1 und am Graph “erkannt”, dass lim = . x→0 x2 2 Mit den vorherigen Sätzen können wir jetzt zeigen, dass unsere Vermutung stimmt: 1− √ √ √ 1 − x2 (1 − 1 − x2 )(1 + 1 − x2 ) x2 1 √ √ √ = . = = x2 x2 (1 + 1 − x2 ) x2 (1 + 1 − x2 ) 1 + 1 − x2 Für x → 0 konvergiert 1 + √ 1 − x2 → 2 und somit gilt nach Satz 2.4 lim 1− √ x→0 1 − x2 1 = . x2 2 Satz 2.7 Seien f ∶ A Ð→ R, g ∶ A Ð→ R und h ∶ A Ð→ R Funktionen. 1. Gilt nun: lim f (x) = b und lim g(x) = b und f (x) ⩽ h(x) ⩽ g(x) für alle x x→a x→a in einer Umgebung von a, so folgt lim h(x) = a x→a 2. Falls g beschränkt ist und lim f (x) = 0, so gilt auch lim (g(x)f (x)) = 0. x→a x→a Konvergenz für ±∞ Auch bei Funktionen, deren Definitionsbereich ein unbeschränktes Intervall enthält, stellt sich die Frage nach dem Randverhalten. Salopp gesagt, fragen wir nach dem Verhalten einer Funktion ”im Unendlichen”. Ein solches Beispiel zeigt Figur 23: 2.1. Grenzwerte von Funktionen 35 Figur 23: lim f (x) = b. x→∞ Die Definition solcher Grenzwerte ist ähnlich wie im Fall der Folgen. Neu ist hier, dass auch Grenzwerte für x → −∞ untersucht werden können. Definition 2.8 Sei f ∶ A Ð→ R eine Funktion und A enthalte ein rechts unbeschränktes Intervall (d.h. es gibt eine Zahl a mit ]a, ∞[ ⊆ A). Die Funktion f konvergiert gegen b für x → ∞, falls es zu jedem noch so kleinen ϵ > 0 ein rϵ ⩾ a gibt, so dass für jedes x > rϵ gilt ∣f (x) − b∣ < ϵ . Und analog: Sei g ∶ B Ð→ R eine Funktion und B enthalte ein links unbeschränktes Intervall (d.h. ] − ∞, a[ ⊆ A). Die Funktion g konvergiert gegen c für x → −∞, falls es zu jedem noch so kleinen ϵ > 0 ein rϵ ⩽ a gibt, so dass für jedes x < rϵ gilt ∣g(x) − c∣ < ϵ . Wir schreiben lim f (x) = b und lim g(x) = c . x→∞ x→−∞ 36 2. Grenzwerte von Funktionen und Stetigkeit Satz 2.9 Seien f ∶ A Ð→ R und g ∶ A Ð→ R Funktionen und A enthalte ein rechts unbeschränktes Intervall. Gilt nun: lim f (x) = a und lim g(x) = b, so gelten die analogen Eigenschaften wie x→∞ x→∞ im Satz 2.4, Satz 2.5 und Satz 2.7. Falls A ein links unbeschränktes Intervall enthält, dann gelten die analogen Eigenschaften für lim . x→−∞ Beispiel 2.10 Wir betrachten die Funktion h ∶ R ∖ {0} → R ∶ x ↦ sin(x) =0 x→∞ x sin(x) x Figur 24: lim Im Folgenden zeigen wir, dass lim x→∞ sin(x) = 0. x Da der Zähler immer zwischen −1 und 1 liegt gilt: 1 sin(x) 1 − ⩽ ⩽ , ∀x ∈ R. (2.1) x x x 1 1 sin(x) Da sowohl lim − = 0 als auch lim = 0 gilt5 , muss auch lim = 0 gelten (Satz 2.9). x→∞ x x→∞ x x→∞ x Zeigen Sie: 1. lim 2x = 0 x→−∞ 2. lim x→∞ 5 x+1 =1 x−1 Vgl. Satz des Eudoxus und Archimedischer Axiom S. 16. 2.2. Uneigentliche Grenzwerte 37 Beispiele 2.11 Man kann z.B. zeigen, dass sin(x) = 1 [BHA S. 178] und x→0 x 1. lim 2. lim xx = 1 [BHA S. 180] gilt. x→0 Satz 2.12 Folgenkriterium Gegeben seien reelle Zahlen a und b. Die Funktion f ∶ A → R hat für x → a genau dann den Grenzwert b, wenn für jede Folge (xn )n∈N0 in A mit lim xn = a und n→∞ xn ≠ a ∀n ∈ N0 , die zugehörige Wertefolge (f (xn ))n∈N0 gegen b konvergiert. Bemerkung In vielen Beispielen ist das Folgenkriterium sehr hilfreich um zu zeigen, dass an einer bestimmten Stelle kein Grenzwert existiert. 2.2 Uneigentliche Grenzwerte Sei f ∶ A Ð→ R eine Funktion und A ein Randpunkt von A, der nicht zu A gehört. Wir sagen f divergiert bestimmt gegen ∞ für x → a, falls es für jedes noch so grosse r ∈ R ein δ > 0 gibt, so dass f (x) > r ist für alle x ∈ A mit 0 < ∣x − a∣ < δ In Zeichen: lim f (x) = ∞ . x→a 38 2. Grenzwerte von Funktionen und Stetigkeit Analog definieren wir: f divergiert bestimmt gegen −∞ für x → a, falls es für jedes noch so grosse r ∈ R ein δ > 0 gibt, so dass f (x) < −r ist für alle x ∈ A mit 0 < ∣x − a∣ < δ. In Zeichen: lim f (x) = −∞ . x→a Falls A ein rechts unbeschränktes Intervall enthält und für jedes noch so grosse r ∈ N0 ein xr existiert, so dass f (x) > r für alle x > xr ist, so sagen wir f divergiere bestimmt gegen ∞ für x → ∞. In Zeichen: lim f (x) = ∞ . x→∞ Und analog definieren wir f divergiert bestimmt gegen −∞ für x → ∞, falls A ein rechts unbeschränktes Intervall enthält und für jedes noch so grosse r ∈ R ein xr existiert, so dass f (x) < −r für alle x > xr . In Zeichen: lim f (x) = −∞ . x→∞ Definieren Sie entsprechend und skizzieren Sie ein Bild dazu: lim f (x) = ∞ , x→−∞ lim f (x) = −∞ . x→−∞ 2.3. Stetigkeit 39 Bemerkung ∞, bzw. −∞ werden in diesen Situationen uneigentliche Grenzwerte der Funktion f für x → a bzw. x → ±∞ genannt. Von ihnen wollen wir jedoch niemals sagen, dass sie gegen +∞ bzw. −∞ konvergieren. Ganz ausdrücklich: Mit b = limx→a f (x) ist immer eine wohlbestimmte Zahl gemeint, ein eigentlicher Grenzwert, niemals eines der Zeichen +∞ oder −∞. Die Symbole +∞ und −∞ sind keine Zahlen, infolgedessen kann man auch nicht mit ihnen rechnen. Zeigen Sie: 1. Für die Funktion ln ∶]0, ∞[→ R ∶ x ↦ ln(x) gilt: lim ln(x) = −∞ , x→0 2. Für die Funktion f ∶ R ∖ {1} → R ∶ x ↦ x+1 gilt: x−1 3. Für die Funktion g ∶] − ∞, 0[→ R ∶ x ↦ 1 gilt: x 4. Für die Funktion p ∶ R → R ∶ x ↦ 2x gilt: lim ∣ x→1 x+1 ∣=∞ , x−1 1 = −∞ , x→0 x lim lim 2x = ∞ , x→∞ 5. Für die Funktion ln ∶]0, ∞[→ R ∶ x ↦ ln(x) gilt: lim ln(x) = ∞ . x→∞ 2.3 Stetigkeit Definitionen 2.13 Die Funktion f ∶ A → R heisst stetig in x0 , wenn x0 in der Definitionsmenge A von f liegt und wenn f (x0 ) = lim f (x) x→x0 Gemäss Definition 2.2 S.30 ist die Funktion f ∶ A → R genau dann stetig in x0 ∈ A , wenn es zu jedem noch so kleinen ϵ > 0 ein δ > 0 gibt, sodass6 : ∣f (x) − f (x0 )∣ < ϵ für alle x ∈ A mit 0 < ∣x − x0 ∣ < δ. 6 Formal können wir dies wie folgt aufschreiben: ∀ϵ > 0 ∃ δ > 0 ∀x ∈ A (0 < ∣x − x0 ∣ < δ Ð→ ∣f (x) − f (x0 )∣ < ϵ) . 40 2. Grenzwerte von Funktionen und Stetigkeit Ist f in jedem Punkt eines Intervalls I ⊆ A stetig, so heisst f stetig in I. Ist f in jedem Punkt der Definitionsmenge A stetig, so heisst f stetig (bzw. stetige Funktion). Bemerkung Bei der Definition der Stetigkeit einer Funktion an einer Stele x0 muss x0 zum Definitionsbereich der Funktion f gehören. Da wir uns in diesem Skript auf reelle Funktionen beschränken, deren Definitionsbereich ein Intervall ist oder als Vereinigung endlich vieler Intervalle dargestellt werden kann, bedeutet das, dass x0 immer aus Elementen x ∈ A angenähert werden kann. D.h. insbesondere, dass die Menge {x ∈ A∣0 < xa < δ} für alle δ > 0 nicht leer ist. Beispiele 2.14 • Die Funktion q ∶ R Ð→ R ∶ x ↦ x2 ist stetig. x2 + 1 ist stetig. Die ”kritische Stelle” x = −1 x+1 gehört nicht zum Definitionsbereich von r. • Die Funktion r ∶ R ∖ {−1} Ð→ R ∶ x ↦ • Die Funktion p ∶ R Ð→ R ∶ x ↦ 2x ist stetig. Wir zeigen exemplarisch die Stetigkeit dieser Funktionen an je einer Stelle: • Wir zeigen, dass die Funktion q ∶ R Ð→ R ∶ x ↦ x2 an der Stelle x0 = 3 stetig ist. Wir müssen nach Definition der Stetigkeit zeigen, dass für jedes ϵ > 0 ein δ > 0 existiert, mit ∣q(x) − q(3)∣ < ϵ für alle x mit ∣x − 3∣ < δ . ∣q(x) − q(3)∣ = ∣x2 − 32 ∣ = ∣x − 3∣∣x + 3∣. Unser Ziel ist nun zu zeigen, dass das Produkt von ∣x − 3∣ und ∣x + 3∣ kleiner als das vorgegebene ϵ ist. ∣x − 3∣ können wir “beliebig klein machen”, da ∣x − 3∣ < δ und δ können wir so klein bestimmen wie wir wollen. Jetzt müssen wir noch zeigen, dass der Faktor ∣x + 3∣ beschränkt ist. Der Abstand zwischen x und 3 ist höchstens δ. Wenn wir δ < 1 wählen, dann gilt: −1 < x − 3 < 1 (vgl. (1.2) S. 4) und somit 2 < x < 4. Mit der Dreiecksungleichung gilt: ∣x + 3∣ < ∣x∣ + ∣3∣ < 4 + 3 = 7 . Wählen wir jetzt δ ∶= min{ 7ϵ , 1}, dann ist ∣x − 3∣∣x + 3∣ < δ ⋅ 7 ≤ 7ϵ ⋅ 7 = ϵ. Also: ∣q(x) − q(3)∣ < ϵ für alle x mit ∣x − 3∣ < δ . 4.3 Grenzwerte von Funktionen und Stetigkeit 181 wobei „>“ gilt, da alle Summanden der ausmultiplizierten Summe positiv sind. Die Division der (Un-)Gleichungskette durch n liefert für alle n ∈ N 2.3. Stetigkeit 1> n−1 2 · hn , also 2 • Wird in der Vorlesung gezeigt. 2 n−1 ! "# $ > h2n (> 0). 41 →0 für n→∞ Da h2n zwischen einer Nullfolge und Null eingeschlossen ist, ist (h2n ) selbst und √ • Wir zeigen, dassNullfolge. die Funktion p ∶gilt R Ð→ x ↦ 2xn→∞ an der Stelle x0 = 0 stetig ist. n damit auch (hn ) eine Damit nR = ∶1+h n −→ 1 und gleichermaßen Zuallerst müssen wir zeigen, dass für den Kehrwert % & n1 1 1 1 1 n→∞ für1 alle n ⩾ 2. (2.2) √ =2 n − 1 < −→ , n n n n Genau wir jetzt den gewünschten nur fürAxiom die speziSei genommen ϵ > 0. Nachhaben der zweiten Folgerung aus demGrenzwert Archimedischen und dem Satz 1 1 1 Eudoxus (S. bewiesen. 16) existiert mit 0 < nϵ < weiterer ϵ. Wir setzen δ = nϵaller) . elle des Nullfolge ( n )n∈N Aufein einenϵUntersuchung (eigentlich: x Sei x ∈ zur R mit ∣x − 0∣ =des ∣x∣Grenzwerts < δ. Nullfolgen Sicherung x → 1 für x → 0 und x > 0 wollen wir 1. Fall x ⩾ 0: Da die Exponentialfunktion eine monoton wachsende Funktion ist, gilt: hier aber verzichten. 1 1 = 20 ≤ 2x ≤ 2δ = 2 nϵ und mit (2.2) erhalten wir: Bemerkung zu Satz 4.13: Beachten Sie, dass es beim Beweis des Satzes ent1 1 scheidend darauf ankommt, dass ∣2xBasis − 20 ∣ und = 2xExponent − 1 ≤ 2 nϵ gleich − 1 < sind! < ϵWir . haben hiernϵ 0 mit also keinen weiteren Beitrag zur sinnvollen Definition von 0 geleistet. Wenn x 2x < 20 = 1 und Fall x < 0: Da monoton ist man2.die zumindest fürdie x ≥Exponentialfunktion 0 definierten Funktionen g undwachsend h mit g(x)ist, =a und 1 −x da −x b > 0 ist nach dem 1. Fall ∣1 − 2 ∣ < n . Diese zwei Eigenschaften brauchen wir h(x) = x mit a, b > 0 betrachtet, so kann man ϵjeweils die Funktionswerte g(0) derbetrachten nächsten Zeile: und in h(0) und danach nach einem Grenzwert für a → 0 ((bzw. b → 0) 1 0 fragen: Es gilt einerseits 0,∣ und ∣2x −g(0) 20 ∣ ==∣2ax ∣ ⋅=∣1 1− → 2−x1∣ <für1 ⋅a∣1→− 0, 2−xaber ∣ = ∣1a−&=2−x < anderer<ϵ ϵ seits h(0) = 0b = 0 → 0 für b → 0, aber b &= 0. Eine allgemein sinnvolle nDefinition von In „00beiden “ ist also nichtist möglich! Fällen also ∣2x − 20 ∣ < ϵ. Alle elementaren Funktionen sind stetig: Polynome, rationale Funktionen, Exponential4.3.3 Stetigkeit funktion, Logarithmusfunktion, Potenzfunktionen, trigonometrische Funktionen und Betragsfunktion sind heutzutage ausnahmslos jeder Stelle ihres stetig. Zudem ist „Stetigkeit“ wird im an Analysisunterricht derDefinitionsbereichs Sekundarstufe II zumeist 7 dieauf Komposition vonBarockzeit stetigen Funktionen, existiert, stetig. dem Niveau der gehandhabt:falls Einesie Funktion, diewieder (zumindest prinzipiell) mit dem Bleistift durchgezeichnet werden kann, ist stetig. Damit liegen einfache Beispiele von Funktionen nahe, die zumindest an einer Stelle nicht stetig sind. Ein typisches[aus Beispiel ist die in ganz R definierte Funktion k mit k(x) = |sgn(x)| Bemerkung BHA S. 181-186]: in Abb. 4.48 (d). Die Funktion hat den Grenzwert 1 für x → 0, jedoch ist der “Stetigkeit” wird heutzutage im Analysisunterricht der Sekundarstufe II zumeist auf dem Funktionswert k(0) = 0. Weitere typische Beispiele für anschaulich stetige und Niveau der Barockzeit gehandhabt: Eine Funktion, die (zumindest prinzipiell) mit dem unstetige Funktionen zeigt Abb. 4.55: Bleistift ohne abzusetzen, gezeichnet werden kann, ist stetig. Abb. 4.55: Stetigkeitsbetrachtungen an Funktionsgraphen Für stetige Funktionen gilt der sogenannte Zwischenwertsatz: 7 Es gibt allerdings auch in “Wirklichkeit” Funktionen, die nicht stetig sind: Z.B. sind alle diskreten Funktionen in Abhängigkeit der Zeit, wie die Anzahl Einwohner eines Dorfes, keine stetigen Funktionen. 42 2. Grenzwerte von Funktionen und Stetigkeit Satz 2.15 Zwischenwertsatz von Bolzano Die Funktion f sei stetig auf dem abgeschlossenen Intervall I = [a, b]. Dann nimmt f jeden Wert zwischen f (a) und f (b) an. Das folgende Bild zeigt, dass die Stetigkeit eine notwendige Voraussetzung dieses Satzes ist: Figur 25: Wenn die Funktion nicht stetig ist, dann werden nicht alle Werte zwischen f (0) und f (4) angenommen. Wieder zeigt ein weiteres Bild, dass es neben der Stetigkeit darauf ankommt, dass der Definitionsbereich zusammenhängend ist, d.h. ein Intervall ist: Figur 26: Wenn der Definitionsbereich nicht zusammenhängend ist, dann werden, obwohl die Funktion stetig ist, nicht alle Werte zwischen f (0) und f (4) angenommen. Mit Hilfe des folgenden Nullstellensatzes werden Sie in den Übungen den Zwischenwertsatz von Bolzano beweisen: 2.3. Stetigkeit 43 Satz 2.16 Nullstellensatz Die Funktion f sei stetig auf dem Intervall I = [a, b] und es gelte f (a) < 0 sowie f (b) > 0. Dann gibt es eine Zahl c mit a < c < b und f (c) = 0. Beweis 5 Wir werden die Eigenschaft nützen, dass jede reelle Intervallschachtelung einen Grenzwert hat. a+b Wir halbieren das Intervall und betrachten die zwei Intervalle [a, a+b 2 ] und [ 2 , b]. Ist a+b f ( a+b 2 ) = 0 so sind wir fertig. Ist f ( 2 ) > 0 so betrachten wir das Intervall [a0 , b0 ] mit a0 = a und b0 = a+b 2 , sonst betrachten wir das Intervall [a0 , b0 ] mit a0 = a+b 2 und b0 = b. Fährt man so fort mit den Intervallen [a0 , b0 ], [a1 , b1 ], usw. so erhält man eine Intervallschachtelung ([an , bn ]). Nach dem Satz über die Existenz von Grenzwerten bei Intervallschachtelungen (Satz 1.20 S.21) hat diese Intervallschachtelung einen Grenzwert c. Nach Konstruktion gilt: f (an ) < 0 < f (bn ) für jedes n. Jetzt kommt die Stetigkeit von f im Spiel: Da an → c und bn → c, folgt f (an ) → f (c) und f (bn ) → f (c), daher f (c) ⩽ 0 ⩽ f (c) d.h. f (c) = 0 . Folgerungen aus dem Zwischenwertsatz von Bolzano Hier folgen zwei Sätze, welche Folgerungen des Zwischenwertsatzes von Bolzano sind. Satz 2.17 Sei f ∶ [a, b] Ð→ R stetig. Dann ist f ([a, b]) ebenfalls ein abgeschlossenens Intervall und es gilt: f ([a, b]) = [α, β] mit α = min f ([a, b]) und β = max f ([a, b]) Beweis 6 f nimmt, nach Satz 2.44 sein Minimum α = min f ([a, b] und sein Maximum β = max f ([a, b]) an. D.h. es gibt Zahlen c ∈ [a, b] und d ∈ [a, b] mit α = f (c) und β = f (d). Nach dem Zwischenwertsatz nimmt f auch alle Werte zwischen α und β an. 44 2. Grenzwerte von Funktionen und Stetigkeit Satz 2.18 Sei f ∶ [a, b] Ð→ R stetig. Genau dann ist f injektiv, wenn f streng monoton (wachsend oder fallend) ist. In diesem Falle ist die inverse Funktion f −1 ∶ f ([a, b]) Ð→ R ebenfalls stetig und mit f streng monoton wachsend bzw. streng monoton fallend. Bemerkung Wir haben die obige invektive Abbildung f ∶ [a, b] → R als Bijektion f ∶ [a, b] → f ([a, b]) interpretiert (obwohl es zwei verschiedene Funktionen sind, da sie zwei verschiedene Zielbereiche haben) und deren Inverse der Einfachheit halber mit f −1 bezeichnet. Beweis 7 (Beweis der 2. Folgerung) Sei zuerst f injektiv. Dann ist entweder f (a) < f (b) oder f (b) < f (a). Wir betrachten nur den ersten Fall (der zweite folgt analog). Wir behaupten, dass dann f (a) < f (x) < f (b) für jedes x ∈]a, b[ gilt. Wäre f (x) < f (a), so gäbe es nach dem Zwischenwertsatz von Bolzano ein c ∈ [x, b] mit f (c) = f (a), was ein Widerspruch zur Injektivität von f ist. Wäre f (b) < f (x) (wegen der Injektivität kann Gleichheit nicht sein) so gäbe es nach dem Zwischenwertsatz von Bolzano ein c ∈ [a, x] mit f (c) = f (b), was ebenfalls ein Widerspruch zur Injektivität von f ist. Damit haben wir gezeigt, dass f (a) < f (x) < f (b) für jedes x ∈]a, b[ gilt. Nochmalige Anwendung desselben Schlusses liefert f (x) < f (y) für a < x < y < b. Umgekehrt ist jede streng monotone Funktion natürlich injektiv. Nun wollen wir den zweiten Teil dieses Satzes beweisen. Wir betrachten nur den Fall einer streng monoton wachsenden stetigen Funktion f ∶ [a, b] → f ([a, b]) (der zweite Fall, wenn f streng monoton fallend ist, folgt analog) und zeigen, dass f −1 ∶ f ([a, b]) → R ebenfalls streng monoton wachsend und stetig ist. Seien y0 , y1 ∈ f ([a, b]) mit y0 < y1 . Es existieren Zahlen x0 , x1 ∈ [a, b] mit f (x0 ) = y0 und f (x1 ) = y1 . Da f streng monoton wachsend ist, folgt aus f (x0 ) = y0 < y1 = f (x1 ), dass x0 < x1 gelten muss und somit f −1 (y0 ) = f −1 (f (x0 )) = x0 < x1 = f −1 (f (x1 )) = f −1 (y1 ). Damit ist gezeigt, dass f −1 streng monoton wachsend ist. 2.3. Stetigkeit 45 Es bleibt zu zeigen, dass f −1 stetig ist. Sei y0 ∈ f ([a, b]) und sei (yn ) eine Folge in f ([a, b]) mit lim yn = y0 , n→∞ wobei yn ≠ y0 für alle n ∈ N. Nach Definition 2.28 S.51 müssen wir zeigen, dass lim f −1 (yn ) = f −1 (y0 ). n→∞ Da f stetig und streng monoton wachsend ist, ist f ([a, b]) = [f (a), f (b)] ein abgeschlossenes Intervall. Sei zn ∶= f −1 (yn ) . (zn ) ist eine Folge in [a, b]. Wir werden als nächstes zeigen, dass (zn ) eine konvergente Folge ist. Dafür konstruieren wir zwei Intervallschachtelungen. ] und Y ∶= [ a+b Wir betrachten I ∶= [a, a+b 2 2 , b]. Falls beide Intervalle I und Y unendlich viele Glieder der Folge enthalten, dann nehmen wir das linke Teilintervall I sonst das Intervall, welches unendlich viele Glieder enthält. Wir bezeichnen die Grenzen des neuen Intervalls mit a0 und b0 und fahren so weiter. Für jedes k ∈ N0 konstruieren wir damit ein Intervall [ak , bk ], welches unendlich viele Glieder der Folge enthält, und so, dass links davon im Intervall [a, ak ] h�chstens endlich viele Glieder der Folge existieren. Da die Länge der Intervalle immer halbiert wird, ist dies eine Intervallschachtelung und besitzt einen Grenzwert c. Wir definieren (nach dem Wohlordnungsprinzip) nk ∶= min {n ∣ zn ∈ [ak , bk ] ∧ n > nk−1 } für jedes k ∈ N0 . Es giltznk ∈ [ak , bk ] und somit limk→∞ znk = c. Analog konstruieren wir eine Intervallschachtelung ([a′k , b′k ]) mit der Eigenschaft, dass für jedes k ∈ N0 das Intervall [a′k , b′k ] unendlich viele Glieder der Folge enthält und so dass es rechts davon, im Intervall [b′k , b], h�chstens endlich viele Glieder der Folge gibt. Auch diese Intervallschachtelung besitzt einen Grenzwert, den wir mit s bezeichnen. Es gilt stets ak ⩽ a′k und bk ⩽ b′k . Wir definieren auch hier mk ∶= min {m ∣ zm ∈ [a′k , b′k ] ∧ m > mk−1 } für jedes k ∈ N0 . Es gilt: liml→∞ zmk = s. Es gilt also c = lim znk k→∞ und lim zmk = s . k→∞ 46 2. Grenzwerte von Funktionen und Stetigkeit Da f stetig ist, gilt: f (c) = lim f (znk ) k→∞ und lim f (zmk ) = f (s) . k→∞ Somit gilt y0 = lim ynk = lim f (f −1 (ynk )) = lim f (znk ) = f (c) k→∞ k→∞ k→∞ und ebenfalls y0 = lim ymk = lim f (f −1 (ymk )) = lim f (zmk ) = f (s) , k→∞ k→∞ k→∞ also gilt f (c) = f (s) und da f injektiv ist, folgt daraus c = s. Nun zeigen wir, dass nicht nur die zwei Teilfolgen (znk ) und (zmk ) gegen c konvergieren, sondern, dass auch lim zn = c (2.3) l→∞ gilt. Sei ϵ > 0. Sei N ∈ N0 mit ϵ > 1 N. So wie wir die zwei Intervallschachtelungen ([ai , bi ]) und ([a′i , b′i ]) konstruiert haben, und da beide denselben Grenzwert c (= s) haben, ist lim ak = lim bk = lim a′k = lim b′k = c . k→∞ k→∞ k→∞ Sei k so gewählt, dass die Intervalllänge b′k − ak < k→∞ 1 2N . Links von ak und rechts von b′k hat es nach der Konstruktion der Intervallschachtelung nur endlich viele Glieder der Folge (zn ). Sei nϵ ∶= max{n ∣ zn < ak ∨ zn > b′k } . Dann gilt zn ∈ [ak , b′k ] für alle n > nϵ , und somit ∣zn − c∣ ⩽ ∣zn − ak ∣ + ∣ak − c∣ < 2 ⋅ 1 1 = <ϵ 2N N für alle n > nϵ . Damit haben wir (2.3) gezeigt und daraus folgt: lim f −1 (yn ) = lim zn = c = f −1 (y0 ) n→∞ und somit ist f −1 stetig. n→∞ 2.3. Stetigkeit 47 Bemerkung Man kann zeigen: wenn jede stetige Funktion auf einem abgeschlossenen Intervall [a, b] jeden Wert zwischen f (a) und f (b) annimmt, dann ist jede Cauchy-Folge konvergent. Dies bedeutet, dass die ‘Zwischenwerteigenschaft’ äquivalent ist zur Vollständigkeit von R. Satz 2.19 Eigenschaften stetiger Funktionen Die Funktion f sei auf dem abgeschlossenen Intervall [a, b] stetig. Dann gilt: 1. f ist beschränkt auf [a, b]. D.h. es gibt eine Zahl M so, dass ∣f (x)∣ ⩽ M, ∀x ∈ [a, b] . 2. f nimmt auf [a, b] ihr Minimum und Maximum an. D.h. es gibt Zahlen c und d aus dem Intervall [a, b] so, dass f (d) ⩽ f (x) ⩽ f (c), ∀x ∈ [a, b] . f (c) ist das Maximum der Funktion f im Intervall [a, b] und f (d) ist das Minimum der Funktion f im Intervall [a, b]. Beweis von Satz 2.19 1. Wir führen einen Widerspruchsbeweis, indem wir annehmen, dass die auf [a, b] stetige Funktion f unbeschränkt sei. Wir konstruieren nun eine Intervallschachtelung: Sei dazu a0 = a und b0 = b. Jetzt halbieren wir das Intervall [a0 , b0 ] in die Intervalle [a0 , a 0 + b0 ] 2 und [ a 0 + b0 , b0 ] . 2 In mindestens einem dieser Intervalle muss f unbeschränkt sein. Nehmen wir an, es sei das linke Teilintervall. Dann setzen wir a1 = a0 und b1 = a0 2+b0 . Dieses Verfahren setzen wir fort. Da in jedem Schritt die Intervallbreite halbiert wird, erhalten wir eine Intervallschachtelung, wobei in jedem Teilintervall die Funktion f unbeschränkt ist. Dies bedeutet, dass in jedem dieser Intervalle [an , bn ] ein cn existiert, mit ∣f (cn )∣ > n. Diese Intervallschachtelung besitzt einen Grenzwert c und es gilt: c = limn→∞ cn , aber lim f (cn ) ≠ f (c) . n→∞ Das ist ein Widerspruch zur Stetigkeit von f . 48 2. Grenzwerte von Funktionen und Stetigkeit 2. Wir haben in 1 gezeigt, dass f ([a, b]) ∶= {f (x)∣x ∈ [a, b]} eine beschränkte Menge ist. Dann existiert S ∶= sup(f ([a, b])) (vgl. Satz vom Supremum und Infimum beschränkter Mengen (Satz 1.22 S.23). Nun halbieren wir das Intervall [a, b]. Wegen des ersten a+b ′ Teils dieses Satzes existieren S1 ∶= Sup(f ([a, a+b 2 ])) und S1 ∶= Sup(f ([ 2 , b])). Nun gilt S = S1 oder S = S1′ . Wir nehmen das entsprechende Teilintervall und fahren so weiter. Damit haben wir eine Intervallschachtelung [an , bn ] konstruiert. Diese Intervallschachtelung besitzt einen Grenzwert c. Für jedes n ∈ N existiert ein cn ∈ [an , bn ] mit S − f (cn ) < n1 . Damit gilt: c = lim an = lim cn = lim bn n→∞ n→∞ n→∞ und da f stetig ist, gilt: f (c) = lim f (cn ) = S . n→∞ Bemerkungen 1. Dass die Stetigkeit eine notwendige Voraussetzung ist, damit das Maximum von der Funktion angenommen wird, zeigt die folgende Funktion: f ∶ [0, 1] Ð→ R ∶ x ↦ { x für 0 ⩽ x < 1 0 für x = 1 . 2. Dass das Intervall abgeschlossen sein muss, damit die Funktion beschränkt ist und damit sie wiederum das Maximum annehmen kann, zeigt die Funktion f ∶]0, 1] Ð→ R ∶ x ↦ 1 . x Beispiele 2.20 Wir werden nun einige Funktionen betrachten, die nicht stetig sind: • In Figur 27 zeigt das erste Bild den Graphen einer Funktion, der ja nun wirklich stetig aussieht! Erst beim Vergrössern “an der richtigen Stelle“ (aber wo ist die jeweils?) merkt man irgendwann, dass die Funktion bei 0 unstetig ist. 2.3. Stetigkeit 4 Mathematische Grundlagen der Analysis 186 49 Abb. 27: 4.58: graphische „Evidenz“ fürman, Stetigkeit Figur Beim Vergrössern sieht dass die Funktion an der Stelle 0 nicht stetig ist. Die verwendete Funktionsvorschrift ! f (x) = x2 x2 x+2 0,00001 f (x) = { x2 für x ≤ 0 x 0⩽ 0 fürfür x> + 0.00001 für x > 0 zeigt die Unstetigkeit bei 0 natürlich sofort, nicht jedoch der Graph! Bei jedem zeigt Unstetigkeit bei 0 natürlich nicht Trugschlüsse jedoch der Graph! Bei jedem vom die Computer gezeichneten Graphen sofort, sind analoge möglich. " vom Computer gezeichneten Graphen sind analoge Trugschlüsse möglich. Beispiel 4.3 („Kammfunktion“ & Co.) Die folgenden drei in ganz R definierten Funktionen f , g und h sind etwas künstlich, zeigen aber, wie komplex und unanschaulich die reellen Zahlen sind. So kom1 für x ∈ Q (x) { R definierte Funktionen gibt, die an keiner plex und unanschaulich, dassfes in =ganz 0 für x ∈ R ∖ Q . oder nur einer Stelle stetig sind oder nur für alle irrationalen Zahlen und 0: • Die Kammfunktion wurde 1829 von Dirichlet angegeben; sie ist definiert durch Für jede Stelle a ∈ R kann man wegen der Dichtheit der rationalen Zahlen Folgen aus rationalen Zahlen angeben, gegen konvergieren und stets Funktionswert 1 1. Die Kammfunktion wurdedie 1829 von aDirichlet angegeben; sie istden definiert durch haben, und Folgen aus irrationalen!Zahlen, die gegen a konvergieren und somit stets den Funktionswert 0 haben. Damit gibt 1 es fürkeinen x ∈ Q Grenzwert, und diese Funktion ist f (x) = an keiner Stelle stetig. (Diese Funktion ist die Funktion der Menge 0 für x Charakteristische ∈ R\Q . Q [vgl. HAG].) Für jede Stelle a ∈ R kann man wegen der Dichtheit der rationalen Zahlen Folgen aus rationalen Zahlen angeben, die gegen a konvergieren und stets den Funktionswert 1 haben, und Folgen aus irrationalen Zahlen, die gegen a x für x ∈ Q g(x)den = {Funktionswert 0 haben. Damit gibt es keinen konvergieren und somit stets 0 für x ∈ R ∖ Q . Grenzwert, und diese Funktion ist an keiner Stelle stetig. Aus heutiger Sicht ist Die Funktion g ist übrigens stetig ankein der „Monster“, Stelle 0, sonst unstetig. diese Funktion sondern die Charakteristische FunktiZumon Beweis betrachten wir eine beliebige rationale Stelle x ≠ 0 und geben zwei Folgen der Menge Q (vgl. 2.4.6). mit x an, deren zugehörige Bildfolgen aber unterschiedlichen Grenzwerte 2. Grenzwert Auf derselben p Grundidee basiert die Definition der folgenden Funktion: haben. Sei x = q , eine gekürzte Bruchdarstellung von x. Die Folge ! p fürpn x = pq ∈ Q g(x) = xqn = qn x+ ∈1 R\Q . 0 für • Auf derselben Grundidee basiert die Definition der folgenden Funktion: 50 2. Grenzwerte von Funktionen und Stetigkeit besteht aus rationalen Zahlen und konvergiert gegen x = pq . Die Folge pn √ yn = qn + 2 besteht aus irrationalen Zahlen und konvergiert ebenfalls gegen x = pq . Es gilt: lim g(xn ) = lim xn = x n→∞ n→∞ und lim g(yn ) = 0 . n→∞ Damit ist g an jeder rationalen Stelle x ≠ 0 unstetig. Es bleibt noch zu zeigen, dass g an der Stelle 0 stetig ist. Aber in diesem Fall liefert jede Nullfolge, egal ob aus rationalen Zahlen oder aus irrationalen Zahlen bestehend, eine ebenfalls gegen Null konvergente Bildfolge, und somit ist die Funktion g stetig bei 0. Kapitel 3 Zum Begriff der Ableitung Wir beginnen diese Kapitels mit der Betrachtung des Änderungsverhaltens elementarer Funktionen. Die sogenannte ”Änderungsrate” führt uns dann durch Grenzübergang zum Begriff der Ableitung. Ein Beispiel dafür ist die Momentangeschwindigkeit als Ableitung der Wegfunktion (vgl. Abschnitt 3.2 Die lokale Änderungsrate - ein Beispiel). Durch die Idee von Weierstrass1 wird der Ableitungsbegriff schlussendlich präzisiert und geometrisch fassbar gemacht. 3.1 Das Änderungsverhalten einer Funktion In Anlehnung an Strang [SC, S.1] möchte ich zuallererst drei Beispiele betrachten, die zeigen sollen, was mit dem Änderungsverhalten einer Funktion gemeint ist: Die lineare Funktion l(x) = 2x, die quadratische Funktion q(x) = x2 , und die Exponentialfunktion h(x) = 2x . 1 Karl Theodor Wilhelm Weierstrass (* 31. Oktober 1815 in Ostenfelde bei Ennigerloh/Münsterland; † 19. Februar 1897 in Berlin) war ein deutscher Mathematiker, der sich vor allem um die logisch fundierte Aufarbeitung der Analysis verdient gemacht hat. 52 3. Zum Begriff der Ableitung Figur 28: l(x) = 2x Gerade Figur 29: q(x) = x2 Parabel Figur 30: h(x) = 2x Exponentialkurve Alle drei Funktionen sind im positiven Bereich der x-Achse wachsend, aber die Art und Weise wie sie wachsen ist ganz verschieden: In der Nähe von x = 0 ist die erste Funktion diejenige, welche am schnellsten wächst, aber die anderen holen bald nach. Alle drei Funktionen haben für x = 2 denselben Funktionswert y = 4. Für x-Werte grösser als 2 und kleiner als 4 ist die quadratische Funktion f (x) = x2 die grösste: bei x = 4 sind beide Funktionswerte 42 und 24 gleich, aber anschliessend wächst die Exponentialfunktion schneller als die quadratische Funktion, bei x = 10 gilt bereits: 102 = 100 und 210 = 1024. Wir haben hier drei Funktionsgleichungen welche von x und 2 abhängig sind, aber ein sehr unterschiedliches Änderungsverhalten zeigen. Als Nächstes überlegen wir uns, wie wir das Änderungsverhalten solcher Funktionen in einem bestimmten Punkt x0 am besten beschreiben können und betrachten dazu Die absolute Änderung, die mittlere Änderungsrate, die lokale Änderungsrate Die Graphen dieser Funktionen sind eine Gerade, eine Parabel und eine Exponentialkurve. Wenn wir das Änderungsverhalten dieser Funktionen in einer bestimmten Stelle x0 beschreiben wollen, dann reicht es nicht, die absolute Änderung f (x1 ) − f (x0 ) für zwei Stellen x0 und x1 zu betrachten, welche nahe2 bei einander liegen. Vielmehr muss man diesen Wert in Relation zur Distanz zwischen x0 und x1 setzen. Aussagekräftiger ist somit bestimmt die absolute Änderung f (x1 ) − f (x0 ) pro Distanz x1 − x0 , also f (x1 ) − f (x0 ) , x1 − x0 welchen Term man die mittlere Änderungsrate von f auf dem Intervall [x0 , x1 ] nennt. 2 Was “nahe” bedeutet ist relativ. Sind x0 und x1 nahe wenn ∣x1 − x0 ∣ = 1 oder ∣x1 − x0 ∣ = ∣x1 − x0 ∣ = 1 ? 1000000 1 100 oder 3.1. Das Änderungsverhalten einer Funktion 53 Im Intervall [x0 , x1 ] = [1, 6] wachsen die Werte f (x) pro x-Einheit im Mittel um f (x1 ) − f (x0 ) f (x1 ) − f (x0 ) = . x1 − x0 5 Die gerade Verbindung (Sekante vgl. S.64) zwischen (x0 , f (x0 )) und (x1 , f (x1 )) geht durch die Punkte (2, f (x0 ) + m), (3, f (x0 ) + 2m), (4, f (x0 ) + 3m), (5, f (x0 ) + 4m), (6, f (x0 ) + 5m) = (x1 , f (x1 )). m= Figur 31: Graph von f Die mittlere Änderungsrate gibt die Steigung m der Geraden3 an, welche durch die Punkte (x0 , f (x0 ) und (x1 , f (x1 )) geht. Auch diese Steigung variiert beträchtlich je nach dem, wie gross man x1 wählt. Da wir das Ziel haben, das Änderungsverhalten der Funktion an der Stelle x0 zu beschreiben, ist es natürlich sinnvoll, x1 nahe bei x0 zu wählen. ”Nahe” ist wie schon gesagt sehr relativ4 . Als nächsten Schritt kann man sich überlegen, was geschieht, wenn man diese Differenz immer kleiner werden lässt, und deren Grenzwert betrachten. Der wichtigste und erfolgreichste Ansatz der Analysis ist, dass nicht nur die mittlere sondern die lokale Änderungsrate lim x→x0 f (x) − f (x0 ) x − x0 von f an der Stelle x0 betrachtet wird. Dieser Ausdruck wird traditionellerweise die erste Ableitung von f an der Stelle x0 genannt und mit f ′ (x0 ) bezeichnet. Bemerkung Ist f ∶ A → R eine beliebige reelle Funktion und x0 ∈ A, so ist es im Allgemeinen nicht klar, (x0 ) dass die Ableitung limx→x0 f (x)−f existiert. x−x0 3 4 Sekante vgl. S.64 Vgl. Fussnote 2 54 3. Zum Begriff der Ableitung Definition 3.1 Die Funktion f ∶ A → R heisst differenzierbar auf A, falls die Ableitung f (x) − f (x0 ) x→x0 x − x0 f ′ (x) = lim für alle x0 ∈ A existiert. In diesem Fall heisst die Funktion, die jedem x ∈ A den Wert f ′ (x) zuordnet die Ableitungsfunktion (oder kurz die Ableitung) von f . Bezeichnungen Wir verwenden auch die folgende Begriffe: f ′ (x0 ) = lim x→x0 f (x) − f (x0 ) x − x0 ´¹¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹¸¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¶ (3.1) mittlere Änderungsrate oder Differenzenquotient ´¹¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¸ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¶ lokale Änderungsrate oder Ableitung oder Differentialquotient In unseren Beispielen hat die lineare Funktion eine konstante, die quadratische eine lineare und die Exponentialfunktion wieder eine exponentielle Ableitungsfunktion (vgl. Anhang A): Graph der Funktion Graph der Ableitung 3.1. Das Änderungsverhalten einer Funktion Figur 32: Funktionen und ihre Ableitungen 55 56 3. Zum Begriff der Ableitung An einem angewandten Beispiel veranschaulichen und untersuchen wir die Bedeutung der absoluten Änderung sowie der mittleren und lokalen Änderungsrate: 3.2 Die lokale Änderungsrate - ein Beispiel Betrachten wir das folgende Diagramm, welches den zurückgelegten Weg eines ICE-Zuges in den ersten 400 Sekunden nach dem Start darstellt. Was wir in Figur 33 sehen, ist der Graph der Wegfunktion s ∶ [0, 400] → R t ↦ s(t) wobei t in Sekunden und s(t) in Metern angegeben wird. Figur 33: Weg-Zeit-Diagramm eines ICE-Zuges in den ersten 400 Sekunden Was ist hier die absolute Änderung s(t1 ) − s(t0 )? Wenn wir zum Beispiel t0 = 100 und t1 = 150 betrachten, dann ist s(150) − s(100) ≈ 3300 Meter. (3.2) Wenn wir t0 = 0 und t1 = 100 betrachten, dann ist s(100) − s(0) ≈ 3400 Meter. (3.3) Die absolute Änderung sagt uns wie viele Meter in der Zeit zwischen t0 und t1 zurückgelegt wurden. In diesem Beispiel können wir aus diesen Angaben bereits erkennen, dass die Geschwindigkeit des Zuges zugenommen haben muss, denn in den ersten 100 Sekunden wird eine kürzere Strecke zurückgelegt als in den nächsten 50 Sekunden. Für t0 = 100 und t1 = 400 gilt: s(t1 ) − s(t0 ) = s(400) − s(100) ≈ 27800 − 3400 = 24400. (3.4) 3.2. Die lokale Änderungsrate - ein Beispiel 57 D.h in diesen 300 Sekunden werden 24.4 Kilometer zurückgelegt. Da die Zeitdifferenzen t1 −t0 immer verschieden sind (zuerst war t1 −t0 = 50, dann t1 −t0 = 100 und nun t1 − t0 = 300), ist es schwierig die Angaben zu vergleichen. Ob die Geschwindigkeit ab 200 oder ab 250 Sekunden nach dem Start immer noch zugenommen hat, können wir aufgrund der absoluten Änderungen in (3.2) und (3.3) nicht sagen. Wenn wir (3.2), (3.3) und (3.4) vergleichen wollen, ist es besser, wenn wir die mittlere Änderungsrate, d.h. die Durchschnittsgeschwindigkeit betrachten: 3400 Im Zeitintervall [0, 100] werden im Mittel in einer Sekunde ≈ 34 Meter zurückgelegt. 100 Im Zeitintervall [100, 150] werden im Mittel in einer Sekunde 3300 ≈ 66 Meter zurückgelegt. 50 24400 Im Zeitintervall [100, 400] werden im Mittel in einer Sekunde ≈ 91 Meter zurückge300 legt. Die mittlere Geschwindigkeit (Durchschnittsgeschwindigkeit) in einem beliebigen Zeitintervall [t0 , t1 ] findet man, indem man die Wegdifferenz s(t1 ) − s(t0 ) auf die zugehörige Zeitdifferenz t1 − t0 bezieht, d.h. durch sie dividiert: Die mittlere Geschwindigkeit im Intervall [t0 , t1 ] ist wie folgt definiert: s(t1 ) − s(t0 ) . t1 − t0 Wir haben also für dieses Beispiel eine konkrete Interpretation der mittleren Änderungsrate als Durchschnittsgeschwindigkeit im Intervall [t0 , t1 ]. Damit wissen wir aber noch nicht wie gross die Geschwindigkeit (Momentangeschwindigkeit) in einem bestimmten Zeitpunkt, z.B. im Zeitpunkt t0 = 100 ist. Die Momentangeschwindigkeit v(to ) ist wie folgt definiert: s(t) − s(t0 ) . t→t0 t − t0 v(t0 ) = lim Wir möchten im folgenden die Momentangeschwindigkeit des Zuges nach 100 Sekunden schätzen. Dazu sollten wir das Weg-Zeit-Diagramm in der Nähe von 100 etwas genauer betrachten: 58 3. Zum Begriff der Ableitung t 50 80 90 95 100 105 110 150 200 300 400 s(t) 980 2290 2820 3095 3380 3680 3980 6650 10440 18860 27770 Figur 34: Weg-Zeit-Diagramm eines ICE-Zuges in der Nähe des Zeitpunktes t0 = 100 Neben dem Diagramm sind nun einige Werte tabellarisch angegeben (es ist schwierig diese Werte aus der Tabelle genau abzulesen). In der folgenden Tabelle betrachten wir, wie sich die mittlere Geschwindigkeit ändert, wenn wir uns immer mehr dem Zeitpunkt t = 100 annähern: Zeitintervall [t0 , t1 ] mittlere Geschwindigkeit s(t1 )−s(t0 ) t1 −t0 im Zeitintervall [t0 , t1 ] [100, 400] 27770−3380 300 ≈ 81.3 [100, 200] 10440−3380 100 ≈ 70.6 [100, 110] 3980−3380 10 ≈ 60 [100, 105] 3680−3380 5 ≈ 60 Wir stellen fest, dass in Intervallen der Form [100, t1 ] die mittlere Geschwindigkeit desto kleiner wird, je mehr sich t1 dem Zeitpunkt 100 nähert. Je kleiner wir das Zeitintervall zwischen t0 = 100 und t1 wählen, desto genauer wird die Momentangeschwindigkeit durch die mittlere Geschwindigkeit angenähert. Was geschieht, wenn wir Intervalle der Form [t1 , 100] wählen? 3.2. Die lokale Änderungsrate - ein Beispiel Zeitintervall [t1 , t0 ] 59 mittlere Geschwindigkeit s(t1 )−s(t0 ) t1 −t0 im Zeitintervall [t0 , t1 ] [50, 100] [80, 100] ≈ 48 980−3380 −50 2290−3380 −20 ≈ 54.5 [90, 100] 2820−3380 −10 ≈ 56 [95, 100] 3095−3380 −5 ≈ 57 Nun stellen wir fest, dass in Intervalle der Form [t1 , 100] die mittlere Geschwindigkeit desto grösser wird, je kleiner die Differenz zwischen 100 und t1 wird. Die Momentangeschwindigkeit des Zuges 100 Sekunden nach dem Start können wir mit diesen Angaben nicht genau bestimmen, aber diese muss nach unseren Überlegungen zwischen 57 und 60 km/h liegen. In diesem Beispiel ist also die lokale Änderungsrate (die Ableitung) die Momentangeschwindigkeit des Zuges. Mit diesem Vorgehen, können wir die Geschwindigkeit des Zuges an jeder Stelle approximieren und so erhalten wir eine Funktion v ∶ [0, 400] → R t ↦ v(t), wobei t in Sekunden und v(t) in m/s gegeben ist. Der Graph von v schaut ungefähr so aus: Figur 35: Graph der Geschwindigkeit des ICE: Die Geschwindigkeit nimmt zu Beginn rasant zu. 60 3. Zum Begriff der Ableitung 3.3 Die Idee von Weierstrass In diesem Abschnitt werden wir die Überlegungen von Weierstrass5 kennenlernen, die das Ziel habeneine nicht lineare Funktion durch eine lineare Funktion zu approximieren: Das folgende Zitat stammt aus einer Vorlesung, die Weierstrass im Sommersemester 1861 am Königlichen Gewerbeinstitut zu Berlin gehalten hat und die von H.A. Schwarz aufgezeichnet wurde: “Die vollständige Veränderung f (x + h) − f (x), welche eine Funktion f (x) dadurch erfährt, dass x in x+h übergeht, lässt sich im allgemeinen in zwei Teile zerlegen, von denen der eine der Aenderung h des Argumentes proportional ist, also aus h und einem von h unabhängigen – in Bezug auf h constanten – Faktor besteht, ... der andere aber nicht bloss an und für sich unendlich klein wird, wenn h unendlich klein wird, d.h. noch unendlich klein wird, wenn man ihn mit h dividiert. ” [DVD, S.81] Um diese Ausführung von Weierstrass besser zu verstehen, bezeichnen wir die Stelle x wieder mit x0 (was deutlicher macht, dass wir uns auf eine feste Stelle x0 konzentrieren). Weierstrass betrachtet die “vollständige Veränderung“ (die “vollständige Veränderung” ist das, was wir die absolute Änderung nennen) zwischen dem Wert von f an der Stelle x0 und dem Wert von f an der Stelle x0 + h (x0 + h haben wir x genannt): Figur 36: Karl Weierstrass (1815-1897) Figur 37: Die “vollständige Veränderung” (die absolute Änderung) 5 Vgl. Fussnote 1 S. 51 3.3. Die Idee von Weierstrass 61 Zuerst sagt Weierstrass, dass man die “vollständige Veränderung” f (x0 + h) − f (x0 ) “im Allgemeinen” in zwei Summanden zerlegen kann und dass der erste Summand “eine der Aenderung h des Argumentes proportional ist” und also dargestellt werden kann in der Form α⋅h für eine geeignete Konstante α, (welche unabhängig von h ist). Er sagt weiter, dass der zweite (Rest-)Summand der Zerlegung, den wir jetzt mit r(h) (noch besser wäre die Bezeichnung r(x0 , h), da r von der Stelle x0 und von h abhängig ist) bezeichnen, “noch unendlich klein wird, wenn man ihn mit h dividiert”. Also strebt r(h) h gegen Null, wenn h r(h) gegen Null strebt. Formal aufgeschrieben: lim = 0. h→0 h Die Beschreibung von Weierstrass lautet formal: f (x0 + h) − f (x0 ) = α ⋅ h + r(h), wobei r(h) = 0. h→0 h lim (3.5) Wir gehen jetzt davon aus, dass die gegebene Funktion f auf einem Intervall definiert und dort differenzierbar ist6 . Als nächstes wollen wir die Formel (3.5) genauer betrachten und folgende drei Aspekte vertiefen: • Die Ableitung: Der von h unabhängige – in Bezug auf h constante – Faktor • Grafische Interpretation • Die lineare Approximation 3.3.1 Die Ableitung: Der von h unabhängige – in Bezug auf h constante – Faktor In diesem Abschnitt zeigen wir, dass der von h unabhängige – in Bezug auf h constante – Faktor, den wir mit α bezeichnet haben, nichts anderes als die Ableitung von f an der Stelle x0 ist. 6 Sämtliche elementare Funktionen wie Polynome, rationale Funktionen, Exponentialfunktion, Lo- garithmusfunktion, Potenzfunktionen, trigonometrische Funktionen und Betragsfunktion sind auf ihren Definitionsbereichen differenzierbar, allenfalls mit Ausnahme von einzelnen Stellen (z.B. die Betragsfunktion oder die Wurzelfunktion). 62 3. Zum Begriff der Ableitung Wegen der Eigenschaft (3.5) gilt nämlich: f ′ (x0 ) S.54 = = (3.5) = = = (3.5) = f (x) − f (x0 ) x − x0 f (x0 + h) − f (x0 ) lim h→0 h α ⋅ h + r(h) lim h→0 h r(h) lim (α + ) h→0 h r(h) α + lim h→0 h (3.6) lim x→x0 (mit h = x − x0 ) (3.7) (3.8) (3.9) (3.10) (3.11) α. Also: f ′ (x0 ) = α. 3.3.2 (3.12) Grafische Interpretation Wegen (3.12) können wir die Formel (3.5) von Weierstrass wie folgt umformen: f (x0 + h) − f (x0 ) = f ′ (x0 ) ⋅ h + r(h) Dazu gehört die nachstehende grafische Darstellung: Figur 38: f (x0 + h) − f (x0 ) = f ′ (x0 ) ⋅ h + r(h) mit r(h) = 0. h→0 h lim (3.13) 3.3. Die Idee von Weierstrass 3.3.3 63 Die lineare Approximation Als Nächstes wollen wir die lineare Funktion t angeben, deren Graph die in Figur 38 rot markierte Strecke enthält. Dieser Graph muss durch die Punkte (x0 , f (x0 )) und (x0 + h , f (x0 + h) − r(h)) (3.14) gehen. Die Funktion t ist gegeben durch t ∶ x ↦ f ′ (x0 )(x − x0 ) + f (x0 ) , denn t ist linear und erfüllt t(x0 ) = f (x0 ) (3.15) und t(x0 + h) = f ′ (x0 )(x0 + h − x0 ) + f (x0 ) = f ′ (x0 )h + f (x0 ) (3.16) f (x0 + h) − r(h). (3.17) (3.13) = Insbesondere gilt also auch f (x0 + h) = t(x0 + h) + r(h) . (3.18) Die Formel (3.5) von Weierstrass besagt, dass die Differenz r(h) zwischen f (x0 + h) und t(x0 + h) in der Nähe von x0 sehr klein ist, nämlich sogar schneller als h selbst gegen Null geht7 . Das bedeutet, dass die Funktion f in der Nähe8 von x0 durch die lineare Funktion t sehr gut approximiert9 wird: 3.18 f (x0 + h) = t(x0 + h) + r(h) ≈ t(x0 + h) . (3.19) Die Funktion t(x) = f ′ (x0 )(x − x0 ) + f (x0 ) , (3.20) welche die Funktion f in der Nähe von x0 linear approximiert, nennt man, nach Weierstrass, die lineare Approximation von f an der Stelle x0 . Wir werden bald sehen, dass die lineare Approximation t diejenige lineare Funktion ist, welche die Funktion f am besten approximiert. (Vgl. S. 66.) Im Folgenden werden wir einige Eigenschaften und Anwendungen der linearen Approximation betrachten, nämlich: Da sogar limh→0 r(x) = 0 gilt, muss r(h) für h → 0 sehr schnell gegen Null konvergieren! h 8 Wie nahe der Punkt “in der Nähe von x0 ” gewählt werden muss, hängt von der gewünschten Genau7 igkeit ab. Je kleiner h ist, desto besser ist die Approximation bzw. desto kleiner ist der Fehler. 9 Das Symbol für eine Approximation ist ≈ und bedeutet “ist ungefähr gleich”. 64 3. Zum Begriff der Ableitung • Die Tangente; d.h. die Gerade, welche den Graphen der Funktion f in der Nähe von x0 am besten annähert • Näherungsweise Berechnung von Funktionswerten • Fehlerrechnung Die Tangente Die mittlere Änderungsrate f (x) − f (x0 ) x − x0 kann geometrisch interpretiert werden als die Steigung der Geraden, welche durch die Punkte (x0 , f (x0 )) und (x, f (x)) geht. Figur 39: Sekanten Die Geraden s1 , s2 , s3 und s4 nennen wir (in Anlehnung an den entsprechenden Begriff für den Kreis) Sekanten. Ist der Graph von f eine “glatte” Kurve und lässt man x gegen x0 gehen, so streben die Sekanten (sn ) gegen eine Gerade, die den Graphen von f im Punkt (x0 , f (x0 )) berührt. Dies ist genau dann der Fall, wenn die lokale Änderungsrate von f in x0 , also die Ableitung f ′ (x0 ) existiert. Die Gerade, welche durch den Punkt (x0 , f (x0 )) geht und die Steigung f ′ (x0 ) hat, nennen wir Tangente an den Graphen von f im Punkt (x0 , f (x0 )) . 3.3. Die Idee von Weierstrass 65 Figur 40: Die Tangente im Punkt (x0 , f (x0 )) Die Tangente an den Graphen von f im Punkt (x0 , f (x0 )) hat die Gleichung10 y = f ′ (x0 )(x − x0 ) + f (x0 ) . (3.21) Die Tangente an den Graphen von f im Punkt (x0 , f (x0 )) ist also nichts anders als der Graph der linearen Approximation von f an der Stelle x0 . Aufgrund dieser Definition, kann man die Ableitung einer Funktion an verschiedenen Punkten von Auge approximieren [BHA, S.89] und diese Punkte verbinden, um daraus eine grobe Annäherung der Ableitungsfunktion zu gewinnen. Euler11 nannte dieses Vorgehen “in libero manus ductu” (mit freier Hand geführt). Bemerkung Diese Gerade heisst Tangente in Anlehnung an den Begriff der Tangente am Kreis. Die Tangente im Punkt P eines Kreises k ist definiert als diejenige Gerade g, welche durch den Punkt P geht und den Kreis k berührt d.h.: g ∩ k = {P }. Die Tangente an eine Kurve so wie wir sie soeben definiert haben, kann jedoch die Kurve im selben Punkt gleichzeitig schneiden und berühren und hat häufig mehr als einen Schnittpunkt mit der Kurve. 10 Jede Gerade, welche durch den Punkt (x0 , f (x0 )) geht, hat eine Gleichung der Form y = m(x − x0 ) + f (x0 ), wobei m die Steigung der Geraden ist (vgl. Übungen). 11 Leonhard Euler (* 15. April 1707 in Basel; † 18. September 1783 in Sankt Petersburg) war ein Schweizer Mathematiker und Physiker, der wegen seiner Beiträge zur Analysis, zur Zahlentheorie und zu vielen weiteren Teilgebieten der Mathematik als einer der bedeutendsten Mathematiker gilt. 66 3. Zum Begriff der Ableitung Figur 41: Die Tangente t0 an der Stelle 0 schneidet und berührt die Kurve im Punkt (0, f (0)) Figur 42: Die Tangente t0.5 an der Stelle 0.5 berührt die Kurve im Punkt (0.5, f (0.5)) und schneidet sie im Punkt (−1, 0) Zudem gibt es im Allgemeinen keine Analogie dazu, dass die Tangente an einem Kreis senkrecht steht zum Radius durch den Kreispunkt P 12 . Die Tangente ist die Gerade, welche den Graphen der Funktion f in der Nähe von x0 am besten annähert Im Titel dieses Abschnittes wird behauptet, dass die Tangente unter allen möglichen Geraden, welche durch den Punkt (x0 , f (x0 )) gehen, diejenige Gerade ist, welche den Graphen von f im Punkt x0 am besten annähert. Wie ist das genau zu verstehen? Jede lineare Funktion, deren Graph durch den Punkt (x0 , f (x0 )) geht, hat eine Funktionsgleichung der Form13 gm (x) = m(x − x0 ) + f (x0 ) . 12 (3.22) Es lässt sich jedoch oft ein sogenannter Krümmungskreis definieren, der im betreffenden Punkt unter anderem dieselbe Tangente hat. 13 vgl. Übungen. 3.3. Die Idee von Weierstrass 67 Figur 43: Graph der Funktion f und verschiedene Geraden, welche durch den Punkt (x0 , f (x0 )) gehen Der Fehler der Approximation von f durch die Funktion gm an der Stelle x0 + h ist F (h) = f (x0 + h) − gm (x0 + h) = f (x0 + h) − f (x0 ) − mh (3.23) Für h → 0 strebt diese Differenz bei jeder Funktion gm gegen Null. Für den relativen Fehler F (h) gilt hingegen h F (h) f (x0 + h) − f (x0 ) − mh = lim h→0 h→0 h h f (x0 + h) − f (x0 ) = lim −m h→0 h lim = f ′ (x0 ) − m . (3.24) (3.25) (3.26) Der relative Fehler konvergiert also nur dann gegen Null, wenn m = f ′ (x0 ) ist. Dies ist genau dann der Fall, wenn es sich um die Tangente handelt. ′ Da die Bedingung limh→0 F (h) h = 0 viel stärker ist und da t(x) = f (x)(x − x0 ) + f (x0 ) die einzige Funktion ist, welche diese Bedingung erfüllt, nennt man die Tangente die Gerade, welche den Graphen der Funktion f in der Nähe von x0 am besten annähert. Anders ausgedrückt gilt, wie bereits erwähnt: für die gegebene Funktion f ist die weiter oben eingeführte lineare Approximation die beste lokale Annäherung durch eine lineare Funktion. 68 3. Zum Begriff der Ableitung Näherungsweise Berechnung von Funktionswerten Die Idee der lokalen linearen Annäherung einer Funktion gibt uns die Möglichkeit Funktionen näherungsweise zu berechnen. Kennt man von einer Funktion f den Funktionswert und die Ableitung14 an einer Stelle x0 , so ist es möglich wegen f (x0 + h) ≈ t(x0 + h) = f ′ (x0 ) ⋅ h + f (x0 ) (3.27) die Funktionswerte in der Umgebung von x0 näherungsweise zu berechnen: Beispiel 3.2 Näherungsweise Berechnungen 1. Wie gross ist √ 16.3 ? Wir wenden (3.27) auf die Funktion f ∶ [0, ∞[→ R; x ↦ x > 0 ist f ′ (x) = 1 √ 2 x √ Der Wert von √ x, x0 = 16 und h = 0.3. Für (vgl. Anhang A). Darum gilt: √ 1 1 16 + 0.3 ≈ √ ⋅ 0.3 + 16 = ⋅ 0.3 + 4 = 4.0375 8 2 16 √ 16.3 auf 6 wesentlichen Ziffern gerundet ist: 4.03733 2. Wie gross ist (−2.98)3 ? Wir wenden (3.27) auf die Funktion g ∶ R → R; x ↦ x3 , x0 = −3 und h = 0.02. Wegen g ′ (x) = 3x2 gilt: (−2.98)3 ≈ 3 ⋅ (−3)2 ⋅ (0.02) + (−3)3 = 27 ⋅ (−0.02) − 27 = −26.46 Der Wert von (−2.98)3 auf 6 wesentlichen Ziffern gerundet ist: -26.4636 Fehlerrechnung Die Idee der lokalen linearen Annäherung einer Funktion gibt uns auch die Möglichkeit das Ausmass von Fehlern zu berechnen. Typischerweise geht es dabei um zwei Grössen, welche voneinander funktional abhängig sind (z.B. durch eine Formel). Wenn die eine Grösse falsch gemessen oder angegeben wird, hat das natürlich eine Auswirkung auf die andere: 14 ist. Auch hier wird also stillschweigend vorausgesetzt, dass die Funktion an der Stelle x0 differenzierbar 3.4. Stetigkeit und Differenzierbarkeit 69 Beispiel 3.3 Kugelvolumen Das Volumen einer Kugel wird mit der Formel V (r) = 43 r3 π berechnet. Nehmen wir an, dass wegen eines Messfehlers für den Radius der Kugel anstatt des wahren Wertes r0 der Wert r0 + h gemessen wird. Statt V (r0 ) erhalten wir das Volumen V (r0 + h). Der Fehler h führt also zum Fehler V (r0 + h) − V (r0 ). Nach (3.27) kann dieser Fehler durch V ′ (r0 ) ⋅ h approximiert werden. Wie goss ist näherungsweise dieser Fehler, wenn der prozentuale Fehler z.B. h = ±1% ist? V (r0 + h ⋅ r0 ) − V (r0 ) ≈ V ′ (r0 ) ⋅ h ⋅ r0 = 4πr02 ⋅ h ⋅ r0 4 3 = r π ⋅ 3h. 3 0 Der Fehler bei der Volumenberechnung beträgt für h = ±1% also ungefähr ±3%. V ′ (r0 ) = 4πr02 ist nichts anderes als der Inhalt der Kugeloberfläche der Kugel mit Radius r0 . Die Formel V ′ (r0 ) ⋅ h ⋅ r0 bedeutet geometrisch, dass die Kugelschale (der Dicke h ⋅ r0 durch “Oberfläche der Kugel” × “Radiusdifferenz” approximiert werden kann. 3.4 Stetigkeit und Differenzierbarkeit Ist f in x0 differenzierbar, so ergibt sich aus (3.1) sofort f (x) − f (x0 ) = f (x) − f (x0 ) (x − x0 ) x − x0 Ð→ x→x0 f ′ (x0 ) ⋅ 0 = 0. (3.28) Also ist lim f (x) = f (x0 ) , x→x0 d.h. f ist in x0 stetig. Damit haben wir gezeigt: Satz 3.4 1. Wenn eine Funktion an einer Stelle differenzierbar ist, dann ist sie dort auch stetig. 2. Falls eine Funktion in einem Intervall differenzierbar ist, so ist sie dort auch stetig. 70 3. Zum Begriff der Ableitung Wir haben im Abschnitt 3.3 S.60 die Idee von Weierstrass untersucht und bereits gesehen, dass “der von h unabhängige - in Bezug auf h constante- Faktor” nichts anders als die Ableitung ist, also insbesondere, dass eine Funktion, welche die Weierstrassschen Bedingungen erfüllt differenzierbar ist. Im folgenden Satz werden wir zeigen, dass diese Bedingungen auch notwendig für Differenzierbarkeit sind: Satz 3.5 Satz von Weierstrass Genau dann ist die Funktion f ∶ I → R an der Stelle x0 differenzierbar, wenn die lokale �Änderung f (x0 + h) − f (x0 ) in der Form f (x0 + h) − f (x0 ) = α ⋅ h + r(h), mit r(h) =0 h→0 h lim (3.29) dargestellt werden kann. In diesem Fall ist α = f ′ (x0 ). Beweis 8 Falls die Funktion f im Punkte x0 differenzierbar ist, definieren wir r(h) ∶= f (x0 + h) − f (x0 ) − f ′ (x0 )h . Dann gilt: f (x0 + h) − f (x0 ) = f ′ (x0 )h + r(h) und lim h→0 r(h) f (x0 + h) − f (x0 ) = lim ( − f ′ (x0 )) = 0 . h→0 h h Ist hingegen (3.29) erfüllt, dann gilt f (x0 + h) − f (x0 ) r(h) = lim (α + )=α h→0 h→0 h h lim (3.30) also existiert f ′ (x0 ) und ist gleich α. Bemerkung Dieser Satz macht den Unterschied zwischen Differenzierbarkeit und Stetigkeit besonders sinnfällig: Stetigkeit von f in x0 bedeutet nur, dass f (x0 + h) − f (x0 ) → 0 für h → 0. Wählt man irgendeine Zahl α und setzt man f (x0 +h)−f (x0 ) = αh+r(h), so ist f genau dann in x0 r(h) = 0, stetig, wenn limh→0 r(h) = 0 ist. Für Differenzierbarkeit braucht man jedoch lim h→0 h was bei stetigen Funktionen nicht erfüllt zu sein braucht. 3.4. Stetigkeit und Differenzierbarkeit 71 Beispiele 3.6 1. Die Betragsfunktion f ∶ R Ð→ R ∶ x ↦ ∣x∣ ist an der Stelle 0 stetig aber nicht differenzierbar. 2. Die Funktion g ∶ R Ð→ R ∶ x ↦ ∣ sin(x)∣ ist für alle n ∈ Z an den Stellen nπ stetig aber nicht differenzierbar. 3. Die Funktion s ∶ [0, ∞[Ð→ R ∶ x ↦ √ x ist an der Stelle 0 stetig aber nicht differen- zierbar. Figur 44: Graph der Betragsfunktion Figur 45: Graph der Funktion g ∶ R Ð→ R ∶ x ↦ ∣ sin(x)∣ Figur 46: Graph der Wurzelfunktion 72 3. Zum Begriff der Ableitung Kapitel 4 Monotonie und Ableitung In der Mittelschule haben Sie mit Hilfe der Ableitung den Verlauf von Kurven untersucht und damit insbesondere Extremwertaufgaben und Kurvendiskussionen durchgeführt. In diesem Kapitel werden wir uns mit den theoretischen Hintergründen dieser Art von Untersuchungen beschäftigen. 4.1 Das Monotoniekriterium In Anlehnung an [DVA, S. 56] betrachen wir das folgende Beispiel, welches stellvertretend für viele ähnlich gelagerte Zusammenhänge steht. Eine zylindrische 33 cl-Dose aus Aluminium kann sehr verschiedene Formen haben: Figur 47: Verschiedene Zylinder mit demselben Inhalt Da man meistens möglichst wenig Aluminium für die Verpackung aufwenden will, suchen wir nun den Zylinder mit der kleinsten Oberfläche. Die Oberfläche hängt von der Wahl des Radius r der Grundfläche und von der Höhe h ab. Sie setzt sich zusammen aus Boden, 74 4. Monotonie und Ableitung Deckel und Mantel: 0(r, h) = 2πr2 + 2πrh (4.1) 3 Da wir cl schlecht mit cm3 oder mit dm verglichen können, arbeiten wir mit ml und cm (1 cm3 = 1ml). Nun variieren r und h nicht unabhängig voneinander; da der Doseninhalt 330 ml betragen soll, gilt: πr2 h = 330 . (4.2) Löst man (4.2) nach h auf und setzt dies in (4.1) ein, so erhält man: 0(r) = 2πr2 + 660 . r (4.3) Da mit grösser werdendem r der Summand 2πr2 zunimmt, der Summand 660 r aber abnimmt, ist nicht ohne weiteres zu erkennen, wie die Oberfläche vom Radius abhängt. Einen ersten Einblick gibt der Graph, den man sich etwa über eine Wertetabelle verschaffen kann. Figur 48: Oberfläche der Dose in cm2 in Abhängigkeit des Radius in cm Wir erkennen, dass mit wachsendem Radius die Oberfläche zunächst abnimmt und dann wieder zunimmt. Wie lässt sich die Stelle r0 bestimmen, an der die Funktion aufhört abzunehmen und wieder zuzunehmen beginnt? 4.1. Das Monotoniekriterium 75 Aus der Anschauung entnehmen wir: In den Bereichen, wo O′ (r) negativ ist, nimmt O(r) streng monoton ab. Dort, wo O′ (r) positiv ist, wächst O(r) streng monoton1 . Damit brauchen wir nur die Stelle zu finden, an der die Ableitung weder positiv noch negativ, also Null ist. 660 r2 (4.4) 165 ≈ 3.74 π (4.5) O′ (r) = 4πr − Für √ r0 = 3 ist O′ (r) = 0. Für r0 ≈ 3.74 cm ist die Höhe h0 ≈ 7.50 cm. (Die üblichen Getränke-Dosen mögen wohl schön sein, verschwenden aber einiges an unnötigem Aluminium. Nicht zu vergessen ist allerdings, dass Boden und Mantel nicht dieselbe Materialdicke haben und noch weitere Faktoren, wie z.B. Handlichkeit eine Rolle spielen.) Wir haben in diesem Beispiel den folgenden Satz verwendet: Satz 4.1 Monotoniekriterium (hinreichendes Kriterium für Monotonie) Eine auf einem Intervall differenzierbare Funktion mit überall positiver Ableitung ist streng monoton wachsend. Analoges gilt für streng monotones Fallen. Bemerkung Das folgende Beispiel zeigt, wieso es wichtig ist, dass die Funktion auf einem Intervall differenzierbar sein muss. Wir definieren die Funktion f auf A ∶= [1, 2] ∪ [3, ∞[ wie folgt: ⎧ ⎪ ⎪ ⎪ f ∶ A Ð→ R ∶ f (x) = ⎨ ⎪ ⎪ ⎪ ⎩ x2 4 für 0.5 ⩽ x ⩽ 2 (x−2.5)2 4 für x ⩾ 3 f ist auf ganz A differenzierbar, mit f ′ (x) = x2 > 0 für alle 0.5 ⩽ x ⩽ 2 und f ′ (x) = für alle x ⩾ 3 aber f ist nicht monoton wachsend wie der Graph zeigt: 1 Anschaulich ist auch klar, dass im Minimum die Tangente horizontal ist. (4.6) x−2.5 2 >0 76 4. Monotonie und Ableitung Figur 49: Graph der Funktion f Beweis 9 (Beweis von Satz 4.1) Wir führen einen Widerspruchsbeweis: Wir nehmen an, dass es eine auf einem Intervall I differenzierbare Funktion f gibt, mit f ′ (x) > 0 für alle x in I, welche nicht streng monoton wachsend ist. Dann gibt es wenigstens zwei Zahlen x0 und z0 in I mit x 0 < z0 und f (x0 ) ⩾ f (z0 ) . (4.7) Die Sekante durch die Punkte (x0 , f (x0 )) und (z0 , f (z0 )) hat also eine nicht positive Steigung. Wir nennen in diesem Beweis ein Zahlenpaar (a, b) ∈ I × I mit der Eigenschaft a < b und f (a) ⩾ f (b) ein Ausnahmepaar. Figur 50: Ausnahmepaar (x0 , z0 ); Die Sekante hat eine nicht positive Steigung Egal welchen Wert f an der Stelle m = x0 +z0 2 in der Mitte der zwei Zahlen x0 und z0 annimmt, wenigstens eine der beiden neuen Sekanten wird ebenfalls eine nichtpositive 4.1. Das Monotoniekriterium 77 Steigung haben, denn sonst wäre f (x0 ) < f (m) < f (z0 ) im Widerspruch zu f (x0 ) ⩾ f (z0 ). Figur 51: Eine der beiden Sekanten muss eine nicht positive Steigung haben Falls (x0 , m) ein Ausnahmepaar ist, dann setzen wir x1 ∶= x0 und z1 ∶= m, ansonsten setzen wir x1 ∶= m und z1 ∶= z0 . Wir fahren so fort und erhalten so eine Intervallschachtelung bestehend aus Ausnahmepaaren (xn , zn ). Wegen der Vollständigkeit von R konvergiert diese Intervallschachtelung gegen eine Zahl c. Es gilt jeweils auch für jedes Intervall [xn , zn ], dass entweder (xn , c) oder (c, zn ) ein Ausnahmepaar ist, denn sonst wäre f (xn ) < f (c) < f (zn ) im Widerspruch dazu, dass (xn , zn ) ein Ausnahmepaar ist. Nun bilden wir die Folge (yn ): ⎧ ⎪ ⎪ xn falls (xn , c) Ausnahmepaar ist, yn ∶= ⎨ ⎪ ⎪ ⎩ zn falls (c, zn ) Ausnahmepaar ist. Dann ist f (yn ) − f (c) ⩽0 yn − c für jedes n ∈ N und da yn gegen c konvergiert, folgt (vgl. S. 6): f (yn ) − f (c) ⩽0 n→∞ yn − c f ′ (c) = lim in Widerspruch zu f ′ (x) > 0. Die zweite Hälfte des Satzes beweist man mit der folgenden Idee: man betrachtet anstatt 78 4. Monotonie und Ableitung der Funktion f mit negativem f ′ , die Funktion (−1) ⋅ f mit positiver Ableitung. Hier kann man die bereits bewiesene erste Hälfte des Satzes anwenden. Die kubische Normalparabel f (x) = x3 wächst auf ganz R streng monoton. Dennoch ist f ′ (0) = 0! Das Monotoniekriterium besagt nur, dass die Positivität der Ableitung hinreichend dafür ist, dass die Funktion streng monoton wachsend ist und das Beispiel der kubischen Normalparabel zeigt, dass es nicht notwendig ist. Immerhin gilt: Satz 4.2 Falls f streng monoton wachsend und differenzierbar auf einem Intervall I ist, dann ist f ′ auf ganz I nicht negativ. Beweis 10 Wir können diesen Satz beweisen in dem wir die Tatsache nutzen, dass für jede Stelle x0 in I die Differenzenquotienten positiv sind: Aus x > x0 folgt, da f streng monoton wachsend ist, dass f (x) > f (x0 ) und somit ist ebenfalls f (x)−f (x0 ) x−x0 f (x)−f (x0 ) x−x0 > 0 . Aus x < x0 folgt > 0 , da sowohl Zähler wie auch Nenner negativ sind. Daraus folgt (vgl. S. 6): f (x) − f (x0 ) ⩾ 0, x→x0 x − x0 f ′ (x) = lim Diese zwei Sätze können wie folgt zusammengefasst werden: Sei f eine auf einem Intervall I differenzierbare Funktion. Dann gilt: Satz 4.1: Wenn f ′ (x) > 0 für alle x ∈ I ist, dann ist f streng monoton wachsend auf I. Satz 4.2: Wenn f streng monoton wachsend auf I ist, dann ist f ′ (x) ⩾ 0 für alle x ∈ I. Man könnte versucht sein anzunehmen, dass eine Funktion, deren Ableitung an einer Stelle x0 positiv ist, in einer genügend kleinen Umgebung von x0 auch streng monoton wächst. D.h. man könnte versucht sein die Bedingung im Satz 4.1, dass f ′ auf einem ganzen Intervall I positiv sein muss etwas abzuschwächen. Dass dem nicht so ist, wird das folgende Beispiel zeigen. Wir betrachten die folgende Funktion: f (x) = { x + 2x2 sin( x1 ) ∶ x ≠ 0 0 ∶ x=0 (4.8) 4.1. Das Monotoniekriterium 79 Figur 52: Graph von f f oszilliert um so schneller zwischen den einhüllenden Kurven (y1 = x+2x2 und y2 = x−2x2 ), je näher sich x dem Punkt 0 nähert. Es gilt: 1 1 1 1 f ′ (x) = 1 + 2 (2x ⋅ sin ( ) − cos ( )) = 1 + 4x ⋅ sin ( ) − 2 cos ( ) x x x x für x ≠ 0. (4.9) Um die Ableitung von f an der Stelle 0 zu bestimmen betrachten wir den Differenzenquotienten 1 f (x) − f (0) x + 2x2 ⋅ sin ( x ) 1 = = 1 + 2x ⋅ sin ( ) . (4.10) x−0 x x Nach Satz 2.7 S.34 folgt aus −x ⩽ x ⋅ sin ( x1 ) ⩽ x, dass 1 lim x ⋅ sin ( ) = 0 . x→0 x Es gilt also: 1 f ′ (0) = lim (1 + 2x ⋅ sin ( )) = 1. x→0 x Wir haben also gezeigt: f ′ (x) = { 1 + 4x ⋅ sin ( x1 ) − 2 cos ( x1 ) für x ≠ 0 1 für x = 0 (4.11) Wir zeigen nun, dass die Funktion f ′ in beliebiger Nähe von Null sowohl positive als auch negative Werte annimmt. Dazu konstruieren wir zwei Nullfolgen (xn ) und (yn ) mit der Eigenschaft lim f ′ (xn ) < 0 n→∞ und lim f ′ (yn ) > 0 . n→∞ 80 4. Monotonie und Ableitung Wir definieren xn = Da sin ( 1 2nπ und 1 ) = sin(2nπ) = 0 xn yn = und 1 . (2n + 1)π cos ( 1 ) = cos(2nπ) = 1 xn gilt für alle n ∈ N f ′ (xn ) = 1 + 4xn ⋅ sin ( 1 1 ) − 2 cos ( ) = 1 − 2 ⋅ 1 = −1 . xn xn Andererseits, da sin ( 1 ) = sin((2n + 1)π) = 0 yn und cos ( 1 ) = cos((2n + 1)π) = −1 yn gilt für alle n ∈ N f ′ (yn ) = 1 + 4yn ⋅ sin ( Es gilt: 1 1 ) − 2 cos ( ) = 1 − 2 ⋅ (−1) = 3 . yn yn lim f ′ (xn ) = −1 ≠ lim f ′ (yn ) = 3 . n→∞ n→∞ f′ Wir haben damit gezeigt, dass in beliebiger Nähe von Null sowohl positive, wie auch negative Werte annimmt und zudem dass f ′ an der Stelle 0 nicht stetig ist. Wegen der Kontraposition von Satz 4.2 ist f in keiner auch noch so kleinen Umgebung von Null streng monoton wachsend obwohl f ′ (0) = 1 also positiv ist (4.11). Bemerkung Das Monotoniekriterium kann geometrisch wie folgt interpretiert werden: Wenn in einem Intervall alle Tangenten positive Steigung haben (f ′ ist positiv) so gilt das auch für alle in diesem Intervall gebildeten Sekanten. Definitionen 4.3 Wir erinnern daran: Eine Funktion f ∶ A → R hat an der Stelle x0 ∈ A ein lokales Minimum, wenn eine Umgebung U ⊆ A von x0 existiert, in welcher der Funktionswert f (x0 ) am kleinsten ist, d.h: f (x) > f (x0 ) ∀x ∈ U ∖ {x0 }. Lokale Maxima sind entsprechend definiert. Nimmt f in x0 ∈ A ein lokales Maximum oder Minimum an, so nennen wir x0 eine lokale Extremalstelle . f hat an der Stelle x0 ein globales Minimum, wenn der Funktionswert f (x0 ) auf ganz A am kleinsten ist, d.h: f (x) > f (x0 ) ∀x ∈ A ∖ {x0 }. Entsprechend werden globale Maxima und globale Extremalstellen definiert. 4.1. Das Monotoniekriterium 81 Es gilt: Satz 4.4 Notwendige Bedingung für Extrema Hat f ∶ [a, b] → R im Punkt x0 ∈]a, b[ ein lokales Extremum und ist f in einer Umgebung von x0 differenzierbar, dann gilt f ′ (x0 ) = 0. Lokale oder auch globale Extrema können auch am Rande von [a, b] auftreten. An diesen Stellen muss die Ableitung nicht unbedingt Null sein: Figur 53: An den Stellen xi hat die Funktion lokale Extremstellen. An den Stellen x1 bis x4 ist die Ableitung Null, an den Randpunkten x0 und x5 jedoch nicht. x2 und x5 sind globale Extremstellen. Beweis 11 (Beweis von Satz 4.4) Wir betrachten den Fall, dass f (c) ein Maximum ist, wobei c ∈ U und U eine ϵ-Umgebung von c in [a, b] ist, in welcher f differenzierbar und f (c) in dieser Umgebung am grössten ist. Dann gilt f (x) − f (c) ⩽ 0, ∀x ∈ U und f (x) − f (c) ⩾ 0 für alle x < c und x−c Daraus folgt: f (x) − f (c) ⩽ 0 für alle x > c. x−c f (x) − f (c) = 0. x→c x−c Analog beweist man den Fall, wo f (c) das Minimum ist. f ′ (c) = lim 82 4. Monotonie und Ableitung 4.2 Der Schrankensatz Wenn Sie mit dem Zug fahren und Ihre Geschwindigkeit (Momentangeschwindigkeit) während einer bestimmten Zeitspanne gewisse Werte nicht über- bzw. unterschreitet, so gilt dies auch für die Durchschnittsgeschwindigkeit. Wir verallgemeinern diese Aussage: Satz 4.5 Schrankensatz Ist f auf einem Intervall I differenzierbar und gilt für jedes x ∈ I m < f ′ (x) < M, so ist für je zwei Werte x1 , x2 ∈ I mit x1 < x2 m< f (x2 ) − f (x1 ) < M. x2 − x1 Beweis 12 Der Schrankensatz ist eine Folgerung des Monotoniekriteriums: Die Voraussetzung m < f ′ (x) lässt sich schreiben in der Form 0 < f ′ (x) − m oder 0 < (f − m ⋅ I)′ (x) wobei I(x) = x (I ist die Identitätsabbildung auf R vgl. [HAG, S.79]). Nach dem Monotoniekriterium ist f − m ⋅ I streng monoton wachsend auf I, d.h. aus x1 < x2 folgt f (x1 ) − mx1 < f (x2 ) − mx2 oder m(x2 − x1 ) < f (x2 ) − f (x1 ). Dividiert man durch x2 − x1 , so folgt die linke Seite der Ungleichung. Die rechte Seite wird analog gezeigt. Der Schrankensatz ist ein wichtiges Hilfsmittel der Analysis. Mit seiner Hilfe lässt sich das globale Wachstum von Funktionen abschätzen. Den Schrankensatz kann man geometrisch wie folgt interpretieren: 4.3. Der Mittelwertsatz 83 Figur 54: Der Graph der Funktion f verläuft für je zwei Punkte x1 und x2 zwischen den zwei Geraden durch den Punkt (x1 , f (x1 )) mit den Steigungen m und M 4.3 Der Mittelwertsatz Wenn Sie mit dem Zug fahren und Ihre Durchschnittsgeschwindigkeit während einer bestimmten Zeitspanne 80 km/h beträgt, so sind Sie sicher irgendwann zwischendurch genau 80 km/h gefahren. Auch diese Aussage verallgemeinern wir: Satz 4.6 Mittelwertsatz Ist f eine auf dem Intervall [a, b] differenzierbare Funktion, so gibt es eine Stelle x0 ∈]a, b[ mit der Eigenschaft f (b) − f (a) = f ′ (x0 ). b−a Geometrisch lässt sich dieser Satz wie folgt veranschaulichen: 84 4. Monotonie und Ableitung Figur 55: Die Tangente an der Stelle x0 hat die selbe Steigung wie die Sekante zwischen (a, f (a)) und (b, f (b)) Beweis 13 (Beweis des Mittelwertsatzes) Wir beweisen zunächst den Spezialfall wo f (a) = f (b) gilt und führen danach den allgemeinen Fall auf diesen Spezialfall zurück. Sei also f (a) = f (b). Wenn f eine konstante Funktion ist, dann ist die Ableitung von f überall Null und der Satz ist trivial. Wenn f nicht konstant ist, dann nimmt f als stetige Funktion (differenzierbare Funktionen sind stetig) nach Satz 2.19 S.47 auf dem abgeschlossenen Intervall [a, b] sein Minimum und sein Maximum an. Es gibt also zwei verschiedene Zahlen c1 , c2 ∈ [a, b] so dass f an der Stelle c1 das Maximum und an der Stelle c2 das Minimum annimmt. Da diese zwei Stellen verschieden sind und f (a) = f (b) gilt, muss mindestens eine davon im Inneren des Intervalls liegen. O.B.d.A. nehmen wir an, dass c1 ∈]a, b[ und f (c1 ) das Maximum ist. Dann gilt nach Satz 4.4 f ′ (c1 ) = 0. Für den allgemeinen Fall betrachten wir die Funktion g ∶ [a, b] → R gegeben durch g(x) = f (x) − f (b) − f (a) (x − a). b−a g ist differenzierbar und es gilt: g(a) = g(b) = f (a). Somit wissen wir aus dem obigen Spezialfall, dass es ein c ∈]a, b[ gibt mit g ′ (c) = 0. Da g ′ (x) = f ′ (x) − f (b) − f (a) b−a 4.4. Kettenregel und Ableitung der Umkehrfunktion 85 für alle x ∈ [a, b], gilt insbesondere: f ′ (c) − f (b) − f (a) = g ′ (c) = 0 b−a und somit f ′ (c) = f (b) − f (a) . b−a Bemerkung Der Mittelwertsatz besagt, dass für eine auf [a, b] differenzierbare Funktion die mittlere �nderungsrate von f auf [a, b] mit mindestens einer lokalen �nderungsrate von f auf ]a, b[ übereinstimmt. Eine Folgerung aus dem Mittelwertsatz ist: Satz 4.7 Ist f eine auf dem Intervall I ∶= [a, b] differenzierbare Funktion und ist f ′ in einer Umgebung U =]x0 − ϵ, x0 + ϵ[ ∩ I von x0 überall Null, so ist f in dieser Umgebung konstant. Beweis 14 Wir beweisen diesen Satz indirekt: wir nehmen an, dass f in U nicht konstant ist. Dann gibt es zwei Zahlen c und d in U mit f (c) ≠ f (d) . Nach dem Mittelwertsatz gibt dann eine Zahl v, die zwischen c und d liegt und für die gilt 0 = f ′ (v) = f (c) − f (d) ≠0 c−d Dies ist ein Widerspruch! 4.4 Kettenregel und Ableitung der Umkehrfunktion Satz 4.8 Kettenregel Seien f ∶ I Ð→ R und g ∶ Y Ð→ R zwei stetige reelle Funktionen mit f (I) ⊆ Y . Sind f bei x0 ∈ I und g bei y0 = f (x0 ) ∈ Y differenzierbar, so ist g ○ h an der Stelle x0 differenzierbar, und es gilt: (g ○ f )′ (x0 ) = g ′ (f (x0 )) ⋅ f ′ (x0 ) . 86 4. Monotonie und Ableitung Beweis 15 Nach Weierstrass (vgl. Satz 3.5 S.70) gilt f (x) − f (x0 ) = f ′ (x0 ) ⋅ (x − x0 ) + rf (x) und g(y) − g(y0 ) = g ′ (y0 ) ⋅ (y − y0 ) + rg (y) . Für die Restsummanden rf und rg gilt: lim x→x0 rf (x) =0 x − x0 mit lim y→y0 rg (y) = 0. y − y0 Für x ∈ I mit x ≠ x0 halten wir fest: (g ○ f )(x) − (g ○ f )(x0 ) = g(y) − g(y0 ) (4.12) = g ′ (y0 ) ⋅ (y − y0 ) + rg (y) (4.13) = g ′ (y0 ) ⋅ (f (x) − f (x0 )) + rg (f (x)) (4.14) = g ′ (f (x0 )) ⋅ (f ′ (x0 )(x − x0 ) + rf (x)) + rg (f (x)) (4.15) Da rg (f (x)) rg (y) = lim =0 x→x0 f (x) − f (x0 ) y→y0 y − y0 lim und da f (x) − f (x0 ) = f ′ (x0 ) , x→x0 x − x0 lim also insbesondere beschränkt ist, folgt aus Satz 2.7.2 S.34: lim x→x0 rg (f (x)) rg (f (x)) f (x) − f (x0 ) = lim = 0. ⋅ x→x 0 f (x) − f (x0 ) x − x0 x − x0 Für den Differenzenquotienten g ′ (f (x0 )) ⋅ f ′ (x0 )(x − x0 ) + g ′ (f (x0 )) ⋅ rf (x) + rg (f (x)) (g ○ f )(x) − (g ○ f )(x0 ) = x − x0 x − x0 rf (x) rg (f (x)) = g ′ (f (x0 )) ⋅ f ′ (x0 ) + g ′ (f (x0 )) ⋅ + (4.16) x − x0 x − x0 gilt also: (g ○ f )(x) − (g ○ f )(x0 ) = g ′ (f (x0 )) ⋅ f ′ (x0 ) x→x0 x − x0 lim 4.4. Kettenregel und Ableitung der Umkehrfunktion 87 Satz 4.9 Ableitung der Umkehrfunktion Sei f ∶ [a, b] Ð→ R injektiv und stetig und sei f −1 ∶ f ([a, b]) Ð→ [a, b] die Umkehrfunktion. Falls f differenzierbar in x0 ∈ [a, b] ist mit f ′ (x0 ) ≠ 0, so ist f −1 an der Stelle f (x0 ) differenzierbar, und es gilt (f −1 )′ (f (x0 )) = 1 f ′ (x0 ) . Bemerkungen 1. Wir interpretieren die injektive Abbildung f ∶ [a, b] → R als Bijektion f ∶ [a, b] → f ([a, b]) und bezeichnen deren Umkehrfunktion der Einfachheit halber mit f −1 . 2. Wir wissen, dass für eine bijektive Funktion der Graph der Umkehrfunktion durch Spiegelung an der ersten Winkelhalbierenden entsteht. Besitzt nun die Ausgangsfunktion im Punkt (x0 , f (x0 )) eine Tangente (ist sie dort also differenzierbar), so geht diese Eigenschaft beim Spiegeln meistens2 nicht verloren. f −1 hat im Punkt (f (x0 ), x0 ) = (y0 , f −1 (y0 )) eine Tangente, deren Steigung den Kehrwert der Steigung der Tangente von f im Punkt (x0 , f (x0 )) ist (vgl. Figur). Figur 56: Steigung der Tangente von f und von f −1 2 Im Fall einer horizontalen Tangente ist das Spiegelbild eine vertikale Gerade. Die Umkehrfunktion kann an der betreffenden Stelle somit nicht differenzierbar sein. 88 4. Monotonie und Ableitung Beweis 16 (Beweis vom Satz über die Ableitung von Umkehrfunktionen) Nach der 2. Folgerung des Zwischenwertsatzes von Bolzano ist f −1 stetig und als bijektive Funktion insbesondere injektiv. Sei y0 ∶= f (x0 ) und sei (yn ) eine Folge in f ([a, b]), mit y0 = limn→∞ yn und mit yn ≠ y0 für alle n ∈ N. Wir setzen xn ∶= f −1 (yn ) für alle n ∈ N0 . Dann ist xn ≠ x0 für alle n ∈ N, da f −1 injektiv ist und limn→∞ xn = x0 , da f −1 stetig ist. Dann gilt: f −1 (yn ) − f −1 (y0 ) xn − x0 = lim = lim n→∞ n→∞ yn − y0 f (xn ) − f (x0 ) n→∞ (f −1 )′ (f (x0 )) = lim 1 f (xn )−f (x0 ) xn −x0 = 1 f ′ (x0 ) Beispiele 4.10 • Die Voraussetzungen von Satz 4.9 sind für die Exponentialfunktion exp ∶ R → R ∶ x ↦ ex auf jedem abgeschlossenen Intervall erfüllt. Also ist die Inverse der Exponentialfunktion, d.h. ln ∶]0, ∞[→ R überall auf ]0, ∞[ differenzierbar und für y = exp(x) = ex gilt ln′ (y) = ln′ (exp(x)) = 1 1 1 = = . ′ exp (x) exp(x) y • Um zu sehen, dass für jedes r ∈ R die Funktion f ∶]0, ∞[→ R ∶ x ↦ xr differenzierbar ist, mit (xr )′ ∶= f ′ (x) = r ⋅ xr−1 , schreiben wir xr = exp(ln(xr )) = exp(r ⋅ ln(x)) und erhalten mit der Kettenregel: f ′ (x) = exp′ (r ⋅ ln(x)) ⋅ (r ⋅ ln(x))′ = exp(ln(xr )) ⋅ r ⋅ 1 1 = xr ⋅ r ⋅ = r ⋅ xr−1 . x x 4.5. Globale und lokale Extrema 89 • Für jedes feste a > 0 ist die Funktion g ∶ R → R ∶ x ↦ ax differenzierbar mit (ax )′ ∶= g ′ (x) = ax ⋅ ln(a) für alle x ∈ R . Um das zu sehen, schreiben wir ax = exp(ln(ax )) = exp(x ⋅ ln(a)). Nach der Kettenregel gilt: g ′ (x) = exp′ (x ⋅ ln(a)) ⋅ (x ⋅ ln(a))′ = exp(ln(ax )) ⋅ ln(a) = ax ⋅ ln(a) . 4.5 Globale und lokale Extrema Wir erinnern an die Notwendige Bedingung für lokale Extrema (Satz 4.4 S.81): Hat f ∶ A → R im Punkt x0 im Inneren von A ein lokales Extremum und ist f in einer Umgebung von x0 differenzierbar, dann gilt f ′ (x0 ) = 0. Nun ist leider nicht automatisch jede Nullstelle von f ′ auch eine lokale Extremstelle von f , wie das Beispiel der kubischen Funktion f (x) = x3 an der Stelle Null zeigt3 . Figur 57: f (x) = x3 Wie wir die Nullstellen von f ′ finden, welche tatsächlich Extremstellen von f sind, zeigt der folgende Satz: 3 Die Bedingung f ′ (x0 ) = 0 ist also für ein lokales Extremum notwendig aber nicht hinreichend. 90 4. Monotonie und Ableitung Satz 4.11 Hinreichende Bedingung für Extrema: Vorzeichenwechsel Ist f ∶ A → R im Punkt x0 im Inneren von A differenzierbar mit f ′ (x0 ) = 0 und wechselt f ′ bei x0 das Vorzeichen von + nach −, so hat f bei x0 ein lokales Maximum, bei Vorzeichenwechsel von − nach + ein lokales Minimum. Bemerkung Die Redewendung f ′ wechselt bei x0 das Vorzeichen von − nach + bedeutet, dass es für ein ϵ > 0 ein Intervall I =]x0 − ϵ, x0 + ϵ[ ⊆ A gibt mit der Eigenschaft, dass f ′ (x) < 0 ∀x ∈ ]x0 − ϵ, x0 [ und f ′ (x) > 0 ∀x ∈ ]x0 , x0 + ϵ[. Beweis 17 Ein Vorzeichenwechsel von − nach + bedeutet nach dem Monotoniekriterium (Satz 4.1), dass f im Intervall I bis x0 streng monoton fällt und ab x0 streng monoton wächst. Dies ist jedoch die Charakterisierung für ein lokales Minimum. Dieser Satz ist anschaulich selbstverständlich: Figur 58: f ′ wechselt von von + nach − Figur 59: g ′ wechselt von von − nach + Figur 60: q ′ ist immer positiv (x0 ist keine lokale Extremstelle) Wenn f ′ anders als in der Voraussetzung des obigen Satzes auf beiden Seiten von x0 dasselbe Vorzeichen hat, (mit f ′ (x0 ) = 0), dann ist x0 keine Extremstelle (vgl. Figur 60). 4.5. Globale und lokale Extrema 91 An dieser Stelle muss dann ein sogenannter Sattelpunkt vorliegen. Und noch zwei weitere Fälle sind möglich: • f ′ ist in einer Umgebung von x0 überall Null: dann ist f in dieser Umgebung konstant (vgl. �bungen). • f ′ nimmt in jeder Umgebung links (bzw. rechts) von x0 sowohl positive wie auch negative Werte an (vgl. das folgende Beispiel). Beispiel 4.12 Auch der Vorzeichenwechsel ist eine hinreichende aber nicht notwendige Bedingung für lokale Extrema. Betrachten wir die folgende Funktion: ⎧ 1 ⎪ ⎪ 2x2 + x2 sin ( x ) für x ≠ 0 f ∶ R Ð→ R ∶ f (x) = ⎨ ⎪ für x = 0 ⎪ ⎩ 0 f ist differenzierbar auf ganz R und insbesondere gilt f ′ (0) = 0 (vgl. �bungen). (4.17) Figur 61: Graph der Funktion f Der Graph dieser Funktion liegt zwischen den Parabeln mit den Gleichungen y = x2 und y = 3x2 . Die Funktion f hat an der Stelle x = 0 ein lokales Minimum. Die Steigung des Graphen von f wechselt aber um so rascher von positiven zu negativen Werten, je näher man dem Punkt (0, 0) kommt. Also gibt es keine Umgebung von Null in der ein Vorzeichenwechsel stattfindet: d.h. es gibt kein Intervall I ∶=] − ϵ, ϵ[, so dass für alle x ∈ I gilt f ′ (x) < 0 für alle x < 0 f ′ (x) > 0 für alle x < 0 und und f ′ (x) > 0 für alle x > 0 oder f ′ (x) < 0 für alle x > 0 . Dieses Beispiel werden Sie in den �bungen genauer untersuchen. 92 4. Monotonie und Ableitung Bemerkung Das Vorzeichenwechsel-Kriterium hat eine weitere Schwäche: Man kann sich bei der Untersuchung von f ′ nicht auf die Stelle x0 beschränken, sondern muss eine ganze Umgebung von x0 einbeziehen, was in der Praxis oft mühsam ist. Falls f in einer Umgebung von x0 zweimal differenzierbar ist, dann kann man allerdings aus dem vorherigen Satz ein weiteres Kriterium herleiten, der diese Schwachstelle nicht mehr hat: Satz 4.13 Hinreichende Bedingung für Extrema mit Hilfe der zweiten Ableitung Ist f ∶ A → R im Punkt x0 im Inneren von A zweimal differenzierbar, so folgt aus f ′ (x0 ) = 0 und f ′′ (x0 ) < 0, dass f in x0 ein lokales Maximum besitzt. Entsprechend folgt aus f ′ (x0 ) = 0 und f ′′ (x0 ) > 0 die Existenz eines lokalen Minimums in x0 . Am Beispiel der biquadratischen Funktion f (x) = x4 sehen wir, dass auch diese Bedingungen nicht notwendig sind. Beweis 18 Für den Differenzenquotienten von f ′ gilt f ′ (x) − f ′ (x0 ) f ′ (x) = , x − x0 x − x0 da f ′ (x0 ) = 0. Es sei nun f ′′ (x0 ) < 0. Wegen f ′ (x) = f ′′ (x0 ) < 0 x→x0 x − x0 lim muss folglich in einer Umgebung von x0 gelten, dass f ′ (x) < 0 für x > x0 , und f ′ (x) > 0 für x < x0 , und f ′ hat, wie behauptet, einen Vorzeichenwechsel. Analog argumentiert man bei f ′′ (x0 ) > 0. Kapitel 5 Integralrechnung In der Einführung in diesen Skriptes steht, dass die Ableitungsfunktion das Änderungsverhalten einer Funktion beschreibt und dass man aus dem Änderungsverhalten der Funktion die ursprüngliche Funktion wieder rekonstruieren kann. Genau dieser zweiten Aufgabe werden wir uns in diesem Kapitel widmen. Integrieren kommt von integrare, was wieder ganz machen bedeutet, also Rekonstruieren. Zuallererst betrachten wir wieder das Beispiel des ICEs und rekonstruieren aus der Geschwindigkeit den zurückgelegten Weg. Dann werden wir allgemein untersuchen, wie man aus dem Änderungsverhalten (Ableitung) einer Funktion die ursprüngliche Funktion rekonstruieren kann und weitere Beispiele betrachten, welche auf die selben mathematischen Überlegungen führen, wie die Rekonstruktion der ursprünglichen Funktion. Wir werden feststellen, dass die rekonstruierte Funktion geometrisch mit dem orientierten1 Flächeninhalt zwischen dem Graphen und der x-Achse übereinstimmt. Umgekehrt werden wir vom orientierten Flächeninhalt F unter dem Graphen einer beliebigen stetigen Funktion ausgehen und zeigen, dass F als Funktion der oberen Intervallgrenze differenzierbar und die Ableitung von F genau die Funktion f ist (Hauptsatz). 5.1 Beispiele 5.1.1 Nochmals das ICE Beispiel Wir versuchen nun aus der Geschwindigkeit des ICE in den ersten 400 Sekunden nach dem Start den zurückgelegten Weg zu rekonstruieren. Zunächst berechnen wir den zurückgelegten Weg zwischen t1 = 100 Sekunden und t2 = 150 Sekunden. 1 Das Wort orientiert, bedeutet, dass wenn die Fläche oberhalb der x-Achse ist, der orientierte Flächen- inhalt positiv ist; jedoch wenn die Fläche unterhalb der x-Achse ist, der orientierte Flächeninhalt negativ ist. 94 5. Integralrechnung Die gemessenen Geschwindigkeiten sind: x 100 110 120 130 140 150 v(x) in m/s 58.2 61.4 64.3 67.0 69.3 71.5 Wäre die Geschwindigkeit ab 100 Sekunden konstant, so würde der Zug in den nächsten 50 Sekunden v(100) ⋅ 50 = 58.2 ⋅ 50 = 2910 Meter (5.1) zurücklegen. Hätte der ICE ab 100 Sekunden die konstante Geschwindigkeit v(150) = 71.5 m/s so würde der Zug in diesen 50 Sekunden v(150) ⋅ 50 = 71.5 ⋅ 50 = 3575 Meter (5.2) 2910 = v(100) ⋅ 50 ⩽ s(150) − s(100) ⩽ v(150) ⋅ 50 = 3575. (5.3) zurücklegen. Sicher gilt: Da wir die Angabe der Geschwindigkeit alle 10 Sekunden haben, können wir diese Idee fortsetzen und den zurückgelegten Weg approximieren in dem wir annehmen, dass der Zug für je 10 Sekunden eine konstante Geschwindigkeit hat: v(100) ⋅ 10 + v(110) ⋅ 10 + v(120) ⋅ 10 + v(130) ⋅ 10 + v(140) ⋅ 10 = 58.2 ⋅ 10 + 61.4 ⋅ 10 + 64.3 ⋅ 10 + 67.0 ⋅ 10 + 69.3 ⋅ 10 = 3202. (5.4) (5.5) Wir könnten auch hier die Geschwindigkeit am Schluss der 10 Sekunden als konstant annehmen, also z.B. annehmen, dass zwischen 100 und 110 Sekunden der Zug mit konstanter Geschwindigkeit v(110) fährt und wiederum diese zurückgelegten Strecken addieren: v(110) ⋅ 10 + v(120) ⋅ 10 + v(130) ⋅ 10 + v(140) ⋅ 10 + v(150) ⋅ 10 = 61.4 ⋅ 10 + 64.3 ⋅ 10 + 67.0 ⋅ 10 + 69.3 ⋅ 10 + 71.5 ⋅ 10 = 3335. (5.6) (5.7) Sicher gilt: 3202 ⩽ s(150) − s(100) ⩽ 3335. (5.8) Aus (3.2) S.56 im Kapitel 3 wissen wir, dass der zurückgelegte Weg s(150) − s(100) ≈ 3300 Meter beträgt. Also haben wir aus der Geschwindigkeit den zurückgelegten Weg wieder approximieren können. Betrachten wir nochmals unseren Prozess: In (5.1) haben wir den zurückgelegten Weg mit v(100) ⋅ 50 angenähert. Dargestellt im Graph der Funktion v ∶ [0, ∞[ → R t ↦ v(t), ist v(100)⋅50 die Fläche des roten Rechtecks und v(150)⋅50 die Fläche des blauen Rechtecks in der folgenden Figur: 5.1. Beispiele Figur 62: Zurückgelegter Weg bei konstanter Geschwindigkeit v(100) als Fläche s(150) − s(100) ≈ v(100) ⋅ 50 95 Figur 63: Zurückgelegter Weg bei konstanter Geschwindigkeit v(150) als Fläche s(150) − s(100) ≈ v(150) ⋅ 50 (5.4) und (5.6) können graphisch wie folgt dargestellt werden: Figur 64: Zurückgelegter Weg approximiert durch stückweiser konstante Geschwindigkeit s(150) − s(100) ≈ ∑4k=0 v(100 + k ⋅ 10) ⋅ 10 Figur 65: Zurückgelegter Weg approximiert durch stückweiser konstante Geschwindigkeit s(150) − s(100) ≈ ∑5k=1 v(100 + k ⋅ 10) ⋅ 10 In diesem Beispiel ist es also möglich, aus der Geschwindigkeit (Ableitung) den zurückgelegten Weg (ursprüngliche Funktion, die sogenannte Stammfunktion vgl. S.113) in einem Zeitintervall approximativ zu rekonstruieren. Um den gesamten zurückgelegten Weg nach 150 Sekunden zu bestimmen (oder allgemein um s(t) und nicht nur um s(t2 ) − s(t1 ) zu berechnen, müssen wir den zurückgelegten Weg 96 5. Integralrechnung in den ersten 100 Sekunden dazu addieren: 4 5 k=0 k=1 s(100) + ∑ v(100 + k ⋅ 10) ⋅ 10 ⩽ s(150) ⩽ s(100) + ∑ v(100 + k ⋅ 10) ⋅ 10. (5.9) Wie gross s(150) ist, wissen wir nicht, da unsere Abschätzungen (5.9) von s(100) abhängen. Wenn wir die obige Idee fortsetzen erhalten wir: 14 s(0) + ∑ v(k ⋅ 10) ⋅ 10 ⩽ s(150) ⩽ 15 s(0) + ∑ v(k ⋅ 10) ⋅ 10 . (5.10) k=1 k=0 In diesem konkreten Beispiel wissen wir aber, dass der zurückgelegte Weg für t = 0 Null sein muss (wir wissen, dass s(0) = 0). Es gilt 14 ∑ v(k ⋅ 10) ⋅ 10 ⩽ s(150) k=0 ⩽ 15 ∑ v(k ⋅ 10) ⋅ 10, da s(0) = 0. (5.11) k=1 In diesem Beispiel hatten wir sehr wenige Angaben über die Geschwindigkeit (nur alle 10 Sekunden). 5.1.2 Die Verallgemeinerung des ICE-Beispiels Im Folgenden überlegen wir allgemein [in Anlehnung an STO, S. 128 ff.], wie die zurückgelegte Strecke s ∶ [0, T ] Ð→ R eines Körpers rekonstruiert werden kann, wenn die Geschwindigkeit als Funktion v ∶ [0, T ] Ð→ R in jedem Punkt von [0, T ] gegeben ist. Wäre die Geschwindigkeit konstant v0 , so wäre die Lösung des Problems sehr einfach: Die zurückgelegte Strecke im Intervall [0, T ] ist gleich ”Geschwindigkeit mal Zeit”: s(T ) = v0 ⋅ T . Hier geht es aber um die Situation, in welcher sich die Geschwindigkeit v(t) mit der Zeit ändert. Wir wollen die Überlegungen vom vorherigen Abschnitt verallgemeinern: Der ganze Vorgang läuft im Zeitintervall [0, T ] ab. Wir denken uns nun dieses Intervall in viele, im Vergleich zur Gesamtdauer, kleine Teilintervalle zerlegt. Während einer solchen kurzen Zeitspanne ändert sich die Geschwindigkeit nur wenig: wir dürfen sie ohne allzu grossen Fehler als konstant annehmen. Dann lässt sich aber die in diesem kurzen Teil-Zeitintervall zurückgelegte Teilstrecke nach der Formel ”Geschwindigkeit mal Zeit” ausrechnen.2 Addiert man all diese Teilstrecken, so erhält man die bis zum Zeitpunkt T zurückgelegte Strecke zumindest näherungsweise. Da wir jetzt, im Gegensatz zum ICE-Beispiel, die Geschwindigkeit zu jedem Zeitpunkt als bekannt voraussetzen, können wir die Intervalle so klein 2 Zu beachten ist, dass wohl die Geschwindigkeit im einzelnen Intervall als konstant angenommen wird, dass sie sich aber von Teilintervall zu Teilintervall ändert. 5.1. Beispiele 97 wählen wie wir wollen. Die Näherung wird umso besser sein, je kleiner die Teilintervalle gewählt werden. Die tatsächlich zurückgelegte Strecke s(T ) wird sich ergeben, wenn man mit einem Grenzübergang die Länge der Teilintervalle gegen Null streben lässt. Diese sprachlich formulierte Idee können wir etwas formaler wie folgt aufschreiben. Wir zerlegen zunächst das Zeitintervall [0, T ] in Teilintervalle [ti−1 , ti ] gemäss folgender Skizze: In Verallgemeinerung zum ICE-Beispiel, wird hier nicht vorausgesetzt, dass die Teilintervalle alle gleich lang sind. Als nächstes wählen wir in jedem Teilintervall [ti−1 , ti ] einen ”Zwischenpunkt” τi . Es ist also ti−1 ≤ τi ≤ ti . Auch hier verallgemeinern wir das ICE-Beispiel: Die τi können, müssen aber nicht, mit den Randpunkten ti−1 oder ti des Teilintervalls zusammenfallen. Wenn wir die Teilintervalle klein genug wählen, so darf man ohne allzu grosse Ungenauigkeit annehmen, die Geschwindigkeit sei in diesem Teilintervall annähernd konstant, nämlich ungefähr gleich v(τi ): v(t) ≈ v(τi ) für t ∈ [ti−1 , ti ] . Da dieses Teilintervall die Länge ti − ti−1 =∶ ∆ti hat, legt unser Gegenstand in dieser Zeit ungefähr die Strecke v(τi )(ti − ti−1 ) = v(τi )∆ti ≈ s(ti ) − s(ti−1 ) zurück3 . Wir führen nun diese Überlegung für jedes Intervall [ti−1 , ti ] durch und erhalten durch Addition einen ungefähren Wert für die gesuchte Grösse s(T ): n s(T ) ≈ ∑ v(τi )∆ti . i=1 Wir betrachten daher jetzt eine Folge von Zerlegungen mit der Eigenschaft, dass die maximale Länge der Teilintervalle mit wachsendem n abnimmt und für n → ∞ gegen 0 strebt. Wir erwarten4 , dass die Folge der Approximationen gegen den Grenzwert s(T ) strebt: 3 Nach dem Mittelwertsatz wissen wir, dass in jedem Intervall [ti−1 , ti ] eine Stelle ηi ∈ ]ti−1 , ti [ existiert mit v(ηi )(ti − ti−1 ) = s(ti ) − s(ti−1 ). 4 Unter welchen Bedingungen dies der Fall ist, werden wir in diesem Kapitel untersuchen. 98 5. Integralrechnung n s(T ) = lim ∑ v(τi )∆ti . ∆ti →0 i=1 Die Frage, wie man denn einen solchen Limes berechnet, werden wir im Verlauf dieses Kapitels genau untersuchen und soll uns im Moment noch nicht kümmern. Vorläufig ist nur wichtig, dass s(T ) als Grenzwert einer ganz bestimmten Art beschrieben werden kann. Im nächsten Abschnitt werden wir uns der Frage widmen ob es immer möglich ist, die Funktion zu rekonstruieren. 5.1.3 Integrieren heisst Rekonstruieren Im Kapitel 3 haben wir im ICE-Beispiel die Geschwindigkeit v als Ableitung des zurückgelegten Weges s berechnet. Im vorherigen Abschnitt haben wir versucht aus der Geschwindigkeit v den zurückgelegten Weg s zu ”rekonstruieren”. In diesem Abschnitt untersuchen wir weiter die Frage, ob man aus der Änderungsrate (Ableitung) einer Funktion die Funktion wiedergewinnen kann. Wir stehen also vor dem folgenden Problem: Gegeben ist eine Funktion f ′ ∶ [a, b] Ð→ R von der wir wissen, dass sie die Ableitung einer (unbekannten) Funktion f ist. Gesucht ist f. Nehmen wir zudem an, dass wir wissen wie gross der Wert von f an einer bestimmten Stelle5 ist, z.B. an der Stelle a. Wir wollen nun den Wert von f an der Stelle b rekonstruieren. Wir zerlegen das Intervall [a, b] in Teilintervalle gemäss folgender Figur: Nach dem Mittelwertsatz 4.6 S.83 existiert ein η1 ∈ [x0 , x1 ] mit f ′ (η1 ) = f (x1 ) − f (x0 ) . x1 − x0 Daraus folgt: f (x1 ) = f ′ (η1 )(x1 − x0 ) + f (x0 ) = f ′ (η1 )(x1 − x0 ) + f (a) (x0 = a) . (5.12) Ebenso existiert ein η2 ∈ [x1 , x2 ] mit f ′ (η2 ) = 5 f (x2 ) − f (x1 ) . x2 − x1 Im ICE-Beispiel konnten wir s(150) bestimmen erst als wir verwendet haben, dass wir wissen, dass s(0) = 0 ist. 5.1. Beispiele 99 Daraus folgt: (5.12) f (x2 ) = f ′ (η2 )(x2 − x1 ) + f (x1 ) = f ′ (η2 )(x2 − x1 ) + f ′ (η1 )(x1 − x0 ) + f (a) . (5.13) Wir können so weiter verfahren und erhalten n f (b) = f (xn ) = ∑ f ′ (ηk )(xk − xk−1 ) + f (a) . (5.14) k=1 Wenn wir die Länge der Teilintervalle [xk−1 , xk ] ”hinreichend klein” wählen, können wir annehmen, dass selbst bei völlig willkürlicher Wahl eines Zwischenpunktes ξk ∈ [xk−1 , xk ] der Term f ′ (ξk )(xk − xk−1 ) sich nur wenig von f ′ (ηk )(xk − xk−1 ) unterscheidet und dass n f (b) ≈ ∑ f ′ (ξk )(xk − xk−1 ) + f (a) . (5.15) k=1 Diese Annäherung dürfte um so besser sein, je kleiner die Länge der Teilintervalle ist. Auch hier erwarten wir, dass falls wir die Zerlegung immer weiter verfeinern so, dass die Intervalllänge gegen Null strebt, dass dann n ∑ f ′ (ξk )(xk − xk−1 ) + f (a) gegen f (b) strebt. k=1 Auch in diesem Beispiel sehen wir, dass die ursprüngliche Funktion als Grenzwert einer bestimmten Art von Reihen rekonstruiert werden kann. 5.1.4 Arbeit Eine einseitig befestigte Schraubenfeder wird gespannt. Ihr loses Ende sei am Anfang an der Stelle 0, am Ende des Vorganges an der Stelle b auf der xAchse: #" $" !" Wie gross ist die geleistete Arbeit (W)? Wäre die Federkraft konstant, z.B. gleich F , also unabhängig von der Lage x des Feder-Endes, so würde wegen der Definition ”Arbeit = Kraft mal Weg” 100 5. Integralrechnung gelten: W = Fb. Nun hängt jedoch die Federkraft von der Dehnung der Feder ab6 : F = F (x). Wir können daher die Beziehung ”Arbeit = Kraft mal Weg” nicht einfach auf das ganze Intervall [0, b] anwenden. Ähnlich wie im Falle der Verallgemeinerung des ICE-Beispiels 5.1.2 teilen wir deshalb das Intervall [0, b] in Teilintervalle [xi−1 , xi ] ein und wählen in jedem solchen Intervall einen Zwischenpunkt ξi . Ohne allzu grossen Fehler darf man annehmen, die Kraft im Intervall [xi−1 , xi ] sei ungefähr gleich F (ξi ), so dass für die dort geleistete Arbeit gilt Wi ≈ F (ξi )∆xi . Um die Genauigkeit zu erhöhen, lassen wir die Teilintervalle immer kleiner werden und erhalten schliesslich n W (b) = lim ∑ F (ξi )∆xi ∆xi →0 i=1 5.1.5 Flächeninhalt Wir betrachten den Graphen einer stetigen Funktion f ∶ [a, b] → R mit f (x) ⩾ 0 , ∀x ∈ [a, b]. Wir möchten den Inhalt A des gefärbten Flächenstücks bestimmen. 6 In einem gewissen Bereich gilt, dass die Federkraft proportional zu x ist. Da es hier aber nicht auf diese spezielle Form der Kraft ankommt, verwenden wir weiterhin die allgemeine variable Kraft F (x). 5.1. Beispiele 101 Figur 66: Fläche A Zu diesem Zweck unterteilen wir [a, b] wie vorher und wählen in jedem [xi−1 , xi ] einen Zwischenpunkt ξi . Der Ausdruck f (ξi )∆xi hat hier eine einfache Bedeutung: Es handelt sich um den Flächeninhalt des in Figur 67 hervorgehobenen Rechtecks. Die Summe n ∑ f (ξi )∆xi i=1 ist dann der Inhalt der aus den einzelnen Rechtecken zusammengesetzten Fläche und demzufolge eine Approximation der Fläche A: Figur 67: Fläche A durch Rechtecksflächen approximiert 102 5. Integralrechnung Um den gesuchten Flächeninhalt A zu erhalten, wird man nun - wie schon in den vorangegangenen Beispielen - die Länge ∆xi der Teilintervalle gegen 0 streben lassen. Man erhält dann: n A = lim ∑ f (ξi )∆xi ∆xi →0 i=1 . 5.1.6 Volumen von Rotationskörpern Wir betrachten den Graphen einer stetigen Funktion f ∶ [a, b] → R mit f (x) ⩾ 0 für jedes x ∈ [a, b]. Nun stellen wir uns vor, dass dieser Graph um die x-Achse rotiert und möchten das Volumen des Rotationskörpers bestimmen. Wir betrachten zunächst einen schmalen Streifen mit Breite ∆xi und Länge f (ξi ). Beim Rotieren entsteht daraus ein Zylinder mit Radius f (ξi ) und Höhe ∆xi und somit vom Volumen Vi = πf (ξi )2 ∆xi Führen wir dies für alle i durch und summieren, so erhalten wir eine Approximation des Rotationskörpers durch viele zylinderförmige Scheiben, und für sein Volumen V gilt: 5.2. Das bestimmte Integral und die Integralfunktion 103 n V ≈ ∑ πf (ξi )2 ∆xi . i=1 Dieser Ausdruck ist ganz ähnlich wie die bisher betrachteten, allerdings steht unter dem Summenzeichen nicht die Funktion f , sondern die Funktion, welche durch x ↦ πf (x)2 gegeben ist. Zum Schluss führen wir auch hier den Grenzübergang durch: Je feiner man die Unterteilung der x-Achse wählt, desto genauer wird die Approximation des gesuchten Volumens durch diese Summe von dünnen, zylinderförmigen Scheiben und man erhält die Formel n V = lim ∑ πf (ξi )2 ∆xi . ∆xi →0 i=1 5.2 Das bestimmte Integral und die Integralfunktion Wir haben in den vorherigen Beispielen gesehen, dass in ganz verschiedenen Situationen dieselbe mathematische Konstruktion auftritt. In diesem Abschnitt wollen wir diese Idee losgelöst von speziellen Beispielen durchführen. Gegeben sei eine beschränkte Funktion f ∶ [a, b] → R mit a < b. Zuerst zerlegen wir, wie in den Beispielen, das Intervall [a, b] durch endlich viele Teilpunkte a = x0 < x1 < x2 < x3 < ... < xn = b in (nicht notwendigerweise gleich grosse) Teilintervalle. Eine solche Folge ζ = (xi )ni=1 nennt man Zerlegung von [a, b]. Sind ζ = (xi )ni=0 und ζ ′ = (yi )m i=0 Zerlegungen von [a, b] mit {x0 , ..., xn } ⊆ {y0 , ..., ym }, so heisst ζ ′ eine Verfeinerung7 von ζ. Zu zwei beliebigen Zerlegungen ζ = (xi )ni=0 und ζ ′ = (yi )m i=0 von [a, b] gibt es stets eine Zerlegung, die feiner ist als beide: man bilde etwa die Vereinigung ζ ∨ ζ ′ = (zk )lk=0 , wobei {zo , ..., zl } = {x0 , ..., xn }∪{yo , ..., ym } gilt und die Numerierung so gewählt ist, dass zk−1 < zk für alle 1 ⩽ k ⩽ l gilt. Sei ζ = (xi )ni=0 eine Zerlegung von [a, b]. ρ(ζ) ∶= max{xi − xi−1 ∣ 1 ⩽ i ⩽ n} heisst Maschenweite von ζ. 7 ′ ζ entsteht aus ζ durch ”Einschiebung von Zwischenpunkten”. 104 5. Integralrechnung Eine Folge (ζn ) von Zerlegungen eines Intervalls [a, b] heisst Zerlegungsnullfolge, wenn die Maschenweite ρ(ζn ) gegen Null konvergiert. Sei also f ∶ [a, b] → R eine beschränkte Funktion und ζ = (xi )ni=0 eine Zerlegung von [a, b]. Dann existieren mi ∶= inf{f (x) ∣ xi−1 ⩽ x ⩽ xi } und Mi ∶= sup{f (x) ∣ xi−1 ⩽ x ⩽ xi } für jedes 1 ⩽ i ⩽ n. Setzen wir n U (f, ζ) ∶= ∑ mi (xi − xi−1 ) n und O(f, ζ) ∶= ∑ Mi (xi − xi−1 ), i=1 (5.16) i=1 so haben wir: U (f, ζ) ⩽ O(f, ζ) . (5.17) U (f, ζ) heisst Untersumme von f bezüglich ζ und O(f, ζ) heisst Obersumme von f bezüglich ζ. Figur 68: Untersumme: die Flächenstücke zwischen x-Achse und Kurve werden von unten angenähert. Es gilt sogar Figur 69: Obersumme: die Flächenstücke zwischen x-Achse und Kurve werden von oben angenähert. U (f, ζ) ⩽ O(f, ζ ′ ) für zwei beliebige Zerlegungen ζ und ζ ′ von [a, b]. Um das zu sehen, muss man sich nur überlegen, dass die Untersummen U (f, ζ) bei Verfeinerung von ζ höchstens grösser werden und entsprechend die Obersummen O(f, ζ) bei Verfeinerung von ζ höchstens kleiner werden. 5.2. Das bestimmte Integral und die Integralfunktion 105 Diese Aussage ist geometrisch intuitiv klar: Figur 70: Untersumme und Figur 73: Obersumme Figur 71: Untersumme bei Verfeinerung der Zerlegung in Figur 70 Figur 72: Untersumme bei Verfeinerung der Zerlegung in Figur 71 Figur 74: Obersumme bei Verfeinerung der Zerlegung in Figur 73 Figur 75: Obersumme bei Verfeinerung der Zerlegung in Figur 74 Die Behauptung U (f, ζ) ⩽ O(f, ζ ′ ) folgt dann aus U (f, ζ) ⩽ U (f, ζ ∨ ζ ′ ) ⩽ O(f, ζ ∨ ζ ′ ) ⩽ O(f, ζ ′ ) . Bezeichnen wir also mit Z die Menge aller Zerlegungen von [a, b], so existieren also sup{U (f, ζ) ∣ ζ ∈ Z} und inf{O(f, ζ) ∣ ζ ∈ Z} für jede beschränkte Funktion f ∶ [a, b] → R. Offenbar gilt stets I(f ) ⩽ I(f ) . Nun definieren wir: 106 5. Integralrechnung Definition 5.1 Die beschränkte Funktion f ∶ [a, b] → R heisst Riemann-integrierbar, wenn sogar I(f ) = I(f ) gilt. In diesem Fall heisst b ∫a f (x)dx ∶= I(f ) = I(f ) das Riemann-Integral von f . Aus der Definition des Riemann-Integrals folgt Satz 5.2 Seien f ∶ [a, b] → R und g ∶ [a, b] → R Riemann-integrierbare Funktionen, dann gilt 1. Die Funktion f + g ∶ [a, b] → R ∶ x ↦ f (x) + g(x) ist ebenfalls Riemannintegrierbar und es gilt: b ∫a f (t) + g(t) dt = ∫ b a f (t) dt + ∫ b g(t) dt a 2. Die Funktion λ ⋅ f ∶ [a, b] → R ∶ x ↦ λ ⋅ f (x) ist für jedes λ ∈ R ebenfalls Riemann-integrierbar und es gilt: b b ∫a λ ⋅ f (t) dt = λ ⋅ ∫a f (t) dt Bemerkung Die Integrationsregeln 1 und 2 besagen, dass das Riemann-Integral über [a, b] ein linearer Operator ist. Das bedeutet, dass die Abbildung Φ, welche jeder integrierbaren Funktion f auf [a, b] so eine Zahl zuordnet, die Eigenschaft besitzt, dass Φ(λf + µg) = λΦ(f ) + µΦ(g) für integrierbare Funktionen f , g auf [a, b] und λ, µ ∈ R. Im folgenden Satz werden weitere Eigenschaften des Riemann-Integrals aufgeführt, welche das Berechnen von Integralen wesentlich vereinfacht: 5.2. Das bestimmte Integral und die Integralfunktion 107 Satz 5.3 Seien f ∶ [a, b] → R und g ∶ [a, b] → R Riemann-integrierbare Funktionen, dann gilt 1. Die Funktion f ∣[d,e] ∶ [d, e] → R ∶ x ↦ f (x) mit [d, e] ⊆ [a, b] ist ebenfalls Riemann-integrierbar, b d b 2. ∫ f (t) dt = ∫ f (t) dt + ∫ f (t) dt für alle d ∈ [a, b], a a d b b 3. ist g(x) ⩽ f (x) für alle x ∈ [a, b], so ist ∫ g(t) dt ⩽ ∫ f (t) dt, a a b b 4. ist f (x) = c eine konstante Funktion, so ist ∫ f (t) dt = ∫ c dt = c(b − a). a a Definitionen 5.4 Falls f [a, b] → R Riemann-integrierbar ist mit a < b, definieren wir: a 1. ∫ f (t) dt ∶= 0, und a a b 2. ∫ f (t) dt ∶= − ∫ f (t) dt. a b Bemerkung Es gibt beschränkte Funtkionen, die nicht Riemann-integrierbar sind. Ein Beispiel dafür ist die Kammfunktion f ∶ [a, b] → R, die wir bereits in Kapitel 1 S.49 betrachtet haben und definiert ist durch 1 für x ∈ Q f (x) ∶= { . 0 für x ∈ R ∖ Q . Für diese Funktion gilt: I(f ) = 0 und I(f ) = b − a . Auf der anderen Seite ist die Menge der Riemann-integrierbaren Funktionen doch recht umfangreich, wie der folgende Satz zeigt: 108 5. Integralrechnung Satz 5.5 Stetige und monotone Funktionen sind Riemann-integrierbar 1. Ist f eine im abgeschlossenen Intervall [a, b] monoton wachsende (oder monoton fallende) Funktion, dann existiert das Riemann-Integral von f über [a, b]. 2. Ist f eine im abgeschlossenen Intervall [a, b] stetige Funktion, dann existiert das Riemann-Integral von f über [a, b]. Beweis. 1. Wir führen den Beweis nur für monoton wachsende Funktionen.8 Es sei im Folgenden also f auf [a, b] monoton wachsend. Dann ist f durch f (a) nach unten und durch f (b) nach oben beschränkt und damit sind I(f ) und I(f ) definiert. Wir müssen zeigen, dass sie gleich sind. m O(f, ζ) − U (f, ζ) = ∑(Mi − mi ) ⋅ (xi − xi−1 ) i=1 m ⩽ ρ(ζ) ⋅ ∑(Mi − mi ) i=1 m = ρ(ζ) ⋅ ∑(f (xi ) − f (xi−1 )) (da f monoton wachsend ist) i=1 = ρ(ζ) ⋅ (f (b) − f (a)) . Also: O(f, ζ) − U (f, ζ) ⩽ ρ(ζ) ⋅ (f (b) − f (a)) . (5.18) Wir wählen nun eine Zerlegungsnullfolge (ζn ). Dann gilt nach (5.18) lim (O(f, ζn ) − U (f, ζn )) = 0 . n→∞ Da I(f ) − I(f ) ⩽ O(f, ζn ) − U (f, ζn ) für alle n ∈ N gilt, folgt I(f ) − I(f ) = 0 und somit ist f Riemann-integrierbar. 2. Als stetige Funktion ist f auf dem abgeschlossenen Intervall [a, b] beschränkt (vgl. Satz 2.19 S.47) und damit sind auch in diesem Fall I(f ) und I(f ) definiert. 8 Der Fall einer monoton fallender Funktion f lässt sich hierauf zurückführen, indem man die Funktion −f betrachtet. 5.2. Das bestimmte Integral und die Integralfunktion 109 Sei ϵ > 0. Man kann zeigen, dass für eine stetige Funktion f auf einem abgeschlossenen Intervall [a, b] für jedes ϵ > 0 ein δ > 0 existiert, so dass9 ∣f (x) − f (y)∣ < ϵ ist für alle x, y ∈ [a, b] mit ∣x − y∣ < δ . (5.19) Sei ζ = (xi )m i=1 eine Zerlegung von [a, b] mit ρ(ζ) ⩽ δ. Ferner seien ξi , ηi ∈ [xi−1 , xi ] mit mi = f (ξi ) und Mi = f (ηi ) für alle 1 ⩽ i ⩽ m (als stetige Funktion nimmt f auf dem abgeschlossenen Intervall [xi−1 , xi ] ihr Minimum und Maximum an). Dann gilt: m O(f, ζ) − U (f, ζ) = ∑(Mi − mi ) ⋅ (xi − xi−1 ) i=1 m = ∑(f (ηi ) − f (ξi )) ⋅ (xi − xi−1 ) i=1 m < ϵ ⋅ ∑(xi − xi−1 ) i=1 = ϵ(b − a) . Für jedes n ∈ N sei für ϵn ∶= (5.20) 1 >0 n ⋅ (b − a) nach (5.19) δn > 0 so gewählt, dass ∣f (x) − f (y)∣ < ϵn ist für alle x, y ∈ [a, b] mit ∣x − y∣ < δn . Wir können nun für jedes n ∈ N eine Zerlegung ζn wählen mit Maschenweite ρ(ζn ) < δn . Dann gilt: (5.20) 1 O(f, ζn ) − U (f, ζn ) < ϵn (b − a) = (5.21) n und daraus folgt lim (O(f, ζn ) − U (f, ζn )) = 0 . n→∞ Da I(f ) − I(f ) ⩽ (O(f, ζn ) − U (f, ζn ) für alle n ∈ N gilt, haben wir gezeigt, dass I(f ) − I(f ) = 0 und somit ist f Riemann-integrierbar. Beweis 19 () 9 Diese Eigenschaft ist stärker als Stetigkeit, da das δ nicht von einer gewählten Stelle x0 abhängig ist sondern ”global” für das ganze Intervall gilt. Man sagt f ist gleichmässig stetig auf [a, b]. 110 5. Integralrechnung Beispiele 5.6 Im Abschnitt 5.1 haben wir jeweils stetige Funktionen betrachtet und somit gilt: • Der zurückgelegte Weg s zwischen 0 und T ist das Integral der Geschwindigkeitsfunktion v s=∫ T v(t) dt . (5.22) 0 • Die geleistete Arbeit W von 0 bis b ist das Integral der Kraft F W =∫ b 0 F (x) dx . (5.23) • Der orientierte Flächeninhalt F von a bis b zwischen dem Graph von f und der x-Achse ist das Integral b F = ∫ f (x) dx . a (5.24) • Das Volumen des Rotationskörpers, welches entsteht, wenn der Graph einer positiven stetigen Funktion f ∶ [a, b] → R um die x-Achse rotiert ist b V = ∫ πf (x)2 dx . a 5.2.1 (5.25) Der orientierte Flächeninhalt Als wir im Abschnitt 5.1.5 den Flächeninhalt A unterhalb des Grafen einer stetigen Funktion f ∶ [a, b] Ð→ R berechnet haben, haben wir vorausgesetzt, dass die Funktion f positiv ist. Da f stetig ist, existiert das Integral von f über [a, b] und wir definieren A ∶= ∫ b b a f (x) dx . Das Integral ∫a f (x)dx ist aber auch für Funktionen definiert, welche negative Werte annehmen. Wenn der Graph der Funktion unterhalb der x-Achse verläuft (f (x) < 0), ist das Produkt f (ξi ) ⋅ ∆xi negativ. 5.2. Das bestimmte Integral und die Integralfunktion 111 Geometrisch gesehen, macht es keinen Sinn von einer negativen Fläche zu sprechen. In der Analysis ist es jedoch sehr wichtig, solche negative Produkte zu betrachten. Wir werden dafür den Begriff ”orientierter Flächeninhalt” verwenden und meinen damit, dass solche Flächen sowohl positiv wie auch negativ sein können je nachdem ob sie oberhalb oder unterhalb der x-Achse liegen. b Figur 76: ∫ f (x)dx a b Für das Integral ∫a f (x) dx werden die Flächenstücke oberhalb der x-Achse positiv und diejenigen unterhalb der x-Achse negativ gerechnet. Dies nennen wir die orientierte Fläche 112 5. Integralrechnung zwischen dem Graphen von f und der x-Achse. Beispiel 5.7 2π Figur 77: ∫0 sin(x)dx = 0 5.2.2 Das Prinzip von Cavalieri Nun soll das Volumen eines Körpers berechnet werden, der in ein räumliches rechtwinkliges kartesisches Koordinatensystem (xyz-Koordinatensystem) eingebettet ist. Die zur yzEbene parallele Ebene durch den Punkt (x, 0, 0) schneidet den Körper in einer Fläche. Wir nehmen an, dass für jeden Wert von x der Inhalt q(x) dieser Fläche existiert und dass dabei q eine stetige Funktion auf dem Intervall [a, b] ist. Dann gilt für das Volumen V des Körpers V =∫ b q(x)dx . a Daraus folgt das Prinzip von Cavalieri: Liegen zwei Körper zwischen zueinander parallelen Ebenen und werden sie von jeder zu diesen parallelen Ebene so geschnitten, dass gleich grosse Schnittflächen entstehen, so haben die Körper das gleiche Volumen. Figur 78: Bonaventura Cavalieri 1598-1647 5.3. Der Hauptsatz 113 5.3 Der Hauptsatz In diesem Abschnitt wird der Zusammenhang zwischen Ableitung und Integral untersucht. Definition 5.8 Seien f und F Funktionen [a, b] → R. Falls F differenzierbar ist und F ′ (x) = f (x) für alle x ∈ [a, b] gilt, so heisst F Stammfunktion von f . Mit F ist dann auch F + c für jedes c ∈ R eine Stammfuntkion von f . Stammfunktionen sind also nicht eindeutig bestimmt. Sind andererseits F und G Stammfunktionen von f , so ist (F − G)′ = f − f = 0 und deswegen10 F − G = c mit einem c ∈ R. Zwei Stammfunktionen von f unterscheiden sich also um eine additive Konstante, oder: Satz 5.9 Ist F eine Stammfunktion von f auf einem Intervall [a, b], so ist {F + c ∣ c ∈ R} die Menge aller Stammfunktionen von f auf [a, b]. Natürlich stellt sich die Frage nach denjenigen Funktionen f , die Stammfunktionen besitzen. 10 Sie haben in den Übungen gezeigt: wenn die Ableitung einer Funktion auf einem Intervall Null ist, dann ist die Funktion auf diesem Intervall konstant. 114 5. Integralrechnung Satz 5.10 Hauptsatz der Differential- und Integralrechnung 1. Ist f ∶ [a, b] → R stetig, so ist die zugehörige Integralfunktion F ∶ [a, b] → R ∶ x ↦ ∫ x a f (t) dt für jedes x ∈ [a, b] differenzierbar und es gilt: F ′ (x) = (∫ x a ′ f (t) dt) = f (x) 2. Ist f ∶ [a, b] → R stetig und ist G eine Stammfunktion von f , so gilt b ∫a f (t) dt = G(b) − G(a) Beweis 1. Sei x0 ∈ [a, b]. Wir müssen zeigen, dass lim ∣ x→x0 F (x) − F (x0 ) − f (x0 )∣ = 0 . x − x0 Sei ϵ > 0. Da f stetig ist, gibt es ein δ > 0 so, dass ∣f (t) − f (x0 )∣ < ϵ für alle t mit ∣t − x0 ∣ < δ. Sei also x ∈ [a, b] mit ∣x − x0 ∣ < δ: x0 RRR x RRR R RR f (t) dt − f (t) dt ∫ ∫ RRR a F (x) − F (x0 ) R a ∣ − f (x0 )∣ = RRR − f (x0 )RRRR RRR RRR x − x0 x − x0 RR RR R x R RR RR RRRR RRRR ∫ f (t) dt x0 R R − f (x0 )RRRR = RR RR RR x − x0 RR RR RR RR = ∣ x 1 (∫ f (t) dt − f (x0 )(x − x0 ))∣ x − x 0 x0 5.3. Der Hauptsatz 115 Satz 5.3.4 = ∣ x x 1 (∫ f (t) dt − ∫ f (x0 ) dt)∣ x − x0 x0 x0 Satz 1.5.2 ∣ x 1 f (t) − f (x0 ) dt∣ x − x0 ∫x0 Satz 5.3.3 x 1 ∣f (t) − f (x0 )∣ dt ∣x − x0 ∣ ∫x0 Satz 5.3.3 x 1 ϵ dt ∫ ∣x − x0 ∣ x0 Satz 5.3.3 = 1 ⋅ ϵ (x − x0 ) ∣x − x0 ∣ = ϵ = ⩽ ⩽ 2. Nach 1 ist F eine Stammfunktion von f . Für diese gilt: F (a) = 0 und F (b) = b ∫a f (t) dt. Ist G irgendeine Stammfunktion von f so gilt (nach Satz 5.9 S.113) G(x) = F (x) + c für eine additive Konstante c. Dann ist: G(b) − G(a) = F (b) − F (a) = ∫ b a f (t) dt . Beweis 20 () Bemerkung Insbesondere folgt aus dem Hauptsatz der Differential- und Integralrechnung, dass für eine stetige Funktion f ∶ [a, b] → R die zugehörige Integralfunktion F ∶ [a, b] → R ∶ x ↦ ∫ x a stetig ist, da differenzierbare Funktionen stetig sind. f (t) dt 278 X DifferenzialX Differenzialund Integralrechn und Integ 278 X.7 NX.7 äherungsverfahren Näherungsverfahren zur Integration zur Integration 116 In vielenInFvielen ällen lässt Fällen sich lässt dassich Integral das Integral einer stetigen einer stetigen Funktion Funktion f über einem f über(ne 5. Integralrechnung zu großen) zu großen) IntervallIntervall [a; b] näherungsweise [a; b] näherungsweise durch (bdurch − a) ·(bη − angeben, a) · η angeben, wobei w ! " ! f (a) + ff(b) (a) + f (b) a+b a+b 5.4 Anwendungen oder ηoder =f η=f η = f (a) η =oder f (a) ηoder = η= " 2 2 2 2 5.4.1 Näherungsverfahren zur Integration ist. Diese ist.Absch Dieseätzung Abschätzung wird wesentlich wird wesentlich besser, wenn besser,man wenn dasman Intervall das Interva in n T b − a b − a In vielen Fällen lässt sich das Integral einer stetigen Funktion f über einem (kleinen) intervalle intervalle [xi−1 ; xi[x ] der xänge ] derhL:= änge h := zerlegt und zerlegt in jedem und indieser jedemTeilinterv dieser T i−1 ; L Intervall [a, b] näherungsweise durch i(b − a) ⋅ η angeben, n wobein11 diese Näherung diese Näherung verwendet. verwendet. Man gelangt Man gelangt so zu folgenden so zu folgenden Regeln:Regeln: η = f (a) #b #b vgl. Figur 79 (5.26) (b) Das Integral Das Integral f (x) dxff(a) hat (x)+ fn dx äherungweise hat näherungweise den Wert den Wert vgl. Figur 80 η = a 2 a n−1 $ (5.27) (5.28) n−1 $ · h(x· i ) f (x fwesentlich (Rechtecksregel, Fig. 1) Fig. 1) i ) wenn man das Intervall Diese Abschätzungenhwerden besser, in(Rechtecksregel, n Teilintervalle b−a i=0 [xi−1 , xi ] der Länge ∆ ∶=i=0 n zerlegt und in jedem dieser Teilintervalle diese Näherung oder oder ! zu den ! " " verwendet. Man gelangt so folgenden Regeln: n−1 n−1 h· b f (a) + ff(b) (a) + $ f (b) $ h· + f (x + i ) f (xi(Trapezregel, ) (Trapezregel, Fig. 2) Fig. 2) n−12 2 i=1 i=1 (x)dx ≈ ∆ ⋅ ∑ f (xi ) oder∫a foder h· b n $ i=0 n % $ Rechtecksregel % & xi−1 + xxii−1 + xi fh · f n−1 f (a) + 2 2 i=1 i=1 f (b) ∫a f (x)dx ≈ ∆ ⋅ ( 2 & + ∑ f (xi )) (5.29) (Tangentenregel, (Tangentenregel, Fig. 3). Fig. 3 Trapezregel (5.30) i=1 y = f (x)y = f (x) y = f (x)y = f (x) y = f (x)y = f ............... ............... .... .... .................................................................... ......................................................................................... ....... ................................................................ ............ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ............. . . .. ......................... .. . ................ .. ............................. .. . . . . . .... .............................................................................................. . . . . . . . . . . . . . . . . . . . .... ... . . . ........................... . . . . . . ... .... ... . . . ........................... .. . . . . . ... .... ... . . . ............................... .... . . . . . . . . . . . . . . . .. .. . . . ... . . ............... . . . . . . ... .. .. . . . ... . .. ............... .. . ... ... . . ..... . . ................ . . . . . . ... .. . . . .. ... .. .. .... .. . . . ... . . .. . . . ... .. .. .... . . . ... .. . . . ... .. ...f.(x. . )..f (x ) ... . . . . . ... ................. ... . .. . . . . . . .............. . . . . . . .. . .. ............... .. . .i+1 . . . .. i+1 ... . . . . . .. ................ .. . . . .) ... .. ... . . . .. f (x ) ... . .f. (x . . ) f (xi ) ... . .f. (x f (xi ) .. . f. (x. i.)... .. .. ... . . . . . i . . . . i.. .. .. .. ... .. . . . ... .. . . . . . .. .............. .. . . . . . .. .. . . . . . i. ................... . . . . . . .... .. . . . . . .. ............... .. . .. . . .. ... .. ... .. . . .. .. . . . . .... ... ...... . . . . . . ... .. . . .. ... .. .... .. . . . .. . . . . ... .. .. ... . . . . .. .. . . . ... .. .. .. . . . . . ................................................................................................................................................................................................................................ ......................................................................................... " xi "! h xi xi+1h ! xi+1 " xi "! h xi xi+1h ! xi+1 " xi "! h xi xi+1h Fig. Zur Fig. 1: Zur Rechtecksregel Fig. 2: Zur Fig.Trapezregel 2: Fig.Tangentenr 3: Zur Tan Figur1:79: ZurRechtecksregel Rechtecksregel Figur 80:Zur Zur Trapezregel TrapezregelFig. 3: Zur Die Approximation Die Approximation eines Integrals eines Integrals wird i. Allg. wird besser, i. Allg. besser, wenn man wenn dieman Funk d Die Approximation eines Integrals wird im Allgemeinen noch besser, wenn man die Funktif über f[a;über b] eine durch [a; b]eine durch Polynomfunktion eine Polynomfunktion p vom Grad p2.vom 2 Grad (Parabel) 2 (Parabel) annähert, an on f über [a, b] durch quadratische Funktion p (Polynomfunktion Grades) annähert, welche welche für welche ! " ! !" " ! " a+b a+b a+b a+b p(a) = fp(a) (a),= fp(a), p = f = f , p(b) ,= fp(b) (b) = f (b) 2 2 2 2 11 Diegilt Abschätzung η =und f (a)das haben wirdas in diesem Kapitel bei der Herleitung desdas Integrals immer undgilt dann dann Integral Integral über f über durch f das durch Integral Integral über p wieder über annähert p ann (Fig äh verwendet. a+b a+b b−a b−a und h :=und gehen und Zur Bestimmung Zur Bestimmung von p(x) von setzen p(x) wir setzen m= wir m =und h := 2 2 2 2 dem Ansatz dem Ansatz p(x) = rp(x) + s(x = r−+a)s(x + t(x − a) −+ a)(x t(x− −m) a)(xaus. − m) Mitaus. p(a)Mit = fp(a) (a),=p(m f( f (m), p(b) f (m), = fp(b) (b) erh = fält (b)man erhält fürman p(x)für denp(x) Term den Term 5.4. Anwendungen 117 p(a) = f (a) , p( a+b a+b ) = f( ) 2 2 (5.31) und p(b) = f (b) X.7 Näherungsverfahren zur Integration (5.32) (5.33) 279 gilt und dann das Integral über f durch das Integral über p annähert (vgl. folgende Figur): y " .. ....... y = p(x) .............. y = f (x) .......! .......... ..... . . . .. .... ... . . .. ........... . . . ..... . . ........ . . . . ..... ............. .. . .. . .. . ..... . . . . . . . . ... ........!........ .......... . .. . .. . .. . .. . .. ..... ...... ...................................................................! ..... . . . . . . . .. . . . ...... . . . . . . . . . . . . ... .... . . . . . . . . . . . ..... . . . . . . . . . . . . .... ... .. .. ! a+b a x b 2 Fig.Simpsonregel 4: Zur Simpson-Formel Figur 81: Zur f (a) + Für f (a + 2h) − 2f (a + h) + f (a) f (a + h) − f (a) (x − a) + (x − a)(x − a − h). h 2h2 a+2h ! Wir werden im Folgenden zeigen, dass für diese Annäherung gilt: p(x) dx ergibt sich dann a a + f (a) 2 a+b f (a + h) − f (a) f (a + 2h) − 2f (ab+−h) (f (a) ·+ 4f (5.34) f (a) · 2h + · 2h2 + ∫ f (x)dx ≈2 h3 . ( 2 ) + f (b)) . 6 a h 2h 3 Also ist a+2h ! h Diese Approximationsformel Keplersche Fassregel (nach Johannes Kepler, 1571h) + f (a + 2h)). f (x) dx ≈ (f (a) + 4f (a + heisst 3 1630). a b Die damit gewonnene Approximationsformel !b " Da f (x) dx ≈ b − a f (a) + 4f 6 a b " # # a+b + f (b) 2 1 dx = b − a = b−a ⋅ (1 + 4 + 1) (5.35) ∫a heißt Simpson-Formel (nach Thoy 6...........M ...".......... . .. .. .. ....... " mas Simpson, 1716–1761). Diese Re-b ........... a+b 1 2 ................2..... .....b −....a ........... . a ) = ... ...........+ ⋅ (a + b) (5.36) gel heißt auch keplersche Fassregel A .....− B4 ∫a x dx = 2 (b . ...."...... 2 ".. .....................................6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ............. ......... (nach Johannes Kepler, 1571–1630). .. .. . . 2 + 2ab + b2 b ................ ...... ... ... .......... ............ ...3.. 3....... ... b...− a ...... ....2...... y =af (x) Kepler gab den Inhalt eines Fasses x2 dx = .1 . (5.37) (b − a ) = ⋅ (a + 4 + b2 ) . . . . . . . ∫ . . . . . . . . . . . . . . . .. . . .3 der Höhe H mit 4 a ............ .... ....6 ............ ... ........ ........ .... .... ! b 1......... a 4... 4.............. m b ...− a ............... b3 ...... a3 x+ 3a2 b + 3ab2 + b3 H 3 ....(b .. − a ..)..... = .. ⋅ .(a + b3 ) (5.38) x dx = (A + 4M + B) .......... ....+ 4 ∫a ........ . 6 4.................... 6 8 . . . . . . . . . . . . . . . . . . . . . . . ................. ........ . ................. . . (5.39) ......................................................................................................................... an (Fig. 5), wobei A und B die H Flächeninhalte des Grund- bzw. und und da das Integral Deckkreises sind M der Inhalt über [a, b] ein linearer Operator ist (vgl. S.106), gilt für PolynomfunkFig. 5: Keplersche Fassregel des Schnittkreises in halber Höhe ist. . ........... . . y = p(x) ...... y = f (x) . ............! . . . . .. ............ . .... . . . ... .... . . .. 118............ . . . . ... .... . . . . ............. .. . .. . .. . .. ... . . . ............... . ... . . . . . .. . .........................................................! ......tionen . . . p(x) . . .=.. ax3 + bx2 + cx + d bis zum dritten Grad: . . . . . . . . . . . ..... . . .. . .. . .. . .. . .. . ... . . . . . . .... . . . . . . ... ! a+b b b x 2 ∫a p(x)dx = 5. Integralrechnung b−a ) + p(b)) , (p(a) + 4p ( a+b 2 6 (5.40) Fig. 4: Zur Simpson-Formel also−gilt für die quadratische Funktion q: f (a + 2h) 2finsbesondere (a + h) + f (a) − a) + (x − a)(x − a − h). 2h2 b ∫a q(x) dx = h dann − f (a) x≈ · 2h2 + f (a + 2h) − 2f (a + h) + f (a) 2 3 · h. 2h2 3 Aus (5.31),(5.32),(5.33) folgt h (f (a) + 4f (a + h) + f (ab + 2h)). 3 f (x) dx ≈ ∫a roximationsformel " b−a ≈ f (a) + 4f 6 ach ThoDiese ReFassregel 71–1630). nes Fasses d B die nd- bzw. der Inhalt Höhe ist. b−a (q(a) + 4q ( a+b ) + q(b)) . 2 6 y " " # b ∫a q(x) dx = b−a (f (a) + 4f ( a+b ) + f (b)) . 2 6 # a+b + f (b) 2 M . ....."............. . . . . . . . .. . . . . . . . ....... ...... ............ . .. . . . . . ........... .... . . . . . . ...........B A.... . . . .. ....."........................................................................................"................ ..... .. .. . ............. ............ . ......... ... .... ......... ... ......... y = f (x) ........ ... .... . .... .. .. ...... .. ..... ...... .. .. ........... .. .... ........ .. ... ............ .. ...... ! ......... b .... ......... m .. ...... a . x . . . . ......... .... ......... ...... .. . ......... .... ...... .. ......... .. . . ............ .................. ............... .... .............................. ...................................................................................................................... H Kepler gab den Inhalt eines Fasses der Höhe H mit H (A + 4M + B) 6 an, wobei A und B die Flächeninhalte des Grund- bzw. Deckkreises sind und M der Inhalt des Schnittkreises in halber Höhe ist. Figur 82: Keplersche Fassregel Fig. 5: Keplersche Fassregel Die Ergebnisse seiner Überlegungen veröffentlichte Kepler in dem Büchlein Neue Stereometrie der Fässer. Gleich zu Beginn beschrieb er, wie er auf das Problem stiess: ”Als ich im vergangenen November eine neue Gattin in mein Haus eingeführt hatte, gerade zu der Zeit, da nach einer reichen und ebenso vorzüglichen Weinernte viele Lastschiffe die Donau 5.4. Anwendungen 119 herauffuhren und �sterreich die Fülle seiner Schätze an unser Norikum verteilte, sodass das ganze Ufer in Linz mit Weinfässern, die zu erträglichem Preis ausgeboten wurden, belagert war, da verlangte es meine Pflicht als Gatte und guter Familienvater, mein Haus mit dem notwendigen Trunk zu versorgen. Ich liess daher etliche Fässer in mein Haus schaffen und daselbst einlegen. Vier Tage hernach kam nun der Verkäufer mit einer Messrute, die er als einziges Instrument benutzte, um ohne Unterschied alle Fässer auszumessen, ohne Rücksicht auf ihre Form zu nehmen oder irgendwelche Berechnung anzustellen. Figur 83: Messung des Inhalts eines Fasses Er steckte nämlich die Spitze des Eisenstabes in die Einfüllöffnung des vollen Fasses schief hinein bis zum unteren Rand der beiden kreisförmigen Holzdeckel, die wir in der heimischen Sprache die Böden nennen. Wenn dann beiderseits diese Länge vom obersten Punkt des Image http://www.mediaculture-online.de/index.php?eID Fassrunds bis zum untersten Punkt der beiden kreisförmigen Bretter gleich erschien, dann gab er nach der Marke, die an der Stelle, wo diese Länge aufhörte, in den Stab eingezeichnet war, die Zahl der Eimer an, die das Fass hielt, und stellte dieser Zahl entsprechend den Preis fest. Mir schien es verwunderlich, ob es möglich sei, aus der durch den Körper des halben Fasses quer gezogenen Linie den Inhalt zu bestimmen, und ich zweifelte an der Zuverlässigkeit dieser Messung.” Kepler rechnete nach und stellte fest, dass der Inhalt der Fässer, welche zu dieser Zeit in �sterreich üblich waren, mit dieser Methode tatsächlich gut abschätzbar war. Figur 84: Kepler 1627 120 5. Integralrechnung Simpson-Regel Wenn wir das Intervall [a, b] in n gleich lange Teilintervalle [xi−1 , xi ] zerlegen, wobei wir n gerade wählen und auf jedem Intervall [xi−1 , xi+1 ] der Länge 2 ⋅ b−a n die Keplersche Fassregel anwenden erhalten wir: b ∫a f (x)dx ≈ b−a (f (a) + 4f (x1 ) + 2f (x2 ) + 4f (x3 ) + 2f (x4 ) + ... + 4f (xn−1 ) + f (b)) 6 n2 X.5 Stammfunktionen und Flächeninhalte ≈ n −1 2 263 n 2 ⎞ b−a⎛ f (a) + 2 ∑Beispiel f (x2k )3+(zur 4 ∑partiellen f (x2k−1Integration): ) + f (b) ! ! 3n ⎝ ⎠ k=1 k=1 xex dx = xex − a) Diese Regel heisst ex dx = xex − ex ! ! ! x dx = x 1716-1761). ln x − x b) ln x dx = 1 · ln x dx = x ln x − Simpson-Regel (nach Thomas Simpson, x Beispiel 4 (zur Integration durch Substitution): a) 5.4.2 ! f ! (x) dx = ln f (x) f (x) b) ! 1 f (x) · f ! (x) dx = (f (x))2 2 Der natürliche und die Exponentialfunktion Für alle α ∈ IRLogarithmus mit α #= −1 gilt ! xα dx = 1 xα+1 , α+1 Im folgenden Abschnitt werden wir einen alternativen Zugang zur Logarithmus- und zur wie man sofort durch Differenziation findet. Der Ausnahmefall α = −1 kann beExponentialfunktion finden [nach SSAA S. 263ff.]. nutzt werden, um die natürliche Logarithmusfunktion ln zu definieren. Man kann damit also einen neuen Zugang zu den Exponential- und Logarithmusfunktionen finden:Definition: Für x > 0 Wir beginnen mit einer Für x > 0 sei sei !x x 1 1 dt ln x ∶= ∫ dt ln . x := t (5.41) 1 t 1 Nach Definition ist(Fig. 3). Dann ist ln eine auf IR+ differenzierbare Funktion mit ln(1) = 0 (ln x)! = 1 >(5.42) 0, x und .. 1 ... x ... ... ln a # ... ... # ..... 1.. ............ # ......................#$..#.................... ..... ................ ....................................................! x a 1 y . ".... y = also ist ln umkehrbar auf IR+ . Die UmFig.85: 3: Natürlicher Logarithmus Natürlicher Logarithmus kehrfunktion von ln nennen wir exp Figur (Fig 4). Ihre ln ∶]0, ∞[Ð→ ln(]0, ∞[)Definitionsmenge (5.43) ist die Bildmenge von ln (also IR, wie wir soy .. x .Wir ist eine streng monoton Funktion undUmsomit umkehrbar. werden auch gleich gleich wachsende sehen werden). Nach der " .. y = e .... . . . . . kehrregel der Differenziation zeigen, dass die Bildmenge ln(]0, ∞[) ganzgilt R ist. . ... .. ..... ........................ . e . . 1 ... ... exp! = ! = exp, ... ..... ..... y = ln x . . + ln ◦auf exp R differenzierbare Funktion . . .. Nach Definition ist ln zudem eine ... ...........mit .......................... . . . 1................................................................ die Funktion exp stimmt also mit ihrer ....... . ..... ..... .............. ..... . . . . . . . . . . . . .. ....... .. Ableitungsfunktion überein. ! .... ........ . . e x . . 1 . . . 1 ′ . . . . . (ln x) = 0 gilt >0. (5.44) Für x > 0 und ein festes a > . . . . . . x ln ax = ln a + ln x, denn ..... ... 1 1 (ln ax)! = · a = = (ln x)! . Fig. 4: Die Funktionen ln und exp ax x ... ln a ... # ... # .... # ............. 1.. .........................#............ ................#$................................................................ . ! x a 1 1 (Fig. 3). Dann ist ln eine auf IR+ differenzierbare Funktion mit 1 (ln x)! = > 0, x also ist ln umkehrbar auf IR+ . Die Um- Fig. 3: Natürlicher Logarithmus 5.4. Anwendungen kehrfunktion von ln nennen wir exp (Fig 4). Ihre Definitionsmenge ist die Bildmenge von ln (also IR, wie wir sogleich sehen werden). Nach der UmDie Umkehrfunktion vonder ln Differenziation nennen wir exp: kehrregel gilt 1 −1! exp = .! =(5.45) exp, exp(x) ∶= ln (x) ln ◦ exp Nach der Umkehrregel der Differenziation die Funktion exp stimmt also mit ihrer gilt Ableitungsfunktion überein. exp′ (x) = ′ Für1 x > 05.44 und ein festes a > 0 gilt exp , (5.46) ln ax = ln a = + ln x, x denn ln (exp(x)) 1 1 ax)! = also ·a= = (ln x)! . die Funktion exp (ln stimmt mit ax x ihrer Ableitung überein. 121 . x .. ... y = e .... .... . ... ... e ....................... ... . . . . .. .. y = ln x ... ... ...... . . .. ... ..... .............. . . 1.................................................................................. . .. ........ ...... .... ............. .... ................ .. . ..... . ! . e x .... .....1 . . . ... . . . . .. .... ... y " Figur Graphen der Funktionen Fig.86: 4: Die Funktionen ln und exp ln und exp Für x > 0 und ein festes a > 0 gilt ln′ (ax) = 1 1 ⋅ a = = ln′ (x) . ax x ln(ax) und ln(x) sind also beide Stammfunktionen von um eine additive Konstante: ln(ax) = ln(x) + c 1 x (5.47) und unterscheiden sich somit nur und da 5.42 ln(a) = ln(a ⋅ 1) = ln(1) + c = c gilt ln(ax) = ln(x) + ln(a) . Es gilt also ganz allgemein: ln(x1 x2 ) = ln(x1 ) + ln(x2 ) ∀x1 , x2 > 0 . (5.48) Aus dieser Beziehung folgt, dass 0 = ln(1) = ln( xx ) = ln(x) + ln( x1 ) und somit 1 ln ( ) = − ln(x) ∀x > 0 . x (5.49) 122 5. Integralrechnung Da die harmonische Reihe unbeschränkt ist und da n n 1 1 ln(n) = ∫ dx ⩾ ∑ 1 x k=2 k (5.50) (vgl. Figur 87) ist auch ln unbeschränkt. n n 1 1 Figur 87: ∫ dx ⩾ ∑ 1 x k=2 k Da ln als Integralfunktion stetig ist, nimmt sie wegen des Zwischenwertsatzes von Bolzano (Satz 2.15 S.42) auch alle Zwischenwerte an und hat also wegen (5.49) die Bildmenge R. Mit y1 = ln(x1 ) und y2 = ln(x2 ) erhält man 5.48 exp(y1 + y2 ) = exp(ln(x1 ) + ln(x2 )) = exp(ln(x1 x2 )) = x1 x2 = exp(y1 ) exp(y2 ) . (5.51) Für festes x > 0 und festes a ∈ R gilt: ln′ (xa ) = 1 a ⋅ axa−1 = = a ⋅ ln′ (x) , a x x also ist ln(xa ) = a ln(x) + c und die additive Konstante c ergibt12 sich als 0, wenn man x = 1 einsetzt. Es gilt also: ln(xa ) = a ln(x) . (5.52) Dies bedeutet für die Funktion exp, dass13 exp(ay) = exp(y)a ∀a, y ∈ R . Es folgt für alle a ∈ R dass exp(a) = exp(1)a . 12 0 = ln(1) = a ⋅ ln(1) + c = 0 + c 13 Für y = ln(x) gilt: exp(ay) = exp(a ln(x)) (5.52) = exp(ln(xa )) = xa = exp(y)a . (5.53) 5.4. Anwendungen 123 Wenn wir e ∶= exp(1) (5.54) exp(a) = ea (5.55) ln(e) = 1 . (5.56) setzen, dann ergibt sich und Damit haben wir einen völlig neuen Zugang zur Exponentialfunktion gefunden. Nach der Definition von ln als Integral gilt (vgl. Figur 88): 1 1+ n 1 1 n 1 1 1 = ⋅ <∫ dt = ln (1 + ) < ⋅ 1 . n+1 n+1 n t n n 1 Figur 88: ∫ 1 1 1+ n 1 1 dt = ln (1 + ) t n (5.57) 124 5. Integralrechnung Wenn wir die vorherigen Ungleichungen mit n multiplizieren erhalten wir14 mit der Formel (5.52): 1 n 1 n 1− = < ln ((1 + ) ) < 1 (5.58) n+1 n+1 n und damit, da mit ln auch exp monoton wachsend und stetig ist, (vgl. 2. Folgerung aus dem Zwischenwertsatz von Bolzano in Kapitel 2): exp (1 − 1 1 n ) < (1 + ) < exp(1) = e . n+1 n (5.59) D.h. 1 n e = lim (1 + ) . n→∞ n Die oben definierte Zahl e ist tatsächlich die Eulersche Zahl! 14 n n+1 = n+1−1 n+1 =1− 1 n+1 (5.60) Anhang A Voraussetzungen aus der Mittelschule A.1 Arithmetische und geometrische Folgen Definitionen A.1 Arithmetische Folgen a ∶ N0 → R ∶ n ↦ a0 + n ⋅ d sind differenzengleich, d. h. die Differenz zweier aufeinander folgender Glieder ist konstant. Ein Beispiel ist die Folge 7, 14, 21, 28, 35, . . . der Vielfachen von 7. Eine arithmetische Folge ist eindeutig definiert, wenn man ihr erstes Glied a0 und die konstante Differenz d = an+1 − an (für alle n ∈ N0 ) kennt: a0 , a1 = a0 + d, a2 = a1 + d = a0 + 2d, a3 = a2 + d = a0 + 3d Allgemein: an = a0 + n ⋅ d. Geometrische Folgen a ∶ N0 → R ∶ n ↦ a0 ⋅ q n , q ≠ 0, sind dagegen quotientengleich, d. h der Quotient zweier aufeinander folgender Glieder ist konstant. Insbesondere sind alle Folgenglieder ungleich Null. Ein Beispiel ist die Folge1, 2, 4, 8, 16, 32,.... Eine geometrische Folge ist somit bekannt, wenn man ihr erstes Glied a0 und den konstanten Quotienten an+1 (für alle n ∈ N0 ) kennt: a0 , a1 = a0 ⋅ q, a2 = a1 ⋅ q = a0 ⋅ q 2 , a3 = a2 ⋅ q = a0 ⋅ q 3 , ... q= an Allgemein: an = a0 ⋅ q n . 126 A. Voraussetzungen aus der Mittelschule Satz A.2 1. Die Folge (sn )n∈N0 sei die aus der arithmetischen Folge (an )n∈N0 gebildete Reihe. Dann gilt n sn = ∑ ak = (n + 1) ⋅ a0 + k=0 n(n + 1) a0 + an ⋅d= ⋅ (n + 1) 2 2 2. Die Folge (sn )n∈N0 sei die aus der geometrischen Folge (an )n∈N0 gebildete Reihe. Dann gilt für q ≠ 1 n sn = ∑ ak = a0 ⋅ k=0 1 − q n+1 1−q Für q = 1 ist die geometrische Folge konstant; für das n-te Glied der zugehörigen Reihe gilt also sn = (n + 1)a0 . Eine arithmetische Folge a ∶ N0 → R ∶ n ↦ a0 +nd ist eine Teilfunktion der linearen Funktion fa ∶ R → R ∶ x ↦ a0 + xd. Eine geometrische Folge a ∶ N0 → R ∶ n ↦ a0 ⋅ q n , q ≠ 0, ist für q > 0 eine Teilfunktion der Exponentialfuntkion fa ∶ R → R ∶ x ↦ a0 ⋅ q x . Im Graph schaut das so aus: Abbildung A.1: Graph der arithmetischen Folge a ∶ N0 → R ∶ n ↦ −1 + 2n und der linearen Funktion fa ∶ R → R ∶ x ↦ −1 + 2x A.1. Arithmetische und geometrische Folgen 127 Abbildung A.2: Graph der geometrischen Folge a ∶ N0 → R ∶ n ↦ 5 ⋅ 0.9n und der Exponentialfunktion fa ∶ R → R ∶ x ↦ 5 ⋅ 0.9x Für negative Quotienten q und nicht ganze Zahlen x ist q x nicht definiert und somit ist die Exponentialfunktion a0 ⋅ q x nicht definiert. Die geometrische Folge a ∶ N0 → R ∶ n ↦ a0 ⋅ q n ist hingegen auch für negative Quotienten definiert: Abbildung A.3: Graph der geometrischen Folge a ∶ N0 → R ∶ n ↦ 5 ⋅ (−0.9)n 128 A.2 A. Voraussetzungen aus der Mittelschule Ableitungsregeln Summenregel Mit f und g ist auch ihre Summe f + g in x0 differenzierbar und es gilt: (f + g)′ (x0 ) = f ′ (x0 ) + g ′ (x0 ) (A.1) Faktorrelgel Mit f ist auch das Produkt c ⋅ f für c ∈ R in x0 differenzierbar und es gilt: (c ⋅ f )′ (x0 ) = c ⋅ f ′ (x0 ) (A.2) Produktregel Mit f und g ist auch das Produkt f ⋅ g in x0 differenzierbar und es gilt: (f ⋅ g)′ (x0 ) = f ′ (x0 ) ⋅ g(x0 ) + f (x0 ) ⋅ g ′ (x0 ) (A.3) Kettenregel Ist f in x0 und g in f (x0 ) differenzierbar, so ist auch Verkettung g ○ f in x0 differenzierbar und es gilt: (g ○ f )′ (x0 ) = g ′ (f (x0 )) ⋅ f ′ (x0 ) (A.4) Quotientenregel Falls g(x0 ) ≠ 0 so ist mit f und g auch ihr Quotient f g in x0 differenzierbar und es gilt: f f ′ (x0 ) ⋅ g(x0 ) − f (x0 ) ⋅ g ′ (x0 ) (x0 ) = g g(x0 )2 (A.5) Potenzregel Für f (x) = xr , r ∈ R und x > 0 gilt: f ′ (x) = rxr−1 (A.6) A.2. Ableitungsregeln 129 Trigonometrische Funktionen Für alle x ∈ R gilt: Für alle x ∈ Rgilt: sin′ (x) = cos(x) (A.7) cos′ (x) = sin(x) (A.8) Für alle x ∈ R ∖ { π2 + k ⋅ π ∣ k ∈ Z} gilt: tan′ (x) = 1 cos2 (x) = 1 + tan2 (x) (A.9) Für alle x ∈ R ∖ {k ⋅ π ∣ k ∈ Z} gilt: cot′ (x) = − 1 = −1 − cot2 (x) sin (x) 2 (A.10) 130 A.3 A. Voraussetzungen aus der Mittelschule Integrationsregeln Summenregel Mit f und g ist auch ihre Summe f + g in x0 integrierbar und es gilt: b b b ∫a f + g dx = ∫a f (x) dx + ∫a g(x) dx . (A.11) Faktorrelgel Mit f ist auch das Produkt c ⋅ f für c ∈ R integrierbar und es gilt: b ∫a cf dx = c ⋅ ∫ b a f (x) dx . (A.12) Partielle Integration Die Produktregel (f ⋅ g)′ = f ′ ⋅ g + f ⋅ g ′ wird beiseitig integriert und liefert: b b ′ ′ ∫a f (x) ⋅ g(x) dx = f (x) ⋅ g(x) − ∫a f (x) ⋅ g (x) dx . (A.13) Substitutionsregel Aus der Kettenregel der Ableitung folgt die Substitutionsregeln: g(b) b ′ ∫a f (g(x)) ⋅ g (x) dx = ∫g(a) f (t) dt und b ∫a f (x) dx = ∫ g‘−1(b) g −1 (a) f (g(s)) ⋅ g ′ (s) ds . (A.14) (A.15) A.4. Zusammenfassung wichtiger Funktionen f mit ihrer Ableitungsfunktion f ′ und einer Stammfunktion F 131 A.4 Zusammenfassung wichtiger Funktionen f mit ihrer Ableitungsfunktion f ′ und einer Stammfunktion F [Aus LSA, S. 329] 132 A. Voraussetzungen aus der Mittelschule A.5. Zusammenfassung Ableitungsregeln und Integrationsregeln A.5 Zusammenfassung Ableitungsregeln und Integrationsregeln [Aus LSA, S. 330] 133 134 A.6 A. Voraussetzungen aus der Mittelschule Formelsammlung A.6. Formelsammlung 135 136 A. Voraussetzungen aus der Mittelschule Anhang B Ergänzungen B.1 Die Betragsfunktion Die Betragsfunktion ∣ ∣ ∶ R Ð→ R ∶ x ↦ ∣x∣ ist gegeben durch ∣x∣ ∶= { ∶ x⩾0 ∶ x<0 x −x oder durch ∣x∣ = √ (B.1) x2 . Die Betragsfunktion hat unter anderem folgende Eigenschaften: Satz B.1 1. Es gilt die Dreiecksungleichung: ∣a∣ − ∣b∣ ⩽ ∣a + b∣ ⩽ ∣a∣ + ∣b∣ 2. Beweis 21 und ∣ab∣ = ∣a∣ ⋅ ∣b∣. 1. Wir zeigen zuerst ∣a + b∣ ⩽ ∣a∣ + ∣b∣. Da 2ab ⩽ 2∣a∣∣b∣ gilt auch a2 + 2ab + b2 ⩽ 2 2 a2 + 2∣a∣∣b∣ + b2 . Also gilt (a + b) ⩽ (∣a∣ + ∣b∣) , wenn wir die Quadratwurzel auch beiden Seiten der Ungleichung ziehen erhalten wir: ∣a + b∣ ⩽ ∣a∣ + ∣b∣. Jetzt zeigen wir ∣a∣−∣b∣ ⩽ ∣a+b∣. Die Ungleichheit, die wir gerade gezeigt haben, können 138 B. Ergänzungen wir anwenden: ∣a∣ = ∣a + b − b∣ ⩽ ∣a + b∣ + ∣ − b∣ = ∣a + b∣ + ∣b∣. Wenn wir ∣b∣ auf beiden Seiten dieser Ungleichung subtrahieren erhalten wir die gewünschte Formel. 2. Um diese Gleichheit zu beweisen brauchen wir die Definition (B.1) der Betragsfunktion und die Tatsache, dass die Quadratwurzel mit der Multiplikation kommutiert: √ √ √ √ ∣a∣∣b∣ = a2 ⋅ b2 = a2 ⋅ b2 = (ab)2 = ∣ab∣. B.1. Die Betragsfunktion 139 Summenregel Mit f und g ist auch ihre Summe f + g in x0 differenzierbar und es gilt: (f + g)′ (x0 ) = f ′ (x0 ) + g ′ (x0 ) (B.2) Faktorrelgel Mit f ist auch das Produkt c ⋅ f für c ∈ R in x0 differenzierbar und es gilt: (c ⋅ f )′ (x0 ) = c ⋅ f ′ (x0 ) (B.3) Produktregel Mit f und g ist auch das Produkt f ⋅ g in x0 differenzierbar und es gilt: (f ⋅ g)′ (x0 ) = f ′ (x0 ) ⋅ g(x0 ) + f (x0 ) ⋅ g ′ (x0 ) (B.4) Kettenregel Ist f in x0 und g in f (x0 ) differenzierbar, so ist auch Verkettung g ○ f in x0 differenzierbar und es gilt: (g ○ f )′ (x0 ) = g ′ (f (x0 )) ⋅ f ′ (x0 ) (B.5) Quotientenregel Falls g(x0 ) ≠ 0 so ist mit f und g auch ihr Quotient f g in x0 differenzierbar und es gilt: f f ′ (x0 ) ⋅ g(x0 ) − f (x0 ) ⋅ g ′ (x0 ) (x0 ) = g g(x0 )2 (B.6) Potenzregel Für f (x) = xr , r ∈ R und x > 0 gilt: f ′ (x) = rxr−1 (B.7) 140 B. Ergänzungen Trigonometrische Funktionen Für alle x ∈ R gilt: Für alle x ∈ Rgilt: sin′ (x) = cos(x) (B.8) cos′ (x) = sin(x) (B.9) Für alle x ∈ R ∖ { π2 + k ⋅ π ∣ k ∈ Z} gilt: tan′ (x) = 1 cos2 (x) = 1 + tan2 (x) (B.10) Für alle x ∈ R ∖ {k ⋅ π ∣ k ∈ Z} gilt: cot′ (x) = − 1 = −1 − cot2 (x) sin (x) 2 (B.11) Bibliographie [BHA 2010] A. Büchter & H. W. Henn, Elementare Analysis, Spektrum, 2010. [Cauchy 1836] A. L. Cauchy, Vorlesung ”uber die Differenzialrechnug, Braunschwieg, 1836. [DVA 2005] R. Danckwerts & D. Vogel, Elementare Analysis, Spektrum, 2005. [DVD 2010] R. Danckwerts & D. Vogel, Analysis verständlich unterrichten, Spektrum, 2010. [Dugac 1973] P. Dugac, Eléments d’analyse de Karl Weierstrass, Berlin, 1973. [Fundamentum] DMK & DPK, Fundamentum Mathematik und Physik, Formeln, Begriffe, Tabellen für die Sekundarstufe I und II, Orell Füssli, 2003. [HAG 2011] M. Huber & C. Albertini, Grundbegriffe der Mathematik, Skript zur gleichnamigen Vorlesung, 2011. [HA1 1986] H. Heuser, Lehrbuch der Analysis, Teil I, Teubner, 1986. [HA2 1986] H. Heuser, Lehrbuch der Analysis, Teil II, Teubner, 1986. [Klein 1928] A. L. Cauchy, Elementarmathematik vom höheren Standpunkt aus (3 Bände), Springer, 1928. [LSA 1999] A. Schmid& W. Schweizer, Analysis Leistungskurs, Gesamtausgabe, Klett, 1999. [SC 2010] G. Strang, Calculus, Wellesley-Cambridge Press, 2010. [PDSZ 2001] F. Padberg& R. Danckwerts & M. Stein, Zahlbereiche, Spektrum, 2001. [SSAA 2009] H. Scheid & W. Schwarz , Elemente der Linearen Algebra und der Analysis, Springer, 2009. [STO 2010] H. H. Storrer, Einführung in der mathematische Behandlung der Naturwissenschaften I, Birkhäuser, 2010. Sachregister Ableitung Umkehrfunktion, 85 Ableitungsfunktion, 54 absolute Änderung, 52 Approximation linear, 63 Archimedische Axiom, 14 arithmetische Folge, 125 Axiom archimedisch, 14 Axiom der Vollständigkeit, 19 Bedingungen Weierstrass, 61 Bernoulli Ungleichung, 9 beschränkt Folge, 12 Funktion, 47 Menge, 22 Cauchy Folge, 12 Definitionslücken, 28 dicht, 25, 26 Differentialquotient, 54 Differenzenquotient, 54 differenzierbar, 54 divergente Folge, 6 Dreiecksungleichung, 137 elementare Funktionen, 61 Eudoxus, 16 Satz des, 16 Eulersche Zahl, 124 Exponentialfunktion, 120 Extremalstelle global, 80 Extremum lokal, 80 Fassregel, 117 Kepler, 117 Fehlerrechnung, 68 Fibonacci Folge, 2 Flächeninhalt orientiert, 93 Folge, 1 beschränkt, 12 konsant, 10 arithmetisch, 125 Cauchy, 12 divergent, 6 Fibonacci, 2 geometrisch, 9, 11, 125 Graph, 3 harmonisch, 2 monoton fallend, 12 monoton wachsend, 12 streng monoton fallend, 12 streng monoton wachsend, 12 Funktion beschränkt, 47 Funktionen elementar, 61 geometrische Folge, 9, 11, 125 Konvergenz, 11 geometrische Reihe, 11 Konvergenz, 11 Glied einer Folge, 1 globale Extremalstelle, 80 globales Maximum, 80 globales Minimum, 80 Graph einer Folge, 3 Grenzwert, 33 uneigentlich, 39 SACHREGISTER 143 Grenzwert der Intervallschachtelung, 21 Grenzwert einer Funktion, 37 Obersumme, 104 orientiert Fläche, 111 harmonische Folge, 2 orientierte Fläche, 111 Hauptsatz der Differential- und Integralrech- orientierter Flächeninhalt, 93, 111 nung, 114 Satz, 114 Rechtecksregel, 116 reelle Funktionen, 27 Infimum, 23 Reihe, 10 Intervallschachtelung, 20 geometrisch, 11 irrationale Zahlen, 13 Kettenregel, 85 konstante Folge, 10 Konvergenz einer Folge, 4 lineare Approximation, 63 lineare Approximierung, 60 Logarithmus, 120 lokale Extremalstelle, 80 lokale Änderungsrate, 56 lokales Maximum, 80 lokales Minimum, 80 Maschenweite, 103 Maximum global, 80 lokal, 80 Menge beschränkt, 22 Minimum global, 80 lokal, 80 Mittelwertsatz, 83 Satz, 83 mittlere Änderungsrate, 52 monoton fallende Folge, 12 monoton wachsend, 75 monoton wachsende Folge, 12 Monotoniekriterium, 73, 75, 80 Schranke obere, 22 untere, 22 Schrankensatz, 82 Satz, 82 Sekante, 64, 80 Simpson-Regel, 120 Stammfunktion, 113 stetig, 69 streng monoton wachsende Folge, 12 Summenfolge, 10 Supremum, 22 Tangente, 64 Trapezregel, 116 Umgebung, 33 Umkehrfunktion, 85, 87 Ableitung, 87 uneigentliche Grenzwerte, 39 Ungleichung Bernoulli, 9 untere Schranke, 22 Untersumme, 104 vollständige Veränderung, 60 Vollständigkeit Axiom, 19 Vorzeichenwechsel, 90 n-te Glied einer Folge, 1 natürlicher Logarithmus, 120 Nullstellensatz, 43 Satz, 43 näherungsweise Berechnung, 68 Weierstrass, 60, 70 Bedingungen, 61 Satz, 70 Wertefolge, 37 obere Schranke, 22 Zahlenfolge, 1 144 Zerlegung, 103 Zerlegungsnullfolge, 104 Zwischenwertsatz von Bolzano, 42 Satz, 42 Änderung, absolute, 52 Änderungsrate, mittlere, 52 SACHREGISTER