Funktionen Chris Preston Sommersemester 2009 Skript ohne Beweise Inhaltsverzeichnis 1 Die rationalen Zahlen 3 2 Die reellen Zahlen 10 3 Stetige Funktionen 16 4 Differentiation 22 5 Mehr über die reellen Zahlen 26 6 Mehr über stetige Funktionen 30 7 Mehr über Differentiation 33 8 Integration von stetigen Funktionen 36 9 Die Funktionen log und exp 45 10 Trigonometrische Funktionen 47 11 Folgen 56 12 Unendliche Reihen 60 1 Die rationalen Zahlen In diesem Kapitel werden die rationalen Zahlen kurz diskutiert. Vorausgesetzt werden adäquate Kenntnisse über die ganzen Zahlen Z = {. . . , −2, −1, 0, 1, 2, . . .} sowie über die natürlichen Zahlen N = {0, 1, 2, . . .}. Wichtige Eigenschaften, die wir brauchen, sind: Sind m, n ∈ Z mit m 6= 0 und n 6= 0, so ist auch mn 6= 0. Es gilt 0n = n0 = 0 für alle n ∈ Z. Ist n ∈ Z mit n 6= 0, so ist genau eines von n und −n in N \ {0}. Eng verbunden mit den rationalen Zahlen sind ihre konkreten Manifestationen als Brüche (und in der Praxis ist die Rechnung mit rationalen Zahlen eigentlich Bruchrechnung.) Ein Bruch ist ein Ausdruck der Form m/n mit m, n ∈ Z und n 6= 0. Brüche kann man addieren und multiplizieren, wie man das in der Schule schon gelernt hat. Brüche sind keine rationalen Zahlen, sie werden aber verwendet, um rationale Zahlen darzustellen. Wir werden nicht explizit sagen, was rationale Zahlen sind, werden aber erklären, wie man sich diese anschaulich vorstellen kann. Dafür wird das Bild der Zahlengeraden verwendet. Die Zahlengerade ist eine in beiden Richtungen unendliche Gerade, auf der bestimmte Punkte mit Zahlen identifiziert sind. Zunächst werden die ganzen Zahlen in ihrer natürlichen Reihenfolge und mit den gleichem Abstand zwischen einer Zahl und der nächsten auf die Zahlengerade gelegt: −3 −2 −1 0 1 2 3 Die rationalen Zahlen füllen dann zu einem bestimmten Grad die Punkte auf der Zahlengeraden auf. Jeder Bruch beschreibt, wie ein Punkt auf der Zahlengeraden konstruiert werden kann, und die Punkte, die auf diese Weise entstehen, sind die rationalen Zahlen. Sei zunächst m/n ein Bruch mit n ∈ N \ {0}; dann wird die entsprechende rationale Zahl auf der Zahlengeraden durch das folgende Verfahren konstruiert: (1) Das Intervall zwischen 0 und 1 wird in n gleiche Teilintervalle geteilt und das erste, das 0 als linken Endpunkt hat, wird als Meß-Einheit benutzt. ↓ ↓ −2 −1 0 1 2 (In diesem Beispiel ist n = 5. Die Endpunkte des ersten Teilintervalls werden mit Pfeilen markiert.) (2) Ist m ∈ N \ {0}, so reihen wir m Kopien von der Meß-Einheit in der positiven Richtung aneinander. Das erste Intervall hat 0 als linken Endpunkt und der rechte 3 1 Die rationalen Zahlen 4 Endpunkt eines Intervalls ist der linke Endpunkt des nächsten Intervalls. Der rechte Endpunkt des letzten Intervalls ist dann die rationale Zahl, die durch den Bruch konstruiert wird. (Im folgenden Beispiel ist n = 5 und m = 8. Der konstruierte Punkt wird mit einem Pfeil markiert.) ↓ −2 −1 0 1 2 (3) Ist −m = p ∈ N \ {0}, so reihen wir p Kopien von der Meß-Einheit in der negativen Richtung aneinander. Das erste Intervall hat 0 als rechten Endpunkt und der linke Endpunkt eines Intervalls ist der rechte Endpunkt des nächsten Intervalls. Der linke Endpunkt des letzten Intervalls ist dann die rationale Zahl, die durch den Bruch konstruiert wird. (Im folgenden Beispiel ist n = 5 und m = −7. Der konstruierte Punkt wird mit einem Pfeil markiert.) ↓ −2 −1 0 1 2 (4) Ist m = 0, so ist der Nullpunkt 0 die rationale Zahl, der durch den Bruch konstruiert wird. ↓ −2 −1 0 1 2 Ist nun m/n ein Bruch mit −n ∈ N \ {0}, so konstruiert m/n die gleiche rationale Zahl wie den Bruch (−m)/(−n). Die rationale Zahl, die durch den Bruch m/n konstruiert wird, werden wir mit [m/n] bezeichnen. Insbesondere ist jede ganze Zahl eine rationale Zahl, und es gilt m = [m/1] für jedes m ∈ Z, d.h. der Bruch m/1 konstruiert die ganze Zahl m. Nun ist es möglich, dass zwei verschiedene Brüche die gleiche rationale Zahl konstruieren. Zum Beispiel ist [n/n] = [1/1] für alle n ∈ Z \ {0}. Um dieses Problem zu analysieren, brauchen wir zwei Beobachtungen, die anschaulich klar sein sollen: (1) Sind p, q, n ∈ Z mit n 6= 0, so gilt [p/n] = [q/n] genau dann, wenn p = q. (2) Es gilt [(mk)/(nk)] = [m/n] für alle m, n, k ∈ Z mit n 6= 0, k 6= 0 (und dann ist nk 6= 0). (Im folgenden Beispiel ist n = 5, m = 8 und k = 2. Unterhalb der Geraden wird die Konstruktion für den Bruch 8/5 und oberhalb der Geraden die Konstruktion für den Bruch 16/10 = (8 · 2)/(5 · 2) abgebildet.) 1 Die rationalen Zahlen 5 ↓ −2 −1 0 1 2 Lemma 1.1 Nehme an, dass (1) und (2) richtig sind und seien m/n, p/q zwei Brüche. Dann gilt [m/n] = [p/q] genau, wenn mq = pn. Wir sagen, dass Brüche m/n und p/q äquivalent sind und schreiben m/n ≈ p/q, wenn mq = pn. Also konstruieren zwei Brüche die gleiche rationale Zahl genau dann, wenn sie äquivalent sind. Aus der Tatsache, dass m/n ≈ p/q genau dann gilt, wenn [m/n] = [p/q], folgen drei Eigenschaften von der Relation ≈. Erstens gilt m/n ≈ m/n für jeden Bruch m/n, (da [m/n] = [m/n]), und zweitens gilt p/q ≈ m/n, wenn m/n ≈ p/q (da [p/q] = [m/n], falls [m/n] = [p/q]). Die dritte Eigenschaft ist: Sind m/n, p/q und r/s Brüche mit m/n ≈ p/q und p/q ≈ r/s, so ist auch m/n ≈ r/s. (Aus [m/n] = [p/q] und [p/q] = [r/s] folgt [m/n] = [r/s].) Die Herleitung dieser Eigenschaften benutzt Lemma 1.1 und hängt also von Aussagen über die Zahlengerade ab. Andererseits hat die Definition von ≈ selbst nichts mit der Zahlengeraden zu tun. Wie zeigen nun, dass die drei Eigenschaften direkt aus den Regeln für die Multiplikation in Z folgen. Lemma 1.2 (1) Es gilt m/n ≈ m/n für alle Brüche m/n. (2) Sind m/n und p/q Brüche mit m/n ≈ p/q, so ist p/q ≈ m/n. (3) Sind m/n, p/q und r/s Brüche mit m/n ≈ p/q und p/q ≈ r/s, so ist auch m/n ≈ r/s. Die folgenden Aussagen fassen die Beziehung zwischen Brüchen und rationalen Zahlen zusammen: (Q1) Jedem Bruch m/n wird eine rationale Zahl zugeordnet, die mit [m/n] bezeichnet wird. (Q2) Für Brüche m/n und p/q gilt [m/n] = [p/q] genau dann, wenn m/n ≈ p/q. (Q3) Zu jeder rationalen Zahl r gibt es einen Bruch m/n mit r = [m/n]. (Q4) Jede ganze Zahl ist auch eine rationale Zahl. (Q5) Für jedes n ∈ Z ist n = [n/1]. Sämtliche Eigenschaften von den rationalen Zahlen, mit denen wir uns im Rest des Kapitels befassen werden, folgen allein aus diesen fünf Aussagen. Man beachte, dass die Zahlengerade hier nicht mehr explizit vorkommt. 1 Die rationalen Zahlen 6 Die Menge der rationalen Zahlen wird mit Q bezeichnet. Nach (Q4) ist Z eine Teilmenge von Q. Ist r eine rationale Zahl und m/n ein Bruch mit r = [m/n], dann sagen wir, dass m/n die Zahl r darstellt oder dass r durch m/n dargestellt wird. Nach (Q3) läßt sich jede rationale Zahl durch einen Bruch darstellen, aber diese Darstellung ist nie eindeutig: Ist r eine rationale Zahl mit r = [m/n], so ist nach (Q2) auch r = [(mp)/(np)] für alle p ∈ Z \ {0}, da (mp)/(np) ≈ m/n. Lemma 1.3 (Existenz eines gemeinsamen Nenners) Seien r, s ∈ Q; dann gibt es ℓ, m, n ∈ Z mit n 6= 0, so dass r = [ℓ/n] und s = [m/n]. Wir werden nun die Addition und Multiplikation von rationalen Zahlen einführen. Dafür beginnen wir bei den Brüchen. Seien m/n und p/q Brüche; die Summe m/n+ p/q und das Produkt (m/n)(p/q) von m/n und p/q werden definiert durch m/n + p/q = (mq + pn)/(nq) , (m/n)(p/q) = (mp)/(nq) . Man beachte: Da n 6= 0, q 6= 0, ist auch nq 6= 0 und also sind (mq + pn)/(nq) und (mp)/(nq) auch Brüche. Lemma 1.4 Seien a/b, c/d, m/n, p/q Brüche mit a/b ≈ m/n und c/d ≈ p/q. Dann gilt a/b + c/d ≈ m/n + p/q und (a/b)(c/d) ≈ (m/n)(p/q). Seien r, s ∈ Q; nach (Q3) gibt es dann Brüche m/n und p/q mit r = [m/n] und s = [p/q]. Wir definieren die Summe r + s und das Produkt rs von r und s durch: r + s = [m/n + p/q] und rs = [(m/n)(p/q)] . Nach Lemma 1.4 macht dies einen Sinn: Sind a/b und c/d weitere Brüche mit r = [a/b] und s = [c/d], so gilt nach (Q2), dass a/b ≈ m/n und c/d ≈ p/q, damit ist nach Lemma 1.4 a/b + c/d ≈ m/n + p/q und (a/b)(c/d) ≈ (m/n)(p/q) und dann ist nach (Q2) [a/b + c/d] = [m/n + p/q] und [(a/b)(c/d)] = [(m/n)(p/q)]. Die Definitionen von r + s und rs hängen also nicht davon ab, welche Brüche man wählt, um r und s darzustellen. Seien m, n ∈ Z; da nach (Q5) m = [m/1] und n = [n/1], ist die Summe von m und n als rationale Zahlen gegeben durch [m/1] + [n/1] = [(m · 1 + n · 1)/(1 · 1)] = [(m + n)/1] = m + n . (Für die Multiplikation in Z gilt p · 1 = p für alle p ∈ Z.) Wenn man ganze Zahlen m und n addiert als rationale Zahlen, so ist ihre Summe m + n nichts anderes als 1 Die rationalen Zahlen 7 ihre Summe als ganze Zahlen. Genauso ist ihr Produkt mn als rationale Zahlen nichts anderes als ihr Produkt als ganze Zahlen, da [m/1][n/1] = [(mn)/(1 · 1)] = [(mn)/1] = mn . Wir untersuchen jetzt, welchen Regeln die Addition und die Multiplikation von rationalen Zahlen unterliegen. Zunächst aber brauchen wir einige Eigenschaften von der Addition und Multiplikation von Brüchen. Lemma 1.5 Für die Addition und Multiplikation von Brüchen gilt Folgendes: (a1) Für alle Brüche k/ℓ, m/n, p/q gilt (k/ℓ + m/n) + p/q = k/ℓ + (m/n + p/q) . (a2) Für alle Brüche m/n, p/q gilt m/n + p/q = p/q + m/n. (a3) Für jeden Bruch m/n ist 0/1 + m/n = m/n. (a4) Für jeden Bruch m/n ist (−m)/n + m/n = 0/(nn). (m1) Für alle Brüche k/ℓ, m/n, p/q gilt ((k/ℓ)(m/n))(p/q) = (k/ℓ)((m/n)(p/q)) . (m2) Für alle Brüche m/n, p/q gilt (m/n)(p/q) = (p/q)(m/n). (m3) Für jeden Bruch m/n ist (1/1)(m/n) = m/n. (d) Für alle Brüche k/ℓ, m/n, p/q gilt ((kℓ)/(ℓℓ))(m/n + p/q) = (k/ℓ)(m/n) + (k/ℓ)(p/q) . Lemma 1.6 Für einen Bruch m/n gilt [m/n] = 0 genau dann, wenn m = 0. Satz 1.1 Die Addition und Multiplikation von rationalen Zahlen unterliegen den folgenden Regeln: (A1) Für alle r, s, t ∈ Q gilt (r + s) + t = r + (s + t). (A2) Für alle r, s ∈ Q gilt r + s = s + r. (A3) Für alle r ∈ Q ist 0 + r = r, wobei 0 die Null in Z ist. (A4) Zu jedem r ∈ Q gibt es ein eindeutiges Element −r ∈ Q mit (−r) + r = 0. (M1) Für alle r, s, t ∈ Q gilt (rs)t = r(st). 1 Die rationalen Zahlen 8 (M2) Für alle r, s ∈ Q gilt rs = sr. (M3) Für alle r ∈ Q ist 1r = r, wobei 1 die Eins in Z ist. (M4) Zu jedem r ∈ Q mit r 6= 0 gibt es ein eindeutiges Element r −1 ∈ Q mit r −1 r = 1. (D) Für alle r, s, t ∈ Q ist r(s + t) = rs + rt. Lemma 1.7 Sei r ∈ Q und sei m/n ein Bruch mit r = [m/n]. (1) Es gilt −r = [(−m)/n]. (2) Ist r 6= 0 (und damit ist nach Lemma 1.6 m 6= 0), so ist r −1 = [n/m]. Sei n ∈ Z; dann gibt es eine eindeutige ganze Zahl −n ∈ Z, so dass −n + n = 0. Aber dann gilt ebenfalls −n+ n = 0 in Q und daraus folgt nach der Eindeutigkeit in Regel (A4) für Q, dass −n auch die eindeutige rationale Zahl ist mit −n+n = 0. Für eine ganze Zahl n gibt es also keine Zweideutigkeit mit der Bedeutung von −n. Sind r, s ∈ Q mit s 6= 0, so schreibt man oft r/s oder rs statt s−1 r. Insbesondere ist dann 1/s eine andere Schreibweise für s−1 (da 1/s = s−1 · 1 = s−1 ). Hier muss man aber aufpassen: Seien m, n ∈ Z mit n 6= 0; dann sind m und n rationale Zahlen und folglich gibt es die rationale Zahl n−1 m, die mit der neuen Schreibweise mit m/n bezeichnet wird. Andererseits bezeichnet m/n auch einen Bruch und in der Tat ist [m/n] = m/n, d.h. der Bruch m/n stellt die rationale Zahl m/n dar. (Setze r = [m/n]. Dann ist (n/1)(m/n) = (nm)/(1 · n) = (nm)/n ≈ m/1 und daraus ergibt sich nach (Q2), dass nr = [n/1][m/n] = [(n/1)(m/n)] = [m/1] = m , d.h. es gilt nr = m in Q und damit ist r = 1 · r = (n−1 n)r = n−1 (nr) = n−1 m. Folglich ist r = m/n.) Setze nun N× = N \ {0} und man beachte, dass für jedes n ∈ Z \ {0} genau eines der Zahlen n und −n in N× liegt. Wir brauchen folgende Verfeinerung von Lemma 1.3: Lemma 1.8 Seien r, s ∈ Q; dann gibt es ℓ, m ∈ Z und n ∈ N× , so dass r = [ℓ/n] und s = [m/n]. 1 Die rationalen Zahlen 9 Ein Spezialfall von Lemma 1.8 ist mit r = s: Für jedes r ∈ Q gibt es m ∈ Z und n ∈ N× , so dass r = [m/n]. (Es ist immer möglich, den Nenner aus N× zu wählen.) Lemma 1.9 Seien m/n und p/q Brüche mit n, q ∈ N× und m/n ≈ p/q. Dann gilt m ∈ N× genau, wenn p ∈ N× . Sei r ∈ Q \ {0}; nach dem Spezialfall von Lemma 1.8 gibt es einen Bruch m/n mit n ∈ N× , so dass r = [m/n] und nach Lemma 1.6 ist dann m 6= 0. Wir sagen, dass r positiv ist, wenn m ∈ N× . Nach Lemma 1.9 macht diese Definition einen Sinn: Ob r positiv ist, hängt nicht davon ab, welchen Bruch (mit Nenner aus N× ) man wählt, um r darzustellen. Anschaulich ist eine rationale Zahl positiv, wenn sie rechts von 0 auf der Zahlengeraden liegt. Da m = [m/1] für jedes m ∈ Z, ist eine ganze Zahl m positiv als rationale Zahl genau dann, wenn m ∈ N× . Satz 1.2 Für jedes r ∈ Q \ {0} ist genau eines von r und −r positiv. Satz 1.3 Für positive rationale Zahlen r, s sind r + s und rs ebenfalls positiv. 2 Die reellen Zahlen In diesem Abschnitt beschäftigen wir uns mit den reellen Zahlen. Wir werden aber hier nicht explizit sagen, was die reellen Zahlen sind, sondern zunächst nur überlegen, was wir von ihnen erwarten. Von den reellen Zahlen erwarten wir mindestens Folgendes: 1. Die reellen Zahlen R entstehen aus den rationalen Zahlen Q durch Hinzufügen von zusätzlichen Zahlen. Insbesondere ist jede rationale Zahl eine reelle Zahl; es gilt also Q ⊂ R. 2. Reelle Zahlen kann man addieren und multiplizieren und diese Operationen sind Erweiterungen der Addition und Multiplikation für rationale Zahlen: Wenn man rationale Zahlen r und s addiert als reelle Zahlen, so ist ihre Summe r + s nichts anderes als ihre Summe als rationale Zahlen. Genauso ist ihr Produkt rs als reelle Zahlen nichts anderes als ihr Produkt als rationale Zahlen. 3. Die Addition und Multiplikation von reellen Zahlen unterliegen den gleichen Regeln wie für die Addition und Multiplikation von rationalen Zahlen: (A1) Für alle x, y, z ∈ R gilt (x + y) + z = x + (y + z). (A2) Für alle x, y ∈ R gilt x + y = y + x. (A3) Für alle x ∈ R ist 0 + x = x, wobei 0 die Null in Q ist. (A4) Zu jedem x ∈ R gibt es ein eindeutiges Element −x ∈ R mit (−x) + x = 0. (M1) Für alle x, y, z ∈ R gilt (xy)z = x(yz). (M2) Für alle x, y ∈ R gilt xy = yx. (M3) Für alle x ∈ R ist 1x = x, wobei 1 die Eins in Q ist. (M4) Zu jedem x ∈ R mit x 6= 0 gibt es ein eindeutiges Element x−1 ∈ R mit x−1 x = 1. (D) Für alle x, y, z ∈ R ist x(y + z) = xy + xz. 4. Es gibt eine Menge von positiven reellen Zahlen, die eine Teilmenge von R\{0} ist und die folgenden Eigenschaften besitzt: (G1) Jede positive rationale Zahl ist auch eine positive reelle Zahl. (Die Menge der positiven reellen Zahlen enthält also die Menge der positiven rationalen Zahlen.) (G2) Für jedes x ∈ R \ {0} ist genau eines von x und −x positiv. (G3) Für positive reelle Zahlen x, y sind x + y und xy ebenfalls positiv. 10 2 Die reellen Zahlen 11 Eine Zahl x ∈ R \ {0} heißt negativ, wenn −x positiv ist. In diesem und auch in den nachfolgenden zwei Kapiteln werden keine weiteren Annahmen über die reellen Zahlen gemacht. Die Aussagen in diesen Kapiteln sind also nur solche, die stets gültig sind, sobald man annimmt, dass die reellen Zahlen die Eigenschaften 1, 2, 3 und 4 besitzen. Da aber 1, 2, 3 und 4 ebenfalls Eigenschaften von Q sind, sind diese alle Aussagen, die eigentlich nicht zwischen Q und R unterscheiden. Erst im Kapitel 5 werden wir nochmal überlegen, was zusätzlich von den reellen Zahlen verlangt werden soll. Sei r ∈ Q; nach (A4) für Q gibt es dann ein eindeutiges Element −r ∈ Q, so dass (−r) + r = 0 und daraus folgt aus der Eindeutigkeit in (A4) für R, dass −r auch die eindeutige reelle Zahl ist mit (−r) + r = 0. Ist r ∈ Q \ {0}, dann gibt es genauso ein eindeutiges Element r −1 ∈ Q, so dass r −1r = 1 und daraus folgt aus der Eindeutigkeit in (M4) für R, dass r −1 auch die eindeutige reelle Zahl ist mit r −1 r = 1. Lemma 2.1 (1) Es gilt −0 = 0. (2) Für alle x, y ∈ R gilt −(x + y) = −x + −y. (3) Es gilt −(−x) = x für alle x ∈ R. (4) Für alle x, y ∈ R gilt −x = −y genau dann, wenn x = y. (5) Für alle x ∈ R mit x 6= 0 ist −x 6= 0. Lemma 2.2 (Kürzungsregeln) (1) Aus z + x = z + y folgt x = y. (2) Aus x + z = y + z folgt x = y. Lemma 2.3 (1) Für alle x, y, z ∈ R ist (x + y)z = xz + yz. (2) Für alle x, y, u, v ∈ R ist (x + y)(u + v) = xu + (xv + (yu + yv)). Sind x, y ∈ R, so wird die Zahl x + −y meistens mit x − y bezeichnet. Sind insbesondere r, s ∈ Q, so ist r − s ∈ Q, da −s ∈ Q. Lemma 2.4 Seien x, y ∈ R; dann ist x − y die eindeutige Zahl z ∈ R mit x = y + z: Es gilt also x = y + (x − y) und ist z ∈ R eine Zahl mit x = y + z, so ist z = x − y. Ferner ist x − y = 0 genau dann, wenn x = y. 2 Die reellen Zahlen 12 Lemma 2.5 (1) Es gilt x − 0 = x und 0 − x = −x für alle x ∈ R. (2) Für alle x, y ∈ R ist y − x = −(x − y) und auch y − x = −x − (−y). (3) Für alle x, y, z ∈ R ist x − z = (x − y) + (y − z). (4) Für alle x, y, u, v ∈ R ist (y + v) − (x + u) = (y − x) + (v − u). (5) Für alle x, y, u, v ∈ R ist yv − xu = x(v − u) + (y − x)v. Lemma 2.6 Es gilt x0 = 0x = 0 für alle x ∈ R. Satz 2.1 (1) Es gilt (−x)y = −(xy) = x(−y) für alle x, y ∈ R. (2) Für alle x, y ∈ R gilt (−x)(−y) = xy. Satz 2.2 Seien x, y ∈ R mit x 6= 0 und y 6= 0. Dann ist xy 6= 0. Lemma 2.7 Für alle x, y, z ∈ R ist z(x − y) = zx − zy. Lemma 2.8 (Kürzungsregeln) (1) Ist z 6= 0, so folgt x = y aus zx = zy. (2) Ist z 6= 0, so folgt x = y aus xz = yz. Sind x, y ∈ R mit y 6= 0, so schreibt man oft x/y oder ist dann 1/y eine andere Schreibweise für y −1. x y statt xy −1. Insbesondere Im Folgenden betrachten wir nun die Kleiner-Relation auf R. Lemma 2.9 Wenn man eine rationale Zahl als reelle Zahl betrachtet, so ist sie eine positive reelle Zahl genau dann, wenn sie eine positive rationale Zahl ist. Seien x, y ∈ R; wir schreiben x < y, wenn y − x positiv ist und sagen, dass x kleiner ist als y. Man beachte (und dies ist sehr wichtig): Sind r, s ∈ Q, so gilt r < s als reelle Zahlen genau dann, wenn r < s als rationale Zahlen gilt. (Dies folgt aus Lemma 2.9, da die Differenz s − r eine rationale Zahl ist.) Gilt x < y, so schreibt man auch y > x und sagt, dass y größer ist als x. Lemma 2.10 Es gilt x > 0 (d.h. 0 < x) genau dann, wenn x positiv ist. 2 Die reellen Zahlen 13 Nach Lemma 2.10 sind die Aussagen x ist positiv“ und x > 0“ äquivalent. Im ” ” Folgenden werden wir meistens die Letztere verwenden. (In der Tat schreibt man x > 0“ aber sagt x ist positiv“.) Insbesondere gilt x > y genau dann, wenn ” ” x − y > 0. Satz 2.3 (Trichotomie) Für alle x, y ∈ R gilt genau eine der Aussagen: (1) Die Zahlen x und y sind gleich: Es gilt x = y. (2) x ist kleiner als y: Es gilt x < y. (3) y ist kleiner als x: Es gilt y < x. Satz 2.4 (1) Sind x, y, z ∈ R mit x < y und y < z, so ist x < z. (2) Sind x, y ∈ R mit x < y, so ist x + z < y + z für alle z ∈ R. (3) Sind x, y, u, v ∈ R mit x < y und u < v, so ist x + u < y + v. (4) Sind x, y ∈ R mit x < y, so ist −y < −z. Es ist nützlich, nicht nur die Kleiner-Relation, sondern auch die Kleiner-gleichRelation zur Verfügung zu haben. Seien x, y ∈ R; wir schreiben x ≤ y, wenn entweder x < y oder x = y und sagen, dass x kleiner gleich y ist. Man kann hier auch y ≥ x schreiben und sagen, dass y größer gleich x ist. Satz 2.5 (1) Für alle x, y ∈ R gilt x ≤ y oder y ≤ x. (2) Es gilt x ≤ y und y ≤ x genau dann, wenn x = y. (3) Sind x, y, z ∈ R mit x ≤ y und y ≤ z, so ist x ≤ z. Ferner ist x = z genau dann, wenn x = y und y = z. (4) Sind x, y, u, v ∈ R mit x ≤ y und u ≤ v, so ist x + u ≤ y + v. Ferner ist x + u = y + v genau dann, wenn x = y und u = v. (5) Sind x, y ∈ R mit x ≤ y, so ist −y ≤ −x. Seien x, y ∈ R; nach Lemma 2.4 und Lemma 2.10 gilt x ≥ y genau dann, wenn x − y ≥ 0. Setze R+ = {x ∈ R : x ≥ 0}. Lemma 2.11 Seien x, y ∈ R+ ; dann ist x + y ∈ R+ und xy ∈ R+ . Ferner ist x + y = 0 genau dann, wenn y = 0 und y = 0. 2 Die reellen Zahlen 14 Satz 2.6 (1) Sind x, y, u, v ∈ R+ mit x ≤ y und u ≤ v, so ist xu ≤ yv. Ist ferner x > 0 und u > 0, so gilt xu = yv genau dann, wenn x = y und u = v. (2) Für jedes x ∈ R \ {0} ist xx > 0. (3) Ist x ∈ R mit x > 0, so ist auch x−1 > 0. (4) Sind x, y ∈ R mit x > 0, y > 0 und x < y, so ist y −1 < x−1 . Für jedes x ∈ R sei der (Absolut)-Betrag |x| von x definiert durch |x| = x , falls x ≥ 0, −x , falls x < 0. Satz 2.7 Der Absolut-Betrag hat folgende Eigenschaften: (1) Für jedes x ∈ R ist |x| ≥ 0 und |x| = 0 gilt genau dann, wenn x = 0. (2) Für alle x, y ∈ R ist |xy| = |x||y|. Insbesondere ist |−x| = |x|. (3) Für alle x, y ∈ R ist |x + y| ≤ |x| + |y| (Dreiecksungleichung). (4) Für alle x, y ∈ R ist ||x| −|y|| ≤ |x−y| (Umgekehrte Dreiecksungleichung). Seien a, b, c ∈ R. Die Aussage a < b < c ist lediglich eine kurze Schreibweise für die Aussage: a < b und b < c. Genauso verwendet man ähnliche Abkürzungen wie a < b ≤ c, a ≤ b < c und a ≤ b ≤ c. Lemma 2.12 Sei b ∈ R mit b > 0 und sei c ∈ R. (1) Es gilt |c| = b genau dann, wenn c = −b oder c = b. (2) Es gilt |c| < b genau dann, wenn −b < c < b. (3) Es gilt |c| ≤ b genau dann, wenn −b ≤ c ≤ b. Satz 2.8 Seien a, b ∈ R mit b > 0 und sei x ∈ R. (1) Es gilt |x − a| = b genau dann, wenn x = a − b oder x = a + b. (2) Es gilt |x − a| < b genau dann, wenn a − b < x < a + b. (3) Es gilt |x − a| ≤ b genau dann, wenn a − b ≤ x ≤ a + b. 2 Die reellen Zahlen 15 Sei N eine nichtleere endliche Teilmenge von R; dann enthält N ein größtes Element, d.h., ein Element x ∈ N mit x ≥ y für jedes y ∈ N, sowie ein kleinstes Element, d.h., ein Element x′ ∈ N mit x′ ≤ y für jedes y ∈ N. Diese Zahlen werden mit max N und min N bezeichnet. (Die Existenz von max N und min N kann durch vollständige Induktion nach der Anzahl der Elemente in N gezeigt werden.) Für N = {x1 , x2 } gilt offensichtlich x1 falls x1 ≥ x2 , x1 falls x1 ≤ x2 , max{x1 , x2 } = und min{x1 , x2 } = x2 falls x1 < x2 x2 falls x1 > x2 . Für a, b ∈ R mit a < b setze [a, b] = {x ∈ R : a ≤ x ≤ b}, (a, b) = {x ∈ R : a < x < b}, (a, b] = {x ∈ R : a < x ≤ b}, [a, b) = {x ∈ R : a ≤ x < b}, und für a, b ∈ R sei [a, +∞) = {x ∈ R : a ≤ x}, (a, +∞) = {x ∈ R : a < x}, (−∞, b] = {x ∈ R : x ≤ b}, (−∞, b) = {x ∈ R : x < b}. Eine Teilmenge von R, die eine dieser Formen hat, heißt Intervall; auch R wird als Intervall betrachtet. Jedes Intervall I hat die folgende Eigenschaft: Sind c, d ∈ I mit c < d, so ist x ∈ I für jedes x ∈ R mit c < x < d. 3 Stetige Funktionen Sei A eine nichtleere Teilmenge von R. Eine Abbildung oder eine Funktion f von A nach R ist eine Vorschrift, die jedem Element von A genau ein Element von R zuordnet. Das dem Element x ∈ A zugeordnete Element von R wird mit f (x) bezeichnet. (Die Wörter Funktion und Abbildung haben die gleiche Bedeutung; wir verwenden aber meistens das Wort Abbildung.) Man schreibt f : A → R um zu zeigen, dass f eine Abbildung von A nach R ist; die Menge A heißt Definitionsbereich von f . Für jede Teilmenge B von A wird {y ∈ R : es gibt ein x ∈ B mit y = f (x)} mit f (B) bezeichnet. Die Menge f (A) heißt das Bild von f . Zwei Abbildungen f, g : A → R sind per Definition gleich, wenn f (x) = g(x) für jedes x ∈ A. Ist A eine nichtleere Teilmenge von R, sind f, g : A → R Abbildungen und ist c ∈ R, so werden Abbildungen f + g, f g und cf von A nach R definiert durch (f + g)(x) = f (x) + g(x), (f g)(x) = f (x)g(x) und (cf )(x) = cf (x) für jedes x ∈ A. Ist ferner f (x) 6= 0 für alle x ∈ A, so wird auch eine Abbildung 1/f : A → R definiert durch (1/f )(x) = 1/f (x) für jedes x ∈ A. Beispiele: (1) Seien f, g : R → R die Abbildungen mit f (x) = 3x2 + 4x + 3 und g(x) = x3 + 3x für alle x ∈ R. Dann ist f + g : R → R die Abbildung mit (f + g)(x) = f (x) + g(x) = (3x2 + 4x + 3) + (x3 + 3x) = x3 + 3x2 + 7x + 3 für alle x ∈ R. Ferner ist f g : R → R die Abbildung mit (f g)(x) = f (x)g(x) = (3x2 + 4x + 3)(x3 + 3x) = 3x5 + 4x4 + 12x3 + 12x2 + 9x für alle x ∈ R. (2) Sei A = R \ {−1, 1} und sei f : A → R die Abbildung mit f (x) = x2 − 1. Dann ist f (x) 6= 0 für alle x ∈ A und 1/f : A → R ist die Abbildung mit (1/f )(x) = 1/f (x) = 1 1 = x2 − 1 (x − 1)(x + 1) für alle x ∈ A. Seien A, B nichtleere Teilmengen von R und seien f : A → R und g : B → R Abbildungen mit f (x) ∈ B für alle x ∈ A (d.h. mit f (A) ⊂ B). Dann gibt es die Abbildung g ◦ f : A → R, die definiert ist durch (g ◦ f )(x) = g(f (x)) 16 3 Stetige Funktionen 17 für alle x ∈ A. Diese Abbildung heißt die Komposition oder Zusammensetzung von f und g. Beispiele: (1) Seien f, g : R → R wieder die Abbildungen mit f (x) = 3x2 +4x+3 und g(y) = y 3 + 3y für alle x, y ∈ R. Dann ist g ◦ f : R → R die Abbildung mit (g ◦ f )(x) = g(f (x)) = g(3x2 + 4x + 3) = (3x2 + 4x + 3)3 + 3(3x2 + 4x + 3) für alle x ∈ R. (2) Seien A = (0, 1), B = {y ∈ R : y > 1} und seien f : A → R und g : B → R die Abbildungen mit f (x) = 1/x2 und g(y) = 1/y 3 für alle x ∈ A, y ∈ B. Dann gilt f (x) ∈ B für alle x ∈ A und g ◦ f : A → R ist die Abbildung mit (g ◦ f )(x) = g(f (x)) = g(1/x2) = 1 = x6 2 3 (1/x ) für alle x ∈ A. Ist f : A → R eine Abbildung und B eine nichtleere Teilmenge von A, so ist die Einschränkung von f auf B die Abbildung f|B : B → R, die definiert ist durch f|B (x) = f (x) für alle x ∈ B. Beispiel: Sei f : R → R die Abbildung mit f (x) = x2 − 1 für alle x ∈ R und sei B = R \ {−1, 1}. Dann ist f|B : B → R die Abbildung mit f|B (x) = x2 − 1 für alle x ∈ B. Man beachte: Es gilt f|B (x) 6= 0 für alle x ∈ B und also gibt es die Abbildung 1/f|B : B → R. Andererseits ist die Abbildung 1/f : R → R nicht definiert, da f (−1) = f (1) = 0. Man hat wahrscheinlich eine relativ gute intuitive Vorstellung, was Stetigkeit für eine Abbildung bedeutet und kennt einige Folgerungen aus dieser Eigenschaft (zum Beispiel im Zusammenhang mit Kurvendiskussion). Mit nur einer intuitiven Vorstellung kommt man aber nicht viel weiter und in diesem Kapitel lernen wir eine sehr präzise Definition von Stetigkeit kennen, die die Grundlage für alles bildet, das später kommt. Im Folgenden sei A eine nichtleere Teilmenge von R. Eine Abbildung f : A → R heißt an einer Stelle a ∈ A stetig, wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass |f (x) − f (a)| < ε für alle x ∈ A mit |x − a| < δ. Nach Satz 2.8 (2) gilt |x − a| < δ genau dann, wenn x ∈ (a − δ, a + δ). Also ist f genau dann an der Stelle a stetig, wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass f (x) im Intervall (f (a) − ε, f (a) + ε) liegt für alle x ∈ A, die im Intervall (x − δ, x + δ) liegen. Die Abbildung f : A → R heißt stetig, wenn sie an jeder Stelle x ∈ A stetig ist. Beispiele: (1) Die durch id(x) = x definierte Identitätsabbildung id : R → R ist stetig: Sei a ∈ R und ε > 0; wähle δ = ε. Für x ∈ R mit |x − a| < δ ist 3 Stetige Funktionen 18 |id(x) − id(a)| = |x − a| < δ = ε, d.h. |id(x) − id(a)| < ε für alle x ∈ R mit |x − a| < δ. Folglich ist id an der Stelle a stetig, und da dies für jedes a ∈ R richtig ist, ist die Abbildung id stetig. (2) Jede konstante Abbildung kb : R → R mit kb (x) = b für alle x ∈ R ist stetig: Sei a ∈ R und ε > 0; wähle δ = 1. Für x ∈ R mit |x − a| < δ ist |kb (x) − kb (a)| = |b − b| = 0 < ε, d.h. |kb (x) − kb (a)| < ε für alle x ∈ R mit |x − a| < δ. Folglich ist kb an der Stelle a stetig, und da dies für jedes a ∈ R richtig ist, ist die Abbildung kb stetig. (3) Die Abbildung | · | : R → R ist stetig: Sei a ∈ R und ε > 0; wähle δ = ε. Für x ∈ R mit |x − a| < δ ist nach Satz 2.7 (4) ||x| − |a|| ≤ |x − a| < δ = ε, d.h. ||x| − |a|| < ε für alle x ∈ R mit |x − a| < δ. Folglich ist | · | an der Stelle a stetig, und da dies für jedes a ∈ R richtig ist, ist die Abbildung | · | stetig. (4) Seien c, d ∈ R mit c < d, und sei f : [c, d] → R definiert durch f (x) = 5x2 für alle x ∈ [c, d]. Dann ist f stetig: Setze M = max{|c|, |d|} und sei a ∈ [c, d]; für alle x ∈ [c, d] gilt dann |f (x) − f (a)| = |5x2 − 5a2 | = |5(x + a)(x − a)| = 5|x + a||x − a| ≤ 5(|x| + |a|)|x − a| ≤ 5(M + M)|x − a| = 10M|x − a| . Sei nun ε > 0 und wähle δ = ε/(10M). Für all x ∈ [c, d] mit |x − a| < δ ist dann |f (x) − f (a)| ≤ 10M|x − a| < 10Mδ = ε , d.h. |f (x) − f (a)| < ε für alle x ∈ [c, d] mit |x − a| < δ. Folglich ist f an der Stelle a stetig, und da dies für jedes a ∈ [c, d] richtig ist, ist die Abbildung f stetig. Bemerkung: Im Beispiel 4 haben wir die folgende nützliche Tatsache benutzt (die man merken soll): Seien c, d ∈ R mit c < d und setze M = max{|c|, |d|}; dann ist |x| ≤ M für alle x ∈ [c, d]. (Ist x ≥ 0, so ist 0 ≤ x ≤ d und damit |x| = x ≤ d = |d| ≤ M. Ist andererseits x < 0, so ist c ≤ x < 0 und in diesem Fall ist |x| = −x ≤ −c = |c| ≤ M. In beiden Fällen ist also |x| ≤ M.) Was bedeutet, dass f an der Stelle a nicht stetig ist? Es bedeutet natürlich, dass es nicht zu jedem ε > 0 ein δ > 0 gibt, so dass |f (x) − f (a)| < ε für alle x ∈ A mit |x − a| < δ. Also ist f an der Stelle a nicht stetig genau dann, wenn es ein ε > 0 gibt, so dass man für jedes δ > 0 ein x ∈ A mit |x − a| < δ finden kann, so dass |f (x) − f (a)| ≥ ε. Sei a ∈ R und sei ja : R → R die Abbildung mit 0 falls x < a , ja (x) = 1 falls x ≥ a . Die Abbildung ja ist nicht stetig an der Stelle a: Für jedes δ > 0 setze aδ = a− 12 δ. Also ist |aδ − a| = 12 δ < δ aber |ja (aδ ) − ja (a)| = |0 − 1| = 1. Für jedes δ > 0 gibt 3 Stetige Funktionen 19 es also ein x ∈ R mit |x − a| < δ, so dass |f (x) − f (a)| ≥ 1. Damit ist ja nicht stetig an der Stelle a (und hier haben wir ε = 1 genommen). Die wichtigsten Eigenschaften von stetigen Abbildungen werden in den folgenden Sätzen präsentiert. Satz 3.1 (1) Sei f : A → R eine Abbildung und B eine nichtleere Teilmenge von A. Ist f an der Stelle a ∈ B stetig, so ist es auch die Einschränkung f|B . (2) Sei f : A → R eine Abbildung, seien c, d ∈ R mit c < d und setze B = A ∩ [c, d] = {x ∈ A : c ≤ x ≤ d} . Sei ferner a ∈ A mit c < a < d (und also ist a ∈ B). Ist die Einschänkung f|B an der Stelle a stetig, so ist f ebenfalls an der Stelle a stetig. Beispiele: (5) Sei f : R → R definiert durch f (x) = 5x2 für alle x ∈ R. Dann ist die Abbildung f stetig: Sei a ∈ R und setzte c = a − 1, d = a + 1; im Beispiel 4 haben wir gezeigt, dass die Einschränkung f|[c,d] von f auf [c, d] stetig ist und insbesondere ist f|[c,d] an der Stelle a stetig. Nun ist c < a < d und daraus ergibt sich nach Satz 3.1 (2), dass auch f an der Stelle a stetig ist. Da dies für jedes a ∈ R richtig ist, ist die Abbildung f stetig. (6) Sei f : I → R eine stetige Abbildung, wobei I ein unbeschränktes Intervall ist (wie R oder {x ∈ R : x > 0}). Wenn man zeigen will (oder muss), dass f an der Stelle a ∈ I stetig ist, so kann man meistens wie in (5) verfahren: Wähle c, d ∈ I mit c < a < d und sei g = f|[c,d] die Einschränkung von f auf [c, d]. Wenn man zeigen kann, dass die Einschänkung g an der Stelle a stetig ist, so ist nach Satz 3.1 (2) auch f an der Stelle a stetig. Es reicht also zu zeigen, dass g stetig ist und dafür wird ein B > 0 (in Abhängigkeit von c, d und f ) gesucht, so dass |f (x) − f (y)| ≤ B|x − y| für alle x, y ∈ [c, d] gilt. Wenn man ein solches B findet, so ist es leicht zu zeigen, dass g an der Stelle a stetig ist für jedes a ∈ [c, d]: Sei ε > 0 und setze δ = ε/B. Ist x ∈ [c, d] mit |x − a| < δ, so ist |g(x) − g(a)| = |f (x) − f (a)| ≤ B|x − a| < Bδ = ε , d.h. |g(x) − g(a)| < ε für alle x ∈ [c, d] mit |x − a| < δ. Dies zeigt, dass g an der Stelle a stetig ist. Lemma 3.1 Sei f : A → R eine Abbildung, die an der Stelle a ∈ A stetig ist. Dann gibt es δ > 0 und c ≥ 0, so dass |f (x)| ≤ c für alle x ∈ A mit |x − a| < δ. 3 Stetige Funktionen 20 Satz 3.2 Seien f, g : A → R Abbildungen, die beide an der Stelle a ∈ A stetig sind. (1) Für alle b, c ∈ R ist die Abbildung bf + cg an der Stelle a stetig. (2) Die Abbildung f g ist an der Stelle a stetig. (3) Nehme an, dass f (x) 6= 0 für alle x ∈ A. Dann ist die Abbildung 1/f an der Stelle a stetig. Für jedes x ∈ R und jedes n ∈ N wird ein Element xn von R definiert durch: x0 = 1, x1 = x und (für n > 1) xn = xxn−1 . Satz 3.3 Seien b0 , . . . , bm , c0 , . . . , cn ∈ R mit c0 + c1 x + · · · + cn xn 6= 0 für alle x ∈ A (und mit m, n ∈ N). Dann ist die Abbildung f : A → R stetig, wobei f (x) = b0 + b1 x + · · · + bm xm c0 + c1 x + · · · + cn xn für alle x ∈ A. Satz 3.4 Sei B eine nichtleere Teilmenge von R und seien f : A → R und g : B → R Abbildungen mit f (A) ⊂ B. Ist f an der Stelle a ∈ A und g an der Stelle f (a) ∈ B stetig, so ist die zusammengesetzte Abbildung g ◦ f : A → R an der Stelle a stetig. Lemma 3.2 Sei f : A → R eine Abbildung, die an der Stelle a ∈ A stetig ist. (1) Gibt es ein δ > 0, so dass (a − δ, a) ⊂ A und f (x) ≥ 0 (bzw. f (x) ≤ 0) für alle x ∈ (a − δ, a), so ist f (a) ≥ 0 (bzw. f (a) ≤ 0). (2) Gibt es ein δ > 0, so dass (a, a + δ) ⊂ A und f (x) ≥ 0 (bzw. f (x) ≤ 0) für alle x ∈ (a, a + δ), so ist f (a) ≥ 0 (bzw. f (a) ≤ 0). Wir bereiten nun die Definition von Differenzierbarkeit im nächsten Kapitel vor. Ist I ein Intervall, so bezeichnet I ◦ die Menge I ohne ihre Endpunkte (falls sie Endpunkte hat). Ist a < b und ist I eines der Intervalle [a, b], (a, b], [a, b) und (a, b), so ist I ◦ = (a, b). Ist I eines der Intervalle [a, ∞) und (a, ∞) (bzw. (−∞, b] und (−∞, b)), so ist I ◦ = (a, ∞) (bzw. I ◦ = (−∞, b)). Schließlich ist R◦ = R. Also ist I ◦ stets ein Intervall und für jedes a ∈ I ◦ gibt es ein δ > 0, so dass (a − δ, a + δ) ⊂ I ◦ . Im Folgenden sei I ein Intervall. 3 Stetige Funktionen 21 Lemma 3.3 Sei a ∈ I ◦ ; dann ist die Menge {x ∈ I : 0 < |x − a| < δ} nichtleer für jedes δ > 0. Sei nun a ∈ I ◦ und sei g : I \ {a} → R eine Abbildung. Ist h : I → R eine Abbildung mit h(x) = g(x) für alle x ∈ I \ {a}, so ist h(a) der einzige Wert, der nicht schon durch g festgelegt worden ist. Satz 3.5 Es gibt höchstens eine Abbildung h : I → R, die an der Stelle a stetig ist und mit h(x) = g(x) für alle x ∈ I \ {a}. Beispiele: (1) Sei a ∈ R und sei g : R \ {a} → R die Abbildung mit −1 falls x < a , g(x) = 1 falls x > a . Sei h : R → R eine Abbildung mit h(x) = g(x) für alle x ∈ R \ {a}. Dann kann h nicht stetig sein an der Stelle a. (Für jedes δ > 0 setze aδ = a − 21 δ und a′δ = a + 12 δ. Also ist |aδ − a| = 12 δ < δ und genauso ist |a′δ − a| < δ. Aber |h(aδ ) − h(a)| = | − 1 − h(a)| = |1 + h(a)| und |h(a′δ ) − h(a)| = |1 − h(a)|, und mindestens eines von |1 + h(a)| und |1 − h(a)| ist größer gleich 1. Für jedes δ > 0 gibt es also ein x ∈ R mit |x − a| < δ, so dass |h(x) − h(a)| ≥ 1. Damit ist h nicht stetig an der Stelle a.) (2) Sei a ∈ R und sei g : R \ {a} → R die Abbildung mit g(x) = x2 für alle x ∈ R \ {a}. Dann ist g(x) = h(x) für alle x ∈ R \ {a}, wobei h : R → R definiert ist durch h(x) = x2 für alle x ∈ R. Da h an der Stelle a stetig ist, ist nach Satz 3.5 h die eindeutige Abbildung, die an der Stelle a stetig ist und mit h(x) = g(x) für alle x ∈ R \ {a}. 4 Differentiation Im Folgenden sei I stets ein Intervall und sei I ◦ wieder die Menge I ohne ihre Endpunkte. Für eine Abbildung f : I → R und a ∈ I ◦ definiere eine Abbildung ∆af : I \ {a} → R durch f (x) − f (a) . ∆af (x) = x−a Dann heißt f in a differenzierbar, wenn es eine Abbildung h : I → R gibt, die an der Stelle a stetig ist und mit ∆af (x) = h(x) für alle x ∈ I \ {a}. In diesem Fall ist nach Satz 3.5 die Abbildung h eindeutig durch ∆af bestimmt; den Wert h(a) nennen wir die Ableitung von f in a. Diese Ableitung wird mit f ′ (a) bezeichnet. Beispiele: (1) Für jedes c ∈ R ist die konstante Abbildung kc : R → R (mit kc (x) = c für alle x ∈ R) in jedem Punkt a ∈ R differenzierbar und es gilt k′c (a) = 0: Für x ∈ R \ {a} ist ∆akc (x) = kc (x) − kc (a) c−c = =0 x−a x−a und damit ist ∆akc (x) = k0 (x) für alle x ∈ R\{a}. Aber die Abbildung k0 ist stetig an der Stelle a und daraus folgt, dass kc in a differenzierbar mit k′c (a) = k0 (a) = 0. (2) Die Identitätsabbildung id : R → R (mit id(x) = x für alle x ∈ R) ist in jedem Punkt a ∈ R differenzierbar mit id′ (a) = 1: Für x ∈ R \ {a} ist ∆aid (x) = id(x) − id(a) x−a = =1 x−a x−a und damit ist ∆aid (x) = k1 (x) für alle x ∈ R\{a}. Aber die Abbildung k1 ist stetig an der Stelle a und daraus folgt, dass id in a differenzierbar mit id′ (a) = k1 (a) = 1. (3) Die Abbildung f : R → R mit f (x) = 5x2 für alle x ∈ R ist in jedem Punkt a ∈ R differenzierbar mit f ′ (a) = 10a: Für x ∈ R \ {a} ist ∆af (x) = 5x2 − 5a2 (x − a)(x + a) f (x) − f (a) = =5 = 5(x + a) x−a x−a x−a und damit ist ∆af (x) = h(x) für alle x ∈ R \ {a}, wobei h : R → R die durch h(x) = 5(x + a) für alle x ∈ R definierte Abbildung ist. Aber die Abbildung h ist stetig an der Stelle a und daraus folgt, dass f in a differenzierbar mit f ′ (a) = h(a) = 5(a + a) = 10a. (4) Die (stetige) Abbildung | · | : R → R ist nicht differenzierbar in 0: Für alle x ∈ R \ {0} gilt |x| |x| − |0| −1 falls x < 0 , 0 = = ∆|·| (x) = 1 falls x > 0 , x−0 x 22 4 Differentiation 23 und es gibt keine Abbildung h : R → R, die an der Stelle 0 stetig ist und mit ∆af (x) = h(x) für alle x ∈ R \ {0}. Ist f in a ∈ I ◦ differenzierbar, so gibt es eine eindeutige Abbildung h, die an der Stelle a stetig ist und mit ∆af (x) = h(x) für alle x ∈ I \ {a}. Diese Abbildung h wird mit ∆af bezeichnet. Insbesondere ist f ′ (a) = ∆af (a). Satz 4.1 Sei J ⊂ I ein Intervall, sei a ∈ J ◦ und sei f : I → R eine Abbildung, die in a differenzierbar ist. Dann ist die Einschränkung f|J von f auf J auch in a differenzierbar und f|J′ (a) = f ′ (a). Lemma 4.1 Sei f : I → R in a ∈ I ◦ differenzierbar. Dann gilt f (x) = f (a) + (x − a)∆fa (x) für alle x ∈ I. Satz 4.2 Eine Abbildung, die in a differenzierbar ist, ist an der Stelle a stetig. Satz 4.3 Seien f, g : I → R Abbildungen, die beide in a ∈ I ◦ differenzierbar sind. (1) Für alle b, c ∈ R ist die Abbildung bf + cg in a differenzierbar, und es gilt (bf + cg)′ (a) = bf ′ (a) + cg ′(a) . (2) Die Abbildung f g ist in a differenzierbar und es gilt (f g)′(a) = f (a)g ′ (a) + f ′ (a)g(a) . (3) Nehme an, dass g(x) 6= 0 für alle x ∈ I. Dann ist die Abbildung f /g in a differenzierbar, und es gilt (f /g)′(a) = f ′ (a)g(a) − f (a)g ′(a) . g(a)2 Seien f, g : I → R Abbildungen, die beide in a ∈ I ◦ differenzierbar sind und mit g(a) 6= 0 (obwohl nicht unbedingt mit g(x) 6= 0 für alle x ∈ I). Nach Satz 4.2 ist g an der Stelle a stetig und damit gibt es ein ε > 0, so dass g(x) 6= 0 für alle x ∈ J = {x ∈ I : |x − a| < ε}. Nun ist J ein Intervall mit a ∈ J ◦ und nach Satz 4.1 sind die Einschränkungen f|J und g|J in a differenzierbar mit ′ f|J′ (a) = f ′ (a) und g|J (a) = g ′ (a). Dies bedeutet, dass, obwohl g die Bedingung in Satz 4.3 (3) nicht unbedingt erfüllt, dieser Satz immer noch auf die Abbildungen f|J und g|J angewendet werden kann. 4 Differentiation 24 Satz 4.4 (Kettenregel) Sei f : I → R differenzierbar in a ∈ I ◦ mit f (I) ⊂ J, wobei J eine Intervall ist mit f (a) ∈ J ◦ ; sei g : J → R differenzierbar in f (a). Dann ist die zusammengesetzte Abbildung g ◦ f : I → R differenzierbar in a und (g ◦ f )′ (a) = g ′(f (a))f ′ (a) . Eine Abbildung f : I → R heißt differenzierbar in I ◦ , wenn f in a differenzierbar ist für jedes a ∈ I ◦ . Satz 4.5 (1) Sei n ∈ N; dann ist die durch pn (x) = xn definierte Abbildung pn : I → R differenzierbar in I ◦ und p′n (a) = nan−1 für alle a ∈ I ◦ (mit p′0 (a) = 0). (2) Nehme an, dass 0 ∈ / I und sei n ≥ 1. Dann ist die durch qn (x) = 1/xn definierte Abbildung qn : I → R differenzierbar in I ◦ und für alle a ∈ I ◦ gilt qn′ (a) = − n an+1 . Seien m, n ∈ N, b0 , . . . , bm , c0 , . . . , cn ∈ R mit c0 + c1 x + · · · + cn xn 6= 0 für alle x ∈ I. Nach Satz 4.3 und Satz 4.5 ist dann die durch f (x) = b0 + b1 x + · · · + bm xm c0 + c1 x + · · · + cn xn definierte Abbildung f : I → R differenzierbar in I ◦ und für alle a ∈ I ◦ gilt f ′ (a) = (c0 + c1 a + · · · + cn an )g(a) − (b0 + b1 a + · · · + bn am )h(a) , (c0 + c1 a + · · · + cn an )2 wobei g(a) = b1 + 2b2 a + · · · + mbm am−1 und h(a) = c1 + 2c2 a + · · · + ncn an−1 . Sei f : I → R differenzierbar in I ◦ ; es gibt also eine Abbildung f ′ : I ◦ → R, d.h. die Abbildung x 7→ f ′ (x). Sie heißt die Ableitung von f . In vielen Anwendungen sind die auftretenden Abbildungen differenzierbar in I ◦ (und nicht nur differenzierbar in einem Punkt). Hier sind also Versionen von Satz 4.3 und von Satz 4.4, die auf diesen Fall zugeschnitten sind. Satz 4.6 Seien f, g : I → R Abbildungen, die in I ◦ differenzierbar sind. (1) Für alle b, c ∈ R ist die Abbildung bf + cg differenzierbar in I ◦ mit (bf + cg)′ = bf ′ + cg ′ . 4 Differentiation 25 (2) Die Abbildung f g ist differenzierbar in I ◦ mit (f g)′ = f g ′ + f ′ g . (3) Ist g(x) 6= 0 für alle x ∈ I, so ist die Abbildung f /g differenzierbar in I ◦ mit (f /g)′ = (f ′ g − f g ′ )/g 2 . Satz 4.7 (Kettenregel) Sei f : I → R differenzierbar in I ◦ und sei J eine weiteres Intervall mit f (I) ⊂ J und f (I ◦ ) ⊂ J ◦ . Ist g : J → R differenzierbar in J ◦ , so ist zusammengesetzte Abbildung g ◦ f : I → R differenzierbar in I ◦ mit (g ◦ f )′ = (g ′ ◦ f ) · f ′ . 5 Mehr über die reellen Zahlen Bisher haben wir über die reellen Zahlen nur angenommen, dass die in Kapitel 2 eingeführten Annahmen 1, 2, 3 und 4 für R gültig sind. Wir haben dann in den letzten zwei Kapiteln gesehen, welche Aussagen über Stetigkeit und Differenzierbarkeit in diesem Rahmen gemacht werden können. Da aber die Annahmen 1, 2, 3 und 4 auch für Q gültig sind, können wir keine Aussage über R beweisen, die für Q falsch ist. Betrachte zum Beispiel die Aussage: Jede positive reelle Zahl besitzt eine Quadratwurzel, d.h., zu jedem x ∈ R mit x > 0 gibt es ein y ∈ R mit y 2 = x. Wenn wir diese Aussage nur mit Hilfe von 1, 2, 3 und 4 beweisen könnten, so würde dies auch zeigen, dass es zu jedem x ∈ Q mit x > 0 ein y ∈ Q mit y 2 = x gibt. Für x = 2 ist diese Aussage aber falsch. Seien a, b ∈ R mit a < b; wir sagen, dass eine stetige Abbildung f : [a, b] → R die Zwischenwerteigenschaft hat, wenn es zu jeder reellen Zahl d zwischen f (a) und f (b) ein c ∈ [a, b] gibt, so dass f (c) = d. In der Schule ging man (mindestens bei der Kurvendiskussion) davon aus, dass diese eine Eigenschaft von jeder auf einem abgeschlossenen Intervall [a, b] definierten stetigen Abbildung ist, aber allein aus den Annahmen 1, 2, 3 und 4 kann man dies nicht herleiten: Wenn es einen Beweis gäbe, so würde er auch zeigen: Ist f : [0, 1] → Q eine stetige Abbildung mit f (0) < 0 und f (1) > 0, dann gibt es ein c ∈ Q mit 0 < c < 1, so dass f (c) = 0. Für die Abbildung mit f (x) = x2 − 12 ist aber die Aussage falsch. Es muss also mehr von den reellen Zahlen verlangt werden, und diese Forderung werden wir im Wesentlichen durch die schon in der Schule geglaubte Annahme festlegen, dass jede stetige Abbildung f : [a, b] → R die Zwischenwerteigenschaft hat. Das Problem mit dieser Annahme ist, dass sie keine direkte Aussage über die reellen Zahlen selbst macht, sondern eine Aussage über stetige Abbildungen ist, die auf den reellen Zahlen definiert sind. Es gibt doch eine äquivalente (aber etwas weniger anschauliche) Annahme, die eine direkte Aussage über die reellen Zahlen ist und die wir jetzt einführen. Sei A eine Teilmenge von R und c ∈ R; wir schreiben A ≤ c, wenn x ≤ c für alle x ∈ A und nennen dann c eine obere Schranke von A. Analog schreiben wir c ≤ A, wenn c ≤ x für alle x ∈ A und hier wird c eine untere Schranke von A genannt. Sind ferner A und B zwei Teilmengen von R, so schreiben wir A ≤ B, wenn x ≤ y für alle x ∈ A, y ∈ B. Lemma 5.1 Äquivalent sind: (1) Jede stetige Abbildung f : [a, b] → R hat die Zwischenwerteigenschaft. (2) Für alle nichtleere Teilmengen A, B von R mit A ≤ B gibt es ein c ∈ R, so dass A ≤ c ≤ B. 26 5 Mehr über die reellen Zahlen 27 Nun führen wir unsere letzte Annahme über die reellen Zahlen ein: 5. Für alle nichtleere Teilmengen A, B von R mit A ≤ B gibt es ein c ∈ R, so dass A ≤ c ≤ B. Nach Lemma 5.1 könnte man genauso gut auch Folgendes als letzte Annahme über die reellen Zahlen verwenden: 5′ . Jede stetige Abbildung f : [a, b] → R hat die Zwischenwerteigenschaft. Im Folgenden nehmen wir stets an, dass die reellen Zahlen die Eigenschaften 1, 2, 3, 4 und 5 besitzen. Die Behauptung, dass eine Aussage über die reellen Zahlen richtig ist, bedeutet dann genau, dass diese Aussage eine logische Folgerung aus den fünf Eigenschaften ist. Die Annahme 5 ist falsch für die rationalen Zahlen Q. Betrachte die Teilmengen A = {r ∈ Q : r ≥ 0 und r 2 < 2} und B = {r ∈ Q : r ≥ 0 und r 2 > 2} von Q. Dann sind A und B nichtleer und A ≤ B. Es gibt aber keine rationale Zahl c mit A ≤ c ≤ B. (Ist A ≤ c ≤ B, so sieht man leicht, dass c2 = 2.) Es stellt sich natürlich die Frage, ob und in welchem Sinne die reellen Zahlen tatsächlich existieren. Man kann mit relativ viel Aufwand zeigen, dass irgendwas existiert, das die Eigenschaften besitzt, die wir von den reellen Zahlen verlangt haben. Ferner kann man zeigen, dass, obwohl es eine Vielfalt von Wegen gibt, die reellen Zahlen zu konstruieren, sie in einem bestimmten Sinne eindeutig durch die Forderungen 1, 2, 3, 4 und 5 festgelegt sind. Die nächste Eigenschaft der reellen Zahlen hält man wahrscheinlich sowieso für richtig, sie folgt aber in der Tat nicht aus 1, 2, 3 und 4 allein ohne 5: Satz 5.1 (Satz von Archimedes) Zu jeder reellen Zahl b ∈ R gibt es eine näturliche Zahl n ∈ N mit n > b. Archimedes ist es vor über zweitausend Jahren aufgefallen, dass man die Aussage in Satz 5.1 braucht, um einige in der Euklidischen Geometrie vorkommende Konstruktionen mit Zirkel und Lineal sicher durchführen zu können. Er war auch überzeugt, dass diese Aussage nicht aus den restlichen Axiomen der Euklidischen Geometrie folgt. Dehalb trägt dieser Satz seinen Namen. Hier ist eine Umformulierung des Satzes von Archimedes, die eine äquivalente Aussage über kleine positive Zahlen macht: Satz 5.2 Zu jedem ε > 0 gibt es ein n ∈ N mit 1/n < ε. Der nächste Satz sagt, die rationalen Zahlen liegen dicht‘ in den reellen Zahlen. ’ 5 Mehr über die reellen Zahlen 28 Satz 5.3 Seien y, z ∈ R mit y < z. Dann gibt es ein x ∈ Q mit y < x < z. Das analoge Ergebnis gilt auch für die Menge R \ Q. Satz 5.4 Seien y, z ∈ R mit y < z. Dann gibt es ein x ∈ R \ Q mit y < x < z. Eine Teilmenge A von R heißt nach oben (bzw. nach unten ) beschränkt, wenn es ein b ∈ R mit A ≤ b (bzw. mit b ≤ A) gibt. Ferner heißt A beschränkt, wenn sie nach oben und nach unten beschränkt ist, d.h., wenn es u, v ∈ R gibt, so dass u ≤ A ≤ v. Man sieht leicht, dass A genau dann beschränkt ist, wenn es ein c ∈ R mit c ≥ 0 gibt, so dass |x| ≤ c für alle x ∈ A. Erinnerung: Unter einem Intervall verstehen wir eine Teilmenge von R, die eine der folgenden Formen hat: [a, b], (a, b), (a, b] und [a, b) (mit a < b), [a, +∞), (a, +∞), (−∞, b] und (−∞, b); ferner ist R selbst ein Intervall. Jedes Intervall I hat die folgende Eigenschaft: Sind c, d ∈ I mit c < d, so ist x ∈ I für jedes x ∈ R mit c < x < d. Außerdem besteht ein Intervall aus mehr als einem Punkt. Sei I die Menge aller Teilmengen I von R, die mehr als einen Punkt enthalten und für die gilt: Sind c, d ∈ I mit c < d, so ist x ∈ I für jedes x ∈ R mit c < x < d. Insbesondere liegt jedes Intervall in I und der Tat gibt es kein weiteres Element in der Menge I: Satz 5.5 Jedes Element in I ist ein Intervall. Etwas genauer gilt für ein Element I ∈ I Folgendes: (1) Ist I weder nach unten noch nach oben beschränkt, so ist I = R. (2) Ist I nach oben, aber nicht nach unten beschränkt, dann gibt es ein b ∈ R, so dass I entweder (−∞, b] oder (−∞, b) ist. (3) Ist I nach unten, aber nicht nach oben beschränkt, dann gibt es ein a ∈ R, so dass I entweder [a, +∞) oder (a, +∞) ist. (4) Ist I beschränkt, dann gibt es a, b ∈ R mit a < b, so dass I eines der vier Intervalle [a, b], (a, b), (a, b] und [a, b) ist. Die nächste Eigenschaft der reellen Zahlen spielt eine sehr wichtige Rolle, ist aber beim ersten Kennenlernen schwer zu verdauen. Sie soll also zunächst als technisches Hilfsmittel ansehen werden, das eingesetzt werden kann, um weitere Eigenschaften nachzuweisen. Sei x ∈ R; ein Intervall (y, z) mit y < x < z wird offenes Intervall um x genannt. Insbesondere ist J(x, δ) ein offenes Intervall um x für jedes δ > 0, wobei J(x, δ) = (x − δ, x + δ) = {y ∈ R : |y − x| < δ} . 5 Mehr über die reellen Zahlen 29 Satz 5.6 (Kompaktheit des Intervalls [a, b]) Für jedes x ∈ [a, b] sei Jx ein offenes Intervall S um x. Dann gibt es eine endliche Teilmenge N von [a, b], so dass [a, b] ⊂ x∈N Jx . Eine Teilmenge F von R heißt kompakt, wenn gilt: Ist Jx ein offenes Intervall um x fürSjedes x ∈ F , dann gibt es stets eine endliche Teilmenge N von F , so dass F ⊂ x∈N Jx . Nach Satz 5.6 ist also das Intervall [a, b] kompakt. 6 Mehr über stetige Funktionen Im Folgenden seien a, b ∈ R mit a < b. Satz 6.1 (Zwischenwertsatz) Sei f : [a, b] → R eine stetige Abbildung und sei d eine reelle Zahl zwischen f (a) und f (b). Dann gibt es ein c ∈ R mit f (c) = d. Hier ist eine direkte Folgerung des Zwischenwertsatzes: Satz 6.2 Sei f : A → R eine stetige Abbildung (mit A ⊂ R beliebig) und sei I ein Intervall mit I ⊂ A. Besteht f (I) aus mehr als einem Punkt, so ist f (I) ein Intervall. Lemma 6.1 Jede stetige Abbildung f : [a, b] → R ist beschränkt: Es gibt ein d ≥ 0, so dass |f (x)| ≤ d für alle x ∈ [a, b]. Satz 6.3 (Satz von Minimum und Maximum) Sei f : [a, b] → R stetig. Dann gibt es u, v ∈ [a, b], so dass f (u) ≤ f (x) ≤ f (v) für alle x ∈ [a, b]. Satz 6.4 Sei f : [a, b] → R eine stetige Abbildung. Besteht f ([a, b]) aus mehr als einem Punkt, so gibt es c, d ∈ R mit c < d, so dass f ([a, b]) = [c, d]. Man beachte: Die Menge f ([a, b]) besteht aus einem Punkt genau dann, wenn die Abbildung f konstant ist. Eine Abbildung f : A → R heißt gleichmäßig stetig, wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass |f (y) − f (x)| < ε für alle x, y ∈ A mit |y − x| < δ. Eine gleichmäßig stetige Abbildung ist stetig (und für jedes ε > 0 hängt die Wahl von δ > 0 nicht von der Stelle a ∈ A ab). Aber im Allgemeinen ist die Umkehrung falsch: Zum Beispiel ist die auf dem Intervall (0, 1) durch x 7→ 1/x definierte Abbildung stetig, aber nicht gleichmäßig stetig. Satz 6.5 (Gleichmäßige Stetigkeit) Jede stetige Abbildung f : [a, b] → R ist gleichmäßig stetig. 30 6 Mehr über stetige Funktionen 31 Im Folgenden sei I ein Intervall. Eine Abbildung f : I → R heißt monoton wachsend, falls f (x) ≤ f (y) für alle x, y ∈ I mit x < y, streng monoton wachsend, falls f (x) < f (y) für alle x, y ∈ I mit x < y, monoton fallend, falls f (x) ≥ f (y) für alle x, y ∈ I mit x < y, streng monoton fallend, falls f (x) > f (y) für alle x, y ∈ I mit x < y. Schließlich heißt f monoton, wenn sie monoton wachsend oder monoton fallend ist, und streng monoton, wenn sie streng monoton wachsend oder streng monoton fallend ist. Ist f : I → R streng monoton, so besteht f (I) aus mehr als einem Punkt. (Es gibt c, d ∈ I mit c 6= d und dann sind f (c) und f (d) zwei verschiedene Punkte in f (I).) Sei nun f : I → R eine streng monotone stetige Abbildung und setze J = f (I); da J aus mehr als einem Punkt besteht, ist nach Satz 6.2 J ein Intervall. Sei b ∈ J; da J = f (I), gibt es mindestens ein a ∈ I mit f (a) = b. In der Tat gibt es genau ein a ∈ I mit f (a) = b, da f (a1 ) 6= f (a2 ), wenn a1 , a2 ∈ I mit a1 6= a2 . (Es gilt entweder a1 < a2 oder a2 < a1 ; ist a1 < a2 , so ist f (a1 ) < f (a2 ) (bzw. f (a2 ) < f (a1 )), falls f streng monoton wachsend (bzw. streng monoton fallend ist); ist dagegen a2 < a1 , so ist f (a2 ) < f (a1 ) (bzw. f (a1 ) < f (a2 )), falls f streng monoton wachsend (bzw. streng monoton fallend ist). In jedem dieser Fälle ist f (a1 ) 6= f (a2 ).) Da es zu jedem b ∈ J genau ein a ∈ I mit f (a) = b gibt, gibt es eine eindeutige Abbildung g : J → R, so dass für jedes b ∈ J gilt: g(b) = a, wobei a das eindeutige Element in I mit f (a) = b ist. Es gilt also g(f (a)) = a für alle a ∈ I und insbesondere ist g(J) = I. Ferner ist f (g(b)) = b für alle b ∈ J. Die Abbildung g heißt die Umkehrabbildung von f und wird mit f −1 bezeichnet. Wir haben also f −1 (f (a)) = a für alle a ∈ I und f (f −1(b)) = b für alle b ∈ J. Ist f streng monoton wachsend, dann ist die Umkehrabbildung f −1 das auch: Sind b1 , b1 ∈ J mit b1 < b2 , so ist f (f −1(b1 )) = b1 < b2 = f (f −1 (b2 )) und daraus ergibt sich, dass f −1 (b1 ) < f −1 (b2 ). Genauso ist f −1 streng monoton fallend, wenn f das ist. Lemma 6.2 Sei x ∈ I und ε > 0; dann gibt es ein δ > 0, so dass |y − x| < ε für alle y ∈ I mit |f (y) − f (x)| < δ. Satz 6.6 Die Umkehrabbildung f −1 : J → R ist stetig. Sei wieder R+ = {x ∈ R : x ≥ 0}. Für jedes n ≥ 1 sei pn : R+ → R die Abbildung mit pn (x) = xn für alle x ≥ 0. Nach Satz 3.2 ist pn stetig und nach Satz 2.6 (1) (und Induktion) ist pn streng monoton wachsend. 6 Mehr über stetige Funktionen 32 Satz 6.7 Es gilt pn (R+ ) = R+ . + Nach Satz 6.6 ist die Umkehrabbildung p−1 R+ n : R → R stetig. Für jedes x ∈ √ ist p−1 y ≥ 0 mit y n = x und daher schreibt man n x n (x) die eindeutige reelle Zahl√ für y. Also ist die Abbildung x 7→ n x von R+ auf R+ streng monoton wachsend und stetig. Insbesondere haben wir Folgendes: Satz 6.8 Sei n ≥ 1; zu jedem x ∈ R+ gibt es eine eindeutige reelle Zahl y ∈ R+ mit y n = x. Mit n = 2 haben wir endlich festgestellt, dass jedes x ∈ R+ eine Quadratwurzel besitzt: Es gibt eine eindeutige reelle Zahl y ∈ R+ mit y 2 = x. 7 Mehr über Differentiation Im Folgenden sei I stets ein Intervall. Im nächsten Satz sei f : I → R eine streng monotone stetige Abbildung. Da f (I) aus mehr als einem Punkt besteht, ist nach Satz 6.2 J = f (I) ein Intervall und die Umkehrabbildung f −1 : J → R, die ebenfalls streng monoton ist, ist nach Satz 6.6 stetig. Ist a ∈ I ◦ , so ist f (a) ∈ J ◦ . (Da a ∈ I ◦ , gibt es ein δ > 0, so dass (a − δ, a + δ) ⊂ I; dann sind f (a − δ) und f (a + δ) Punkte in J = f (I) und f (a) liegt strikt zwischen f (a − δ) und f (a + δ). Also ist f (a) kein Endpunkt von J.) Satz 7.1 Sei a ∈ I ◦ und setze b = f (a). Ist f in a differenzierbar, so ist f −1 in b differenzierbar genau dann, wenn f ′ (a) 6= 0, und in diesem Fall ist (f −1 )′ (b) = 1/f ′(a) . Satz 7.2 Für n ≥ 1 sei wn : R+ → R die Abbildung mit wn (x) = x ∈ R+ . Dann ist wn in b differenzierbar für jedes b > 0 mit wn′ (b) = √ n x für alle 1 √ n−1 . n n b Sei nun f : I → R eine beliebige Abbildung. Dann hat f in a ∈ I ein lokales Minimum (bzw. lokales Maximum ), wenn es ein δ > 0 gibt, so dass f (a) ≤ f (x) (bzw. f (a) ≥ f (x)) für alle x ∈ I mit |x − a| < δ. Man sagt ferner, dass f in a ein lokales Extremum besitzt, wenn f in a entweder ein lokales Minimum oder ein lokales Maximum hat. Satz 7.3 Sei f : I → R eine Abbildung und a ∈ I ◦ . Besitzt f in a ein lokales Extremum und ist f in a differenzierbar, so ist f ′ (a) = 0. Eine Abbildung f : I → R heißt in I ◦ differenzierbar, wenn f in c differenzierbar ist für jedes c ∈ I ◦ . Satz 7.4 (Satz von Rolle) Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist, und seien a, b ∈ I mit a < b. Ist f (a) = f (b), dann gibt es ein c ∈ (a, b), so dass f ′ (c) = 0 (und hier ist f ′ (c) definiert, da c ∈ (a, b) ⊂ I ◦ ). 33 7 Mehr über Differentiation 34 Satz 7.5 (Mittelwertsatz) Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist, seien a, b ∈ I mit a < b. Dann gibt es ein c ∈ (a, b), so dass f ′ (c) = f (b) − f (a) b−a (und wieder ist f ′ (c) definiert, da c ∈ (a, b) ⊂ I ◦ ). Satz 7.6 Sei f : I → R eine stetige Abbildung. Dann ist f konstant genau, wenn f in I ◦ differenzierbar ist und f ′ (x) = 0 für alle x ∈ I ◦ . Satz 7.7 Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist. (1) Dann ist f monoton wachsend (bzw. monoton fallend) genau, wenn f ′ (x) ≥ 0 (bzw. f ′ (x) ≤ 0) für alle x ∈ I ◦ . (2) Gilt f ′ (x) > 0 (bzw. f ′ (x) < 0) für alle x ∈ I ◦ , so ist f streng monoton wachsend (bzw. streng monoton fallend). Die Umkehrung von Satz 7.7 (2) ist falsch: Sei f : R → R die Abbildung, die gegeben ist durch f (x) = x3 für alle x ∈ R. Dann ist f streng monoton wachsend, aber f ′ (x) = 3x2 für alle x ∈ R und insbesondere ist f ′ (0) = 0. Satz 7.8 Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist und seien a, b ∈ I mit a < b. Nehme an, dass f ′ (x) 6= 0 für alle x ∈ (a, b). (1) Gilt entweder f (a) < 0 und f (b) > 0 oder f (a) > 0 und f (b) < 0, dann gibt es genau einen Punkt c ∈ (a, b) mit f (c) = 0. (2) Gilt entweder f (a) ≤ 0 und f (b) ≤ 0 oder f (a) ≥ 0 und f (b) ≥ 0, so ist f (x) 6= 0 für alle x ∈ (a, b). Im Folgenden seien a, b ∈ R mit a < b und sei f : [a, b] → R eine stetige Abbildung, die in (a, b) differenzierbar ist. Die Abbildung f hat in c ∈ [a, b] ein Maximum (bzw. ein Minimum ,) wenn f (c) ≥ f (x) (bzw. f (c) ≤ f (x)) für alle x ∈ [a, b]. Nach Satz 6.3 (Satz von Minimum und Maximum) gibt es mindestens einen Punkt c ∈ [a, b], in dem f ein Maximum hat und mindestens einen Punkt d ∈ [a, b], in dem f ein Minimum hat. Andererseits ist ein Maximum (bzw. Minimum) ein lokales Maximum (bzw. ein lokales Minimum) und daraus ergibt 7 Mehr über Differentiation 35 sich nach Satz 7.3 Folgendes: Ist c ∈ (a, b) ein Punkt, in dem f ein Maximum oder ein Minimum hat, so ist f ′ (c) = 0. Setze Maxf = {a ∈ D : f hat in a ein Maximum} , Minf = {a ∈ D : f hat in a ein Minimum} , Nullf ′ = {a ∈ I : f ′ (a) = 0} . Dann ist sowohl Maxf als auch Minf eine Teilmenge der Menge {c, d} ∪ Nullf ′ . Dieses kann man benutzen, um die Stellen zu finden, in denen f ein Maximum oder ein Minimum hat. Beispiele (1) Sei f : [0, 1] → R die durch f (x) = x − x2 für alle x ∈ [0, 1] definierte Abbildung. Da f ′ (a) = 1 − 2a, ist Nullf ′ = { 12 }, und damit sind Maxf und Minf beide Teilmengen von {0, 12 , 1}. Aber f (0) = f (1) = 0 und f ( 12 ) = 41 , und folglich ist Maxf = { 21 } und Minf = {0, 1}. (2) Sei f : [0, 1] → R die durch f (x) = 1 − x2 + 2x4 für alle x ∈ [0, 1] definierte Abbildung. Da f ′ (a) = −2a + 8a3 , ist Nullf ′ = { 21 }, und damit sind Maxf und Minf beide Teilmengen von {0, 21 , 1}. Aber f (0) = 1, f (1) = 2 und f ( 21 ) = 78 , und daher ist Maxf = {1} und Minf = { 12 }. (3) Sei f : [−1, 1] → R die durch f (x) = x3 für alle x ∈ [−1, 1] definierte Abbildung. Da f ′ (a) = 3a2 , ist Nullf ′ = {0}, und damit sind Maxf und Minf beide Teilmengen von {−1, 0, 1}. Aber f (−1) = −1, f (1) = 1 und f (0) = 0, und folglich ist Maxf = {1} und Minf = {−1}. In diesem Fall ist 0 weder ein lokales Maximum noch ein lokales Minimum von f , obwohl f ′ (0) = 0. (4) Ein Bauer hat einen Zaun der Länge 500 m und will damit ein Rechteck mit der größmöglichen Fläche umschließen. Welche Länge und Breite muss dann das Rechteck haben? Betrachte ein Rechteck mit der Länge x; dann ist die Breite 250 − x und die umschlossene Fläche ist x(250 − x). Mathematisch ist also die Aufgabe: Man berechne Maxf , wobei f : [0, 250] → R die Abbildung ist mit f (x) = x(250 − x) für alle x ∈ [0, 250]. Da f ′ (a) = 250 − 2a, ist Nullf ′ = {125}, und damit ist Maxf eine Teilmenge von {0, 125, 250}. Aber f (0) = f (250) = 0 und f (125) = 125 · 125 und daher ist Maxf = {125}. Folglich soll das Rechteck eine Länge und eine Breite von 125 m haben. 8 Integration von stetigen Funktionen Setze R+ = {x ∈ R : x ≥ 0}. Ist A eine nichtleere Teilmenge von R und wenn wir f : A → R+ schreiben, dann meinen wir, dass f : A → R eine Abbildung ist mit f (x) ∈ R+ für alle x ∈ A (d.h. mit f (x) ≥ 0 für alle x ∈ A). Sind f, g : A → R+ Abbildungen, so bedeutet f ≤ g (oder g ≥ f ), dass f (x) ≤ g(x) für alle x ∈ A. Seien a, b ∈ R mit a < b. Zu jeder Abbildung f : [a, b] → R+ gibt es die Teilmenge Ff = {(x, y) ∈ R2 : x ∈ [a, b] und 0 ≤ y ≤ f (x)} von der Ebene R2 . Diese Teilmenge Ff kann als Fläche unter der Abbildung f angesehen werden. Im folgenden Bild, in dem die Abbildung f stetig ist, besteht die Teilmenge Ff aus genau denjenigen Punkten in der Ebene, die innerhalb (oder auf) der roten Linie liegen. f Ff b a In diesem Kapitel werden wir für jede stetige Abbildung f : [a, b] → R+ eine Zahl einführen, die den Flächeninhalt von der Teilmenge Ff angibt. Diese Größe wird R mit f bezeichnet und wird das Integral von f genannt. Zunächst aber betrachten wir die Treppenfunktionen. Außer von trivialen Fällen sind diese Abbildungen nicht stetig, aber für eine Treppenfunktion f ist klar, was der Flächeninhalt von Ff ist und man kann ihn auch explizit berechnen. Eine Abbildung f : [a, b] → R+ heißt Treppenfunktion, wenn es a0 , . . . , an ∈ R mit a = a0 < · · · < an = b gibt, so dass f konstant auf jedem der Intervalle [a0 , a1 ], (a1 , a2 ], . . . (an−1 , an ] ist. Die geordnete Menge U = (a0 , . . . , an ) heißt dann eine Unterteilung für f . 36 8 Integration von stetigen Funktionen 37 f a = a0 a1 a2 an = b Ist f : [a, b] → R+ eine Treppenfunktion, so gibt es keine eindeutige Unterteilung für f , da man zu jeder Unterteilung eine neue Unterteilung durch das Hinzufügen von zusätzlichen (überflüssigen) Elementen konstruieren kann. f a = a0 a1 a2 am = b Es gibt aber eine minimale Unterteilung U = (a0 , . . . , an ), in der a1 , . . . , an−1 genau die Stellen in [a, b] sind, in der f einen Sprung macht‘. ’ 8 Integration von stetigen Funktionen 38 Für jedes c ∈ R+ ist insbesondere die konstante Abbildung kc : [a, b] → R+ (mit kc (x) = c für alle x ∈ [a, b]) eine Treppenfunktion. Diese konstanten Abbildungen sind die einzigen Treppenfunktionen, die stetig sind. Lemma 8.1 Seien f, g : [a, b] → R+ Treppenfunktionen. (1) Für alle c, d ∈ R+ ist cf + dg eine Treppenfunktion. (2) Ist f ≤ g, so ist g − f eine Treppenfunktion. Sei U = (a0 , . . . , an ) eine Unterteilung für die Treppenfunktion f , und für jedes j = 1, . . . , n sei cj der Wert von f auf dem Intervall (aj−1 , aj ]. Setze Z n X cj (aj − aj−1 ) . f= U j=1 c1 f c2 R1 R2 cn Rn a0 a1 a2 an R Es ist anschaulich klar, dass U f der Flächeninhalt von Ff ist, da Ff aus n im Wesentlichen nicht überlappenden Rechtecken R1 , . . . , Rn besteht, und also ist ihr Flächeninhalt die Summe r1 + · · · + rn , wobei rj = cj (aj −Raj−1) der Flächeninhalt von Rj ist. Formal müssen wir aber nachweisen, dass U f nicht von der Unterteilung U abhängt: Lemma 8.2 Sind U und V Unterteilungen für die Treppenfunktion f , so ist Z Z f= f. U V 8 Integration von stetigen Funktionen 39 R Da nach Lemma R8.2 die Zahl U f nicht von R der Unterteilung U abhängt, wird diese einfach mit f bezeichnet; die Zahl f gibt also den Fächeninhalt von Ff R R an und heißt Integral von f . (Oft schreibt man f (x) dx statt f .) R Insbesondere gilt kc = (b − a)c für die konstante Abbildung kc : [a, b] → R+ , da {a, b} eine Unterteilung für kc ist. Lemma 8.3 Seien f, g : [a, b] → R+ Treppenfunktionen. R R R (1) Für alle c, d ∈ R+ ist (cf + dg) = c f + d g. R R (2) Ist f ≤ g, so ist f ≤ g. R Sei f : [a, b] → R+ eine stetige Abbildung; wir werden nun den Flächeninhalt f von der Fläche Ff bestimmen. Sind g, h : [a, b] → R+ Treppenfunktionen mit R g ≤ f ≤ h, so ist Fg ⊂R Ff ⊂ FRh und folglich muss der Flächeninhalt f zwischen R den Flächeninhalten g und h liegen. Für den Flächeninhalt f muss also Z Z Z g≤ f≤ h gelten für alleR Treppenfunktionen g, h : [a, b] → R+ mit g ≤ f ≤ h. Es stellt sich heraus, dass f schon eindeutig durch diese Anforderung festgelegt ist. Um dies zu zeigen, wird der folgende Zusammenhang zwischen stetigen Abbildungen und Treppenfunktionen benötigt: Satz 8.1 Sei f : [a, b] → R+ eine stetige Abbildung und sei ε > 0. Dann gibt es Treppenfunktionen g, h : [a, b] → R+ mit g ≤ f ≤ h und h ≤ g + ε (d.h. mit h(x) ≤ g(x) + ε für alle x ∈ [a, b]). h g a0 a1 a2 f an 8 Integration von stetigen Funktionen 40 Sei f : [a, b] → R+ eine stetige Abbildung und sei ε > 0. Nach Satz 8.1 gibt es Treppenfunktionen g, h R: [a, b]R→ R+ mit g ≤ f ≤ h und h ≤ g + kε . Da g ≤ h, ist nach Lemma 8.3 (2) R R R g R≤ h und R da h ≤ g + ε, ist nach Lemma 8.3 (1) und (2) h ≤ (g + ε) = g + kε = g + (b − a)ε. Es gilt also Z Z Z g ≤ h ≤ g + (b − a)ε R R und insbesondere ist | g − h| ≤ (b − a)ε. Satz 8.2 Sei f : [a, b]R→ R+ eine stetige Abbildung; dann gibt es eine eindeutige Zahl c ∈ RR+ , so dass g ≤ c für jede Treppenfunktion g : [a, b] → R+ mit g ≤ f und c ≤ h für jede Treppenfunktion h : [a, b] → R+ mit f ≤ h. Die Zahl c in Satz 8.2 heißt das Integral von f und wird mit bezeichnet. R f (oder R f (x) dx) Satz 8.3 Seien f, g : [a, b] → R+ stetige Abbildungen. R R R (1) Für alle c, d ∈ R+ ist (cf + dg) = c f + d g. R R (2) Ist f ≤ g, so ist f ≤ g. Wir wollen nun das Integral für stetige Abbildungen definieren, die auch negative Werte annehmen können und dafür brauchen wir folgende Konstruktion: Für jede Abbildung f : [a, b] → R definiere Abbildungen f+ , f− : [a, b] → R+ durch f (x) falls f (x) ≥ 0 , f+ (x) = 0 falls f (x) < 0 , −f (x) falls f (x) < 0 , f− (x) = 0 falls f (x) ≥ 0 . Also gilt f = f+ − f− . Lemma 8.4 Für jede stetige Abbildung f : [a, b] → R sind die Abbildungen f+ und f− auch stetig. Sei f : [a, b] → R stetig; dann definieren wir das Integral Z f= Z f+ − Z f− . R f von f durch 8 Integration von stetigen Funktionen 41 Satz 8.4 Seien f, g : [a, b] → R stetige Abbildungen. R R R (1) Für alle c, d ∈ R ist (cf + dg) = c f + d g. R R (2) Ist f ≤ g, so ist f ≤ g. Satz 8.5 (Mittelwertsatz der Integralrechnung) Sei f : [a, b] → R stetig. Dann gibt es ein c ∈ [a, b], so dass Z f = f (c)(b − a) . Im Folgenden sei I ein beliebiges Intervall. Sei f : I → R eine stetige Abbildung und seien a, b ∈ I mit a < b; bezeichne mit f|[a,b] die Einschränkung von f auf [a, b], d.h. f|[a,b] : [a, b] → R ist die Abbildung mit f|[a,b] (x) = f (x) R für alle x ∈ [a, b]. Nach Satz 3.1 ist f|[a,b] stetig und folglich ist das Integral f|[a,b] von Rb R f|[a,b] definiert. Wir schreiben aber a f statt f|[a,b] . Lemma 8.5 Für jede stetige Abbildung f und alle a, c, b ∈ I mit a < c < b ist Z b Z c Z b f= f+ f. a a c Für eine stetige Abbildung f ist es nützlich, das Integral‘ ’ Z b Z a f =− f a Rb a f durch b zu definieren, falls a, b ∈ I mit b < a. Für jedes a ∈ I setzt man schließlich Z a f =0. a Lemma 8.6 Sei f : I → R eine stetige Abbildung; für alle a, b, c ∈ I gilt dann Z b Z c Z b f= f+ f. a a c 8 Integration von stetigen Funktionen 42 Satz 8.6 Sei f : I → R stetig, sei a ∈ I und definiere F : I → R durch Z x F (x) = f a für jedes x ∈ I. Dann ist die Abbildung F stetig, F ist in I ◦ differenzierbar und es gilt F ′ (b) = f (b) für alle b ∈ I ◦ . Sei f : I → R stetig. Eine stetige Abbildung F : I → R, die in I ◦ differenzierbar ist, heißt Stammfunktion von f , wenn F ′ (x) = f (x) für alle x ∈ I ◦ . Nach Satz 8.6 besitzt jede stetige Abbildung f eine Stammfunktion: Wähle einen Rx Punkt a ∈ I; die Abbildung x 7→ a f ist dann eine Stammfunktion von f . Ist F : I → R eine Stammfunktion von f , so ist F + c auch eine Stammfunktion für jedes c ∈ R, da (F + c)′ (x) = F ′ (x) + k′c (x) = F ′ (x) + 0 = f (x) + 0 = f (x) für alle x ∈ I ◦ . Die Umkehrung ist ebenfalls richtig: Satz 8.7 Sind F und G beide Stammfunktionen von f , so ist F − G konstant. Satz 8.8 Sei f : I → R eine stetige Abbildung, sei a ∈ I und b ∈ R. Dann besitzt f eine eindeutige Stammfunktion F mit F (a) = b. Beispiele: (1) Seien c0 , . . . , cn ∈ R (mit n ≥ 0) und sei f : R → R gegeben durch f (x) = c0 + c1 x + c2 x2 + · · · + cn xn . Dann ist nach Satz 4.5 (1) die Abbildung 1 1 1 x 7→ c0 x + c1 x2 + c2 x3 + · · · + cn xn+1 2 3 n+1 eine Stammfunktion von f . (2) Sei I = {x ∈ R : x > 0} und für n ≥ 1 sei gn : I → R gegeben durch gn (x) = 1 . xn Ist n ≥ 2, so ist nach Satz 4.5 (2) die Abbildung x 7→ − 1 (n − 1)xn−1 eine Stammfunktion von gn . Folgendes Ergebnis wird Fundamentalsatz der Differential- und Integralrechnung genannt: 8 Integration von stetigen Funktionen 43 Satz 8.9 Sei f : I → R eine stetige Abbildung und sei F eine Stammfunktion von f . Dann gilt für alle a, b ∈ I Z b f = F (b) − F (a) . a Beispiele: (1) Sei f : R → R die Abbildung, die definiert ist durch f (x) = 3x2 + 4x + 6 für alle x ∈ R. Definiere F : R → R durch F (x) = x3 + 2x2 + 6x für alle x ∈ R; da F ′ = f , ist F eine Stammfunktion von f und folglich ist Z 1 f = F (1) − F (−1) = (13 + 2 · 12 + 6 · 1) − ((−1)3 + 2(−1)2 + 6(−1)) = 14 , −1 Z 3 2 Z f = F (3) − F (2) = (33 + 2 · 32 + 6 · 3) − (23 + 2 · 22 + 6 · 2) = 53 , 5 1 f = F (5) − F (1) = (53 + 2 · 53 + 6 · 5) − (13 + 2 · 12 + 6 · 1) = 194 . (2) Sei I = {x ∈ R : x > 0} und sei f : I → R definiert durch f (x) = 1 4 + x2 x3 für alle x ∈ I. Definiere F : I → R durch 2 1 F (x) = − − 2 x x für alle x ∈ I; da F ′ = f , ist F eine Stammfunktion von f und folglich ist Z 2 1 2 1 2 f = F (2) − F (1) = − − 2 − − − 2 = 2 , 2 2 1 1 1 Z 3 1 2 1 2 4 f = F (3) − F (2) = − − 2 − − − 2 = , 3 3 2 2 9 2 Z 10 1 4 2 1 2 f = F (10) − F (5) = − − 2 − − − 2 = . 10 10 5 5 25 5 Sei J ein Intervall; eine stetige Abbildung g : J → R heißt stetig differenzierbar, wenn g in J ◦ differenzierbar ist und die Ableitung g ′ : J ◦ → R stetig ist. 8 Integration von stetigen Funktionen 44 Satz 8.10 (Substitutionsregel) Sei f : I → R stetig und sei g : J → R eine stetig differenzierbare Abbildung mit g(J) ⊂ I. Seien a, b ∈ J ◦ mit a < b und nehme an, dass g((a, b)) ⊂ I ◦ . Dann gilt Z a b ′ f (g(t))g (t) dt = Z g(b) f. g(a) Man beachte: Da a, b ∈ J ◦ , ist g ′(x) definiert für alle x ∈ [a, b] und folglich können wir nach Satz 3.1 und Satz 3.3 eine stetige Abbildung h : [a, b] → R definieren durch h(x) = f (g(x))g ′(x) für alle x ∈ [a, b]. Also gibt es das Integral Rb Rb h = f (g(t))g ′(t) dt. a a Satz 8.11 (Partielle Integration) Seien f, g : I → R stetig differenzierbare Abbildungen. Dann gilt für alle a, b ∈ I ◦ mit a < b Z b Z b ′ f g = f (b)g(b) − f (a)g(a) − gf ′ . a a Man beachte: Wie in Satz 8.10 sind x 7→ f (x)g ′ (x) und x 7→ g(x)f ′ (x) stetige Rb Rb Abbildungen auf [a, b] und damit sind die Integrale a f g ′ und a gf ′ definiert. 9 Die Funktionen log und exp In diesem Kapitel werden wir den natürlichen Logarithmus log : (0, ∞) → R und die Exponentialfunktion exp : R → R kennenlernen. Die Abbildung log wird als Stammfunktion von der Abbildung x 7→ 1/x definiert und exp wird dann als Umkehrabbildung von log eingeführt. Satz 9.1 Es gibt eine eindeutige differenzierbare Abbildung log : (0, ∞) → R mit log(1) = 0 und log′ (x) = 1/x für alle x > 0. Die Abbildung log : (0, ∞) → R in Satz 9.1 heißt natürlicher Logarithmus. Nach Satz 7.7 (2) ist log streng monoton wachsend, da log′ (x) = 1/x > 0 für alle x > 0. log 0 1 Satz 9.2 Für alle x, y ∈ (0, ∞) gilt log(xy) = log(x) + log(y). Insbesondere gilt nach Satz 9.2, dass log(1/x) = − log(x) für alle x > 0, da log(x) + log(1/x) = log(x · 1/x) = log(1) = 0. Lemma 9.1 Es gilt log((0, ∞)) = R. Die Umkehrabbildung log−1 : R → R wird mit exp bezeichnet und sie heißt Exponentialfunktion. Also ist exp streng monoton wachsend mit exp(R) = (0, ∞) und nach Satz 6.3 ist exp stetig. Da log(1) = 0, ist exp(0) = 1. Die Zahl exp(0) heißt Eulersche Zahl und wird mit e bezeichnet; sie liegt zwischen 2, 171828 und 2, 171829. 45 9 Die Funktionen log und exp 46 exp 1 0 Satz 9.3 Für alle x, y ∈ R gilt exp(x + y) = exp(x) exp(y). Insbesondere gilt nach Satz 9.3, dass exp(−x) = 1/ exp(x) für alle x ∈ R, da exp(−x) exp(x) = exp(−x + x) = exp(0) = 1. Satz 9.4 Die Exponentialfunktion exp ist differenzierbar mit exp′ (x) = exp(x) für alle x ∈ R. Im folgenden Satz sei I ein Intervall, das mehr als einen Punkt enthält und wie in Kapitel 7 sei I ◦ die Menge I ohne ihre Endpunkte. Satz 9.5 Sei a ∈ I und seien b, c ∈ R. Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist und für die gilt: f (a) = b und f ′ (x) = cf (x) für alle x ∈ I ◦ . Dann gilt f (x) = b exp(c(x − a)) für alle x ∈ I. Satz 9.6 Die Exponentialfunktion ist die eindeutige differenzierbare Abbildung f : R → R mit f ′ = f und f (0) = 1. Satz 9.7 Sei f : R → R eine differenzierbare Abbildung mit f (0) = 1 und f (x + y) = f (x)f (y) für alle x, y ∈ R. Dann gilt f (x) = exp(cx) für alle x ∈ R, wobei c = f ′ (0). Insbesondere ist die Exponentialfunktion die eindeutige differenzierbare Abbildung f : R → R mit f (0) = f ′ (0) = 1 und f (x + y) = f (x)f (y) für alle x, y ∈ R. 10 Trigonometrische Funktionen In diesem Kapitel führen wir die Cosinus- und Sinus-Funktionen ein. Erinnerung: Für Punkte P = (x, y) und Q = (x′ , y ′) in R2 ist der Abstand zwischen P und Q gegeben durch p d(P, Q) = (x′ − x)2 + (y ′ − y)2 . Betrachte den Kreis S 1 in der euklidischen Ebene R2 mit Radius 1 und Mittelpunkt O = (0, 0). Also besteht S 1 aus den Punkten (x, y) in R2 mit x2 + y 2 = 1, da sie genau√die Punkte sind, die Abstand 1 zu O haben. Für jedes a ∈ [0, 1] sei Pa = (a, 1 − a2 ) der Punkt auf dem Kreis, der über a liegt und sei OPa die Verbindungsgerade zwischen O und Pa . Insbesondere ist P1 = (1, 0) und somit ist OP1 ein Teil von der x-Achse. Sei a ∈ [0, 1] und sei θ der Winkel zwischen OP1 und OPa . Dann lernt man in der Schule, dass √ cos(θ) = a und sin(θ) = 1 − a2 . Pa = (a, √ 1 − a2 ) 1 sin(θ) θ O a cos(θ) P1 Wie misst man aber den Winkel θ? Im Alltag wird der Grad als Maßeinheit benutzt, wobei 1 Grad als 360. Teil des Vollwinkels definiert ist. (Für a ∈ [0, 1] liegt also der Winkel θ zwischen 0 und 90 Grad.) Für fast alle Anwendungen in der Mathematik ist es jedoch besser, Bogenmaß zu verwenden: Wenn θ in Bogenmaß gemessen wird, so ist θ die Länge des Kreisbogens zwischen P1 und 47 10 Trigonometrische Funktionen 48 Pa . (Der Vollwinkel hat also ein Bogenmaß von 2π, wobei per Definition π die Hälfte des Umfangs von einem Kreis mit Radius 1 ist, und für a ∈ [0, 1] liegt das Bogenmaß von θ zwischen 0 und π/2.) Wir werden nicht direkt mit der Länge des Kreisbogens arbeiten, da dies nicht so einfach ist, sondern mit einem Flächeninhalt, der im Wesentlichen den gleichen Wert ergibt. Für jedes a ∈ [0, 1] sei Fa die Fläche, die durch die Verbindungsgeraden OP1 , OPa und den Kreisbogen zwischen P1 und Pa bestimmt ist. Im Bild ist diese Fläche das gelb gefärbte Gebiet. Pa = (a, √ 1 − a2 ) θ O a P1 Im Folgenden machen wir von der Tatsache Gebrauch, dass die Länge des Kreisbogens zwischen P1 und Pa zweimal der Fächeninhalt von Fa ist. Auf einem Beweis wird hier verzichtet, da wir die Länge eines Kreisbogens nicht definieren wollen. In der Schule hat man aber mindestens einen Spezialfall davon gesehen: Der Umfang eines Kreises vom Radius 1 ist 2π und der Flächeninhalt der Kreisscheibe ist die Hälfte von 2π, nämlich π. Der Flächeninhalt von Fa wird durch ein Integral gegeben: Sei ha : [0, 1] → R die stetige Abbildung, deren Graphen durch die rote Linie gegeben ist. Auf dem Intervall [0, a] ist also ha eine Gerade und auf dem Intervall [a, 1] ist ha ein Kreisbogen. Genauer haben wir √ ( √ 1 − a2 /a)x falls 0 < x < a , ha (x) = 1 − x2 falls a ≤ x ≤ 1 , 10 Trigonometrische Funktionen 49 √ da 1 − a2 /a die Steigerung der Verbindungsgeraden OPa ist. (Wenn a = 0, ist √ die Steigerung nicht definiert, aber in diesem Fall ist ha (x) = 1 − x2 für alle x ∈ [0, 1].) Nun ist Fa = Fha = {(x, y) ∈ R2 : x ∈ [0, 1] und 0 ≤ y ≤ ha (x)} R und damit ist der Flächeninhalt von Fa durch das Integral ha gegeben. Definiere eine Abbildung γ : [0, 1] → R durch Z γ(a) = 2 ha für jedes a ∈ [0, 1]. Insbesondere ist γ(1) = 0 und γ(0) = π/2 (da es sich um einen rechten Winkel handelt, wenn a = 0). Da wir Bogenmaß verwenden, um den Winkel θ zwischen den Verbindungsgeraden OP1 und OPa zu messen, ist θ = γ(a). Lemma 10.1 Für alle a ∈ [0, 1] gilt Z 1√ √ 2 γ(a) = a 1 − a + 2 1 − x2 dx . a Lemma 10.2 Die Abbildung γ ist stetig, γ ist differenzierbar in (0, 1) und es gilt γ ′ (a) = − √ 1 1 − a2 für alle a ∈ (0, 1). Insbesondere ist γ ′ (a) < 0 für alle a ∈ (0, 1) und folglich ist nach Satz 7.7 (2) γ streng monoton fallend. Ferner ist γ([0, 1]) = [0, π/2]. Da nach Lemma 10.2 γ : [0, 1] → R stetig und streng monoton fallend ist und γ([0, 1]) = [0, π/2], gibt es die Umkehrabbildung γ −1 : [0, π/2] → R. Also gilt γ −1 ([0, π/2]) = [0, 1], γ −1 ist ebenfalls streng monoton fallend und nach Satz 6.6 ist γ −1 stetig. Sei a ∈ [0, 1] und sei θ der Winkel zwischen den Verbindungsgeraden OP1 und OPa . Dann ist einerseits θ = γ(a) und andererseits a = cos(θ) und daraus ergibt sich, dass cos(θ) = a = γ −1 (γ(a)) = γ −1 (θ). Für jedes θ ∈ [0, π/2] ist also cos(θ) = γ −1 (θ) p p und damit auch sin(θ) = 1 − (cos(θ))2 = 1 − (γ −1 (θ))2 . 10 Trigonometrische Funktionen 50 Satz 10.1 Die Abbildungen cos, sin : [0, π/2] → R sind stetig, cos ist streng monoton fallend und sin streng monoton wachsend mit cos(0) = 1, cos(π/2) = 0, sin(0) = 0 und sin(π/2) = 1. Ferner sind beide Abbildungen differenzierbar in (0, π/2) und für alle θ ∈ (0, π/2) gilt cos′ (θ) = − sin(θ) und sin′ (θ) = cos(θ) . 1 sin cos 0 π/2 Der folgende Satz zeigt, dass die Abbildung cos, sin : [0, π/2] → R eindeutig durch die in Satz 10.1 vorkommenden Eigenschaften bestimmt sind. Satz 10.2 Seien s, c : [0, π/2] → R stetige Abbildungen, für die gilt: (1) s(0) = 0 und c(0) = 1, (2) s und c sind in (0, π/2) differenzierbar, (3) s′ (θ) = c(θ) und c′ (θ) = −s(θ) für alle θ ∈ (0, π/2). Dann ist s = sin und c = cos. Satz 10.3 Für alle θ ∈ [0, π/2] gilt sin(π/2 − θ) = cos(θ) und cos(π/2 − θ) = sin(θ) . 10 Trigonometrische Funktionen 51 Bisher sind die Abbildungen sin und cos nur auf dem Intervall [0, π/2] definiert. Der Definitionsbereich dieser Abbildungen wird jetzt schrittweise erweitert, so dass wir schließlich Abbildungen sin, cos : R → R haben, die auf der ganzen reellen Achse definiert sind. In diesem Erweiterungsprozess wird das folgende Ergebnis benötigt: Lemma 10.3 Seien a, b, c ∈ R mit a < b < c und seien f : [a, b] → R und g : [b, c] → R Abbildungen mit f (b) = g(b); definiere h : [a, c] → R durch f (x) falls x ∈ [a, b] , h(x) = g(x) falls x ∈ (b, c] . Dann gilt: (1) Sind f und g stetig, so ist h ebenfalls stetig. (2) Ist f in (a, b) und g in (b, c) differenzierbar und gibt es eine an der Stelle b stetige Abbildung d : [a, c] → R mit f ′ (x) = d(x) für alle x ∈ (a, b) und g ′ (x) = d(x) für alle x ∈ (b, c), so ist h in (a, c) differenzierbar und h′ (x) = d(x) für alle x ∈ (a, c). Nun zum Erweiterungsverfahren: Schritt 1: Der Definitionsbereich der Abbildungen sin und cos wird vom Intervall [0, π/2] zum Intervall [0, π] erweitert. Sei θ ∈ [π/2, π]; dann ist θ der Winkel zwischen der√Verbindungsgeraden OP1 und einer Verbindungsgeraden OPa′ , wobei Pa′ = (−a, 1 − a2 ) mit a ∈ [0, 1]. Ferner ist π − θ ∈ [0, π/2] und π − θ √ ist der Winkel zwischen den Verbindungsgeraden OP1 und OPa , wobei Pa = (a, 1 − a2 ). Pa′ = (−a, √ √ Pa = (a, 1 − a2 ) 1 − a2 ) θ −a O π−θ a P1 Nach der Definition√von cos und sin auf dem Intervall [0, π/2] ist cos(π − θ) = a und sin(π − θ) = 1 − a2 ,√und wie man in der Schule gelernt hat, soll cos(θ) gleich −a und sin(θ) gleich 1 − a2 sein. Folglich setzen wir für jedes θ ∈ [π/2, π] cos(θ) = − cos(π − θ) und sin(θ) = sin(π − θ) . 10 Trigonometrische Funktionen 52 1 sin 0 π/2 π cos −1 Man beachte: Das Element π/2 liegt sowohl im Intervall [0, π/2] als auch im Intevall [π/2, π] und damit gibt es zwei Definitionen für cos(π/2) und sin(π/2). Sie stimmen aber überein, da cos(π/2) = 0 = − cos(π − π/2) und sin(π) = sin(π − π/2) . Nach Satz 3.4 und Satz 4.4 sind beide Abbildungen stetig im Intervall [π/2, π] und differenzierbar in (π/2, π) und sin′ (θ) = − sin′ (π − θ) = − cos(π − θ) = cos(θ) und cos′ (θ) = − cos′ (π − θ) = − sin(π − θ) = − sin(θ) für alle θ ∈ (π/2, π). Nach Lemma 10.3 (1) sind also die Abbildungen cos, sin : [0, π] → R stetig und nach Lemma 10.3 (2) sind sie differenzierbar in (0, π) mit cos′ (θ) = − sin(θ) und sin′ (θ) = cos(θ) für alle θ ∈ (0, π). Schritt 2: Der Definitionsbereich der Abbildungen sin und cos wird vom Intervall [0, π] zum Intervall [0, 2π] erweitert. Sei θ ∈ [π, 2π]; dann ist θ der Winkel zwischen der √ Verbindungsgeraden OP1 und einer Verbindungsgeraden OPa′′, wobei Pa′′ = (a, − 1 − a2 ) mit a ∈ [−1, 1]. Ferner ist 2π −θ ∈ [0, π] und 2π −θ ist √ der Winkel zwischen den Verbindungsgeraden OP1 und OPa , wobei Pa = (a, − 1 − a2 ). 10 Trigonometrische Funktionen 53 √ Pa = (a, 1 − a2 ) θ 2π − θ a P1 √ Pa′′ = (a, − 1 − a2 ) Nach der Definition√von cos und sin auf dem Intervall [0, π] ist cos(2π − θ) = a , und wie man in der Schule gelernt hat, soll cos(θ) und sin(2π − θ) = 1 − a2√ gleich a und sin(θ) gleich − 1 − a2 sein. Folglich setzen wir für jedes θ ∈ [π, 2π] cos(θ) = cos(2π − θ) und sin(θ) = − sin(2π − θ) . 1 cos 0 π 2π sin −1 Man beachte: Das Element π liegt sowohl im Intervall [0, π] als auch im Intevall [π, 2π] und damit gibt es zwei Definitionen für cos(π) und sin(π). Sie stimmen aber überein, da cos(π) = cos(2π − π) und sin(π) = 0 = − sin(2π − π) . Nach Satz 3.4 und Satz 4.4 sind beide Abbildungen stetig im Intervall [π, 2π] und differenzierbar in (π, 2π) und sin′ (θ) = −(− sin′ (2π − θ)) = cos(2π − θ) = cos(θ) 10 Trigonometrische Funktionen 54 und cos′ (θ) = − cos′ (2π − θ) = sin(2π − θ) = − sin(θ) für alle θ ∈ (π, 2π). Nach Lemma 10.3 (1) sind also die Abbildungen cos, sin : [0, 2π] → R stetig und nach Lemma 10.3 (2) sind sie differenzierbar in (0, 2π) mit cos′ (θ) = − sin(θ) und sin′ (θ) = cos(θ) für alle θ ∈ (0, 2π). Schritt 3: Der Definitionsbereich der Abbildungen sin und cos wird vom Intervall [0, 2π] zum Intervall R+ erweitert. Sei n ∈ N und θ ∈ [2πn, 2π(n + 1)]. Dann ist θ − 2πn ∈ [0, 2π] und θ und θ − 2πn sind von der gleichen Verbindungsgeraden abgeschlossen. Folglich setzen wir cos(θ) = cos(θ − 2πn) und sin(θ) = sin(θ − 2πn) für jedes θ ∈ [2πn, 2π(n + 1)]. sin 0 2π cos 4π 6π 8π Man beachte: Das Element 2π(n + 1) liegt sowohl im Intervall [2πn, 2π(n + 1)] als auch im Intevall [2π(n + 1), 2π(n + 2)] und damit gibt es zwei Definitionen für cos(2π(n + 1)) und sin(2π(n + 1)). Sie stimmen aber überein, da cos(2π(n + 1) − 2π(n + 1)) = cos(0) = 1 = cos(2π) = cos(2π(n + 1) − 2πn) , sin(2π(n + 1) − 2π(n + 1)) = sin(0) = 0 = sin(2π) = sin(2π(n + 1) − 2πn) . Beide Abbildungen sind stetig im Intervall [2πn, 2π(n + 1)] und differenzierbar in (2πn, 2π(n + 1)) und sin′ (θ) = sin′ (θ − 2πn)) = cos(θ − 2πn) = cos(θ) und cos′ (θ) = cos′ (θ − 2πn) = − sin(θ − 2πn) = − sin(θ) für alle θ ∈ (2πn, 2π(n + 1)). Nach Lemma 10.3 (1) sind also die Abbildungen cos, sin : R+ → R stetig und nach Lemma 10.3 (2) sind sie differenzierbar in (0, ∞) mit cos′ (θ) = − sin(θ) und sin′ (θ) = cos(θ) für alle θ ∈ (0, ∞). Schritt 4: Der Definitionsbereich der Abbildungen sin und cos wird vom Intervall R+ zur ganzen reellen Achse R erweitert. Sei θ ∈ (−∞, 0]; ist θ der Winkel zwischen der Verbindungsgeraden OP1 und √ 2 einer Verbindungsgeraden OPa, wobei Pa = (a, b) mit b = ± 1 − a , so ist −θ der Winkel zwischen den Verbindungsgeraden OP1 und OPa′′, wobei Pa′′ = (a, −b). Folglich setzen wir für jedes θ ∈ (−∞, 0] cos(θ) = cos(−θ) und sin(θ) = − sin(−θ) . 10 Trigonometrische Funktionen 55 sin −4π −2π cos 0 2π 4π Die zwei Definitionen für cos(0) und sin(0) stimmen überein, da cos(0) = cos(−0) und sin(0) = 0 = − sin(−0) . Nach Satz 3.4 und Satz 4.4 sind beide Abbildungen stetig im Intervall (−∞, 0] und differenzierbar in (−∞, 0) und sin′ (θ) = −(− sin′ (−θ)) = cos(−θ) = cos(θ) und cos′ (θ) = − cos′ (−θ) = sin(−θ) = − sin(θ) für alle θ ∈ (−∞, 0). Nach Lemma 10.3 (1) sind also die Abbildungen cos, sin : R → R stetig und nach Lemma 10.3 (2) sind sie differenzierbar mit cos′ (θ) = − sin(θ) und sin′ (θ) = cos(θ) für alle θ ∈ R. Am Ende dieses Erweiterungsverfahrens haben wir differenzierbare Abbildungen sin, cos : R → R mit sin(0) = 0, cos(0) = 1, sin′ = cos und cos′ = − sin. Die Abbildungen sin und cos sind eindeutig durch diese Eigenschaften bestimmt: Satz 10.4 Seien s, c : R → R differenzierbare Abbildungen, für die gilt: (1) s(0) = 0 und c(0) = 1, (2) s′ (θ) = c(θ) und c′ (θ) = −s(θ) für alle θ ∈ R. Dann ist s = sin und c = cos. Satz 10.5 Die Abbildungen sin, cos : R → R haben folgende Eigenschaften: (1) Für alle θ ∈ [0, π/2] gilt cos(π/2 − θ) = sin(θ) und sin(π/2 − θ) = cos(θ). (2) Für alle θ ∈ [0, π] gilt cos(π − θ) = − cos(θ) und sin(π − θ) = sin(θ). (3) Für alle θ ∈ [0, 2π] gilt cos(2π − θ) = cos(θ) und sin(2π − θ) = − sin(θ). (4) Für alle θ ∈ R, n ∈ Z gilt cos(θ + 2πn) = cos(θ) und sin(θ + 2πn) = sin(θ). (5) Für alle θ ∈ R gilt cos(−θ) = cos(θ) und sin(−θ) = − sin(θ). (6) Die Abbildung cos ist streng monoton fallend im Intervall [0, π] und streng monoton wachsend im Intervall [π, 2π]. (7) Die Abbildung sin ist streng monoton wachsend im Intervall [0, π/2] und im Intervall [3π/2, 2π] und ist streng monoton fallend im Intervall [π/2, 3π/2]. 11 Folgen In den meisten Büchern über Analysis werden Folgen gerade am Anfang eingeführt und sie dienen als Grundlage für die Behandlung von Stetigkeit und Differenzierbarkeit. Dies ist dafür (offensichtlich) nicht unbedingt notwendig, für die Weiterentwicklung der Theorie sind sie aber unverzichtbar. Unter einer Folge aus R versteht man eine Abbildung ̺ : N× → R. Jedem n ∈ N× = {1, 2, . . .} ist also ein Element xn = ̺(n) ∈ R zugeordnet und man schreibt hierfür meistens {xn }n≥1 statt ̺. Manchmal ist es nützlich, eine Folge nicht mit 1, sondern mit 0 oder mit einem Index p ≥ 2 anzufangen. In diesem Fall schreiben wir dann {xn }n≥0 (bzw. {xn }n≥p ) statt {xn }n≥1 . Die Definitionen (bzw. Ergebnisse) werden hier für Folgen formuliert, die mit dem Index 1 starten, aber sie machen einen Sinn (bzw. sie gelten) auch dann, wenn dies nicht der Fall ist. Sei {xn }n≥1 eine Folge aus R. Die Folge heißt konvergent gegen x ∈ R, falls es zu jedem ε > 0 ein m ≥ 1 gibt, so dass |xn − x| < ε für alle n ≥ m. Sei {xn }n≥1 eine Folge, x ∈ R und p ≥ 1. Offensichtlich hängt es nicht von den ersten Gliedern x1 , . . . , xp−1 ab, ob {xn }n≥1 gegen x konvergiert. Also konvergiert {xn }n≥1 gegen x genau dann, wenn {xn }n≥p gegen x konvergiert. Lemma 11.1 Sei {xn }n≥1 eine Folge aus R und seien x, x′ ∈ R. Konvergiert {xn }n≥1 gegen x und gegen x′ , so ist x′ = x. Konvergiert eine Folge {xn }n≥1 aus R gegen x, so nennt man x den Grenzwert oder den Limes der Folge und schreibt limn→∞ xn = x oder nur limn xn = x. Nach Lemma 11.1 macht diese Schreibweise einen Sinn. Wichtige Beispiele: (1) Es gilt limn 1/n = 0; die Folge {1/n}n≥1 konvergiert also gegen 0: Sei ε > 0; nach Satz 5.1 (Satz von Archimedes) gibt es ein m ≥ 1, so dass m > ε−1 , und für alle n ≥ m ist dann |1/n − 0| = 1/n ≤ 1/m < ε; folglich gilt limn 1/n = 0. (In der Tat ist die Aussage, dass die Folge {1/n}n≥1 gegen 0 konvergiert, äquivalent zu der Behauptung im Satz von Archimedes.) (2) Für jedes x ∈ R mit |x| < 1 konvergiert die Folge {xn }n≥0 der Potenzen von x gegen 0: Es gilt limn xn = 0. Dies folgt wie in (1) mit Hilfe der folgenden nützlichen Bernoullischen Ungleichung: Lemma 11.2 Sei x ∈ R mit x > −1. Dann gilt (1 + x)n ≥ 1 + nx für alle n ∈ N. Eine Folge {xn }n≥1 aus R heißt beschränkt, wenn es ein c ∈ R+ gibt, so dass |xn | ≤ c für alle n ≥ 1. 56 11 Folgen 57 Lemma 11.3 Jede konvergente Folge aus R ist beschränkt. Satz 11.1 Seien {xn }n≥1 , {yn }n≥1 zwei konvergente Folgen mit x = limn xn und y = limn yn . (1) Für alle a, b ∈ R konvergiert auch die Folge {axn + byn }n≥1 , und es gilt lim (axn + byn ) = ax + by . n→∞ (2) Die Produktfolge {xn yn }n≥1 konvergiert, und es gilt limn xn yn = xy. (3) Nehme an, dass xn 6= 1 für alle n ≥ 1 und x 6= 1. Dann konvergiert die Folge {1/xn }n≥1 , und es gilt limn 1/xn = 1/x. Satz 11.2 (1) Sei {xn }n≥1 eine konvergente Folge reeller Zahlen mit xn ≥ 0 für alle n ≥ 1. Dann ist limn xn ≥ 0. (2) Seien {xn }n≥1 , {yn }n≥1 zwei konvergente Folgen reeller Zahlen mit xn ≤ yn für alle n ≥ 1. Dann ist limn xn ≤ limn yn . Sei {xn }n≥1 eine Folge aus R und sei 1 ≤ n1 < n2 < · · · eine aufsteigende Folge aus N× . Dann heißt die Folge {xnk }k≥1 (d.h. die Folge {yk }k≥1 mit yk = xnk für alle k ≥ 1) Teilfolge der Folge {xn }n≥1 . Bemerkung: Ist n1 < n2 < · · · eine aufsteigende Folge aus N× , so ist nm ≥ m für alle m ≥ 1. Sei {xn }n≥1 eine Folge und sei p ≥ 1. Dann ist die Folge {xn }n≥p sowie jede ihrer Teilfolgen eine Teilfolge von {xn }n≥1 . Lemma 11.4 Sei {xn }n≥1 eine konvergente Folge aus R mit limn xn = x. Dann konvergiert jede Teilfolge – auch gegen x. In diesem Kapitel haben wir bisher Annahme 5 nur gebraucht um zu zeigen, dass limn 1/n = 0 und limn z n = 0, falls |z| < 1. Im Rest des Kapitels aber spielen die Folgerungen aus Annahme 5 eine entscheidende Rolle. Satz 11.3 (Bolzano-Weierstraß) Jede beschränkte Folge aus R besitzt eine konvergente Teilfolge. Eine Folge {xn }n≥1 aus R heißt Cauchy-Folge, wenn es zu jedem ε > 0 ein q ≥ 1 gibt, so dass |xm − xn | < ε für alle m, n ≥ q. 11 Folgen 58 Lemma 11.5 Jede Cauchy-Folge aus R ist beschränkt. Lemma 11.6 Besitzt eine Cauchy-Folge aus R eine konvergente Teilfolge, so ist sie selbst konvergent. Satz 11.4 Eine Folge aus R konvergiert genau dann, wenn sie eine Cauchy-Folge ist. Eine Folge {xn }n≥1 reeller Zahlen heißt monoton wachsend, falls xn ≤ xn+1 für alle n ≥ 1, streng monoton wachsend, falls xn < xn+1 für alle n ≥ 1, monoton fallend, falls xn+1 ≤ xn für alle n ≥ 1, streng monoton fallend, falls xn+1 < xn für alle n ≥ 1 und monoton, falls sie monoton wachsend oder monoton fallend ist. Es ist klar, dass eine monoton wachsende (bzw. ein monoton fallende) Folge {xn }n≥1 reeller Zahlen genau dann beschränkt ist, wenn die Menge {xn : n ≥ 1} = {x ∈ R : es gibt ein n ≥ 1, so dass x = xn } nach oben (bzw. nach unten) beschränkt ist. Satz 11.5 Jede beschränkte monotone Folge {xn }n≥1 reeller Zahlen konvergiert. Es folgen zwei Beispiele, die zeigen, wie Folgen benutzt werden können, um Zahlen zu konstruieren. Satz 11.6 Seien a, x0 ∈ R mit a > 0, x0 > 0 und sei {xn }n≥1 die Folge mit 1 a xn+1 = xn + 2 xn √ für alle n ∈ N. Dann gilt limn xn = a. Satz 11.7 Sei c ∈ R mit 0 ≤ c < 1 und sei {xn }n≥0 eine Folge aus R mit |xn+2 − xn+1 | ≤ c|xn+1 − xn | für alle n ≥ 0. Dann konvergiert die Folge {xn }n≥0 . 11 Folgen 59 Die Stetigkeit einer Abbildung f : A → R kann mit Hilfe von Folgen formuliert werden, und die zweite Aussage im nächsten Satz wird oft als Definition von Stetigkeit verwendet. Satz 11.8 Sei A eine nichtleere Teilmenge von R, sei f : A → R eine Abbildung und a ∈ A. Dann sind äquivalent: (1) f ist an der Stelle a stetig. (2) Die Folge {f (xn )}n≥1 konvergiert gegen f (a) für jede Folge {xn }n≥1 aus A, die gegen a konvergiert. Satz 11.8 hätte man nicht in Kapitel 3 beweisen können, da man hier benötigt, dass limn 1/n = 0, und dies ist nur eine Umformulierung vom Satz 5.1 (Satz von Archimedes). 12 Unendliche Reihen Sei {xn }n≥1 eine Folge aus R und für jedes n ≥ 1 sei sn = n X xk k=1 (= x1 + x2 + · · · + xn ) . Dann heißt die Folge {sn }n≥1 dieser Partialsummen (unendliche) Reihe mit den P Gliedern xn , n ≥ 1, und wird mit ∞ bezeichnet. Konvergiert die Reihe n=1 xn P P∞ ∞ n=1 xn , so wird ihr Grenzwert ebenfalls mit n=1 xn bezeichnet und heißt dann Summe der Reihe. Bei Reihen fängt man oft mit dem Index 0 an; in diesem Fall gibt es eine Folge P∞ {xn }n≥0 , die Folge {sn }n≥0 der Partialsummen und die (unendliche) Reihe n=0 xn . P n Wichtiges Beispiel: Die geometrische Reihe ∞ n=0 x konvergiert mit der Summe ∞ X n=0 xn = (1 − x)−1 P für jedes x ∈ R mit |x| < 1. (Sei x 6= 1 fest und für jedes n ≥ 0 sei sn = nk=0 xk ; dann ist sn = (1 − x)−1 (1 − xn+1 ) und damit |sn − (1 − x)−1 | = |1 − x|−1 |x|n+1 . Daraus folgt, dass {sn }n≥0 gegen (1 − x)−1 konvergiert, falls |x| < 1. P∞die Folge D.h.: die Reihe n=0 xn konvergiert mit der Summe (1 − x)−1 , wenn |x| < 1.) Sei {xn }n≥1 eine Folge aus R und sei qP≥ 1. Dann ist es klar, dass die Reihe P ∞ dann konvergiert, wenn ∞ n=1 xn genauP n=q Px∞n konvergiert. Konvergieren diese Reihen, so ist ∞ x = x + · · · + x + 1 q−1 n=1 n n=q xn . Satz 12.1 Sei {xn }n≥1Peine Folge reeller Zahlen mit xn ≥ 0 für alle n ≥ 1. Dann nach konvergiert die Reihe ∞ n=1 xn genau, wenn die Folge der Partialsummen Pn oben beschränkt ist, d.h., genau dann, wenn es ein c ≥ 0 gibt, so dass k=1 xk ≤ c für alle n ≥ 1. P Nach Satz 12.1 konvergiert die harmonische Reihe ∞ nicht, da für jedes n=1 1/n P∞ P2p p ≥ 0 gilt n=1 1/n ≥ p/2. Dagegen konvergiert die Reihe n=1 1/n2 , da n n n X X X 1 1 1 1 1 = 1 + 1 − ≤2 ≤ 1 + = 1 + − k2 k(k − 1) k−1 k n k=2 k=2 k=1 für alle n > 1. Im Folgenden sei {xn }n≥1 eine Folge aus R. Folgendes ist das Cauchysche Konvergenz-Kriterium: 60 12 Unendliche Reihen 61 P∞ Satz 12.2 Die unendliche Reihe P genau dann, wenn es zu n=1 xn konvergiert n jedem ε > 0 ein q ≥ 1 gibt, so dass k=m xk < ε für alle n ≥ m ≥ q. Satz 12.3 Für jede konvergente Reihe gegen 0. P∞ n=1 xn konvergiert die Folge {xn }n≥1 Satz 12.4 Sei {cn }n≥1Peine Folge reeller Zahlen mit |xn | ≤ cn P für alle n ≥ 1. ∞ ∞ c (in R), so konvergiert die Reihe Konvergiert die Reihe n=1 xn und es n=1 n P∞ P∞ P∞ gilt n=1 xn ≤ n=1 cn . Insbesondere konvergiert n=1 xn mit ∞ ∞ X X |xn | , xn ≤ n=1 P∞ n=1 falls die Reihe n=1 |xn | in R konvergiert. P P∞ Die Reihe ∞ x heißt absolut konvergent, falls die Reihe n n=1 n=1 |xn | konvergiert (in R). Die letzte Aussage in Satz 12.4 sagt also, dass eine absolut konvergente Reihe auch im gewöhnlichen Sinn konvergiert. P n Insbesondere konvergiert die geometrische Reihe ∞ n=0 x absolut für jedes x ∈ R mit |x| < 1. Nun werden einige Konvergenz-Kriterien für Reihen betrachtet. Im Folgenden sei wieder {xn }n≥1 eine Folge aus R. Satz 12.5 (Majoranten-Kriterium) Sei {cn }n≥1 eine Folge reeller Zahlen mit |x für alle n ≥ 1. Konvergiert die Reihe Pn∞| ≤ cn (und insbesondere ist dann cn ≥ 0) P∞ n=1 cn (in R), so konvergiert die Reihe n=1 xn absolut und ∞ ∞ X X xn ≤ cn . n=1 n=1 Satz 12.6 (Quotienten-Kriterium) Nehme an, dass xn 6= 0 für alle n ≥ 1 und dass es ein θ ∈ R mit 0 P < θ < 1 gibt, so dass |xn+1 |/|xn | ≤ θ für alle n ≥ 1. Dann konvergiert die Reihe ∞ n=1 xn absolut. Satz 12.7 (Das Leibnizsche Kriterium) Sei {xn }n≥1 eine monoton fallende Folge reeller Zahlen, die gegen 0 konvergiert (insbesondere ist also xn ≥ 0 für alle P∞ n ≥ 1). Dann konvergiert die alternierende Reihe n=1 (−1)n xn . P Im Gegensatz zu der harmonischen Reihe ∞ n=1 1/n konvergiert nach Satz 12.7 P∞ die alternierende harmonische Reihe n=1 (−1)n+1 /n. Natürlich kann diese Reihe nicht absolut konvergieren, da die harmonische Reihe nicht konvergiert.