Funktionen: Sommersemester 2009

Funktionen
Chris Preston
Sommersemester 2009
Skript ohne Beweise
Inhaltsverzeichnis
1 Die rationalen Zahlen
3
2 Die reellen Zahlen
10
3 Stetige Funktionen
16
4 Differentiation
22
5 Mehr über die reellen Zahlen
26
6 Mehr über stetige Funktionen
30
7 Mehr über Differentiation
33
8 Integration von stetigen Funktionen
36
9 Die Funktionen log und exp
45
10 Trigonometrische Funktionen
47
11 Folgen
56
12 Unendliche Reihen
60
1
Die rationalen Zahlen
In diesem Kapitel werden die rationalen Zahlen kurz diskutiert. Vorausgesetzt
werden adäquate Kenntnisse über die ganzen Zahlen Z = {. . . , −2, −1, 0, 1, 2, . . .}
sowie über die natürlichen Zahlen N = {0, 1, 2, . . .}. Wichtige Eigenschaften, die
wir brauchen, sind: Sind m, n ∈ Z mit m 6= 0 und n 6= 0, so ist auch mn 6= 0. Es
gilt 0n = n0 = 0 für alle n ∈ Z. Ist n ∈ Z mit n 6= 0, so ist genau eines von n
und −n in N \ {0}.
Eng verbunden mit den rationalen Zahlen sind ihre konkreten Manifestationen
als Brüche (und in der Praxis ist die Rechnung mit rationalen Zahlen eigentlich
Bruchrechnung.) Ein Bruch ist ein Ausdruck der Form m/n mit m, n ∈ Z und
n 6= 0. Brüche kann man addieren und multiplizieren, wie man das in der Schule
schon gelernt hat. Brüche sind keine rationalen Zahlen, sie werden aber verwendet,
um rationale Zahlen darzustellen.
Wir werden nicht explizit sagen, was rationale Zahlen sind, werden aber erklären,
wie man sich diese anschaulich vorstellen kann. Dafür wird das Bild der Zahlengeraden verwendet. Die Zahlengerade ist eine in beiden Richtungen unendliche
Gerade, auf der bestimmte Punkte mit Zahlen identifiziert sind. Zunächst werden
die ganzen Zahlen in ihrer natürlichen Reihenfolge und mit den gleichem Abstand
zwischen einer Zahl und der nächsten auf die Zahlengerade gelegt:
−3
−2
−1
0
1
2
3
Die rationalen Zahlen füllen dann zu einem bestimmten Grad die Punkte auf der
Zahlengeraden auf. Jeder Bruch beschreibt, wie ein Punkt auf der Zahlengeraden
konstruiert werden kann, und die Punkte, die auf diese Weise entstehen, sind die
rationalen Zahlen.
Sei zunächst m/n ein Bruch mit n ∈ N \ {0}; dann wird die entsprechende
rationale Zahl auf der Zahlengeraden durch das folgende Verfahren konstruiert:
(1) Das Intervall zwischen 0 und 1 wird in n gleiche Teilintervalle geteilt und das
erste, das 0 als linken Endpunkt hat, wird als Meß-Einheit benutzt.
↓ ↓
−2
−1
0
1
2
(In diesem Beispiel ist n = 5. Die Endpunkte des ersten Teilintervalls werden mit
Pfeilen markiert.)
(2) Ist m ∈ N \ {0}, so reihen wir m Kopien von der Meß-Einheit in der positiven
Richtung aneinander. Das erste Intervall hat 0 als linken Endpunkt und der rechte
3
1 Die rationalen Zahlen
4
Endpunkt eines Intervalls ist der linke Endpunkt des nächsten Intervalls. Der
rechte Endpunkt des letzten Intervalls ist dann die rationale Zahl, die durch
den Bruch konstruiert wird. (Im folgenden Beispiel ist n = 5 und m = 8. Der
konstruierte Punkt wird mit einem Pfeil markiert.)
↓
−2
−1
0
1
2
(3) Ist −m = p ∈ N \ {0}, so reihen wir p Kopien von der Meß-Einheit in der
negativen Richtung aneinander. Das erste Intervall hat 0 als rechten Endpunkt
und der linke Endpunkt eines Intervalls ist der rechte Endpunkt des nächsten
Intervalls. Der linke Endpunkt des letzten Intervalls ist dann die rationale Zahl,
die durch den Bruch konstruiert wird. (Im folgenden Beispiel ist n = 5 und
m = −7. Der konstruierte Punkt wird mit einem Pfeil markiert.)
↓
−2
−1
0
1
2
(4) Ist m = 0, so ist der Nullpunkt 0 die rationale Zahl, der durch den Bruch
konstruiert wird.
↓
−2
−1
0
1
2
Ist nun m/n ein Bruch mit −n ∈ N \ {0}, so konstruiert m/n die gleiche rationale
Zahl wie den Bruch (−m)/(−n).
Die rationale Zahl, die durch den Bruch m/n konstruiert wird, werden wir mit
[m/n] bezeichnen.
Insbesondere ist jede ganze Zahl eine rationale Zahl, und es gilt m = [m/1] für
jedes m ∈ Z, d.h. der Bruch m/1 konstruiert die ganze Zahl m.
Nun ist es möglich, dass zwei verschiedene Brüche die gleiche rationale Zahl
konstruieren. Zum Beispiel ist [n/n] = [1/1] für alle n ∈ Z \ {0}. Um dieses
Problem zu analysieren, brauchen wir zwei Beobachtungen, die anschaulich klar
sein sollen:
(1) Sind p, q, n ∈ Z mit n 6= 0, so gilt [p/n] = [q/n] genau dann, wenn p = q.
(2) Es gilt [(mk)/(nk)] = [m/n] für alle m, n, k ∈ Z mit n 6= 0, k 6= 0 (und dann
ist nk 6= 0).
(Im folgenden Beispiel ist n = 5, m = 8 und k = 2. Unterhalb der Geraden wird
die Konstruktion für den Bruch 8/5 und oberhalb der Geraden die Konstruktion
für den Bruch 16/10 = (8 · 2)/(5 · 2) abgebildet.)
1 Die rationalen Zahlen
5
↓
−2
−1
0
1
2
Lemma 1.1 Nehme an, dass (1) und (2) richtig sind und seien m/n, p/q zwei
Brüche. Dann gilt [m/n] = [p/q] genau, wenn mq = pn.
Wir sagen, dass Brüche m/n und p/q äquivalent sind und schreiben m/n ≈ p/q,
wenn mq = pn. Also konstruieren zwei Brüche die gleiche rationale Zahl genau
dann, wenn sie äquivalent sind.
Aus der Tatsache, dass m/n ≈ p/q genau dann gilt, wenn [m/n] = [p/q], folgen
drei Eigenschaften von der Relation ≈. Erstens gilt m/n ≈ m/n für jeden Bruch
m/n, (da [m/n] = [m/n]), und zweitens gilt p/q ≈ m/n, wenn m/n ≈ p/q (da
[p/q] = [m/n], falls [m/n] = [p/q]). Die dritte Eigenschaft ist: Sind m/n, p/q
und r/s Brüche mit m/n ≈ p/q und p/q ≈ r/s, so ist auch m/n ≈ r/s. (Aus
[m/n] = [p/q] und [p/q] = [r/s] folgt [m/n] = [r/s].)
Die Herleitung dieser Eigenschaften benutzt Lemma 1.1 und hängt also von Aussagen über die Zahlengerade ab. Andererseits hat die Definition von ≈ selbst
nichts mit der Zahlengeraden zu tun. Wie zeigen nun, dass die drei Eigenschaften
direkt aus den Regeln für die Multiplikation in Z folgen.
Lemma 1.2 (1) Es gilt m/n ≈ m/n für alle Brüche m/n.
(2) Sind m/n und p/q Brüche mit m/n ≈ p/q, so ist p/q ≈ m/n.
(3) Sind m/n, p/q und r/s Brüche mit m/n ≈ p/q und p/q ≈ r/s, so ist auch
m/n ≈ r/s.
Die folgenden Aussagen fassen die Beziehung zwischen Brüchen und rationalen
Zahlen zusammen:
(Q1) Jedem Bruch m/n wird eine rationale Zahl zugeordnet, die mit [m/n] bezeichnet wird.
(Q2) Für Brüche m/n und p/q gilt [m/n] = [p/q] genau dann, wenn m/n ≈ p/q.
(Q3) Zu jeder rationalen Zahl r gibt es einen Bruch m/n mit r = [m/n].
(Q4) Jede ganze Zahl ist auch eine rationale Zahl.
(Q5) Für jedes n ∈ Z ist n = [n/1].
Sämtliche Eigenschaften von den rationalen Zahlen, mit denen wir uns im Rest des
Kapitels befassen werden, folgen allein aus diesen fünf Aussagen. Man beachte,
dass die Zahlengerade hier nicht mehr explizit vorkommt.
1 Die rationalen Zahlen
6
Die Menge der rationalen Zahlen wird mit Q bezeichnet. Nach (Q4) ist Z eine Teilmenge von Q. Ist r eine rationale Zahl und m/n ein Bruch mit r = [m/n], dann
sagen wir, dass m/n die Zahl r darstellt oder dass r durch m/n dargestellt wird.
Nach (Q3) läßt sich jede rationale Zahl durch einen Bruch darstellen, aber diese
Darstellung ist nie eindeutig: Ist r eine rationale Zahl mit r = [m/n], so ist nach
(Q2) auch r = [(mp)/(np)] für alle p ∈ Z \ {0}, da (mp)/(np) ≈ m/n.
Lemma 1.3 (Existenz eines gemeinsamen Nenners) Seien r, s ∈ Q; dann
gibt es ℓ, m, n ∈ Z mit n 6= 0, so dass r = [ℓ/n] und s = [m/n].
Wir werden nun die Addition und Multiplikation von rationalen Zahlen einführen.
Dafür beginnen wir bei den Brüchen. Seien m/n und p/q Brüche; die Summe
m/n+ p/q und das Produkt (m/n)(p/q) von m/n und p/q werden definiert durch
m/n + p/q = (mq + pn)/(nq) ,
(m/n)(p/q) = (mp)/(nq) .
Man beachte: Da n 6= 0, q 6= 0, ist auch nq 6= 0 und also sind (mq + pn)/(nq)
und (mp)/(nq) auch Brüche.
Lemma 1.4 Seien a/b, c/d, m/n, p/q Brüche mit a/b ≈ m/n und c/d ≈ p/q.
Dann gilt a/b + c/d ≈ m/n + p/q und (a/b)(c/d) ≈ (m/n)(p/q).
Seien r, s ∈ Q; nach (Q3) gibt es dann Brüche m/n und p/q mit r = [m/n] und
s = [p/q]. Wir definieren die Summe r + s und das Produkt rs von r und s durch:
r + s = [m/n + p/q] und rs = [(m/n)(p/q)] .
Nach Lemma 1.4 macht dies einen Sinn: Sind a/b und c/d weitere Brüche mit
r = [a/b] und s = [c/d], so gilt nach (Q2), dass a/b ≈ m/n und c/d ≈ p/q, damit
ist nach Lemma 1.4 a/b + c/d ≈ m/n + p/q und (a/b)(c/d) ≈ (m/n)(p/q) und
dann ist nach (Q2) [a/b + c/d] = [m/n + p/q] und [(a/b)(c/d)] = [(m/n)(p/q)].
Die Definitionen von r + s und rs hängen also nicht davon ab, welche Brüche
man wählt, um r und s darzustellen.
Seien m, n ∈ Z; da nach (Q5) m = [m/1] und n = [n/1], ist die Summe von m
und n als rationale Zahlen gegeben durch
[m/1] + [n/1] = [(m · 1 + n · 1)/(1 · 1)] = [(m + n)/1] = m + n .
(Für die Multiplikation in Z gilt p · 1 = p für alle p ∈ Z.) Wenn man ganze Zahlen
m und n addiert als rationale Zahlen, so ist ihre Summe m + n nichts anderes als
1 Die rationalen Zahlen
7
ihre Summe als ganze Zahlen. Genauso ist ihr Produkt mn als rationale Zahlen
nichts anderes als ihr Produkt als ganze Zahlen, da
[m/1][n/1] = [(mn)/(1 · 1)] = [(mn)/1] = mn .
Wir untersuchen jetzt, welchen Regeln die Addition und die Multiplikation von
rationalen Zahlen unterliegen. Zunächst aber brauchen wir einige Eigenschaften
von der Addition und Multiplikation von Brüchen.
Lemma 1.5 Für die Addition und Multiplikation von Brüchen gilt Folgendes:
(a1) Für alle Brüche k/ℓ, m/n, p/q gilt
(k/ℓ + m/n) + p/q = k/ℓ + (m/n + p/q) .
(a2) Für alle Brüche m/n, p/q gilt m/n + p/q = p/q + m/n.
(a3) Für jeden Bruch m/n ist 0/1 + m/n = m/n.
(a4) Für jeden Bruch m/n ist (−m)/n + m/n = 0/(nn).
(m1) Für alle Brüche k/ℓ, m/n, p/q gilt
((k/ℓ)(m/n))(p/q) = (k/ℓ)((m/n)(p/q)) .
(m2) Für alle Brüche m/n, p/q gilt (m/n)(p/q) = (p/q)(m/n).
(m3) Für jeden Bruch m/n ist (1/1)(m/n) = m/n.
(d)
Für alle Brüche k/ℓ, m/n, p/q gilt
((kℓ)/(ℓℓ))(m/n + p/q) = (k/ℓ)(m/n) + (k/ℓ)(p/q) .
Lemma 1.6 Für einen Bruch m/n gilt [m/n] = 0 genau dann, wenn m = 0.
Satz 1.1 Die Addition und Multiplikation von rationalen Zahlen unterliegen den
folgenden Regeln:
(A1) Für alle r, s, t ∈ Q gilt (r + s) + t = r + (s + t).
(A2) Für alle r, s ∈ Q gilt r + s = s + r.
(A3) Für alle r ∈ Q ist 0 + r = r, wobei 0 die Null in Z ist.
(A4) Zu jedem r ∈ Q gibt es ein eindeutiges Element −r ∈ Q mit (−r) + r = 0.
(M1) Für alle r, s, t ∈ Q gilt (rs)t = r(st).
1 Die rationalen Zahlen
8
(M2) Für alle r, s ∈ Q gilt rs = sr.
(M3) Für alle r ∈ Q ist 1r = r, wobei 1 die Eins in Z ist.
(M4) Zu jedem r ∈ Q mit r 6= 0 gibt es ein eindeutiges Element r −1 ∈ Q mit
r −1 r = 1.
(D) Für alle r, s, t ∈ Q ist r(s + t) = rs + rt.
Lemma 1.7 Sei r ∈ Q und sei m/n ein Bruch mit r = [m/n].
(1) Es gilt −r = [(−m)/n].
(2) Ist r 6= 0 (und damit ist nach Lemma 1.6 m 6= 0), so ist r −1 = [n/m].
Sei n ∈ Z; dann gibt es eine eindeutige ganze Zahl −n ∈ Z, so dass −n + n = 0.
Aber dann gilt ebenfalls −n+ n = 0 in Q und daraus folgt nach der Eindeutigkeit
in Regel (A4) für Q, dass −n auch die eindeutige rationale Zahl ist mit −n+n = 0.
Für eine ganze Zahl n gibt es also keine Zweideutigkeit mit der Bedeutung von
−n.
Sind r, s ∈ Q mit s 6= 0, so schreibt man oft r/s oder rs statt s−1 r. Insbesondere
ist dann 1/s eine andere Schreibweise für s−1 (da 1/s = s−1 · 1 = s−1 ).
Hier muss man aber aufpassen: Seien m, n ∈ Z mit n 6= 0; dann sind m und n
rationale Zahlen und folglich gibt es die rationale Zahl n−1 m, die mit der neuen
Schreibweise mit m/n bezeichnet wird. Andererseits bezeichnet m/n auch einen
Bruch und in der Tat ist [m/n] = m/n, d.h. der Bruch m/n stellt die rationale
Zahl m/n dar. (Setze r = [m/n]. Dann ist
(n/1)(m/n) = (nm)/(1 · n) = (nm)/n ≈ m/1
und daraus ergibt sich nach (Q2), dass
nr = [n/1][m/n] = [(n/1)(m/n)] = [m/1] = m ,
d.h. es gilt nr = m in Q und damit ist r = 1 · r = (n−1 n)r = n−1 (nr) = n−1 m.
Folglich ist r = m/n.)
Setze nun N× = N \ {0} und man beachte, dass für jedes n ∈ Z \ {0} genau
eines der Zahlen n und −n in N× liegt. Wir brauchen folgende Verfeinerung von
Lemma 1.3:
Lemma 1.8 Seien r, s ∈ Q; dann gibt es ℓ, m ∈ Z und n ∈ N× , so dass r = [ℓ/n]
und s = [m/n].
1 Die rationalen Zahlen
9
Ein Spezialfall von Lemma 1.8 ist mit r = s: Für jedes r ∈ Q gibt es m ∈ Z
und n ∈ N× , so dass r = [m/n]. (Es ist immer möglich, den Nenner aus N× zu
wählen.)
Lemma 1.9 Seien m/n und p/q Brüche mit n, q ∈ N× und m/n ≈ p/q. Dann
gilt m ∈ N× genau, wenn p ∈ N× .
Sei r ∈ Q \ {0}; nach dem Spezialfall von Lemma 1.8 gibt es einen Bruch m/n
mit n ∈ N× , so dass r = [m/n] und nach Lemma 1.6 ist dann m 6= 0. Wir sagen,
dass r positiv ist, wenn m ∈ N× . Nach Lemma 1.9 macht diese Definition einen
Sinn: Ob r positiv ist, hängt nicht davon ab, welchen Bruch (mit Nenner aus N× )
man wählt, um r darzustellen. Anschaulich ist eine rationale Zahl positiv, wenn
sie rechts von 0 auf der Zahlengeraden liegt.
Da m = [m/1] für jedes m ∈ Z, ist eine ganze Zahl m positiv als rationale Zahl
genau dann, wenn m ∈ N× .
Satz 1.2 Für jedes r ∈ Q \ {0} ist genau eines von r und −r positiv.
Satz 1.3 Für positive rationale Zahlen r, s sind r + s und rs ebenfalls positiv.
2
Die reellen Zahlen
In diesem Abschnitt beschäftigen wir uns mit den reellen Zahlen. Wir werden
aber hier nicht explizit sagen, was die reellen Zahlen sind, sondern zunächst nur
überlegen, was wir von ihnen erwarten.
Von den reellen Zahlen erwarten wir mindestens Folgendes:
1. Die reellen Zahlen R entstehen aus den rationalen Zahlen Q durch Hinzufügen
von zusätzlichen Zahlen. Insbesondere ist jede rationale Zahl eine reelle Zahl; es
gilt also Q ⊂ R.
2. Reelle Zahlen kann man addieren und multiplizieren und diese Operationen
sind Erweiterungen der Addition und Multiplikation für rationale Zahlen: Wenn
man rationale Zahlen r und s addiert als reelle Zahlen, so ist ihre Summe r + s
nichts anderes als ihre Summe als rationale Zahlen. Genauso ist ihr Produkt rs
als reelle Zahlen nichts anderes als ihr Produkt als rationale Zahlen.
3. Die Addition und Multiplikation von reellen Zahlen unterliegen den gleichen
Regeln wie für die Addition und Multiplikation von rationalen Zahlen:
(A1) Für alle x, y, z ∈ R gilt (x + y) + z = x + (y + z).
(A2) Für alle x, y ∈ R gilt x + y = y + x.
(A3) Für alle x ∈ R ist 0 + x = x, wobei 0 die Null in Q ist.
(A4) Zu jedem x ∈ R gibt es ein eindeutiges Element −x ∈ R mit (−x) + x = 0.
(M1) Für alle x, y, z ∈ R gilt (xy)z = x(yz).
(M2) Für alle x, y ∈ R gilt xy = yx.
(M3) Für alle x ∈ R ist 1x = x, wobei 1 die Eins in Q ist.
(M4) Zu jedem x ∈ R mit x 6= 0 gibt es ein eindeutiges Element x−1 ∈ R mit
x−1 x = 1.
(D) Für alle x, y, z ∈ R ist x(y + z) = xy + xz.
4. Es gibt eine Menge von positiven reellen Zahlen, die eine Teilmenge von R\{0}
ist und die folgenden Eigenschaften besitzt:
(G1) Jede positive rationale Zahl ist auch eine positive reelle Zahl. (Die Menge
der positiven reellen Zahlen enthält also die Menge der positiven rationalen
Zahlen.)
(G2) Für jedes x ∈ R \ {0} ist genau eines von x und −x positiv.
(G3) Für positive reelle Zahlen x, y sind x + y und xy ebenfalls positiv.
10
2 Die reellen Zahlen
11
Eine Zahl x ∈ R \ {0} heißt negativ, wenn −x positiv ist.
In diesem und auch in den nachfolgenden zwei Kapiteln werden keine weiteren
Annahmen über die reellen Zahlen gemacht. Die Aussagen in diesen Kapiteln
sind also nur solche, die stets gültig sind, sobald man annimmt, dass die reellen
Zahlen die Eigenschaften 1, 2, 3 und 4 besitzen. Da aber 1, 2, 3 und 4 ebenfalls
Eigenschaften von Q sind, sind diese alle Aussagen, die eigentlich nicht zwischen
Q und R unterscheiden. Erst im Kapitel 5 werden wir nochmal überlegen, was
zusätzlich von den reellen Zahlen verlangt werden soll.
Sei r ∈ Q; nach (A4) für Q gibt es dann ein eindeutiges Element −r ∈ Q, so
dass (−r) + r = 0 und daraus folgt aus der Eindeutigkeit in (A4) für R, dass −r
auch die eindeutige reelle Zahl ist mit (−r) + r = 0. Ist r ∈ Q \ {0}, dann gibt es
genauso ein eindeutiges Element r −1 ∈ Q, so dass r −1r = 1 und daraus folgt aus
der Eindeutigkeit in (M4) für R, dass r −1 auch die eindeutige reelle Zahl ist mit
r −1 r = 1.
Lemma 2.1 (1) Es gilt −0 = 0.
(2) Für alle x, y ∈ R gilt −(x + y) = −x + −y.
(3) Es gilt −(−x) = x für alle x ∈ R.
(4) Für alle x, y ∈ R gilt −x = −y genau dann, wenn x = y.
(5) Für alle x ∈ R mit x 6= 0 ist −x 6= 0.
Lemma 2.2 (Kürzungsregeln) (1) Aus z + x = z + y folgt x = y.
(2) Aus x + z = y + z folgt x = y.
Lemma 2.3 (1) Für alle x, y, z ∈ R ist (x + y)z = xz + yz.
(2) Für alle x, y, u, v ∈ R ist (x + y)(u + v) = xu + (xv + (yu + yv)).
Sind x, y ∈ R, so wird die Zahl x + −y meistens mit x − y bezeichnet. Sind
insbesondere r, s ∈ Q, so ist r − s ∈ Q, da −s ∈ Q.
Lemma 2.4 Seien x, y ∈ R; dann ist x − y die eindeutige Zahl z ∈ R mit
x = y + z: Es gilt also x = y + (x − y) und ist z ∈ R eine Zahl mit x = y + z, so
ist z = x − y. Ferner ist x − y = 0 genau dann, wenn x = y.
2 Die reellen Zahlen
12
Lemma 2.5 (1) Es gilt x − 0 = x und 0 − x = −x für alle x ∈ R.
(2) Für alle x, y ∈ R ist y − x = −(x − y) und auch y − x = −x − (−y).
(3) Für alle x, y, z ∈ R ist x − z = (x − y) + (y − z).
(4) Für alle x, y, u, v ∈ R ist (y + v) − (x + u) = (y − x) + (v − u).
(5) Für alle x, y, u, v ∈ R ist yv − xu = x(v − u) + (y − x)v.
Lemma 2.6 Es gilt x0 = 0x = 0 für alle x ∈ R.
Satz 2.1 (1) Es gilt (−x)y = −(xy) = x(−y) für alle x, y ∈ R.
(2) Für alle x, y ∈ R gilt (−x)(−y) = xy.
Satz 2.2 Seien x, y ∈ R mit x 6= 0 und y 6= 0. Dann ist xy 6= 0.
Lemma 2.7 Für alle x, y, z ∈ R ist z(x − y) = zx − zy.
Lemma 2.8 (Kürzungsregeln) (1) Ist z 6= 0, so folgt x = y aus zx = zy.
(2) Ist z 6= 0, so folgt x = y aus xz = yz.
Sind x, y ∈ R mit y 6= 0, so schreibt man oft x/y oder
ist dann 1/y eine andere Schreibweise für y −1.
x
y
statt xy −1. Insbesondere
Im Folgenden betrachten wir nun die Kleiner-Relation auf R.
Lemma 2.9 Wenn man eine rationale Zahl als reelle Zahl betrachtet, so ist sie
eine positive reelle Zahl genau dann, wenn sie eine positive rationale Zahl ist.
Seien x, y ∈ R; wir schreiben x < y, wenn y − x positiv ist und sagen, dass x
kleiner ist als y. Man beachte (und dies ist sehr wichtig): Sind r, s ∈ Q, so gilt
r < s als reelle Zahlen genau dann, wenn r < s als rationale Zahlen gilt. (Dies
folgt aus Lemma 2.9, da die Differenz s − r eine rationale Zahl ist.) Gilt x < y,
so schreibt man auch y > x und sagt, dass y größer ist als x.
Lemma 2.10 Es gilt x > 0 (d.h. 0 < x) genau dann, wenn x positiv ist.
2 Die reellen Zahlen
13
Nach Lemma 2.10 sind die Aussagen x ist positiv“ und x > 0“ äquivalent. Im
”
”
Folgenden werden wir meistens die Letztere verwenden. (In der Tat schreibt man
x > 0“ aber sagt x ist positiv“.) Insbesondere gilt x > y genau dann, wenn
”
”
x − y > 0.
Satz 2.3 (Trichotomie) Für alle x, y ∈ R gilt genau eine der Aussagen:
(1) Die Zahlen x und y sind gleich: Es gilt x = y.
(2) x ist kleiner als y: Es gilt x < y.
(3) y ist kleiner als x: Es gilt y < x.
Satz 2.4 (1) Sind x, y, z ∈ R mit x < y und y < z, so ist x < z.
(2) Sind x, y ∈ R mit x < y, so ist x + z < y + z für alle z ∈ R.
(3) Sind x, y, u, v ∈ R mit x < y und u < v, so ist x + u < y + v.
(4) Sind x, y ∈ R mit x < y, so ist −y < −z.
Es ist nützlich, nicht nur die Kleiner-Relation, sondern auch die Kleiner-gleichRelation zur Verfügung zu haben. Seien x, y ∈ R; wir schreiben x ≤ y, wenn
entweder x < y oder x = y und sagen, dass x kleiner gleich y ist. Man kann hier
auch y ≥ x schreiben und sagen, dass y größer gleich x ist.
Satz 2.5 (1) Für alle x, y ∈ R gilt x ≤ y oder y ≤ x.
(2) Es gilt x ≤ y und y ≤ x genau dann, wenn x = y.
(3) Sind x, y, z ∈ R mit x ≤ y und y ≤ z, so ist x ≤ z. Ferner ist x = z genau
dann, wenn x = y und y = z.
(4) Sind x, y, u, v ∈ R mit x ≤ y und u ≤ v, so ist x + u ≤ y + v. Ferner ist
x + u = y + v genau dann, wenn x = y und u = v.
(5) Sind x, y ∈ R mit x ≤ y, so ist −y ≤ −x.
Seien x, y ∈ R; nach Lemma 2.4 und Lemma 2.10 gilt x ≥ y genau dann, wenn
x − y ≥ 0. Setze R+ = {x ∈ R : x ≥ 0}.
Lemma 2.11 Seien x, y ∈ R+ ; dann ist x + y ∈ R+ und xy ∈ R+ . Ferner ist
x + y = 0 genau dann, wenn y = 0 und y = 0.
2 Die reellen Zahlen
14
Satz 2.6 (1) Sind x, y, u, v ∈ R+ mit x ≤ y und u ≤ v, so ist xu ≤ yv. Ist
ferner x > 0 und u > 0, so gilt xu = yv genau dann, wenn x = y und u = v.
(2) Für jedes x ∈ R \ {0} ist xx > 0.
(3) Ist x ∈ R mit x > 0, so ist auch x−1 > 0.
(4) Sind x, y ∈ R mit x > 0, y > 0 und x < y, so ist y −1 < x−1 .
Für jedes x ∈ R sei der (Absolut)-Betrag |x| von x definiert durch
|x| =
x , falls x ≥ 0,
−x , falls x < 0.
Satz 2.7 Der Absolut-Betrag hat folgende Eigenschaften:
(1) Für jedes x ∈ R ist |x| ≥ 0 und |x| = 0 gilt genau dann, wenn x = 0.
(2) Für alle x, y ∈ R ist |xy| = |x||y|. Insbesondere ist |−x| = |x|.
(3) Für alle x, y ∈ R ist |x + y| ≤ |x| + |y| (Dreiecksungleichung).
(4) Für alle x, y ∈ R ist ||x| −|y|| ≤ |x−y| (Umgekehrte Dreiecksungleichung).
Seien a, b, c ∈ R. Die Aussage a < b < c ist lediglich eine kurze Schreibweise für
die Aussage: a < b und b < c. Genauso verwendet man ähnliche Abkürzungen
wie a < b ≤ c, a ≤ b < c und a ≤ b ≤ c.
Lemma 2.12 Sei b ∈ R mit b > 0 und sei c ∈ R.
(1) Es gilt |c| = b genau dann, wenn c = −b oder c = b.
(2) Es gilt |c| < b genau dann, wenn −b < c < b.
(3) Es gilt |c| ≤ b genau dann, wenn −b ≤ c ≤ b.
Satz 2.8 Seien a, b ∈ R mit b > 0 und sei x ∈ R.
(1) Es gilt |x − a| = b genau dann, wenn x = a − b oder x = a + b.
(2) Es gilt |x − a| < b genau dann, wenn a − b < x < a + b.
(3) Es gilt |x − a| ≤ b genau dann, wenn a − b ≤ x ≤ a + b.
2 Die reellen Zahlen
15
Sei N eine nichtleere endliche Teilmenge von R; dann enthält N ein größtes
Element, d.h., ein Element x ∈ N mit x ≥ y für jedes y ∈ N, sowie ein kleinstes
Element, d.h., ein Element x′ ∈ N mit x′ ≤ y für jedes y ∈ N. Diese Zahlen
werden mit max N und min N bezeichnet. (Die Existenz von max N und min N
kann durch vollständige Induktion nach der Anzahl der Elemente in N gezeigt
werden.) Für N = {x1 , x2 } gilt offensichtlich
x1 falls x1 ≥ x2 ,
x1 falls x1 ≤ x2 ,
max{x1 , x2 } =
und min{x1 , x2 } =
x2 falls x1 < x2
x2 falls x1 > x2 .
Für a, b ∈ R mit a < b setze
[a, b] = {x ∈ R : a ≤ x ≤ b}, (a, b) = {x ∈ R : a < x < b},
(a, b] = {x ∈ R : a < x ≤ b}, [a, b) = {x ∈ R : a ≤ x < b},
und für a, b ∈ R sei
[a, +∞) = {x ∈ R : a ≤ x}, (a, +∞) = {x ∈ R : a < x},
(−∞, b] = {x ∈ R : x ≤ b}, (−∞, b) = {x ∈ R : x < b}.
Eine Teilmenge von R, die eine dieser Formen hat, heißt Intervall; auch R wird als
Intervall betrachtet. Jedes Intervall I hat die folgende Eigenschaft: Sind c, d ∈ I
mit c < d, so ist x ∈ I für jedes x ∈ R mit c < x < d.
3
Stetige Funktionen
Sei A eine nichtleere Teilmenge von R. Eine Abbildung oder eine Funktion f von
A nach R ist eine Vorschrift, die jedem Element von A genau ein Element von
R zuordnet. Das dem Element x ∈ A zugeordnete Element von R wird mit f (x)
bezeichnet. (Die Wörter Funktion und Abbildung haben die gleiche Bedeutung;
wir verwenden aber meistens das Wort Abbildung.)
Man schreibt f : A → R um zu zeigen, dass f eine Abbildung von A nach R ist;
die Menge A heißt Definitionsbereich von f . Für jede Teilmenge B von A wird
{y ∈ R : es gibt ein x ∈ B mit y = f (x)}
mit f (B) bezeichnet. Die Menge f (A) heißt das Bild von f . Zwei Abbildungen
f, g : A → R sind per Definition gleich, wenn f (x) = g(x) für jedes x ∈ A.
Ist A eine nichtleere Teilmenge von R, sind f, g : A → R Abbildungen und ist
c ∈ R, so werden Abbildungen f + g, f g und cf von A nach R definiert durch
(f + g)(x) = f (x) + g(x), (f g)(x) = f (x)g(x) und (cf )(x) = cf (x)
für jedes x ∈ A. Ist ferner f (x) 6= 0 für alle x ∈ A, so wird auch eine Abbildung
1/f : A → R definiert durch (1/f )(x) = 1/f (x) für jedes x ∈ A.
Beispiele: (1) Seien f, g : R → R die Abbildungen mit f (x) = 3x2 + 4x + 3 und
g(x) = x3 + 3x für alle x ∈ R. Dann ist f + g : R → R die Abbildung mit
(f + g)(x) = f (x) + g(x) = (3x2 + 4x + 3) + (x3 + 3x) = x3 + 3x2 + 7x + 3
für alle x ∈ R. Ferner ist f g : R → R die Abbildung mit
(f g)(x) = f (x)g(x) = (3x2 + 4x + 3)(x3 + 3x) = 3x5 + 4x4 + 12x3 + 12x2 + 9x
für alle x ∈ R.
(2) Sei A = R \ {−1, 1} und sei f : A → R die Abbildung mit f (x) = x2 − 1.
Dann ist f (x) 6= 0 für alle x ∈ A und 1/f : A → R ist die Abbildung mit
(1/f )(x) = 1/f (x) =
1
1
=
x2 − 1
(x − 1)(x + 1)
für alle x ∈ A.
Seien A, B nichtleere Teilmengen von R und seien f : A → R und g : B → R
Abbildungen mit f (x) ∈ B für alle x ∈ A (d.h. mit f (A) ⊂ B). Dann gibt es die
Abbildung g ◦ f : A → R, die definiert ist durch
(g ◦ f )(x) = g(f (x))
16
3 Stetige Funktionen
17
für alle x ∈ A. Diese Abbildung heißt die Komposition oder Zusammensetzung
von f und g.
Beispiele: (1) Seien f, g : R → R wieder die Abbildungen mit f (x) = 3x2 +4x+3
und g(y) = y 3 + 3y für alle x, y ∈ R. Dann ist g ◦ f : R → R die Abbildung mit
(g ◦ f )(x) = g(f (x)) = g(3x2 + 4x + 3) = (3x2 + 4x + 3)3 + 3(3x2 + 4x + 3)
für alle x ∈ R.
(2) Seien A = (0, 1), B = {y ∈ R : y > 1} und seien f : A → R und g : B → R
die Abbildungen mit f (x) = 1/x2 und g(y) = 1/y 3 für alle x ∈ A, y ∈ B. Dann
gilt f (x) ∈ B für alle x ∈ A und g ◦ f : A → R ist die Abbildung mit
(g ◦ f )(x) = g(f (x)) = g(1/x2) =
1
= x6
2
3
(1/x )
für alle x ∈ A.
Ist f : A → R eine Abbildung und B eine nichtleere Teilmenge von A, so ist die
Einschränkung von f auf B die Abbildung f|B : B → R, die definiert ist durch
f|B (x) = f (x) für alle x ∈ B.
Beispiel: Sei f : R → R die Abbildung mit f (x) = x2 − 1 für alle x ∈ R und
sei B = R \ {−1, 1}. Dann ist f|B : B → R die Abbildung mit f|B (x) = x2 − 1
für alle x ∈ B. Man beachte: Es gilt f|B (x) 6= 0 für alle x ∈ B und also gibt es
die Abbildung 1/f|B : B → R. Andererseits ist die Abbildung 1/f : R → R nicht
definiert, da f (−1) = f (1) = 0.
Man hat wahrscheinlich eine relativ gute intuitive Vorstellung, was Stetigkeit
für eine Abbildung bedeutet und kennt einige Folgerungen aus dieser Eigenschaft
(zum Beispiel im Zusammenhang mit Kurvendiskussion). Mit nur einer intuitiven
Vorstellung kommt man aber nicht viel weiter und in diesem Kapitel lernen wir
eine sehr präzise Definition von Stetigkeit kennen, die die Grundlage für alles
bildet, das später kommt.
Im Folgenden sei A eine nichtleere Teilmenge von R. Eine Abbildung f : A → R
heißt an einer Stelle a ∈ A stetig, wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass
|f (x) − f (a)| < ε für alle x ∈ A mit |x − a| < δ.
Nach Satz 2.8 (2) gilt |x − a| < δ genau dann, wenn x ∈ (a − δ, a + δ). Also ist
f genau dann an der Stelle a stetig, wenn es zu jedem ε > 0 ein δ > 0 gibt, so
dass f (x) im Intervall (f (a) − ε, f (a) + ε) liegt für alle x ∈ A, die im Intervall
(x − δ, x + δ) liegen.
Die Abbildung f : A → R heißt stetig, wenn sie an jeder Stelle x ∈ A stetig ist.
Beispiele: (1) Die durch id(x) = x definierte Identitätsabbildung id : R → R
ist stetig: Sei a ∈ R und ε > 0; wähle δ = ε. Für x ∈ R mit |x − a| < δ ist
3 Stetige Funktionen
18
|id(x) − id(a)| = |x − a| < δ = ε, d.h. |id(x) − id(a)| < ε für alle x ∈ R mit
|x − a| < δ. Folglich ist id an der Stelle a stetig, und da dies für jedes a ∈ R
richtig ist, ist die Abbildung id stetig.
(2) Jede konstante Abbildung kb : R → R mit kb (x) = b für alle x ∈ R ist
stetig: Sei a ∈ R und ε > 0; wähle δ = 1. Für x ∈ R mit |x − a| < δ ist
|kb (x) − kb (a)| = |b − b| = 0 < ε, d.h. |kb (x) − kb (a)| < ε für alle x ∈ R mit
|x − a| < δ. Folglich ist kb an der Stelle a stetig, und da dies für jedes a ∈ R
richtig ist, ist die Abbildung kb stetig.
(3) Die Abbildung | · | : R → R ist stetig: Sei a ∈ R und ε > 0; wähle δ = ε. Für
x ∈ R mit |x − a| < δ ist nach Satz 2.7 (4) ||x| − |a|| ≤ |x − a| < δ = ε, d.h.
||x| − |a|| < ε für alle x ∈ R mit |x − a| < δ. Folglich ist | · | an der Stelle a stetig,
und da dies für jedes a ∈ R richtig ist, ist die Abbildung | · | stetig.
(4) Seien c, d ∈ R mit c < d, und sei f : [c, d] → R definiert durch f (x) = 5x2
für alle x ∈ [c, d]. Dann ist f stetig: Setze M = max{|c|, |d|} und sei a ∈ [c, d];
für alle x ∈ [c, d] gilt dann
|f (x) − f (a)| = |5x2 − 5a2 | = |5(x + a)(x − a)| = 5|x + a||x − a|
≤ 5(|x| + |a|)|x − a| ≤ 5(M + M)|x − a| = 10M|x − a| .
Sei nun ε > 0 und wähle δ = ε/(10M). Für all x ∈ [c, d] mit |x − a| < δ ist dann
|f (x) − f (a)| ≤ 10M|x − a| < 10Mδ = ε ,
d.h. |f (x) − f (a)| < ε für alle x ∈ [c, d] mit |x − a| < δ. Folglich ist f an der Stelle
a stetig, und da dies für jedes a ∈ [c, d] richtig ist, ist die Abbildung f stetig.
Bemerkung: Im Beispiel 4 haben wir die folgende nützliche Tatsache benutzt
(die man merken soll): Seien c, d ∈ R mit c < d und setze M = max{|c|, |d|};
dann ist |x| ≤ M für alle x ∈ [c, d]. (Ist x ≥ 0, so ist 0 ≤ x ≤ d und damit
|x| = x ≤ d = |d| ≤ M. Ist andererseits x < 0, so ist c ≤ x < 0 und in diesem
Fall ist |x| = −x ≤ −c = |c| ≤ M. In beiden Fällen ist also |x| ≤ M.)
Was bedeutet, dass f an der Stelle a nicht stetig ist? Es bedeutet natürlich, dass
es nicht zu jedem ε > 0 ein δ > 0 gibt, so dass |f (x) − f (a)| < ε für alle x ∈ A
mit |x − a| < δ. Also ist f an der Stelle a nicht stetig genau dann, wenn es ein
ε > 0 gibt, so dass man für jedes δ > 0 ein x ∈ A mit |x − a| < δ finden kann, so
dass |f (x) − f (a)| ≥ ε.
Sei a ∈ R und sei ja : R → R die Abbildung mit
0 falls x < a ,
ja (x) =
1 falls x ≥ a .
Die Abbildung ja ist nicht stetig an der Stelle a: Für jedes δ > 0 setze aδ = a− 12 δ.
Also ist |aδ − a| = 12 δ < δ aber |ja (aδ ) − ja (a)| = |0 − 1| = 1. Für jedes δ > 0 gibt
3 Stetige Funktionen
19
es also ein x ∈ R mit |x − a| < δ, so dass |f (x) − f (a)| ≥ 1. Damit ist ja nicht
stetig an der Stelle a (und hier haben wir ε = 1 genommen).
Die wichtigsten Eigenschaften von stetigen Abbildungen werden in den folgenden
Sätzen präsentiert.
Satz 3.1 (1) Sei f : A → R eine Abbildung und B eine nichtleere Teilmenge
von A. Ist f an der Stelle a ∈ B stetig, so ist es auch die Einschränkung f|B .
(2) Sei f : A → R eine Abbildung, seien c, d ∈ R mit c < d und setze
B = A ∩ [c, d] = {x ∈ A : c ≤ x ≤ d} .
Sei ferner a ∈ A mit c < a < d (und also ist a ∈ B). Ist die Einschänkung f|B
an der Stelle a stetig, so ist f ebenfalls an der Stelle a stetig.
Beispiele: (5) Sei f : R → R definiert durch f (x) = 5x2 für alle x ∈ R. Dann ist
die Abbildung f stetig: Sei a ∈ R und setzte c = a − 1, d = a + 1; im Beispiel 4
haben wir gezeigt, dass die Einschränkung f|[c,d] von f auf [c, d] stetig ist und
insbesondere ist f|[c,d] an der Stelle a stetig. Nun ist c < a < d und daraus ergibt
sich nach Satz 3.1 (2), dass auch f an der Stelle a stetig ist. Da dies für jedes
a ∈ R richtig ist, ist die Abbildung f stetig.
(6) Sei f : I → R eine stetige Abbildung, wobei I ein unbeschränktes Intervall
ist (wie R oder {x ∈ R : x > 0}). Wenn man zeigen will (oder muss), dass f
an der Stelle a ∈ I stetig ist, so kann man meistens wie in (5) verfahren: Wähle
c, d ∈ I mit c < a < d und sei g = f|[c,d] die Einschränkung von f auf [c, d]. Wenn
man zeigen kann, dass die Einschänkung g an der Stelle a stetig ist, so ist nach
Satz 3.1 (2) auch f an der Stelle a stetig. Es reicht also zu zeigen, dass g stetig
ist und dafür wird ein B > 0 (in Abhängigkeit von c, d und f ) gesucht, so dass
|f (x) − f (y)| ≤ B|x − y|
für alle x, y ∈ [c, d] gilt. Wenn man ein solches B findet, so ist es leicht zu zeigen,
dass g an der Stelle a stetig ist für jedes a ∈ [c, d]: Sei ε > 0 und setze δ = ε/B.
Ist x ∈ [c, d] mit |x − a| < δ, so ist
|g(x) − g(a)| = |f (x) − f (a)| ≤ B|x − a| < Bδ = ε ,
d.h. |g(x) − g(a)| < ε für alle x ∈ [c, d] mit |x − a| < δ. Dies zeigt, dass g an der
Stelle a stetig ist.
Lemma 3.1 Sei f : A → R eine Abbildung, die an der Stelle a ∈ A stetig ist.
Dann gibt es δ > 0 und c ≥ 0, so dass |f (x)| ≤ c für alle x ∈ A mit |x − a| < δ.
3 Stetige Funktionen
20
Satz 3.2 Seien f, g : A → R Abbildungen, die beide an der Stelle a ∈ A stetig
sind.
(1) Für alle b, c ∈ R ist die Abbildung bf + cg an der Stelle a stetig.
(2) Die Abbildung f g ist an der Stelle a stetig.
(3) Nehme an, dass f (x) 6= 0 für alle x ∈ A. Dann ist die Abbildung 1/f an der
Stelle a stetig.
Für jedes x ∈ R und jedes n ∈ N wird ein Element xn von R definiert durch:
x0 = 1, x1 = x und (für n > 1) xn = xxn−1 .
Satz 3.3 Seien b0 , . . . , bm , c0 , . . . , cn ∈ R mit c0 + c1 x + · · · + cn xn 6= 0 für alle
x ∈ A (und mit m, n ∈ N). Dann ist die Abbildung f : A → R stetig, wobei
f (x) =
b0 + b1 x + · · · + bm xm
c0 + c1 x + · · · + cn xn
für alle x ∈ A.
Satz 3.4 Sei B eine nichtleere Teilmenge von R und seien f : A → R und
g : B → R Abbildungen mit f (A) ⊂ B. Ist f an der Stelle a ∈ A und g an der
Stelle f (a) ∈ B stetig, so ist die zusammengesetzte Abbildung g ◦ f : A → R an
der Stelle a stetig.
Lemma 3.2 Sei f : A → R eine Abbildung, die an der Stelle a ∈ A stetig ist.
(1) Gibt es ein δ > 0, so dass (a − δ, a) ⊂ A und f (x) ≥ 0 (bzw. f (x) ≤ 0) für
alle x ∈ (a − δ, a), so ist f (a) ≥ 0 (bzw. f (a) ≤ 0).
(2) Gibt es ein δ > 0, so dass (a, a + δ) ⊂ A und f (x) ≥ 0 (bzw. f (x) ≤ 0) für
alle x ∈ (a, a + δ), so ist f (a) ≥ 0 (bzw. f (a) ≤ 0).
Wir bereiten nun die Definition von Differenzierbarkeit im nächsten Kapitel vor.
Ist I ein Intervall, so bezeichnet I ◦ die Menge I ohne ihre Endpunkte (falls sie
Endpunkte hat). Ist a < b und ist I eines der Intervalle [a, b], (a, b], [a, b) und
(a, b), so ist I ◦ = (a, b). Ist I eines der Intervalle [a, ∞) und (a, ∞) (bzw. (−∞, b]
und (−∞, b)), so ist I ◦ = (a, ∞) (bzw. I ◦ = (−∞, b)). Schließlich ist R◦ = R.
Also ist I ◦ stets ein Intervall und für jedes a ∈ I ◦ gibt es ein δ > 0, so dass
(a − δ, a + δ) ⊂ I ◦ .
Im Folgenden sei I ein Intervall.
3 Stetige Funktionen
21
Lemma 3.3 Sei a ∈ I ◦ ; dann ist die Menge {x ∈ I : 0 < |x − a| < δ} nichtleer
für jedes δ > 0.
Sei nun a ∈ I ◦ und sei g : I \ {a} → R eine Abbildung. Ist h : I → R eine
Abbildung mit h(x) = g(x) für alle x ∈ I \ {a}, so ist h(a) der einzige Wert, der
nicht schon durch g festgelegt worden ist.
Satz 3.5 Es gibt höchstens eine Abbildung h : I → R, die an der Stelle a stetig
ist und mit h(x) = g(x) für alle x ∈ I \ {a}.
Beispiele: (1) Sei a ∈ R und sei g : R \ {a} → R die Abbildung mit
−1 falls x < a ,
g(x) =
1 falls x > a .
Sei h : R → R eine Abbildung mit h(x) = g(x) für alle x ∈ R \ {a}. Dann
kann h nicht stetig sein an der Stelle a. (Für jedes δ > 0 setze aδ = a − 21 δ und
a′δ = a + 12 δ. Also ist |aδ − a| = 12 δ < δ und genauso ist |a′δ − a| < δ. Aber
|h(aδ ) − h(a)| = | − 1 − h(a)| = |1 + h(a)| und |h(a′δ ) − h(a)| = |1 − h(a)|, und
mindestens eines von |1 + h(a)| und |1 − h(a)| ist größer gleich 1. Für jedes δ > 0
gibt es also ein x ∈ R mit |x − a| < δ, so dass |h(x) − h(a)| ≥ 1. Damit ist h nicht
stetig an der Stelle a.)
(2) Sei a ∈ R und sei g : R \ {a} → R die Abbildung mit g(x) = x2 für alle
x ∈ R \ {a}. Dann ist g(x) = h(x) für alle x ∈ R \ {a}, wobei h : R → R definiert
ist durch h(x) = x2 für alle x ∈ R. Da h an der Stelle a stetig ist, ist nach Satz 3.5
h die eindeutige Abbildung, die an der Stelle a stetig ist und mit h(x) = g(x) für
alle x ∈ R \ {a}.
4
Differentiation
Im Folgenden sei I stets ein Intervall und sei I ◦ wieder die Menge I ohne ihre
Endpunkte. Für eine Abbildung f : I → R und a ∈ I ◦ definiere eine Abbildung
∆af : I \ {a} → R durch
f (x) − f (a)
.
∆af (x) =
x−a
Dann heißt f in a differenzierbar, wenn es eine Abbildung h : I → R gibt, die an
der Stelle a stetig ist und mit ∆af (x) = h(x) für alle x ∈ I \ {a}. In diesem Fall
ist nach Satz 3.5 die Abbildung h eindeutig durch ∆af bestimmt; den Wert h(a)
nennen wir die Ableitung von f in a. Diese Ableitung wird mit f ′ (a) bezeichnet.
Beispiele: (1) Für jedes c ∈ R ist die konstante Abbildung kc : R → R (mit
kc (x) = c für alle x ∈ R) in jedem Punkt a ∈ R differenzierbar und es gilt
k′c (a) = 0: Für x ∈ R \ {a} ist
∆akc (x) =
kc (x) − kc (a)
c−c
=
=0
x−a
x−a
und damit ist ∆akc (x) = k0 (x) für alle x ∈ R\{a}. Aber die Abbildung k0 ist stetig
an der Stelle a und daraus folgt, dass kc in a differenzierbar mit k′c (a) = k0 (a) = 0.
(2) Die Identitätsabbildung id : R → R (mit id(x) = x für alle x ∈ R) ist in
jedem Punkt a ∈ R differenzierbar mit id′ (a) = 1: Für x ∈ R \ {a} ist
∆aid (x) =
id(x) − id(a)
x−a
=
=1
x−a
x−a
und damit ist ∆aid (x) = k1 (x) für alle x ∈ R\{a}. Aber die Abbildung k1 ist stetig
an der Stelle a und daraus folgt, dass id in a differenzierbar mit id′ (a) = k1 (a) = 1.
(3) Die Abbildung f : R → R mit f (x) = 5x2 für alle x ∈ R ist in jedem Punkt
a ∈ R differenzierbar mit f ′ (a) = 10a: Für x ∈ R \ {a} ist
∆af (x) =
5x2 − 5a2
(x − a)(x + a)
f (x) − f (a)
=
=5
= 5(x + a)
x−a
x−a
x−a
und damit ist ∆af (x) = h(x) für alle x ∈ R \ {a}, wobei h : R → R die durch
h(x) = 5(x + a) für alle x ∈ R definierte Abbildung ist. Aber die Abbildung
h ist stetig an der Stelle a und daraus folgt, dass f in a differenzierbar mit
f ′ (a) = h(a) = 5(a + a) = 10a.
(4) Die (stetige) Abbildung | · | : R → R ist nicht differenzierbar in 0: Für alle
x ∈ R \ {0} gilt
|x|
|x| − |0|
−1 falls x < 0 ,
0
=
=
∆|·| (x) =
1 falls x > 0 ,
x−0
x
22
4 Differentiation
23
und es gibt keine Abbildung h : R → R, die an der Stelle 0 stetig ist und mit
∆af (x) = h(x) für alle x ∈ R \ {0}.
Ist f in a ∈ I ◦ differenzierbar, so gibt es eine eindeutige Abbildung h, die an der
Stelle a stetig ist und mit ∆af (x) = h(x) für alle x ∈ I \ {a}. Diese Abbildung h
wird mit ∆af bezeichnet. Insbesondere ist f ′ (a) = ∆af (a).
Satz 4.1 Sei J ⊂ I ein Intervall, sei a ∈ J ◦ und sei f : I → R eine Abbildung,
die in a differenzierbar ist. Dann ist die Einschränkung f|J von f auf J auch in
a differenzierbar und f|J′ (a) = f ′ (a).
Lemma 4.1 Sei f : I → R in a ∈ I ◦ differenzierbar. Dann gilt
f (x) = f (a) + (x − a)∆fa (x)
für alle x ∈ I.
Satz 4.2 Eine Abbildung, die in a differenzierbar ist, ist an der Stelle a stetig.
Satz 4.3 Seien f, g : I → R Abbildungen, die beide in a ∈ I ◦ differenzierbar
sind.
(1) Für alle b, c ∈ R ist die Abbildung bf + cg in a differenzierbar, und es gilt
(bf + cg)′ (a) = bf ′ (a) + cg ′(a) .
(2) Die Abbildung f g ist in a differenzierbar und es gilt
(f g)′(a) = f (a)g ′ (a) + f ′ (a)g(a) .
(3) Nehme an, dass g(x) 6= 0 für alle x ∈ I. Dann ist die Abbildung f /g in a
differenzierbar, und es gilt
(f /g)′(a) =
f ′ (a)g(a) − f (a)g ′(a)
.
g(a)2
Seien f, g : I → R Abbildungen, die beide in a ∈ I ◦ differenzierbar sind und mit
g(a) 6= 0 (obwohl nicht unbedingt mit g(x) 6= 0 für alle x ∈ I). Nach Satz 4.2
ist g an der Stelle a stetig und damit gibt es ein ε > 0, so dass g(x) 6= 0
für alle x ∈ J = {x ∈ I : |x − a| < ε}. Nun ist J ein Intervall mit a ∈ J ◦
und nach Satz 4.1 sind die Einschränkungen f|J und g|J in a differenzierbar mit
′
f|J′ (a) = f ′ (a) und g|J
(a) = g ′ (a). Dies bedeutet, dass, obwohl g die Bedingung in
Satz 4.3 (3) nicht unbedingt erfüllt, dieser Satz immer noch auf die Abbildungen
f|J und g|J angewendet werden kann.
4 Differentiation
24
Satz 4.4 (Kettenregel) Sei f : I → R differenzierbar in a ∈ I ◦ mit f (I) ⊂ J,
wobei J eine Intervall ist mit f (a) ∈ J ◦ ; sei g : J → R differenzierbar in f (a).
Dann ist die zusammengesetzte Abbildung g ◦ f : I → R differenzierbar in a und
(g ◦ f )′ (a) = g ′(f (a))f ′ (a) .
Eine Abbildung f : I → R heißt differenzierbar in I ◦ , wenn f in a differenzierbar
ist für jedes a ∈ I ◦ .
Satz 4.5 (1) Sei n ∈ N; dann ist die durch pn (x) = xn definierte Abbildung
pn : I → R differenzierbar in I ◦ und
p′n (a) = nan−1
für alle a ∈ I ◦ (mit p′0 (a) = 0).
(2) Nehme an, dass 0 ∈
/ I und sei n ≥ 1. Dann ist die durch qn (x) = 1/xn
definierte Abbildung qn : I → R differenzierbar in I ◦ und für alle a ∈ I ◦ gilt
qn′ (a) = −
n
an+1
.
Seien m, n ∈ N, b0 , . . . , bm , c0 , . . . , cn ∈ R mit c0 + c1 x + · · · + cn xn 6= 0 für alle
x ∈ I. Nach Satz 4.3 und Satz 4.5 ist dann die durch
f (x) =
b0 + b1 x + · · · + bm xm
c0 + c1 x + · · · + cn xn
definierte Abbildung f : I → R differenzierbar in I ◦ und für alle a ∈ I ◦ gilt
f ′ (a) =
(c0 + c1 a + · · · + cn an )g(a) − (b0 + b1 a + · · · + bn am )h(a)
,
(c0 + c1 a + · · · + cn an )2
wobei g(a) = b1 + 2b2 a + · · · + mbm am−1 und h(a) = c1 + 2c2 a + · · · + ncn an−1 .
Sei f : I → R differenzierbar in I ◦ ; es gibt also eine Abbildung f ′ : I ◦ → R, d.h.
die Abbildung x 7→ f ′ (x). Sie heißt die Ableitung von f .
In vielen Anwendungen sind die auftretenden Abbildungen differenzierbar in I ◦
(und nicht nur differenzierbar in einem Punkt). Hier sind also Versionen von
Satz 4.3 und von Satz 4.4, die auf diesen Fall zugeschnitten sind.
Satz 4.6 Seien f, g : I → R Abbildungen, die in I ◦ differenzierbar sind.
(1) Für alle b, c ∈ R ist die Abbildung bf + cg differenzierbar in I ◦ mit
(bf + cg)′ = bf ′ + cg ′ .
4 Differentiation
25
(2) Die Abbildung f g ist differenzierbar in I ◦ mit
(f g)′ = f g ′ + f ′ g .
(3) Ist g(x) 6= 0 für alle x ∈ I, so ist die Abbildung f /g differenzierbar in I ◦ mit
(f /g)′ = (f ′ g − f g ′ )/g 2 .
Satz 4.7 (Kettenregel) Sei f : I → R differenzierbar in I ◦ und sei J eine
weiteres Intervall mit f (I) ⊂ J und f (I ◦ ) ⊂ J ◦ . Ist g : J → R differenzierbar in
J ◦ , so ist zusammengesetzte Abbildung g ◦ f : I → R differenzierbar in I ◦ mit
(g ◦ f )′ = (g ′ ◦ f ) · f ′ .
5
Mehr über die reellen Zahlen
Bisher haben wir über die reellen Zahlen nur angenommen, dass die in Kapitel 2
eingeführten Annahmen 1, 2, 3 und 4 für R gültig sind. Wir haben dann in den
letzten zwei Kapiteln gesehen, welche Aussagen über Stetigkeit und Differenzierbarkeit in diesem Rahmen gemacht werden können.
Da aber die Annahmen 1, 2, 3 und 4 auch für Q gültig sind, können wir keine
Aussage über R beweisen, die für Q falsch ist. Betrachte zum Beispiel die Aussage:
Jede positive reelle Zahl besitzt eine Quadratwurzel, d.h., zu jedem x ∈ R mit
x > 0 gibt es ein y ∈ R mit y 2 = x. Wenn wir diese Aussage nur mit Hilfe von 1,
2, 3 und 4 beweisen könnten, so würde dies auch zeigen, dass es zu jedem x ∈ Q
mit x > 0 ein y ∈ Q mit y 2 = x gibt. Für x = 2 ist diese Aussage aber falsch.
Seien a, b ∈ R mit a < b; wir sagen, dass eine stetige Abbildung f : [a, b] → R die
Zwischenwerteigenschaft hat, wenn es zu jeder reellen Zahl d zwischen f (a) und
f (b) ein c ∈ [a, b] gibt, so dass f (c) = d. In der Schule ging man (mindestens bei
der Kurvendiskussion) davon aus, dass diese eine Eigenschaft von jeder auf einem
abgeschlossenen Intervall [a, b] definierten stetigen Abbildung ist, aber allein aus
den Annahmen 1, 2, 3 und 4 kann man dies nicht herleiten: Wenn es einen
Beweis gäbe, so würde er auch zeigen: Ist f : [0, 1] → Q eine stetige Abbildung
mit f (0) < 0 und f (1) > 0, dann gibt es ein c ∈ Q mit 0 < c < 1, so dass
f (c) = 0. Für die Abbildung mit f (x) = x2 − 12 ist aber die Aussage falsch.
Es muss also mehr von den reellen Zahlen verlangt werden, und diese Forderung
werden wir im Wesentlichen durch die schon in der Schule geglaubte Annahme
festlegen, dass jede stetige Abbildung f : [a, b] → R die Zwischenwerteigenschaft
hat.
Das Problem mit dieser Annahme ist, dass sie keine direkte Aussage über die
reellen Zahlen selbst macht, sondern eine Aussage über stetige Abbildungen ist,
die auf den reellen Zahlen definiert sind. Es gibt doch eine äquivalente (aber etwas
weniger anschauliche) Annahme, die eine direkte Aussage über die reellen Zahlen
ist und die wir jetzt einführen.
Sei A eine Teilmenge von R und c ∈ R; wir schreiben A ≤ c, wenn x ≤ c für
alle x ∈ A und nennen dann c eine obere Schranke von A. Analog schreiben wir
c ≤ A, wenn c ≤ x für alle x ∈ A und hier wird c eine untere Schranke von A
genannt. Sind ferner A und B zwei Teilmengen von R, so schreiben wir A ≤ B,
wenn x ≤ y für alle x ∈ A, y ∈ B.
Lemma 5.1 Äquivalent sind:
(1) Jede stetige Abbildung f : [a, b] → R hat die Zwischenwerteigenschaft.
(2) Für alle nichtleere Teilmengen A, B von R mit A ≤ B gibt es ein c ∈ R, so
dass A ≤ c ≤ B.
26
5 Mehr über die reellen Zahlen
27
Nun führen wir unsere letzte Annahme über die reellen Zahlen ein:
5. Für alle nichtleere Teilmengen A, B von R mit A ≤ B gibt es ein c ∈ R, so
dass A ≤ c ≤ B.
Nach Lemma 5.1 könnte man genauso gut auch Folgendes als letzte Annahme
über die reellen Zahlen verwenden:
5′ . Jede stetige Abbildung f : [a, b] → R hat die Zwischenwerteigenschaft.
Im Folgenden nehmen wir stets an, dass die reellen Zahlen die Eigenschaften 1, 2,
3, 4 und 5 besitzen. Die Behauptung, dass eine Aussage über die reellen Zahlen
richtig ist, bedeutet dann genau, dass diese Aussage eine logische Folgerung aus
den fünf Eigenschaften ist.
Die Annahme 5 ist falsch für die rationalen Zahlen Q. Betrachte die Teilmengen
A = {r ∈ Q : r ≥ 0 und r 2 < 2} und B = {r ∈ Q : r ≥ 0 und r 2 > 2} von Q.
Dann sind A und B nichtleer und A ≤ B. Es gibt aber keine rationale Zahl c mit
A ≤ c ≤ B. (Ist A ≤ c ≤ B, so sieht man leicht, dass c2 = 2.)
Es stellt sich natürlich die Frage, ob und in welchem Sinne die reellen Zahlen
tatsächlich existieren. Man kann mit relativ viel Aufwand zeigen, dass irgendwas
existiert, das die Eigenschaften besitzt, die wir von den reellen Zahlen verlangt
haben. Ferner kann man zeigen, dass, obwohl es eine Vielfalt von Wegen gibt, die
reellen Zahlen zu konstruieren, sie in einem bestimmten Sinne eindeutig durch
die Forderungen 1, 2, 3, 4 und 5 festgelegt sind.
Die nächste Eigenschaft der reellen Zahlen hält man wahrscheinlich sowieso für
richtig, sie folgt aber in der Tat nicht aus 1, 2, 3 und 4 allein ohne 5:
Satz 5.1 (Satz von Archimedes) Zu jeder reellen Zahl b ∈ R gibt es eine
näturliche Zahl n ∈ N mit n > b.
Archimedes ist es vor über zweitausend Jahren aufgefallen, dass man die Aussage in Satz 5.1 braucht, um einige in der Euklidischen Geometrie vorkommende
Konstruktionen mit Zirkel und Lineal sicher durchführen zu können. Er war auch
überzeugt, dass diese Aussage nicht aus den restlichen Axiomen der Euklidischen
Geometrie folgt. Dehalb trägt dieser Satz seinen Namen.
Hier ist eine Umformulierung des Satzes von Archimedes, die eine äquivalente
Aussage über kleine positive Zahlen macht:
Satz 5.2 Zu jedem ε > 0 gibt es ein n ∈ N mit 1/n < ε.
Der nächste Satz sagt, die rationalen Zahlen liegen dicht‘ in den reellen Zahlen.
’
5 Mehr über die reellen Zahlen
28
Satz 5.3 Seien y, z ∈ R mit y < z. Dann gibt es ein x ∈ Q mit y < x < z.
Das analoge Ergebnis gilt auch für die Menge R \ Q.
Satz 5.4 Seien y, z ∈ R mit y < z. Dann gibt es ein x ∈ R \ Q mit y < x < z.
Eine Teilmenge A von R heißt nach oben (bzw. nach unten ) beschränkt, wenn
es ein b ∈ R mit A ≤ b (bzw. mit b ≤ A) gibt. Ferner heißt A beschränkt, wenn
sie nach oben und nach unten beschränkt ist, d.h., wenn es u, v ∈ R gibt, so
dass u ≤ A ≤ v. Man sieht leicht, dass A genau dann beschränkt ist, wenn es ein
c ∈ R mit c ≥ 0 gibt, so dass |x| ≤ c für alle x ∈ A.
Erinnerung: Unter einem Intervall verstehen wir eine Teilmenge von R, die eine
der folgenden Formen hat: [a, b], (a, b), (a, b] und [a, b) (mit a < b), [a, +∞),
(a, +∞), (−∞, b] und (−∞, b); ferner ist R selbst ein Intervall. Jedes Intervall I
hat die folgende Eigenschaft: Sind c, d ∈ I mit c < d, so ist x ∈ I für jedes x ∈ R
mit c < x < d. Außerdem besteht ein Intervall aus mehr als einem Punkt.
Sei I die Menge aller Teilmengen I von R, die mehr als einen Punkt enthalten und
für die gilt: Sind c, d ∈ I mit c < d, so ist x ∈ I für jedes x ∈ R mit c < x < d.
Insbesondere liegt jedes Intervall in I und der Tat gibt es kein weiteres Element
in der Menge I:
Satz 5.5 Jedes Element in I ist ein Intervall. Etwas genauer gilt für ein Element
I ∈ I Folgendes:
(1) Ist I weder nach unten noch nach oben beschränkt, so ist I = R.
(2) Ist I nach oben, aber nicht nach unten beschränkt, dann gibt es ein b ∈ R,
so dass I entweder (−∞, b] oder (−∞, b) ist.
(3) Ist I nach unten, aber nicht nach oben beschränkt, dann gibt es ein a ∈ R,
so dass I entweder [a, +∞) oder (a, +∞) ist.
(4) Ist I beschränkt, dann gibt es a, b ∈ R mit a < b, so dass I eines der vier
Intervalle [a, b], (a, b), (a, b] und [a, b) ist.
Die nächste Eigenschaft der reellen Zahlen spielt eine sehr wichtige Rolle, ist
aber beim ersten Kennenlernen schwer zu verdauen. Sie soll also zunächst als
technisches Hilfsmittel ansehen werden, das eingesetzt werden kann, um weitere
Eigenschaften nachzuweisen.
Sei x ∈ R; ein Intervall (y, z) mit y < x < z wird offenes Intervall um x genannt.
Insbesondere ist J(x, δ) ein offenes Intervall um x für jedes δ > 0, wobei
J(x, δ) = (x − δ, x + δ) = {y ∈ R : |y − x| < δ} .
5 Mehr über die reellen Zahlen
29
Satz 5.6 (Kompaktheit des Intervalls [a, b]) Für jedes x ∈ [a, b] sei Jx ein
offenes Intervall
S um x. Dann gibt es eine endliche Teilmenge N von [a, b], so
dass [a, b] ⊂ x∈N Jx .
Eine Teilmenge F von R heißt kompakt, wenn gilt: Ist Jx ein offenes Intervall um
x fürSjedes x ∈ F , dann gibt es stets eine endliche Teilmenge N von F , so dass
F ⊂ x∈N Jx . Nach Satz 5.6 ist also das Intervall [a, b] kompakt.
6
Mehr über stetige Funktionen
Im Folgenden seien a, b ∈ R mit a < b.
Satz 6.1 (Zwischenwertsatz) Sei f : [a, b] → R eine stetige Abbildung und sei
d eine reelle Zahl zwischen f (a) und f (b). Dann gibt es ein c ∈ R mit f (c) = d.
Hier ist eine direkte Folgerung des Zwischenwertsatzes:
Satz 6.2 Sei f : A → R eine stetige Abbildung (mit A ⊂ R beliebig) und sei I
ein Intervall mit I ⊂ A. Besteht f (I) aus mehr als einem Punkt, so ist f (I) ein
Intervall.
Lemma 6.1 Jede stetige Abbildung f : [a, b] → R ist beschränkt: Es gibt ein
d ≥ 0, so dass |f (x)| ≤ d für alle x ∈ [a, b].
Satz 6.3 (Satz von Minimum und Maximum) Sei f : [a, b] → R stetig.
Dann gibt es u, v ∈ [a, b], so dass f (u) ≤ f (x) ≤ f (v) für alle x ∈ [a, b].
Satz 6.4 Sei f : [a, b] → R eine stetige Abbildung. Besteht f ([a, b]) aus mehr als
einem Punkt, so gibt es c, d ∈ R mit c < d, so dass f ([a, b]) = [c, d].
Man beachte: Die Menge f ([a, b]) besteht aus einem Punkt genau dann, wenn die
Abbildung f konstant ist.
Eine Abbildung f : A → R heißt gleichmäßig stetig, wenn es zu jedem ε > 0 ein
δ > 0 gibt, so dass |f (y) − f (x)| < ε für alle x, y ∈ A mit |y − x| < δ. Eine
gleichmäßig stetige Abbildung ist stetig (und für jedes ε > 0 hängt die Wahl von
δ > 0 nicht von der Stelle a ∈ A ab). Aber im Allgemeinen ist die Umkehrung
falsch: Zum Beispiel ist die auf dem Intervall (0, 1) durch x 7→ 1/x definierte
Abbildung stetig, aber nicht gleichmäßig stetig.
Satz 6.5 (Gleichmäßige Stetigkeit) Jede stetige Abbildung f : [a, b] → R ist
gleichmäßig stetig.
30
6 Mehr über stetige Funktionen
31
Im Folgenden sei I ein Intervall. Eine Abbildung f : I → R heißt
monoton wachsend, falls f (x) ≤ f (y) für alle x, y ∈ I mit x < y,
streng monoton wachsend, falls f (x) < f (y) für alle x, y ∈ I mit x < y,
monoton fallend, falls f (x) ≥ f (y) für alle x, y ∈ I mit x < y,
streng monoton fallend, falls f (x) > f (y) für alle x, y ∈ I mit x < y.
Schließlich heißt f monoton, wenn sie monoton wachsend oder monoton fallend
ist, und streng monoton, wenn sie streng monoton wachsend oder streng monoton
fallend ist. Ist f : I → R streng monoton, so besteht f (I) aus mehr als einem
Punkt. (Es gibt c, d ∈ I mit c 6= d und dann sind f (c) und f (d) zwei verschiedene
Punkte in f (I).)
Sei nun f : I → R eine streng monotone stetige Abbildung und setze J = f (I);
da J aus mehr als einem Punkt besteht, ist nach Satz 6.2 J ein Intervall. Sei
b ∈ J; da J = f (I), gibt es mindestens ein a ∈ I mit f (a) = b. In der Tat gibt
es genau ein a ∈ I mit f (a) = b, da f (a1 ) 6= f (a2 ), wenn a1 , a2 ∈ I mit a1 6= a2 .
(Es gilt entweder a1 < a2 oder a2 < a1 ; ist a1 < a2 , so ist f (a1 ) < f (a2 ) (bzw.
f (a2 ) < f (a1 )), falls f streng monoton wachsend (bzw. streng monoton fallend
ist); ist dagegen a2 < a1 , so ist f (a2 ) < f (a1 ) (bzw. f (a1 ) < f (a2 )), falls f streng
monoton wachsend (bzw. streng monoton fallend ist). In jedem dieser Fälle ist
f (a1 ) 6= f (a2 ).) Da es zu jedem b ∈ J genau ein a ∈ I mit f (a) = b gibt, gibt
es eine eindeutige Abbildung g : J → R, so dass für jedes b ∈ J gilt: g(b) = a,
wobei a das eindeutige Element in I mit f (a) = b ist. Es gilt also g(f (a)) = a für
alle a ∈ I und insbesondere ist g(J) = I. Ferner ist f (g(b)) = b für alle b ∈ J.
Die Abbildung g heißt die Umkehrabbildung von f und wird mit f −1 bezeichnet.
Wir haben also f −1 (f (a)) = a für alle a ∈ I und f (f −1(b)) = b für alle b ∈ J.
Ist f streng monoton wachsend, dann ist die Umkehrabbildung f −1 das auch:
Sind b1 , b1 ∈ J mit b1 < b2 , so ist f (f −1(b1 )) = b1 < b2 = f (f −1 (b2 )) und daraus
ergibt sich, dass f −1 (b1 ) < f −1 (b2 ). Genauso ist f −1 streng monoton fallend, wenn
f das ist.
Lemma 6.2 Sei x ∈ I und ε > 0; dann gibt es ein δ > 0, so dass |y − x| < ε für
alle y ∈ I mit |f (y) − f (x)| < δ.
Satz 6.6 Die Umkehrabbildung f −1 : J → R ist stetig.
Sei wieder R+ = {x ∈ R : x ≥ 0}. Für jedes n ≥ 1 sei pn : R+ → R die Abbildung
mit pn (x) = xn für alle x ≥ 0. Nach Satz 3.2 ist pn stetig und nach Satz 2.6 (1)
(und Induktion) ist pn streng monoton wachsend.
6 Mehr über stetige Funktionen
32
Satz 6.7 Es gilt pn (R+ ) = R+ .
+
Nach Satz 6.6 ist die Umkehrabbildung p−1
R+
n : R → R stetig. Für jedes x ∈ √
ist p−1
y ≥ 0 mit y n = x und daher schreibt man n x
n (x) die eindeutige reelle Zahl√
für y. Also ist die Abbildung x 7→ n x von R+ auf R+ streng monoton wachsend
und stetig. Insbesondere haben wir Folgendes:
Satz 6.8 Sei n ≥ 1; zu jedem x ∈ R+ gibt es eine eindeutige reelle Zahl y ∈ R+
mit y n = x.
Mit n = 2 haben wir endlich festgestellt, dass jedes x ∈ R+ eine Quadratwurzel
besitzt: Es gibt eine eindeutige reelle Zahl y ∈ R+ mit y 2 = x.
7
Mehr über Differentiation
Im Folgenden sei I stets ein Intervall.
Im nächsten Satz sei f : I → R eine streng monotone stetige Abbildung. Da f (I)
aus mehr als einem Punkt besteht, ist nach Satz 6.2 J = f (I) ein Intervall und
die Umkehrabbildung f −1 : J → R, die ebenfalls streng monoton ist, ist nach
Satz 6.6 stetig. Ist a ∈ I ◦ , so ist f (a) ∈ J ◦ . (Da a ∈ I ◦ , gibt es ein δ > 0, so dass
(a − δ, a + δ) ⊂ I; dann sind f (a − δ) und f (a + δ) Punkte in J = f (I) und f (a)
liegt strikt zwischen f (a − δ) und f (a + δ). Also ist f (a) kein Endpunkt von J.)
Satz 7.1 Sei a ∈ I ◦ und setze b = f (a). Ist f in a differenzierbar, so ist f −1 in
b differenzierbar genau dann, wenn f ′ (a) 6= 0, und in diesem Fall ist
(f −1 )′ (b) = 1/f ′(a) .
Satz 7.2 Für n ≥ 1 sei wn : R+ → R die Abbildung mit wn (x) =
x ∈ R+ . Dann ist wn in b differenzierbar für jedes b > 0 mit
wn′ (b) =
√
n
x für alle
1
√
n−1 .
n
n b
Sei nun f : I → R eine beliebige Abbildung. Dann hat f in a ∈ I ein lokales
Minimum (bzw. lokales Maximum ), wenn es ein δ > 0 gibt, so dass f (a) ≤ f (x)
(bzw. f (a) ≥ f (x)) für alle x ∈ I mit |x − a| < δ. Man sagt ferner, dass f in
a ein lokales Extremum besitzt, wenn f in a entweder ein lokales Minimum oder
ein lokales Maximum hat.
Satz 7.3 Sei f : I → R eine Abbildung und a ∈ I ◦ . Besitzt f in a ein lokales
Extremum und ist f in a differenzierbar, so ist f ′ (a) = 0.
Eine Abbildung f : I → R heißt in I ◦ differenzierbar, wenn f in c differenzierbar
ist für jedes c ∈ I ◦ .
Satz 7.4 (Satz von Rolle) Sei f : I → R eine stetige Abbildung, die in I ◦
differenzierbar ist, und seien a, b ∈ I mit a < b. Ist f (a) = f (b), dann gibt es ein
c ∈ (a, b), so dass f ′ (c) = 0 (und hier ist f ′ (c) definiert, da c ∈ (a, b) ⊂ I ◦ ).
33
7 Mehr über Differentiation
34
Satz 7.5 (Mittelwertsatz) Sei f : I → R eine stetige Abbildung, die in I ◦
differenzierbar ist, seien a, b ∈ I mit a < b. Dann gibt es ein c ∈ (a, b), so dass
f ′ (c) =
f (b) − f (a)
b−a
(und wieder ist f ′ (c) definiert, da c ∈ (a, b) ⊂ I ◦ ).
Satz 7.6 Sei f : I → R eine stetige Abbildung. Dann ist f konstant genau, wenn
f in I ◦ differenzierbar ist und f ′ (x) = 0 für alle x ∈ I ◦ .
Satz 7.7 Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist.
(1) Dann ist f monoton wachsend (bzw. monoton fallend) genau, wenn f ′ (x) ≥ 0
(bzw. f ′ (x) ≤ 0) für alle x ∈ I ◦ .
(2) Gilt f ′ (x) > 0 (bzw. f ′ (x) < 0) für alle x ∈ I ◦ , so ist f streng monoton
wachsend (bzw. streng monoton fallend).
Die Umkehrung von Satz 7.7 (2) ist falsch: Sei f : R → R die Abbildung, die
gegeben ist durch f (x) = x3 für alle x ∈ R. Dann ist f streng monoton wachsend,
aber f ′ (x) = 3x2 für alle x ∈ R und insbesondere ist f ′ (0) = 0.
Satz 7.8 Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist und
seien a, b ∈ I mit a < b. Nehme an, dass f ′ (x) 6= 0 für alle x ∈ (a, b).
(1) Gilt entweder f (a) < 0 und f (b) > 0 oder f (a) > 0 und f (b) < 0, dann gibt
es genau einen Punkt c ∈ (a, b) mit f (c) = 0.
(2) Gilt entweder f (a) ≤ 0 und f (b) ≤ 0 oder f (a) ≥ 0 und f (b) ≥ 0, so ist
f (x) 6= 0 für alle x ∈ (a, b).
Im Folgenden seien a, b ∈ R mit a < b und sei f : [a, b] → R eine stetige
Abbildung, die in (a, b) differenzierbar ist. Die Abbildung f hat in c ∈ [a, b] ein
Maximum (bzw. ein Minimum ,) wenn f (c) ≥ f (x) (bzw. f (c) ≤ f (x)) für alle
x ∈ [a, b]. Nach Satz 6.3 (Satz von Minimum und Maximum) gibt es mindestens
einen Punkt c ∈ [a, b], in dem f ein Maximum hat und mindestens einen Punkt
d ∈ [a, b], in dem f ein Minimum hat. Andererseits ist ein Maximum (bzw.
Minimum) ein lokales Maximum (bzw. ein lokales Minimum) und daraus ergibt
7 Mehr über Differentiation
35
sich nach Satz 7.3 Folgendes: Ist c ∈ (a, b) ein Punkt, in dem f ein Maximum
oder ein Minimum hat, so ist f ′ (c) = 0. Setze
Maxf = {a ∈ D : f hat in a ein Maximum} ,
Minf = {a ∈ D : f hat in a ein Minimum} ,
Nullf ′ = {a ∈ I : f ′ (a) = 0} .
Dann ist sowohl Maxf als auch Minf eine Teilmenge der Menge {c, d} ∪ Nullf ′ .
Dieses kann man benutzen, um die Stellen zu finden, in denen f ein Maximum
oder ein Minimum hat.
Beispiele (1) Sei f : [0, 1] → R die durch f (x) = x − x2 für alle x ∈ [0, 1]
definierte Abbildung. Da f ′ (a) = 1 − 2a, ist Nullf ′ = { 12 }, und damit sind Maxf
und Minf beide Teilmengen von {0, 12 , 1}. Aber f (0) = f (1) = 0 und f ( 12 ) = 41 ,
und folglich ist Maxf = { 21 } und Minf = {0, 1}.
(2) Sei f : [0, 1] → R die durch f (x) = 1 − x2 + 2x4 für alle x ∈ [0, 1] definierte
Abbildung. Da f ′ (a) = −2a + 8a3 , ist Nullf ′ = { 21 }, und damit sind Maxf und
Minf beide Teilmengen von {0, 21 , 1}. Aber f (0) = 1, f (1) = 2 und f ( 21 ) = 78 , und
daher ist Maxf = {1} und Minf = { 12 }.
(3) Sei f : [−1, 1] → R die durch f (x) = x3 für alle x ∈ [−1, 1] definierte
Abbildung. Da f ′ (a) = 3a2 , ist Nullf ′ = {0}, und damit sind Maxf und Minf
beide Teilmengen von {−1, 0, 1}. Aber f (−1) = −1, f (1) = 1 und f (0) = 0, und
folglich ist Maxf = {1} und Minf = {−1}. In diesem Fall ist 0 weder ein lokales
Maximum noch ein lokales Minimum von f , obwohl f ′ (0) = 0.
(4) Ein Bauer hat einen Zaun der Länge 500 m und will damit ein Rechteck mit
der größmöglichen Fläche umschließen. Welche Länge und Breite muss dann das
Rechteck haben? Betrachte ein Rechteck mit der Länge x; dann ist die Breite
250 − x und die umschlossene Fläche ist x(250 − x). Mathematisch ist also die
Aufgabe: Man berechne Maxf , wobei f : [0, 250] → R die Abbildung ist mit
f (x) = x(250 − x) für alle x ∈ [0, 250]. Da f ′ (a) = 250 − 2a, ist Nullf ′ = {125},
und damit ist Maxf eine Teilmenge von {0, 125, 250}. Aber f (0) = f (250) = 0
und f (125) = 125 · 125 und daher ist Maxf = {125}. Folglich soll das Rechteck
eine Länge und eine Breite von 125 m haben.
8
Integration von stetigen Funktionen
Setze R+ = {x ∈ R : x ≥ 0}. Ist A eine nichtleere Teilmenge von R und wenn wir
f : A → R+ schreiben, dann meinen wir, dass f : A → R eine Abbildung ist mit
f (x) ∈ R+ für alle x ∈ A (d.h. mit f (x) ≥ 0 für alle x ∈ A). Sind f, g : A → R+
Abbildungen, so bedeutet f ≤ g (oder g ≥ f ), dass f (x) ≤ g(x) für alle x ∈ A.
Seien a, b ∈ R mit a < b. Zu jeder Abbildung f : [a, b] → R+ gibt es die Teilmenge
Ff = {(x, y) ∈ R2 : x ∈ [a, b] und 0 ≤ y ≤ f (x)}
von der Ebene R2 . Diese Teilmenge Ff kann als Fläche unter der Abbildung f
angesehen werden. Im folgenden Bild, in dem die Abbildung f stetig ist, besteht
die Teilmenge Ff aus genau denjenigen Punkten in der Ebene, die innerhalb (oder
auf) der roten Linie liegen.
f
Ff
b
a
In diesem Kapitel werden wir für jede stetige Abbildung f : [a, b] → R+ eine Zahl
einführen,
die den Flächeninhalt von der Teilmenge Ff angibt. Diese Größe wird
R
mit f bezeichnet und wird das Integral von f genannt.
Zunächst aber betrachten wir die Treppenfunktionen. Außer von trivialen Fällen
sind diese Abbildungen nicht stetig, aber für eine Treppenfunktion f ist klar, was
der Flächeninhalt von Ff ist und man kann ihn auch explizit berechnen.
Eine Abbildung f : [a, b] → R+ heißt Treppenfunktion, wenn es a0 , . . . , an ∈ R
mit a = a0 < · · · < an = b gibt, so dass f konstant auf jedem der Intervalle
[a0 , a1 ], (a1 , a2 ], . . . (an−1 , an ] ist. Die geordnete Menge U = (a0 , . . . , an ) heißt
dann eine Unterteilung für f .
36
8 Integration von stetigen Funktionen
37
f
a = a0
a1
a2
an = b
Ist f : [a, b] → R+ eine Treppenfunktion, so gibt es keine eindeutige Unterteilung
für f , da man zu jeder Unterteilung eine neue Unterteilung durch das Hinzufügen
von zusätzlichen (überflüssigen) Elementen konstruieren kann.
f
a = a0
a1
a2
am = b
Es gibt aber eine minimale Unterteilung U = (a0 , . . . , an ), in der a1 , . . . , an−1
genau die Stellen in [a, b] sind, in der f einen Sprung macht‘.
’
8 Integration von stetigen Funktionen
38
Für jedes c ∈ R+ ist insbesondere die konstante Abbildung kc : [a, b] → R+ (mit
kc (x) = c für alle x ∈ [a, b]) eine Treppenfunktion. Diese konstanten Abbildungen
sind die einzigen Treppenfunktionen, die stetig sind.
Lemma 8.1 Seien f, g : [a, b] → R+ Treppenfunktionen.
(1) Für alle c, d ∈ R+ ist cf + dg eine Treppenfunktion.
(2) Ist f ≤ g, so ist g − f eine Treppenfunktion.
Sei U = (a0 , . . . , an ) eine Unterteilung für die Treppenfunktion f , und für jedes
j = 1, . . . , n sei cj der Wert von f auf dem Intervall (aj−1 , aj ]. Setze
Z
n
X
cj (aj − aj−1 ) .
f=
U
j=1
c1
f
c2
R1
R2
cn
Rn
a0
a1
a2
an
R
Es ist anschaulich klar, dass U f der Flächeninhalt von Ff ist, da Ff aus n
im Wesentlichen nicht überlappenden Rechtecken R1 , . . . , Rn besteht, und also
ist ihr Flächeninhalt die Summe r1 + · · · + rn , wobei rj = cj (aj −Raj−1) der
Flächeninhalt von Rj ist. Formal müssen wir aber nachweisen, dass U f nicht
von der Unterteilung U abhängt:
Lemma 8.2 Sind U und V Unterteilungen für die Treppenfunktion f , so ist
Z
Z
f=
f.
U
V
8 Integration von stetigen Funktionen
39
R
Da nach Lemma R8.2 die Zahl U f nicht von
R der Unterteilung U abhängt, wird
diese einfach mit f bezeichnet; die Zahl f gibt also den Fächeninhalt von Ff
R
R
an und heißt Integral von f . (Oft schreibt man f (x) dx statt f .)
R
Insbesondere gilt kc = (b − a)c für die konstante Abbildung kc : [a, b] → R+ , da
{a, b} eine Unterteilung für kc ist.
Lemma 8.3 Seien f, g : [a, b] → R+ Treppenfunktionen.
R
R
R
(1) Für alle c, d ∈ R+ ist (cf + dg) = c f + d g.
R
R
(2) Ist f ≤ g, so ist f ≤ g.
R
Sei f : [a, b] → R+ eine stetige Abbildung; wir werden nun den Flächeninhalt f
von der Fläche Ff bestimmen. Sind g, h : [a, b] → R+ Treppenfunktionen
mit
R
g ≤ f ≤ h, so ist Fg ⊂R Ff ⊂ FRh und folglich muss der Flächeninhalt
f zwischen
R
den Flächeninhalten g und h liegen. Für den Flächeninhalt f muss also
Z
Z
Z
g≤ f≤ h
gelten für alleR Treppenfunktionen g, h : [a, b] → R+ mit g ≤ f ≤ h. Es stellt sich
heraus, dass f schon eindeutig durch diese Anforderung festgelegt ist. Um dies
zu zeigen, wird der folgende Zusammenhang zwischen stetigen Abbildungen und
Treppenfunktionen benötigt:
Satz 8.1 Sei f : [a, b] → R+ eine stetige Abbildung und sei ε > 0. Dann gibt es
Treppenfunktionen g, h : [a, b] → R+ mit g ≤ f ≤ h und h ≤ g + ε (d.h. mit
h(x) ≤ g(x) + ε für alle x ∈ [a, b]).
h
g
a0
a1
a2
f
an
8 Integration von stetigen Funktionen
40
Sei f : [a, b] → R+ eine stetige Abbildung und sei ε > 0. Nach Satz 8.1 gibt es
Treppenfunktionen g, h R: [a, b]R→ R+ mit g ≤ f ≤ h und h ≤ g + kε . Da g ≤ h,
ist nach
Lemma
8.3 (2)
R
R
R g R≤ h und
R da h ≤ g + ε, ist nach Lemma 8.3 (1) und
(2) h ≤ (g + ε) = g + kε = g + (b − a)ε. Es gilt also
Z
Z
Z
g ≤ h ≤ g + (b − a)ε
R
R
und insbesondere ist | g − h| ≤ (b − a)ε.
Satz 8.2 Sei f : [a, b]R→ R+ eine stetige Abbildung; dann gibt es eine eindeutige
Zahl c ∈ RR+ , so dass g ≤ c für jede Treppenfunktion g : [a, b] → R+ mit g ≤ f
und c ≤ h für jede Treppenfunktion h : [a, b] → R+ mit f ≤ h.
Die Zahl c in Satz 8.2 heißt das Integral von f und wird mit
bezeichnet.
R
f (oder
R
f (x) dx)
Satz 8.3 Seien f, g : [a, b] → R+ stetige Abbildungen.
R
R
R
(1) Für alle c, d ∈ R+ ist (cf + dg) = c f + d g.
R
R
(2) Ist f ≤ g, so ist f ≤ g.
Wir wollen nun das Integral für stetige Abbildungen definieren, die auch negative
Werte annehmen können und dafür brauchen wir folgende Konstruktion: Für jede
Abbildung f : [a, b] → R definiere Abbildungen f+ , f− : [a, b] → R+ durch
f (x) falls f (x) ≥ 0 ,
f+ (x) =
0 falls f (x) < 0 ,
−f (x) falls f (x) < 0 ,
f− (x) =
0
falls f (x) ≥ 0 .
Also gilt f = f+ − f− .
Lemma 8.4 Für jede stetige Abbildung f : [a, b] → R sind die Abbildungen f+
und f− auch stetig.
Sei f : [a, b] → R stetig; dann definieren wir das Integral
Z
f=
Z
f+ −
Z
f− .
R
f von f durch
8 Integration von stetigen Funktionen
41
Satz 8.4 Seien f, g : [a, b] → R stetige Abbildungen.
R
R
R
(1) Für alle c, d ∈ R ist (cf + dg) = c f + d g.
R
R
(2) Ist f ≤ g, so ist f ≤ g.
Satz 8.5 (Mittelwertsatz der Integralrechnung) Sei f : [a, b] → R stetig.
Dann gibt es ein c ∈ [a, b], so dass
Z
f = f (c)(b − a) .
Im Folgenden sei I ein beliebiges Intervall. Sei f : I → R eine stetige Abbildung
und seien a, b ∈ I mit a < b; bezeichne mit f|[a,b] die Einschränkung von f
auf [a, b], d.h. f|[a,b] : [a, b] → R ist die Abbildung mit f|[a,b] (x) = f (x)
R für alle
x ∈ [a, b]. Nach Satz 3.1 ist f|[a,b] stetig und folglich ist das Integral f|[a,b] von
Rb
R
f|[a,b] definiert. Wir schreiben aber a f statt f|[a,b] .
Lemma 8.5 Für jede stetige Abbildung f und alle a, c, b ∈ I mit a < c < b ist
Z b
Z c
Z b
f=
f+
f.
a
a
c
Für eine stetige Abbildung f ist es nützlich, das Integral‘
’
Z b
Z a
f =−
f
a
Rb
a
f durch
b
zu definieren, falls a, b ∈ I mit b < a. Für jedes a ∈ I setzt man schließlich
Z a
f =0.
a
Lemma 8.6 Sei f : I → R eine stetige Abbildung; für alle a, b, c ∈ I gilt dann
Z b
Z c
Z b
f=
f+
f.
a
a
c
8 Integration von stetigen Funktionen
42
Satz 8.6 Sei f : I → R stetig, sei a ∈ I und definiere F : I → R durch
Z x
F (x) =
f
a
für jedes x ∈ I. Dann ist die Abbildung F stetig, F ist in I ◦ differenzierbar und
es gilt F ′ (b) = f (b) für alle b ∈ I ◦ .
Sei f : I → R stetig. Eine stetige Abbildung F : I → R, die in I ◦ differenzierbar
ist, heißt Stammfunktion von f , wenn F ′ (x) = f (x) für alle x ∈ I ◦ .
Nach Satz 8.6 besitzt jede stetige Abbildung
f eine Stammfunktion: Wähle einen
Rx
Punkt a ∈ I; die Abbildung x 7→ a f ist dann eine Stammfunktion von f .
Ist F : I → R eine Stammfunktion von f , so ist F + c auch eine Stammfunktion
für jedes c ∈ R, da (F + c)′ (x) = F ′ (x) + k′c (x) = F ′ (x) + 0 = f (x) + 0 = f (x)
für alle x ∈ I ◦ . Die Umkehrung ist ebenfalls richtig:
Satz 8.7 Sind F und G beide Stammfunktionen von f , so ist F − G konstant.
Satz 8.8 Sei f : I → R eine stetige Abbildung, sei a ∈ I und b ∈ R. Dann besitzt
f eine eindeutige Stammfunktion F mit F (a) = b.
Beispiele: (1) Seien c0 , . . . , cn ∈ R (mit n ≥ 0) und sei f : R → R gegeben durch
f (x) = c0 + c1 x + c2 x2 + · · · + cn xn .
Dann ist nach Satz 4.5 (1) die Abbildung
1
1
1
x 7→ c0 x + c1 x2 + c2 x3 + · · · +
cn xn+1
2
3
n+1
eine Stammfunktion von f .
(2) Sei I = {x ∈ R : x > 0} und für n ≥ 1 sei gn : I → R gegeben durch
gn (x) =
1
.
xn
Ist n ≥ 2, so ist nach Satz 4.5 (2) die Abbildung
x 7→ −
1
(n − 1)xn−1
eine Stammfunktion von gn .
Folgendes Ergebnis wird Fundamentalsatz der Differential- und Integralrechnung
genannt:
8 Integration von stetigen Funktionen
43
Satz 8.9 Sei f : I → R eine stetige Abbildung und sei F eine Stammfunktion
von f . Dann gilt für alle a, b ∈ I
Z b
f = F (b) − F (a) .
a
Beispiele: (1) Sei f : R → R die Abbildung, die definiert ist durch
f (x) = 3x2 + 4x + 6
für alle x ∈ R. Definiere F : R → R durch F (x) = x3 + 2x2 + 6x für alle x ∈ R;
da F ′ = f , ist F eine Stammfunktion von f und folglich ist
Z 1
f = F (1) − F (−1) = (13 + 2 · 12 + 6 · 1) − ((−1)3 + 2(−1)2 + 6(−1)) = 14 ,
−1
Z
3
2
Z
f = F (3) − F (2) = (33 + 2 · 32 + 6 · 3) − (23 + 2 · 22 + 6 · 2) = 53 ,
5
1
f = F (5) − F (1) = (53 + 2 · 53 + 6 · 5) − (13 + 2 · 12 + 6 · 1) = 194 .
(2) Sei I = {x ∈ R : x > 0} und sei f : I → R definiert durch
f (x) =
1
4
+
x2 x3
für alle x ∈ I. Definiere F : I → R durch
2
1
F (x) = − − 2
x x
für alle x ∈ I; da F ′ = f , ist F eine Stammfunktion von f und folglich ist
Z 2
1
2 1
2
f = F (2) − F (1) = − − 2 − − − 2 = 2 ,
2 2
1 1
1
Z 3
1
2 1
2 4
f = F (3) − F (2) = − − 2 − − − 2 = ,
3 3
2 2
9
2
Z 10
1
4
2 1
2
f = F (10) − F (5) = − − 2 − − − 2 =
.
10 10
5 5
25
5
Sei J ein Intervall; eine stetige Abbildung g : J → R heißt stetig differenzierbar,
wenn g in J ◦ differenzierbar ist und die Ableitung g ′ : J ◦ → R stetig ist.
8 Integration von stetigen Funktionen
44
Satz 8.10 (Substitutionsregel) Sei f : I → R stetig und sei g : J → R eine
stetig differenzierbare Abbildung mit g(J) ⊂ I. Seien a, b ∈ J ◦ mit a < b und
nehme an, dass g((a, b)) ⊂ I ◦ . Dann gilt
Z
a
b
′
f (g(t))g (t) dt =
Z
g(b)
f.
g(a)
Man beachte: Da a, b ∈ J ◦ , ist g ′(x) definiert für alle x ∈ [a, b] und folglich
können wir nach Satz 3.1 und Satz 3.3 eine stetige Abbildung h : [a, b] → R
definieren durch h(x) = f (g(x))g ′(x) für alle x ∈ [a, b]. Also gibt es das Integral
Rb
Rb
h
=
f (g(t))g ′(t) dt.
a
a
Satz 8.11 (Partielle Integration) Seien f, g : I → R stetig differenzierbare
Abbildungen. Dann gilt für alle a, b ∈ I ◦ mit a < b
Z b
Z b
′
f g = f (b)g(b) − f (a)g(a) −
gf ′ .
a
a
Man beachte: Wie in Satz 8.10 sind x 7→ f (x)g ′ (x) und x 7→ g(x)f ′ (x) stetige
Rb
Rb
Abbildungen auf [a, b] und damit sind die Integrale a f g ′ und a gf ′ definiert.
9
Die Funktionen log und exp
In diesem Kapitel werden wir den natürlichen Logarithmus log : (0, ∞) → R
und die Exponentialfunktion exp : R → R kennenlernen. Die Abbildung log wird
als Stammfunktion von der Abbildung x 7→ 1/x definiert und exp wird dann als
Umkehrabbildung von log eingeführt.
Satz 9.1 Es gibt eine eindeutige differenzierbare Abbildung log : (0, ∞) → R mit
log(1) = 0 und log′ (x) = 1/x für alle x > 0.
Die Abbildung log : (0, ∞) → R in Satz 9.1 heißt natürlicher Logarithmus. Nach
Satz 7.7 (2) ist log streng monoton wachsend, da log′ (x) = 1/x > 0 für alle x > 0.
log
0
1
Satz 9.2 Für alle x, y ∈ (0, ∞) gilt log(xy) = log(x) + log(y).
Insbesondere gilt nach Satz 9.2, dass
log(1/x) = − log(x)
für alle x > 0, da log(x) + log(1/x) = log(x · 1/x) = log(1) = 0.
Lemma 9.1 Es gilt log((0, ∞)) = R.
Die Umkehrabbildung log−1 : R → R wird mit exp bezeichnet und sie heißt
Exponentialfunktion. Also ist exp streng monoton wachsend mit exp(R) = (0, ∞)
und nach Satz 6.3 ist exp stetig. Da log(1) = 0, ist exp(0) = 1. Die Zahl exp(0)
heißt Eulersche Zahl und wird mit e bezeichnet; sie liegt zwischen 2, 171828 und
2, 171829.
45
9 Die Funktionen log und exp
46
exp
1
0
Satz 9.3 Für alle x, y ∈ R gilt exp(x + y) = exp(x) exp(y).
Insbesondere gilt nach Satz 9.3, dass
exp(−x) = 1/ exp(x)
für alle x ∈ R, da exp(−x) exp(x) = exp(−x + x) = exp(0) = 1.
Satz 9.4 Die Exponentialfunktion exp ist differenzierbar mit exp′ (x) = exp(x)
für alle x ∈ R.
Im folgenden Satz sei I ein Intervall, das mehr als einen Punkt enthält und wie
in Kapitel 7 sei I ◦ die Menge I ohne ihre Endpunkte.
Satz 9.5 Sei a ∈ I und seien b, c ∈ R. Sei f : I → R eine stetige Abbildung,
die in I ◦ differenzierbar ist und für die gilt: f (a) = b und f ′ (x) = cf (x) für alle
x ∈ I ◦ . Dann gilt f (x) = b exp(c(x − a)) für alle x ∈ I.
Satz 9.6 Die Exponentialfunktion ist die eindeutige differenzierbare Abbildung
f : R → R mit f ′ = f und f (0) = 1.
Satz 9.7 Sei f : R → R eine differenzierbare Abbildung mit f (0) = 1 und
f (x + y) = f (x)f (y)
für alle x, y ∈ R. Dann gilt f (x) = exp(cx) für alle x ∈ R, wobei c = f ′ (0).
Insbesondere ist die Exponentialfunktion die eindeutige differenzierbare Abbildung
f : R → R mit f (0) = f ′ (0) = 1 und f (x + y) = f (x)f (y) für alle x, y ∈ R.
10
Trigonometrische Funktionen
In diesem Kapitel führen wir die Cosinus- und Sinus-Funktionen ein.
Erinnerung: Für Punkte P = (x, y) und Q = (x′ , y ′) in R2 ist der Abstand
zwischen P und Q gegeben durch
p
d(P, Q) = (x′ − x)2 + (y ′ − y)2 .
Betrachte den Kreis S 1 in der euklidischen Ebene R2 mit Radius 1 und Mittelpunkt O = (0, 0). Also besteht S 1 aus den Punkten (x, y) in R2 mit x2 + y 2 = 1,
da sie genau√die Punkte sind, die Abstand 1 zu O haben. Für jedes a ∈ [0, 1]
sei Pa = (a, 1 − a2 ) der Punkt auf dem Kreis, der über a liegt und sei OPa die
Verbindungsgerade zwischen O und Pa . Insbesondere ist P1 = (1, 0) und somit
ist OP1 ein Teil von der x-Achse. Sei a ∈ [0, 1] und sei θ der Winkel zwischen
OP1 und OPa . Dann lernt man in der Schule, dass
√
cos(θ) = a und sin(θ) = 1 − a2 .
Pa = (a,
√
1 − a2 )
1
sin(θ)
θ
O
a
cos(θ)
P1
Wie misst man aber den Winkel θ? Im Alltag wird der Grad als Maßeinheit
benutzt, wobei 1 Grad als 360. Teil des Vollwinkels definiert ist. (Für a ∈ [0, 1]
liegt also der Winkel θ zwischen 0 und 90 Grad.) Für fast alle Anwendungen
in der Mathematik ist es jedoch besser, Bogenmaß zu verwenden: Wenn θ in
Bogenmaß gemessen wird, so ist θ die Länge des Kreisbogens zwischen P1 und
47
10 Trigonometrische Funktionen
48
Pa . (Der Vollwinkel hat also ein Bogenmaß von 2π, wobei per Definition π die
Hälfte des Umfangs von einem Kreis mit Radius 1 ist, und für a ∈ [0, 1] liegt das
Bogenmaß von θ zwischen 0 und π/2.)
Wir werden nicht direkt mit der Länge des Kreisbogens arbeiten, da dies nicht so
einfach ist, sondern mit einem Flächeninhalt, der im Wesentlichen den gleichen
Wert ergibt. Für jedes a ∈ [0, 1] sei Fa die Fläche, die durch die Verbindungsgeraden OP1 , OPa und den Kreisbogen zwischen P1 und Pa bestimmt ist. Im Bild
ist diese Fläche das gelb gefärbte Gebiet.
Pa = (a,
√
1 − a2 )
θ
O
a
P1
Im Folgenden machen wir von der Tatsache Gebrauch, dass die Länge des Kreisbogens zwischen P1 und Pa zweimal der Fächeninhalt von Fa ist. Auf einem
Beweis wird hier verzichtet, da wir die Länge eines Kreisbogens nicht definieren
wollen. In der Schule hat man aber mindestens einen Spezialfall davon gesehen:
Der Umfang eines Kreises vom Radius 1 ist 2π und der Flächeninhalt der Kreisscheibe ist die Hälfte von 2π, nämlich π.
Der Flächeninhalt von Fa wird durch ein Integral gegeben: Sei ha : [0, 1] → R
die stetige Abbildung, deren Graphen durch die rote Linie gegeben ist. Auf dem
Intervall [0, a] ist also ha eine Gerade und auf dem Intervall [a, 1] ist ha ein
Kreisbogen. Genauer haben wir
√
( √
1 − a2 /a)x falls 0 < x < a ,
ha (x) =
1 − x2
falls a ≤ x ≤ 1 ,
10 Trigonometrische Funktionen
49
√
da 1 − a2 /a die Steigerung der Verbindungsgeraden OPa ist. (Wenn
a = 0, ist
√
die Steigerung nicht definiert, aber in diesem Fall ist ha (x) = 1 − x2 für alle
x ∈ [0, 1].) Nun ist
Fa = Fha = {(x, y) ∈ R2 : x ∈ [0, 1] und 0 ≤ y ≤ ha (x)}
R
und damit ist der Flächeninhalt von Fa durch das Integral ha gegeben.
Definiere eine Abbildung γ : [0, 1] → R durch
Z
γ(a) = 2 ha
für jedes a ∈ [0, 1]. Insbesondere ist γ(1) = 0 und γ(0) = π/2 (da es sich um
einen rechten Winkel handelt, wenn a = 0). Da wir Bogenmaß verwenden, um
den Winkel θ zwischen den Verbindungsgeraden OP1 und OPa zu messen, ist
θ = γ(a).
Lemma 10.1 Für alle a ∈ [0, 1] gilt
Z 1√
√
2
γ(a) = a 1 − a + 2
1 − x2 dx .
a
Lemma 10.2 Die Abbildung γ ist stetig, γ ist differenzierbar in (0, 1) und es gilt
γ ′ (a) = − √
1
1 − a2
für alle a ∈ (0, 1). Insbesondere ist γ ′ (a) < 0 für alle a ∈ (0, 1) und folglich ist
nach Satz 7.7 (2) γ streng monoton fallend. Ferner ist γ([0, 1]) = [0, π/2].
Da nach Lemma 10.2 γ : [0, 1] → R stetig und streng monoton fallend ist und
γ([0, 1]) = [0, π/2], gibt es die Umkehrabbildung γ −1 : [0, π/2] → R. Also gilt
γ −1 ([0, π/2]) = [0, 1], γ −1 ist ebenfalls streng monoton fallend und nach Satz 6.6
ist γ −1 stetig.
Sei a ∈ [0, 1] und sei θ der Winkel zwischen den Verbindungsgeraden OP1 und
OPa . Dann ist einerseits θ = γ(a) und andererseits a = cos(θ) und daraus ergibt
sich, dass cos(θ) = a = γ −1 (γ(a)) = γ −1 (θ). Für jedes θ ∈ [0, π/2] ist also
cos(θ) = γ −1 (θ)
p
p
und damit auch sin(θ) = 1 − (cos(θ))2 = 1 − (γ −1 (θ))2 .
10 Trigonometrische Funktionen
50
Satz 10.1 Die Abbildungen cos, sin : [0, π/2] → R sind stetig, cos ist streng
monoton fallend und sin streng monoton wachsend mit cos(0) = 1, cos(π/2) = 0,
sin(0) = 0 und sin(π/2) = 1. Ferner sind beide Abbildungen differenzierbar in
(0, π/2) und für alle θ ∈ (0, π/2) gilt
cos′ (θ) = − sin(θ) und sin′ (θ) = cos(θ) .
1
sin
cos
0
π/2
Der folgende Satz zeigt, dass die Abbildung cos, sin : [0, π/2] → R eindeutig
durch die in Satz 10.1 vorkommenden Eigenschaften bestimmt sind.
Satz 10.2 Seien s, c : [0, π/2] → R stetige Abbildungen, für die gilt:
(1) s(0) = 0 und c(0) = 1,
(2) s und c sind in (0, π/2) differenzierbar,
(3) s′ (θ) = c(θ) und c′ (θ) = −s(θ) für alle θ ∈ (0, π/2).
Dann ist s = sin und c = cos.
Satz 10.3 Für alle θ ∈ [0, π/2] gilt
sin(π/2 − θ) = cos(θ) und cos(π/2 − θ) = sin(θ) .
10 Trigonometrische Funktionen
51
Bisher sind die Abbildungen sin und cos nur auf dem Intervall [0, π/2] definiert.
Der Definitionsbereich dieser Abbildungen wird jetzt schrittweise erweitert, so
dass wir schließlich Abbildungen sin, cos : R → R haben, die auf der ganzen
reellen Achse definiert sind. In diesem Erweiterungsprozess wird das folgende
Ergebnis benötigt:
Lemma 10.3 Seien a, b, c ∈ R mit a < b < c und seien f : [a, b] → R und
g : [b, c] → R Abbildungen mit f (b) = g(b); definiere h : [a, c] → R durch
f (x) falls x ∈ [a, b] ,
h(x) =
g(x) falls x ∈ (b, c] .
Dann gilt:
(1) Sind f und g stetig, so ist h ebenfalls stetig.
(2) Ist f in (a, b) und g in (b, c) differenzierbar und gibt es eine an der Stelle
b stetige Abbildung d : [a, c] → R mit f ′ (x) = d(x) für alle x ∈ (a, b) und
g ′ (x) = d(x) für alle x ∈ (b, c), so ist h in (a, c) differenzierbar und h′ (x) = d(x)
für alle x ∈ (a, c).
Nun zum Erweiterungsverfahren:
Schritt 1: Der Definitionsbereich der Abbildungen sin und cos wird vom Intervall
[0, π/2] zum Intervall [0, π] erweitert.
Sei θ ∈ [π/2, π]; dann ist θ der Winkel zwischen der√Verbindungsgeraden OP1 und
einer Verbindungsgeraden OPa′ , wobei Pa′ = (−a, 1 − a2 ) mit a ∈ [0, 1]. Ferner
ist π − θ ∈ [0, π/2] und π − θ √
ist der Winkel zwischen den Verbindungsgeraden
OP1 und OPa , wobei Pa = (a, 1 − a2 ).
Pa′ = (−a,
√
√
Pa = (a, 1 − a2 )
1 − a2 )
θ
−a
O
π−θ
a
P1
Nach der Definition√von cos und sin auf dem Intervall [0, π/2] ist cos(π − θ) = a
und sin(π − θ) = 1 − a2 ,√und wie man in der Schule gelernt hat, soll cos(θ)
gleich −a und sin(θ) gleich 1 − a2 sein. Folglich setzen wir für jedes θ ∈ [π/2, π]
cos(θ) = − cos(π − θ) und sin(θ) = sin(π − θ) .
10 Trigonometrische Funktionen
52
1
sin
0
π/2
π
cos
−1
Man beachte: Das Element π/2 liegt sowohl im Intervall [0, π/2] als auch im
Intevall [π/2, π] und damit gibt es zwei Definitionen für cos(π/2) und sin(π/2).
Sie stimmen aber überein, da
cos(π/2) = 0 = − cos(π − π/2) und sin(π) = sin(π − π/2) .
Nach Satz 3.4 und Satz 4.4 sind beide Abbildungen stetig im Intervall [π/2, π] und
differenzierbar in (π/2, π) und sin′ (θ) = − sin′ (π − θ) = − cos(π − θ) = cos(θ)
und cos′ (θ) = − cos′ (π − θ) = − sin(π − θ) = − sin(θ) für alle θ ∈ (π/2, π).
Nach Lemma 10.3 (1) sind also die Abbildungen cos, sin : [0, π] → R stetig und
nach Lemma 10.3 (2) sind sie differenzierbar in (0, π) mit cos′ (θ) = − sin(θ) und
sin′ (θ) = cos(θ) für alle θ ∈ (0, π).
Schritt 2: Der Definitionsbereich der Abbildungen sin und cos wird vom Intervall
[0, π] zum Intervall [0, 2π] erweitert.
Sei θ ∈ [π, 2π]; dann ist θ der Winkel zwischen der √
Verbindungsgeraden OP1 und
einer Verbindungsgeraden OPa′′, wobei Pa′′ = (a, − 1 − a2 ) mit a ∈ [−1, 1]. Ferner ist 2π −θ ∈ [0, π] und 2π −θ ist
√ der Winkel zwischen den Verbindungsgeraden
OP1 und OPa , wobei Pa = (a, − 1 − a2 ).
10 Trigonometrische Funktionen
53
√
Pa = (a, 1 − a2 )
θ
2π − θ
a
P1
√
Pa′′ = (a, − 1 − a2 )
Nach der Definition√von cos und sin auf dem Intervall [0, π] ist cos(2π − θ) = a
, und wie man in der Schule gelernt hat, soll cos(θ)
und sin(2π − θ) = 1 − a2√
gleich a und sin(θ) gleich − 1 − a2 sein. Folglich setzen wir für jedes θ ∈ [π, 2π]
cos(θ) = cos(2π − θ) und sin(θ) = − sin(2π − θ) .
1
cos
0
π
2π
sin
−1
Man beachte: Das Element π liegt sowohl im Intervall [0, π] als auch im Intevall
[π, 2π] und damit gibt es zwei Definitionen für cos(π) und sin(π). Sie stimmen
aber überein, da
cos(π) = cos(2π − π) und sin(π) = 0 = − sin(2π − π) .
Nach Satz 3.4 und Satz 4.4 sind beide Abbildungen stetig im Intervall [π, 2π] und
differenzierbar in (π, 2π) und sin′ (θ) = −(− sin′ (2π − θ)) = cos(2π − θ) = cos(θ)
10 Trigonometrische Funktionen
54
und cos′ (θ) = − cos′ (2π − θ) = sin(2π − θ) = − sin(θ) für alle θ ∈ (π, 2π). Nach
Lemma 10.3 (1) sind also die Abbildungen cos, sin : [0, 2π] → R stetig und nach
Lemma 10.3 (2) sind sie differenzierbar in (0, 2π) mit cos′ (θ) = − sin(θ) und
sin′ (θ) = cos(θ) für alle θ ∈ (0, 2π).
Schritt 3: Der Definitionsbereich der Abbildungen sin und cos wird vom Intervall
[0, 2π] zum Intervall R+ erweitert.
Sei n ∈ N und θ ∈ [2πn, 2π(n + 1)]. Dann ist θ − 2πn ∈ [0, 2π] und θ und θ − 2πn
sind von der gleichen Verbindungsgeraden abgeschlossen. Folglich setzen wir
cos(θ) = cos(θ − 2πn) und sin(θ) = sin(θ − 2πn)
für jedes θ ∈ [2πn, 2π(n + 1)].
sin
0
2π
cos
4π
6π
8π
Man beachte: Das Element 2π(n + 1) liegt sowohl im Intervall [2πn, 2π(n + 1)]
als auch im Intevall [2π(n + 1), 2π(n + 2)] und damit gibt es zwei Definitionen für
cos(2π(n + 1)) und sin(2π(n + 1)). Sie stimmen aber überein, da
cos(2π(n + 1) − 2π(n + 1)) = cos(0) = 1 = cos(2π) = cos(2π(n + 1) − 2πn) ,
sin(2π(n + 1) − 2π(n + 1)) = sin(0) = 0 = sin(2π) = sin(2π(n + 1) − 2πn) .
Beide Abbildungen sind stetig im Intervall [2πn, 2π(n + 1)] und differenzierbar
in (2πn, 2π(n + 1)) und sin′ (θ) = sin′ (θ − 2πn)) = cos(θ − 2πn) = cos(θ) und
cos′ (θ) = cos′ (θ − 2πn) = − sin(θ − 2πn) = − sin(θ) für alle θ ∈ (2πn, 2π(n + 1)).
Nach Lemma 10.3 (1) sind also die Abbildungen cos, sin : R+ → R stetig und
nach Lemma 10.3 (2) sind sie differenzierbar in (0, ∞) mit cos′ (θ) = − sin(θ) und
sin′ (θ) = cos(θ) für alle θ ∈ (0, ∞).
Schritt 4: Der Definitionsbereich der Abbildungen sin und cos wird vom Intervall
R+ zur ganzen reellen Achse R erweitert.
Sei θ ∈ (−∞, 0]; ist θ der Winkel zwischen der Verbindungsgeraden
OP1 und
√
2
einer Verbindungsgeraden OPa, wobei Pa = (a, b) mit b = ± 1 − a , so ist −θ
der Winkel zwischen den Verbindungsgeraden OP1 und OPa′′, wobei Pa′′ = (a, −b).
Folglich setzen wir für jedes θ ∈ (−∞, 0]
cos(θ) = cos(−θ) und sin(θ) = − sin(−θ) .
10 Trigonometrische Funktionen
55
sin
−4π
−2π
cos
0
2π
4π
Die zwei Definitionen für cos(0) und sin(0) stimmen überein, da
cos(0) = cos(−0) und sin(0) = 0 = − sin(−0) .
Nach Satz 3.4 und Satz 4.4 sind beide Abbildungen stetig im Intervall (−∞, 0]
und differenzierbar in (−∞, 0) und sin′ (θ) = −(− sin′ (−θ)) = cos(−θ) = cos(θ)
und cos′ (θ) = − cos′ (−θ) = sin(−θ) = − sin(θ) für alle θ ∈ (−∞, 0). Nach
Lemma 10.3 (1) sind also die Abbildungen cos, sin : R → R stetig und nach
Lemma 10.3 (2) sind sie differenzierbar mit cos′ (θ) = − sin(θ) und sin′ (θ) = cos(θ)
für alle θ ∈ R.
Am Ende dieses Erweiterungsverfahrens haben wir differenzierbare Abbildungen
sin, cos : R → R mit sin(0) = 0, cos(0) = 1, sin′ = cos und cos′ = − sin. Die
Abbildungen sin und cos sind eindeutig durch diese Eigenschaften bestimmt:
Satz 10.4 Seien s, c : R → R differenzierbare Abbildungen, für die gilt:
(1) s(0) = 0 und c(0) = 1,
(2) s′ (θ) = c(θ) und c′ (θ) = −s(θ) für alle θ ∈ R.
Dann ist s = sin und c = cos.
Satz 10.5 Die Abbildungen sin, cos : R → R haben folgende Eigenschaften:
(1) Für alle θ ∈ [0, π/2] gilt cos(π/2 − θ) = sin(θ) und sin(π/2 − θ) = cos(θ).
(2) Für alle θ ∈ [0, π] gilt cos(π − θ) = − cos(θ) und sin(π − θ) = sin(θ).
(3) Für alle θ ∈ [0, 2π] gilt cos(2π − θ) = cos(θ) und sin(2π − θ) = − sin(θ).
(4) Für alle θ ∈ R, n ∈ Z gilt cos(θ + 2πn) = cos(θ) und sin(θ + 2πn) = sin(θ).
(5) Für alle θ ∈ R gilt cos(−θ) = cos(θ) und sin(−θ) = − sin(θ).
(6) Die Abbildung cos ist streng monoton fallend im Intervall [0, π] und streng
monoton wachsend im Intervall [π, 2π].
(7) Die Abbildung sin ist streng monoton wachsend im Intervall [0, π/2] und im
Intervall [3π/2, 2π] und ist streng monoton fallend im Intervall [π/2, 3π/2].
11
Folgen
In den meisten Büchern über Analysis werden Folgen gerade am Anfang eingeführt und sie dienen als Grundlage für die Behandlung von Stetigkeit und
Differenzierbarkeit. Dies ist dafür (offensichtlich) nicht unbedingt notwendig, für
die Weiterentwicklung der Theorie sind sie aber unverzichtbar.
Unter einer Folge aus R versteht man eine Abbildung ̺ : N× → R. Jedem
n ∈ N× = {1, 2, . . .} ist also ein Element xn = ̺(n) ∈ R zugeordnet und man
schreibt hierfür meistens {xn }n≥1 statt ̺. Manchmal ist es nützlich, eine Folge
nicht mit 1, sondern mit 0 oder mit einem Index p ≥ 2 anzufangen. In diesem
Fall schreiben wir dann {xn }n≥0 (bzw. {xn }n≥p ) statt {xn }n≥1 . Die Definitionen
(bzw. Ergebnisse) werden hier für Folgen formuliert, die mit dem Index 1 starten,
aber sie machen einen Sinn (bzw. sie gelten) auch dann, wenn dies nicht der Fall
ist.
Sei {xn }n≥1 eine Folge aus R. Die Folge heißt konvergent gegen x ∈ R, falls es zu
jedem ε > 0 ein m ≥ 1 gibt, so dass |xn − x| < ε für alle n ≥ m.
Sei {xn }n≥1 eine Folge, x ∈ R und p ≥ 1. Offensichtlich hängt es nicht von den
ersten Gliedern x1 , . . . , xp−1 ab, ob {xn }n≥1 gegen x konvergiert. Also konvergiert
{xn }n≥1 gegen x genau dann, wenn {xn }n≥p gegen x konvergiert.
Lemma 11.1 Sei {xn }n≥1 eine Folge aus R und seien x, x′ ∈ R. Konvergiert
{xn }n≥1 gegen x und gegen x′ , so ist x′ = x.
Konvergiert eine Folge {xn }n≥1 aus R gegen x, so nennt man x den Grenzwert
oder den Limes der Folge und schreibt limn→∞ xn = x oder nur limn xn = x.
Nach Lemma 11.1 macht diese Schreibweise einen Sinn.
Wichtige Beispiele: (1) Es gilt limn 1/n = 0; die Folge {1/n}n≥1 konvergiert also
gegen 0: Sei ε > 0; nach Satz 5.1 (Satz von Archimedes) gibt es ein m ≥ 1, so
dass m > ε−1 , und für alle n ≥ m ist dann |1/n − 0| = 1/n ≤ 1/m < ε; folglich
gilt limn 1/n = 0. (In der Tat ist die Aussage, dass die Folge {1/n}n≥1 gegen 0
konvergiert, äquivalent zu der Behauptung im Satz von Archimedes.)
(2) Für jedes x ∈ R mit |x| < 1 konvergiert die Folge {xn }n≥0 der Potenzen
von x gegen 0: Es gilt limn xn = 0. Dies folgt wie in (1) mit Hilfe der folgenden
nützlichen Bernoullischen Ungleichung:
Lemma 11.2 Sei x ∈ R mit x > −1. Dann gilt (1 + x)n ≥ 1 + nx für alle n ∈ N.
Eine Folge {xn }n≥1 aus R heißt beschränkt, wenn es ein c ∈ R+ gibt, so dass
|xn | ≤ c für alle n ≥ 1.
56
11 Folgen
57
Lemma 11.3 Jede konvergente Folge aus R ist beschränkt.
Satz 11.1 Seien {xn }n≥1 , {yn }n≥1 zwei konvergente Folgen mit x = limn xn und
y = limn yn .
(1) Für alle a, b ∈ R konvergiert auch die Folge {axn + byn }n≥1 , und es gilt
lim (axn + byn ) = ax + by .
n→∞
(2) Die Produktfolge {xn yn }n≥1 konvergiert, und es gilt limn xn yn = xy.
(3) Nehme an, dass xn 6= 1 für alle n ≥ 1 und x 6= 1. Dann konvergiert die Folge
{1/xn }n≥1 , und es gilt limn 1/xn = 1/x.
Satz 11.2 (1) Sei {xn }n≥1 eine konvergente Folge reeller Zahlen mit xn ≥ 0 für
alle n ≥ 1. Dann ist limn xn ≥ 0.
(2) Seien {xn }n≥1 , {yn }n≥1 zwei konvergente Folgen reeller Zahlen mit xn ≤ yn
für alle n ≥ 1. Dann ist limn xn ≤ limn yn .
Sei {xn }n≥1 eine Folge aus R und sei 1 ≤ n1 < n2 < · · · eine aufsteigende Folge
aus N× . Dann heißt die Folge {xnk }k≥1 (d.h. die Folge {yk }k≥1 mit yk = xnk für
alle k ≥ 1) Teilfolge der Folge {xn }n≥1 .
Bemerkung: Ist n1 < n2 < · · · eine aufsteigende Folge aus N× , so ist nm ≥ m für
alle m ≥ 1.
Sei {xn }n≥1 eine Folge und sei p ≥ 1. Dann ist die Folge {xn }n≥p sowie jede ihrer
Teilfolgen eine Teilfolge von {xn }n≥1 .
Lemma 11.4 Sei {xn }n≥1 eine konvergente Folge aus R mit limn xn = x. Dann
konvergiert jede Teilfolge – auch gegen x.
In diesem Kapitel haben wir bisher Annahme 5 nur gebraucht um zu zeigen, dass
limn 1/n = 0 und limn z n = 0, falls |z| < 1. Im Rest des Kapitels aber spielen die
Folgerungen aus Annahme 5 eine entscheidende Rolle.
Satz 11.3 (Bolzano-Weierstraß) Jede beschränkte Folge aus R besitzt eine
konvergente Teilfolge.
Eine Folge {xn }n≥1 aus R heißt Cauchy-Folge, wenn es zu jedem ε > 0 ein q ≥ 1
gibt, so dass |xm − xn | < ε für alle m, n ≥ q.
11 Folgen
58
Lemma 11.5 Jede Cauchy-Folge aus R ist beschränkt.
Lemma 11.6 Besitzt eine Cauchy-Folge aus R eine konvergente Teilfolge, so ist
sie selbst konvergent.
Satz 11.4 Eine Folge aus R konvergiert genau dann, wenn sie eine Cauchy-Folge
ist.
Eine Folge {xn }n≥1 reeller Zahlen heißt monoton wachsend, falls xn ≤ xn+1 für
alle n ≥ 1, streng monoton wachsend, falls xn < xn+1 für alle n ≥ 1, monoton
fallend, falls xn+1 ≤ xn für alle n ≥ 1, streng monoton fallend, falls xn+1 < xn
für alle n ≥ 1 und monoton, falls sie monoton wachsend oder monoton fallend
ist.
Es ist klar, dass eine monoton wachsende (bzw. ein monoton fallende) Folge
{xn }n≥1 reeller Zahlen genau dann beschränkt ist, wenn die Menge
{xn : n ≥ 1} = {x ∈ R : es gibt ein n ≥ 1, so dass x = xn }
nach oben (bzw. nach unten) beschränkt ist.
Satz 11.5 Jede beschränkte monotone Folge {xn }n≥1 reeller Zahlen konvergiert.
Es folgen zwei Beispiele, die zeigen, wie Folgen benutzt werden können, um Zahlen
zu konstruieren.
Satz 11.6 Seien a, x0 ∈ R mit a > 0, x0 > 0 und sei {xn }n≥1 die Folge mit
1
a
xn+1 =
xn +
2
xn
√
für alle n ∈ N. Dann gilt limn xn = a.
Satz 11.7 Sei c ∈ R mit 0 ≤ c < 1 und sei {xn }n≥0 eine Folge aus R mit
|xn+2 − xn+1 | ≤ c|xn+1 − xn |
für alle n ≥ 0. Dann konvergiert die Folge {xn }n≥0 .
11 Folgen
59
Die Stetigkeit einer Abbildung f : A → R kann mit Hilfe von Folgen formuliert
werden, und die zweite Aussage im nächsten Satz wird oft als Definition von
Stetigkeit verwendet.
Satz 11.8 Sei A eine nichtleere Teilmenge von R, sei f : A → R eine Abbildung
und a ∈ A. Dann sind äquivalent:
(1) f ist an der Stelle a stetig.
(2) Die Folge {f (xn )}n≥1 konvergiert gegen f (a) für jede Folge {xn }n≥1 aus A,
die gegen a konvergiert.
Satz 11.8 hätte man nicht in Kapitel 3 beweisen können, da man hier benötigt,
dass limn 1/n = 0, und dies ist nur eine Umformulierung vom Satz 5.1 (Satz von
Archimedes).
12
Unendliche Reihen
Sei {xn }n≥1 eine Folge aus R und für jedes n ≥ 1 sei
sn =
n
X
xk
k=1
(= x1 + x2 + · · · + xn ) .
Dann heißt die Folge {sn }n≥1 dieser Partialsummen (unendliche) Reihe mit den
P
Gliedern
xn , n ≥ 1, und wird mit ∞
bezeichnet. Konvergiert die Reihe
n=1 xn P
P∞
∞
n=1 xn , so wird ihr Grenzwert ebenfalls mit
n=1 xn bezeichnet und heißt dann
Summe der Reihe. Bei Reihen fängt man oft mit dem Index 0 an; in diesem
Fall gibt es eine Folge
P∞ {xn }n≥0 , die Folge {sn }n≥0 der Partialsummen und die
(unendliche) Reihe n=0 xn .
P
n
Wichtiges Beispiel: Die geometrische Reihe ∞
n=0 x konvergiert mit der Summe
∞
X
n=0
xn = (1 − x)−1
P
für jedes x ∈ R mit |x| < 1. (Sei x 6= 1 fest und für jedes n ≥ 0 sei sn = nk=0 xk ;
dann ist sn = (1 − x)−1 (1 − xn+1 ) und damit |sn − (1 − x)−1 | = |1 − x|−1 |x|n+1 .
Daraus folgt, dass
{sn }n≥0 gegen (1 − x)−1 konvergiert, falls |x| < 1.
P∞die Folge
D.h.: die Reihe n=0 xn konvergiert mit der Summe (1 − x)−1 , wenn |x| < 1.)
Sei {xn }n≥1 eine Folge aus R und sei qP≥ 1. Dann ist es klar, dass die Reihe
P
∞
dann konvergiert, wenn ∞
n=1 xn genauP
n=q
Px∞n konvergiert. Konvergieren diese
Reihen, so ist ∞
x
=
x
+
·
·
·
+
x
+
1
q−1
n=1 n
n=q xn .
Satz 12.1 Sei {xn }n≥1Peine Folge reeller Zahlen mit xn ≥ 0 für alle n ≥ 1. Dann
nach
konvergiert die Reihe ∞
n=1 xn genau, wenn die Folge der Partialsummen
Pn
oben beschränkt ist, d.h., genau dann, wenn es ein c ≥ 0 gibt, so dass k=1 xk ≤ c
für alle n ≥ 1.
P
Nach Satz 12.1 konvergiert die harmonische Reihe ∞
nicht, da für jedes
n=1 1/n
P∞
P2p
p ≥ 0 gilt n=1 1/n ≥ p/2. Dagegen konvergiert die Reihe n=1 1/n2 , da
n
n n
X
X
X
1
1
1
1
1
=
1
+
1
−
≤2
≤
1
+
=
1
+
−
k2
k(k − 1)
k−1 k
n
k=2
k=2
k=1
für alle n > 1. Im Folgenden sei {xn }n≥1 eine Folge aus R.
Folgendes ist das Cauchysche Konvergenz-Kriterium:
60
12 Unendliche Reihen
61
P∞
Satz 12.2 Die unendliche Reihe P
genau dann, wenn es zu
n=1 xn konvergiert
n
jedem ε > 0 ein q ≥ 1 gibt, so dass
k=m xk < ε für alle n ≥ m ≥ q.
Satz 12.3 Für jede konvergente Reihe
gegen 0.
P∞
n=1
xn konvergiert die Folge {xn }n≥1
Satz 12.4 Sei {cn }n≥1Peine Folge reeller Zahlen mit |xn | ≤ cn P
für alle n ≥ 1.
∞
∞
c
(in
R),
so
konvergiert
die
Reihe
Konvergiert
die
Reihe
n=1 xn und es
n=1 n
P∞
P∞
P∞
gilt
n=1 xn ≤
n=1 cn . Insbesondere konvergiert
n=1 xn mit
∞
∞
X
X
|xn | ,
xn ≤
n=1
P∞
n=1
falls die Reihe n=1 |xn | in R konvergiert.
P
P∞
Die Reihe ∞
x
heißt
absolut
konvergent,
falls
die
Reihe
n
n=1
n=1 |xn | konvergiert
(in R). Die letzte Aussage in Satz 12.4 sagt also, dass eine absolut konvergente
Reihe auch im gewöhnlichen Sinn konvergiert.
P
n
Insbesondere konvergiert die geometrische Reihe ∞
n=0 x absolut für jedes x ∈ R
mit |x| < 1.
Nun werden einige Konvergenz-Kriterien für Reihen betrachtet. Im Folgenden sei
wieder {xn }n≥1 eine Folge aus R.
Satz 12.5 (Majoranten-Kriterium) Sei {cn }n≥1 eine Folge reeller Zahlen mit
|x
für alle n ≥ 1. Konvergiert die Reihe
Pn∞| ≤ cn (und insbesondere ist dann cn ≥ 0)
P∞
n=1 cn (in R), so konvergiert die Reihe
n=1 xn absolut und
∞
∞
X
X
xn ≤
cn .
n=1
n=1
Satz 12.6 (Quotienten-Kriterium) Nehme an, dass xn 6= 0 für alle n ≥ 1
und dass es ein θ ∈ R mit 0 P
< θ < 1 gibt, so dass |xn+1 |/|xn | ≤ θ für alle n ≥ 1.
Dann konvergiert die Reihe ∞
n=1 xn absolut.
Satz 12.7 (Das Leibnizsche Kriterium) Sei {xn }n≥1 eine monoton fallende
Folge reeller Zahlen, die gegen 0 konvergiert (insbesondere
ist also xn ≥ 0 für alle
P∞
n ≥ 1). Dann konvergiert die alternierende Reihe n=1 (−1)n xn .
P
Im Gegensatz zu der harmonischen Reihe ∞
n=1 1/n konvergiert nach Satz 12.7
P∞
die alternierende harmonische Reihe n=1 (−1)n+1 /n. Natürlich kann diese Reihe nicht absolut konvergieren, da die harmonische Reihe nicht konvergiert.