Funktionen: Sommersemester 2009

Werbung
Funktionen
Chris Preston
Sommersemester 2009
Skript ohne Beweise
Inhaltsverzeichnis
1 Die rationalen Zahlen
3
2 Die reellen Zahlen
10
3 Stetige Funktionen
16
4 Differentiation
22
5 Mehr über die reellen Zahlen
26
6 Mehr über stetige Funktionen
30
7 Mehr über Differentiation
33
8 Integration von stetigen Funktionen
36
9 Die Funktionen log und exp
45
10 Trigonometrische Funktionen
47
11 Folgen
56
12 Unendliche Reihen
60
1
Die rationalen Zahlen
In diesem Kapitel werden die rationalen Zahlen kurz diskutiert. Vorausgesetzt
werden adäquate Kenntnisse über die ganzen Zahlen Z = {. . . , −2, −1, 0, 1, 2, . . .}
sowie über die natürlichen Zahlen N = {0, 1, 2, . . .}. Wichtige Eigenschaften, die
wir brauchen, sind: Sind m, n ∈ Z mit m 6= 0 und n 6= 0, so ist auch mn 6= 0. Es
gilt 0n = n0 = 0 für alle n ∈ Z. Ist n ∈ Z mit n 6= 0, so ist genau eines von n
und −n in N \ {0}.
Eng verbunden mit den rationalen Zahlen sind ihre konkreten Manifestationen
als Brüche (und in der Praxis ist die Rechnung mit rationalen Zahlen eigentlich
Bruchrechnung.) Ein Bruch ist ein Ausdruck der Form m/n mit m, n ∈ Z und
n 6= 0. Brüche kann man addieren und multiplizieren, wie man das in der Schule
schon gelernt hat. Brüche sind keine rationalen Zahlen, sie werden aber verwendet,
um rationale Zahlen darzustellen.
Wir werden nicht explizit sagen, was rationale Zahlen sind, werden aber erklären,
wie man sich diese anschaulich vorstellen kann. Dafür wird das Bild der Zahlengeraden verwendet. Die Zahlengerade ist eine in beiden Richtungen unendliche
Gerade, auf der bestimmte Punkte mit Zahlen identifiziert sind. Zunächst werden
die ganzen Zahlen in ihrer natürlichen Reihenfolge und mit den gleichem Abstand
zwischen einer Zahl und der nächsten auf die Zahlengerade gelegt:
−3
−2
−1
0
1
2
3
Die rationalen Zahlen füllen dann zu einem bestimmten Grad die Punkte auf der
Zahlengeraden auf. Jeder Bruch beschreibt, wie ein Punkt auf der Zahlengeraden
konstruiert werden kann, und die Punkte, die auf diese Weise entstehen, sind die
rationalen Zahlen.
Sei zunächst m/n ein Bruch mit n ∈ N \ {0}; dann wird die entsprechende
rationale Zahl auf der Zahlengeraden durch das folgende Verfahren konstruiert:
(1) Das Intervall zwischen 0 und 1 wird in n gleiche Teilintervalle geteilt und das
erste, das 0 als linken Endpunkt hat, wird als Meß-Einheit benutzt.
↓ ↓
−2
−1
0
1
2
(In diesem Beispiel ist n = 5. Die Endpunkte des ersten Teilintervalls werden mit
Pfeilen markiert.)
(2) Ist m ∈ N \ {0}, so reihen wir m Kopien von der Meß-Einheit in der positiven
Richtung aneinander. Das erste Intervall hat 0 als linken Endpunkt und der rechte
3
1 Die rationalen Zahlen
4
Endpunkt eines Intervalls ist der linke Endpunkt des nächsten Intervalls. Der
rechte Endpunkt des letzten Intervalls ist dann die rationale Zahl, die durch
den Bruch konstruiert wird. (Im folgenden Beispiel ist n = 5 und m = 8. Der
konstruierte Punkt wird mit einem Pfeil markiert.)
↓
−2
−1
0
1
2
(3) Ist −m = p ∈ N \ {0}, so reihen wir p Kopien von der Meß-Einheit in der
negativen Richtung aneinander. Das erste Intervall hat 0 als rechten Endpunkt
und der linke Endpunkt eines Intervalls ist der rechte Endpunkt des nächsten
Intervalls. Der linke Endpunkt des letzten Intervalls ist dann die rationale Zahl,
die durch den Bruch konstruiert wird. (Im folgenden Beispiel ist n = 5 und
m = −7. Der konstruierte Punkt wird mit einem Pfeil markiert.)
↓
−2
−1
0
1
2
(4) Ist m = 0, so ist der Nullpunkt 0 die rationale Zahl, der durch den Bruch
konstruiert wird.
↓
−2
−1
0
1
2
Ist nun m/n ein Bruch mit −n ∈ N \ {0}, so konstruiert m/n die gleiche rationale
Zahl wie den Bruch (−m)/(−n).
Die rationale Zahl, die durch den Bruch m/n konstruiert wird, werden wir mit
[m/n] bezeichnen.
Insbesondere ist jede ganze Zahl eine rationale Zahl, und es gilt m = [m/1] für
jedes m ∈ Z, d.h. der Bruch m/1 konstruiert die ganze Zahl m.
Nun ist es möglich, dass zwei verschiedene Brüche die gleiche rationale Zahl
konstruieren. Zum Beispiel ist [n/n] = [1/1] für alle n ∈ Z \ {0}. Um dieses
Problem zu analysieren, brauchen wir zwei Beobachtungen, die anschaulich klar
sein sollen:
(1) Sind p, q, n ∈ Z mit n 6= 0, so gilt [p/n] = [q/n] genau dann, wenn p = q.
(2) Es gilt [(mk)/(nk)] = [m/n] für alle m, n, k ∈ Z mit n 6= 0, k 6= 0 (und dann
ist nk 6= 0).
(Im folgenden Beispiel ist n = 5, m = 8 und k = 2. Unterhalb der Geraden wird
die Konstruktion für den Bruch 8/5 und oberhalb der Geraden die Konstruktion
für den Bruch 16/10 = (8 · 2)/(5 · 2) abgebildet.)
1 Die rationalen Zahlen
5
↓
−2
−1
0
1
2
Lemma 1.1 Nehme an, dass (1) und (2) richtig sind und seien m/n, p/q zwei
Brüche. Dann gilt [m/n] = [p/q] genau, wenn mq = pn.
Wir sagen, dass Brüche m/n und p/q äquivalent sind und schreiben m/n ≈ p/q,
wenn mq = pn. Also konstruieren zwei Brüche die gleiche rationale Zahl genau
dann, wenn sie äquivalent sind.
Aus der Tatsache, dass m/n ≈ p/q genau dann gilt, wenn [m/n] = [p/q], folgen
drei Eigenschaften von der Relation ≈. Erstens gilt m/n ≈ m/n für jeden Bruch
m/n, (da [m/n] = [m/n]), und zweitens gilt p/q ≈ m/n, wenn m/n ≈ p/q (da
[p/q] = [m/n], falls [m/n] = [p/q]). Die dritte Eigenschaft ist: Sind m/n, p/q
und r/s Brüche mit m/n ≈ p/q und p/q ≈ r/s, so ist auch m/n ≈ r/s. (Aus
[m/n] = [p/q] und [p/q] = [r/s] folgt [m/n] = [r/s].)
Die Herleitung dieser Eigenschaften benutzt Lemma 1.1 und hängt also von Aussagen über die Zahlengerade ab. Andererseits hat die Definition von ≈ selbst
nichts mit der Zahlengeraden zu tun. Wie zeigen nun, dass die drei Eigenschaften
direkt aus den Regeln für die Multiplikation in Z folgen.
Lemma 1.2 (1) Es gilt m/n ≈ m/n für alle Brüche m/n.
(2) Sind m/n und p/q Brüche mit m/n ≈ p/q, so ist p/q ≈ m/n.
(3) Sind m/n, p/q und r/s Brüche mit m/n ≈ p/q und p/q ≈ r/s, so ist auch
m/n ≈ r/s.
Die folgenden Aussagen fassen die Beziehung zwischen Brüchen und rationalen
Zahlen zusammen:
(Q1) Jedem Bruch m/n wird eine rationale Zahl zugeordnet, die mit [m/n] bezeichnet wird.
(Q2) Für Brüche m/n und p/q gilt [m/n] = [p/q] genau dann, wenn m/n ≈ p/q.
(Q3) Zu jeder rationalen Zahl r gibt es einen Bruch m/n mit r = [m/n].
(Q4) Jede ganze Zahl ist auch eine rationale Zahl.
(Q5) Für jedes n ∈ Z ist n = [n/1].
Sämtliche Eigenschaften von den rationalen Zahlen, mit denen wir uns im Rest des
Kapitels befassen werden, folgen allein aus diesen fünf Aussagen. Man beachte,
dass die Zahlengerade hier nicht mehr explizit vorkommt.
1 Die rationalen Zahlen
6
Die Menge der rationalen Zahlen wird mit Q bezeichnet. Nach (Q4) ist Z eine Teilmenge von Q. Ist r eine rationale Zahl und m/n ein Bruch mit r = [m/n], dann
sagen wir, dass m/n die Zahl r darstellt oder dass r durch m/n dargestellt wird.
Nach (Q3) läßt sich jede rationale Zahl durch einen Bruch darstellen, aber diese
Darstellung ist nie eindeutig: Ist r eine rationale Zahl mit r = [m/n], so ist nach
(Q2) auch r = [(mp)/(np)] für alle p ∈ Z \ {0}, da (mp)/(np) ≈ m/n.
Lemma 1.3 (Existenz eines gemeinsamen Nenners) Seien r, s ∈ Q; dann
gibt es ℓ, m, n ∈ Z mit n 6= 0, so dass r = [ℓ/n] und s = [m/n].
Wir werden nun die Addition und Multiplikation von rationalen Zahlen einführen.
Dafür beginnen wir bei den Brüchen. Seien m/n und p/q Brüche; die Summe
m/n+ p/q und das Produkt (m/n)(p/q) von m/n und p/q werden definiert durch
m/n + p/q = (mq + pn)/(nq) ,
(m/n)(p/q) = (mp)/(nq) .
Man beachte: Da n 6= 0, q 6= 0, ist auch nq 6= 0 und also sind (mq + pn)/(nq)
und (mp)/(nq) auch Brüche.
Lemma 1.4 Seien a/b, c/d, m/n, p/q Brüche mit a/b ≈ m/n und c/d ≈ p/q.
Dann gilt a/b + c/d ≈ m/n + p/q und (a/b)(c/d) ≈ (m/n)(p/q).
Seien r, s ∈ Q; nach (Q3) gibt es dann Brüche m/n und p/q mit r = [m/n] und
s = [p/q]. Wir definieren die Summe r + s und das Produkt rs von r und s durch:
r + s = [m/n + p/q] und rs = [(m/n)(p/q)] .
Nach Lemma 1.4 macht dies einen Sinn: Sind a/b und c/d weitere Brüche mit
r = [a/b] und s = [c/d], so gilt nach (Q2), dass a/b ≈ m/n und c/d ≈ p/q, damit
ist nach Lemma 1.4 a/b + c/d ≈ m/n + p/q und (a/b)(c/d) ≈ (m/n)(p/q) und
dann ist nach (Q2) [a/b + c/d] = [m/n + p/q] und [(a/b)(c/d)] = [(m/n)(p/q)].
Die Definitionen von r + s und rs hängen also nicht davon ab, welche Brüche
man wählt, um r und s darzustellen.
Seien m, n ∈ Z; da nach (Q5) m = [m/1] und n = [n/1], ist die Summe von m
und n als rationale Zahlen gegeben durch
[m/1] + [n/1] = [(m · 1 + n · 1)/(1 · 1)] = [(m + n)/1] = m + n .
(Für die Multiplikation in Z gilt p · 1 = p für alle p ∈ Z.) Wenn man ganze Zahlen
m und n addiert als rationale Zahlen, so ist ihre Summe m + n nichts anderes als
1 Die rationalen Zahlen
7
ihre Summe als ganze Zahlen. Genauso ist ihr Produkt mn als rationale Zahlen
nichts anderes als ihr Produkt als ganze Zahlen, da
[m/1][n/1] = [(mn)/(1 · 1)] = [(mn)/1] = mn .
Wir untersuchen jetzt, welchen Regeln die Addition und die Multiplikation von
rationalen Zahlen unterliegen. Zunächst aber brauchen wir einige Eigenschaften
von der Addition und Multiplikation von Brüchen.
Lemma 1.5 Für die Addition und Multiplikation von Brüchen gilt Folgendes:
(a1) Für alle Brüche k/ℓ, m/n, p/q gilt
(k/ℓ + m/n) + p/q = k/ℓ + (m/n + p/q) .
(a2) Für alle Brüche m/n, p/q gilt m/n + p/q = p/q + m/n.
(a3) Für jeden Bruch m/n ist 0/1 + m/n = m/n.
(a4) Für jeden Bruch m/n ist (−m)/n + m/n = 0/(nn).
(m1) Für alle Brüche k/ℓ, m/n, p/q gilt
((k/ℓ)(m/n))(p/q) = (k/ℓ)((m/n)(p/q)) .
(m2) Für alle Brüche m/n, p/q gilt (m/n)(p/q) = (p/q)(m/n).
(m3) Für jeden Bruch m/n ist (1/1)(m/n) = m/n.
(d)
Für alle Brüche k/ℓ, m/n, p/q gilt
((kℓ)/(ℓℓ))(m/n + p/q) = (k/ℓ)(m/n) + (k/ℓ)(p/q) .
Lemma 1.6 Für einen Bruch m/n gilt [m/n] = 0 genau dann, wenn m = 0.
Satz 1.1 Die Addition und Multiplikation von rationalen Zahlen unterliegen den
folgenden Regeln:
(A1) Für alle r, s, t ∈ Q gilt (r + s) + t = r + (s + t).
(A2) Für alle r, s ∈ Q gilt r + s = s + r.
(A3) Für alle r ∈ Q ist 0 + r = r, wobei 0 die Null in Z ist.
(A4) Zu jedem r ∈ Q gibt es ein eindeutiges Element −r ∈ Q mit (−r) + r = 0.
(M1) Für alle r, s, t ∈ Q gilt (rs)t = r(st).
1 Die rationalen Zahlen
8
(M2) Für alle r, s ∈ Q gilt rs = sr.
(M3) Für alle r ∈ Q ist 1r = r, wobei 1 die Eins in Z ist.
(M4) Zu jedem r ∈ Q mit r 6= 0 gibt es ein eindeutiges Element r −1 ∈ Q mit
r −1 r = 1.
(D) Für alle r, s, t ∈ Q ist r(s + t) = rs + rt.
Lemma 1.7 Sei r ∈ Q und sei m/n ein Bruch mit r = [m/n].
(1) Es gilt −r = [(−m)/n].
(2) Ist r 6= 0 (und damit ist nach Lemma 1.6 m 6= 0), so ist r −1 = [n/m].
Sei n ∈ Z; dann gibt es eine eindeutige ganze Zahl −n ∈ Z, so dass −n + n = 0.
Aber dann gilt ebenfalls −n+ n = 0 in Q und daraus folgt nach der Eindeutigkeit
in Regel (A4) für Q, dass −n auch die eindeutige rationale Zahl ist mit −n+n = 0.
Für eine ganze Zahl n gibt es also keine Zweideutigkeit mit der Bedeutung von
−n.
Sind r, s ∈ Q mit s 6= 0, so schreibt man oft r/s oder rs statt s−1 r. Insbesondere
ist dann 1/s eine andere Schreibweise für s−1 (da 1/s = s−1 · 1 = s−1 ).
Hier muss man aber aufpassen: Seien m, n ∈ Z mit n 6= 0; dann sind m und n
rationale Zahlen und folglich gibt es die rationale Zahl n−1 m, die mit der neuen
Schreibweise mit m/n bezeichnet wird. Andererseits bezeichnet m/n auch einen
Bruch und in der Tat ist [m/n] = m/n, d.h. der Bruch m/n stellt die rationale
Zahl m/n dar. (Setze r = [m/n]. Dann ist
(n/1)(m/n) = (nm)/(1 · n) = (nm)/n ≈ m/1
und daraus ergibt sich nach (Q2), dass
nr = [n/1][m/n] = [(n/1)(m/n)] = [m/1] = m ,
d.h. es gilt nr = m in Q und damit ist r = 1 · r = (n−1 n)r = n−1 (nr) = n−1 m.
Folglich ist r = m/n.)
Setze nun N× = N \ {0} und man beachte, dass für jedes n ∈ Z \ {0} genau
eines der Zahlen n und −n in N× liegt. Wir brauchen folgende Verfeinerung von
Lemma 1.3:
Lemma 1.8 Seien r, s ∈ Q; dann gibt es ℓ, m ∈ Z und n ∈ N× , so dass r = [ℓ/n]
und s = [m/n].
1 Die rationalen Zahlen
9
Ein Spezialfall von Lemma 1.8 ist mit r = s: Für jedes r ∈ Q gibt es m ∈ Z
und n ∈ N× , so dass r = [m/n]. (Es ist immer möglich, den Nenner aus N× zu
wählen.)
Lemma 1.9 Seien m/n und p/q Brüche mit n, q ∈ N× und m/n ≈ p/q. Dann
gilt m ∈ N× genau, wenn p ∈ N× .
Sei r ∈ Q \ {0}; nach dem Spezialfall von Lemma 1.8 gibt es einen Bruch m/n
mit n ∈ N× , so dass r = [m/n] und nach Lemma 1.6 ist dann m 6= 0. Wir sagen,
dass r positiv ist, wenn m ∈ N× . Nach Lemma 1.9 macht diese Definition einen
Sinn: Ob r positiv ist, hängt nicht davon ab, welchen Bruch (mit Nenner aus N× )
man wählt, um r darzustellen. Anschaulich ist eine rationale Zahl positiv, wenn
sie rechts von 0 auf der Zahlengeraden liegt.
Da m = [m/1] für jedes m ∈ Z, ist eine ganze Zahl m positiv als rationale Zahl
genau dann, wenn m ∈ N× .
Satz 1.2 Für jedes r ∈ Q \ {0} ist genau eines von r und −r positiv.
Satz 1.3 Für positive rationale Zahlen r, s sind r + s und rs ebenfalls positiv.
2
Die reellen Zahlen
In diesem Abschnitt beschäftigen wir uns mit den reellen Zahlen. Wir werden
aber hier nicht explizit sagen, was die reellen Zahlen sind, sondern zunächst nur
überlegen, was wir von ihnen erwarten.
Von den reellen Zahlen erwarten wir mindestens Folgendes:
1. Die reellen Zahlen R entstehen aus den rationalen Zahlen Q durch Hinzufügen
von zusätzlichen Zahlen. Insbesondere ist jede rationale Zahl eine reelle Zahl; es
gilt also Q ⊂ R.
2. Reelle Zahlen kann man addieren und multiplizieren und diese Operationen
sind Erweiterungen der Addition und Multiplikation für rationale Zahlen: Wenn
man rationale Zahlen r und s addiert als reelle Zahlen, so ist ihre Summe r + s
nichts anderes als ihre Summe als rationale Zahlen. Genauso ist ihr Produkt rs
als reelle Zahlen nichts anderes als ihr Produkt als rationale Zahlen.
3. Die Addition und Multiplikation von reellen Zahlen unterliegen den gleichen
Regeln wie für die Addition und Multiplikation von rationalen Zahlen:
(A1) Für alle x, y, z ∈ R gilt (x + y) + z = x + (y + z).
(A2) Für alle x, y ∈ R gilt x + y = y + x.
(A3) Für alle x ∈ R ist 0 + x = x, wobei 0 die Null in Q ist.
(A4) Zu jedem x ∈ R gibt es ein eindeutiges Element −x ∈ R mit (−x) + x = 0.
(M1) Für alle x, y, z ∈ R gilt (xy)z = x(yz).
(M2) Für alle x, y ∈ R gilt xy = yx.
(M3) Für alle x ∈ R ist 1x = x, wobei 1 die Eins in Q ist.
(M4) Zu jedem x ∈ R mit x 6= 0 gibt es ein eindeutiges Element x−1 ∈ R mit
x−1 x = 1.
(D) Für alle x, y, z ∈ R ist x(y + z) = xy + xz.
4. Es gibt eine Menge von positiven reellen Zahlen, die eine Teilmenge von R\{0}
ist und die folgenden Eigenschaften besitzt:
(G1) Jede positive rationale Zahl ist auch eine positive reelle Zahl. (Die Menge
der positiven reellen Zahlen enthält also die Menge der positiven rationalen
Zahlen.)
(G2) Für jedes x ∈ R \ {0} ist genau eines von x und −x positiv.
(G3) Für positive reelle Zahlen x, y sind x + y und xy ebenfalls positiv.
10
2 Die reellen Zahlen
11
Eine Zahl x ∈ R \ {0} heißt negativ, wenn −x positiv ist.
In diesem und auch in den nachfolgenden zwei Kapiteln werden keine weiteren
Annahmen über die reellen Zahlen gemacht. Die Aussagen in diesen Kapiteln
sind also nur solche, die stets gültig sind, sobald man annimmt, dass die reellen
Zahlen die Eigenschaften 1, 2, 3 und 4 besitzen. Da aber 1, 2, 3 und 4 ebenfalls
Eigenschaften von Q sind, sind diese alle Aussagen, die eigentlich nicht zwischen
Q und R unterscheiden. Erst im Kapitel 5 werden wir nochmal überlegen, was
zusätzlich von den reellen Zahlen verlangt werden soll.
Sei r ∈ Q; nach (A4) für Q gibt es dann ein eindeutiges Element −r ∈ Q, so
dass (−r) + r = 0 und daraus folgt aus der Eindeutigkeit in (A4) für R, dass −r
auch die eindeutige reelle Zahl ist mit (−r) + r = 0. Ist r ∈ Q \ {0}, dann gibt es
genauso ein eindeutiges Element r −1 ∈ Q, so dass r −1r = 1 und daraus folgt aus
der Eindeutigkeit in (M4) für R, dass r −1 auch die eindeutige reelle Zahl ist mit
r −1 r = 1.
Lemma 2.1 (1) Es gilt −0 = 0.
(2) Für alle x, y ∈ R gilt −(x + y) = −x + −y.
(3) Es gilt −(−x) = x für alle x ∈ R.
(4) Für alle x, y ∈ R gilt −x = −y genau dann, wenn x = y.
(5) Für alle x ∈ R mit x 6= 0 ist −x 6= 0.
Lemma 2.2 (Kürzungsregeln) (1) Aus z + x = z + y folgt x = y.
(2) Aus x + z = y + z folgt x = y.
Lemma 2.3 (1) Für alle x, y, z ∈ R ist (x + y)z = xz + yz.
(2) Für alle x, y, u, v ∈ R ist (x + y)(u + v) = xu + (xv + (yu + yv)).
Sind x, y ∈ R, so wird die Zahl x + −y meistens mit x − y bezeichnet. Sind
insbesondere r, s ∈ Q, so ist r − s ∈ Q, da −s ∈ Q.
Lemma 2.4 Seien x, y ∈ R; dann ist x − y die eindeutige Zahl z ∈ R mit
x = y + z: Es gilt also x = y + (x − y) und ist z ∈ R eine Zahl mit x = y + z, so
ist z = x − y. Ferner ist x − y = 0 genau dann, wenn x = y.
2 Die reellen Zahlen
12
Lemma 2.5 (1) Es gilt x − 0 = x und 0 − x = −x für alle x ∈ R.
(2) Für alle x, y ∈ R ist y − x = −(x − y) und auch y − x = −x − (−y).
(3) Für alle x, y, z ∈ R ist x − z = (x − y) + (y − z).
(4) Für alle x, y, u, v ∈ R ist (y + v) − (x + u) = (y − x) + (v − u).
(5) Für alle x, y, u, v ∈ R ist yv − xu = x(v − u) + (y − x)v.
Lemma 2.6 Es gilt x0 = 0x = 0 für alle x ∈ R.
Satz 2.1 (1) Es gilt (−x)y = −(xy) = x(−y) für alle x, y ∈ R.
(2) Für alle x, y ∈ R gilt (−x)(−y) = xy.
Satz 2.2 Seien x, y ∈ R mit x 6= 0 und y 6= 0. Dann ist xy 6= 0.
Lemma 2.7 Für alle x, y, z ∈ R ist z(x − y) = zx − zy.
Lemma 2.8 (Kürzungsregeln) (1) Ist z 6= 0, so folgt x = y aus zx = zy.
(2) Ist z 6= 0, so folgt x = y aus xz = yz.
Sind x, y ∈ R mit y 6= 0, so schreibt man oft x/y oder
ist dann 1/y eine andere Schreibweise für y −1.
x
y
statt xy −1. Insbesondere
Im Folgenden betrachten wir nun die Kleiner-Relation auf R.
Lemma 2.9 Wenn man eine rationale Zahl als reelle Zahl betrachtet, so ist sie
eine positive reelle Zahl genau dann, wenn sie eine positive rationale Zahl ist.
Seien x, y ∈ R; wir schreiben x < y, wenn y − x positiv ist und sagen, dass x
kleiner ist als y. Man beachte (und dies ist sehr wichtig): Sind r, s ∈ Q, so gilt
r < s als reelle Zahlen genau dann, wenn r < s als rationale Zahlen gilt. (Dies
folgt aus Lemma 2.9, da die Differenz s − r eine rationale Zahl ist.) Gilt x < y,
so schreibt man auch y > x und sagt, dass y größer ist als x.
Lemma 2.10 Es gilt x > 0 (d.h. 0 < x) genau dann, wenn x positiv ist.
2 Die reellen Zahlen
13
Nach Lemma 2.10 sind die Aussagen x ist positiv“ und x > 0“ äquivalent. Im
”
”
Folgenden werden wir meistens die Letztere verwenden. (In der Tat schreibt man
x > 0“ aber sagt x ist positiv“.) Insbesondere gilt x > y genau dann, wenn
”
”
x − y > 0.
Satz 2.3 (Trichotomie) Für alle x, y ∈ R gilt genau eine der Aussagen:
(1) Die Zahlen x und y sind gleich: Es gilt x = y.
(2) x ist kleiner als y: Es gilt x < y.
(3) y ist kleiner als x: Es gilt y < x.
Satz 2.4 (1) Sind x, y, z ∈ R mit x < y und y < z, so ist x < z.
(2) Sind x, y ∈ R mit x < y, so ist x + z < y + z für alle z ∈ R.
(3) Sind x, y, u, v ∈ R mit x < y und u < v, so ist x + u < y + v.
(4) Sind x, y ∈ R mit x < y, so ist −y < −z.
Es ist nützlich, nicht nur die Kleiner-Relation, sondern auch die Kleiner-gleichRelation zur Verfügung zu haben. Seien x, y ∈ R; wir schreiben x ≤ y, wenn
entweder x < y oder x = y und sagen, dass x kleiner gleich y ist. Man kann hier
auch y ≥ x schreiben und sagen, dass y größer gleich x ist.
Satz 2.5 (1) Für alle x, y ∈ R gilt x ≤ y oder y ≤ x.
(2) Es gilt x ≤ y und y ≤ x genau dann, wenn x = y.
(3) Sind x, y, z ∈ R mit x ≤ y und y ≤ z, so ist x ≤ z. Ferner ist x = z genau
dann, wenn x = y und y = z.
(4) Sind x, y, u, v ∈ R mit x ≤ y und u ≤ v, so ist x + u ≤ y + v. Ferner ist
x + u = y + v genau dann, wenn x = y und u = v.
(5) Sind x, y ∈ R mit x ≤ y, so ist −y ≤ −x.
Seien x, y ∈ R; nach Lemma 2.4 und Lemma 2.10 gilt x ≥ y genau dann, wenn
x − y ≥ 0. Setze R+ = {x ∈ R : x ≥ 0}.
Lemma 2.11 Seien x, y ∈ R+ ; dann ist x + y ∈ R+ und xy ∈ R+ . Ferner ist
x + y = 0 genau dann, wenn y = 0 und y = 0.
2 Die reellen Zahlen
14
Satz 2.6 (1) Sind x, y, u, v ∈ R+ mit x ≤ y und u ≤ v, so ist xu ≤ yv. Ist
ferner x > 0 und u > 0, so gilt xu = yv genau dann, wenn x = y und u = v.
(2) Für jedes x ∈ R \ {0} ist xx > 0.
(3) Ist x ∈ R mit x > 0, so ist auch x−1 > 0.
(4) Sind x, y ∈ R mit x > 0, y > 0 und x < y, so ist y −1 < x−1 .
Für jedes x ∈ R sei der (Absolut)-Betrag |x| von x definiert durch
|x| =
x , falls x ≥ 0,
−x , falls x < 0.
Satz 2.7 Der Absolut-Betrag hat folgende Eigenschaften:
(1) Für jedes x ∈ R ist |x| ≥ 0 und |x| = 0 gilt genau dann, wenn x = 0.
(2) Für alle x, y ∈ R ist |xy| = |x||y|. Insbesondere ist |−x| = |x|.
(3) Für alle x, y ∈ R ist |x + y| ≤ |x| + |y| (Dreiecksungleichung).
(4) Für alle x, y ∈ R ist ||x| −|y|| ≤ |x−y| (Umgekehrte Dreiecksungleichung).
Seien a, b, c ∈ R. Die Aussage a < b < c ist lediglich eine kurze Schreibweise für
die Aussage: a < b und b < c. Genauso verwendet man ähnliche Abkürzungen
wie a < b ≤ c, a ≤ b < c und a ≤ b ≤ c.
Lemma 2.12 Sei b ∈ R mit b > 0 und sei c ∈ R.
(1) Es gilt |c| = b genau dann, wenn c = −b oder c = b.
(2) Es gilt |c| < b genau dann, wenn −b < c < b.
(3) Es gilt |c| ≤ b genau dann, wenn −b ≤ c ≤ b.
Satz 2.8 Seien a, b ∈ R mit b > 0 und sei x ∈ R.
(1) Es gilt |x − a| = b genau dann, wenn x = a − b oder x = a + b.
(2) Es gilt |x − a| < b genau dann, wenn a − b < x < a + b.
(3) Es gilt |x − a| ≤ b genau dann, wenn a − b ≤ x ≤ a + b.
2 Die reellen Zahlen
15
Sei N eine nichtleere endliche Teilmenge von R; dann enthält N ein größtes
Element, d.h., ein Element x ∈ N mit x ≥ y für jedes y ∈ N, sowie ein kleinstes
Element, d.h., ein Element x′ ∈ N mit x′ ≤ y für jedes y ∈ N. Diese Zahlen
werden mit max N und min N bezeichnet. (Die Existenz von max N und min N
kann durch vollständige Induktion nach der Anzahl der Elemente in N gezeigt
werden.) Für N = {x1 , x2 } gilt offensichtlich
x1 falls x1 ≥ x2 ,
x1 falls x1 ≤ x2 ,
max{x1 , x2 } =
und min{x1 , x2 } =
x2 falls x1 < x2
x2 falls x1 > x2 .
Für a, b ∈ R mit a < b setze
[a, b] = {x ∈ R : a ≤ x ≤ b}, (a, b) = {x ∈ R : a < x < b},
(a, b] = {x ∈ R : a < x ≤ b}, [a, b) = {x ∈ R : a ≤ x < b},
und für a, b ∈ R sei
[a, +∞) = {x ∈ R : a ≤ x}, (a, +∞) = {x ∈ R : a < x},
(−∞, b] = {x ∈ R : x ≤ b}, (−∞, b) = {x ∈ R : x < b}.
Eine Teilmenge von R, die eine dieser Formen hat, heißt Intervall; auch R wird als
Intervall betrachtet. Jedes Intervall I hat die folgende Eigenschaft: Sind c, d ∈ I
mit c < d, so ist x ∈ I für jedes x ∈ R mit c < x < d.
3
Stetige Funktionen
Sei A eine nichtleere Teilmenge von R. Eine Abbildung oder eine Funktion f von
A nach R ist eine Vorschrift, die jedem Element von A genau ein Element von
R zuordnet. Das dem Element x ∈ A zugeordnete Element von R wird mit f (x)
bezeichnet. (Die Wörter Funktion und Abbildung haben die gleiche Bedeutung;
wir verwenden aber meistens das Wort Abbildung.)
Man schreibt f : A → R um zu zeigen, dass f eine Abbildung von A nach R ist;
die Menge A heißt Definitionsbereich von f . Für jede Teilmenge B von A wird
{y ∈ R : es gibt ein x ∈ B mit y = f (x)}
mit f (B) bezeichnet. Die Menge f (A) heißt das Bild von f . Zwei Abbildungen
f, g : A → R sind per Definition gleich, wenn f (x) = g(x) für jedes x ∈ A.
Ist A eine nichtleere Teilmenge von R, sind f, g : A → R Abbildungen und ist
c ∈ R, so werden Abbildungen f + g, f g und cf von A nach R definiert durch
(f + g)(x) = f (x) + g(x), (f g)(x) = f (x)g(x) und (cf )(x) = cf (x)
für jedes x ∈ A. Ist ferner f (x) 6= 0 für alle x ∈ A, so wird auch eine Abbildung
1/f : A → R definiert durch (1/f )(x) = 1/f (x) für jedes x ∈ A.
Beispiele: (1) Seien f, g : R → R die Abbildungen mit f (x) = 3x2 + 4x + 3 und
g(x) = x3 + 3x für alle x ∈ R. Dann ist f + g : R → R die Abbildung mit
(f + g)(x) = f (x) + g(x) = (3x2 + 4x + 3) + (x3 + 3x) = x3 + 3x2 + 7x + 3
für alle x ∈ R. Ferner ist f g : R → R die Abbildung mit
(f g)(x) = f (x)g(x) = (3x2 + 4x + 3)(x3 + 3x) = 3x5 + 4x4 + 12x3 + 12x2 + 9x
für alle x ∈ R.
(2) Sei A = R \ {−1, 1} und sei f : A → R die Abbildung mit f (x) = x2 − 1.
Dann ist f (x) 6= 0 für alle x ∈ A und 1/f : A → R ist die Abbildung mit
(1/f )(x) = 1/f (x) =
1
1
=
x2 − 1
(x − 1)(x + 1)
für alle x ∈ A.
Seien A, B nichtleere Teilmengen von R und seien f : A → R und g : B → R
Abbildungen mit f (x) ∈ B für alle x ∈ A (d.h. mit f (A) ⊂ B). Dann gibt es die
Abbildung g ◦ f : A → R, die definiert ist durch
(g ◦ f )(x) = g(f (x))
16
3 Stetige Funktionen
17
für alle x ∈ A. Diese Abbildung heißt die Komposition oder Zusammensetzung
von f und g.
Beispiele: (1) Seien f, g : R → R wieder die Abbildungen mit f (x) = 3x2 +4x+3
und g(y) = y 3 + 3y für alle x, y ∈ R. Dann ist g ◦ f : R → R die Abbildung mit
(g ◦ f )(x) = g(f (x)) = g(3x2 + 4x + 3) = (3x2 + 4x + 3)3 + 3(3x2 + 4x + 3)
für alle x ∈ R.
(2) Seien A = (0, 1), B = {y ∈ R : y > 1} und seien f : A → R und g : B → R
die Abbildungen mit f (x) = 1/x2 und g(y) = 1/y 3 für alle x ∈ A, y ∈ B. Dann
gilt f (x) ∈ B für alle x ∈ A und g ◦ f : A → R ist die Abbildung mit
(g ◦ f )(x) = g(f (x)) = g(1/x2) =
1
= x6
2
3
(1/x )
für alle x ∈ A.
Ist f : A → R eine Abbildung und B eine nichtleere Teilmenge von A, so ist die
Einschränkung von f auf B die Abbildung f|B : B → R, die definiert ist durch
f|B (x) = f (x) für alle x ∈ B.
Beispiel: Sei f : R → R die Abbildung mit f (x) = x2 − 1 für alle x ∈ R und
sei B = R \ {−1, 1}. Dann ist f|B : B → R die Abbildung mit f|B (x) = x2 − 1
für alle x ∈ B. Man beachte: Es gilt f|B (x) 6= 0 für alle x ∈ B und also gibt es
die Abbildung 1/f|B : B → R. Andererseits ist die Abbildung 1/f : R → R nicht
definiert, da f (−1) = f (1) = 0.
Man hat wahrscheinlich eine relativ gute intuitive Vorstellung, was Stetigkeit
für eine Abbildung bedeutet und kennt einige Folgerungen aus dieser Eigenschaft
(zum Beispiel im Zusammenhang mit Kurvendiskussion). Mit nur einer intuitiven
Vorstellung kommt man aber nicht viel weiter und in diesem Kapitel lernen wir
eine sehr präzise Definition von Stetigkeit kennen, die die Grundlage für alles
bildet, das später kommt.
Im Folgenden sei A eine nichtleere Teilmenge von R. Eine Abbildung f : A → R
heißt an einer Stelle a ∈ A stetig, wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass
|f (x) − f (a)| < ε für alle x ∈ A mit |x − a| < δ.
Nach Satz 2.8 (2) gilt |x − a| < δ genau dann, wenn x ∈ (a − δ, a + δ). Also ist
f genau dann an der Stelle a stetig, wenn es zu jedem ε > 0 ein δ > 0 gibt, so
dass f (x) im Intervall (f (a) − ε, f (a) + ε) liegt für alle x ∈ A, die im Intervall
(x − δ, x + δ) liegen.
Die Abbildung f : A → R heißt stetig, wenn sie an jeder Stelle x ∈ A stetig ist.
Beispiele: (1) Die durch id(x) = x definierte Identitätsabbildung id : R → R
ist stetig: Sei a ∈ R und ε > 0; wähle δ = ε. Für x ∈ R mit |x − a| < δ ist
3 Stetige Funktionen
18
|id(x) − id(a)| = |x − a| < δ = ε, d.h. |id(x) − id(a)| < ε für alle x ∈ R mit
|x − a| < δ. Folglich ist id an der Stelle a stetig, und da dies für jedes a ∈ R
richtig ist, ist die Abbildung id stetig.
(2) Jede konstante Abbildung kb : R → R mit kb (x) = b für alle x ∈ R ist
stetig: Sei a ∈ R und ε > 0; wähle δ = 1. Für x ∈ R mit |x − a| < δ ist
|kb (x) − kb (a)| = |b − b| = 0 < ε, d.h. |kb (x) − kb (a)| < ε für alle x ∈ R mit
|x − a| < δ. Folglich ist kb an der Stelle a stetig, und da dies für jedes a ∈ R
richtig ist, ist die Abbildung kb stetig.
(3) Die Abbildung | · | : R → R ist stetig: Sei a ∈ R und ε > 0; wähle δ = ε. Für
x ∈ R mit |x − a| < δ ist nach Satz 2.7 (4) ||x| − |a|| ≤ |x − a| < δ = ε, d.h.
||x| − |a|| < ε für alle x ∈ R mit |x − a| < δ. Folglich ist | · | an der Stelle a stetig,
und da dies für jedes a ∈ R richtig ist, ist die Abbildung | · | stetig.
(4) Seien c, d ∈ R mit c < d, und sei f : [c, d] → R definiert durch f (x) = 5x2
für alle x ∈ [c, d]. Dann ist f stetig: Setze M = max{|c|, |d|} und sei a ∈ [c, d];
für alle x ∈ [c, d] gilt dann
|f (x) − f (a)| = |5x2 − 5a2 | = |5(x + a)(x − a)| = 5|x + a||x − a|
≤ 5(|x| + |a|)|x − a| ≤ 5(M + M)|x − a| = 10M|x − a| .
Sei nun ε > 0 und wähle δ = ε/(10M). Für all x ∈ [c, d] mit |x − a| < δ ist dann
|f (x) − f (a)| ≤ 10M|x − a| < 10Mδ = ε ,
d.h. |f (x) − f (a)| < ε für alle x ∈ [c, d] mit |x − a| < δ. Folglich ist f an der Stelle
a stetig, und da dies für jedes a ∈ [c, d] richtig ist, ist die Abbildung f stetig.
Bemerkung: Im Beispiel 4 haben wir die folgende nützliche Tatsache benutzt
(die man merken soll): Seien c, d ∈ R mit c < d und setze M = max{|c|, |d|};
dann ist |x| ≤ M für alle x ∈ [c, d]. (Ist x ≥ 0, so ist 0 ≤ x ≤ d und damit
|x| = x ≤ d = |d| ≤ M. Ist andererseits x < 0, so ist c ≤ x < 0 und in diesem
Fall ist |x| = −x ≤ −c = |c| ≤ M. In beiden Fällen ist also |x| ≤ M.)
Was bedeutet, dass f an der Stelle a nicht stetig ist? Es bedeutet natürlich, dass
es nicht zu jedem ε > 0 ein δ > 0 gibt, so dass |f (x) − f (a)| < ε für alle x ∈ A
mit |x − a| < δ. Also ist f an der Stelle a nicht stetig genau dann, wenn es ein
ε > 0 gibt, so dass man für jedes δ > 0 ein x ∈ A mit |x − a| < δ finden kann, so
dass |f (x) − f (a)| ≥ ε.
Sei a ∈ R und sei ja : R → R die Abbildung mit
0 falls x < a ,
ja (x) =
1 falls x ≥ a .
Die Abbildung ja ist nicht stetig an der Stelle a: Für jedes δ > 0 setze aδ = a− 12 δ.
Also ist |aδ − a| = 12 δ < δ aber |ja (aδ ) − ja (a)| = |0 − 1| = 1. Für jedes δ > 0 gibt
3 Stetige Funktionen
19
es also ein x ∈ R mit |x − a| < δ, so dass |f (x) − f (a)| ≥ 1. Damit ist ja nicht
stetig an der Stelle a (und hier haben wir ε = 1 genommen).
Die wichtigsten Eigenschaften von stetigen Abbildungen werden in den folgenden
Sätzen präsentiert.
Satz 3.1 (1) Sei f : A → R eine Abbildung und B eine nichtleere Teilmenge
von A. Ist f an der Stelle a ∈ B stetig, so ist es auch die Einschränkung f|B .
(2) Sei f : A → R eine Abbildung, seien c, d ∈ R mit c < d und setze
B = A ∩ [c, d] = {x ∈ A : c ≤ x ≤ d} .
Sei ferner a ∈ A mit c < a < d (und also ist a ∈ B). Ist die Einschänkung f|B
an der Stelle a stetig, so ist f ebenfalls an der Stelle a stetig.
Beispiele: (5) Sei f : R → R definiert durch f (x) = 5x2 für alle x ∈ R. Dann ist
die Abbildung f stetig: Sei a ∈ R und setzte c = a − 1, d = a + 1; im Beispiel 4
haben wir gezeigt, dass die Einschränkung f|[c,d] von f auf [c, d] stetig ist und
insbesondere ist f|[c,d] an der Stelle a stetig. Nun ist c < a < d und daraus ergibt
sich nach Satz 3.1 (2), dass auch f an der Stelle a stetig ist. Da dies für jedes
a ∈ R richtig ist, ist die Abbildung f stetig.
(6) Sei f : I → R eine stetige Abbildung, wobei I ein unbeschränktes Intervall
ist (wie R oder {x ∈ R : x > 0}). Wenn man zeigen will (oder muss), dass f
an der Stelle a ∈ I stetig ist, so kann man meistens wie in (5) verfahren: Wähle
c, d ∈ I mit c < a < d und sei g = f|[c,d] die Einschränkung von f auf [c, d]. Wenn
man zeigen kann, dass die Einschänkung g an der Stelle a stetig ist, so ist nach
Satz 3.1 (2) auch f an der Stelle a stetig. Es reicht also zu zeigen, dass g stetig
ist und dafür wird ein B > 0 (in Abhängigkeit von c, d und f ) gesucht, so dass
|f (x) − f (y)| ≤ B|x − y|
für alle x, y ∈ [c, d] gilt. Wenn man ein solches B findet, so ist es leicht zu zeigen,
dass g an der Stelle a stetig ist für jedes a ∈ [c, d]: Sei ε > 0 und setze δ = ε/B.
Ist x ∈ [c, d] mit |x − a| < δ, so ist
|g(x) − g(a)| = |f (x) − f (a)| ≤ B|x − a| < Bδ = ε ,
d.h. |g(x) − g(a)| < ε für alle x ∈ [c, d] mit |x − a| < δ. Dies zeigt, dass g an der
Stelle a stetig ist.
Lemma 3.1 Sei f : A → R eine Abbildung, die an der Stelle a ∈ A stetig ist.
Dann gibt es δ > 0 und c ≥ 0, so dass |f (x)| ≤ c für alle x ∈ A mit |x − a| < δ.
3 Stetige Funktionen
20
Satz 3.2 Seien f, g : A → R Abbildungen, die beide an der Stelle a ∈ A stetig
sind.
(1) Für alle b, c ∈ R ist die Abbildung bf + cg an der Stelle a stetig.
(2) Die Abbildung f g ist an der Stelle a stetig.
(3) Nehme an, dass f (x) 6= 0 für alle x ∈ A. Dann ist die Abbildung 1/f an der
Stelle a stetig.
Für jedes x ∈ R und jedes n ∈ N wird ein Element xn von R definiert durch:
x0 = 1, x1 = x und (für n > 1) xn = xxn−1 .
Satz 3.3 Seien b0 , . . . , bm , c0 , . . . , cn ∈ R mit c0 + c1 x + · · · + cn xn 6= 0 für alle
x ∈ A (und mit m, n ∈ N). Dann ist die Abbildung f : A → R stetig, wobei
f (x) =
b0 + b1 x + · · · + bm xm
c0 + c1 x + · · · + cn xn
für alle x ∈ A.
Satz 3.4 Sei B eine nichtleere Teilmenge von R und seien f : A → R und
g : B → R Abbildungen mit f (A) ⊂ B. Ist f an der Stelle a ∈ A und g an der
Stelle f (a) ∈ B stetig, so ist die zusammengesetzte Abbildung g ◦ f : A → R an
der Stelle a stetig.
Lemma 3.2 Sei f : A → R eine Abbildung, die an der Stelle a ∈ A stetig ist.
(1) Gibt es ein δ > 0, so dass (a − δ, a) ⊂ A und f (x) ≥ 0 (bzw. f (x) ≤ 0) für
alle x ∈ (a − δ, a), so ist f (a) ≥ 0 (bzw. f (a) ≤ 0).
(2) Gibt es ein δ > 0, so dass (a, a + δ) ⊂ A und f (x) ≥ 0 (bzw. f (x) ≤ 0) für
alle x ∈ (a, a + δ), so ist f (a) ≥ 0 (bzw. f (a) ≤ 0).
Wir bereiten nun die Definition von Differenzierbarkeit im nächsten Kapitel vor.
Ist I ein Intervall, so bezeichnet I ◦ die Menge I ohne ihre Endpunkte (falls sie
Endpunkte hat). Ist a < b und ist I eines der Intervalle [a, b], (a, b], [a, b) und
(a, b), so ist I ◦ = (a, b). Ist I eines der Intervalle [a, ∞) und (a, ∞) (bzw. (−∞, b]
und (−∞, b)), so ist I ◦ = (a, ∞) (bzw. I ◦ = (−∞, b)). Schließlich ist R◦ = R.
Also ist I ◦ stets ein Intervall und für jedes a ∈ I ◦ gibt es ein δ > 0, so dass
(a − δ, a + δ) ⊂ I ◦ .
Im Folgenden sei I ein Intervall.
3 Stetige Funktionen
21
Lemma 3.3 Sei a ∈ I ◦ ; dann ist die Menge {x ∈ I : 0 < |x − a| < δ} nichtleer
für jedes δ > 0.
Sei nun a ∈ I ◦ und sei g : I \ {a} → R eine Abbildung. Ist h : I → R eine
Abbildung mit h(x) = g(x) für alle x ∈ I \ {a}, so ist h(a) der einzige Wert, der
nicht schon durch g festgelegt worden ist.
Satz 3.5 Es gibt höchstens eine Abbildung h : I → R, die an der Stelle a stetig
ist und mit h(x) = g(x) für alle x ∈ I \ {a}.
Beispiele: (1) Sei a ∈ R und sei g : R \ {a} → R die Abbildung mit
−1 falls x < a ,
g(x) =
1 falls x > a .
Sei h : R → R eine Abbildung mit h(x) = g(x) für alle x ∈ R \ {a}. Dann
kann h nicht stetig sein an der Stelle a. (Für jedes δ > 0 setze aδ = a − 21 δ und
a′δ = a + 12 δ. Also ist |aδ − a| = 12 δ < δ und genauso ist |a′δ − a| < δ. Aber
|h(aδ ) − h(a)| = | − 1 − h(a)| = |1 + h(a)| und |h(a′δ ) − h(a)| = |1 − h(a)|, und
mindestens eines von |1 + h(a)| und |1 − h(a)| ist größer gleich 1. Für jedes δ > 0
gibt es also ein x ∈ R mit |x − a| < δ, so dass |h(x) − h(a)| ≥ 1. Damit ist h nicht
stetig an der Stelle a.)
(2) Sei a ∈ R und sei g : R \ {a} → R die Abbildung mit g(x) = x2 für alle
x ∈ R \ {a}. Dann ist g(x) = h(x) für alle x ∈ R \ {a}, wobei h : R → R definiert
ist durch h(x) = x2 für alle x ∈ R. Da h an der Stelle a stetig ist, ist nach Satz 3.5
h die eindeutige Abbildung, die an der Stelle a stetig ist und mit h(x) = g(x) für
alle x ∈ R \ {a}.
4
Differentiation
Im Folgenden sei I stets ein Intervall und sei I ◦ wieder die Menge I ohne ihre
Endpunkte. Für eine Abbildung f : I → R und a ∈ I ◦ definiere eine Abbildung
∆af : I \ {a} → R durch
f (x) − f (a)
.
∆af (x) =
x−a
Dann heißt f in a differenzierbar, wenn es eine Abbildung h : I → R gibt, die an
der Stelle a stetig ist und mit ∆af (x) = h(x) für alle x ∈ I \ {a}. In diesem Fall
ist nach Satz 3.5 die Abbildung h eindeutig durch ∆af bestimmt; den Wert h(a)
nennen wir die Ableitung von f in a. Diese Ableitung wird mit f ′ (a) bezeichnet.
Beispiele: (1) Für jedes c ∈ R ist die konstante Abbildung kc : R → R (mit
kc (x) = c für alle x ∈ R) in jedem Punkt a ∈ R differenzierbar und es gilt
k′c (a) = 0: Für x ∈ R \ {a} ist
∆akc (x) =
kc (x) − kc (a)
c−c
=
=0
x−a
x−a
und damit ist ∆akc (x) = k0 (x) für alle x ∈ R\{a}. Aber die Abbildung k0 ist stetig
an der Stelle a und daraus folgt, dass kc in a differenzierbar mit k′c (a) = k0 (a) = 0.
(2) Die Identitätsabbildung id : R → R (mit id(x) = x für alle x ∈ R) ist in
jedem Punkt a ∈ R differenzierbar mit id′ (a) = 1: Für x ∈ R \ {a} ist
∆aid (x) =
id(x) − id(a)
x−a
=
=1
x−a
x−a
und damit ist ∆aid (x) = k1 (x) für alle x ∈ R\{a}. Aber die Abbildung k1 ist stetig
an der Stelle a und daraus folgt, dass id in a differenzierbar mit id′ (a) = k1 (a) = 1.
(3) Die Abbildung f : R → R mit f (x) = 5x2 für alle x ∈ R ist in jedem Punkt
a ∈ R differenzierbar mit f ′ (a) = 10a: Für x ∈ R \ {a} ist
∆af (x) =
5x2 − 5a2
(x − a)(x + a)
f (x) − f (a)
=
=5
= 5(x + a)
x−a
x−a
x−a
und damit ist ∆af (x) = h(x) für alle x ∈ R \ {a}, wobei h : R → R die durch
h(x) = 5(x + a) für alle x ∈ R definierte Abbildung ist. Aber die Abbildung
h ist stetig an der Stelle a und daraus folgt, dass f in a differenzierbar mit
f ′ (a) = h(a) = 5(a + a) = 10a.
(4) Die (stetige) Abbildung | · | : R → R ist nicht differenzierbar in 0: Für alle
x ∈ R \ {0} gilt
|x|
|x| − |0|
−1 falls x < 0 ,
0
=
=
∆|·| (x) =
1 falls x > 0 ,
x−0
x
22
4 Differentiation
23
und es gibt keine Abbildung h : R → R, die an der Stelle 0 stetig ist und mit
∆af (x) = h(x) für alle x ∈ R \ {0}.
Ist f in a ∈ I ◦ differenzierbar, so gibt es eine eindeutige Abbildung h, die an der
Stelle a stetig ist und mit ∆af (x) = h(x) für alle x ∈ I \ {a}. Diese Abbildung h
wird mit ∆af bezeichnet. Insbesondere ist f ′ (a) = ∆af (a).
Satz 4.1 Sei J ⊂ I ein Intervall, sei a ∈ J ◦ und sei f : I → R eine Abbildung,
die in a differenzierbar ist. Dann ist die Einschränkung f|J von f auf J auch in
a differenzierbar und f|J′ (a) = f ′ (a).
Lemma 4.1 Sei f : I → R in a ∈ I ◦ differenzierbar. Dann gilt
f (x) = f (a) + (x − a)∆fa (x)
für alle x ∈ I.
Satz 4.2 Eine Abbildung, die in a differenzierbar ist, ist an der Stelle a stetig.
Satz 4.3 Seien f, g : I → R Abbildungen, die beide in a ∈ I ◦ differenzierbar
sind.
(1) Für alle b, c ∈ R ist die Abbildung bf + cg in a differenzierbar, und es gilt
(bf + cg)′ (a) = bf ′ (a) + cg ′(a) .
(2) Die Abbildung f g ist in a differenzierbar und es gilt
(f g)′(a) = f (a)g ′ (a) + f ′ (a)g(a) .
(3) Nehme an, dass g(x) 6= 0 für alle x ∈ I. Dann ist die Abbildung f /g in a
differenzierbar, und es gilt
(f /g)′(a) =
f ′ (a)g(a) − f (a)g ′(a)
.
g(a)2
Seien f, g : I → R Abbildungen, die beide in a ∈ I ◦ differenzierbar sind und mit
g(a) 6= 0 (obwohl nicht unbedingt mit g(x) 6= 0 für alle x ∈ I). Nach Satz 4.2
ist g an der Stelle a stetig und damit gibt es ein ε > 0, so dass g(x) 6= 0
für alle x ∈ J = {x ∈ I : |x − a| < ε}. Nun ist J ein Intervall mit a ∈ J ◦
und nach Satz 4.1 sind die Einschränkungen f|J und g|J in a differenzierbar mit
′
f|J′ (a) = f ′ (a) und g|J
(a) = g ′ (a). Dies bedeutet, dass, obwohl g die Bedingung in
Satz 4.3 (3) nicht unbedingt erfüllt, dieser Satz immer noch auf die Abbildungen
f|J und g|J angewendet werden kann.
4 Differentiation
24
Satz 4.4 (Kettenregel) Sei f : I → R differenzierbar in a ∈ I ◦ mit f (I) ⊂ J,
wobei J eine Intervall ist mit f (a) ∈ J ◦ ; sei g : J → R differenzierbar in f (a).
Dann ist die zusammengesetzte Abbildung g ◦ f : I → R differenzierbar in a und
(g ◦ f )′ (a) = g ′(f (a))f ′ (a) .
Eine Abbildung f : I → R heißt differenzierbar in I ◦ , wenn f in a differenzierbar
ist für jedes a ∈ I ◦ .
Satz 4.5 (1) Sei n ∈ N; dann ist die durch pn (x) = xn definierte Abbildung
pn : I → R differenzierbar in I ◦ und
p′n (a) = nan−1
für alle a ∈ I ◦ (mit p′0 (a) = 0).
(2) Nehme an, dass 0 ∈
/ I und sei n ≥ 1. Dann ist die durch qn (x) = 1/xn
definierte Abbildung qn : I → R differenzierbar in I ◦ und für alle a ∈ I ◦ gilt
qn′ (a) = −
n
an+1
.
Seien m, n ∈ N, b0 , . . . , bm , c0 , . . . , cn ∈ R mit c0 + c1 x + · · · + cn xn 6= 0 für alle
x ∈ I. Nach Satz 4.3 und Satz 4.5 ist dann die durch
f (x) =
b0 + b1 x + · · · + bm xm
c0 + c1 x + · · · + cn xn
definierte Abbildung f : I → R differenzierbar in I ◦ und für alle a ∈ I ◦ gilt
f ′ (a) =
(c0 + c1 a + · · · + cn an )g(a) − (b0 + b1 a + · · · + bn am )h(a)
,
(c0 + c1 a + · · · + cn an )2
wobei g(a) = b1 + 2b2 a + · · · + mbm am−1 und h(a) = c1 + 2c2 a + · · · + ncn an−1 .
Sei f : I → R differenzierbar in I ◦ ; es gibt also eine Abbildung f ′ : I ◦ → R, d.h.
die Abbildung x 7→ f ′ (x). Sie heißt die Ableitung von f .
In vielen Anwendungen sind die auftretenden Abbildungen differenzierbar in I ◦
(und nicht nur differenzierbar in einem Punkt). Hier sind also Versionen von
Satz 4.3 und von Satz 4.4, die auf diesen Fall zugeschnitten sind.
Satz 4.6 Seien f, g : I → R Abbildungen, die in I ◦ differenzierbar sind.
(1) Für alle b, c ∈ R ist die Abbildung bf + cg differenzierbar in I ◦ mit
(bf + cg)′ = bf ′ + cg ′ .
4 Differentiation
25
(2) Die Abbildung f g ist differenzierbar in I ◦ mit
(f g)′ = f g ′ + f ′ g .
(3) Ist g(x) 6= 0 für alle x ∈ I, so ist die Abbildung f /g differenzierbar in I ◦ mit
(f /g)′ = (f ′ g − f g ′ )/g 2 .
Satz 4.7 (Kettenregel) Sei f : I → R differenzierbar in I ◦ und sei J eine
weiteres Intervall mit f (I) ⊂ J und f (I ◦ ) ⊂ J ◦ . Ist g : J → R differenzierbar in
J ◦ , so ist zusammengesetzte Abbildung g ◦ f : I → R differenzierbar in I ◦ mit
(g ◦ f )′ = (g ′ ◦ f ) · f ′ .
5
Mehr über die reellen Zahlen
Bisher haben wir über die reellen Zahlen nur angenommen, dass die in Kapitel 2
eingeführten Annahmen 1, 2, 3 und 4 für R gültig sind. Wir haben dann in den
letzten zwei Kapiteln gesehen, welche Aussagen über Stetigkeit und Differenzierbarkeit in diesem Rahmen gemacht werden können.
Da aber die Annahmen 1, 2, 3 und 4 auch für Q gültig sind, können wir keine
Aussage über R beweisen, die für Q falsch ist. Betrachte zum Beispiel die Aussage:
Jede positive reelle Zahl besitzt eine Quadratwurzel, d.h., zu jedem x ∈ R mit
x > 0 gibt es ein y ∈ R mit y 2 = x. Wenn wir diese Aussage nur mit Hilfe von 1,
2, 3 und 4 beweisen könnten, so würde dies auch zeigen, dass es zu jedem x ∈ Q
mit x > 0 ein y ∈ Q mit y 2 = x gibt. Für x = 2 ist diese Aussage aber falsch.
Seien a, b ∈ R mit a < b; wir sagen, dass eine stetige Abbildung f : [a, b] → R die
Zwischenwerteigenschaft hat, wenn es zu jeder reellen Zahl d zwischen f (a) und
f (b) ein c ∈ [a, b] gibt, so dass f (c) = d. In der Schule ging man (mindestens bei
der Kurvendiskussion) davon aus, dass diese eine Eigenschaft von jeder auf einem
abgeschlossenen Intervall [a, b] definierten stetigen Abbildung ist, aber allein aus
den Annahmen 1, 2, 3 und 4 kann man dies nicht herleiten: Wenn es einen
Beweis gäbe, so würde er auch zeigen: Ist f : [0, 1] → Q eine stetige Abbildung
mit f (0) < 0 und f (1) > 0, dann gibt es ein c ∈ Q mit 0 < c < 1, so dass
f (c) = 0. Für die Abbildung mit f (x) = x2 − 12 ist aber die Aussage falsch.
Es muss also mehr von den reellen Zahlen verlangt werden, und diese Forderung
werden wir im Wesentlichen durch die schon in der Schule geglaubte Annahme
festlegen, dass jede stetige Abbildung f : [a, b] → R die Zwischenwerteigenschaft
hat.
Das Problem mit dieser Annahme ist, dass sie keine direkte Aussage über die
reellen Zahlen selbst macht, sondern eine Aussage über stetige Abbildungen ist,
die auf den reellen Zahlen definiert sind. Es gibt doch eine äquivalente (aber etwas
weniger anschauliche) Annahme, die eine direkte Aussage über die reellen Zahlen
ist und die wir jetzt einführen.
Sei A eine Teilmenge von R und c ∈ R; wir schreiben A ≤ c, wenn x ≤ c für
alle x ∈ A und nennen dann c eine obere Schranke von A. Analog schreiben wir
c ≤ A, wenn c ≤ x für alle x ∈ A und hier wird c eine untere Schranke von A
genannt. Sind ferner A und B zwei Teilmengen von R, so schreiben wir A ≤ B,
wenn x ≤ y für alle x ∈ A, y ∈ B.
Lemma 5.1 Äquivalent sind:
(1) Jede stetige Abbildung f : [a, b] → R hat die Zwischenwerteigenschaft.
(2) Für alle nichtleere Teilmengen A, B von R mit A ≤ B gibt es ein c ∈ R, so
dass A ≤ c ≤ B.
26
5 Mehr über die reellen Zahlen
27
Nun führen wir unsere letzte Annahme über die reellen Zahlen ein:
5. Für alle nichtleere Teilmengen A, B von R mit A ≤ B gibt es ein c ∈ R, so
dass A ≤ c ≤ B.
Nach Lemma 5.1 könnte man genauso gut auch Folgendes als letzte Annahme
über die reellen Zahlen verwenden:
5′ . Jede stetige Abbildung f : [a, b] → R hat die Zwischenwerteigenschaft.
Im Folgenden nehmen wir stets an, dass die reellen Zahlen die Eigenschaften 1, 2,
3, 4 und 5 besitzen. Die Behauptung, dass eine Aussage über die reellen Zahlen
richtig ist, bedeutet dann genau, dass diese Aussage eine logische Folgerung aus
den fünf Eigenschaften ist.
Die Annahme 5 ist falsch für die rationalen Zahlen Q. Betrachte die Teilmengen
A = {r ∈ Q : r ≥ 0 und r 2 < 2} und B = {r ∈ Q : r ≥ 0 und r 2 > 2} von Q.
Dann sind A und B nichtleer und A ≤ B. Es gibt aber keine rationale Zahl c mit
A ≤ c ≤ B. (Ist A ≤ c ≤ B, so sieht man leicht, dass c2 = 2.)
Es stellt sich natürlich die Frage, ob und in welchem Sinne die reellen Zahlen
tatsächlich existieren. Man kann mit relativ viel Aufwand zeigen, dass irgendwas
existiert, das die Eigenschaften besitzt, die wir von den reellen Zahlen verlangt
haben. Ferner kann man zeigen, dass, obwohl es eine Vielfalt von Wegen gibt, die
reellen Zahlen zu konstruieren, sie in einem bestimmten Sinne eindeutig durch
die Forderungen 1, 2, 3, 4 und 5 festgelegt sind.
Die nächste Eigenschaft der reellen Zahlen hält man wahrscheinlich sowieso für
richtig, sie folgt aber in der Tat nicht aus 1, 2, 3 und 4 allein ohne 5:
Satz 5.1 (Satz von Archimedes) Zu jeder reellen Zahl b ∈ R gibt es eine
näturliche Zahl n ∈ N mit n > b.
Archimedes ist es vor über zweitausend Jahren aufgefallen, dass man die Aussage in Satz 5.1 braucht, um einige in der Euklidischen Geometrie vorkommende
Konstruktionen mit Zirkel und Lineal sicher durchführen zu können. Er war auch
überzeugt, dass diese Aussage nicht aus den restlichen Axiomen der Euklidischen
Geometrie folgt. Dehalb trägt dieser Satz seinen Namen.
Hier ist eine Umformulierung des Satzes von Archimedes, die eine äquivalente
Aussage über kleine positive Zahlen macht:
Satz 5.2 Zu jedem ε > 0 gibt es ein n ∈ N mit 1/n < ε.
Der nächste Satz sagt, die rationalen Zahlen liegen dicht‘ in den reellen Zahlen.
’
5 Mehr über die reellen Zahlen
28
Satz 5.3 Seien y, z ∈ R mit y < z. Dann gibt es ein x ∈ Q mit y < x < z.
Das analoge Ergebnis gilt auch für die Menge R \ Q.
Satz 5.4 Seien y, z ∈ R mit y < z. Dann gibt es ein x ∈ R \ Q mit y < x < z.
Eine Teilmenge A von R heißt nach oben (bzw. nach unten ) beschränkt, wenn
es ein b ∈ R mit A ≤ b (bzw. mit b ≤ A) gibt. Ferner heißt A beschränkt, wenn
sie nach oben und nach unten beschränkt ist, d.h., wenn es u, v ∈ R gibt, so
dass u ≤ A ≤ v. Man sieht leicht, dass A genau dann beschränkt ist, wenn es ein
c ∈ R mit c ≥ 0 gibt, so dass |x| ≤ c für alle x ∈ A.
Erinnerung: Unter einem Intervall verstehen wir eine Teilmenge von R, die eine
der folgenden Formen hat: [a, b], (a, b), (a, b] und [a, b) (mit a < b), [a, +∞),
(a, +∞), (−∞, b] und (−∞, b); ferner ist R selbst ein Intervall. Jedes Intervall I
hat die folgende Eigenschaft: Sind c, d ∈ I mit c < d, so ist x ∈ I für jedes x ∈ R
mit c < x < d. Außerdem besteht ein Intervall aus mehr als einem Punkt.
Sei I die Menge aller Teilmengen I von R, die mehr als einen Punkt enthalten und
für die gilt: Sind c, d ∈ I mit c < d, so ist x ∈ I für jedes x ∈ R mit c < x < d.
Insbesondere liegt jedes Intervall in I und der Tat gibt es kein weiteres Element
in der Menge I:
Satz 5.5 Jedes Element in I ist ein Intervall. Etwas genauer gilt für ein Element
I ∈ I Folgendes:
(1) Ist I weder nach unten noch nach oben beschränkt, so ist I = R.
(2) Ist I nach oben, aber nicht nach unten beschränkt, dann gibt es ein b ∈ R,
so dass I entweder (−∞, b] oder (−∞, b) ist.
(3) Ist I nach unten, aber nicht nach oben beschränkt, dann gibt es ein a ∈ R,
so dass I entweder [a, +∞) oder (a, +∞) ist.
(4) Ist I beschränkt, dann gibt es a, b ∈ R mit a < b, so dass I eines der vier
Intervalle [a, b], (a, b), (a, b] und [a, b) ist.
Die nächste Eigenschaft der reellen Zahlen spielt eine sehr wichtige Rolle, ist
aber beim ersten Kennenlernen schwer zu verdauen. Sie soll also zunächst als
technisches Hilfsmittel ansehen werden, das eingesetzt werden kann, um weitere
Eigenschaften nachzuweisen.
Sei x ∈ R; ein Intervall (y, z) mit y < x < z wird offenes Intervall um x genannt.
Insbesondere ist J(x, δ) ein offenes Intervall um x für jedes δ > 0, wobei
J(x, δ) = (x − δ, x + δ) = {y ∈ R : |y − x| < δ} .
5 Mehr über die reellen Zahlen
29
Satz 5.6 (Kompaktheit des Intervalls [a, b]) Für jedes x ∈ [a, b] sei Jx ein
offenes Intervall
S um x. Dann gibt es eine endliche Teilmenge N von [a, b], so
dass [a, b] ⊂ x∈N Jx .
Eine Teilmenge F von R heißt kompakt, wenn gilt: Ist Jx ein offenes Intervall um
x fürSjedes x ∈ F , dann gibt es stets eine endliche Teilmenge N von F , so dass
F ⊂ x∈N Jx . Nach Satz 5.6 ist also das Intervall [a, b] kompakt.
6
Mehr über stetige Funktionen
Im Folgenden seien a, b ∈ R mit a < b.
Satz 6.1 (Zwischenwertsatz) Sei f : [a, b] → R eine stetige Abbildung und sei
d eine reelle Zahl zwischen f (a) und f (b). Dann gibt es ein c ∈ R mit f (c) = d.
Hier ist eine direkte Folgerung des Zwischenwertsatzes:
Satz 6.2 Sei f : A → R eine stetige Abbildung (mit A ⊂ R beliebig) und sei I
ein Intervall mit I ⊂ A. Besteht f (I) aus mehr als einem Punkt, so ist f (I) ein
Intervall.
Lemma 6.1 Jede stetige Abbildung f : [a, b] → R ist beschränkt: Es gibt ein
d ≥ 0, so dass |f (x)| ≤ d für alle x ∈ [a, b].
Satz 6.3 (Satz von Minimum und Maximum) Sei f : [a, b] → R stetig.
Dann gibt es u, v ∈ [a, b], so dass f (u) ≤ f (x) ≤ f (v) für alle x ∈ [a, b].
Satz 6.4 Sei f : [a, b] → R eine stetige Abbildung. Besteht f ([a, b]) aus mehr als
einem Punkt, so gibt es c, d ∈ R mit c < d, so dass f ([a, b]) = [c, d].
Man beachte: Die Menge f ([a, b]) besteht aus einem Punkt genau dann, wenn die
Abbildung f konstant ist.
Eine Abbildung f : A → R heißt gleichmäßig stetig, wenn es zu jedem ε > 0 ein
δ > 0 gibt, so dass |f (y) − f (x)| < ε für alle x, y ∈ A mit |y − x| < δ. Eine
gleichmäßig stetige Abbildung ist stetig (und für jedes ε > 0 hängt die Wahl von
δ > 0 nicht von der Stelle a ∈ A ab). Aber im Allgemeinen ist die Umkehrung
falsch: Zum Beispiel ist die auf dem Intervall (0, 1) durch x 7→ 1/x definierte
Abbildung stetig, aber nicht gleichmäßig stetig.
Satz 6.5 (Gleichmäßige Stetigkeit) Jede stetige Abbildung f : [a, b] → R ist
gleichmäßig stetig.
30
6 Mehr über stetige Funktionen
31
Im Folgenden sei I ein Intervall. Eine Abbildung f : I → R heißt
monoton wachsend, falls f (x) ≤ f (y) für alle x, y ∈ I mit x < y,
streng monoton wachsend, falls f (x) < f (y) für alle x, y ∈ I mit x < y,
monoton fallend, falls f (x) ≥ f (y) für alle x, y ∈ I mit x < y,
streng monoton fallend, falls f (x) > f (y) für alle x, y ∈ I mit x < y.
Schließlich heißt f monoton, wenn sie monoton wachsend oder monoton fallend
ist, und streng monoton, wenn sie streng monoton wachsend oder streng monoton
fallend ist. Ist f : I → R streng monoton, so besteht f (I) aus mehr als einem
Punkt. (Es gibt c, d ∈ I mit c 6= d und dann sind f (c) und f (d) zwei verschiedene
Punkte in f (I).)
Sei nun f : I → R eine streng monotone stetige Abbildung und setze J = f (I);
da J aus mehr als einem Punkt besteht, ist nach Satz 6.2 J ein Intervall. Sei
b ∈ J; da J = f (I), gibt es mindestens ein a ∈ I mit f (a) = b. In der Tat gibt
es genau ein a ∈ I mit f (a) = b, da f (a1 ) 6= f (a2 ), wenn a1 , a2 ∈ I mit a1 6= a2 .
(Es gilt entweder a1 < a2 oder a2 < a1 ; ist a1 < a2 , so ist f (a1 ) < f (a2 ) (bzw.
f (a2 ) < f (a1 )), falls f streng monoton wachsend (bzw. streng monoton fallend
ist); ist dagegen a2 < a1 , so ist f (a2 ) < f (a1 ) (bzw. f (a1 ) < f (a2 )), falls f streng
monoton wachsend (bzw. streng monoton fallend ist). In jedem dieser Fälle ist
f (a1 ) 6= f (a2 ).) Da es zu jedem b ∈ J genau ein a ∈ I mit f (a) = b gibt, gibt
es eine eindeutige Abbildung g : J → R, so dass für jedes b ∈ J gilt: g(b) = a,
wobei a das eindeutige Element in I mit f (a) = b ist. Es gilt also g(f (a)) = a für
alle a ∈ I und insbesondere ist g(J) = I. Ferner ist f (g(b)) = b für alle b ∈ J.
Die Abbildung g heißt die Umkehrabbildung von f und wird mit f −1 bezeichnet.
Wir haben also f −1 (f (a)) = a für alle a ∈ I und f (f −1(b)) = b für alle b ∈ J.
Ist f streng monoton wachsend, dann ist die Umkehrabbildung f −1 das auch:
Sind b1 , b1 ∈ J mit b1 < b2 , so ist f (f −1(b1 )) = b1 < b2 = f (f −1 (b2 )) und daraus
ergibt sich, dass f −1 (b1 ) < f −1 (b2 ). Genauso ist f −1 streng monoton fallend, wenn
f das ist.
Lemma 6.2 Sei x ∈ I und ε > 0; dann gibt es ein δ > 0, so dass |y − x| < ε für
alle y ∈ I mit |f (y) − f (x)| < δ.
Satz 6.6 Die Umkehrabbildung f −1 : J → R ist stetig.
Sei wieder R+ = {x ∈ R : x ≥ 0}. Für jedes n ≥ 1 sei pn : R+ → R die Abbildung
mit pn (x) = xn für alle x ≥ 0. Nach Satz 3.2 ist pn stetig und nach Satz 2.6 (1)
(und Induktion) ist pn streng monoton wachsend.
6 Mehr über stetige Funktionen
32
Satz 6.7 Es gilt pn (R+ ) = R+ .
+
Nach Satz 6.6 ist die Umkehrabbildung p−1
R+
n : R → R stetig. Für jedes x ∈ √
ist p−1
y ≥ 0 mit y n = x und daher schreibt man n x
n (x) die eindeutige reelle Zahl√
für y. Also ist die Abbildung x 7→ n x von R+ auf R+ streng monoton wachsend
und stetig. Insbesondere haben wir Folgendes:
Satz 6.8 Sei n ≥ 1; zu jedem x ∈ R+ gibt es eine eindeutige reelle Zahl y ∈ R+
mit y n = x.
Mit n = 2 haben wir endlich festgestellt, dass jedes x ∈ R+ eine Quadratwurzel
besitzt: Es gibt eine eindeutige reelle Zahl y ∈ R+ mit y 2 = x.
7
Mehr über Differentiation
Im Folgenden sei I stets ein Intervall.
Im nächsten Satz sei f : I → R eine streng monotone stetige Abbildung. Da f (I)
aus mehr als einem Punkt besteht, ist nach Satz 6.2 J = f (I) ein Intervall und
die Umkehrabbildung f −1 : J → R, die ebenfalls streng monoton ist, ist nach
Satz 6.6 stetig. Ist a ∈ I ◦ , so ist f (a) ∈ J ◦ . (Da a ∈ I ◦ , gibt es ein δ > 0, so dass
(a − δ, a + δ) ⊂ I; dann sind f (a − δ) und f (a + δ) Punkte in J = f (I) und f (a)
liegt strikt zwischen f (a − δ) und f (a + δ). Also ist f (a) kein Endpunkt von J.)
Satz 7.1 Sei a ∈ I ◦ und setze b = f (a). Ist f in a differenzierbar, so ist f −1 in
b differenzierbar genau dann, wenn f ′ (a) 6= 0, und in diesem Fall ist
(f −1 )′ (b) = 1/f ′(a) .
Satz 7.2 Für n ≥ 1 sei wn : R+ → R die Abbildung mit wn (x) =
x ∈ R+ . Dann ist wn in b differenzierbar für jedes b > 0 mit
wn′ (b) =
√
n
x für alle
1
√
n−1 .
n
n b
Sei nun f : I → R eine beliebige Abbildung. Dann hat f in a ∈ I ein lokales
Minimum (bzw. lokales Maximum ), wenn es ein δ > 0 gibt, so dass f (a) ≤ f (x)
(bzw. f (a) ≥ f (x)) für alle x ∈ I mit |x − a| < δ. Man sagt ferner, dass f in
a ein lokales Extremum besitzt, wenn f in a entweder ein lokales Minimum oder
ein lokales Maximum hat.
Satz 7.3 Sei f : I → R eine Abbildung und a ∈ I ◦ . Besitzt f in a ein lokales
Extremum und ist f in a differenzierbar, so ist f ′ (a) = 0.
Eine Abbildung f : I → R heißt in I ◦ differenzierbar, wenn f in c differenzierbar
ist für jedes c ∈ I ◦ .
Satz 7.4 (Satz von Rolle) Sei f : I → R eine stetige Abbildung, die in I ◦
differenzierbar ist, und seien a, b ∈ I mit a < b. Ist f (a) = f (b), dann gibt es ein
c ∈ (a, b), so dass f ′ (c) = 0 (und hier ist f ′ (c) definiert, da c ∈ (a, b) ⊂ I ◦ ).
33
7 Mehr über Differentiation
34
Satz 7.5 (Mittelwertsatz) Sei f : I → R eine stetige Abbildung, die in I ◦
differenzierbar ist, seien a, b ∈ I mit a < b. Dann gibt es ein c ∈ (a, b), so dass
f ′ (c) =
f (b) − f (a)
b−a
(und wieder ist f ′ (c) definiert, da c ∈ (a, b) ⊂ I ◦ ).
Satz 7.6 Sei f : I → R eine stetige Abbildung. Dann ist f konstant genau, wenn
f in I ◦ differenzierbar ist und f ′ (x) = 0 für alle x ∈ I ◦ .
Satz 7.7 Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist.
(1) Dann ist f monoton wachsend (bzw. monoton fallend) genau, wenn f ′ (x) ≥ 0
(bzw. f ′ (x) ≤ 0) für alle x ∈ I ◦ .
(2) Gilt f ′ (x) > 0 (bzw. f ′ (x) < 0) für alle x ∈ I ◦ , so ist f streng monoton
wachsend (bzw. streng monoton fallend).
Die Umkehrung von Satz 7.7 (2) ist falsch: Sei f : R → R die Abbildung, die
gegeben ist durch f (x) = x3 für alle x ∈ R. Dann ist f streng monoton wachsend,
aber f ′ (x) = 3x2 für alle x ∈ R und insbesondere ist f ′ (0) = 0.
Satz 7.8 Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist und
seien a, b ∈ I mit a < b. Nehme an, dass f ′ (x) 6= 0 für alle x ∈ (a, b).
(1) Gilt entweder f (a) < 0 und f (b) > 0 oder f (a) > 0 und f (b) < 0, dann gibt
es genau einen Punkt c ∈ (a, b) mit f (c) = 0.
(2) Gilt entweder f (a) ≤ 0 und f (b) ≤ 0 oder f (a) ≥ 0 und f (b) ≥ 0, so ist
f (x) 6= 0 für alle x ∈ (a, b).
Im Folgenden seien a, b ∈ R mit a < b und sei f : [a, b] → R eine stetige
Abbildung, die in (a, b) differenzierbar ist. Die Abbildung f hat in c ∈ [a, b] ein
Maximum (bzw. ein Minimum ,) wenn f (c) ≥ f (x) (bzw. f (c) ≤ f (x)) für alle
x ∈ [a, b]. Nach Satz 6.3 (Satz von Minimum und Maximum) gibt es mindestens
einen Punkt c ∈ [a, b], in dem f ein Maximum hat und mindestens einen Punkt
d ∈ [a, b], in dem f ein Minimum hat. Andererseits ist ein Maximum (bzw.
Minimum) ein lokales Maximum (bzw. ein lokales Minimum) und daraus ergibt
7 Mehr über Differentiation
35
sich nach Satz 7.3 Folgendes: Ist c ∈ (a, b) ein Punkt, in dem f ein Maximum
oder ein Minimum hat, so ist f ′ (c) = 0. Setze
Maxf = {a ∈ D : f hat in a ein Maximum} ,
Minf = {a ∈ D : f hat in a ein Minimum} ,
Nullf ′ = {a ∈ I : f ′ (a) = 0} .
Dann ist sowohl Maxf als auch Minf eine Teilmenge der Menge {c, d} ∪ Nullf ′ .
Dieses kann man benutzen, um die Stellen zu finden, in denen f ein Maximum
oder ein Minimum hat.
Beispiele (1) Sei f : [0, 1] → R die durch f (x) = x − x2 für alle x ∈ [0, 1]
definierte Abbildung. Da f ′ (a) = 1 − 2a, ist Nullf ′ = { 12 }, und damit sind Maxf
und Minf beide Teilmengen von {0, 12 , 1}. Aber f (0) = f (1) = 0 und f ( 12 ) = 41 ,
und folglich ist Maxf = { 21 } und Minf = {0, 1}.
(2) Sei f : [0, 1] → R die durch f (x) = 1 − x2 + 2x4 für alle x ∈ [0, 1] definierte
Abbildung. Da f ′ (a) = −2a + 8a3 , ist Nullf ′ = { 21 }, und damit sind Maxf und
Minf beide Teilmengen von {0, 21 , 1}. Aber f (0) = 1, f (1) = 2 und f ( 21 ) = 78 , und
daher ist Maxf = {1} und Minf = { 12 }.
(3) Sei f : [−1, 1] → R die durch f (x) = x3 für alle x ∈ [−1, 1] definierte
Abbildung. Da f ′ (a) = 3a2 , ist Nullf ′ = {0}, und damit sind Maxf und Minf
beide Teilmengen von {−1, 0, 1}. Aber f (−1) = −1, f (1) = 1 und f (0) = 0, und
folglich ist Maxf = {1} und Minf = {−1}. In diesem Fall ist 0 weder ein lokales
Maximum noch ein lokales Minimum von f , obwohl f ′ (0) = 0.
(4) Ein Bauer hat einen Zaun der Länge 500 m und will damit ein Rechteck mit
der größmöglichen Fläche umschließen. Welche Länge und Breite muss dann das
Rechteck haben? Betrachte ein Rechteck mit der Länge x; dann ist die Breite
250 − x und die umschlossene Fläche ist x(250 − x). Mathematisch ist also die
Aufgabe: Man berechne Maxf , wobei f : [0, 250] → R die Abbildung ist mit
f (x) = x(250 − x) für alle x ∈ [0, 250]. Da f ′ (a) = 250 − 2a, ist Nullf ′ = {125},
und damit ist Maxf eine Teilmenge von {0, 125, 250}. Aber f (0) = f (250) = 0
und f (125) = 125 · 125 und daher ist Maxf = {125}. Folglich soll das Rechteck
eine Länge und eine Breite von 125 m haben.
8
Integration von stetigen Funktionen
Setze R+ = {x ∈ R : x ≥ 0}. Ist A eine nichtleere Teilmenge von R und wenn wir
f : A → R+ schreiben, dann meinen wir, dass f : A → R eine Abbildung ist mit
f (x) ∈ R+ für alle x ∈ A (d.h. mit f (x) ≥ 0 für alle x ∈ A). Sind f, g : A → R+
Abbildungen, so bedeutet f ≤ g (oder g ≥ f ), dass f (x) ≤ g(x) für alle x ∈ A.
Seien a, b ∈ R mit a < b. Zu jeder Abbildung f : [a, b] → R+ gibt es die Teilmenge
Ff = {(x, y) ∈ R2 : x ∈ [a, b] und 0 ≤ y ≤ f (x)}
von der Ebene R2 . Diese Teilmenge Ff kann als Fläche unter der Abbildung f
angesehen werden. Im folgenden Bild, in dem die Abbildung f stetig ist, besteht
die Teilmenge Ff aus genau denjenigen Punkten in der Ebene, die innerhalb (oder
auf) der roten Linie liegen.
f
Ff
b
a
In diesem Kapitel werden wir für jede stetige Abbildung f : [a, b] → R+ eine Zahl
einführen,
die den Flächeninhalt von der Teilmenge Ff angibt. Diese Größe wird
R
mit f bezeichnet und wird das Integral von f genannt.
Zunächst aber betrachten wir die Treppenfunktionen. Außer von trivialen Fällen
sind diese Abbildungen nicht stetig, aber für eine Treppenfunktion f ist klar, was
der Flächeninhalt von Ff ist und man kann ihn auch explizit berechnen.
Eine Abbildung f : [a, b] → R+ heißt Treppenfunktion, wenn es a0 , . . . , an ∈ R
mit a = a0 < · · · < an = b gibt, so dass f konstant auf jedem der Intervalle
[a0 , a1 ], (a1 , a2 ], . . . (an−1 , an ] ist. Die geordnete Menge U = (a0 , . . . , an ) heißt
dann eine Unterteilung für f .
36
8 Integration von stetigen Funktionen
37
f
a = a0
a1
a2
an = b
Ist f : [a, b] → R+ eine Treppenfunktion, so gibt es keine eindeutige Unterteilung
für f , da man zu jeder Unterteilung eine neue Unterteilung durch das Hinzufügen
von zusätzlichen (überflüssigen) Elementen konstruieren kann.
f
a = a0
a1
a2
am = b
Es gibt aber eine minimale Unterteilung U = (a0 , . . . , an ), in der a1 , . . . , an−1
genau die Stellen in [a, b] sind, in der f einen Sprung macht‘.
’
8 Integration von stetigen Funktionen
38
Für jedes c ∈ R+ ist insbesondere die konstante Abbildung kc : [a, b] → R+ (mit
kc (x) = c für alle x ∈ [a, b]) eine Treppenfunktion. Diese konstanten Abbildungen
sind die einzigen Treppenfunktionen, die stetig sind.
Lemma 8.1 Seien f, g : [a, b] → R+ Treppenfunktionen.
(1) Für alle c, d ∈ R+ ist cf + dg eine Treppenfunktion.
(2) Ist f ≤ g, so ist g − f eine Treppenfunktion.
Sei U = (a0 , . . . , an ) eine Unterteilung für die Treppenfunktion f , und für jedes
j = 1, . . . , n sei cj der Wert von f auf dem Intervall (aj−1 , aj ]. Setze
Z
n
X
cj (aj − aj−1 ) .
f=
U
j=1
c1
f
c2
R1
R2
cn
Rn
a0
a1
a2
an
R
Es ist anschaulich klar, dass U f der Flächeninhalt von Ff ist, da Ff aus n
im Wesentlichen nicht überlappenden Rechtecken R1 , . . . , Rn besteht, und also
ist ihr Flächeninhalt die Summe r1 + · · · + rn , wobei rj = cj (aj −Raj−1) der
Flächeninhalt von Rj ist. Formal müssen wir aber nachweisen, dass U f nicht
von der Unterteilung U abhängt:
Lemma 8.2 Sind U und V Unterteilungen für die Treppenfunktion f , so ist
Z
Z
f=
f.
U
V
8 Integration von stetigen Funktionen
39
R
Da nach Lemma R8.2 die Zahl U f nicht von
R der Unterteilung U abhängt, wird
diese einfach mit f bezeichnet; die Zahl f gibt also den Fächeninhalt von Ff
R
R
an und heißt Integral von f . (Oft schreibt man f (x) dx statt f .)
R
Insbesondere gilt kc = (b − a)c für die konstante Abbildung kc : [a, b] → R+ , da
{a, b} eine Unterteilung für kc ist.
Lemma 8.3 Seien f, g : [a, b] → R+ Treppenfunktionen.
R
R
R
(1) Für alle c, d ∈ R+ ist (cf + dg) = c f + d g.
R
R
(2) Ist f ≤ g, so ist f ≤ g.
R
Sei f : [a, b] → R+ eine stetige Abbildung; wir werden nun den Flächeninhalt f
von der Fläche Ff bestimmen. Sind g, h : [a, b] → R+ Treppenfunktionen
mit
R
g ≤ f ≤ h, so ist Fg ⊂R Ff ⊂ FRh und folglich muss der Flächeninhalt
f zwischen
R
den Flächeninhalten g und h liegen. Für den Flächeninhalt f muss also
Z
Z
Z
g≤ f≤ h
gelten für alleR Treppenfunktionen g, h : [a, b] → R+ mit g ≤ f ≤ h. Es stellt sich
heraus, dass f schon eindeutig durch diese Anforderung festgelegt ist. Um dies
zu zeigen, wird der folgende Zusammenhang zwischen stetigen Abbildungen und
Treppenfunktionen benötigt:
Satz 8.1 Sei f : [a, b] → R+ eine stetige Abbildung und sei ε > 0. Dann gibt es
Treppenfunktionen g, h : [a, b] → R+ mit g ≤ f ≤ h und h ≤ g + ε (d.h. mit
h(x) ≤ g(x) + ε für alle x ∈ [a, b]).
h
g
a0
a1
a2
f
an
8 Integration von stetigen Funktionen
40
Sei f : [a, b] → R+ eine stetige Abbildung und sei ε > 0. Nach Satz 8.1 gibt es
Treppenfunktionen g, h R: [a, b]R→ R+ mit g ≤ f ≤ h und h ≤ g + kε . Da g ≤ h,
ist nach
Lemma
8.3 (2)
R
R
R g R≤ h und
R da h ≤ g + ε, ist nach Lemma 8.3 (1) und
(2) h ≤ (g + ε) = g + kε = g + (b − a)ε. Es gilt also
Z
Z
Z
g ≤ h ≤ g + (b − a)ε
R
R
und insbesondere ist | g − h| ≤ (b − a)ε.
Satz 8.2 Sei f : [a, b]R→ R+ eine stetige Abbildung; dann gibt es eine eindeutige
Zahl c ∈ RR+ , so dass g ≤ c für jede Treppenfunktion g : [a, b] → R+ mit g ≤ f
und c ≤ h für jede Treppenfunktion h : [a, b] → R+ mit f ≤ h.
Die Zahl c in Satz 8.2 heißt das Integral von f und wird mit
bezeichnet.
R
f (oder
R
f (x) dx)
Satz 8.3 Seien f, g : [a, b] → R+ stetige Abbildungen.
R
R
R
(1) Für alle c, d ∈ R+ ist (cf + dg) = c f + d g.
R
R
(2) Ist f ≤ g, so ist f ≤ g.
Wir wollen nun das Integral für stetige Abbildungen definieren, die auch negative
Werte annehmen können und dafür brauchen wir folgende Konstruktion: Für jede
Abbildung f : [a, b] → R definiere Abbildungen f+ , f− : [a, b] → R+ durch
f (x) falls f (x) ≥ 0 ,
f+ (x) =
0 falls f (x) < 0 ,
−f (x) falls f (x) < 0 ,
f− (x) =
0
falls f (x) ≥ 0 .
Also gilt f = f+ − f− .
Lemma 8.4 Für jede stetige Abbildung f : [a, b] → R sind die Abbildungen f+
und f− auch stetig.
Sei f : [a, b] → R stetig; dann definieren wir das Integral
Z
f=
Z
f+ −
Z
f− .
R
f von f durch
8 Integration von stetigen Funktionen
41
Satz 8.4 Seien f, g : [a, b] → R stetige Abbildungen.
R
R
R
(1) Für alle c, d ∈ R ist (cf + dg) = c f + d g.
R
R
(2) Ist f ≤ g, so ist f ≤ g.
Satz 8.5 (Mittelwertsatz der Integralrechnung) Sei f : [a, b] → R stetig.
Dann gibt es ein c ∈ [a, b], so dass
Z
f = f (c)(b − a) .
Im Folgenden sei I ein beliebiges Intervall. Sei f : I → R eine stetige Abbildung
und seien a, b ∈ I mit a < b; bezeichne mit f|[a,b] die Einschränkung von f
auf [a, b], d.h. f|[a,b] : [a, b] → R ist die Abbildung mit f|[a,b] (x) = f (x)
R für alle
x ∈ [a, b]. Nach Satz 3.1 ist f|[a,b] stetig und folglich ist das Integral f|[a,b] von
Rb
R
f|[a,b] definiert. Wir schreiben aber a f statt f|[a,b] .
Lemma 8.5 Für jede stetige Abbildung f und alle a, c, b ∈ I mit a < c < b ist
Z b
Z c
Z b
f=
f+
f.
a
a
c
Für eine stetige Abbildung f ist es nützlich, das Integral‘
’
Z b
Z a
f =−
f
a
Rb
a
f durch
b
zu definieren, falls a, b ∈ I mit b < a. Für jedes a ∈ I setzt man schließlich
Z a
f =0.
a
Lemma 8.6 Sei f : I → R eine stetige Abbildung; für alle a, b, c ∈ I gilt dann
Z b
Z c
Z b
f=
f+
f.
a
a
c
8 Integration von stetigen Funktionen
42
Satz 8.6 Sei f : I → R stetig, sei a ∈ I und definiere F : I → R durch
Z x
F (x) =
f
a
für jedes x ∈ I. Dann ist die Abbildung F stetig, F ist in I ◦ differenzierbar und
es gilt F ′ (b) = f (b) für alle b ∈ I ◦ .
Sei f : I → R stetig. Eine stetige Abbildung F : I → R, die in I ◦ differenzierbar
ist, heißt Stammfunktion von f , wenn F ′ (x) = f (x) für alle x ∈ I ◦ .
Nach Satz 8.6 besitzt jede stetige Abbildung
f eine Stammfunktion: Wähle einen
Rx
Punkt a ∈ I; die Abbildung x 7→ a f ist dann eine Stammfunktion von f .
Ist F : I → R eine Stammfunktion von f , so ist F + c auch eine Stammfunktion
für jedes c ∈ R, da (F + c)′ (x) = F ′ (x) + k′c (x) = F ′ (x) + 0 = f (x) + 0 = f (x)
für alle x ∈ I ◦ . Die Umkehrung ist ebenfalls richtig:
Satz 8.7 Sind F und G beide Stammfunktionen von f , so ist F − G konstant.
Satz 8.8 Sei f : I → R eine stetige Abbildung, sei a ∈ I und b ∈ R. Dann besitzt
f eine eindeutige Stammfunktion F mit F (a) = b.
Beispiele: (1) Seien c0 , . . . , cn ∈ R (mit n ≥ 0) und sei f : R → R gegeben durch
f (x) = c0 + c1 x + c2 x2 + · · · + cn xn .
Dann ist nach Satz 4.5 (1) die Abbildung
1
1
1
x 7→ c0 x + c1 x2 + c2 x3 + · · · +
cn xn+1
2
3
n+1
eine Stammfunktion von f .
(2) Sei I = {x ∈ R : x > 0} und für n ≥ 1 sei gn : I → R gegeben durch
gn (x) =
1
.
xn
Ist n ≥ 2, so ist nach Satz 4.5 (2) die Abbildung
x 7→ −
1
(n − 1)xn−1
eine Stammfunktion von gn .
Folgendes Ergebnis wird Fundamentalsatz der Differential- und Integralrechnung
genannt:
8 Integration von stetigen Funktionen
43
Satz 8.9 Sei f : I → R eine stetige Abbildung und sei F eine Stammfunktion
von f . Dann gilt für alle a, b ∈ I
Z b
f = F (b) − F (a) .
a
Beispiele: (1) Sei f : R → R die Abbildung, die definiert ist durch
f (x) = 3x2 + 4x + 6
für alle x ∈ R. Definiere F : R → R durch F (x) = x3 + 2x2 + 6x für alle x ∈ R;
da F ′ = f , ist F eine Stammfunktion von f und folglich ist
Z 1
f = F (1) − F (−1) = (13 + 2 · 12 + 6 · 1) − ((−1)3 + 2(−1)2 + 6(−1)) = 14 ,
−1
Z
3
2
Z
f = F (3) − F (2) = (33 + 2 · 32 + 6 · 3) − (23 + 2 · 22 + 6 · 2) = 53 ,
5
1
f = F (5) − F (1) = (53 + 2 · 53 + 6 · 5) − (13 + 2 · 12 + 6 · 1) = 194 .
(2) Sei I = {x ∈ R : x > 0} und sei f : I → R definiert durch
f (x) =
1
4
+
x2 x3
für alle x ∈ I. Definiere F : I → R durch
2
1
F (x) = − − 2
x x
für alle x ∈ I; da F ′ = f , ist F eine Stammfunktion von f und folglich ist
Z 2
1
2 1
2
f = F (2) − F (1) = − − 2 − − − 2 = 2 ,
2 2
1 1
1
Z 3
1
2 1
2 4
f = F (3) − F (2) = − − 2 − − − 2 = ,
3 3
2 2
9
2
Z 10
1
4
2 1
2
f = F (10) − F (5) = − − 2 − − − 2 =
.
10 10
5 5
25
5
Sei J ein Intervall; eine stetige Abbildung g : J → R heißt stetig differenzierbar,
wenn g in J ◦ differenzierbar ist und die Ableitung g ′ : J ◦ → R stetig ist.
8 Integration von stetigen Funktionen
44
Satz 8.10 (Substitutionsregel) Sei f : I → R stetig und sei g : J → R eine
stetig differenzierbare Abbildung mit g(J) ⊂ I. Seien a, b ∈ J ◦ mit a < b und
nehme an, dass g((a, b)) ⊂ I ◦ . Dann gilt
Z
a
b
′
f (g(t))g (t) dt =
Z
g(b)
f.
g(a)
Man beachte: Da a, b ∈ J ◦ , ist g ′(x) definiert für alle x ∈ [a, b] und folglich
können wir nach Satz 3.1 und Satz 3.3 eine stetige Abbildung h : [a, b] → R
definieren durch h(x) = f (g(x))g ′(x) für alle x ∈ [a, b]. Also gibt es das Integral
Rb
Rb
h
=
f (g(t))g ′(t) dt.
a
a
Satz 8.11 (Partielle Integration) Seien f, g : I → R stetig differenzierbare
Abbildungen. Dann gilt für alle a, b ∈ I ◦ mit a < b
Z b
Z b
′
f g = f (b)g(b) − f (a)g(a) −
gf ′ .
a
a
Man beachte: Wie in Satz 8.10 sind x 7→ f (x)g ′ (x) und x 7→ g(x)f ′ (x) stetige
Rb
Rb
Abbildungen auf [a, b] und damit sind die Integrale a f g ′ und a gf ′ definiert.
9
Die Funktionen log und exp
In diesem Kapitel werden wir den natürlichen Logarithmus log : (0, ∞) → R
und die Exponentialfunktion exp : R → R kennenlernen. Die Abbildung log wird
als Stammfunktion von der Abbildung x 7→ 1/x definiert und exp wird dann als
Umkehrabbildung von log eingeführt.
Satz 9.1 Es gibt eine eindeutige differenzierbare Abbildung log : (0, ∞) → R mit
log(1) = 0 und log′ (x) = 1/x für alle x > 0.
Die Abbildung log : (0, ∞) → R in Satz 9.1 heißt natürlicher Logarithmus. Nach
Satz 7.7 (2) ist log streng monoton wachsend, da log′ (x) = 1/x > 0 für alle x > 0.
log
0
1
Satz 9.2 Für alle x, y ∈ (0, ∞) gilt log(xy) = log(x) + log(y).
Insbesondere gilt nach Satz 9.2, dass
log(1/x) = − log(x)
für alle x > 0, da log(x) + log(1/x) = log(x · 1/x) = log(1) = 0.
Lemma 9.1 Es gilt log((0, ∞)) = R.
Die Umkehrabbildung log−1 : R → R wird mit exp bezeichnet und sie heißt
Exponentialfunktion. Also ist exp streng monoton wachsend mit exp(R) = (0, ∞)
und nach Satz 6.3 ist exp stetig. Da log(1) = 0, ist exp(0) = 1. Die Zahl exp(0)
heißt Eulersche Zahl und wird mit e bezeichnet; sie liegt zwischen 2, 171828 und
2, 171829.
45
9 Die Funktionen log und exp
46
exp
1
0
Satz 9.3 Für alle x, y ∈ R gilt exp(x + y) = exp(x) exp(y).
Insbesondere gilt nach Satz 9.3, dass
exp(−x) = 1/ exp(x)
für alle x ∈ R, da exp(−x) exp(x) = exp(−x + x) = exp(0) = 1.
Satz 9.4 Die Exponentialfunktion exp ist differenzierbar mit exp′ (x) = exp(x)
für alle x ∈ R.
Im folgenden Satz sei I ein Intervall, das mehr als einen Punkt enthält und wie
in Kapitel 7 sei I ◦ die Menge I ohne ihre Endpunkte.
Satz 9.5 Sei a ∈ I und seien b, c ∈ R. Sei f : I → R eine stetige Abbildung,
die in I ◦ differenzierbar ist und für die gilt: f (a) = b und f ′ (x) = cf (x) für alle
x ∈ I ◦ . Dann gilt f (x) = b exp(c(x − a)) für alle x ∈ I.
Satz 9.6 Die Exponentialfunktion ist die eindeutige differenzierbare Abbildung
f : R → R mit f ′ = f und f (0) = 1.
Satz 9.7 Sei f : R → R eine differenzierbare Abbildung mit f (0) = 1 und
f (x + y) = f (x)f (y)
für alle x, y ∈ R. Dann gilt f (x) = exp(cx) für alle x ∈ R, wobei c = f ′ (0).
Insbesondere ist die Exponentialfunktion die eindeutige differenzierbare Abbildung
f : R → R mit f (0) = f ′ (0) = 1 und f (x + y) = f (x)f (y) für alle x, y ∈ R.
10
Trigonometrische Funktionen
In diesem Kapitel führen wir die Cosinus- und Sinus-Funktionen ein.
Erinnerung: Für Punkte P = (x, y) und Q = (x′ , y ′) in R2 ist der Abstand
zwischen P und Q gegeben durch
p
d(P, Q) = (x′ − x)2 + (y ′ − y)2 .
Betrachte den Kreis S 1 in der euklidischen Ebene R2 mit Radius 1 und Mittelpunkt O = (0, 0). Also besteht S 1 aus den Punkten (x, y) in R2 mit x2 + y 2 = 1,
da sie genau√die Punkte sind, die Abstand 1 zu O haben. Für jedes a ∈ [0, 1]
sei Pa = (a, 1 − a2 ) der Punkt auf dem Kreis, der über a liegt und sei OPa die
Verbindungsgerade zwischen O und Pa . Insbesondere ist P1 = (1, 0) und somit
ist OP1 ein Teil von der x-Achse. Sei a ∈ [0, 1] und sei θ der Winkel zwischen
OP1 und OPa . Dann lernt man in der Schule, dass
√
cos(θ) = a und sin(θ) = 1 − a2 .
Pa = (a,
√
1 − a2 )
1
sin(θ)
θ
O
a
cos(θ)
P1
Wie misst man aber den Winkel θ? Im Alltag wird der Grad als Maßeinheit
benutzt, wobei 1 Grad als 360. Teil des Vollwinkels definiert ist. (Für a ∈ [0, 1]
liegt also der Winkel θ zwischen 0 und 90 Grad.) Für fast alle Anwendungen
in der Mathematik ist es jedoch besser, Bogenmaß zu verwenden: Wenn θ in
Bogenmaß gemessen wird, so ist θ die Länge des Kreisbogens zwischen P1 und
47
10 Trigonometrische Funktionen
48
Pa . (Der Vollwinkel hat also ein Bogenmaß von 2π, wobei per Definition π die
Hälfte des Umfangs von einem Kreis mit Radius 1 ist, und für a ∈ [0, 1] liegt das
Bogenmaß von θ zwischen 0 und π/2.)
Wir werden nicht direkt mit der Länge des Kreisbogens arbeiten, da dies nicht so
einfach ist, sondern mit einem Flächeninhalt, der im Wesentlichen den gleichen
Wert ergibt. Für jedes a ∈ [0, 1] sei Fa die Fläche, die durch die Verbindungsgeraden OP1 , OPa und den Kreisbogen zwischen P1 und Pa bestimmt ist. Im Bild
ist diese Fläche das gelb gefärbte Gebiet.
Pa = (a,
√
1 − a2 )
θ
O
a
P1
Im Folgenden machen wir von der Tatsache Gebrauch, dass die Länge des Kreisbogens zwischen P1 und Pa zweimal der Fächeninhalt von Fa ist. Auf einem
Beweis wird hier verzichtet, da wir die Länge eines Kreisbogens nicht definieren
wollen. In der Schule hat man aber mindestens einen Spezialfall davon gesehen:
Der Umfang eines Kreises vom Radius 1 ist 2π und der Flächeninhalt der Kreisscheibe ist die Hälfte von 2π, nämlich π.
Der Flächeninhalt von Fa wird durch ein Integral gegeben: Sei ha : [0, 1] → R
die stetige Abbildung, deren Graphen durch die rote Linie gegeben ist. Auf dem
Intervall [0, a] ist also ha eine Gerade und auf dem Intervall [a, 1] ist ha ein
Kreisbogen. Genauer haben wir
√
( √
1 − a2 /a)x falls 0 < x < a ,
ha (x) =
1 − x2
falls a ≤ x ≤ 1 ,
10 Trigonometrische Funktionen
49
√
da 1 − a2 /a die Steigerung der Verbindungsgeraden OPa ist. (Wenn
a = 0, ist
√
die Steigerung nicht definiert, aber in diesem Fall ist ha (x) = 1 − x2 für alle
x ∈ [0, 1].) Nun ist
Fa = Fha = {(x, y) ∈ R2 : x ∈ [0, 1] und 0 ≤ y ≤ ha (x)}
R
und damit ist der Flächeninhalt von Fa durch das Integral ha gegeben.
Definiere eine Abbildung γ : [0, 1] → R durch
Z
γ(a) = 2 ha
für jedes a ∈ [0, 1]. Insbesondere ist γ(1) = 0 und γ(0) = π/2 (da es sich um
einen rechten Winkel handelt, wenn a = 0). Da wir Bogenmaß verwenden, um
den Winkel θ zwischen den Verbindungsgeraden OP1 und OPa zu messen, ist
θ = γ(a).
Lemma 10.1 Für alle a ∈ [0, 1] gilt
Z 1√
√
2
γ(a) = a 1 − a + 2
1 − x2 dx .
a
Lemma 10.2 Die Abbildung γ ist stetig, γ ist differenzierbar in (0, 1) und es gilt
γ ′ (a) = − √
1
1 − a2
für alle a ∈ (0, 1). Insbesondere ist γ ′ (a) < 0 für alle a ∈ (0, 1) und folglich ist
nach Satz 7.7 (2) γ streng monoton fallend. Ferner ist γ([0, 1]) = [0, π/2].
Da nach Lemma 10.2 γ : [0, 1] → R stetig und streng monoton fallend ist und
γ([0, 1]) = [0, π/2], gibt es die Umkehrabbildung γ −1 : [0, π/2] → R. Also gilt
γ −1 ([0, π/2]) = [0, 1], γ −1 ist ebenfalls streng monoton fallend und nach Satz 6.6
ist γ −1 stetig.
Sei a ∈ [0, 1] und sei θ der Winkel zwischen den Verbindungsgeraden OP1 und
OPa . Dann ist einerseits θ = γ(a) und andererseits a = cos(θ) und daraus ergibt
sich, dass cos(θ) = a = γ −1 (γ(a)) = γ −1 (θ). Für jedes θ ∈ [0, π/2] ist also
cos(θ) = γ −1 (θ)
p
p
und damit auch sin(θ) = 1 − (cos(θ))2 = 1 − (γ −1 (θ))2 .
10 Trigonometrische Funktionen
50
Satz 10.1 Die Abbildungen cos, sin : [0, π/2] → R sind stetig, cos ist streng
monoton fallend und sin streng monoton wachsend mit cos(0) = 1, cos(π/2) = 0,
sin(0) = 0 und sin(π/2) = 1. Ferner sind beide Abbildungen differenzierbar in
(0, π/2) und für alle θ ∈ (0, π/2) gilt
cos′ (θ) = − sin(θ) und sin′ (θ) = cos(θ) .
1
sin
cos
0
π/2
Der folgende Satz zeigt, dass die Abbildung cos, sin : [0, π/2] → R eindeutig
durch die in Satz 10.1 vorkommenden Eigenschaften bestimmt sind.
Satz 10.2 Seien s, c : [0, π/2] → R stetige Abbildungen, für die gilt:
(1) s(0) = 0 und c(0) = 1,
(2) s und c sind in (0, π/2) differenzierbar,
(3) s′ (θ) = c(θ) und c′ (θ) = −s(θ) für alle θ ∈ (0, π/2).
Dann ist s = sin und c = cos.
Satz 10.3 Für alle θ ∈ [0, π/2] gilt
sin(π/2 − θ) = cos(θ) und cos(π/2 − θ) = sin(θ) .
10 Trigonometrische Funktionen
51
Bisher sind die Abbildungen sin und cos nur auf dem Intervall [0, π/2] definiert.
Der Definitionsbereich dieser Abbildungen wird jetzt schrittweise erweitert, so
dass wir schließlich Abbildungen sin, cos : R → R haben, die auf der ganzen
reellen Achse definiert sind. In diesem Erweiterungsprozess wird das folgende
Ergebnis benötigt:
Lemma 10.3 Seien a, b, c ∈ R mit a < b < c und seien f : [a, b] → R und
g : [b, c] → R Abbildungen mit f (b) = g(b); definiere h : [a, c] → R durch
f (x) falls x ∈ [a, b] ,
h(x) =
g(x) falls x ∈ (b, c] .
Dann gilt:
(1) Sind f und g stetig, so ist h ebenfalls stetig.
(2) Ist f in (a, b) und g in (b, c) differenzierbar und gibt es eine an der Stelle
b stetige Abbildung d : [a, c] → R mit f ′ (x) = d(x) für alle x ∈ (a, b) und
g ′ (x) = d(x) für alle x ∈ (b, c), so ist h in (a, c) differenzierbar und h′ (x) = d(x)
für alle x ∈ (a, c).
Nun zum Erweiterungsverfahren:
Schritt 1: Der Definitionsbereich der Abbildungen sin und cos wird vom Intervall
[0, π/2] zum Intervall [0, π] erweitert.
Sei θ ∈ [π/2, π]; dann ist θ der Winkel zwischen der√Verbindungsgeraden OP1 und
einer Verbindungsgeraden OPa′ , wobei Pa′ = (−a, 1 − a2 ) mit a ∈ [0, 1]. Ferner
ist π − θ ∈ [0, π/2] und π − θ √
ist der Winkel zwischen den Verbindungsgeraden
OP1 und OPa , wobei Pa = (a, 1 − a2 ).
Pa′ = (−a,
√
√
Pa = (a, 1 − a2 )
1 − a2 )
θ
−a
O
π−θ
a
P1
Nach der Definition√von cos und sin auf dem Intervall [0, π/2] ist cos(π − θ) = a
und sin(π − θ) = 1 − a2 ,√und wie man in der Schule gelernt hat, soll cos(θ)
gleich −a und sin(θ) gleich 1 − a2 sein. Folglich setzen wir für jedes θ ∈ [π/2, π]
cos(θ) = − cos(π − θ) und sin(θ) = sin(π − θ) .
10 Trigonometrische Funktionen
52
1
sin
0
π/2
π
cos
−1
Man beachte: Das Element π/2 liegt sowohl im Intervall [0, π/2] als auch im
Intevall [π/2, π] und damit gibt es zwei Definitionen für cos(π/2) und sin(π/2).
Sie stimmen aber überein, da
cos(π/2) = 0 = − cos(π − π/2) und sin(π) = sin(π − π/2) .
Nach Satz 3.4 und Satz 4.4 sind beide Abbildungen stetig im Intervall [π/2, π] und
differenzierbar in (π/2, π) und sin′ (θ) = − sin′ (π − θ) = − cos(π − θ) = cos(θ)
und cos′ (θ) = − cos′ (π − θ) = − sin(π − θ) = − sin(θ) für alle θ ∈ (π/2, π).
Nach Lemma 10.3 (1) sind also die Abbildungen cos, sin : [0, π] → R stetig und
nach Lemma 10.3 (2) sind sie differenzierbar in (0, π) mit cos′ (θ) = − sin(θ) und
sin′ (θ) = cos(θ) für alle θ ∈ (0, π).
Schritt 2: Der Definitionsbereich der Abbildungen sin und cos wird vom Intervall
[0, π] zum Intervall [0, 2π] erweitert.
Sei θ ∈ [π, 2π]; dann ist θ der Winkel zwischen der √
Verbindungsgeraden OP1 und
einer Verbindungsgeraden OPa′′, wobei Pa′′ = (a, − 1 − a2 ) mit a ∈ [−1, 1]. Ferner ist 2π −θ ∈ [0, π] und 2π −θ ist
√ der Winkel zwischen den Verbindungsgeraden
OP1 und OPa , wobei Pa = (a, − 1 − a2 ).
10 Trigonometrische Funktionen
53
√
Pa = (a, 1 − a2 )
θ
2π − θ
a
P1
√
Pa′′ = (a, − 1 − a2 )
Nach der Definition√von cos und sin auf dem Intervall [0, π] ist cos(2π − θ) = a
, und wie man in der Schule gelernt hat, soll cos(θ)
und sin(2π − θ) = 1 − a2√
gleich a und sin(θ) gleich − 1 − a2 sein. Folglich setzen wir für jedes θ ∈ [π, 2π]
cos(θ) = cos(2π − θ) und sin(θ) = − sin(2π − θ) .
1
cos
0
π
2π
sin
−1
Man beachte: Das Element π liegt sowohl im Intervall [0, π] als auch im Intevall
[π, 2π] und damit gibt es zwei Definitionen für cos(π) und sin(π). Sie stimmen
aber überein, da
cos(π) = cos(2π − π) und sin(π) = 0 = − sin(2π − π) .
Nach Satz 3.4 und Satz 4.4 sind beide Abbildungen stetig im Intervall [π, 2π] und
differenzierbar in (π, 2π) und sin′ (θ) = −(− sin′ (2π − θ)) = cos(2π − θ) = cos(θ)
10 Trigonometrische Funktionen
54
und cos′ (θ) = − cos′ (2π − θ) = sin(2π − θ) = − sin(θ) für alle θ ∈ (π, 2π). Nach
Lemma 10.3 (1) sind also die Abbildungen cos, sin : [0, 2π] → R stetig und nach
Lemma 10.3 (2) sind sie differenzierbar in (0, 2π) mit cos′ (θ) = − sin(θ) und
sin′ (θ) = cos(θ) für alle θ ∈ (0, 2π).
Schritt 3: Der Definitionsbereich der Abbildungen sin und cos wird vom Intervall
[0, 2π] zum Intervall R+ erweitert.
Sei n ∈ N und θ ∈ [2πn, 2π(n + 1)]. Dann ist θ − 2πn ∈ [0, 2π] und θ und θ − 2πn
sind von der gleichen Verbindungsgeraden abgeschlossen. Folglich setzen wir
cos(θ) = cos(θ − 2πn) und sin(θ) = sin(θ − 2πn)
für jedes θ ∈ [2πn, 2π(n + 1)].
sin
0
2π
cos
4π
6π
8π
Man beachte: Das Element 2π(n + 1) liegt sowohl im Intervall [2πn, 2π(n + 1)]
als auch im Intevall [2π(n + 1), 2π(n + 2)] und damit gibt es zwei Definitionen für
cos(2π(n + 1)) und sin(2π(n + 1)). Sie stimmen aber überein, da
cos(2π(n + 1) − 2π(n + 1)) = cos(0) = 1 = cos(2π) = cos(2π(n + 1) − 2πn) ,
sin(2π(n + 1) − 2π(n + 1)) = sin(0) = 0 = sin(2π) = sin(2π(n + 1) − 2πn) .
Beide Abbildungen sind stetig im Intervall [2πn, 2π(n + 1)] und differenzierbar
in (2πn, 2π(n + 1)) und sin′ (θ) = sin′ (θ − 2πn)) = cos(θ − 2πn) = cos(θ) und
cos′ (θ) = cos′ (θ − 2πn) = − sin(θ − 2πn) = − sin(θ) für alle θ ∈ (2πn, 2π(n + 1)).
Nach Lemma 10.3 (1) sind also die Abbildungen cos, sin : R+ → R stetig und
nach Lemma 10.3 (2) sind sie differenzierbar in (0, ∞) mit cos′ (θ) = − sin(θ) und
sin′ (θ) = cos(θ) für alle θ ∈ (0, ∞).
Schritt 4: Der Definitionsbereich der Abbildungen sin und cos wird vom Intervall
R+ zur ganzen reellen Achse R erweitert.
Sei θ ∈ (−∞, 0]; ist θ der Winkel zwischen der Verbindungsgeraden
OP1 und
√
2
einer Verbindungsgeraden OPa, wobei Pa = (a, b) mit b = ± 1 − a , so ist −θ
der Winkel zwischen den Verbindungsgeraden OP1 und OPa′′, wobei Pa′′ = (a, −b).
Folglich setzen wir für jedes θ ∈ (−∞, 0]
cos(θ) = cos(−θ) und sin(θ) = − sin(−θ) .
10 Trigonometrische Funktionen
55
sin
−4π
−2π
cos
0
2π
4π
Die zwei Definitionen für cos(0) und sin(0) stimmen überein, da
cos(0) = cos(−0) und sin(0) = 0 = − sin(−0) .
Nach Satz 3.4 und Satz 4.4 sind beide Abbildungen stetig im Intervall (−∞, 0]
und differenzierbar in (−∞, 0) und sin′ (θ) = −(− sin′ (−θ)) = cos(−θ) = cos(θ)
und cos′ (θ) = − cos′ (−θ) = sin(−θ) = − sin(θ) für alle θ ∈ (−∞, 0). Nach
Lemma 10.3 (1) sind also die Abbildungen cos, sin : R → R stetig und nach
Lemma 10.3 (2) sind sie differenzierbar mit cos′ (θ) = − sin(θ) und sin′ (θ) = cos(θ)
für alle θ ∈ R.
Am Ende dieses Erweiterungsverfahrens haben wir differenzierbare Abbildungen
sin, cos : R → R mit sin(0) = 0, cos(0) = 1, sin′ = cos und cos′ = − sin. Die
Abbildungen sin und cos sind eindeutig durch diese Eigenschaften bestimmt:
Satz 10.4 Seien s, c : R → R differenzierbare Abbildungen, für die gilt:
(1) s(0) = 0 und c(0) = 1,
(2) s′ (θ) = c(θ) und c′ (θ) = −s(θ) für alle θ ∈ R.
Dann ist s = sin und c = cos.
Satz 10.5 Die Abbildungen sin, cos : R → R haben folgende Eigenschaften:
(1) Für alle θ ∈ [0, π/2] gilt cos(π/2 − θ) = sin(θ) und sin(π/2 − θ) = cos(θ).
(2) Für alle θ ∈ [0, π] gilt cos(π − θ) = − cos(θ) und sin(π − θ) = sin(θ).
(3) Für alle θ ∈ [0, 2π] gilt cos(2π − θ) = cos(θ) und sin(2π − θ) = − sin(θ).
(4) Für alle θ ∈ R, n ∈ Z gilt cos(θ + 2πn) = cos(θ) und sin(θ + 2πn) = sin(θ).
(5) Für alle θ ∈ R gilt cos(−θ) = cos(θ) und sin(−θ) = − sin(θ).
(6) Die Abbildung cos ist streng monoton fallend im Intervall [0, π] und streng
monoton wachsend im Intervall [π, 2π].
(7) Die Abbildung sin ist streng monoton wachsend im Intervall [0, π/2] und im
Intervall [3π/2, 2π] und ist streng monoton fallend im Intervall [π/2, 3π/2].
11
Folgen
In den meisten Büchern über Analysis werden Folgen gerade am Anfang eingeführt und sie dienen als Grundlage für die Behandlung von Stetigkeit und
Differenzierbarkeit. Dies ist dafür (offensichtlich) nicht unbedingt notwendig, für
die Weiterentwicklung der Theorie sind sie aber unverzichtbar.
Unter einer Folge aus R versteht man eine Abbildung ̺ : N× → R. Jedem
n ∈ N× = {1, 2, . . .} ist also ein Element xn = ̺(n) ∈ R zugeordnet und man
schreibt hierfür meistens {xn }n≥1 statt ̺. Manchmal ist es nützlich, eine Folge
nicht mit 1, sondern mit 0 oder mit einem Index p ≥ 2 anzufangen. In diesem
Fall schreiben wir dann {xn }n≥0 (bzw. {xn }n≥p ) statt {xn }n≥1 . Die Definitionen
(bzw. Ergebnisse) werden hier für Folgen formuliert, die mit dem Index 1 starten,
aber sie machen einen Sinn (bzw. sie gelten) auch dann, wenn dies nicht der Fall
ist.
Sei {xn }n≥1 eine Folge aus R. Die Folge heißt konvergent gegen x ∈ R, falls es zu
jedem ε > 0 ein m ≥ 1 gibt, so dass |xn − x| < ε für alle n ≥ m.
Sei {xn }n≥1 eine Folge, x ∈ R und p ≥ 1. Offensichtlich hängt es nicht von den
ersten Gliedern x1 , . . . , xp−1 ab, ob {xn }n≥1 gegen x konvergiert. Also konvergiert
{xn }n≥1 gegen x genau dann, wenn {xn }n≥p gegen x konvergiert.
Lemma 11.1 Sei {xn }n≥1 eine Folge aus R und seien x, x′ ∈ R. Konvergiert
{xn }n≥1 gegen x und gegen x′ , so ist x′ = x.
Konvergiert eine Folge {xn }n≥1 aus R gegen x, so nennt man x den Grenzwert
oder den Limes der Folge und schreibt limn→∞ xn = x oder nur limn xn = x.
Nach Lemma 11.1 macht diese Schreibweise einen Sinn.
Wichtige Beispiele: (1) Es gilt limn 1/n = 0; die Folge {1/n}n≥1 konvergiert also
gegen 0: Sei ε > 0; nach Satz 5.1 (Satz von Archimedes) gibt es ein m ≥ 1, so
dass m > ε−1 , und für alle n ≥ m ist dann |1/n − 0| = 1/n ≤ 1/m < ε; folglich
gilt limn 1/n = 0. (In der Tat ist die Aussage, dass die Folge {1/n}n≥1 gegen 0
konvergiert, äquivalent zu der Behauptung im Satz von Archimedes.)
(2) Für jedes x ∈ R mit |x| < 1 konvergiert die Folge {xn }n≥0 der Potenzen
von x gegen 0: Es gilt limn xn = 0. Dies folgt wie in (1) mit Hilfe der folgenden
nützlichen Bernoullischen Ungleichung:
Lemma 11.2 Sei x ∈ R mit x > −1. Dann gilt (1 + x)n ≥ 1 + nx für alle n ∈ N.
Eine Folge {xn }n≥1 aus R heißt beschränkt, wenn es ein c ∈ R+ gibt, so dass
|xn | ≤ c für alle n ≥ 1.
56
11 Folgen
57
Lemma 11.3 Jede konvergente Folge aus R ist beschränkt.
Satz 11.1 Seien {xn }n≥1 , {yn }n≥1 zwei konvergente Folgen mit x = limn xn und
y = limn yn .
(1) Für alle a, b ∈ R konvergiert auch die Folge {axn + byn }n≥1 , und es gilt
lim (axn + byn ) = ax + by .
n→∞
(2) Die Produktfolge {xn yn }n≥1 konvergiert, und es gilt limn xn yn = xy.
(3) Nehme an, dass xn 6= 1 für alle n ≥ 1 und x 6= 1. Dann konvergiert die Folge
{1/xn }n≥1 , und es gilt limn 1/xn = 1/x.
Satz 11.2 (1) Sei {xn }n≥1 eine konvergente Folge reeller Zahlen mit xn ≥ 0 für
alle n ≥ 1. Dann ist limn xn ≥ 0.
(2) Seien {xn }n≥1 , {yn }n≥1 zwei konvergente Folgen reeller Zahlen mit xn ≤ yn
für alle n ≥ 1. Dann ist limn xn ≤ limn yn .
Sei {xn }n≥1 eine Folge aus R und sei 1 ≤ n1 < n2 < · · · eine aufsteigende Folge
aus N× . Dann heißt die Folge {xnk }k≥1 (d.h. die Folge {yk }k≥1 mit yk = xnk für
alle k ≥ 1) Teilfolge der Folge {xn }n≥1 .
Bemerkung: Ist n1 < n2 < · · · eine aufsteigende Folge aus N× , so ist nm ≥ m für
alle m ≥ 1.
Sei {xn }n≥1 eine Folge und sei p ≥ 1. Dann ist die Folge {xn }n≥p sowie jede ihrer
Teilfolgen eine Teilfolge von {xn }n≥1 .
Lemma 11.4 Sei {xn }n≥1 eine konvergente Folge aus R mit limn xn = x. Dann
konvergiert jede Teilfolge – auch gegen x.
In diesem Kapitel haben wir bisher Annahme 5 nur gebraucht um zu zeigen, dass
limn 1/n = 0 und limn z n = 0, falls |z| < 1. Im Rest des Kapitels aber spielen die
Folgerungen aus Annahme 5 eine entscheidende Rolle.
Satz 11.3 (Bolzano-Weierstraß) Jede beschränkte Folge aus R besitzt eine
konvergente Teilfolge.
Eine Folge {xn }n≥1 aus R heißt Cauchy-Folge, wenn es zu jedem ε > 0 ein q ≥ 1
gibt, so dass |xm − xn | < ε für alle m, n ≥ q.
11 Folgen
58
Lemma 11.5 Jede Cauchy-Folge aus R ist beschränkt.
Lemma 11.6 Besitzt eine Cauchy-Folge aus R eine konvergente Teilfolge, so ist
sie selbst konvergent.
Satz 11.4 Eine Folge aus R konvergiert genau dann, wenn sie eine Cauchy-Folge
ist.
Eine Folge {xn }n≥1 reeller Zahlen heißt monoton wachsend, falls xn ≤ xn+1 für
alle n ≥ 1, streng monoton wachsend, falls xn < xn+1 für alle n ≥ 1, monoton
fallend, falls xn+1 ≤ xn für alle n ≥ 1, streng monoton fallend, falls xn+1 < xn
für alle n ≥ 1 und monoton, falls sie monoton wachsend oder monoton fallend
ist.
Es ist klar, dass eine monoton wachsende (bzw. ein monoton fallende) Folge
{xn }n≥1 reeller Zahlen genau dann beschränkt ist, wenn die Menge
{xn : n ≥ 1} = {x ∈ R : es gibt ein n ≥ 1, so dass x = xn }
nach oben (bzw. nach unten) beschränkt ist.
Satz 11.5 Jede beschränkte monotone Folge {xn }n≥1 reeller Zahlen konvergiert.
Es folgen zwei Beispiele, die zeigen, wie Folgen benutzt werden können, um Zahlen
zu konstruieren.
Satz 11.6 Seien a, x0 ∈ R mit a > 0, x0 > 0 und sei {xn }n≥1 die Folge mit
1
a
xn+1 =
xn +
2
xn
√
für alle n ∈ N. Dann gilt limn xn = a.
Satz 11.7 Sei c ∈ R mit 0 ≤ c < 1 und sei {xn }n≥0 eine Folge aus R mit
|xn+2 − xn+1 | ≤ c|xn+1 − xn |
für alle n ≥ 0. Dann konvergiert die Folge {xn }n≥0 .
11 Folgen
59
Die Stetigkeit einer Abbildung f : A → R kann mit Hilfe von Folgen formuliert
werden, und die zweite Aussage im nächsten Satz wird oft als Definition von
Stetigkeit verwendet.
Satz 11.8 Sei A eine nichtleere Teilmenge von R, sei f : A → R eine Abbildung
und a ∈ A. Dann sind äquivalent:
(1) f ist an der Stelle a stetig.
(2) Die Folge {f (xn )}n≥1 konvergiert gegen f (a) für jede Folge {xn }n≥1 aus A,
die gegen a konvergiert.
Satz 11.8 hätte man nicht in Kapitel 3 beweisen können, da man hier benötigt,
dass limn 1/n = 0, und dies ist nur eine Umformulierung vom Satz 5.1 (Satz von
Archimedes).
12
Unendliche Reihen
Sei {xn }n≥1 eine Folge aus R und für jedes n ≥ 1 sei
sn =
n
X
xk
k=1
(= x1 + x2 + · · · + xn ) .
Dann heißt die Folge {sn }n≥1 dieser Partialsummen (unendliche) Reihe mit den
P
Gliedern
xn , n ≥ 1, und wird mit ∞
bezeichnet. Konvergiert die Reihe
n=1 xn P
P∞
∞
n=1 xn , so wird ihr Grenzwert ebenfalls mit
n=1 xn bezeichnet und heißt dann
Summe der Reihe. Bei Reihen fängt man oft mit dem Index 0 an; in diesem
Fall gibt es eine Folge
P∞ {xn }n≥0 , die Folge {sn }n≥0 der Partialsummen und die
(unendliche) Reihe n=0 xn .
P
n
Wichtiges Beispiel: Die geometrische Reihe ∞
n=0 x konvergiert mit der Summe
∞
X
n=0
xn = (1 − x)−1
P
für jedes x ∈ R mit |x| < 1. (Sei x 6= 1 fest und für jedes n ≥ 0 sei sn = nk=0 xk ;
dann ist sn = (1 − x)−1 (1 − xn+1 ) und damit |sn − (1 − x)−1 | = |1 − x|−1 |x|n+1 .
Daraus folgt, dass
{sn }n≥0 gegen (1 − x)−1 konvergiert, falls |x| < 1.
P∞die Folge
D.h.: die Reihe n=0 xn konvergiert mit der Summe (1 − x)−1 , wenn |x| < 1.)
Sei {xn }n≥1 eine Folge aus R und sei qP≥ 1. Dann ist es klar, dass die Reihe
P
∞
dann konvergiert, wenn ∞
n=1 xn genauP
n=q
Px∞n konvergiert. Konvergieren diese
Reihen, so ist ∞
x
=
x
+
·
·
·
+
x
+
1
q−1
n=1 n
n=q xn .
Satz 12.1 Sei {xn }n≥1Peine Folge reeller Zahlen mit xn ≥ 0 für alle n ≥ 1. Dann
nach
konvergiert die Reihe ∞
n=1 xn genau, wenn die Folge der Partialsummen
Pn
oben beschränkt ist, d.h., genau dann, wenn es ein c ≥ 0 gibt, so dass k=1 xk ≤ c
für alle n ≥ 1.
P
Nach Satz 12.1 konvergiert die harmonische Reihe ∞
nicht, da für jedes
n=1 1/n
P∞
P2p
p ≥ 0 gilt n=1 1/n ≥ p/2. Dagegen konvergiert die Reihe n=1 1/n2 , da
n
n n
X
X
X
1
1
1
1
1
=
1
+
1
−
≤2
≤
1
+
=
1
+
−
k2
k(k − 1)
k−1 k
n
k=2
k=2
k=1
für alle n > 1. Im Folgenden sei {xn }n≥1 eine Folge aus R.
Folgendes ist das Cauchysche Konvergenz-Kriterium:
60
12 Unendliche Reihen
61
P∞
Satz 12.2 Die unendliche Reihe P
genau dann, wenn es zu
n=1 xn konvergiert
n
jedem ε > 0 ein q ≥ 1 gibt, so dass
k=m xk < ε für alle n ≥ m ≥ q.
Satz 12.3 Für jede konvergente Reihe
gegen 0.
P∞
n=1
xn konvergiert die Folge {xn }n≥1
Satz 12.4 Sei {cn }n≥1Peine Folge reeller Zahlen mit |xn | ≤ cn P
für alle n ≥ 1.
∞
∞
c
(in
R),
so
konvergiert
die
Reihe
Konvergiert
die
Reihe
n=1 xn und es
n=1 n
P∞
P∞
P∞
gilt
n=1 xn ≤
n=1 cn . Insbesondere konvergiert
n=1 xn mit
∞
∞
X
X
|xn | ,
xn ≤
n=1
P∞
n=1
falls die Reihe n=1 |xn | in R konvergiert.
P
P∞
Die Reihe ∞
x
heißt
absolut
konvergent,
falls
die
Reihe
n
n=1
n=1 |xn | konvergiert
(in R). Die letzte Aussage in Satz 12.4 sagt also, dass eine absolut konvergente
Reihe auch im gewöhnlichen Sinn konvergiert.
P
n
Insbesondere konvergiert die geometrische Reihe ∞
n=0 x absolut für jedes x ∈ R
mit |x| < 1.
Nun werden einige Konvergenz-Kriterien für Reihen betrachtet. Im Folgenden sei
wieder {xn }n≥1 eine Folge aus R.
Satz 12.5 (Majoranten-Kriterium) Sei {cn }n≥1 eine Folge reeller Zahlen mit
|x
für alle n ≥ 1. Konvergiert die Reihe
Pn∞| ≤ cn (und insbesondere ist dann cn ≥ 0)
P∞
n=1 cn (in R), so konvergiert die Reihe
n=1 xn absolut und
∞
∞
X
X
xn ≤
cn .
n=1
n=1
Satz 12.6 (Quotienten-Kriterium) Nehme an, dass xn 6= 0 für alle n ≥ 1
und dass es ein θ ∈ R mit 0 P
< θ < 1 gibt, so dass |xn+1 |/|xn | ≤ θ für alle n ≥ 1.
Dann konvergiert die Reihe ∞
n=1 xn absolut.
Satz 12.7 (Das Leibnizsche Kriterium) Sei {xn }n≥1 eine monoton fallende
Folge reeller Zahlen, die gegen 0 konvergiert (insbesondere
ist also xn ≥ 0 für alle
P∞
n ≥ 1). Dann konvergiert die alternierende Reihe n=1 (−1)n xn .
P
Im Gegensatz zu der harmonischen Reihe ∞
n=1 1/n konvergiert nach Satz 12.7
P∞
die alternierende harmonische Reihe n=1 (−1)n+1 /n. Natürlich kann diese Reihe nicht absolut konvergieren, da die harmonische Reihe nicht konvergiert.
Herunterladen