Ein Skript für Analysis I

Werbung
Ein Skript für Analysis I
Chris Preston
Wintersemester 2001/02
1
2
Dies ist ein Skript für Analysis I. Die Texte von Lang [10], Königsberger [8] und
Amman und Escher [1] haben die Darstellung beeinflusst.
Chris Preston
Februar, 2003
3
Inhaltsverzeichnis
1
Mengen und Abbildungen
4
2
Der Körper der rationalen Zahlen
12
3
Der Körper der reellen Zahlen
19
4
Der Körper der komplexen Zahlen
26
5
Folgen
30
6
Unendliche Reihen
39
7
Stetige Funktionen
48
8
Folgenkompaktheit
58
9
Trigonometrische Funktionen
61
10 Differentiation
67
11 Mittelwertsätze
80
12 Integration von Regelfunktionen
89
13 Integration und Differentiation
98
14 Das Riemannsche Integral
104
Literatur
110
Index
111
1
Mengen und Abbildungen
Sind α und β (mathematische) Objekte, so bedeutet α = β, dass sie gleich sind.
Sind sie nicht gleich, so schreibt man α 6= β. Die wichtigsten Typen von Objekten
sind Mengen und Abbildungen.
Ist X eine Menge und x ein Objekt, so bedeutet x ∈ X, dass x ein Element von
X ist. Ist x kein Element von X, so schreibt man x ∈
/ X.
Fakt 1 Mengen X und Y sind genau dann gleich, wenn sie aus den gleichen
Elementen bestehen, d.h., wenn für jedes Objekt x gilt: x ∈ X genau dann, wenn
x∈Y.
Bekannte Mengen sind:
— Die Menge N = {0, 1, 2, . . . } der natürlichen Zahlen.
— Die Menge Z = { . . . , −2, −1, 0, 1, 2, . . . } der ganzen Zahlen.
— Die Menge Q der rationalen Zahlen.
Eine Menge Y heißt Teilmenge einer Menge X (geschrieben Y ⊂ X), wenn jedes
Element von Y auch zu X gehört, d.h., wenn y ∈ X für jedes y ∈ Y . Insbesondere
gilt N ⊂ Z ⊂ Q.
Lemma 1.1 Für Mengen X und Y gilt X = Y genau dann, wenn X ⊂ Y und
Y ⊂ X.
Beweis Übung.
Sei X eine Menge. Ist E(x) ein Ausdruck, der eine Aussage darstellt, wenn für x
ein Element von X eingesetzt wird, so heißt E Eigenschaft auf X.
Fakt 2 Sei X eine Menge und sei E eine Eigenschaft auf X; dann gibt es eine
(eindeutige) Teilmenge von X, die aus allen Elementen x von X besteht, für die
E(x) wahr ist; sie wird mit {x ∈ X : E(x)} bezeichnet.
Zum Beispiel sei E(n) der Ausdruck 3 < n < 7; dann ist E eine Eigenschaft auf
N und {n ∈ N : 3 < n < 7} ist die Teilmenge von N, die aus den Elementen 4, 5
und 6 besteht.
Sei Y Teilmenge einer Menge X und sei E(x) der Ausdruck x ∈
/ Y . Dann ist E
eine Eigenschaft auf X und die Teilmenge {x ∈ X : x ∈
/ Y } von X wird mit
X \ Y bezeichnet. Sie heißt das Komplement von Y (in X).
4
1 Mengen und Abbildungen
5
Fakt 3 Es gibt eine Menge ∅, die kein Element enthält: Für jedes Objekt x gilt
also x ∈
/ ∅. Die Menge ∅ heißt leere Menge.
Lemma 1.2 Die leere Menge ∅ ist eindeutig, d.h. sie ist die einzige Menge, die
kein Element enthält: Ist ∅′ eine Menge mit x ∈
/ ∅′ für jedes Objekt x, so ist
∅′ = ∅.
Beweis Übung.
Die leere Menge ist Teilmenge jeder Menge, d.h., ∅ ⊂ X für jede Menge X. Eine
Menge X heißt nichtleer, wenn X 6= ∅, d.h., wenn es mindestens ein Objekt x
mit x ∈ X gibt.
Fakt 4 Sind x1 , . . . , xn endlich viele Objekte, so gibt es eine (eindeutige) Menge
P , die genau aus diesen Elementen besteht: Ist w eine Objekt, so gilt w ∈ P genau
dann, wenn w = xk für (mindestens) ein k = 1, . . . , n. Diese Menge P wird mit
{x1 , . . . , xn } bezeichnet.
Sei I eine nichtleere Menge und für jedes i ∈ I sei Xi eine Menge. Dann heißt
{Xi : i ∈ I} Familie von Mengen und I die Indexmenge für diese Familie. (Man
merke, dass es hier nicht verlangt wird, dass Xi 6= Xj , falls i 6= j.) Das einfachste
Beispiel ist mit I = [n] für ein n ≥ 1, wobei [n] die Teilmenge {1, 2, . . . , n}
von N bezeichnet. Eine Familie {Xi : i ∈ [n]} besteht also aus den n Mengen
X1 , . . . , Xn .
Fakt 5 Zu jeder Familie {Xi : i ∈ I} von Mengen gibt es eine (eindeutige)
Menge V mit der Eigenschaft: Für jedes Objekt x gilt x ∈ V genau dann, wenn
x ∈ Xi für (mindestens) ein i ∈ I. Die Menge
V heißt Vereinigung der Mengen
S
in der Familie {Xi : i ∈ I} und wird mit i∈I Xi bezeichnet.
Fakt 6 Zu jeder Familie {Xi : i ∈ I} von Mengen gibt es eine (eindeutige)
Menge D mit der Eigenschaft: Für jedes Objekt x gilt x ∈ D genau dann, wenn
x ∈ Xi für alle i ∈ I. Die Menge
D heißt Durchschnitt der Mengen in der Familie
T
{Xi : i ∈ I} und wird mit i∈I Xi bezeichnet.
Sind X1 , . . . , Xn endlich viele Mengen, so wird die Vereinigung (bzw. derSDurchschnitt) der Mengen in derTFamilie {Xi : i ∈ [n]} mit X1 ∪ · · · ∪ Xn oder nk=1 Xk
(bzw. X1 ∩ · · · ∩ Xn oder nk=1 Xk ) bezeichnet.
1 Mengen und Abbildungen
6
Fakt 7 Zu jeder Menge X gibt es eine (eindeutige) Menge P(X), deren Elemente
genau die Teilmengen von X sind. Für jedes Objekt Y gilt also Y ∈ P(X) genau
dann, wenn Y eine Menge ist mit Y ⊂ X. Die Menge P(X) heißt Potenzmenge
von X.
Da ∅ ⊂ X, ist ∅ ∈ P(X); insbesondere ist P(X) stets nichtleer. Die Menge
P(∅) besteht aus dem einzigen Element ∅, d.h., P(∅) = {∅}.
Seien X und Y Mengen. Eine Abbildung oder eine Funktion f von X nach Y ist
eine Vorschrift, die jedem Element von X genau ein Element von Y zuordnet. Das
dem Element x ∈ X zugeordnete Element von Y wird mit f (x) bezeichnet. Ist f
eine Abbildung, so schreibt man f : X → Y um zu zeigen, dass f eine Abbildung
von X nach Y ist. Ist f : X → Y eine Abbildung, so heißt X Definitionsbereich
von f und wird mit dom(f ) bezeichnet. Die Teilmenge von Y
{y ∈ Y : es gibt ein x ∈ X mit y = f (x)}
heißt Bild von f und wird mit im(f ) bezeichnet.
Fakt 8 Abbildungen f : X → Y und f ′ : X ′ → Y ′ sind genau dann gleich, wenn
gilt: X = X ′ , Y = Y ′ und f (x) = f ′ (x) für jedes x ∈ X.
Für jede Menge Y gibt es genau eine Abbildung von ∅ nach Y . Es gibt eine
Abbildung von einer Menge X nach ∅ genau dann, wenn X = ∅.
Einfache Beispiele von Abbildungen sind:
(1) Für jede Menge X gibt es die Identitätsabbildung idX : X → X, die definiert
ist durch idX (x) = x für jedes x ∈ X.
(2) Ist X eine Menge und Y eine Teilmenge von X, so gibt es die Inklusionsabbildung inY,X : Y → X, die definiert ist durch inY,X (y) = y für jedes y ∈ Y .
Insbesondere ist idX = inX,X .
(3) Sind X und Y Mengen, so gibt es für jedes y ∈ Y die konstante Abbildung
cony : X → Y , die definiert ist durch cony (x) = y für jedes x ∈ X.
Fakt 9 Sind X, Y, Z Mengen und f : X → Y und g : Y → Z Abbildungen, so
gibt es die Abbildung g ◦ f : X → Z, die definiert ist durch (g ◦ f )(x) = g(f (x))
für alle x ∈ X. Diese Abbildung heißt die Komposition von f und g und wird oft
lediglich mit gf bezeichnet.
Für jede Abbildung f : X → Y gilt f ◦ idX = f = idY ◦ f .
1 Mengen und Abbildungen
7
Lemma 1.3 (Assoziativität der Komposition) Seien W, X, Y, Z Mengen
und f : W → X, g : X → Y und h : Y → Z Abbildungen. Dann gilt
h ◦ (g ◦ f ) = (h ◦ g) ◦ f .
Beweis Übung.
Aufgrund der Assoziativität ist es unnötig, bei Kompositionen Klammern zu
setzen, d.h., die Abbildung in Lemma 1.3 kann einfach mit h ◦ g ◦ f bezeichnet
werden.
Ist f : X → Z eine Abbildung und Y eine Teilmenge von X, so gibt es die
Abbildung f|Y = f ◦ inY,X ; also ist f|Y : Y → Z definiert durch f|Y (y) = f (y) für
jedes y ∈ Y und heißt Restriktionsabbildung. Insbesondere ist f|X = f .
Eine Abbildung f : X → Y heißt injektiv, wenn f (x) 6= f (x′ ) für alle x, x′ ∈ X
mit x 6= x′ , surjektiv, wenn es zu jedem y ∈ Y ein x ∈ X mit y = f (x) gibt (d.h.,
wenn im(f ) = Y ), und bijektiv, wenn sie injektiv und surjektiv ist.
Für jede Menge X ist die Identitätsabbildung idX : X → X bijektiv. Ist Y eine
Teilmenge von X, so ist die Inklusionsabbildung inY,X : Y → X injektiv; sie ist
aber nur dann surjektiv, wenn Y = X. Ist f : X → Z eine injektive Abbildung,
so ist die Restriktionsabbildung f|Y : Y → Z auch injektiv für jede Teilmenge Y
von X.
Lemma 1.4 Seien f : X → Y und g : Y → Z Abbildungen. Sind f und g
injektiv (bzw. surjektiv bzw. bijektiv), so ist die Komposition g ◦ f auch injektiv
(bzw. surjektiv bzw. bijektiv).
Beweis Übung.
Lemma 1.5 Seien X, Y Mengen und sei f : X → Y eine Abbildung.
(1) Gibt es eine Abbildung g : Y → X mit g ◦ f = idX , so ist f injektiv.
(2) Ist X nichtleer und ist f injektiv, so gibt es eine Abbildung g : Y → X mit
g ◦ f = idX .
(3) Gibt es eine Abbildung g : Y → X mit f ◦ g = idY , so ist f surjektiv.
(4) Ist f surjektiv, so gibt es eine Abbildung g : Y → X mit f ◦ g = idY .
Beweis Übung.
Im Beweis für Lemma 1.5 (4) wird das so genannte Auswahlaxiom benötigt:
1 Mengen und Abbildungen
8
Fakt 10 Sei {Xi : i ∈ S
I} eine Familie von nichtleeren Mengen. Dann existiert
eine Abbildung f : I → i∈I Xi mit f (i) ∈ Xi für jedes i ∈ I.
Satz 1.1 Eine Abbildung f : X → Y ist genau dann bijektiv, wenn es eine
Abbildung g : Y → X mit g ◦ f = idX und f ◦ g = idY gibt. In diesem Fall ist g
eindeutig bestimmt.
Beweis Die Behauptung ist trivial richtig, falls X = ∅; es kann also angenommen
werden, dass X nichleer ist.
Nehme zunächst an, dass es eine Abbildung g : Y → X mit g ◦ f = idX und
f ◦ g = idY gibt. Nach Lemma 1.5 (1) (bzw. nach Lemma 1.5 (3)) ist f dann
injektiv (bzw. surjektiv) und damit ist f bijektiv.
Nehme nun umgekehrt an, dass f bijektiv ist. Insbesondere ist f injektiv, und
folglich gibt es nach Lemma 1.5 (4) eine Abbildung g : Y → X mit g ◦ f = idX .
Aber dann gilt auch f ◦ g = idY : Sei y ∈ Y ; da f surjektiv ist, gibt es ein x ∈ X
mit y = f (x) und daraus folgt, dass
(f ◦ g)(y) = (f ◦ g)(f (x)) = ((f ◦ g) ◦ f )(x) = (f ◦ (g ◦ f ))(x)
= (f ◦ idX )(x) = f (idX (x)) = f (x) = y = idY (y) .
Dies zeigt, dass (f ◦g)(y) = idY (y) für alle y ∈ Y , d.h., f ◦g = idY . Schließlich muss
die Eindeutigkeit von g nachgewiesen werden: Seien g, g ′ : Y → X Abbildungen
mit g ◦ f = idX , f ◦ g = idY , g ′ ◦ f = idX und f ◦ g ′ = idY . Dann gilt
g ′ = g ′ ◦ idY = g ′ ◦ (f ◦ g) = (g ′ ◦ f ) ◦ g = idX ◦ g = g .
Sei f : X → Y eine bijektive Abbildung; nach Satz 1.1 gibt es eine eindeutige
Abbildung g : Y → X mit g ◦ f = idX und f ◦ g = idY . Diese Abbildung g heißt
die Umkehrabbildung von f und wird mit f −1 bezeichnet, es gilt also f −1 ◦f = idX
und f ◦ f −1 = idY . Offensichtlich ist id−1
X = idX für jede Menge X.
Lemma 1.6 Sind f : X → Y und g : Y → Z bijektive Abbildungen, so ist
(g ◦ f )−1 = f −1 ◦ g −1 .
(Erinnerung: Nach Lemma 1.4 ist die Abbildung g ◦ f : X → Z bijektiv.)
Beweis Übung.
Sei f : X → Y eine Abbildung. Für jedes A ⊂ X heißt die Teilmenge von Y
{y ∈ Y : es gibt ein x ∈ A mit y = f (x)}
1 Mengen und Abbildungen
9
das Bild von A unter f und wird mit f (A) bezeichnet. Insbesondere ist f (X) das
Bild von f , d.h., f (X) = im(f ). Für jedes B ⊂ Y heißt die Teilmenge von X
{x ∈ X : f (x) ∈ B}
das Urbild von B unter f und wird mit f −1 (B) bezeichnet. Es gibt eigentlich kein
Problem mit dieser Schreibweise, wenn f : X → Y eine bijektive Abbildung ist,
da in diesem Fall das Bild einer Teilmenge B von Y unter der Umkehrabbildung
f −1 gleich dem Urbild von B unter f ist.
Fakt 11 Seien X, Y Mengen; dann gibt es eine (eindeutige) Menge Abb(X, Y ),
deren Elemente genau die Abbildungen von X nach Y sind. Für jedes Objekt f
gilt also f ∈ Abb(X, Y ) genau dann, wenn f eine Abbildung von X nach Y ist.
Sei {Xi : i ∈ I} eine Familie von Mengen und setze V =
S
i∈I
Xi . Die Menge
{f ∈ Abb(I, V ) : f (i) ∈ Xi für alle i ∈ I}
heißtQdas (cartesische) Produkt der Mengen in der Familie {Xi : i ∈ I} und wird
mit i∈I Xi bezeichnet.
LemmaQ
1.7 Ist {Xi : i ∈ I} eine Familie von nichtleeren Mengen, so ist das
Produkt i∈I Xi auch nichtleer.
Beweis Dies ist lediglich eine Umformulierung des Auswahlaxioms.
Seien X1 , . . . , Xn endlich viele Mengen;Qin diesem Fall wird das Produkt der
Mengen in der Familie {Xi : i ∈ [n]} mit nk=1 Xk oder X1 × · · · × Xn bezeichnet.
S
Die Menge X1 × · · · × Xn besteht also aus allen Abbildungen f : [n] → nk=1 Xk
mit f (k) ∈ Xk für jedes k. Für jedes k = 1, . . . , n sei xk ∈ Xk ; dann gibt
es ein eindeutiges Element f ∈ X1 × · · · × Xn mit f (k) = xk für jedes k und
dieses Element wird mit (x1 , . . . , xn ) bezeichnet. Ist umgekehrt f ein Element
von X1 × · · · × Xn , so gibt es für jedes k ein eindeutiges xk ∈ Xk , so dass
f = (x1 , . . . , xn ). Insbesondere gilt (x1 , . . . , xn ) = (x′1 , . . . , x′n ) genau dann, wenn
xk = x′k für jedes k. Das Produkt X1 ×· · ·×Xn kann also als Menge aller n-Tupeln
(x1 , . . . , xn )
angesehen werden, wobei xk ∈ Xk für jedes k = 1, . . . , n.
Seien X und Y Mengen; dann kann und wird das Produkt X × Y angesehen
werden als Menge aller geordneten Paare (x, y) mit x ∈ X und y ∈ Y , wobei
‘geordnet’ hier bedeutet, dass (x, y) = (x′ , y ′) genau dann, wenn x = x′ und
y = y′.
1 Mengen und Abbildungen
10
Sei X eine Menge; eine Teilmenge R von X ×X wird oft als (binäre) Relation auf
X angesehen. In diesem Fall schreibt man meistens x1 R x2 statt (x1 , x2 ) ∈ R.
Für jede Menge X gibt es die Relationen = und 6= auf X sowie die Relation ⊂
auf P(X). Auf den Mengen N, Z und Q gibt es ferner die Ordnungsrelationen <,
≤, > und ≥.
Eine Relation R auf einer Menge X heißt
— reflexiv, wenn x R x gilt für jedes x ∈ X,
— transitiv, wenn aus x1 R x2 und x2 R x3 stets x1 R x3 folgt,
— symmetrisch, wenn x2 R x1 gilt für alle x1 , x2 ∈ X mit x1 R x2 ,
— antisymmetrisch, wenn aus x1 R x2 und x2 R x1 stets x1 = x2 folgt.
Die Relationen =, ⊂, ≤ und ≥ sind reflexiv, =, ⊂, <, ≤, > und ≥ sind transitiv, =
und 6= sind symmetrisch und die Relationen =, ⊂, ≤ und ≥ sind antisymmetrisch.
Eine Relation ∼ auf X, die reflexiv, symmetrisch und auch transitiv ist, heißt
Äquivalenzrelation auf X. Insbesondere ist = eine Äquivalenzrelation.
Wichtiges Beispiel: Sei Q = Z × Z× , wobei Z× = Z \ {0} und definiere eine
Relation ∼ auf Q durch: (m1 , n1 ) ∼ (m2 , n2 ) genau dann, wenn m1 n2 = m2 n1 .
Dann sieht man leicht, dass ∼ eine Äquivalenzrelation auf Q ist. (Natürlich wird
das Element (m, n) von Q normalerweise mit m/n bezeichnet.)
Im Folgenden sei ∼ eine Äquivalenzrelation auf einer Menge X. Setze
[x] = {y ∈ X : y ∼ x}
für jedes x ∈ X; [x] heißt die Äquivalenzklasse (oder Restklasse) von x. Dann gilt
insbesondere x ∈ [x] für jedes x ∈ X, da ∼ reflexiv ist.
Sind x, y ∈ X, so bedeutet x 6∼ y, dass x ∼ y nicht gilt.
Lemma 1.8 (1) Seien x, y ∈ X mit x ∼ y; dann ist [x] = [y].
(2) Seien x, y ∈ X mit x 6∼ y; dann sind die Äquivalenzklassen [x] und [y]
disjunkt, d.h., [x] ∩ [y] = ∅.
(3) Seien x, y ∈ X; dann gilt entweder [x] = [y] oder [x] ∩ [y] = ∅.
Beweis (1) Seien u, v ∈ X mit u ∼ v und sei z ∈ [u]. Dann ist z ∼ u und damit
z ∼ v, da ∼ transitiv ist. Folglich ist z ∈ [v], und dies zeigt, dass [u] ⊂ [v], falls
u ∼ v. Insbesondere ist [x] ⊂ [y]. Aber y ∼ x, da ∼ symmetrisch ist, und also
gilt auch [y] ⊂ [x], d.h., [x] = [y].
(2) Seien x, y ∈ X mit [x] ∩ [y] 6= ∅. Dann gibt es ein Element z ∈ [x] ∩ [y] und
damit gilt z ∼ x und z ∼ y. Aber dann ist x ∼ z, da ∼ symmetrisch ist, und
1 Mengen und Abbildungen
11
daraus ergibt sich, dass x ∼ y, da ∼ transitiv ist. Folglich ist [x] ∩ [y] = ∅, falls
x 6∼ y.
(3) Dies folgt unmittelbar aus (1) und (2).
Definiere nun eine Teilmenge von P(X) durch
X/∼ = {A ∈ P(X) : es gibt ein x ∈ X mit A = [x]} ;
X/∼ heißt die Restklassenmenge modulo ∼.
Eine Teilmenge A von P(X) heißt Partition oder Zerlegung von X, wenn es zu
jedem x ∈ X genau ein A ∈ A mit x ∈ A gibt.
Satz 1.2 Die Restklassenmenge X/∼ ist eine Partition von X.
Beweis Sei x ∈ X; dann ist [x] ∈ X/∼ und x ∈ [x]. Sei nun A ein beliebiges
Element von X/∼ mit x ∈ A; dann gibt es y ∈ X mit A = [y]. Da x ∈ A = [y],
ist damit x ∼ y, und daraus folgt nach Lemma 1.8 (1), dass A = [y] = [x]. Dies
zeigt, dass es genau ein A ∈ X/∼ (nämlich A = [x]) mit x ∈ A gibt.
Ist A eine Partition von X und x ∈ X, so bezeichnet Ax das eindeutige Element
von A mit x ∈ Ax .
Satz 1.3 Sei A eine Partition von X und definiere eine Relation ∼ auf X durch:
x ∼ y genau dann, wenn Ax = Ay . Dann ist ∼ eine Äquivalenzrelation auf X
und A = X/∼.
Beweis Dies ist klar.
Sei X eine Menge; eine Abbildung ⊕ : X × X → X nennt man Verknüpfung
auf X, und in diesem Fall schreibt man meistens x1 ⊕ x2 statt ⊕(x1 , x2 ). Zum
Beispiel gibt es auf N die zwei Verknüpfungen + : N × N → N (Addition) und
× : N × N → N (Multiplikation).
Hier ist eine äußerst wichtige Eigenschaft der natürlichen Zahlen:
Fakt 12 (Prinzip der vollständigen Induktion) Sei N eine Teilmenge von
N mit 0 ∈ N, für die gilt: Für jedes n ∈ N ist auch n + 1 ∈ N. Dann ist N = N.
Satz 1.4 (Beweis durch vollständige Induktion) Für jedes n ∈ N sei An
eine Aussage. Nehme an, A0 ist richtig und es gilt: Aus der Richtigkeit von An
folgt, dass An+1 auch richtig ist. Dann ist An richtig für jedes n ∈ N.
Beweis Sei N = {n ∈ N : An ist richtig}; dann ist 0 ∈ N und für jedes n ∈ N
ist auch n + 1 ∈ N. Daraus folgt nach dem Prinzip der vollständigen Induktion,
dass N = N, d.h., An ist richtig für jedes n ∈ N.
2
Der Körper der rationalen Zahlen
Die rationalen Zahlen Q werden hier als gegeben vorausgesetzt. Insbesondere ist
Q ein Beispiel für einen Körper – ein Begriff, der nun eingeführt wird.
Ein 5-Tupel (K, +, ·, 0, 1) bestehend aus einer Menge K, einer Verknüpfung
+ : K×K →K
(λ, µ) 7→ λ + µ
(genannt Addition), einer Verknüpfung
· : K×K →K
(λ, µ) 7→ λµ
(genannt Multiplikation) und Elementen 0, 1 ∈ K mit 0 6= 1 heißt Körper, wenn
folgendes gilt:
(K1) (λ + µ) + ν = λ + (µ + ν) für alle λ, µ, ν ∈ K.
(K2) λ + µ = µ + λ für alle λ, µ ∈ K.
(K3) 0 + λ = λ für alle λ ∈ K.
(K4) Zu jedem λ ∈ K gibt es ein Element −λ ∈ K mit (−λ) + λ = 0.
(K5) (λµ)ν = λ(µν) für alle λ, µ, ν ∈ K.
(K6) λµ = µλ für alle λ, µ ∈ K.
(K7) Für alle λ ∈ K gilt 1λ = λ.
(K8) Zu jedem λ ∈ K mit λ 6= 0 gibt es ein Element λ−1 ∈ K mit λ−1 λ = 1.
(K9) λ(µ + ν) = λµ + λν für alle λ, µ, ν ∈ K.
Bemerkung: Nach der üblichen Konvention soll die Addition in K weniger stark
binden als die Multiplikation. (λµ + λν bedeutet also (λµ) + (λν).)
Die Elemente 0 und 1 heißen das Nullelement oder die Null bzw. das Einselement
oder die Eins.
Lemma 2.1 Sei (K, +, ·, 0, 1) ein Körper.
(1) Das Nullelement 0 ist eindeutig: Ist 0′ ∈ K ein Element mit 0′ + λ = λ für
alle λ ∈ K, so ist 0′ = 0.
(2) Zu jedem λ ∈ K gibt es genau ein Element −λ ∈ K mit (−λ) + λ = 0.
(3) Das Einselement 1 ist eindeutig: Ist 1′ ∈ K ein Element mit 1′ λ = λ für alle
λ ∈ K, so ist 1′ = 1.
(4) Zu jedem λ ∈ K mit λ 6= 0 gibt es genau ein Element λ−1 ∈ K mit λ−1 λ = 1.
12
2 Der Körper der rationalen Zahlen
13
Beweis (1) Sei 0′ ∈ K ein Element mit 0′ + λ = λ für alle λ ∈ K; insbesondere
ist dann 0′ + 0 = 0. Da aber 0 + λ = λ für alle λ ∈ K, ist auch 0 + 0′ = 0′ , und
nach (K2) ist 0 + 0′ = 0′ + 0. Damit ist 0′ = 0 + 0′ = 0′ + 0 = 0.
(2) Sei λ ∈ K und sei λ′ ∈ K mit λ′ + λ = 0. Unter Anwendung von (K1), (K2),
(K3) und (K4) folgt dann, dass
λ′ = 0 + λ′ = ((−λ) + λ) + λ′ = (−λ) + (λ + λ′ )
= (−λ) + (λ′ + λ) = (−λ) + 0 = 0 + (−λ) = −λ .
(3) Sei 1′ ∈ K ein Element mit 1′ λ = λ für alle λ ∈ K; insbesondere ist dann
1′ · 1 = 1. Da aber 1λ = λ für alle λ ∈ K, ist auch 1 · 1′ = 0′ , und nach (K6) ist
1 · 1′ = 1′ · 1. Damit ist 1′ = 1 · 1′ = 1′ · 1 = 1.
(4) Sei λ ∈ K und sei λ′ ∈ K \ {0} mit λ′ λ = 1. Unter Anwendung von (K5),
(K6), (K7) und (K8) folgt dann, dass
λ′ = 1λ′ = (λ−1 λ)λ′ = λ−1 (λλ′ ) = λ−1 (λ′ λ) = λ−1 1 = 1λ−1 = λ−1 .
Wenn aus dem Kontext klar ist, welche Verknüpfungen + und · und Elemente 0
und 1 gemeint sind, dann wird lediglich K statt (K, +, ·, 0, 1) geschrieben.
Ist K ein Körper, so wird eine Verknüpfung
− : K×K →K
(λ, µ) 7→ λ − µ
(genannt Subtraktion) durch λ − µ = λ + (−µ) definiert.
Die rationalen Zahlen Q mit der üblichen Addition und Multiplikation bilden
einen Körper. (Das Nullelement ist 0 und das Einselement ist 1.)
Ist K ein Körper, so wird die Teilmenge K \ {0} von K mit K × bezeichnet. Ein
Körper K heißt angeordnet bezüglich einer Teilmenge P von K × , wenn gilt:
(1) Für jedes λ ∈ K × ist genau eines von λ und −λ in P .
(2) Für alle λ, µ ∈ P ist λ + µ ∈ P und λµ ∈ P .
Insbesondere ist der Körper Q angeordnet bezüglich der Teilmenge
PQ = {λ ∈ Q : λ > 0}
von Q× . Dies ist aber die einzige Möglichkeit:
Lemma 2.2 Ist Q angeordnet bezüglich einer Teilmenge P , so ist P = PQ .
2 Der Körper der rationalen Zahlen
14
Beweis Übung.
Sei K ein Körper angeordnet bezüglich einer Teilmenge P von K × ; dann wird eine
Relation > auf K definiert durch: Es gilt λ > µ genau dann, wenn λ − µ ∈ P .
Insbesondere ist P = {λ ∈ K : λ > 0}. Vorübergehend wird > die von P
abgeleitete Größer-Relation genannt. Die von PQ abgeleitete Größer-Relation auf
Q ist natürlich nichts anderes als die übliche Größer-Relation > auf den rationalen
Zahlen.
Satz 2.1 Sei K ein Körper angeordnet bezüglich einer Teilmenge P von K × .
Dann besitzt die von P abgeleitete Größer-Relation > folgende Eigenschaften:
(1) Es gilt nicht 0 > 0.
(2) Für jedes λ ∈ K × gilt genau eines von λ > 0 und −λ > 0.
(3) Es gilt λ + µ > 0 und λµ > 0 für alle λ, µ ∈ K mit λ > 0, µ > 0.
(4) Es gilt λ > µ genau dann, wenn λ − µ > 0.
Ist umgekehrt > irgendeine Relation auf einem Körper K, die (1), (2), (3) und
(4) erfüllt, und P = {λ ∈ K : λ > 0}, dann ist P eine Teilmenge von K × , K ist
angeordnet bezüglich P und > ist die von P abgeleitete Größer-Relation.
Beweis (1) Dies ist klar, da 0 ∈
/ P und P = {λ ∈ K : λ > 0}.
(2) Dies ist auch klar, da für jedes λ ∈ K × genau eines von λ ∈ P und −λ ∈ P
gilt, und P = {λ ∈ K : λ > 0}.
(3) Seien λ, µ ∈ K mit λ > 0, µ > 0. Dann ist λ ∈ P und µ ∈ P und damit auch
λ + µ ∈ P und λµ ∈ P . Folglich ist λ + µ > 0 und λµ > 0.
(4) Es gilt λ > µ genau dann, wenn λ − µ ∈ P , d.h., λ > µ gilt genau dann,
wenn λ − µ > 0.
Ist K ein Körper angeordnet bezüglich einer Teilmenge P von K × , so wird dann
meistens lediglich von einem angeordneten Körper K geredet. Die von P abgeleitete Größer-Relation wird mit > bezeichnet und die Teilmenge P nicht mehr
explizit erwähnt.
Im Folgenden sei K ein angeordneter Körper. Wie in Q wird die Relation <
definiert durch: Es gilt λ < µ genau dann, wenn µ > λ. Folglich gilt λ < µ genau
dann, wenn µ − λ ∈ P .
Satz 2.2 Die folgenden Rechenregeln gelten für die Relationen < und >:
(1) Sind λ, µ ∈ K mit λ 6= µ, so ist genau eine der Aussagen λ < µ und µ < λ
richtig.
2 Der Körper der rationalen Zahlen
15
(2) Sind λ, µ, ν ∈ K mit λ < µ und µ < ν, so ist λ < ν.
(3) Es gilt λ < µ genau dann, wenn −λ > −µ.
(4) Sind λ, µ ∈ K mit λ < µ, so ist λ + ν < µ + ν für alle ν ∈ K.
(5) Sind λ, µ, ν, ̺ ∈ K mit λ < µ und ν < ̺, so ist λ + ν < µ + ̺.
(6) Sind λ, µ ∈ K mit λ < µ und ν > 0, so ist νλ < νµ.
(7) Sind λ, µ ∈ K mit λ < µ und ν < 0, so ist νµ < νλ.
(8) Für jedes λ ∈ K × ist λλ > 0; insbesondere ist 1 > 0.
(9) Ist λ ∈ K × mit λ > 0, so ist λ−1 > 0.
(10) Sind λ, µ ∈ K × mit λ > 0 und µ > λ, so ist µ−1 < λ−1 .
Beweis (1) Dies ist klar.
(2) Sind λ, µ, ν ∈ K mit λ < µ und µ < ν, so ist µ − λ ∈ P und ν − µ ∈ P und
damit ν − λ = (ν − µ) + (µ − λ) ∈ P , d.h., λ < ν.
(3) Es gilt λ < µ genau dann, wenn µ − λ ∈ P , und −λ > −µ gilt genau dann,
wenn −λ − (−µ) ∈ P . Aber −λ − (−µ) = −λ + µ = µ − λ.
(4) Sind λ, µ ∈ K mit λ < µ, so ist µ − λ ∈ P und damit (µ + ν) − (λ + ν) =
µ − λ ∈ P für alle ν ∈ K, d.h., λ + ν < µ + ν für alle ν ∈ K.
(5) Sind λ, µ, ν, ̺ ∈ K mit λ < µ und ν < ̺, so ist µ − λ ∈ P und ̺ − ν ∈ P
und damit auch (µ + ̺) − (λ + ν) = (µ − λ) + (̺ − ν) ∈ P , d.h., λ + ν < µ + ̺.
(6) Sind λ, µ ∈ K mit λ < µ und ν > 0, so ist µ − λ ∈ P und ν ∈ P und damit
auch νµ − νλ = ν(µ − λ) ∈ P , d.h., νλ < νµ.
(7) Sind λ, µ ∈ K mit λ < µ und ν < 0, so ist µ − λ ∈ P und −ν ∈ P und damit
auch νλ − νµ = (−ν)(µ − λ) ∈ P , d.h., νµ < νλ.
(8) Ist λ ∈ P , so ist λλ ∈ P und damit λλ > 0. Ist dagegen −λ ∈ P , so ist wieder
λλ = (−λ)(−λ) ∈ P , d.h., λλ > 0. Folglich ist λλ > 0 für alle λ ∈ K × , da für
jedes λ ∈ K × genau eines von λ und −λ in P ist. Insbesondere ist 1 = 1 · 1 > 0.
(9) Sei λ ∈ K × mit λ > 0; dann ist λ−1 ∈ K × und damit ist genau eines von λ−1
und −λ−1 in P . Aber −λ−1 ∈ P ist nicht möglich, da dann −1 = λ(−λ−1 ) ∈ P
wäre und daher 1 ∈
/ P (im Widerspruch zu 1 > 0). Also ist λ−1 ∈ P , d.h.,
−1
λ > 0.
(10) Seien λ, µ ∈ K × mit λ > 0 und µ > λ; also sind λ ∈ P , µ − λ ∈ P und
µ = (µ − λ) + λ ∈ P , und nach (9) ist (µ − λ)−1 > 0, d.h., (µ − λ)−1 ∈ P . Daraus
folgt, dass λµ(µ − λ)−1 ∈ P , d.h., λµ(µ − λ)−1 > 0. Aber
(λ−1 − µ−1 )λµ(µ − λ)−1 = (µ − λ)(µ − λ)−1 = 1 ,
2 Der Körper der rationalen Zahlen
16
d.h., λµ(µ − λ)−1 = (λ−1 − µ−1 )−1 und damit ist nach (9) λ−1 − µ−1 > 0, d.h.,
µ−1 < λ−1 .
Wie in Q werden die Relationen ≤ und ≥ auf K definiert durch: Es gilt λ ≤ µ
genau dann, wenn λ < µ oder λ = µ, und λ ≥ µ genau dann, wenn λ > µ oder
λ = µ. Für jedes λ ∈ K sei der (Absolut)-Betrag |λ| von λ definiert durch
λ , falls λ ≥ 0,
|λ| =
−λ , falls λ < 0.
Satz 2.3 Der Absolut-Betrag hat folgende Eigenschaften:
(1) Für jedes λ ∈ K ist |λ| ≥ 0 und |λ| = 0 gilt genau dann, wenn λ = 0.
(2) Für alle λ, µ ∈ K ist |λµ| = |λ||µ|. Insbesondere ist |−λ| = |λ|.
(3) Für alle λ, µ ∈ K ist |λ + µ| ≤ |λ| + |µ| (Dreiecksungleichung).
(4) Für alle λ, µ ∈ K ist ||λ| − |µ|| ≤ |λ − µ| (Umgekehrte Dreiecksungleichung).
Beweis (1) Für jedes λ ∈ K gilt genau eines von λ = 0, λ > 0 und λ < 0. Ist
λ > 0, so ist |λ| = λ > 0, und |λ| =
6 0. Ist λ < 0, so ist |λ| = −λ > 0, und wieder
ist |λ| =
6 0. Schließlich ist |0| = 0. Für jedes λ ∈ K ist also |λ| ≥ 0 und |λ| = 0
gilt genau dann, wenn λ = 0.
(2) Sind λ ≥ 0 und µ ≥ 0, so ist λµ ≥ 0 und damit |λµ| = λµ = |λ||µ|. Ist λ < 0
und µ ≥ 0, so ist λµ = −(−λ)µ ≤ 0 und damit ist |λµ| = −λµ = (−λ)µ = |λ||µ|.
Genauso gilt |λµ| = |λ||µ|, wenn λ ≥ 0 und µ < 0. Sind schließlich λ < 0 und
µ < 0, so ist λµ = (−λ)(−µ) > 0 und damit ist |λµ| = λµ = (−λ)(−µ) = |λ||µ|.
Insbesondere ist |−λ| = |−1 · λ| = |−1||λ| = 1 · |λ| = |λ| für jedes λ ∈ K.
(3) Gilt λ ≥ 0 und µ ≥ 0 oder λ < 0 und µ < 0, so stellt man leicht fest,
dass |λ + µ| = |λ| + |µ|. Nehme also ohne Beschränkung der Allgemeinheit an,
dass λ ≥ 0 und µ < 0; damit ist |λ| = λ und |µ| = −µ. Ist λ + µ ≥ 0, so ist
|λ + µ| = λ + µ und daraus ergibt sich, dass
|λ| + |µ| − |λ + µ| = λ + (−µ) − (λ + µ) = (−µ) + (−µ) ≥ 0 .
Ist andererseits λ + µ < 0, so ist |λ + µ| = −(λ + µ) und hier ist
|λ| + |µ| − |λ + µ| = λ + (−µ) + (λ + µ) = λ + λ ≥ 0 .
In beiden Fällen ist |λ| + |µ| − |λ + µ| ≥ 0, d.h., |λ + µ| ≤ |λ| + |µ|.
(4) Nach (3) ist |λ| = |(λ −µ) + µ| ≤ |λ −µ| + |µ| und damit ist |λ| −|µ| ≤ |λ −µ|.
Genauso gilt |µ| − |λ| ≤ |µ − λ| = |λ − µ|. Folglich ist ||λ| − |µ|| ≤ |λ − µ|: Ist
|λ| − |µ| ≥ 0, so ist ||λ| − |µ|| = |λ| − |µ| ≤ |λ − µ|; ist andererseits |λ| − |µ| < 0,
so ist wieder ||λ| − |µ|| = −(|λ| − |µ|) = |µ| − |λ| ≤ |λ − µ|.
2 Der Körper der rationalen Zahlen
17
Satz 2.4 Sei n ≥ 2 und seien λ1 , . . . , λn ∈ K.
(1) Es gibt ein eindeutiges λ ∈ K, für das gilt: λk ≤ λ für alle k = 1, . . . , n und
λj = λ für mindestens ein j. Das Element λ wird mit max{λk : 1 ≤ k ≤ n} oder
max{λ1 , . . . , λn } bezeichnet.
(2) Es gibt ein eindeutiges λ′ ∈ K, für das gilt: λk ≥ λ′ für alle k = 1, . . . , n
und λj = λ′ für mindestens ein j. Das Element λ′ wird mit min{λk : 1 ≤ k ≤ n}
oder min{λ1 , . . . , λn } bezeichnet.
Beweis Übung.
Satz 2.5 Sei m ≥ 2 und λ1 , . . . , λm , ε ∈ K mit ε > 0 und 0 < λk+1 − λk < ε
für jedes k = 1, . . . , m − 1. Ferner seien µ, ν ∈ K mit λ1 ≤ µ < ν ≤ λm und
ν − µ ≥ ε. Dann gibt es ein k mit µ < λk < ν.
Beweis Übung.
Für jedes n ∈ N wird das Element |1 + 1 +{z· · · + 1} von K mit n bezeichnet. Da
n−mal
1 = 1 > 0 und n + 1 = n + 1 für jedes n ∈ N, sieht man leicht, dass n > 0 für
alle n ≥ 1. Für jedes λ ∈ K und jedes n ∈ N wird das Element |λλ {z
· · · λ} von K
n−mal
mit λn bezeichnet, wobei λ0 = 1.
Lemma 2.3 (Bernoullische Ungleichung) Sei λ ∈ K mit λ > −1. Dann gilt
(1 + λ)n ≥ 1 + nλ
für alle n ∈ N.
Beweis Für jedes n ∈ N sei An die Aussage, dass (1 + λ)n ≥ 1 + nλ für alle
λ > −1 gilt. Dann ist A0 richtig, da (1 + λ)0 = 1 = 1 + 0λ. Sei also n ∈ N und
nehme an, dass An richtig ist. Für λ ∈ K mit λ > −1 ist dann
(1 + λ)n+1 = (1 + λ)n (1 + λ) ≥ (1 + nλ)(1 + λ) = 1 + nλ + λ + nλ2
= 1 + (n + 1)λ + nλ2 = 1 + n + 1λ + nλ2 ≥ 1 + n + 1λ ,
da λ + 1 > 0 und λ2 ≥ 0, und folglich ist An+1 auch richtig. Daraus ergibt sich
nach Satz 1.4, dass An für alle n ∈ N richtig ist.
Lemma 2.4 Sei λ ∈ K mit 0 < λ < 1. Für jedes n ∈ N gilt dann
(1 + λ)n < 1 + 3n λ .
2 Der Körper der rationalen Zahlen
18
Beweis Für jedes n ∈ N sei An die Aussage, dass (1 + λ)n < 1 + 3n λ für alle
λ ∈ K mit 0 < λ < 1 gilt. Da (1 + λ)0 = 1 < 1 + 30 λ, ist A0 richtig. Sei also
n ∈ N und nehme an, dass An richtig ist. Für λ ∈ K mit 0 < λ < 1 ist dann
(1 + λ)n+1 = (1 + λ)n (1 + λ) < (1 + 3n λ)(1 + λ)
= 1 + 3n λ + λ + 3n λ2 ≤ 1 + 3n λ + λ + 3n λ = 1 + (3n + 3n + 1)λ
≤ 1 + (3n + 3n + 3n )λ = 1 + (3 3n )λ = 1 + 3n+1 λ ,
und folglich ist An+1 auch richtig. Daraus ergibt sich nach Satz 1.4, dass An für
alle n ∈ N richtig ist.
3
Der Körper der reellen Zahlen
Ziel dieses Abschnittes ist es, den Körper R der reellen Zahlen einzuführen.
Ein Körper K heißt Körpererweiterung eines Körpers F , wenn F ⊂ K und die
Addition (bzw. die Multiplikation) in F die Einschränkung der Addition (bzw.
der Multiplikation) in K ist. (Dies bedeutet: Für alle λ, µ ∈ F muss λ+µ = λ⊕µ
und λ × µ = λ ⊗ µ gelten, wobei + und × (bzw. ⊕ und ⊗) die Addition und die
Multiplikation in F (bzw. in K) sind.)
Ist K eine Körpererweiterung von F , so ist die Null (bzw. die Eins) in F auch
die Null (bzw. die Eins) in K.
Der Körper R wird als angeordnete Körpererweiterung von Q eintreten, (d.h. als
ein angeordneter Körper, der gleichzeitig eine Körpererweiterung von Q ist).
Im Folgenden sei K eine beliebige angeordnete Körpererweiterung von Q (wobei
nicht auszuschließen ist, dass K = Q). Als Vorbereitung auf die Definition von R
werden die Eigenschaften von K untersucht.
Lemma 3.1 Die Größer-Relation > auf K ist eine Erweiterung der üblichen
Größer-Relation > auf Q. (Dies bedeutet: Sind x, y ∈ Q, so gilt x > y in K
genau dann, wenn x > y in Q gilt.)
Beweis Sei K angeordnet bezüglich der Teilmenge P von K × , setze P ′ = P ∩ Q,
also ist P ′ Teilmenge von Q× . Ist λ ∈ P ′, so ist genau eines von λ und −λ in
P und damit ist genau eines von λ und −λ in P ′ . Sind ferner λ, µ ∈ P ′ , so ist
λ + µ ∈ P und λµ ∈ P und damit auch λ + µ ∈ P ′ und λµ ∈ P ′ . Folglich
ist Q angeordnet bezüglich der Teilmenge P ′ von Q und daraus ergibt sich nach
Lemma 2.2, dass P ′ = PQ = {λ ∈ Q : λ > 0}. Ist also λ ∈ Q, so gilt λ > 0 in K
genau dann, wenn λ > 0 in Q gilt. Daher ist die Größer-Relation > auf K eine
Erweiterung der Größer-Relation > auf Q.
Sei D eine Teilmenge von K; ein Element z ∈ K heißt dann obere Schranke (bzw.
untere Schranke) von D, wenn x ≤ z für alle x ∈ D (bzw. x ≥ z für alle x ∈ D)
gilt. Die Teilmenge D heißt nach oben (bzw. nach unten) beschränkt, wenn es
eine obere Schranke (bzw. eine untere Schranke) für D gibt.
Sei D eine Teilmenge von K; ein Element z ∈ K heißt dann Supremum von D,
falls z die kleinste obere Schranke von D ist. Genauer bedeutet dies: Einerseits ist
z eine obere Schranke von D, und ist andererseits z ′ irgendeine obere Schranke
von D, so ist z ≤ z ′ . Es ist klar, dass es höchstens ein Element mit diesen zwei
Eigenschaften gibt. Falls es existiert, wird es mit sup(D) bezeichnet.
Analog heißt z ∈ K Infimum von D, falls z die größte untere Schranke von D
ist. Genauer bedeutet dies: Einerseits ist z eine untere Schranke von D, und ist
19
3 Der Körper der reellen Zahlen
20
andererseits z ′ irgendeine untere Schranke von D, so ist z ′ ≤ z. Wieder ist es
klar, dass es höchstens ein Element mit diesen zwei Eigenschaften gibt. Falls es
existiert, wird es mit inf(D) bezeichnet.
Existiert sup(D) (bzw. inf(D)), so ist D natürlich nach oben beschränkt (bzw.
nach unten beschränkt).
Sei n ≥ 2 fest und für jedes x ∈ K mit x > 1 sei Wx = {y ∈ K : y n < x}. Dann
ist Wx nichtleer, da 1 ∈ Wx , und x ist eine obere Schranke von Wx . (Sei y ∈ K
mit y n < x. Ist y ≤ 1, so ist y ≤ 1 < x; ist dagegen y > 1, so ist y < y n < x.)
Also ist Wx eine nichtleere, nach oben beschränkte Teilmenge von K.
Lemma 3.2 Existiert das Supremum z = sup(Wx ), so ist z n = x.
Beweis Da 1 ∈ Wx , ist z ≥ 1. Nehme an, dass z n < x und sei h = min{a, 1/2},
wobei a = (x − z n )(3n z n−1 )−1 . Also ist 0 < h < 1, da a > 0, und damit auch
0 < z −1 h < 1, da z −1 ≤ 1. Nun ist nach Lemma 2.5
(z + h)n = z n (1 + z −1 h)n < z n (1 + 3n z −1 h)
= z n + 3n z n−1 h ≤ z n + 3n z n−1 a = z n + (x − z n ) = x ,
d.h. z + h ∈ Wx . Aber dann wäre z keine obere Schranke von Wx , und dies zeigt,
dass z n ≥ x. Nehme nun an, dass z n > x, setze a = (z n − x)(nz n−1 )−1 und sei
h = min{a, 1/2}. Wieder ist 0 < h < 1, da a > 0, und damit auch −z −1 h > −1,
da z −1 ≤ 1. Daraus ergibt sich nach Lemma 2.4, dass
(z − h)n = z n (1 − z −1 h)n ≥ z n (1 − nz −1 h)
= z n − nz n−1 h ≥ z n − nz n−1 a = z n − (z n − x) = x > y n
für alle y ∈ Wx . Folglich ist z − h > y für alle y ∈ Wx , da z − h ≥ 0. (Sind
u, v ∈ K mit u ≥ 0 und un > v n , so ist u > v.) Aber dann wäre z − h eine
obere Schranke von Wx , die kleiner als z ist, und dies zeigt, dass z n ≤ x. Also ist
z n = x.
Lemma 3.3 Äquivalent sind:
(1) Jede nichtleere, nach oben beschränkte Teilmenge von K besitzt ein Supremum.
(2) Jede nichtleere, nach unten beschränkte Teilmenge von K besitzt ein Infimum.
Beweis (1) ⇒ (2): Sei A eine nichtleere, nach unten beschränkte Teilmenge von
K. Dann ist A− = {x ∈ K : −x ∈ A} eine nichtleere, nach oben beschränkte
Teilmenge von K und damit existiert z = sup(A− ). Aber dann ist −z = inf(A).
3 Der Körper der reellen Zahlen
21
(2) ⇒ (1): Analog.
Die Körpererweiterung K heißt ordnungsvollständig, wenn jede nichtleere, nach
oben beschränkte Teilmenge von K ein Supremum besitzt. Nach Lemma 3.2 ist
Q selbst nicht ordnungsvollständig, da es zum Beispiel keine rationale Zahl z ∈ Q
mit z 2 = 2 gibt.
Es gibt eine im Wesentlichen eindeutige ordnungsvollständige Körpererweiterung
von Q (siehe Satz 3.1 unten): Diese Körpererweiterung ist dann per Definition
der Körper der reellen Zahlen. Für die genaue Formulierung der Eindeutigkeit
muss hier zunächst erklärt werden, was ein Körperisomorphismus ist.
Seien F , F ′ Körper; eine Abbildung ψ : F → F ′ heißt Körperhomomorphismus,
wenn ψ(λ + µ) = ψ(λ) + ψ(µ) und ψ(λµ) = ψ(λ)ψ(µ) für alle λ, µ ∈ F . Ist ψ ein
Körperhomomorphismus, so sieht man leicht, dass ψ(0) = 0 und ψ(1) = 1.
Lemma 3.4 Sei ψ : F → F ′ ein Körperhomomorphismus. Ist ψ bijektiv, so ist
die Umkehrabbildung ψ −1 : F ′ → F auch ein Körperhomomorphismus.
Beweis Seien λ′ , µ′ ∈ F ′ ; da ψ bijektiv ist, gibt es eindeutige Elemente λ, µ ∈ F
mit λ′ = ψ(λ) und µ′ = ψ(µ) und damit auch mit λ = ψ −1 (λ′ ) und µ = ψ −1 (µ′ ).
Da ψ(λ + µ) = ψ(λ) + ψ(µ), gilt nun
ψ −1 (λ′ + µ′ ) = ψ −1 (ψ(λ) + ψ(µ)) = ψ −1 (ψ(λ + µ)) = λ + µ = ψ −1 (λ′ ) + ψ −1 (µ′ )
und da ψ(λµ) = ψ(λ)ψ(µ), gilt auch
ψ −1 (λ′ µ′ ) = ψ −1 (ψ(λ)ψ(µ)) = ψ −1 (ψ(λµ)) = λµ = ψ −1 (λ′ )ψ −1 (µ′ ) .
Dies zeigt dann, dass ψ −1 ein Körperhomomorphismus ist.
Ein bijektiver Körperhomomorphismus heißt ein Körperisomorphismus. Körper
F und F ′ heißen isomorph, wenn es einen Körperisomorphismus ψ : F → F ′ gibt.
Satz 3.1 Es gibt eine ordnungsvollständige Körpererweiterung von Q. Sind ferner K und K ′ zwei solche Körpererweiterungen, so gibt es einen eindeutigen
Körperisomorphismus ψ : K → K ′ , und ψ(x) = x für jedes x ∈ Q.
Beweis Siehe, zum Beispiel, Amman und Escher [1], Seite 99.
Nach Satz 3.1 gibt es bis auf Isomorphie genau eine ordnungsvollständige Körpererweiterung von Q. Die heißt der Körper der reellen Zahlen und wird mit R
bezeichnet.
Nach der Definition besitzt jede nichtleere, nach oben beschränkte Teilmenge von
R ein Supremum. Nach Lemma 3.3 besitzt dann auch jede nichtleere, nach unten
beschränkte Teilmenge von R ein Infimum.
3 Der Körper der reellen Zahlen
22
Lemma 3.5 Sei D eine nichtleere nach oben beschränkte Teilmenge von R und
sei z ∈ R. Dann gilt:
(1) z ≥ sup(D) genau dann, wenn z ≥ x für alle x ∈ D.
(2) z ≤ sup(D) genau dann, wenn es für jedes ε > 0 ein x ∈ D mit z < x + ε
gibt.
(3) z = sup(D) genau dann, wenn z ≥ x für alle x ∈ D und es für jedes ε > 0
ein x ∈ D mit z < x + ε gibt.
Sei D eine nichtleere nach unten beschränkte Teilmenge von R und z ∈ R. Dann
gilt:
(4) z ≤ inf(D) genau dann, wenn z ≤ x für alle x ∈ D.
(5) z ≥ inf(D) genau dann, wenn es für jedes ε > 0 ein x ∈ D mit z > x − ε
gibt.
(6) z = inf(D) genau dann, wenn z ≤ x für alle x ∈ D und es für jedes ε > 0
ein x ∈ D mit z > x − ε gibt.
Beweis (1) Es gilt z ≥ sup(D) genau dann, wenn z eine obere Schranke von D
ist, d.h., genau dann, wenn z ≥ x für alle x ∈ D.
(2) Sei z ≤ sup(D); für jedes ε > 0 ist dann z − ε < sup(D) und damit ist z − ε
keine obere Schranke von D. Es gibt also ein x ∈ D mit z − ε < x, d.h., mit
z < x + ε. Nehme nun umgekehrt an, dass es für jedes ε > 0 ein x ∈ D mit
z < x + ε gibt. Dann ist z − ε < sup(D) für jedes ε > 0, da x ≤ sup(D) für alle
x ∈ D. Damit ist z ≤ sup(D) (sonst wäre z−ε = sup(D) mit ε = z−sup(D) > 0).
(3) Dies folgt unmittelbar aus (1) und (2).
(4), (5) und (6): Wie (1), (2) und (3).
Lemma 3.6 Seien D, D ′ nichtleere Teilmengen von R mit D ⊂ D ′ .
(1) Ist D ′ nach oben beschränkt, dann ist auch D und sup(D) ≤ sup(D ′ ).
(1) Ist D ′ nach unten beschränkt, so ist auch D und inf(D ′ ) ≤ inf(D).
Beweis Dies ist klar.
Eine Teilmenge D von R heißt beschränkt, wenn sie nach oben und nach unten
beschränkt ist, d.h., wenn es u, v ∈ R gibt, so dass u ≤ x ≤ v für alle x ∈ D. Man
sieht leicht, dass D genau dann beschränkt ist, wenn es ein B ∈ R mit B ≥ 0
gibt, so dass |x| ≤ B für alle x ∈ D.
Lemma 3.7 Sei D eine nichtleere beschränkte Teilmenge von R; für jedes x ∈ D
gilt dann inf(D) ≤ x ≤ sup(D). Insbesondere ist inf(D) ≤ sup(D).
3 Der Körper der reellen Zahlen
23
Beweis Dies ist ebenso klar.
Sei D eine nichtleere Teilmenge von R; eine Zahl c ∈ D heißt Maximum (bzw.
Minimum) von D, wenn x ≤ c für alle x ∈ D (bzw. x ≥ c für alle x ∈ D). Es
ist klar, dass das Maximum (bzw. das Minimum) im Falle der Existenz eindeutig
bestimmt ist. Ferner ist es klar, dass D nach oben beschränkt (bzw. nach unten
beschränkt) ist, falls das Maximum (bzw. das Minimum) existiert.
Lemma 3.8 (1) Sei D eine nichtleere, nach oben beschränkte Teilmenge von R.
Dann besitzt D ein Maximum genau, wenn sup(D) ∈ D, und in diesem Fall ist
sup(D) das Maximum.
(2) Sei D eine nichtleere, nach unten beschränkte Teilmenge von R. Dann besitzt
D ein Minimum genau, wenn inf(D) ∈ D, und in diesem Fall ist inf(D) das
Minimum.
Beweis Dies folgt unmittelbar aus den Definitionen.
Sei D eine nichtleere endliche Teilmenge von R; dann besitzt D ein Maximum
und ein Minimum. Ist ferner x1 , . . . , xn irgendeine Aufzählung der Elemente von
D, so ist max{x1 , . . . , xn } das Maximum und min{x1 , . . . , xn } das Minimum.
Satz 3.2 Sei x ∈ R mit x ≥ 0; für jedes n ≥ 2 gibt es dann eine
√ eindeutige reelle
Zahl z mit z ó 0, so dass z n = x. Diese Zahl z wird mit n x bezeichnet (oder
lediglich mit x, falls n = 2).
Beweis Es gibt mindestens eine Zahl z ≥ 0 mit z n = x: Dies folgt unmittelbar
aus Lemma 3.2, falls x > 1, und die Fälle x = 0 und x = 1 sind trivial richtig,
da 0n = 0 und 1n = 1. Es bleibt also nur der Fall mit 0 < x < 1. Aber hier
ist x−1 > 1, damit gibt es ein y ≥ 0 mit y n = x−1 ; folglich ist y −1 > 0 und
(y −1)n = x.
Es gibt höchstens eine Zahl z ≥ 0 mit z n = x: Sei y ≥ 0 mit y 6= z. Ist y < z
(bzw. y > z), so ist y n < z n (bzw. y n > z n ) und damit ist y n 6= x.
Satz 3.3 (Satz von Archimedes) Zu jeder reellen Zahl x ∈ R gibt es eine
näturliche Zahl n ∈ N mit n > x. Mit anderen Worten: Die Teilmenge N von R
ist nicht nach oben beschränkt.
Beweis Die Aussage ist trivial richtig, wenn x < 0, da in diesem Fall n > x für
jedes n ∈ N; sei also x ≥ 0. Dann ist A = {n ∈ N : n ≤ x} eine nichtleere
nach oben beschränkte Teilmenge von R, da 0 ∈ A und x eine obere Schranke
von A ist. Folglich existiert das Supremum z = sup(A). Nun gibt es ein m ∈ A
mit z − 1 < m, sonst wäre z − 1 auch eine obere Schranke von A. Damit ist
n = m + 1 ∈ N und n > z. Insbesondere ist n ∈
/ A (sonst wäre z keine obere
Schranke), d.h. n > x.
3 Der Körper der reellen Zahlen
24
Satz 3.4 Zu jedem ε > 0 gibt es ein n ∈ N \ {0} mit 1/n < ε.
Beweis Sei ε > 0; nach Satz 3.3 gibt es dann n ∈ N \ {0} mit n > ε−1 , und
daraus folgt nach Satz 2.2 (10), dass 1/n < (ε−1)−1 = ε.
Satz 3.5 (1) Sei x ∈ R mit x > 1. Zu jedem c ∈ R gibt es dann ein n ∈ N, so
dass xn > c.
(2) Sei x ∈ R mit 0 < x < 1. Zu jedem ε > 0 gibt es dann ein n ∈ N, so dass
xn < ε.
Beweis (1) Setze y = x − 1, also ist y > 0. Sei nun c ∈ R; nach Satz 3.3 gibt es
ein n ∈ N, so dass n > cy −1 . Folglich ist ny > c und damit ist nach Lemma 2.4
xn = (y + 1)n ≥ 1 + ny > 1 + c > c .
(2) Setze y = x−1 ; dann ist y > 1. Sei nun ε > 0; nach (1) gibt es ein n ∈ N, so
dass y n > ε−1 und nach Satz 2.2 (10) ist dann xn = (y n )−1 < (ε−1 )−1 = ε.
Satz 3.6 Seien y, z ∈ R mit y < z. Dann gibt es ein x ∈ Q mit y < x < z.
Beweis Setze w = max{|y|, |z|}; nach Satz 3.3 gibt es dann ein N ∈ N mit
w < N, und damit ist −N < y < x < N. Ferner gibt es nach Satz 3.4 ein
n ∈ N \ {0} mit 1/n < z − y. Sei nun m = 2Nn + 1 und für k = 1, . . . , m sei
xk = −N + (k − 1)/n. Dann ist x1 = −N < y, z < N = xm und für 1 ≤ k < m ist
xk+1 − xk = n−1 < z − y. Folglich gibt es nach Lemma 2.3 ein k mit y < xk < z.
Aber xj ∈ Q für jedes j und daher gibt es ein x ∈ Q mit y < x < z.
Eine nichtleere Teilmenge I von R heißt Intervall, wenn gilt: Sind a, b ∈ I mit
a < b, so ist x ∈ I für jedes x ∈ R mit a < x < b. Offensichtlich ist R selbst ein
Intervall sowie die einpunktige Menge {a} für jedes a ∈ R. Weitere Beispiele für
Intervalle sind:
Für a, b ∈ R mit a < b:
[a, b] = {x ∈ R : a ≤ x ≤ b}, (a, b) = {x ∈ R : a < x < b},
(a, b] = {x ∈ R : a < x ≤ b}, [a, b) = {x ∈ R : a ≤ x < b}.
Für a, b ∈ R:
[a, +∞) = {x ∈ R : a ≤ x}, (a, +∞) = {x ∈ R : a < x},
(−∞, b] = {x ∈ R : x ≤ b}, (−∞, b) = {x ∈ R : x < b}.
In der Tat gibt es dann keine weiteren Beispiele:
3 Der Körper der reellen Zahlen
25
Satz 3.7 Sei I ⊂ R ein Intervall, das mehr als einen Punkt enthält.
(1) Ist I weder nach unten noch nach oben beschränkt, so ist I = R.
(2) Ist I nach unten, aber nicht nach oben beschränkt, dann gibt es a ∈ R, so
dass I = [a, +∞) oder I = (a, +∞).
(3) Ist I nach oben, aber nicht nach unten beschränkt, dann gibt es b ∈ R, so
dass I = (−∞, b] oder I = (−∞, b).
(4) Ist I beschränkt, dann gibt es a, b ∈ R mit a < b, so dass I eines der vier
Intervalle [a, b], (a, b), (a, b] und [a, b) ist.
Beweis Übung.
Es ist oft nützlich, R durch das Hinzufügen der zwei Symbolen −∞ und +∞ zu
ergänzen. Die Menge R ∪ {−∞, +∞} heißt dann erweiterte Zahlengerade und
wird mit R̄ bezeichnet. Die Relation < wird zu einer Relation < auf R̄ erweitert:
Per Definition gilt −∞ < x < +∞ für jedes x ∈ R. Die anderen Relationen ≤,
> und ≥ werden dann entsprechend erweitert.
Genauso wie für Teilmengen von R wird auch das Supremum und das Infimum
für Teilmengen von R̄ definiert.
Satz 3.8 Sei D eine nichtleere Teilmenge von R̄.
(1) Dann besitzt D ein Supremum sup(D) und ein Infimum inf(D).
(2) Ist +∞ ∈ D, so gilt sup(D) = +∞.
(3) Ist +∞ ∈
/ D, so gilt sup(D) = +∞ genau dann, wenn es zu jedem z ∈ R ein
x ∈ D mit x > z gibt, d.h., wenn D keine obere Schranke in R besitzt.
(4) Es gilt sup(D) = −∞ genau dann, wenn D = {−∞}.
(5) Ist −∞ ∈ D, so gilt inf(D) = −∞.
(6) Ist −∞ ∈
/ D, so gilt inf(D) = −∞ genau dann, wenn es zu jedem z ∈ R ein
x ∈ D mit z < x gibt, d.h., wenn D keine untere Schranke in R besitzt.
(7) Es gilt inf(D) = +∞ genau dann, wenn D = {+∞}.
(8) Für jedes x ∈ D gilt inf(D) ≤ x ≤ sup(D).
(9) Ist D ′ eine Teilmenge von R̄ mit D ⊂ D ′ , so ist sup(D) ≤ sup(D ′ ) und auch
inf(D ′ ) ≤ inf(D).
Beweis Übung.
4
Der Körper der komplexen Zahlen
Sind K und F Körper, so heißt F Unterkörper von K, wenn K Körpererweiterung
von F ist.
Für jedes x ∈ R ist x2 ≥ 0; daher gibt es keine reelle Zahl x mit x2 = −1.
Sei K eine Körpererweiterung von R, die ein Element i enthält, für das i2 = −1
gilt; insbesondere ist dann i ∈
/ R. Sei
L = {z ∈ K : es gibt x, y ∈ R mit z = x + iy} ;
da x = x + i0 und i = 0 + i1, ist R ⊂ L und i ∈ L. Jedes Element in L hat eine
eindeutige Darstellung der Form x + iy mit x, y ∈ R: Sind x, y, x′ , y ′ ∈ R mit
x + iy = x′ + iy ′ , so ist zunächst y = y ′ , sonst wäre i = (x′ − x)/(y − y ′) ein
Element von R, und wenn y = y ′, so ist auch x − x′ = i(y ′ − y) = 0, d.h. x = x′ .
Lemma 4.1 (1) L ist Unterkörper von K und damit eine Körpererweiterung
von R, die i enthält.
(2) Ist M ein Unterkörper von K, der eine Körpererweiterung von R ist und i
enthält, so ist L ⊂ M. Damit ist L die kleinste Körpererweiterung von R in K,
die i enthält.
Beweis (1) Seien z, z ′ ∈ L; dann gibt es x, y, x′ , y ′ ∈ R, so dass z = x + iy und
z ′ = x′ + iy ′ , und folglich sind
z + z ′ = (x + iy) + (x′ + iy ′ ) = (x + x′ ) + i(y + y ′) ,
zz ′ = (x + iy)(x′ + iy ′) = (xx′ − yy ′) + i(xy ′ + x′ y)
und −z = −(x + iy) = −x + i(−y) alle Elemente von L. Ist ferner z 6= 0, so ist
σ = x2 + y 2 > 0, und in diesem Fall ist
x
σ
+i
x2 y 2 xy yx −y (x + iy) =
+i
=1,
+
−
σ
σ
σ
σ
σ
d.h. z −1 = (x/σ) + i(−y/σ) ist ein Element von L.
(2) Dies ist klar.
Betrachte nun eine weitere Körpererweiterung K ′ von R, die ein Element j
enthält, für das j 2 = −1 gilt, und sei
L′ = {z ∈ K ′ : es gibt x, y ∈ R mit z = x + jy} ;
nach Lemma 4.1 ist L′ die kleinste Körpererweiterung von R in K ′ , die j enthält.
26
4 Der Körper der komplexen Zahlen
27
Lemma 4.2 Es gibt einen eindeutigen Körperisomorphismus ψ : L → L′ , so
dass ψ(x) = x für alle x ∈ R und ψ(i) = j.
Beweis Ist ψ : L → L′ ein Körperhomomorphismus mit ψ(x) = x für alle x ∈ R
und ψ(i) = j, so ist ψ(x+ iy) = x+ jy für alle x, y ∈ R. Da aber jedes Element in
L eine eindeutige Darstellung der Form x + iy mit x, y ∈ R hat, kann umgekehrt
eine Abbildung ψ : L → L′ definiert werden durch ψ(x + iy) = x + jy für alle
x, y ∈ R. Man sieht leicht, dass diese Abbildung ψ ein Körperisomorphismus mit
ψ(x) = x für alle x ∈ R und ψ(i) = j ist.
Gibt es eine minimale Körpererweiterung von R, die ein Element i enthält, für das
i2 = −1 gilt, so ist nach Lemma 4.2 diese Erweiterung im Wesentlichen eindeutig.
Und in der Tat gibt es eine solche Erweiterung: Sei C = R2 = {(x, y) : x, y ∈ R},
definiere eine Addition + : C × C → C durch
(x, y) + (x′ , y ′) = (x + x′ , y + y ′)
und eine Multiplikation · : C × C → C durch
(x, y)(x′ , y ′) = (xx′ − yy ′, xy ′ + yx′ ) .
Dann ist (C, +, ·, 0, 1) ein Körper, wobei 0 = (0, 0) und 1 = (1, 0): Es wird
als Übungsaufgabe überlassen zu zeigen, dass die Addition und Multiplikation
assoziativ und kommutativ sind und dass das distributative Gesetz gilt. Das
Element (0, 0) (bzw. das Element (1, 0)) ist die Null (bzw. die Eins) in C, da
(0, 0) + (x, y) = (0 + x, 0 + y) = (x, y) und
(1, 0)(x, y) = (1x − 0y, 1y + 0x) = (x, y)
für jedes (x, y) ∈ C. Ferner ist −(x, y) = (−x, −y) für jedes (x, y) ∈ C. Ist
(x, y) ∈ C mit (x, y) 6= (0, 0), so ist σ = x2 + y 2 > 0 und
x2 y 2 xy yx y
= (1, 0) ,
, − (x, y) =
+ ,
−
σ σ
σ
σ σ
σ
x
d.h. (x/σ, −y/σ) = (x, y)−1 .
Nun wird R mit der Teilmenge R × {0} = {(x, 0) : x ∈ R} von C identifiziert.
Etwas genauer: Für jedes x ∈ R wird das Element x mit dem Element (x, 0) ∈ C
identifiziert. Diese Identifizierung von R und R × {0} ⊂ C ist verträglich mit den
Additionen und Multiplikationen in R und C, da (x, 0) + (x′ , 0) = (x + x′ , 0) und
(x, 0)(x′ , 0) = (xx′ , 0) für alle x, x ∈ R. Auf diese Weise kann R als Unterkörper
von C angesehen werden. Mit anderen Worten, C wird als Körpererweiterung von
R angesehen.
4 Der Körper der komplexen Zahlen
28
Setze nun i = (0, 1); dann ist (0, 1)(0, 1) = (−1, 0) = −(1, 0), d.h. i2 = −1. Damit
ist C eine Körpererweiterung von R, die ein Element i enthält, für das i2 = −1
gilt. Ferner ist C eine minimale solche Erweiterung: Ist z = (x, y) ∈ C, so ist
(x, y) = (x, 0) + (0, y) = (x, 0) + (0, 1)(y, 0)
und damit hat z = (x, y) ∈ C die (eindeutige) Darstellung x + iy.
In der Praxis wird diese Darstellung ständig verwendet: Es wird also meistens
x + iy statt (x, y) geschreiben. Das Element i = (0, 1) in C heißt imaginäre
Einheit.
Sei z = x+iy ∈ C mit x, y ∈ R; dann heißt x (bzw. y) Realteil (bzw. Imaginärteil )
von z und wird mit Re z (bzw. mit Im z) bezeichnet. Ferner heißt x − iy die zu z
konjugierte komplexe Zahl und sie wird mit z bezeichnet. Man sieht sofort, dass
die folgenden Rechenregeln gelten:
(1) Re z = (z + z)/2 und Im z = (z − z)/2i für alle z ∈ C.
(2) z = z für alle z ∈ C.
(3) z = z genau dann, wenn z ∈ R.
(4) z + w = z + w und zw = z w für alle z, w ∈ C.
(5) Für z = x + iy (mit x, y ∈ R) ist zz = x2 + y 2.
Sei z ∈ C; nach √
(5) ist zz eine nichtnegative reelle Zahl und ihre (nichtnegative)
Quadratwurzel zz wird mit |z| bezeichnet und heißt der Betrag von z. Also ist
p
|z| = (Re z)2 + (Im z)2 .
Diese Bezeichnung stimmt mit dem auf R definierten Betrag, da für x ∈ R ist
x , falls x ≥ 0,
|x| =
−x , falls x < 0.
Satz 4.1 Folgende Rechenregeln gelten für den Betrag:
(1) |zw| = |z||w| für alle z, w ∈ C.
(2) | Re z| ≤ |z|, | Im z| ≤ |z| und |z| = |z| für alle z ∈ C.
(3) |z| = 0 genau dann, wenn z = 0.
(4) |z + w| ≤ |z| + |w| für alle z, w ∈ C (Dreiecksungleichung).
(5) ||z| − |w|| ≤ |z − w| für alle z, w ∈ C (Umgekehrte Dreiecksungleichung).
4 Der Körper der komplexen Zahlen
√
29
√ √
zzww = zz ww = |z||w|.
p
2 und daraus ergibt
(2) Sei z = x + iy ∈√C mitp
x, y ∈ R; dann ist |z| = px2 + yp
2
2
2
2
2
2
sich, dass
p | Re z| = xp ≤ x + y = |z|, | Im z| = y ≤ x + y = |z| und
|z| = x2 + (−y)2 = x2 + y 2 = |z|.
Beweis (1) Für alle z, w ∈ C ist |zw| =
zwzw =
√
(3) Dies ist klar: Für alle x, y ∈ R ist x2 + y 2 = 0 genau dann, wenn x = y = 0.
(4) Für jedes ζ ∈ C ist ζ + ζ = 2 Re ζ; folglich gilt nach (1) und (2), dass
|z + w|2 = (z + w)(z + w) = (z + w)(z + w)
= zz + zw + zw + ww = |z|2 + 2 Re(zw) + |w|2
≤ |z|2 + 2|zw| + |w|2 = |z|2 + 2|z||w| + |w|2 = (|z| + |w|)2 ,
und damit ist |z + w| ≤ |z| + |w|.
(5) Nach (4) gilt |z| = |z − w + w| ≤ |z − w| + |w| und damit |z| − |w| ≤ |z − w|,
und genauso gilt −(|z| − |w|) = |w| − |z| ≤ |w − z| = |z − w|. Daraus ergibt sich,
dass ||z| − |w|| ≤ |z − w|.
Eine Teilmenge D von C heißt beschränkt, wenn es ein B ∈ R mit B ≥ 0 gibt, so
dass |z| ≤ B für alle z ∈ D.
Lemma 4.3 Eine Teilmenge D von C ist genau dann beschränkt, wenn Re(D)
und Im(D) beschränkte Teilmengen von R sind.
Beweis Sei D beschränkt; dann gibt es ein B ∈ R mit B ≥ 0, so dass |z| ≤ B
für alle z ∈ D. Nach Satz 4.1 (2) ist also | Re z| ≤ B und | Im z| ≤ B für alle
z ∈ D, und damit sind Re(D) und Im(D) beschränkt. Sind umgekehrt Re(D)
und Im(D) beschränkte Teilmengen von R, dann gibt es B1 , B2 ∈ R mit B1 ≥ 0
und B2 ≥ 0, so p
dass | Re z| ≤ B1 und | Im z| ≤ B2 für alle z ∈ D. Daraus ergibt
sich, dass |z| ≤ B12 + B22 für alle z ∈ D, d.h., D ist eine beschränkte Teilmenge
von C.
5
Folgen
Ab jetzt bezeichnet K entweder den Körper R oder den Körper C. Genauer bedeutet dies: K wird in denjenigen Situationen verwendet, in denen die Ersetzung
von K sowohl durch R als auch durch C einen Sinn macht.
Unter einer Folge aus einer Menge X versteht man eine Abbildung
̺ : {n ∈ N : n ≥ p} → X
für ein p ∈ N. Jedem n ≥ p ist also ein Element xn = ̺(n) ∈ X zugeordnet und
man schreibt hierfür meistens {xn }n≥p statt ̺.
Sei {xn }n≥p eine Folge aus K. Die Folge heißt konvergent gegen x ∈ K, falls es zu
jedem ε > 0 ein N ≥ p gibt, so dass |xn − x| < ε für alle n ≥ N.
Bemerkung: Bei einem Ausdruck wie ‘ε > 0’ oder ‘N ≥ p’ muss es aus dem
Kontext entnommen werden, dass ‘ε ∈ R mit ε > 0’ bzw. ‘N ∈ N mit N ≥ p’
gemeint ist.
Lemma 5.1 Sei {xn }n≥p eine Folge aus K und sei q ≥ p. Dann konvergiert die
Folge {xn }n≥p gegen x ∈ K genau, wenn die Folge {xn }n≥q gegen x konvergiert.
Beweis Dies ist klar.
Lemma 5.2 Sei {xn }n≥p eine Folge aus K und seien x, x′ ∈ K. Konvergiert
{xn }n≥p gegen x und gegen x′ , so ist x′ = x.
Beweis Sei ε > 0; da {xn }n≥p gegen x und gegen x′ konvergiert, gibt es N, N ′ ≥ p,
so dass |xn − x| < ε/2 für alle n ≥ N und |xn − x′ | < ε/2 für alle n ≥ N ′ . Für
M = max{N, N ′ } ist dann
|x − x′ | = |x − xM + xM − x′ | ≤ |x − xM | + |xM − x′ | < ε/2 + ε/2 = ε ,
und dies zeigt, dass |x − x′ | < ε für alle ε > 0. Damit ist x′ = x.
Konvergiert eine Folge {xn }n≥p aus K gegen x, so nennt man x den Grenzwert
oder den Limes der Folge und schreibt limn→∞ xn = x. Nach Lemma 5.2 macht
diese Schreibweise einen Sinn. Ferner gibt es nach Lemma 5.1 auch kein Problem
mit dieser Schreibweise, wenn die Folgen {xn }n≥p und {xn }n≥q (für ein q ≥ p)
gleichzeitig behandelt werden.
Wichtige Beispiele: (1) Die Folge {1/n}n≥1 konvergiert gegen 0: limn→∞ 1/n = 0.
(Sei ε > 0; nach Satz 3.3 gibt es ein N ≥ 1, so dass N > ε−1 , und für alle n ≥ N
ist dann |1/n − 0| = 1/n ≤ 1/N < ε; dies zeigt, dass limn→∞ 1/n = 0.)
(2) Für jedes x ∈ K mit |x| < 1 konvergiert die Folge {xn }n≥0 der Potenzen von
x gegen 0: limn→∞ xn = 0. (Dies ist wie in (1), aber mit Hilfe von Satz 3.5 (2).)
30
5 Folgen
31
Satz 5.1 Sei {zn }n≥p eine Folge komplexer Zahlen und z ∈ C.
(1) Die Folge {zn }n≥p konvergiert gegen z genau dann, wenn die Folge {Re zn }n≥p
gegen Re z und die Folge {Im zn }n≥p gegen Im z konvergiert.
(2) Die Folge {zn }n≥p konvergiert gegen z genau dann, wenn die Folge {z n }n≥p
gegen z konvergiert.
Beweis (1) Nehme zunächst an, dass die Folge {zn }n≥p gegen z konvergiert, und
sei ε > 0. Dann gibt es N ≥ p, so dass |zn − z| < ε für alle n ≥ N. Daraus folgt
nach Satz 4.1 (2), dass sowohl | Re zn − Re z| = | Re(zn − z)| ≤ |zn − z| < ε als
auch | Im zn − Im z| = | Im(zn − z)| ≤ |zn − z| < ε für alle n ≥ N, und dies zeigt,
dass {Re zn }n≥p gegen Re z und {Im zn }n≥p gegen Im z konvergiert.
Nehme umgekehrt an, dass {Re zn }n≥p gegen Re z und {Im zn }n≥p gegen Im z
konvergiert, und sei ε > 0. Dann gibt es N1 , N2 ≥ p, so dass | Re zn − Re z| < ε/2
für alle n ≥ N1 und | Im zn −Im z| < ε/2 für alle n ≥ N2 . Setze N = max{N1 , N2 };
für alle n ≥ N ist dann
|zn − z| = | Re zn + i Im zn − Re z − i Im z|
= | Re zn − Re z + i(Im zn − Im z)| ≤ | Re zn − Re z| + |i(Im zn − Im z)|
= | Re zn − Re z| + |i|| Im zn − Im z| = | Re zn − Re z| + | Im zn − Im z|
< ε/2 + ε/2 = ε ,
und dies zeigt, dass {zn }n≥p gegen z konvergiert.
(2) Dies folgt unmittelbar aus der Tatsache, dass |z n − z| = |zn − z|.
Sei {xn }n≥p eine Folge reeller Zahlen. Da R ⊂ C, kann {xn }n≥p auch als Folge
komplexer Zahlen angesehen werden. Es gibt also zwei mögliche Konvergenzbegriffe (Konvergenz in R und Konvergenz in C), die hier angewendet werden
können, die aber übereinstimmen: Aus Satz 5.1 (1) folgt, dass die Folge genau
dann in C konvergiert, wenn sie in R konvergiert.
Ist {xn }n≥p eine Folge aus K, so ist {|xn |}n≥p eine Folge reeller Zahlen.
Satz 5.2 Sei {x
n }n≥p eine konvergente Folge aus K. Dann konvergiert die Folge
{|xn |}n≥p und lim xn = lim |xn |.
n→∞
n→∞
Beweis Sei x = limn→∞ xn und ε > 0. Dann gibt es N ≥ p, so dass |xn − x| < ε
für alle n ≥ p, und daraus folgt nach Satz 2.3 (4) (bzw. nach Satz 4.1 (5)), dass
auch ||xn | − |x|| ≤ |xn − x| < ε für alle n ≥ p, und dies zeigt, dass die Folge
{|xn |}n≥p gegen |x| konvergiert.
5 Folgen
32
Satz 5.3 Seien {yn }n≥p und {xn }n≥p zwei konvergente Folgen reeller Zahlen mit
yn ≤ xn für alle n ≥ p. Dann gilt lim yn ≤ lim xn .
n→∞
n→∞
Beweis Setze x = limn→∞ xn und y = limn→∞ yn . Sei ε > 0; dann gibt es N, N ′ ≥
p, so dass |xn − x| < ε/2 für alle n ≥ N und |yn − y| < ε/2 für alle n ≥ N ′ . Für
M = max{N, N ′ } ist dann
y − x ≤ y − yM + xM − x ≤ |y − yM + xM − x|
≤ |y − yM | + |xM − x| < ε/2 + ε/2 = ε ,
und dies zeigt, dass y − x < ε für alle ε > 0. Damit ist y − x ≤ 0, d.h. y ≤ x.
Wichtiger Spezialfall von Satz 5.3: Ist {xn }n≥p eine konvergente Folge reeller
Zahlen mit xn ≥ 0 für alle n ≥ p, so ist limn→∞ xn ≥ 0 (da die Folge {yn }n≥p mit
yn = 0 für alle n ≥ p offensichtlich gegen 0 konvergiert).
Sei {xn }n≥p eine Folge aus K. Für m ≥ p wird die Teilmenge von K
{x ∈ K : es gibt n ≥ m, so dass x = xn }
kurz mit {xn : n ≥ m} bezeichnet. Die Folge {xn }n≥p heißt beschränkt, wenn
{xn : n ≥ p} eine beschränkte Teilmenge von K ist. Also ist {xn }n≥p beschränkt
genau dann, wenn es ein B ∈ R mit B ≥ 0 gibt, so dass |xn | ≤ B für alle n ≥ p.
Satz 5.4 Jede konvergente Folge aus K ist beschränkt.
Beweis Sei {xn }n≥p eine konvergente Folge mit Grenzwert x. Dann gibt es N ≥ p,
so dass |xn − x| < 1 für alle n ≥ N, und folglich ist |xn | ≤ 1 + |x| für alle n ≥ N.
Sei c = 1 + |x| + |xp | + |xp+1 | + · · · + |xN −1 |; dann ist |xn | ≤ c für alle n ≥ p und
damit ist die Folge {xn }n≥p beschränkt.
Sei {xn }n≥p eine konvergente Folge
aus K mit
|xn | ≤ c für alle n ≥ p. Dann folgt
aus Satz 5.2 und Satz 5.3, dass limn→∞ xn ≤ c.
Satz 5.5 Seien {xn }n≥p und {yn }n≥p zwei konvergente Folgen aus K.
(1) Dann konvergiert auch die Summenfolge {xn + yn }n≥p , und es gilt
lim (xn + yn ) = lim xn + lim yn .
n→∞
n→∞
n→∞
(2) Ebenso konvergiert die Produktfolge {xn yn }n≥p , und es gilt
lim xn yn = lim xn · lim yn .
n→∞
n→∞
n→∞
5 Folgen
33
Beweis Setze x = limn→∞ xn und y = limn→∞ yn .
(1) Sei ε > 0; dann gibt es N, N ′ ≥ p, so dass |xn − x| < ε/2 für alle n ≥ N und
|yn − y| < ε/2 für alle n ≥ N ′ . Sei M = max{N, N ′ }; für alle n ≥ M ist dann
|(xn + yn ) − (x + y)| = |(xn − x) + (yn − y)| ≤ |xn − x| + |yn − y| < ε/2 + ε/2 = ε
und dies zeigt, dass die Summenfolge {xn + yn }n≥p gegen x + y konvergiert.
(2) Nach Satz 5.4 ist die Folge {xn }n≥p beschränkt; es gibt also c > 0, so dass
|xn | ≤ c für alle n ≥ p. Setze b = c + |y| (und also ist b > 0). Sei ε > 0; dann gibt
es N, N ′ ≥ p, so dass |xn − x| < ε/b für alle n ≥ N und |yn − y| < ε/b für alle
n ≥ N ′ . Sei M = max{N, N ′ }; für alle n ≥ M ist dann
|xn yn − xy| = |xn (yn − y) + (xn − x)y|
≤ |xn (yn − y)| + |(xn − x)y| = |xn ||yn − y| + |y||xn − x|
≤ c|yn − y| + |y||xn − x| < cε/b + |y|ε/b = ε ,
und dies zeigt, dass die Produktfolge {xn yn }n≥p gegen xy konvergiert.
Lemma 5.3 Sei {xn }n≥p eine konvergente Folge aus K mit limn→∞ xn = x 6= 0.
Dann gibt es ein q ≥ p, so dass xn 6= 0 für alle n ≥ q.
Beweis Sei ε = |x|/2 (und damit ist ε > 0). Es gibt also q ≥ p, so dass |xn −x| < ε
für alle n ≥ q, und daraus folgt, dass
2ε = |x| = |x − xn + xn | ≤ |x − xn | + |xn | < ε + |xn |
und insbesondere ist |xn | > ε > 0 für alle q ≥ p.
Ist {xn }n≥p eine konvergente Folge reeller Zahlen mit limn→∞ xn = x, so zeigt der
Beweis für Lemma 5.3 tatsächlich folgendes: Ist x > 0 (bzw. ist x < 0), dann gibt
es ein q ≥ p, so dass xn > 0 für alle n ≥ q (bzw. so dass xn < 0 für alle n ≥ q).
Satz 5.6 Sei {xn }n≥p eine konvergente Folge aus K mit xn 6= 0 für alle n ≥ p
und limn→∞ xn 6= 0. Dann konvergiert die Inversefolge {x−1
n }n≥p , und
−1
lim x−1
.
n = lim xn
n→∞
n→∞
Beweis Sei x = limn→∞ xn . Wie im Beweis für Lemma 5.3 gibt es ein q ≥ p, so
dass |xn | ≥ |x|/2 für alle n ≥ q; setze b = 2/|x|2 . Sei nun ε > 0; dann gibt es
M ≥ p, so dass |xn − x| < ε/b für alle n ≥ M. Sei N = max{M, q}; für alle
n ≥ N ist dann
1
1 xn − x |xn − x|
2 1
≤
|xn − x| = b|xn − x| < bε/b = ε ,
− =
=
xn x
xn x
|xn ||x|
|x| |x|
5 Folgen
34
−1
und dies zeigt, dass die Inversefolge {x−1
konvergiert.
n }n≥p gegen x
Sei {xn }n≥p eine Folge aus K und sei nq < nq+1 < · · · eine aufsteigende Folge
natürlicher Zahlen mit p ≤ nq . Dann heißt die Folge {xnk }k≥q (d.h. die Folge
{yk }k≥q mit yk = xnk für alle k ≥ q) Teilfolge der Folge {xn }n≥p .
Bemerkung: Ist nq < nq+1 < · · · eine aufsteigende Folge natürlicher Zahlen mit
p ≤ nq , so ist nq+m ≥ p + m für alle m ∈ N.
Sei {xn }n≥p eine Folge und sei q ≥ p. Dann ist die Folge {xn }n≥q sowie jede ihrer
Teilfolgen eine Teilfolge von {xn }n≥p .
Satz 5.7 Sei {xn }n≥p eine konvergente Folge aus K mit limn→∞ xn = x. Dann
konvergiert jede Teilfolge – auch gegen x.
Beweis Sei {xnk }k≥q Teilfolge von {xn }n≥p und sei ε > 0. Da die Folge {xn }n≥p
gegen x konvergiert, gibt es dann ein M ≥ p, so dass |xn − x| < ε für alle n ≥ M.
Sei N = M − p + q; für jedes k ≥ N ist dann nk ≥ nN = nM −p+q ≥ M und damit
ist |xnk − x| < ε. Folglich konvergiert die Teilfolge {xnk }k≥q gegen x.
Eine Folge {xn }n≥p reeller Zahlen heißt monoton wachsend, falls xn ≤ xn+1 für
alle n ≥ p, streng monoton wachsend, falls xn < xn+1 für alle n ≥ p, monoton
fallend, falls xn+1 ≤ xn für alle n ≥ p, streng monoton fallend, falls xn+1 < xn für
alle n ≥ p und monoton, falls sie monoton wachsend oder monoton fallend ist.
Es ist klar, dass eine monoton wachsende (bzw. ein monoton fallende) Folge
{xn }n≥p reeller Zahlen genau dann beschränkt ist, wenn {xn : n ≥ p} nach oben
(bzw. nach unten) beschränkt ist.
Satz 5.8 Jede beschränkte monotone Folge {xn }n≥p reeller Zahlen konvergiert
mit dem Grenzwert sup({xn : n ≥ p}) (bzw. inf({xn : n ≥ p})), falls {xn }n≥p
monoton wachsend (bzw. monoton fallend) ist.
Beweis Sei {xn }n≥p eine beschränkte monoton wachsende Folge reeller Zahlen
und sei A = {xn : n ≥ p}. Dann ist A eine nichtleere nach oben beschränkte
Teilmenge von R und damit existiert das Supremum x = sup(A). Sei ε > 0; dann
gibt es y ∈ A mit y > x − ε, sonst wäre x − ε eine obere Schranke von A, es gibt
also N ≥ p mit xN = y > x − ε. Aber dann ist x − ε < xn ≤ xn ≤ x < x + ε
für alle n ≥ N, da die Folge {xn }n≥p monoton wachsend ist und x eine obere
Schranke von A ist. Mit anderen Worten: Für alle n ≥ N ist |xn − x| < ε,
und dies zeigt, dass die Folge {xn }n≥p gegen x konvergiert. Der Beweis für eine
beschränkte monoton fallende Folge geht natürlich analog.
5 Folgen
35
Ist {xn }n≥p eine nicht beschränkte monoton wachsende (bzw. monoton fallende)
Folge reeller Zahlen, so ist es nützlich limn→∞ xn = +∞ (bzw. limn→∞ xn = −∞)
zu setzen; nach Satz 5.8 gilt also
lim xn = sup({xn : n ≥ p})
n→∞
für jede monoton wachsende Folge {xn }n≥p und
lim xn = inf({xn : n ≥ p})
n→∞
für jede monoton fallende Folge {xn }n≥p reeller Zahlen.
Satz 5.9 Jede Folge reeller Zahlen besitzt eine monotone Teilfolge.
Beweis Sei {xn }n≥p eine Folge reeller Zahlen; in diesem Beweis wird ein Index
m ≥ p kritisch genannt, wenn xn ≤ xm für alle p ≤ n ≤ m und xn < xm für alle
n > m. Es ist ist klar, dass es höchstens einen Index mit diesen Eigenschaften
gibt, im allgemeinen aber braucht er nicht zu existieren. Das folgende Lemma
wird benötigt:
Lemma 5.4 (1) Eine Folge reeller Zahlen, die keinen kritischen Index hat, besitzt eine monoton wachsende Teilfolge.
(2) Sei {xn }n≥p ein Folge reeller Zahlen und sei q ≥ p. Besitzt die Folge {xn }n≥q
eine monoton wachsende Teilfolge, so besitzt die Folge {xn }n≥p ebenso eine.
(3) Sei {xn }n≥p ein Folge reeller Zahlen und sei q ≥ p. Hat die Folge {xn }n≥q
keinen kritischen Index, so besitzt die Folge {xn }n≥p eine monoton wachsende
Teilfolge.
Beweis (1) ist eine Übung, (2) ist klar, und (3) folgt aus (1) und (2).
Nun zum Beweis für Satz 5.9: Sei {xn }n≥p ein Folge reeller Zahlen und nehme
an, dass diese Folge keine monoton wachsende Teilfolge besitzt. Es wird gezeigt,
dass dann {xn }n≥p eine streng monoton fallende Teilfolge besitzt.
Nach Lemma 5.3 (3) hat die Folge {xn }n≥q einen kritischen Index für jedes q ≥ p.
Folglich gibt es eine aufsteigende Folge n0 < n1 < · · · natürlicher Zahlen mit
n0 dem kritischen Index der Folge {xn }n≥p und mit nk+1 dem kritischen Index
der Folge {xn }n≥nk +1 für jedes k ∈ N. Aber xnk+1 < xnk für jedes k ∈ N (da
nk+1 > nk ), und damit ist {xnk }k≥0 eine streng monoton fallende Teilfolge von
{xn }n≥p . Dies zeigt: Entweder besitzt {xn }n≥p eine monoton wachsende oder eine
streng monoton fallende Teilfolge; insbesondere besitzt {xn }n≥p eine monotone
Teilfolge.
5 Folgen
36
Lemma 5.5 Jede beschränkte Folge reeller Zahlen besitzt eine konvergente Teilfolge.
Beweis Jede Folge reeller Zahlen besitzt eine monotone Teilfolge (Satz 5.9). Ist
die Folge beschränkt, so ist auch diese Teilfolge beschränkt und damit konvergiert
sie nach Satz 5.8.
Satz 5.10 (Bolzano-Weierstraß) Jede beschränkte Folge aus K besitzt eine
konvergente Teilfolge.
Beweis Nach Lemma 5.4 bleibt nur der Fall mit K = C; sei also {zn }n≥p eine
beschränkte Folge komplexer Zahlen. Für jedes n ≥ p sei xn = Re zn ; nach
Satz 4.1 (2) ist {xn }n≥p eine beschränkte Folge reeller Zahlen, die dann nach
Lemma 5.4 eine konvergente Teilfolge {xnk }k≥q besitzt. Setze yk = Im znk für
jedes k ≥ q; nach Satz 4.1 (2) ist {yk }k≥q eine beschränkte Folge reeller Zahlen,
die dann wieder nach Lemma 5.4 eine konvergente Teilfolge {ykj }j≥r besitzt. Setze
mj = nkj für jedes j ≥ r; dann ist {xmj }j≥r eine Teilfolge von {xnk }k≥q und somit
konvergent. Nun ist ykj = Im zmj für jedes j ≥ r und folglich konvergieren die
Folgen {Re zmj }j≥r und {Im zmj }j≥r . Nach Satz 5.1 (1) konvergiert also die Folge
{zmj }j≥r , d.h. die Folge {zn }n≥p besitzt die konvergente Teilfolge {zmj }j≥r .
Eine Folge {xn }n≥p aus K heißt Cauchy-Folge, wenn es zu jedem ε > 0 ein N ≥ p
gibt, so dass |xm − xn | < ε für alle m, n ≥ N.
Lemma 5.6 Jede Cauchy-Folge aus K ist beschränkt.
Beweis (Dies ist sehr ähnlich zu dem Beweis für Satz 5.4) Sei {xn }n≥p eine
Cauchy-Folge. Dann gibt es N ≥ p, so dass |xm − xn | < 1 für alle m, n ≥ N, und
folglich ist |xn | ≤ 1 + |xN | für alle n ≥ N. Sei c = 1 + |xp | + · · · + |xN |; dann ist
|xn | ≤ c für alle n ≥ p und damit ist die Folge {xn }n≥p beschränkt.
Lemma 5.7 Besitzt eine Cauchy-Folge aus K eine konvergente Teilfolge, so ist
sie selbst konvergent.
Beweis Sei {xnk }k≥q eine Teilfolge einer Cauchy-Folge {xn }n≥p und nehme an,
dass {xnk }k≥q gegen x konvergiert. Sei ε > 0; dann gibt es N ≥ q, so dass
|xnk − x| < ε/2 für alle k ≥ N und N ′ ≥ p, so dass |xm − xn | < ε/2 für alle
m, n ≥ N ′ . Wähle r ≥ N, so dass nr ≥ N ′ und setze M = nr ; dann ist
|xn − x| = |xn − xM + xM − x| ≤ |xn − xM | + |xM − x|
= |xn − xM | + |xnr − x| < ε/2 + ε/2 = ε
für alle n ≥ M und dies zeigt, dass auch {xn }n≥p gegen x konvergiert.
5 Folgen
37
Satz 5.11 Eine Folge aus K konvergiert genau dann, wenn sie eine Cauchy-Folge
ist.
Beweis Sei {xn }n≥p eine konvergente Folge mit limn→∞ xn = x. Sei ε > 0; es gibt
also N ≥ p, so dass |xn − x| < ε/2 für alle n ≥ N. Für alle n, m ≥ N ist dann
|xm − xn | = |xm − x + x − xn | ≤ |xm − x| + |x − xn | < ε/2 + ε/2 = ε
und dies zeigt, dass {xn }n≥p eine Cauchy-Folge ist. Die Umkehrung folgt direkt
aus Lemma 5.5, Lemma 5.6 und Satz 5.10.
Sei nun {xn }n≥p eine nach oben beschränkte Folge reeller Zahlen. Für n ≥ p sei
x↑n = sup({xm : m ≥ n}); folglich ist {x↑n }n≥p eine monoton fallende Folge reeller
Zahlen, da {xn : n ≥ m + 1} ⊂ {xn : n ≥ m} für jedes m ≥ p. Setze
x↑ = lim x↑n ,
n→∞
somit ist x↑ ∈ R ∪ {−∞}. Diese ‘Zahl’ x↑ heißt Limes superior der Folge {xn }n≥p
und wird mit lim supn→∞ xn bezeichnet. Ist die Folge nicht nach oben beschränkt,
so setzt man lim supn→∞ xn = +∞.
Analog wird der Limes inferior definiert. Zunächst sei {xn }n≥p eine nach unten
beschränkte Folge reeller Zahlen. Für jedes n ≥ p sei x↓n = inf({xm : m ≥ n});
also ist {x↓n }n≥p eine monoton wachsende Folge reeller Zahlen, da für jedes m ≥ p
gilt {xn : n ≥ m} ⊂ {xn : n ≥ m + 1}. Setze
x↓ = lim x↓n ,
n→∞
somit ist x↓ ∈ R ∪ {+∞}. Diese ‘Zahl’ x↓ heißt Limes inferior der Folge {xn }n≥p
und wird mit lim inf n→∞ xn bezeichnet. Ist die Folge nicht nach unten beschränkt,
so setzt man lim inf n→∞ xn = −∞.
Satz 5.12 Für jede Folge {xn }n≥p reeller Zahlen gilt lim inf xn ≤ lim sup xn .
n→∞
n→∞
Beweis Dies ist klar, wenn lim inf n→∞ xn = −∞ oder lim supn→∞ xn = +∞.
Es kann also angenommen werden, dass die Folge {xn }n≥p beschränkt ist. Aber
nach Lemma 3.7 ist x↓n = inf({xm : m ≥ n}) ≤ sup({xm : m ≥ n}) = x↑n für
jedes n ≥ p. Damit ist die monoton wachsende Folge {x↓n }n≥p nach oben und die
monoton fallende Folge {x↑n }n≥p nach unten beschränkt, und folglich ist
lim inf xn = lim x↓n ≤ lim x↑n = lim sup xn .
n→∞
n→∞
n→∞
n→∞
5 Folgen
38
Lemma 5.8 Sei {xn }n≥p eine Folge reeller Zahlen und sei x ∈ R.
(1) Es gilt lim supn→∞ xn ≤ x genau dann, wenn die Menge {n ≥ p : xn > x + ε}
endlich ist für jedes ε > 0.
(2) Es gilt lim supn→∞ xn ≥ x genau dann, wenn die Menge {n ≥ p : xn > x − ε}
unendlich ist für jedes ε > 0.
(3) Es gilt lim inf n→∞ xn ≥ x genau dann, wenn die Menge {n ≥ p : xn < x − ε}
endlich ist für jedes ε > 0.
(4) Es gilt lim inf n→∞ xn ≤ x genau dann, wenn die Menge {n ≥ p : xn < x + ε}
unendlich ist für jedes ε > 0.
Beweis (1) Dies ist trivial richtig, wenn die Folge {xn }n≥p nicht nach oben beschränkt ist, da in diesem Fall die Menge {n ≥ p : xn > y} unendlich ist für
jedes y ∈ R und lim supn→∞ xn = +∞. Es kann also angenommen werden, dass
{xn }n≥p nach oben beschränkt ist. In diesem Fall gilt lim supn→∞ xn ≤ x genau
dann, wenn es zu jedem ε > 0 ein n ≥ p mit sup({xm : m ≥ n}) ≤ x + ε gibt,
(da die Folge {x↑n }n≥p monoton fallend ist). Aber sup({xm : m ≥ n}) ≤ x + ε
gilt genau dann, wenn xm ≤ x + ε für alle m ≥ n. Daraus ergibt sich, dass
lim supn→∞ xn ≤ x genau dann gilt, wenn es zu jedem ε > 0 ein n ≥ p gibt mit
xm ≤ x + ε für alle m ≥ n, d.h. genau dann, wenn für jedes ε > 0 die Menge
{n ≥ p : xn > x + ε} endlich ist.
(2) Es kann wieder angenommen werden, dass {xn }n≥p nach oben beschränkt ist.
In diesem Fall gilt lim supn→∞ xn ≥ x genau dann, wenn sup({xm : m ≥ n}) ≥ x
für alle n ≥ p und nach Lemma 3.5 (2) gilt dies genau dann, wenn es zu jedem
ε > 0 und jedem n ≥ p ein m ≥ n mit xm > x − ε gibt, d.h. genau dann, wenn
für jedes ε > 0 die Menge {n ≥ p : xn > x − ε} unendlich ist.
(3) und (4): Wie (1) und (2).
Satz 5.13 Sei {xn }n≥p eine Folge reeller Zahlen und sei x ∈ R.
(1) Es gilt lim supn→∞ xn = x genau dann, wenn die Menge {n ≥ p : xn > x + ε}
endlich und die Menge {n ≥ p : xn > x − ε} unendlich ist für jedes ε > 0.
(2) Es gilt lim inf n→∞ xn = x genau dann, wenn die Menge {n ≥ p : xn < x − ε}
endlich und die Menge {n ≥ p : xn < x + ε} unendlich ist für jedes ε > 0.
Beweis Dies folgt unmittelbar aus Lemma 5.7.
Satz 5.14 Eine Folge {xn }n≥p reeller Zahlen konvergiert gegen eine Zahl x ∈ R
genau dann, wenn lim inf xn = x = lim sup xn .
n→∞
Beweis Übung.
n→∞
6
Unendliche Reihen
Sei {xn }n≥p eine Folge aus K und für jedes n ≥ p sei
sn =
n
X
xk
k=p
(= xp + xp+1 + · · · + xn ) .
Dann heißt die Folge {sn }n≥p dieser P
Partialsummen (unendliche) Reihe mit den
bezeichnet. Konvergiert die Reihe
Gliedern xn , n ≥ p, und wird mit ∞
n=p xn P
P
∞
∞
x
,
so
wird
ihr
Grenzwert
ebenfalls
mit
n=p xn bezeichnet und heißt dann
n=p n
Summe der Reihe.
P
n
Wichtiges Beispiel: Die geometrische Reihe ∞
n=0 x konvergiert mit der Summe
∞
X
n=0
xn = (1 − x)−1
P
für jedes x ∈ K mit |x| < 1. (Sei x 6= 1 fest und für jedes n ≥ 0 sei sn = nk=0 xk ;
dann ist sn = (1 − x)−1 (1 − xn+1 ) und damit |sn − (1 − x)−1 | = |1 − x|−1 |x|n+1 .
Daraus folgt, dass
{sn }n≥0 gegen (1 − x)−1 konvergiert, falls |x| < 1.
P∞die Folge
D.h.: die Reihe n=0 xn konvergiert mit der Summe (1 − x)−1 , wenn |x| < 1.)
Lemma 6.1
und sei q ≥ p. Dann konvergiert
P∞Sei {xn }n≥p eine Folge aus KP
∞
die Reihe
Konvergieren
n=p xn genau, wenn die Reihe
n=q xn konvergiert.
P∞
P
∞
x
=
x̄
+
diese Reihen, so gilt für ihre Summen, dass
n=q xn , wobei
n=p n
x̄ = xp + xp+1 + · · · + xq−1 .
P
P
Beweis Für jedes n ≥ p sei sn = nk=p xk und für jedes n ≥ q sei s′n = nk=q xk .
Dann gilt sn = x̄+s′n für jedes n ≥ q, und daraus folgt, dass die Folge {sn }n≥q genau dann konvergiert, wenn die Folge {s′n }n≥q konvergiert. Aber nach Lemma 5.1
konvergiert die Folge
P∞die Folge {sn }n≥p konvergiert.
P∞{sn }n≥q genau dann, wenn
Damit konvergiert n=p xn genau dann, wenn n=q xn konvergiert. Konvergieren
diese Reihen, so ergibt sich aus Lemma 5.1, dass
∞
X
xn = lim sn = x̄ + lim s′n = x̄ +
n→∞
n=p
n→∞
∞
X
xn .
n=q
Lemma
6.2 Ist {zn }n≥p eine Folge komplexer Zahlen,
P∞
P∞ so konvergiert
P∞die Reihe
n=p zn genau dann, wenn die (reellen) Reihen
n=p (Re zn ) und
n=p (Im zn )
konvergieren, und in diesem Fall ist
∞
X
n=p
zn =
∞
X
(Re zn ) + i
n=p
∞
X
n=p
39
(Im zn ) .
6 Unendliche Reihen
Beweis Setze sn =
n ≥ p. Dann gilt
sn =
n
X
k=p
zk =
n
X
40
Pn
k=p zk , tn =
Pn
k=p (Re zk ) und un =
(Re zk ) + i(Im zk ) =
k=p
n
X
(Re zk ) + i
k=p
Pn
n
X
k=p (Im zk )
für jedes
(Im zk ) = tn + iun ,
k=p
d.h., tn =P
Re sn und un = Im sn . Daraus ergibt sich nach Satz
P∞ 5.1 (1), dass
∞
z
genau
dann
konvergiert,
wenn
die
Reihen
die
Reihe
n=p (Re zn ) und
n=p n
P∞
n=p (Im zn ) konvergieren. Außerdem gilt in diesem Fall, dass
∞
X
n=p
∞
∞
X
X
zn = lim sn = lim tn + i lim un =
(Re zn ) + i
(Im zn ) .
n→∞
n→∞
n→∞
n=p
n=p
Satz 6.1 Sei {xn }n≥p eine P
Folge reeller Zahlen mit xn ≥ 0 für alle n ≥ p.
Dann konvergiert die Reihe ∞
n=p xn genau, wenn die Folge der Partialsummen
nach
Pn oben beschränkt ist, d.h., genau dann, wenn es ein M ≥ 0 gibt, so dass
k=p xk ≤ M für alle n ≥ p.
Beweis Für jedes n ≥ p sei sn =
sn+1 =
n+1
X
k=p
Pn
k=p
xk . Dann ist
xk = xn+1 +
n
X
k=p
xk ≥
n
X
xk = sn
k=p
für jedes n ≥ p, die Folge {sn }n≥p ist also monoton wachsend. Daraus ergibt
sich nach Satz 5.4 und Satz 5.8, dass die Folge {sn }n≥p genau dann konvergiert,
wenn sie nach oben beschränkt ist, (da eine monoton wachsende Folge genau
dann beschränkt
P∞ ist, wenn sie nach oben beschränkt ist). Mit anderen Worten:
Die Reihe n=p xn konvergiert genau dann, wenn es ein M ≥ 0 gibt, so dass
P
n
k=p xk ≤ M für alle n ≥ p.
P∞
nicht, da für jedes
Nach Satz 6.1 konvergiert die harmonische Reihe
n=1 1/n
P∞
P2p
p ≥ 0 gilt n=1 1/n ≥ p/2. Dagegen konvergiert die Reihe n=1 1/n2 , da
n
n
n X
X
X
1
1
1
1
1
= 1+ 1−
≤2
≤1+
=1+
−
k2
k(k − 1)
k−1 k
n
k=1
k=2
k=2
für alle n > 1. Im Folgenden sei {xn }n≥p eine Folge aus K.
Satz
P∞ 6.2 (Das Cauchysche Konvergenz-Kriterium) Die unendliche Reihe
xn konvergiert genau dann, wenn es zu jedem ε > 0 ein N ≥ p gibt, so
n=p P
dass | nk=m xk | < ε für alle n ≥ m ≥ N.
6 Unendliche Reihen
41
Pn
Beweis
Für
jedes
n
≥
p
sei
s
=
n
k=p xk . Nehme zunächst an, dass die Reihe
P∞
x
konvergiert.
Dann
konvergiert
die Folge {sn }n≥p und nach Satz 5.11
n=p n
ist also {sn }n≥p eine Cauchy-Folge. Sei ε > 0; dann gibt es M ≥ p, so dass
|sn − sm | < ε für alle n > m ≥ M. Setze N =
PM + 1; für alle n ≥ m ≥ N ist
n > m − 1 ≥ M und daraus ergibt sich, dass | nk=m xk | = |sn − sm−1 | < ε.
Nehme umgekehrt
Pnan, dass diese Bedingung erfüllt ist. Sei ε > 0; dann gibt es
N ≥ p, so dass
P | k=m xk | < ε für alle n ≥ m ≥ N. Für alle n > m ≥ N ist dann
|sn − sm | = nk=m+1 xk < ε,P
und dies zeigt, dass {sn }n≥p eine Cauchy-Folge ist.
Damit konvergiert die Reihe ∞
n=p xn nach Satz 5.11.
Satz 6.3 Für jede konvergente Reihe
gegen 0.
P∞
n=p
xn konvergiert die Folge {xn }n≥p
P
Beweis Sei ε > 0; nach Satz 6.2 gibt es dann N ≥ p, so dass | nk=m xk | < ε für
alle n ≥ m ≥ N. Daraus ergibt sich (mit m = n), dass |xn | < ε für alle n ≥ N.
Dies zeigt, dass die Folge {xn }n≥p gegen 0 konvergiert.
Satz 6.4 Sei {cn }n≥p P
eine Folge reeller Zahlen mit |xn | ≤ cn P
für alle n ≥ p.
∞
Konvergiert die Reihe n=p cn (in R), so konvergiert die Reihe ∞
n=p xn und es
P
P
∞
∞
gilt n=p xn ≤ n=p cn .
P
P∞
P∞
∞
Insbesondere konvergiert
n=p xn mit n=p xn ≤
n=p |xn |, falls die Reihe
P∞
n=p |xn | in R konvergiert.
P
P
BeweisPFür jedes n ≥ p sei sn = nk=p xk und s∗n = nk=p ck . Sei ε > 0; da die
∗
Reihe ∞
n=p cn konvergiert (d.h. die Folge {sn }n≥p konvergiert), ist nach Satz 5.11
∗
{sn }n≥p eine Cauchy-Folge, und folglich gibt es N ≥ p, so dass |s∗n − s∗m | < ε für
alle n > m ≥ N. Für alle n > m ≥ N ist dann
n
n
n
X
X
X
ck = |s∗n − s∗m | < ε ,
|xk | ≤
xk ≤
|sn − sm | = k=m+1
k=m+1
k=m+1
und dies zeigt, dass die Folge {sn }n≥p eine Cauchy-Folge
und damit nach Satz 5.11
P
x
konvergiert.
Ferner ist
eine konvergente Folge ist, d.h. die Reihe ∞
n=p n
n
n
n
X
X
X
|sn | = xk ≤
|xk | ≤
ck = s∗n
k=p
k=p
k=p
für alle n ≥ p, und daraus folgt nach Satz 5.2 und Satz 5.3, dass
∞
∞
X
X
∗
cn .
xn = | lim sn | = lim |sn | ≤ lim sn =
n=p
n→∞
n→∞
n→∞
n=p
6 Unendliche Reihen
42
Die letzte Aussage folgt nun mit cn = |xn |.
P
P∞
Die Reihe ∞
n=p xn heißt absolut konvergent, falls die Reihe
n=p |xn | konvergiert
(in R). Die letzte Aussage in Satz 6.4 sagt also, dass eine absolut konvergente
Reihe auch im gewöhnlichen Sinn konvergiert.
P
n
Insbesondere konvergiert die geometrische Reihe ∞
n=0 x absolut für jedes x ∈ K
mit |x| < 1.
Lemma
q ≥ p. Dann konvergiert die
P 6.3 Sei {xn }n≥p eine Folge aus K und
Psei
∞
Reihe ∞
x
absolut
genau,
wenn
die
Reihe
n=p n
n=q xn absolut konvergiert.
Beweis Dies folgt unmittelbar aus Lemma 6.1.
Lemma
6.4 Ist {zn }n≥p eine Folge komplexer Zahlen,
P∞die Reihe
P∞ so konvergiert
P∞
(Re
z
)
und
z
absolut
genau
dann,
wenn
die
Reihen
n
n=p (Im zn )
n=p
n=p n
absolut konvergieren.
Beweis Dies folgt aus Satz 6.4, da | Re zn | ≤ |zn |, | Im zn | ≤ |zn | und
|zn | =
für alle n ≥ p.
p
| Re zn |2 + | Im zn |2 ≤ | Re zn | + | Im zn |
Nun werden einige Konvergenz-Kriterien für Reihen betrachtet. Im Folgenden sei
wieder {xn }n≥p eine Folge aus K.
Satz 6.5 (Majoranten-Kriterium) Sei {cn }n≥p eine Folge reeller Zahlen mit
|xn | ≤P
cn (und insbesondere ist dann cn ≥ 0) P
für alle n ≥ p. Konvergiert die
∞
c
(in
R),
so
konvergiert
die
Reihe
Reihe ∞
n=p n
n=p xn absolut und
∞
∞
X
X
xn ≤
cn .
n=p
n=p
Beweis Dies ist lediglich eine Umformulierung von Satz 6.4.
Satz 6.6 (Quotienten-Kriterium) Nehme an, dass xn 6= 0 für alle n ≥ p und
dass es ein θ ∈ R mit 0 < P
θ < 1 gibt, so dass |xn+1 |/|xn | ≤ θ für alle n ≥ p.
Dann konvergiert die Reihe ∞
n=p xn absolut.
6 Unendliche Reihen
43
Beweis Für alle n ≥ p ist |xn+1 | ≤ θ|xn |, und daraus ergibt sich mit vollständiger
n
Induktion, dass |xn | ≤ MθP
für alle n ≥ p, wobei M = θ−p |xp |. Nach P
Satz 6.5
∞
n
konvergiert also die Reihe P n=p xn absolut, da die geometrische Reihe ∞
n=0 θ
∞
n
und damit auch die Reihe n=p Mθ absolut konvergiert.
Satz 6.7 (Wurzelkriterium) Sei α = lim sup
(1) Ist α < 1, so
(2) Ist α > 1, so
p
n
|xn | (also gilt 0 ≤ α ≤
n→∞
P
konvergiert die Reihe ∞
n=p xn absolut.
P∞
divergiert die Reihe n=p xn (d.h. die Reihe konvergiert
+∞).
nicht).
Beweis (1) Wähle βpmit α < β < 1; da α < β, gibt es nach Lemma 5.7 (1)
n
ein q ≥ p, so dass P
|xn | ≤ β und damit |xn | ≤ β n für alle n ≥ q. Aber die
∞
geometrische Reihe n=qP
β n kovergiert, weil β < 1, und daraus ergibt sich nach
∞
Satz 6.5, dass
P∞ die Reihe n=q xn absolut konvergiert. Folglich konvergiert auch
die Reihe n=p xn absolut.
p
(2) Da α > 1, ist nach Lemma 5.7 (2) die Menge {n ≥ p : n |xn | ≥ 1} und damit
auch die Menge {n ≥ p : |xn | ≥ 1} unendlich, und folglich konvergiert die
P∞Folge
{xn }n≥p nicht gegen 0. Daraus ergibt sich nach Satz 6.3, dass die Reihe n=p xn
divergiert.
Satz 6.8 (Leibnizsches Kriterium) Sei {xn }n≥p eine monoton fallende Folge
reeller Zahlen, die gegen 0 konvergiert (insbesondere
xn ≥ 0 für alle
P ist also
n
(−1)
x
n ≥ p). Dann konvergiert die alternierende Reihe ∞
n.
n=p
Beweis Für n ≥ p sei sn =
Pn
k
k=p (−1) xk .
Für jedes n ≥ p ist dann
s2n+2 = s2n − x2n+1 + x2n+2 ≤ s2n und
s2n+3 = s2n+1 − x2n+2 + x2n+3 ≥ s2n+1 .
Damit ist die Folge {s2n }n≥p monoton fallend und die Folge {s2n+1 }n≥p monoton
wachsend. Ferner ergibt sich daraus, dass s2p+1 ≤ s2n+1 = s2n −x2n+1 ≤ s2n ≤ s2p ,
und insbesondere ist dann s2n ≥ s2p+1 und s2n+1 ≤ s2p für alle n ≥ p. Die
Folgen {s2n }n≥p und {s2n+1 }n≥p sind also monoton und beschränkt und daher
nach Satz 5.8 konvergent. Setze s = limn→∞ s2n und s′ = limn→∞ s2n+1 ; nach
Satz 5.5 (1) ist
s′ − s = lim s2n+1 − lim s2n = lim (s2n+1 − s2n ) = lim x2n+1 = 0 ,
n→∞
n→∞
n→∞
n→∞
d.h., s′ = s. Sei nun ε > 0; dann gibt es N, N ′ ≥ p, so dass |s − s2m | < ε für alle
m ≥ N und |s′ − s2m+1 | < ε für alle m ≥ N ′ ; setze M = max{2N, 2N ′ + 1}. Sei
6 Unendliche Reihen
44
n ≥ M; ist n gerade, so ist m = 2n mit m ≥ N, ist dagegen n ungerade, so ist
m = 2n + 1 mit m ≥ N ′ ; in beiden Fällen
P∞ist alson |s − sn | < ε. Dies zeigt, dass
die Folge {sn }n≥p und damit die Reihe
n=p (−1) xn konvergiert.
Nun muss das sogenannte Cauchy-Produkt von Reihen behandelt werden. Dies
wird zum Beweis der Funktionalgleichung der Exponentialfunktion gebraucht. Im
Folgenden seien {xn }n≥0 und {yn }n≥0 Folgen aus K.
P
P∞
Satz 6.9 Nehme an, dieP
Reihen ∞
absolut und
n=0 xn und
n=0 yn konvergieren
P∞
n
für jedes n ∈ N sei cn = k=0 xk yn−k . Dann konvergiert n=0 cn absolut und
∞
X
cn =
n=0
P∞
(Die Reihe
n=0 cn
∞
X
n=0
xn
∞
X
n=0
yn .
heißt das Cauchy-Produkt der Reihen
Beweis
P Für jedes n ∈ NPsetze sn =
s∗n = nk=0 |xk | und t∗n = nk=0 |yk |.
Pn
k=0
xk , tn =
P∞
n=0
Pn
xn und
k=0 yk ,
P∞
un =
n=0
yn .)
Pn
k=0 ck ,
Lemma 6.5 Seien m, n ≥ 1 mit n ≥ 2m. Dann gilt |un − sn tn | ≤ |s∗n t∗n − s∗m t∗m |.
Beweis Setze Qn = {(p, q) ∈ N2 : p ≤ n, q ≤ n}, Dn = {(p, q) ∈ N2 : p + q ≤ n}
für jedes n ∈ N. Dann sieht man leicht, dass
X
X
xp yq .
xp yq und sn tn =
un =
(p,q)∈Qn
(p,q)∈Dn
Seien m, n ≥ 1 mit n ≥ 2m. Dann gilt Qm ⊂ Dn ⊂ Qn und daraus folgt, dass
X
X
xp yq xp yq −
|un − sn tn | = (p,q)∈Qn
(p,q)∈Dn
=
X
(p,q)∈Qn \Dn
=
X
(p,q)∈Qn
Setze nun s =
∞
P
xp yq ≤
|xp ||yq | −
(p,q)∈Qn \Dn
X
(p,q)∈Qm
xn und t =
n=0
Lemma 6.6 Die Reihe
X
∞
P
|xp ||yq | ≤
|xp ||yq | =
s∗n t∗n
X
(p,q)∈Qn \Qm
|xp ||yq |
− s∗m t∗m = |s∗n t∗n − s∗m t∗m | .
yn .
n=0
∞
P
n=0
cn konvergiert mit der Summe st.
6 Unendliche Reihen
45
P
P∞
Beweis Da die Reihen ∞
x
und
n
n=0
n=0 yn absolut konvergieren, konvergieren
die Folgen {s∗n }n≥0 und {t∗n }n≥0 . Damit konvergiert nach Satz 5.5 (2) auch die
Folge {s∗n t∗n }n≥0 und folglich ist nach Satz 5.11 {s∗n t∗n }n≥0 eine Cauchy-Folge. Sei
nun ε > 0; es gibt also ein N ∈ N, so dass |s∗n t∗n − s∗m t∗m | < ε für alle m, n ≥ N.
Nach Lemma 6.5 ist |un − sn tn | ≤ |s∗n t∗n − s∗N t∗N | < ε für alle n ≥ 2N, und dies
zeigt, dass limn→∞ (un − sn tn ) = 0. Aber s = limn→∞ sn und t = limn→∞ tn und
damit nach Satz 5.5 (2) auch st = limn→∞ sn tn , und daraus ergibt sich, dass die
Folge {un }n≥0 konvergiert und
lim un = lim (un − sn tn ) + lim sn tn = 0 + st = st .
n→∞
n→∞
n→∞
P∞
konvergiert mit der Summe st.
P
Nach Lemma 6.6
nur zu zeigen,
dass die Reihe ∞
n=0 cn absolut konvergiert.
P
Pbleibt
∞
∞
Da die Reihen n=0 |xn | und n=0 |yn | absolut konvergieren, kann Lemma
P∞ 6.6∗
auf diese Reihen angewendet
werden,
und
daraus
folgt,
dass
die
Reihe
n=0 cn
Pn
∗
konvergiert, wobei cn = k=0 |xk ||yn−k |. Aber für jedes n ≥ 0 gilt
Mit anderen Worten: Die Reihe
n=0 cn
n
n
X
X
|xk ||yn−k | = c∗
xk yn−k ≤
|cn | =
n
k=0
und damit konvergiert
∞
P
k=0
cn absolut nach Satz 6.5.
n=0
Als nächstes wird die Exponentialreihe behandelt.
Satz 6.10 Für jedes x ∈ K konvergiert die Reihe
∞
P
xn /n! absolut.
n=0
Beweis Sei x ∈ K fest und wähle p ∈ N mit p ≥ 2|x|. Für jedes n ≥ p ist dann
n+1 n
n
x
= |x| x ≤ 1 x (n + 1)! n + 1 n! 2 n! P
n
und daraus ergibt sich nach Satz 6.6 (mit θ = 1/2), dass die Reihe P∞
n=p x /n!
∞
n
absolut konvergiert. Nach Lemma 6.3 konvergiert dann die Reihe
n=0 x /n!
absolut.
P
P∞ n
n
Die Reihe ∞
n=0 x /n! wird Exponentialreihe genannt und die Summe
n=0 x /n!
mit exp(x) bezeichnet. Insbesondere ist exp(0) =
Die Zahl exp(1) wird meistens
P1.
∞
mit e bezeichnet (Eulersche Zahl ); es gilt e = n=0 1/n! = 2, 71828 . . ..
Da exp(x) für jedes x ∈ K erklärt ist, gibt es die Exponentialfunktion x 7→ exp(x)
als Abbildung von K nach K.
6 Unendliche Reihen
46
Satz 6.11 (Funktionalgleichung der Exponentialfunktion) Es gilt
exp(x + y) = exp(x) exp(y)
für alle x, y ∈ K.
n
Beweis Seien
yn = y n /n! und
n = x /n!, P
Pn x, y ∈ K fest und für jedes n ≥ 0 seiPx∞
konvergieren n=0 xn und ∞
sei cn = k=0 xk yn−k . Nach Satz 6.10 P
n=0 yn absolut
∞
und daraus folgt nach Satz 6.9, dass n=0 cn absolut konvergiert und
∞
X
∞
X
cn =
n=0
n=0
xn
∞
X
yn = exp(x) exp(y) .
n=0
Nach dem binomischen Lehrsatz gilt aber, dass
cn =
und damit ist
n
n
X
1 k
1
1 X 1
1
n!
x
y n−k =
xk y n−k
k!
(n
−
k)!
n!
k!
(n
−
k)!
k=0
k=0
n X
1
1
n k n−k
=
x y
= (x + y)n ,
n! k=0 k
n!
∞
P
n=0
cn =
∞
P
(x + y)n /n! = exp(x + y).
n=0
Mit vollständiger Induktion folgt unmittelbar aus Satz 6.11, dass
exp
n
X
k=1
xk =
n
Y
exp(xk )
k=1
für alle x1 , . . . , xn ∈ K, n ≥ 1. Das folgende Ergebnis beschäftigt sich mit der
Exponentialfunktion im Komplexen.
Satz 6.12 (1) Für alle z ∈ C ist exp(z) 6= 0 und exp(−z) = exp(z)−1 .
(2) Es gilt exp(z) = exp(z) für jedes z ∈ C.
(3) Für alle z, ξ ∈ C gilt | exp(z + ξ) − exp(z)| ≤ |ξ| exp(|ξ|) exp(|z|).
(4) Für alle z, ξ ∈ C mit ξ 6= 0 gilt
|ξ|
exp(z + ξ) − exp(z)
− exp(z) ≤
exp(|ξ|) exp(|z|) .
ξ
2
6 Unendliche Reihen
47
Beweis (1) Nach Satz 6.11 ist exp(z) exp(−z) = exp(z − z) = exp(0) = 1; damit
ist exp(z) 6= 0 und exp(−z) = exp(z)−1 .
P
P
(2) Für jedes n ≥ 0 sei sn = nk=0 z k /k! und s′n = nk=0 z k /k! und folglich ist
exp(z) = limn→∞ sn und exp(z) = limn→∞ s′n . Aber für jedes n ≥ 0 ist s′n = sn
und daraus ergibt sich nach Satz 5.1 (2), dass exp(z) = exp(z).
(3) und (4): Übungen.
Folgende Ergebnisse beschäftigen sich mit der Exponentialfunktion im Reellen.
Lemma 6.7 Für alle x ∈ R mit x > 0 gilt exp(x) ≥ 1 + x.
Beweis Sei x ∈ R mit x > 0; für jedes m ≥ 2 ist dann
m
m
X
X
1 n
1 n
x =1+x+
x ≥1+x,
n!
n!
n=0
n=2
Pm n
und damit ist nach Satz 5.3 exp(x) = lim
n=0 x /n! ≥ 1 + x.
m→∞
Satz 6.13 (1) exp(x) > 0 für alle x ∈ R.
(2) exp(x) > exp(y), falls x, y ∈ R mit x > y.
(3) exp(n) = en für alle n ∈ N.
(4) limx→∞ exp(x) = ∞: Zu jedem N > 0 gibt es ein M > 0, so dass exp(x) > N
für alle x ∈ R mit x > M.
(5) limx→−∞ exp(x) = 0: Zu jedem ε > 0 gibt es ein M > 0, so dass exp(x) < ε
für alle x ∈ R mit x < −M.
Beweis (1) Falls x ≥ 0, so ist nach Lemma 6.7 exp(x) ≥ 1 + x > 0. Ist dagegen
x < 0, so ist −x > 0 und damit exp(−x) ≥ 1; nach Satz 6.12 (1) ist dann auch
exp(x) = exp(−x)−1 > 0.
(2) Sei x > y; dann ist nach Satz 6.11 exp(x) = exp(y+x−y) = exp(y) exp(x−y).
Aber nach (1) ist exp(y) > 0 und nach Lemma 6.7 ist exp(x − y) ≥ 1 + x − y > 1.
Damit ist exp(x) > exp(y).
P
Q
Q
n
(3) Nach Satz 6.11 ist exp(n) = exp
1
= nk=1 exp(1) = nk=1 e = en .
k=1
(4) Sei N > 0; nach Lemma 6.7 ist e = exp(1) ≥ 2 > 1 und damit gibt es nach
Satz 3.6 (1) ein n ∈ N, so dass en > N. Daraus ergibt sich nach (2) und (3), dass
exp(x) > exp(n) = en > N für alle x ∈ R mit x > n.
(5) Sei ε > 0; nach (4) gibt es dann M > 0, so dass exp(y) > ε−1 für alle y > M,
und daraus folgt nach Satz 6.12 (1), dass exp(−y) = exp(y)−1 < (ε−1 )−1 = ε für
alle y > M, d.h., exp(x) < ε für alle x ∈ R mit x < −M.
7
Stetige Funktionen
Die Wörter Funktion und Abbildung sind Synonyme, wobei das Letztere hier
bevorzugt wird.
Sind X und Y Mengen, so wird die Menge aller Abbildungen von X nach Y mit
Abb(X, Y ) bezeichnet. (Oft wird diese Menge mit Y X bezeichnet.)
Sei nun X eine nichtleere Menge und K ein Körper. Für f, g ∈ Abb(X, K) und
λ ∈ K definiere Elemente f + g, f g und λf von Abb(X, K) durch
(f + g)(x) = f (x) + g(x), (f g)(x) = f (x) · g(x) und (λf )(x) = λf (x)
für jedes x ∈ X. Dies liefert dann die Verknüpfungen
+ : Abb(X, K) × Abb(X, K) → Abb(X, K) mit (f, g) 7→ f + g ,
× : Abb(X, K) × Abb(X, K) → Abb(X, K) mit (f, g) 7→ f g ,
· : K × Abb(X, K) → Abb(X, K) mit (λ, f ) 7→ λf .
Lemma 7.1 (1) Mit den Verknüpfungen + und · ist Abb(X, K) ein Vektorraum
über K. Die Nullabbildung 0 : X → K (mit 0(x) = 0 für alle x ∈ X) ist
die Null in Abb(X, K); zu jedem f ∈ Abb(X, K) ist −f ∈ Abb(X, K) durch
(−f )(x) = −f (x) für alle x ∈ X gegeben.
(2) Mit den Verknüpfungen + und × ist Abb(X, K) ein kommutativer Ring mit
Eins. Die Einsabbildung 1 : X → K (mit 1(x) = 1 für alle x ∈ X) ist die Eins
in Abb(X, K).
(3) In dem kommutativen Ring Abb(X, K) ist ein Element f invertierbar genau
dann, wenn f (x) 6= 0 für alle x ∈ X, und in diesem Fall ist die Inverse f −1 die
Abbildung, die durch f −1 (x) = (f (x))−1 für alle x ∈ X gegeben ist.
Beweis Dies ist klar.
Für den Rest des Kapitels sei K′ entweder R oder C und sei D stets eine nichtleere
Teilmenge von K′ . Abbildungen von D nach K werden hier untersucht. Es gibt
also eigentlich die vier verschiedenen Fälle:
(1) Reelle Abbildungen definiert auf einer Teilmenge von R.
(2) Reelle Abbildungen definiert auf einer Teilmenge von C.
(3) Komplexe Abbildungen definiert auf einer Teilmenge von R.
(4) Komplexe Abbildungen definiert auf einer Teilmenge von C.
In einem gewissen Sinne aber ist alles unter dem vierten Fall subsumiert: Jede
Abbildung von einer Menge X nach R kann auch als Abbildung von X nach C
angesehen werden; ferner ist jede Teilmenge E von R auch Teilmenge von C.
48
7 Stetige Funktionen
49
Sei f : D → K eine Abbildung. Dann heißt f an einer Stelle x ∈ D stetig, wenn
es zu jedem ε > 0 ein δ > 0 gibt, so dass |f (y) − f (x)| < ε für alle y ∈ D mit
|y − x| < δ.
Sei f : D → R eine Abbildung. Da f auch als Abbildung von D nach C angesehen
werden kann, gibt es zwei mögliche Stetigkeitsbegriffe (Stetigkeit mit K = R und
Stetigkeit mit K = C), die hier angewendet werden können, die aber übereinstimmen: Die Stetigkeit von g an einer Stelle x ∈ D hängt nicht davon ab, ob
man K = R oder K = C nimmt (da der Betrag | · | in R die Einschränkung vom
Betrag | · | in C ist).
Sei nun E eine nichtleere Teilmenge von R und g : E → K eine Abbildung. Da E
auch als Teilmenge von C angesehen werden kann, gibt es wieder zwei mögliche
Stetigkeitsbegriffe (Stetigkeit mit K′ = R und Stetigkeit mit K′ = C), die hier
angewendet werden kann. Wieder stimmen sie aber überein: Die Stetigkeit von g
an einer Stelle x ∈ E hängt nicht davon ab, ob man K′ = R oder K′ = C nimmt.
Eine Abbildung f : D → K heißt stetig, wenn sie an jeder Stelle x ∈ D stetig ist.
Sei idK : K → K die durch idK (x) = x definierte Identitätsabbildung, und für
jedes a ∈ K′ sei conaK : K → K′ die durch conaK (x) = a definierte konstante
Abbildung. Es ist klar, dass diese Abbildungen alle stetig sind.
Die Abbildung | · | : K → R ist stetig: Sei x ∈ K; zu jedem ε > 0 gilt ||y| − |x|| < ε
für alle y ∈ K mit |y − x| < ε (da ||y| − |x|| ≤ |y − x|), und dies zeigt, dass | · |
an der Stelle x stetig ist.
Satz 7.1 Die Exponentialfunktion exp : K → K ist stetig.
Beweis Sei z ∈ K und ε > 0; setze η = exp(−1 − |z|)ε und sei δ = min{η, 1}.
Für alle w ∈ K mit |w − z| < δ ist dann nach Satz 6.12 (3)
| exp(w) − exp(z)| ≤ |w − z| exp(|w − z|) exp(|z|)
≤ |w − z| exp(1 + |z|) < η exp(1 + |z|) = ε ,
und dies zeigt, dass exp an der Stelle z stetig ist.
Ist f : D → C, so gibt es dann die Abbildungen f : D → C, Re f : D → R und
Im f : D → R, die gegeben sind durch f (x) = f (x), (Re f )(x) = Re(f (x)) und
(Im f )(x) = Im(f (x)) für alle x ∈ D.
Satz 7.2 Sei f : D → C eine Abbildung und x ∈ D. Dann sind äquivalent:
(1) f ist an der Stelle x stetig.
(2) Re f und Im f sind beide an der Stelle x stetig.
(3) f ist an der Stelle x stetig.
7 Stetige Funktionen
50
Beweis Übung.
Lemma 7.2 Sei f : D → K eine Abbildung und E eine nichtleere Teilmenge von
D. Ist f an der Stelle x ∈ E stetig, so ist auch die Einschränkung fE von f auf
E. (Die Einschränkung fE : E → K ist die durch fE (x) = f (x) für alle x ∈ E
definierte Abbildung.)
Beweis Sei ε > 0; da f an der Stelle x stetig ist, gibt es ein δ > 0, so dass
|f (y) − f (x)| < ε für alle y ∈ D mit |y − x| < δ. Insbesondere ist dann
|fE (y) − fE (x)| = |f (y) − f (x)| < ε
für alle y ∈ E mit |y − x| < δ, und dies zeigt, dass fE an der Stelle x stetig ist.
Satz 7.3 Sei f : D → K eine Abbildung und x ∈ D. Dann sind äquivalent:
(1) f ist an der Stelle x stetig.
(2) Die Folge {f (xn )}n≥p konvergiert gegen f (x) für jede Folge {xn }n≥p aus D,
die gegen x konvergiert.
Beweis Nehme zunächst an, dass f an der Stelle x stetig ist, und sei {xn }n≥p eine
Folge aus D, die gegen x konvergiert. Sei ε > 0; dann gibt es ein δ > 0, so dass
|f (y) − f (x)| < ε für alle y ∈ D mit |y − x| < δ. Da {xn }n≥p gegen x konvergiert,
gibt es also ein N ≥ p, so dass |xn − x| < δ für alle n ≥ N. Daraus folgt, dass
|f (xn ) −f (x)| < ε für alle n ≥ N, und dies zeigt, dass die Folge {f (xn )}n≥p gegen
f (x) konvergiert.
Nehme umgekehrt an, dass f an der Stelle x nicht stetig ist. Dann gibt es ein
ε > 0, so dass zu jedem δ > 0 ein y ∈ D existiert mit |y − x| < δ aber mit
|f (y) − f (x)| ≥ ε. Insbesondere bedeutet dies, dass es für jedes n ≥ 1 ein xn ∈ D
gibt mit |xn − x| < n1 aber |f (xn ) − f (x)| ≥ ε. Dann ist {xn }n≥1 eine Folge aus
D, die offensichtlich gegen x konvergiert, aber die Folge {f (xn )}n≥1 kann nicht
gegen f (x) konvergieren, da |f (xn ) − f (x)| ≥ ε für alle n ≥ 1.
Lemma 7.3 Sei f : D → K eine Abbildung, die an der Stelle x ∈ D stetig ist.
Dann gibt es δ > 0 und c ≥ 0, so dass |f (y)| ≤ c für alle y ∈ D mit |y − x| < δ.
Beweis Da f an der Stelle x stetig ist, gibt es δ > 0, so dass |f (y) − f (x)| < 1
für alle y ∈ D mit |y − x| < δ. Sei c = 1 + |f (x)|; dann ist
|f (y)| = |f (y) − f (x) + f (x)| ≤ |f (y) − f (x)| + |f (x)| ≤ 1 + |f (x)| = c
für alle y ∈ D mit |y − x| < δ.
7 Stetige Funktionen
51
Satz 7.4 Seien f, g : D → K Abbildungen, die beide an der Stelle x ∈ D stetig
sind. Dann sind die Abbildungen f + g, f g und λf (für jedes λ ∈ K) auch an der
Stelle x stetig. Ist ferner f (y) 6= 0 für jedes y ∈ D, so ist die Abbildung f −1 an
der Stelle x stetig.
Beweis Dies folgt eigentlich unmittelbar aus Satz 7.3, Satz 5.5 und Satz 5.6.
Dennoch werden Beweise für diese Behauptungen gegeben, die die Definition von
Stetigkeit direkt verwenden.
Die Abbildung f + g ist an der Stelle x stetig: Sei ε > 0; dann gibt es δ1 > 0,
so dass |f (y) − f (x)| < ε/2 für alle y ∈ D mit |y − x| < δ1 , und genauso gibt
es δ2 > 0, so dass |g(y) − g(x)| < ε/2 für alle y ∈ D mit |y − x| < δ2 . Sei
δ = min{δ1 , δ2 }; für alle y ∈ D mit |y − x| < δ ist dann
|(f (y) + g(y)) − (f (x) + g(x))| = |(f (y) − f (x)) + (g(y) − g(x))|
≤ |f (y) − f (x)| + |g(y) − g(x)| < ε/2 + ε/2 = ε ,
und dies zeigt, dass f + g an der Stelle x stetig ist.
Die Abbildung f g ist an der Stelle x stetig: Nach Lemma 7.3 gibt es δ0 > 0 und
c ≥ 0, so dass |f (y)| ≤ c für alle y ∈ D mit |y − x| < δ0 ; wähle b > c + |g(x)|.
Sei ε > 0; dann gibt es δ1 > 0, so dass |f (y) − f (x)| < b−1 ε für alle y ∈ D mit
|y − x| < δ1 , und genauso gibt es δ2 > 0, so dass |g(y) − g(x)| < b−1 ε für alle
y ∈ D mit |y − x| < δ2 . Sei δ = min{δ0 , δ1 , δ2 }; dann ist
|f (y)g(y) − f (x)g(x)| = |f (y)g(y) − f (y)g(x) + f (y)g(x) − f (x)g(x)|
= f (y) g(y) − g(x) + f (y) − f (x) g(x)
≤ |f (y)||g(y) − g(x)| + |f (y) − f (x)||g(x)| ≤ cb−1 ε + b−1 ε|g(x)| < ε
für alle y ∈ D mit |y − x| < δ und dies zeigt, dass f g an der Stelle x stetig ist.
Für jedes λ ∈ R ist die Abbildung λf an der Stelle x stetig: Wähle b mit |λ| < b.
Sei ε > 0; dann gibt es δ > 0, so dass |f (y) − f (x)| < b−1 ε für alle y ∈ D mit
|y − x| < δ. Für alle y ∈ D mit |y − x| < δ ist dann
|λf (y) − λf (x)| = |λ||f (y) − f (x)| ≤ |λ|b−1 ε < ε ,
und dies zeigt, dass λf an der Stelle x stetig ist.
Schließlich nehme an, dass f (y) 6= 0 für alle y ∈ D. Dann ist die Abbildung f −1
an der Stelle x stetig: Setze η = |f (x)|/2. Zunächst gibt es ein δ0 > 0, so dass
|f (y)−f (x)| < η und damit auch |f (y)| ≥ |f (x)|−|f (y)−f (x)| > η für alle y ∈ D
mit |y − x| < δ0 . Sei nun ε > 0; dann gibt es δ1 > 0, so dass |f (y) − f (x)| < 2η 2 ε
für alle y ∈ D mit |y − x| < δ1 . Sei δ = min{δ0 , δ1 }; dann ist
−1
|f −1(y) − f −1 (x)| = |f (y)||f (x)| |f (y) − f (x)|
−1
−1
≤ 2η 2 |f (y) − f (x)| ≤ 2η 2 2η 2 ε = ε
für alle y ∈ D mit |y − x| < δ, und daher ist f −1 an der Stelle x stetig.
7 Stetige Funktionen
52
Satz 7.5 Sei E eine nichtleere Teilmenge von K und seien f : D → K und
g : E → K′′ Abbildungen mit f (D) ⊂ E, wobei K′′ auch entweder R oder C
ist. Ist f an der Stelle x ∈ D und g an der Stelle f (x) ∈ E stetig, so ist die
zusammengesetzte Abbildung g ◦ f : D → K′′ an der Stelle x stetig.
Beweis Setze z = f (x). Sei ε > 0; da g an der Stelle z stetig ist, gibt es η > 0, so
dass |g(w) − g(z)| < ε für alle w ∈ E mit |w − z| < η. Da nun f an der Stelle x
stetig ist, gibt es δ > 0, so dass |f (y) − f (x)| < η für alle y ∈ D mit |y − x| < δ.
Für alle y ∈ D mit |y − x| < δ ist dann |f (y) − z| = |f (y) − f (x)| < η, und
f (y) ∈ E. Damit ist |g(f (y)) − g(z)| < ε, d.h. |g(f (y)) − g(f (x))| < ε. Daraus
ergibt sich, dass g ◦ f an der Stelle x stetig ist.
Seien f, g : D → R Abbildungen; dann können Abbildungen max{f, g} : D → R
und min{f, g} : D → R definiert werden durch
max{f, g}(x) = max{f (x), g(x)} ,
min{f, g}(x) = min{f (x), g(x)} .
Sind f und g beide an der Stelle x ∈ D stetig, so sind auch max{f, g} und
min{f, g}. Dies folgt aus Satz 7.4 undSatz 7.5, da max{f, g} = 21 (f +g)+|f −g|
und min{f, g} = 12 (f + g) − |f − g| , und die Abbildung | · | : R → R stetig ist.
Für jedes x ∈ D, r > 0 sei BD (x, r) = {y ∈ D : |y − x| < r} (offener Ball in D
um x mit Radius r). Insbesondere ist BR (x, r) = (x − r, x + r) für alle x ∈ R,
r > 0.
Bemerkung: Ist D eine Teilmenge von R – und damit auch Teilmenge von C –,
dann hängt die Definition von BD (x, r) nicht davon ab, ob man K = R oder
K = C nimmt.
Eine Teilmenge U von D heißt offen in D (oder offene Teilmenge von D), wenn
es zu jedem x ∈ U ein ε > 0 gibt, so dass BD (x, ε) ⊂ U.
Man sieht leicht, dass die Intervalle (a, b), (−∞, b) und (a, +∞) offene Teilmengen
von R sind.
Lemma 7.4 Für jedes x ∈ K, r > 0 ist BK (x, r) eine offene Teilmenge von K.
Beweis Sei y ∈ BK (x, r); dann ist |y − x| < r und damit ist ε = r − |y − x| > 0.
Für alle z ∈ BK (y, ε) ist dann nach der Dreiecksungleichung
|z − x| = |z − y + y − x| ≤ |z − y| + |y − x| < ε + |y − x| = r ,
d.h. BK (y, ε) ⊂ BK (x, r) und dies zeigt, dass BK (x, r) offen in K ist.
Insbesondere ist U eine offene Teilmenge von R, wenn es zu jedem x ∈ U ein
ε > 0 gibt, so dass (x − ε, x + ε) ⊂ U.
7 Stetige Funktionen
53
Lemma 7.5 (1) Die leere Menge ∅ und die Menge D selbst sind offen in D.
(2) Ist {Uα }α∈A
S eine beliebige Familie von offenen Teilmengen von D, so ist ihre
Vereinigung α∈A Uα offen in D.
T
(3) Sind U1 , . . . , Un (mit n ≥ 1) offen in D, so ist ihr Durchschnitt nk=1 Uk
eine offene Teilmenge von D.
Beweis (1) Dies ist klar.
S
(2) Setze U = α∈A Uα , und sei x ∈ U. Dann ist x ∈ Uα für ein α ∈ A und
folglich gibt es ε > 0, so dass BD (x, ε) ⊂ Uα , da Uα offen in D ist. Damit ist
BD (x, ε) ⊂ U, und dies zeigt, dass U offen in D ist.
T
(3) Setze U = nk=1 Uk , und sei x ∈ U. Für jedes k gibt es dann εk > 0, so dass
BD (x, ε) ⊂ Uk da x ∈ Uk und
T Sei ε = min{εk : 1 ≤ k ≤ n}; also
T Uk offen in D ist.
ist ε > 0 und BD (x, ε) = nk=1 BD (x, εk ) ⊂ nk=1 Uk = U, und dies zeigt, dass U
offen in D ist.
Satz 7.6 Eine Abbildung f : D → K ist genau dann stetig, wenn für jede offene
Teilmenge U von K die Menge f −1 (U) offen in D ist.
Beweis Nehme zunächst an, dass f stetig ist. Sei U eine offene Teilmenge von
K und sei x ∈ f −1 (U). Dann ist f (x) ∈ U und folglich gibt es ε > 0, so dass
BK (f (x), ε) ⊂ U. Da aber f an der Stelle x stetig ist, gibt es δ > 0, so dass
|f (y) − f (x)| < ε für alle y ∈ D mit |y − x| < δ. Also ist BD (x, δ) ⊂ f −1 (U), und
dies zeigt, dass f −1 (U) offen in D ist.
Nehme umgekehrt an, dass für jede offene Teilmenge U von K die Menge f −1 (U)
offen in D ist. Sei x ∈ D und ε > 0. Nach Lemma 7.4 ist U = BK (f (x), ε) eine
offene Teilmenge von K und folglich ist f −1 (U) offen in D. Ferner ist x ∈ f −1 (U)
und damit gibt es δ > 0, so dass BD (x, δ) ⊂ f −1 (U). Für jedes y ∈ D mit
|y − x| < δ ist also f (y) ∈ U, d.h. |f (y) − f (x)| < ε. Dies zeigt, dass f an der
Stelle x stetig ist und daher, da x ∈ D beliebig war, dass f stetig ist.
Eine Teilmenge F von D heißt abgeschlossen in D (oder abgeschlossene Teilmenge
von D), wenn die Menge D \ F = {x ∈ D : x ∈
/ F } offen in D ist.
Die Intervalle [a, b], (−∞, b] und [a, +∞) sind abgeschlossene Teilmengen von R.
Lemma 7.6 (1) Die leere Menge ∅ und die Menge D selbst sind abgeschlossene
Teilmengen von D.
(2) Ist {Fα }α∈A eine beliebige
Familie von abgeschlossenen Teilmengen von D,
T
so ist ihr Durchschnitt α∈A Fα abgeschlossen in D.
(3) Sind F1 , . . . , Fn (mit n ≥ 1) abgeschlossen in D, so ist ihre Vereinigung
S
n
k=1 Fk eine abgeschlossene Teilmenge von D.
7 Stetige Funktionen
54
Beweis Dies folgt unmittelbar aus Lemma 7.5, da
D\
\
Fα =
α∈A
[
α∈A
(D \ Fα ) und D \
n
[
k=1
Fk =
n
\
(D \ Fk ) .
k=1
Eine Folge {xn }n≥p aus D heißt konvergent in D, wenn {xn }n≥p konvergiert und
x = lim xn ∈ D.
n→∞
Satz 7.7 Eine Teilmenge F von D ist genau dann abgeschlossen in D, wenn der
Grenzwert von jeder Folge aus F , die in D konvergent ist, auch in F liegt.
Beweis Nehme zunächst an, dass F eine abgeschlossene Teilmenge von D ist,
und sei {xn }n≥p eine Folge aus F , die in D konvergent ist. Setze x = limn→∞ xn ;
also ist x ∈ D. Sei ε > 0; dann gibt es ein N ≥ p, so dass |xn − x| < ε für alle
n ≥ N, d.h. xn ∈ BD (x, ε) für alle n ≥ N. Insbesondere ist BD (x, ε) ∩ F 6= ∅ für
jedes ε > 0. Wäre nun x ∈ D \ F , so gäbe es ein ε > 0 mit BD (x, ε) ⊂ D \ F und
daher mit BD (x, ε) ∩ F = ∅, da D \ F offen ist. Daraus ergibt sich, dass x ∈ F .
Nehme umgekehrt an, dass F nicht abgeschlossen in D ist; dann ist D \ F nicht
offen in D. Es gibt daher ein x ∈ D\F , so dass für jedes ε > 0 die Menge BD (x, ε)
keine Teilmenge von D \ F ist, oder, anders ausgedrückt: so dass für jedes ε > 0
ein y ∈ F mit |y − x| < ε existiert. Für jedes n ≥ 1 gibt es insbesondere also
ein xn ∈ F mit |xn − x| < 1/n und damit konvergiert die Folge {xn }n≥p gegen
x. Aber dann ist {xn }n≥1 eine Folge aus F , die konvergent in D ist, für die der
Grenzwert x nicht in F liegt.
Lemma 7.7 Sei F eine nichtleere abgeschlossene Teilmenge von R.
(1) Ist F nach oben beschränkt, so besitzt F ein Maximum: Es gibt v ∈ F , so
dass x ≤ v für alle x ∈ F .
(2) Ist F nach unten beschränkt, so besitzt F ein Minimum: Es gibt u ∈ F , so
dass u ≤ x für alle x ∈ F .
Beweis (1) Nach Satz 4.1 (1) besitzt F ein Supremum v und nach Lemma 4.1 (1)
besitzt F ein Maximum genau dann, wenn v ∈ F (und in diesem Fall ist v das
Maximum). Nehme an, dass v ∈
/ F . Dann liegt v in der offenen Teilmenge R \ F
von R und also gibt es ein ε > 0, so dass (v − ε, v + ε) ⊂ R \ F . Da v eine obere
Schranke von F ist, ist x ≤ v für jedes x ∈ F . Aber das Intervall (v − ε, v] enthält
kein Element von F und daraus ergibt sich, dass v − ε auch eine obere Schranke
von F ist. Damit ist v nicht die kleinste obere Schranke, und dieser Widerspruch
zeigt, dass v in F liegen muss.
(2) Analog zu (1).
7 Stetige Funktionen
55
Lemma 7.8 Sei f : D → R eine Abbildung, die an der Stelle x ∈ D stetig ist.
Ist f (x) > 0 (bzw. ist f (x) < 0), dann gibt es ein η > 0, so dass f (y) > 0 (bzw.
so dass f (y) < 0) für alle y ∈ D mit |y − x| < η.
Beweis (Dies ist schon im letzten Teil vom Beweis für Satz 7.4 enthalten.) Nehme
an, dass f (x) > 0; dann gibt es ein η > 0, so dass |f (y) − f (x)| < f (x)/2 und
damit auch f (y) = f (x) + f (y) − f (x) ≥ f (x) − |f (x) − f (y)| > f (x)/2 > 0 für
alle y ∈ D mit |y − x| < η. Der andere Fall (mit f (x) < 0) ist ähnlich.
Im Folgenden seien a, b ∈ R mit a < b.
Lemma 7.9 Sei f : [a, b] → R eine stetige Abbildung mit f (a) < 0 and f (b) > 0.
Dann gibt es c ∈ (a, b) mit f (c) = 0.
Beweis Sei A = {x ∈ [a, b] : f (x) < 0}. Dann ist a ∈ A und x ≤ b für alle x ∈ A,
d.h. A ist eine nichtleere nach oben beschränkte Teilmenge von R. Also existiert
das Supremum c = sup(A).
Nehme an, dass f (c) < 0; dann ist c 6= b und nach Lemma 7.8 gibt es ein η > 0,
so dass f (y) < 0 für alle y ∈ [a, b] mit |y − c| < η. Insbesondere existiert ein
x ∈ (c, b) mit f (x) < 0, und dann wäre aber c keine obere Schranke von A.
Nehme nun an, dass f (c) > 0; hier ist c 6= a und nach Lemma 7.8 gibt es ein
η > 0, so dass f (y) > 0 für alle y ∈ [a, b] mit |y − c| < η. Aber dann ist jedes
x ∈ (c − η, c) ∩ [a, b] eine obere Schranke von A, und damit wäre c nicht die
kleinste obere Schranke.
Daraus ergibt sich, dass f (c) = 0 (und damit auch, dass c ∈ (a, b)).
Satz 7.8 (Zwischenwertsatz) Sei f : [a, b] → R eine stetige Abbildung und sei
z eine reelle Zahl zwischen f (a) und f (b). Dann gibt es c ∈ [a, b] mit f (c) = z.
Beweis Ist z = f (a) (bzw. ist z = f (b)), so kann man c = a (bzw. c = b)
nehmen. Es kann also angenommen werden, dass entweder f (a) < z < f (b) oder
f (b) < z < f (a).
Nehme zunächst an, dass f (a) < z < f (b) und sei g = f − z, d.h. g : [a, b] → R
ist definiert durch g(x) = f (x) − z für jedes x ∈ [a, b]. Nach Satz 7.4 ist g stetig
und g(a) = f (a) − z < 0, g(b) = f (b) − z > 0. Daraus folgt nach Lemma 7.9,
dass g(c) = 0 für ein c ∈ (a, b), und damit ist f (c) = g(c) + z = z.
Nehme nun an, dass f (b) < z < f (a) und sei hier g = z − f , d.h. g : [a, b] → R
ist definiert durch g(x) = z − f (x) für jedes x ∈ [a, b]. Nach Satz 7.4 ist g stetig
und g(a) = z − f (a) < 0, g(b) = z − f (b) > 0. Daraus folgt nach Lemma 7.9,
dass g(c) = 0 für ein c ∈ (a, b), und damit ist f (c) = z − g(c) = z.
7 Stetige Funktionen
56
Satz 7.9 Sei f : D → R eine stetige Abbildung. Für jedes Intervall I ⊂ R mit
I ⊂ D ist dann f (I) auch ein Intervall.
Beweis Seien a, b ∈ f (I) mit a < b. Dann gibt es α, β ∈ I mit a = f (α) und
b = f (β). Setze ᾰ = min{α, β} und β̆ = max{α, β}. Dann sind ᾰ, β̆ Elemente
von I mit ᾰ < β̆, und also ist J = [ᾰ, β̆] ⊂ I ⊂ D, da I ein Intervall ist. Nach
Lemma 7.2 ist die Einschränkung fJ von f auf J stetig. Sei nun c ∈ (a, b); dann
ist c eine Zahl zwischen fJ (ᾰ) und fJ (β̆), und daraus ergibt sich nach Satz 7.7,
dass es ein γ ∈ J ⊂ I gibt mit f (γ) = fJ (γ) = c. Damit ist c ∈ f (I), und dies
zeigt, dass f (I) ein Intervall ist.
Im Folgenden sei f : I → R eine stetige Abbildung, wobei I ein Intervall ist, das
mehr als einen Punkt enthält.
Lemma 7.10 Nehme an, es gibt a, b, c, d ∈ I mit a < b und c < d, so dass
f (a) < f (b) und f (c) > f (d). Dann ist f nicht injektiv.
Beweis Für jedes t ∈ [0, 1] liegt (1 − t)a + tc zwischen a und c und (1 − t)b + td
zwischen b und d; insbesondere liegen (1 − t)a + tc und (1 − t)b + td beide im
Intervall I. Folglich kann eine Abbildung h : [0, 1] → R definiert werden durch
h(t) = f ((1 − t)a + tc) − f ((1 − t)b + d)
für jedes t ∈ [0, 1]. Nach Satz 7.4 und Satz 7.5 ist h stetig, da die Abbildungen
t 7→ (1 − t)a + tc und t 7→ (1 − t)b + d (von [0, 1] nach R) stetig sind. Nun ist
h(0) = f (a) − f (b) < 0 und h(1) = f (c) − f (d) > 0, und daher gibt es nach
dem Zwischenwertsatz ein s ∈ [0, 1] mit h(s) = 0, d.h, mit f ((1 − s)a + sc) =
f ((1 − s)b + d). Aber (1 − s)a + sc 6= (1 − s)b + d, da
(1 − s)b + d − (1 − s)a + sc = (1 − s)(b − a) + s(d − c) ,
und dies zeigt, dass f nicht injektiv ist.
Satz 7.10 Die Abbildung f ist injektiv genau dann, wenn sie streng monoton ist.
Beweis Es ist klar, dass eine streng monotone Abbildung injektiv ist. Nehme nun
umgekehrt an, dass f nicht streng monoton ist. Dann gibt es a, b, c, d ∈ I mit
a < b und c < d, so dass f (a) ≤ f (b) und f (c) ≥ f (d). Ist f (a) = f (b) oder
f (c) = f (d), so ist f offensichtlich nicht injektiv. Ist andererseits f (a) < f (b) und
f (c) > f (d), so ergibt sich aus Lemma 7.10, dass f wieder nicht injektiv ist.
Nehme nun zusätzlich an, dass f injektiv ist (und damit streng monoton).
7 Stetige Funktionen
57
Lemma 7.11 Sei x ∈ I und ε > 0; dann gibt es ein δ > 0, so dass |y − x| < ε
für alle y ∈ I mit |f (y) − f (x)| < δ.
Beweis Nehme zunächst an, dass x kein Endpunkt des Intervalls I ist. Dann gibt
es ein η > 0 mit η ≤ ε, so dass die Punkte x − η und x + η beide in I liegen. Setze
δ = min{|f (x) − f (x − η)|, |f (x) − f (x + η)|}; also ist δ > 0, da f streng monoton
ist. Sei y ∈ I mit |f (y)−f (x)| < δ; dann liegt f (y) im Intervall (f (x)−δ, f (x)+δ)
und damit zwischen f (x−η) und f (x+ η). Da f streng monoton ist, folgt daraus,
dass y ∈ (x − η, x + η) und daher ist |y − x| < ε.
Nehme nun an, dass x Endpunkt des Intervalls I ist und ohne Beschränkung der
Allgemeinheit sei x der linke Endpunkt von I. Da I mehr als einen Punkt enthält,
gibt es ein η > 0 mit η ≤ ε, so dass x + η ∈ I. Setze hier δ = |f (x) − f (x + η)|;
also ist δ > 0, da f streng monoton ist. Wie im anderen Fall ist wieder |y − x| < ε
für alle y ∈ I mit |f (y) − f (x)| < δ.
Setze nun J = f (I); nach Satz 7.9 ist J ein Intervall, und f bildet das Intervall
I bijektiv auf J ab. Ist f streng monoton wachsend, dann ist f −1 das auch: Sind
x, y ∈ J mit x < y, so sind f (f −1(x)) = x < y = f (f −1(y)) und daraus ergibt
sich, dass f −1 (x) < f −1 (y). Genauso ist f −1 streng monoton fallend, wenn f das
ist.
Satz 7.11 Die Umkehrabbildung f −1 : J → I ist stetig.
Beweis Sei x ∈ J und ε > 0; also ist f −1 (x) ∈ I und nach Lemma 7.11 gibt es
dann ein δ > 0, so dass |v − f −1 (x)| < ε für alle v ∈ I mit
|f (v) − x| = |f (v) − f (f −1 (x))| < δ .
Sei nun y ∈ J mit |y − x| < δ; dann gibt es ein eindeutiges v ∈ I mit f (v) = y.
Damit ist |f (v) − x| < δ und folglich ist |f −1 (y) − f −1 (x)| = |v − f −1 (x)| < ε.
Dies zeigt, dass f −1 an der Stelle x stetig ist.
Nach Satz 7.1 und Satz 6.13 (2) ist die Abbildung exp : R → R stetig und streng
monoton wachsend, und nach Satz 6.13 (4) und (5) ist exp(R) = (0, +∞). Die
Umkehrabbildung exp−1 : (0, +∞) → R heißt natürlicher Logarithmus und wird
mit log bezeichnet. Also ist log streng monoton wachsend und bildet das Intervall
(0, +∞) bijektiv auf R ab. Ferner ist nach Satz 7.11 die Abbildung log stetig.
Satz 7.12 Es gilt log(1) = 0 und für alle x, y ∈ (0, +∞)
log(xy) = log(x) + log(y) .
Beweis Da exp(0) = 1, ist log(1) = 0. Seien x, y ∈ (0, +∞); dann gibt es u, v ∈ R
mit x = exp(u) und y = exp(v), und damit ist nach Satz 6.11
log(xy) = log(exp(u) exp(v)) = log(exp(u + v)) = u + v = log(x) + log(y) .
8
Folgenkompaktheit
Eine Teilmenge F von K heißt folgenkompakt, wenn jede Folge aus F eine Teilfolge
besitzt, die in F konvergent ist. D.h.: Ist {xn }n≥p eine Folge aus F , so gibt es
eine Teilfolge {xnk }k≥q und x ∈ F , so dass x = lim xnk .
k→∞
Für eine Teilmenge F von R gibt es anscheinend zwei mögliche Definitionen
für die Folgenkompaktheit (mit K = R und mit K = C). Es gibt aber keinen
Unterschied: F ist folgenkompakt als Teilmenge von R genau dann, wenn sie
folgenkompakt als Teilmenge von C ist.
Lemma 8.1 Jede folgenkompakte Teilmenge von K ist beschränkt.
Beweis Übung.
Satz 8.1 Eine Teilmenge F von K ist folgenkompakt genau dann, wenn sie abgeschlossen und beschränkt ist.
Beweis Nehme zunächst an, dass F abgeschlossen und beschränkt ist. Sei {xn }n≥p
eine Folge aus F ; dann ist diese Folge auch beschränkt und damit besitzt sie nach
Satz 5.10 (Bolzano-Weierstraß) eine konvergente Teilfolge: Es gibt eine Teilfolge
{xnk }k≥q und x ∈ K, so dass x = limk→∞ xnk . Also ist {xnk }k≥q eine Folge aus F ,
die konvergent (d.h. konvergent in K) ist, und daraus folgt nach Satz 7.7, dass
x ∈ F , da F abgeschlossen ist. Dies zeigt, dass F folgenkompakt ist.
Nehme umgekehrt an, dass F folgenkompakt ist; nach Lemma 8.1 ist also F
beschränkt und es bleibt nur zu zeigen, dass F abgeschlossen ist. Sei {xn }n≥p
eine Folge aus F , die konvergiert. Da F folgenkompakt ist, gibt es eine Teilfolge
{xnk }k≥q und x ∈ F , so dass x = limk→∞ xnk und nach Satz 5.7 ist dann auch
x = limn→∞ xn . Daraus ergibt sich nach Satz 7.7, dass F abgeschlossen ist.
Sei a, b ∈ R mit a < b. Nach Satz 8.1 ist insbesondere das Intervall [a, b] eine
folgenkompakte Teilmenge von R. Im Folgenden sei D wieder eine nichtleere
Teilmenge von K′ , wobei K′ entweder R oder C ist.
Satz 8.2 Sei f : D → K eine stetige Abbildung und sei F eine folgenkompakte
Teilmenge von K′ mit F ⊂ D. Dann ist das Bild f (F ) eine folgenkompakte
Teilmenge von K.
Beweis Sei {yn }n≥p eine Folge aus f (F ); für jedes n ≥ p gibt es dann ein xn ∈ F
mit yn = f (xn ). Damit ist {xn }n≥p eine Folge aus der folgenkompakten Teilmenge
F ; es gibt also eine Teilfolge {xnk }k≥q und x ∈ F , so dass {xnk }k≥q gegen x
58
8 Folgenkompaktheit
59
konvergiert, und da f stetig ist, konvergiert nach Satz 7.3 {f (xnk )}k≥q gegen
f (x), d.h. {ynk )}k≥q konvergiert gegen das Element y = f (x) ∈ f (F ). Mit anderen
Worten: Die Folge {yn }n≥p besitzt eine Teilfolge, die in f (F ) konvergent ist, und
dies zeigt, dass f (F ) eine folgenkompakte Teilmenge von K ist.
Satz 8.3 (Satz von Minimum und Maximum) Sei f : D → R eine stetige
Abbildung und F eine nichtleere folgenkompakte Teilmenge von K′ mit F ⊂ D.
Dann gibt es u, v ∈ F , so dass f (u) ≤ f (x) ≤ f (v) für alle x ∈ F .
Beweis Nach Satz 8.2 ist f (F ) folgenkompakt und damit nach Satz 8.1 eine
nichtleere Teilmenge von R, die beschränkt und abgeschlossen ist. Daraus folgt
nach Lemma 7.9, dass f (F ) ein Minimum und ein Maximum besitzt: Es gibt
u′ , v ′ ∈ f (F ), so dass u′ ≤ y ≤ v ′ für alle y ∈ f (F ). Wähle u, v ∈ F mit
f (u) = u′ und f (v) = v ′ ; dann ist f (u) ≤ f (x) ≤ f (v) für alle x ∈ F .
Satz 8.4 Sei {Fn }n≥p eine Folge von nichtleeren abgeschlossenen Teilmengen von
K mit Fp beschränkt und T
Fn+1 ⊂ Fn für alle n ≥ p. Dann hat die Folge einen
nichtleeren Durchschnitt:
Fn 6= ∅.
n≥p
Beweis Für jedes n ≥ p wähle xn ∈ Fn . Dann ist {xn }n≥p eine Folge aus Fp
und nach Satz 8.1 ist Fp folgenkompakt. Es gibt also eine Teilfolge {xnk }k≥q und
x ∈ Fp , so dass x = limk→∞ xnk . Nun ist x ∈ Fn für jedes n ≥ p: Sei n ≥ p; dann
gibt es m ≥ q mit nm ≥ n und daher auch nk ≥ n für alle k ≥ m; folglich ist
xnk ∈ Fnk ⊂ Fn für alle k ≥ m, d.h. {xnk }k≥m ist eine Folge aus Fn . Aber nach
Lemma 5.1 konvergiert {xnk }k≥m gegen x, und daraus
ergibtTsich nach Satz 7.7,
T
dass x ∈ Fn . Da x ∈ Fn für jedes n ≥ p, ist x ∈
Fn , d.h.
Fn 6= ∅.
n≥p
n≥p
Beispiel: Für jedes n ≥ 0 sei En = [n, +∞); En ist eine T
nichtleere abgeschlossene
Teilmenge von R und En+1 ⊂ En für alle n ≥ 0. Aber n≥0 En = ∅. (Natürlich
ist hier E0 nicht beschränkt.)
Erinnerung: Eine Abbildung f : D → K ist stetig, wenn es zu jedem x ∈ D und
zu jedem ε > 0 ein δ > 0 gibt, so dass |f (y) − f (x)| < ε für alle y ∈ D mit
|y − x| < δ.
Eine Abbildung f : D → K heißt nun gleichmäßig stetig, wenn es zu jedem ε > 0
ein δ > 0 gibt, so dass |f (y) − f (x)| < ε für alle x, y ∈ D mit |y − x| < δ.
Insbesondere ist jede gleichmäßig stetige Abbildung stetig.
Beispiel: Sei h : (0, 1) → R die durch h(x) = 1/x gegebene Abbildung. Nach
Satz 7.4 ist h stetig, da h = (id(0,1) )−1 , aber h ist nicht gleichmäßig stetig. (Der
Beweis dafür ist eine Übung.)
8 Folgenkompaktheit
60
Satz 8.5 Ist die Menge D folgenkompakt, so ist jede stetige Abbildung f : D → K
gleichmäßig stetig.
Beweis Nehme an, dass f nicht gleichmäßig stetig ist. Dann gibt es ein ε > 0, für
das gilt: Zu jedem δ > 0 existieren x, y ∈ D mit |y −x| < δ aber |f (y)−f (x)| ≥ ε.
Zu jedem n ≥ 1 gibt es dann insbesondere xn , yn ∈ D mit |yn − xn | < 1/n, aber
mit |f (yn ) − f (xn )| ≥ ε. Nun ist {xn }n≥1 eine Folge aus der folgenkompakten
Teilmenge D, es gibt also eine Teilfolge {xnk }k≥q , die gegen ein Element x ∈ D
konvergiert. Da |yn −xn | < 1/n für alle n ≥ p, sieht man leicht, dass auch die Folge
{ynk }k≥q gegen x konvergiert. Aber f ist an der Stelle x stetig und daraus folgt
nach Satz 7.3, dass sowohl limk→∞ f (xnk ) = f (x) als auch limk→∞ f (ynk ) = f (x).
Dies steht nun im Widerspruch zu der Tatsache, dass |f (ynk ) − f (xnk )| ≥ ε für
alle k ≥ q. Daher muss f gleichmäßig stetig sein.
9
Trigonometrische Funktionen
Lemma 9.1 Es gilt |exp(ix)| = 1 für jedes x ∈ R.
Beweis Sei x ∈ R und setze z = exp(ix). Dann ist nach Satz 6.12 (1) und (2)
z = exp(ix) = exp(ix) = exp(−ix) = exp(ix)−1 = z −1
√
und damit ist zz = zz −1 = 1. Daraus folgt, dass |z| = zz = 1.
Sei cis : R → C die Abbildung, die definiert ist durch
cis(x) = exp(ix) .
Dann ist cis(0) = 1, |cis(x)| = 1 für alle x ∈ R und für x, y ∈ R ist nach Satz 6.11
cis(x + y) = cis(x) cis(y) .
Die Cosinus-Funktion cos : R → R und die Sinus-Funktion sin : R → R werden
nun definiert durch cos = Re cis und sin = Im cis. Diese Definitionen sind in der
Eulerschen Formel zusammengefasst: Es gilt
exp(ix) = cos(x) + i sin(x)
für alle x ∈ R.
Satz 9.1 (1) Für alle x ∈ R gilt
1
1
exp(ix) + exp(−ix) und sin(x) =
exp(ix) − exp(−ix) .
2
2i
2
(2) Für alle x ∈ R ist cos2 (x) + sin2 (x) = 1 (wobei cos2 (x) für cos(x) und
2
sin2 (x) für sin(x) geschrieben wird).
cos(x) =
(3) Es gilt cos(−x) = cos(x) und sin(−x) = − sin(x) für alle x ∈ R.
(4) cos(0) = 1 und sin(0) = 0.
Beweis (1) Für alle z ∈ C ist Re z = (z + z)/2 und Im z = (z − z)/2i.
(2) Für alle z ∈ C ist (Re z)2 + (Im z)2 = |z|2 und |exp(ix)| = 1 für jedes x ∈ R
nach Lemma 9.1.
(3) Für alle x ∈ R ist
cos(−x) + i sin(−x) = exp(−ix) = exp(ix)
= cos(x) + i sin(x) = cos(x) − i sin(x) ,
und damit ist cos(−x) = cos(x) und sin(−x) = − sin(x).
(4) Es gilt cos(0) + i sin(0) = exp(i0) = exp(0) = 1 = 1 + i0 und daraus folgt,
dass cos(0) = 1 und sin(0) = 0.
61
9 Trigonometrische Funktionen
62
Satz 9.2 Die Abbildung cis : R → C ist stetig und damit auch (nach Satz 7.2)
die Abbildungen cos : R → R und sin : R → R.
Beweis Sei f : C → C die durch f (z) = exp(iz) gegebene Abbildung. Dann ist
f die Zusammensetzung der Abbildungen h und exp, wobei h : C → C durch
h(z) = iz gegeben ist. Nun ist nach Satz 7.1 exp stetig und nach Satz 7.4 ist h
stetig und damit ist nach Satz 7.5 auch f stetig. Aber cis ist die Einschränkung
von f auf R und daraus folgt nach Lemma 7.3, dass cis stetig ist.
Satz 9.3 (Additionstheoreme) Für alle x, y ∈ R gilt
cos(x + y) = cos(x) cos(y) − sin(x) sin(y) ,
sin(x + y) = sin(x) cos(y) + cos(x) sin(y) .
Beweis Für alle x, y ∈ R gilt nach Satz 6.11
cos(x + y) + i sin(x + y) = exp(i(x + y)) = exp(ix + iy)
= exp(ix) exp(iy) = cos(x) + i sin(x) cos(y) + i sin(y)
= cos(x) cos(y) − sin(x) sin(y) + i sin(x) cos(y) + cos(x) sin(y) .
Nach Satz 9.1 (3) und Satz 9.3 gilt auch für alle x, y ∈ R
cos(x − y) = cos(x) cos(y) + sin(x) sin(y) ,
sin(x − y) = sin(x) cos(y) − cos(x) sin(y) .
Satz 9.4 Für alle x, y ∈ R gilt
x + y x − y
sin(x) − sin(y) = 2 cos
sin
,
x2 + y x2 − y sin
.
cos(x) − cos(y) = −2 sin
2
2
Beweis Setze u = (x + y)/2, v = (x − y)/2; also ist x = u + v und y = u − v,
und daraus folgt nach Satz 9.3, dass
sin(x) − sin(y) = sin(u + v) − sin(u − v)
= sin(u) cos(v) + cos(u) sin(v) + sin(u) cos(v) − cos(u) sin(v)
x + y x − y
= 2 sin(u) cos(v) = 2 cos
sin
.
2
2
Die andere Gleichung ist analog zu beweisen.
9 Trigonometrische Funktionen
63
Satz 9.5 Für jedes x ∈ R gilt
∞
X
∞
X
1
1
m 2m
cos(x) =
(−1) x
und sin(x) =
(−1)m x2m+1 .
(2m)!
(2m
+
1)!
m=0
m=0
In beiden Fällen konvergieren diese Reihen absolut.
Beweis Dies folgt unmittelbar aus Lemma 6.2 und Lemma 6.4, da
∞
X
1
cos(x) + i sin(x) = cis(x) = exp(ix) =
(ix)n
n!
n=0
und i4k = 1, i4k+1 = i, i4k+2 = −1 und i4k+3 = −i für alle k ∈ N.
Satz 9.5 sagt also, dass für jedes x ∈ R gilt:
x2 x4 x6
+
−
+··· ,
2!
4!
6!
x3 x5 x7
sin(x) = x −
+
−
+··· .
3!
5!
7!
cos(x) = 1 −
Lemma 9.2 Es gilt cos(x) ≤ 1 − x2 /2! + x4 /4! und sin(x) ≥ x − x3 /3! für jedes
x ∈ [0, 2]. Insbesondere ist cos(2) < 0 und sin(x) > 0 für alle x ∈ (0, 2].
Beweis Übung.
Lemma 9.3 Die Abbildung cos ist im Intervall [0, 2] streng monoton fallend.
Beweis Seien 0 ≤ y < x ≤ 2; dann folgt aus Lemma 9.2 und Satz 9.4, dass
x + y x − y cos(x) − cos(y) = −2 sin
sin
<0,
2
2
(x + y)/2 und (x − y)/2 beide im Intervall [0, 2] liegen.
Satz 9.6 Die Abbildung cos hat im Intervall [0, 2] genau eine Nullstelle: Es gibt
genau einen Punkt x ∈ [0, 2] mit cos(x) = 0.
Beweis Nach Satz 9.2 und Lemma 7.2 ist die Einschränkung von cos auf [0, 2]
stetig. Ferner ist cos(0) = 1 > 0 und nach Lemma 9.2 ist cos(2) < 0. Folglich gibt
es nach Satz 7.8 (Zwischenwertsatz) ein x ∈ (0, 2) mit cos(x) = 0. Eine weitere
Nullstelle von cos in [0, 2] kann es nicht geben, da nach Lemma 9.3 cos in diesem
Intervall streng monoton fallend ist.
Nun wird das Zweifache der eindeutigen Nullstelle von cos im Intervall [0, 2] mit
π
bezeichnet. Also ist 0 < π < 4 und π/2 ist die kleinste positive Nullstelle von cos.
9 Trigonometrische Funktionen
64
Lemma 9.4 Es gilt cis(π/2) = i.
Beweis Da cos(π/2) = 0, ist nach Satz 9.1 (3) sin2 (π/2) = 1. Aber π/2 < 2 und
nach Lemma 9.4 (2) ist sin > 0 im Intervall (0, 2]; damit ist sin(π/2) = 1. Folglich
ist cis(π/2) = cos(π/2) + i sin(π/2) = i.
Satz 9.7 (1) 2π ist die kleinste positive Zahl σ mit cis(σ) = 1.
(2) Für jedes x ∈ R und jedes n ∈ Z ist cis(x + 2πn) = cis(x) und damit auch
cos(x + 2πn) = cos(x) und sin(x + 2πn) = sin(x).
Beweis (1) Nach Satz 6.11 ist cis(2x) = cis(x + x) = cis(x) cis(x) = cis2 (x) für
jedes x ∈ R. Insbesondere ist nach Lemma 9.4 cis(π) = cis2 (π/2) = i2 = −1
und daher cis(2π) = cis2 (π) = (−1)2 = 1. Sei nun σ > 0 mit cis(σ) = 1; dann
ist cis4 (σ/4) = cis(σ/4 + σ/4 + σ/4 + σ/4) = cis(σ) = 1, daraus folgt, dass
cis(σ/4) ∈ {1, −1, i, −i}, und damit ist cos(σ/4) = Re cis(σ/4) ∈ {1, −1, 0}.
Aber 0 < cos(x) < 1 für alle x ∈ (0, π/2) und also ist σ/4 ≥ π/2, d.h., σ ≥ 2π.
Dies zeigt, dass 2π die kleinste positive Zahl σ mit cis(σ) = 1 ist.
(2) Da cis(2π) = 1, gilt für jedes n ∈ Z, dass
cis(2π(n + 1)) = cis(2πn + 2π) = cis(2πn) cis(2π) = cis(2πn) .
Daraus ergibt sich durch Induktion nach n, dass cis(2πn) = 1 für alle n ∈ N und
−1
damit für alle n ∈ Z, da cis(−y) = cis(y)
für alle y ∈ R. Für jedes x ∈ R,
n ∈ Z ist nun cis(x + 2πn) = cis(x) cis(2πn) = cis(x).
Nach Satz 9.7 wird insbesondere jede der Abbildungen cos und sin bestimmt
durch die periodische Fortsetzung ihrer Einschränkung auf dem Intervall [0, 2π].
Das Verhalten von cos und sin in [0, 2π] ist im folgenden Satz beschrieben.
Satz 9.8 (1a) Die Abbildung cos ist streng monoton fallend im Intervall [0, π]
und streng monoton wachsend im Intervall [π, 2π].
(1b) Für alle x ∈ [0, π/2] ist cos(π − x) = −cos(x).
(1c) Für alle x ∈ [0, π] ist cos(2π − x) = cos(x).
(1d) cos(0) = 1, cos(π/2) = 0, cos(π) = −1, cos(3π/2) = 0 und cos(2π) = 1.
(2a) Die Abbildung sin ist streng monoton wachsend im Intervall [0, π/2] sowie
im Intervall [3π/2, 2π] und streng monoton fallend im Intervall [π/2, 3π/2].
(2b) Für alle x ∈ [0, π/2] ist sin(π − x) = sin(x).
(2c) Für alle x ∈ [0, π] ist sin(2π − x) = − sin(x).
(2d) sin(0) = 0, sin(π/2) = 1, sin(π) = 0, sin(3π/2) = −1 und sin(2π) = 0.
9 Trigonometrische Funktionen
65
Beweis (1d) Es ist schon gesehen worden, dass cos(0) = cos(2π) = 1, cos(π/2) =
0 und cos(π) = −1, und nach Satz 9.3 ist dann
cos(3π/2) = cos(π + π/2) = cos(π) cos(π/2) − sin(π) sin(π/2) = 0 ,
da cos(π/2) = sin(π) = 0.
(1b) Für alle x ∈ [0, π/2] ist nach Satz 9.3
cos(π − x) = cos(π) cos(x) + sin(π) sin(x) = − cos(x) ,
da cos(π) = −1 und damit auch sin(π) = 0.
(1c) Für alle x ∈ [0, π] ist nach Satz 9.3
cos(2π − x) = cos(2π) cos(x) + sin(2π) sin(x) = cos(x) ,
da cos(π) = 1 und damit wieder sin(π) = 0.
(1a) Nach Lemma 9.3 und Satz 9.6 ist cos streng monoton fallend im Intervall
[0, π/2] und damit nach (1b) auch streng monoton fallend im Intervall [π/2, π],
d.h. cos ist streng monoton fallend im Intervall [0, π]. Daraus folgt nach (1c), dass
cos streng monoton wachsend im Intervall [π, 2π] ist.
Die Aussagen über sin sind analog zu beweisen.
Lemma 9.5 Es gilt cos(R) = cos([0, 2π]) = [−1, 1].
Beweis Setze I = cos([0, 2π]). Nach Satz 7.9 und Satz 9.2 ist I ein Intervall und
nach Satz 9.1 (2) ist I ⊂ [−1, 1]. Aber nach Satz 9.8 (1d) liegen −1 und 1 in I und
daher ist cos([0, 2π]) = I = [−1, 1]. Da ferner cos([0, 2π]) ⊂ cos(R) ⊂ [−1, 1], ist
auch cos(R) = [−1, 1].
Setze S 1 = {z ∈ C : |z| = 1}.
Satz 9.9 Es gilt cis(R) = cis([0, 2π)) = S 1 .
Beweis Nach Lemma 9.1 ist cis([0, 2π)) ⊂ cis(R) ⊂ S 1 . Sei nun z ∈ S 1 und setze
x = Re z, y = Im z. Damit ist x2 + y 2 = |z|2 = 1 und insbesondere ist x ∈ [−1, 1];
nach Lemma 9.5 gibt es also t ∈ [0, 2π] mit cos(t) = x. Dann ist nach Satz 9.1 (2)
y 2 = 1 − x2 = 1 − cos2 (t) = sin2 (t) ,
d.h. y ist entweder sin(t) oder − sin(t). Aber nach Satz 9.1 (3) ist cos(−t) = cos(t)
und sin(−t) = − sin(t) und daher ist z entweder cos(t) + i sin(t) = cis(t) oder
cos(−t)+i sin(−t) = cis(−t) = cis(2π−t). In beiden Fällen ist z ∈ cis([0, 2π]), und
dies zeigt, dass cis([0, 2π]) = S 1 . Folglich ist cis([0, 2π)) = S 1 , da cis(0) = cis(2π),
und damit ist auch cis(R) = S 1 .
Nach Satz 9.7 wird auch die Abbildung cis bestimmt durch die periodische Fortsetzung ihrer Einschränkung auf dem Intervall [0, 2π].
9 Trigonometrische Funktionen
66
Satz 9.10 Die Abbildung cis bildet das Intervall [0, 2π) bijektiv auf S 1 ab.
Beweis Seien x, y ∈ [0, 2π) mit x ≤ y und cis(x) = cis(y). Da 0 ≤ y − x < 2π
und cis(y − x) = cis(x)(cis(y))−1 = 1, folgt dann aus Satz 9.6 (1), dass y − x = 0,
d.h., y = x. Damit ist die Einschränkung der Abbildung cis auf dem Intervall
[0, 2π) injektiv. Folglich bildet cis das Intervall [0, 2π) bijektiv auf S 1 ab, da nach
Satz 9.9 cis([0, 2π)) = S 1 .
Satz 9.11 Sei w ∈ C und n ≥ 1; dann gibt es ein z ∈ C mit z n = w.
Beweis Da 0n = 0, kann man annehmen, dass w 6= 0. Sei r = |w|; also ist r > 0,
und nach Satz 3.2 gibt es ein ̺ > 0 mit ̺n = r. Setze nun u = r −1 w; dann ist
|u| = |r −1 w| = r −1 |w| = r −1 r = 1, d.h., u ∈ S 1 . Folglich gibt es nach Satz 9.10
ein x ∈ [0, 2π) mit cis(x) = u. Sei jetzt z = ̺ cis(x/n); dann ist
z n = (̺ cis(x/n))n = ̺n (cis(x/n))n = r cis(x) = ru = w .
10
Differentiation
Im Folgenden sei D stets eine nichtleere Teilmenge von K. In diesem Kapitel
werden Abbildungen f : D → K untersucht. Es gibt also hier zwei Fälle (im
Gegensatz zu Kapitel 7, wo es vier Fälle gab):
— Reelle Abbildungen definiert auf einer Teilmenge von R, d.h. f : D → R
mit D ⊂ R.
— Komplexe Abbildungen definiert auf einer Teilmenge von C. d.h. f : D → C
mit D ⊂ C.
Ein Punkt a ∈ K heißt Häufungspunkt von D, wenn für jedes ε > 0 die Menge
BD (a, ε) \ {a} = {x ∈ D : 0 < |x − a| < ε} nichtleer ist.
Ist U eine offene Teilmenge von K, so ist jedes a ∈ U ein Häufungspunkt von U
(da die Menge BK (a, ε) \ {a} das Element a + η für alle 0 < η < ε enthält). Ist
ferner I ein Intervall, das mehr als einen Punkt enthält, so ist jedes a ∈ I ein
Häufungspunkt von I (da es für jedes a ∈ I ein ε > 0 gibt, so dass (a − ε, a) oder
(a, a + ε) eine Teilmenge von I ist).
Lemma 10.1 Sei a ∈ D ein Häufungspunkt von D; dann gibt es mindestens
eine Folge aus D \ {a}, die gegen a konvergiert.
Beweis Für jedes n ≥ 1 wähle xn ∈ D mit 0 < |xn − a| < 1/n. Dann ist {xn }n≥p
eine Folge aus D \ {a}, die offensichtlich gegen a konvergiert.
Im Folgenden sei stets a ∈ D ein Häufungspunkt von D. Sei g : D \ {a} → K
eine Abbildung und sei y ∈ K. Konvergiert die Folge {g(xn )}n≥p gegen y für jede
Folge {xn }n≥p aus D \ {a}, die gegen a konvergiert, so schreibt man
y = lim g(x) .
x→a
Nach Lemma 5.2 und Lemma 10.1 kann es höchstens ein y mit y = limx→a g(x)
geben, und folglich macht diese Schreibweise einen Sinn.
Lemma 10.2 Sei g : D \ {a} → K eine Abbildung und y ∈ K. Dann sind
äquivalent:
(1) Es gilt y = limx→a g(x).
(2) Zu jedem ε > 0 gibt es ein δ > 0, so dass |g(x) − y| < ε für alle x ∈ D \ {a}
mit |x − a| < δ.
(3) Die Abbildung ğ : D → K, die definiert ist durch
g(x) , falls x ∈ D \ {a},
ğ(x) =
y , falls x = a,
ist stetig an der Stelle a.
67
10 Differentiation
68
Beweis Übung.
Eine Abbildung h : K → K heißt affin, wenn es Elemente b, c ∈ K gibt, so dass
h(x) = b + cx für alle x ∈ K.
Lemma 10.3 Sei f : D → K eine Abbildung; dann kann es höchstens eine affine
Abbildung h : K → K geben mit h(a) = f (a) und
f (x) − h(x)
=0.
x→a
x−a
lim
Beweis Seien h1 , h2 : K → K affine Abbildungen mit h1 (a) = h2 (a) = f (a) und
f (x) − h1 (x)
f (x) − h2 (x)
= lim
=0.
x→a
x→a
x−a
x−a
lim
Definiere g : D \ {a} → K durch g(x) = (h1 (x) − h2 (x))/(x − a) und sei {xn }n≥p
eine Folge aus D \ {a}, die gegen a konvergiert. Da für alle x ∈ D \ {a}
h1 (x) − h2 (x)
f (x) − h2 (x) f (x) − h1 (x)
−
=
= g(x) ,
x−a
x−a
x−a
konvergiert nach Satz 5.5 die Folge {g(xn )}n≥p gegen 0. Seien nun b1 , b2 , c1 , c2
mit h1 (x) = b1 + c1 x und h2 (x) = b2 + c2 x; dann ist
h1 (x) − h2 (x) = b1 + c1 x − b2 − c2 x
= b1 + c1 a + c1 (x − a) − b2 − c2 a − c2 (x − a) = (c1 − c2 )(x − a) ,
da b1 + c1 a = h1 (a) = h2 (a) = b2 + c2 a. Damit ist g(x) = c1 − c2 für alle
x ∈ D \ {a}, und insbesondere konvergiert die Folge {g(xn )}n≥p gegen c1 − c2 .
Folglich ist c1 = c2 und dann ist ebenfalls b1 = b2 , da b1 − b2 = a(c2 − c1 ), d.h.
h1 = h2 .
Eine Abbildung f : D → K heißt in a linear approximierbar, wenn es eine affine
Abbildung h : K → K mit h(a) = f (a) gibt, so dass
f (x) − h(x)
=0.
x→a
x−a
lim
Nach Lemma 10.3 ist diese affine Abbildung h dann eindeutig bestimmt. Eine
Abbildung f : D → K heißt in a differenzierbar, wenn es ein y ∈ K gibt, so dass
f (x) − f (a)
.
x→a
x−a
y = lim
Dieser Grenzwert y heißt die Ableitung von f in a und er wird meistens mit f ′ (a)
bezeichnet, aber manchmal auch mit f˙(a), ∂f (a) oder Df (a).
10 Differentiation
69
Satz 10.1 Für eine Abbildung f : D → K sind äquivalent:
(1) f ist in a differenzierbar.
f (x) − f (a) − c(x − a)
= 0.
x→a
x−a
(3) Es gibt ein c ∈ K und eine an der Stelle a stetige Abbildung r : D → K mit
r(a) = 0, so dass f (x) = f (a) + c(x − a) + r(x)(x − a) für alle x ∈ D.
(2) Es gibt ein c ∈ K, so dass lim
(4) f ist in a linear approximierbar.
In den Fällen (2) und (3) ist c = f ′ (a). Im Fall (4) ist die eindeutig bestimmte
affine Abbildung h durch h(x) = f (a) + f ′ (a)(x − a) gegeben.
Beweis (1) ⇒ (2): Sei f˘ : D \ {a} → K die Abbildung, die definiert ist durch
˘ = f (x) − f (a)
f(x)
x−a
für alle x ∈ D \ {a}. Nach Voraussetzung konvergiert die Folge {f˘(xn )}n≥p gegen
f ′ (a) – und damit die Folge {f˘(xn ) − f ′ (a)}n≥p gegen 0 – für jede Folge {xn }n≥p
aus D \ {a}, die gegen a konvergiert. Aber
′
˘ − f ′ (a) = f (x) − f (a) − f (a)(x − a)
f(x)
x−a
für alle x ∈ D \ {a} und dies zeigt, dass
f (x) − f (a) − f ′ (a)(x − a)
=0.
x→a
x−a
lim
(2) ⇒ (3): Definiere eine Abbildung r : D → K durch
(f (x) − f (a) − c(x − a))/(x − a) , falls x ∈ D \ {a},
r(x) =
0,
falls x = a.
Nach Lemma 10.2 ist r an der Stelle a stetig. Per Definition ist r(a) = 0 und
f (x) = f (a) + c(x − a) + r(x)(x − a) für alle x ∈ D \ {a}. Das Letztere gilt aber
trivialerweise auch für x = a.
(3) ⇒ (4): Es gibt also ein c ∈ K und eine an der Stelle a stetige Abbildung
r : D → K mit r(a) = 0, so dass f (x) = f (a) + c(x − a) + r(x)(x − a) für alle
x ∈ D. Sei h : K → K die affine Abbildung, die gegeben ist durch
h(x) = f (a) − ca + cx = f (a) + c(x − a)
für alle x ∈ K. Dann ist
f (x) − h(x)
−r(x)(x − a)
=
= −r(x)
x−a
x−a
10 Differentiation
70
für alle x ∈ D \ {a}, und daraus folgt nach Lemma 10.2, dass
f (x) − h(x)
=0.
x−a
Ferner ist h(a) = f (a), und damit ist f in a linear approximierbar.
lim
x→a
(4) ⇒ (1): Es gibt eine eindeutige affine Abbildung h : K → K mit h(a) = f (a)
und limx→a (f (x) − h(x))/(x − a) = 0. Seien b, c ∈ K, so dass h(x) = b + cx; da
h(a) = f (a), ist h(x) = f (a) + h(x) − h(a) = f (a) + c(x − a) für alle x ∈ K. Sei
˘ = (f (x)−f (a))/(x−a)
f˘ : D\{a} → K die Abbildung, die definiert ist durch f(x)
für alle x ∈ D \ {a}. Dann ist
˘ − c = f (x) − f (a) − c(x − a) = f (x) − h(x)
f(x)
x−a
x−a
˘ n ) − c}n≥p
für alle x ∈ D \ {a}. Nach Voraussetzung konvergiert die Folge {f(x
gegen 0 – und damit die Folge {f˘(xn )}n≥p gegen c – für jede Folge {xn }n≥p aus
D \ {a}, die gegen a konvergiert. Daraus ergibt sich, dass
f (x) − f (a)
=c,
x−a
d.h. f ist in a differenzierbar mit f ′ (a) = c (und daher ist h die affine Abbildung
x 7→ f (a) + f ′ (a)(x − a)).
lim
x→a
Satz 10.2 Ist f : D → K in a differenzierbar, so ist f an der Stelle a stetig.
Beweis Sei f : D → K in a differenzierbar. Nach Satz 10.2 gibt es dann eine an
der Stelle a stetige Abbildung r : D → K mit r(a) = 0, so dass
f (x) = f (a) + f ′ (a)(x − a) + r(x)(x − a)
für alle x ∈ D. Daraus folgt nach Satz 7.4, dass f an der Stelle a stetig ist, da
die Abbildung x 7→ x − a stetig ist.
Satz 10.3 Seien f, g : D → K Abbildungen, die beide in a differenzierbar sind.
(1) Für alle λ, µ ∈ K ist die Abbildung λf + µg in a differenzierbar, und es gilt
(λf + µg)′ (a) = λf ′ (a) + µg ′(a) .
(2) Die Abbildung f · g ist in a differenzierbar und es gilt
(f · g)′ (a) = f (a)g ′ (a) + f ′ (a)g(a) .
(3) Nehme an, dass g(x) 6= 0 für alle x ∈ D. Dann ist die Abbildung f /g in a
differenzierbar, und es gilt
′
f
f ′ (a)g(a) − f (a)g ′ (a)
.
(a) =
g
g(a)2
10 Differentiation
71
Beweis Seien f˘, ğ : D \ {a} → K die Abbildungen, die definiert sind durch
f (x) − f (a)
f˘(x) =
x−a
und ğ(x) =
g(x) − g(a)
x−a
für alle x ∈ D \ {a}. Nach Voraussetzung konvergiert die Folge {f˘(xn )}n≥p gegen
f ′ (a) und die Folge {ğ(xn )}n≥p gegen g ′(a) für jede Folge {xn }n≥p aus D \ {a},
die gegen a konvergiert.
(1) Sei {xn }n≥p eine Folge aus D \ {a}, die gegen a konvergiert. Nach Satz 5.5 (1)
˘ n ) + µğ(xn )}n≥p gegen λf ′ (a) + µg ′(a). Aber
konvergiert dann die Folge {λf(x
f (x) − f (a)
g(x) − g(a)
+µ
x−a
x−a
(λf + µg)(x) − (λf + µg)(a)
=
x−a
λf˘(x) + µğ(x) = λ
für jedes x ∈ D \ {a}. Daraus ergibt sich, dass
(λf + µg)(x) − (λf + µg)(a)
;
x→a
x−a
λf ′ (a) + µg ′(a) = lim
d.h. λf + µg ist in a differenzierbar und (λf + µg)′(a) = λf ′ (a) + µg ′(a).
(2) Sei {xn }n≥p eine Folge aus D\{a}, die gegen a konvergiert. Damit konvergiert
nach Satz 5.5 die Folge {f (xn )ğ(xn ) + f˘(xn )g(a)}n≥p gegen f (a)g ′(a) + f ′ (a)g(a),
da nach Satz 10.2 und Satz 7.3 die Folge {f (xn )}n≥p gegen f (a) konvergiert. Aber
g(x) − g(a) f (x) − f (a)
f (x)ğ(x) + f˘(x)g(a) = f (x)
+
g(a)
x−a
x−a
f (x)(g(x) − g(a)) + (f (x) − f (a))g(a)
f (x)g(x) − f (a)g(a)
=
=
x−a
x−a
für jedes x ∈ D \ {a}. Daraus ergibt sich, dass
f (a)g ′ (a) + f ′ (a)g(a) = lim
x→a
(f · g)(x) − (f · g)(a)
;
x−a
d.h. f · g ist in a differenzierbar und (f · g)′ (a) = f (a)g ′(a) + f ′ (a)g(a).
(3) Sei {xn }n≥p eine Folge aus D\{a}, die gegen a konvergiert. Damit konvergiert
nach Satz 5.5 die Folge {f˘(xn )g(a) − f (a)ğ(xn )}n≥p gegen f ′ (a)g(a) − f (a)g ′ (a).
Aber
h f (x) − f (a)
˘
1
g(x) − g(a) i
f(x)g(a)
− f (a)ğ(x)
=
g(x) − f (a)
g(x)g(a)
g(x)g(a)
x−a
x−a
h
i
(f (x) − f (a))g(a) − f (a)(g(x) − g(a))
1
=
g(x)g(a)
x−a
h
f i
1
f (x)g(a) − f (a)g(x) i
1 h f =
=
(x) −
(a)
g(x)g(a)
x−a
x−a g
g
10 Differentiation
72
für jedes x ∈ D \ {a}, und nach Satz 10.2 und Satz 7.3 konvergiert die Folge
{g(xn )}n≥p gegen g(a). Daraus folgt, nach Satz 5.5 und Satz 5.6, dass
f i
1 h f f ′ (a)g(a) − f (a)g ′ (a)
(x) −
(a) ,
= lim
x→a x − a
g(a)2
g
g
d.h. die Abbildung f /g ist in a differenzierbar, und es gilt
f ′
g
(a) =
f ′ (a)g(a) − f (a)g ′(a)
.
g(a)2
Lemma 10.4 Sei E eine Teilmenge von D, die a enthält, und nehme an, dass
a ein Häufungspunkt von E ist; sei f : D → K in a differenzierbar. Dann ist die
Einschränkung fE von f auf E auch in a differenzierbar und fE′ (a) = f ′ (a).
Beweis Dies ist klar.
Seien f, g : D → K Abbildungen, die beide in a differenzierbar sind und mit
g(a) 6= 0 (obwohl nicht unbedingt mit g(x) 6= 0 für alle x ∈ D). Nach Satz 10.2
ist g an der Stelle a stetig und damit gibt es ein ε > 0, so dass g(x) 6= 0 für alle x ∈
BD (a, ε). Nun ist a Häufungspunkt von E = BD (a, ε) und nach Lemma 10.4 sind
fE und gE in a differenzierbar mit fE′ (a) = f ′ (a) und gE′ (a) = g ′ (a). Dies bedeutet,
dass, obwohl g die Bedingung in Satz 10.3 (3) nicht unbedingt erfüllt, dieser Satz
immer noch auf die Abbildungen fE und gE angewendet werden können.
Satz 10.4 (Kettenregel) Sei E eine weitere nichtleere Teilmenge von K und
sei b ∈ E ein Häufungspunkt von E. Sei f : D → K differenzierbar in a mit
f (D) ⊂ E und f (a) = b und sei g : E → K differenzierbar in b. Dann ist die
zusammengesetzte Abbildung g ◦ f : D → K differenzierbar in a und es gilt
(g ◦ f )′ (a) = g ′(f (a))f ′ (a) .
Beweis Da f in a differenzierbar ist, gibt es nach Satz 10.1 eine an der Stelle a
stetige Abbildung r : D → K mit r(a) = 0, so dass
f (x) = f (a) + f ′ (a)(x − a) + r(x)(x − a) = f (a) + f ′ (a) + r(x) (x − a)
für alle x ∈ D, und da g in b differenzierbar ist, gibt es eine an der Stelle b stetige
Abbildung s : E → K mit s(b) = 0, so dass
g(y) = g(b) + g ′(b)(y − b) + s(y)(y − b) = g(b) + g ′(b) + s(y) (y − b)
10 Differentiation
73
für alle y ∈ E. Für alle x ∈ D ist dann
(g ◦ f )(x) = g(f (x)) = g(f (a)) + g ′ (f (a)) + s(f (x)) f (x) − f (a)
= g(f (a)) + g ′ (f (a)) + s(f (x)) f ′ (a) + r(x) (x − a)
= (g ◦ f )(a) + g ′ (f (a))f ′ (a)(x − a) + t(x)(x − a) ,
wobei t : D → K durch t(x) = s(f (x))r(x) + g ′(f (a))r(x) + s(f (x))f ′ (a) für alle
x ∈ D gegeben ist. Aber nach Satz 7.4 und Satz 7.5 ist t and der Stelle a stetig
und t(a) = s(f (a))r(a) + g ′(f (a))r(a) + s(f (a))f ′ (a) = 0. Daraus ergibt sich nach
Satz 10.1, dass g ◦ f in a differenzierbar ist und (g ◦ f )′ (a) = g ′ (f (a))f ′ (a).
Lemma 10.5 Sei f : D → K injektiv und stetig an der Stelle a. Dann ist f (b)
Häufungspunkt von E = f (D).
Beweis Sei ε > 0; da f an der Stelle a stetig ist, gibt es ein δ > 0, so dass
|f (x) − f (a)| < ε für alle x ∈ D mit |x − a| < δ. Damit ist f (x) ∈ BE (f (a), ε) für
alle x ∈ BD (a, δ), d.h. f (BD (a, δ)) ⊂ BE (f (a), ε). Folglich ist f (BD (a, δ) \ {a}
Teilmenge von BE (f (a), ε) \ {f (a)}, da f injektiv ist. Aber BD (a, δ) \ {a} ist
nichtleer, da a Häufungspunkt von D ist, und also ist BE (f (a), ε) \ {f (a)} auch
nichtleer. Dies zeigt, dass f (a) Häufungspunkt von E ist.
Ist f : D → K injektiv und differenzierbar in a, so ist nach Satz 10.2 und
Lemma 10.5 f (b) Häufungspunkt von E = f (D).
Satz 10.5 Sei f : D → K injektiv und in a differenzierbar. Setze E = f (D) und
nehme an, dass die Umkehrabbildung f −1 : E → K an der Stelle b = f (a) stetig
ist. Dann ist f −1 in b differenzierbar genau, wenn f ′ (a) 6= 0. In diesem Fall ist
(f −1 )′ (b) =
1
f ′ (a)
.
Beweis Nehme zunächst an, dass f ′ (a) 6= 0, und sei {yn }n≥p eine Folge aus E\{b},
die gegen b konvergiert. Für jedes n ≥ p setze xn = f −1 (yn ); dann ist {xn }n≥p
eine Folge aus D \ {a} (da f (xn ) = y 6= f (a)), die gegen a konvergiert, da f −1 an
der Stelle b stetig ist. Nach Voraussetzung ist f in a differenzierbar, und daher
ist limn→∞ (f (xn ) − f (a))/(xn − a) = f ′ (a) 6= 0. Ferner ist f (xn ) − f (a) 6= 0 für
alle n ≥ p, da xn 6= a und f injektiv ist, und daraus folgt nach Satz 5.6, dass
f −1 (yn ) − f −1 (b)
1
xn − a
lim
= lim
= ′
.
n→∞
n→∞
yn − b
f (xn ) − f (a)
f (a)
Damit ist f −1 in b differenzierbar und es gilt (f −1 )′ (b) = 1/f ′ (a).
10 Differentiation
74
Nehme nun umgekehrt an, dass f −1 in b differenzierbar ist. Nach Satz 10.4 ist
f −1 ◦ f in a differenzierbar und (f −1 ◦ f )′(a) = (f −1 )′ (b)f ′ (a). Aber f −1 ◦ f = idD
und offensichtlich ist id′D (a) = 1; d.h. (f −1 )′ (b)f ′ (a) = 1. Daher ist f ′ (a) 6= 0 und
(f −1 )′ (b) = 1/f ′(a).
Lemma 10.6 Sei D Teilmenge von R; eine Abbildung f : D → C ist genau dann
in a differenzierbar, wenn Re f und Im f in a differenzierbar sind. In diesem Fall
gilt f ′ (a) = (Re f )′ (a) + i(Im f )′ (a).
Bemerkung: Die Differenzierbarkeit von f in a ist hier natürlich mit K = C
definiert und insbesondere wird D als Teilmenge von C angesehen.
Beweis Übung.
Die Teilmenge D heißt perfekt, wenn jedes a ∈ D ein Häufungspunkt von D ist.
Lemma 10.7 (1) Jede offene Teilmenge von K ist perfekt.
(2) Jede perfekte Teilmenge von R ist auch eine perfekte Teilmenge von C.
(3) Jedes Intervall, das mehr als einen Punkt enthält, ist perfekt.
Beweis Übung.
Im Folgenden sei D eine nichtleere perfekte Teilmenge von K. Eine Abbildung
f : D → K heißt differenzierbar, wenn f in a differenzierbar ist für jedes a ∈ D.
Satz 10.6 Seien c0 , . . . , cn ∈ K (mit n ≥ 0) und sei f : D → K die durch
f (x) = c0 + c1 x + c2 x2 + · · · + cn xn
für alle x ∈ D gegebene Abbildung. Dann ist f differenzierbar und
f ′ (a) = c1 + 2c2 a + · · · + ncn an−1
für alle a ∈ D.
Beweis Für jedes n ≥ 0 definiere hn : D → R durch hn (x) = xn für alle x ∈ D;
(insbesondere ist dann h0 (x) = 1 für alle x ∈ D). Es ist klar, dass h0 und h1
differenzierbar sind und h′0 (a) = 0 und h′1 (a) = 1 für alle a ∈ D. Sei nun n ≥ 1
und nehme an, dass hn differenzierbar ist und dass h′n (a) = nan−1 für alle a ∈ D.
Da hn+1 = h1 · hn , ist dann nach Satz 10.3 (2) auch hn+1 differenzierbar und
h′n+1 (a) = (h1 · hn )′ (a) = h1 (x)h′n (a) + h′1 (x)hn (a)
= a · nan−1 + 1 · an = (n + 1)an
10 Differentiation
75
für alle a ∈ D. Daraus folgt durch Induktion nach n, dass hn differenzierbar
ist für jedes n ≥ 0 und h′n (a) = nan−1 für alle a ∈ D, n ≥ 1. Damit ist nach
Satz 10.3 (1) f = c0 h0 + c1 h1 + · · · + cn hn differenzierbar und es gilt
f ′ (a) = c0 h′0 (a) + c1 h′1 (a) + · · · + cn h′n (a) = c1 + 2c2 a + · · · + ncn an−1
für alle a ∈ D.
Satz 10.7 Nehme an, dass 0 ∈
/ D und sei n ≥ 1. Dann ist die durch gn (x) = 1/xn
definierte Abbildung gn : D → K differenzierbar und für alle a ∈ D gilt
gn′ (a) = −
n
an+1
.
Beweis Es gilt gn = 1/hn , wobei hn : D → K wie im Beweis für Satz 10.6 ist,
und daraus folgt nach Satz 10.3 (3), dass gn differenzierbar ist und
gn′ (a) =
1 ′
−nan−1
n
0 · hn (a) − 1 · h′n (a)
=
= − n+1
(a) =
2
2n
hn
hn (a)
a
a
für alle a ∈ D.
Satz 10.8 (1) Die Abbildung exp : K → K ist differenzierbar und exp′ = exp.
(2) Die Abbildung cis : R → C ist differenzierbar und cis′ = i cis.
(3) Die Abbildungen cos, sin : R → R sind beide differenzierbar mit cos′ = − sin
und sin′ = cos.
Beweis (1) Sei a ∈ K und ε > 0; setze η = exp −(1 + |a|) ε und δ = min{η, 1}.
Für alle x ∈ K \ {a} mit |x − a| < δ ist dann nach Satz 6.10 (4)
exp(x) − exp(a)
|x − a|
− exp(a) ≤
exp(|x − a|) exp(|a|)
x−a
2
|x − a|
exp(1 + |a|) < η exp(1 + |a|) = ε ,
≤
2
und daraus folgt, dass limx→a (exp(x) − exp(a))/(x − a) = exp(a). Damit ist exp
in a differenzierbar und exp′ (a) = exp(a).
(2) Definiere f : C → C durch f (z) = exp(iz) für alle z ∈ C. Dann ist f = exp ◦h,
wobei h(z) = iz für alle z ∈ C, und daraus ergibt sich nach (1), Satz 10.4 und
Satz 10.6, dass f differenzierbar ist und
f ′ (a) = (exp ◦h)′ (a) = exp′ (h(a))h′ (a) = i exp(ia) = if (a) .
10 Differentiation
76
Aber cis ist die Einschränkung von f auf R und folglich gilt nach Lemma 10.4,
dass cis differenzierbar ist und cis′ (a) = f ′ (a) = if (a) = i cis(a) für alle a ∈ R.
(3) Da cos = Re cis und sin = Im cis, sind nach (2) und Lemma 10.6 cos und sin
differenzierbar und cos′ (a) = Re(cis′ (a)) = Re(i cis(a)) = − Im cis(a) = − sin(a)
und sin′ (a) = Im(cis′ (a)) = Im(i cis(a)) = Re cis(a) = cos(a) für alle a ∈ R.
Satz 10.9 Die Abbildung log : (0, +∞) → R ist differenzierbar und es gilt
log′ (a) =
1
a
für alle a ∈ (0, +∞).
Beweis Sei a ∈ (0, +∞) und setze c = log(a). Nun ist exp in c differenzierbar, log
ist an der Stelle a = exp(c) stetig und exp′ (c) 6= 0. Daraus folgt nach Satz 10.5,
dass die Abbildung log in a differenzierbar ist und
log′ (a) =
1
1
1
=
=
.
exp′ (c)
exp(c)
a
Sei f : D → K differenzierbar; es gibt also eine Abbildung f ′ : D → K, d.h. die
Abbildung x 7→ f ′ (x). Sie heißt die Ableitung von f .
In vielen Anwendungen sind die auftretenden Abbildungen differenzierbar (und
nicht nur differenzierbar in einem Punkt). Es ist also nützlich, über Versionen
der Sätze 10.3, 10.4 und 10.5 zu verfügen, die auf diesen Fall zugeschnitten sind.
Satz 10.10 Seien f, g : D → K differenzierbare Abbildungen
(1) Für alle λ, µ ∈ K ist die Abbildung λf + µg differenzierbar mit
(λf + µg)′ = λf ′ + µg ′ .
(2) Die Abbildung f · g ist differenzierbar mit
(f · g)′ = f · g ′ + f ′ · g .
(3) Ist g(x) 6= 0 für alle x ∈ D, so ist die Abbildung f /g differenzierbar mit
f ′
g
=
f ′ · g − f · g′
.
g2
Beweis Dies folgt unmittelbar aus Satz 10.3.
10 Differentiation
77
Satz 10.11 (Kettenregel) Sei E eine weitere nichtleere perfekte Teilmenge von
K. Seien f : D → K und g : E → K differenzierbare Abbildungen mit f (D) ⊂ E.
Dann ist die zusammengesetzte Abbildung g ◦ f : D → K differenzierbar mit
(g ◦ f )′ = (g ′ ◦ f ) · f ′ .
Beweis Dies folgt unmittelbar aus Satz 10.4, da für alle a ∈ D
(g ◦ f )′ (a) = g ′(f (a))f ′ (a) = (g ′ ◦ f ) · f ′ (a) .
Ist die Abbildung f : D → K injektiv und differenzierbar, so ist nach Satz 10.2
und Lemma 10.5 E = f (D) eine perfekte Teilmenge von K.
Satz 10.12 Sei f : D → K injektiv und differenzierbar. Setze E = f (D) und
nehme an, dass die Umkehrabbildung f −1 : E → K stetig ist. Dann ist f −1
differenzierbar genau, wenn f ′ (a) 6= 0 für alle a ∈ D. In diesem Fall ist
(f −1 )′ =
1
◦ f −1 .
′
f
Beweis Dies folgt unmittelbar aus Satz 10.5, da für alle a ∈ D
1
1
−1
−1 ′
(a) .
=
◦f
(f ) (a) = ′ −1
f (f (a))
f′
Sei f : D → K differenzierbar; im Folgenden wird die Abbleitung f ′ auch mit ∂f
bezeichnet. Sei nun a ∈ D; ist die Abbildung ∂f : D → K in a differenzierbar, so
heißt die Ableitung (∂f )′ (a) von ∂f in a die zweite Ableitung von f in a und sie
wird mit ∂ 2 f (a) oder f ′′ (a) bezeichnet.
Ist ∂f : D → K differenzierbar, so gibt es eine Abbildung ∂ 2 f : D → K. Natürlich
kann dieser Prozeß induktiv fortgesetzt werden: Setze ∂ 0 f = f , ∂ 1 f = ∂f und
sei n ≥ 1; f : D → K heißt n-mal in a differenzierbar, wenn sie (n − 1)-mal
differenzierbar ist und die Abbildung ∂ n−1 f : D → K in a differenzierbar ist.
Nun heißt f n-mal differenzierbar, wenn sie (n − 1)-mal differenzierbar ist und
die Abbildung ∂ n−1 f : D → K differenzierbar ist.
Die Ableitung (∂ n−1 f )′ (a) von ∂ n−1 f in a wird mit ∂ n f (a) bezeichnet. Ist f n-mal
differenzierbar, so gibt es eine Abbildung ∂ n f : D → K.
Schließlich heißt eine Abbildung f : D → K n-mal stetig differenzierbar, wenn sie
n-mal differenzierbar ist und die Abbildung ∂ n f : D → K stetig ist.
Im Folgenden sei K = R, also ist D nun eine Teilmenge von R. Eine Abbildung
f : D → R heißt in a rechtsseitig differenzierbar, wenn a ein Häufungspunkt von
10 Differentiation
78
D ∩ [a, +∞) ist und die Einschränkung von f auf D ∩ [a, +∞) in a differenzierbar
ist. In diesem Fall heißt die Ableitung in a von dieser Einschränkung rechtsseite
Abbleitung von f in a und wird mit ∂+ f (a) bezeichnet.
Analog wird linksseitige Differenzierbarkeit definiert: Die Abbildung f heißt in
a linksseitig differenzierbar, wenn a ein Häufungspunkt von D ∩ (−∞, a] ist und
die Einschränkung von f auf D ∩ (−∞, a] in a differenzierbar ist. In diesem Fall
heißt die Ableitung in a von dieser Einschränkung linksseite Abbleitung von f in
a und wird mit ∂− f (a) bezeichnet.
Ist a ein Häufungspunkt von D ∩ [a, +∞), so ist f in a rechtsseitig differenzierbar
genau dann, wenn es ein c ∈ R gibt, so dass
f (xn ) − f (a)
=c
n→∞
xn − a
lim
für jede Folge {xn }n≥p aus D ∩ (a, +∞), die gegen a konvergiert; ferner ist in
diesem Fall c = ∂+ f (a). Eine analoge Aussage gilt natürlich für linksseitige Differenzierbarkeit in a.
Lemma 10.8 Ein Punkt b ∈ R ist Häufungspunkt von D genau dann, wenn b
Häufungspunkt von mindestens einer der Mengen D ∩ [b, +∞) und D ∩ (−∞, b]
ist.
Beweis Dies ist klar.
Im Folgenden sei f : D → R eine Abbildung.
Lemma 10.9 (1) Sei a ein Häufungspunkt von D ∩[a, +∞), der kein Häufungspunkt von D ∩ (−∞, a] ist. Dann ist f in a differenzierbar genau, wenn f in a
rechtsseitig differenzierbar ist, und in diesen Fall ist ∂f (a) = ∂+ f (a).
(2) Sei a ein Häufungspunkt von D ∩ (−∞, a]), der kein Häufungspunkt von
D ∩ [a, +∞) ist. Dann ist f in a differenzierbar genau, wenn f in a linksseitig
differenzierbar ist, und hier ist ∂f (a) = ∂− f (a).
Beweis (1) Dies folgt aus der folgenden Tatsache: Da a kein Häufungspunkt von
D ∩ (−∞, a] ist, gibt es ein ε > 0, so dass D ∩ (a − ε, a) = ∅. Ist also {xn }n≥p
eine Folge aus D \ {a}, die gegen a konvergiert, dann existiert ein q ≥ p, so dass
xn ∈ D ∩ (a, +∞) für alle n ≥ q.
(2) Dies ist analog zu beweisen.
Nehme nun an, a ist Häufungspunkt von sowohl D∩(−∞, a] als auch D∩[a, +∞).
10 Differentiation
79
Satz 10.13 Die Abbildung f ist in a differenzierbar genau dann, wenn f in a
linksseitig und rechtseitig differenzierbar ist und ∂− f (a) = ∂+ f (a). In diesem Fall
ist ∂f (a) = ∂− f (a) = ∂+ f (a).
Beweis Sei f+ (bzw. f− ) die Einschränkung von f auf D ∩ [a, +∞) (bzw. auf
D ∩ (−∞, a]). Ist f in a differenzierbar, so sind nach Lemma 10.4 f+ und f− in
a differenzierbar und es gilt f+′ (a) = f ′ (a) = f−′ (a). Mit anderen Worten: Ist f
in a differenzierbar, so ist f in a linksseitig und rechtseitig differenzierbar und es
gilt ∂− f (a) = f+′ (a) = f−′ (a) = ∂+ f (a).
Nehme nun an, f ist in a sowohl linksseitig als auch rechtsseitig differenzierbar
und es gilt ∂− f (a) = ∂+ f (a). Dann sind f+ und f− in a differenzierbar und
f+′ (a) = f−′ (a). Nach Satz 10.1 gibt es also an der Stelle a stetige Abbildungen
r+ : D ∩ [a, +∞) → R und r− : D ∩ (−∞, a] → R mit r+ (a) = r− (a) = 0, so dass
f (x) = f+ (x) = f (a) + f+′ (a)(x − a) + r+ (x)(x − a) für alle x ∈ D ∩ [a, +∞) und
f (x) = f− (x) = f (a) + f−′ (a)(x − a) + r− (x)(x − a) für alle x ∈ D ∩ (−∞, a]. Sei
nun r : D → R die Abbildung, die definiert ist durch
r+ (x) , falls x ∈ D ∩ [a, +∞),
r(x) =
r− (x) , falls x ∈ D ∩ (−∞, a).
Dann ist r(a) = 0 und man sieht leicht, dass r an der Stelle a stetig ist. Ferner
ist f (x) = f (a) + c(x − a) + r(x)(x − a) für alle x ∈ D, wobei c = f+′ (a) = f−′ (a).
Daraus folgt nach Satz 10.1, das f in a differenzierbar ist und es gilt f ′ (a) = c,
d.h. ∂f (a) = ∂− f (a) = ∂+ f (a), da ∂− f (a) = f+′ (a) und ∂+ f (a) = f−′ (a).
11
Mittelwertsätze
Im Folgenden sei D stets eine nichtleere Teilmenge von R (es wird hier nur der
Fall K = R betrachtet).
Sei f : D → R eine Abbildung; dann hat f in a ∈ D ein lokales Minimum
(bzw. lokales Maximum), wenn es ein ε > 0 gibt, so dass f (a) ≤ f (x) (bzw.
f (a) ≥ f (x)) für alle x ∈ D mit |x − a| < ε. Man sagt dann, dass f in a ein
lokales Extremum besitze, wenn f in a entweder ein lokales Minimum oder ein
lokales Maximum hat.
Ein Punkt a ∈ D heißt innerer Punkt von D, wenn es ein ε > 0 gibt, so dass
{x ∈ R : |x − a| < ε} ⊂ D. Mit anderen Worten: wenn es ein ε > 0 gibt, so
dass BR (a, ε) = (a − ε, a + ε) ⊂ D. Insbesondere ist jeder innere Punkt von D
Häufungspunkt von D. Ferner ist D eine offene Teilmenge von R genau dann,
wenn jeder Punkt in D ein innerer Punkt ist.
Die Menge der inneren Punkte von D heißt das Innere von D und wird mit D ◦
bezeichnet.
Lemma 11.1 Sei f : D → R eine Abbildung und a ∈ D ◦ . Besitzt f in a ein
lokales Extremum und is f in a differenzierbar, so ist f ′ (a) = 0.
Beweis Da a innerer Punkt von D ist, gibt es ein ε > 0, so dass (a−ε, a+ε) ⊂ D.
Definiere eine Abbildung g : D \ {a} → R durch
g(x) =
f (x) − f (a)
x−a
für alle x ∈ D \ {a}; also ist limx→a g(x) = f ′ (a). Nehme an, f besitzt in a ein
lokales Minimum. Dann gibt es ein ε′ > 0, so dass f (a) ≤ f (x) für alle x ∈ D mit
|x − a| < ε′ . Setze δ = min{ε, ε′}; dann ist (a − δ, a + δ) ⊂ D und f (a) ≤ f (x) für
alle x ∈ (a − δ, a + δ). Für jedes n ≥ 2 sei xn = a − δn−1 und x′n = a + δn−1 ; dann
sind {xn }n≥2 und {x′n }n≥2 beide Folgen aus D\{a}, die gegen a konvergieren, und
daraus folgt, dass die Folgen {g(xn )}n≥2 und {g(x′n )}n≥2 gegen f ′ (a) konvergieren.
Aber für jedes n ≥ 2 ist g(xn ) ≤ 0 und g(x′n ) ≥ 0, da f (xn ) − f (a) ≥ 0,
f (x′n ) − f (a) ≥ 0, xn − a < 0 und x′n − a > 0. Damit ist nach Satz 5.3
0 ≤ lim g(x′n ) = f ′ (a) = lim g(xn ) ≤ 0 ; ,
n→∞
n→∞
d.h. f ′ (a) = 0. Für ein lokales Maximum ist das Lemma analog zu beweisen.
Sei E eine nichtleere Teilmenge von D, die perfekt ist. Eine Abbildung f : D → R
heißt dann in E differenzierbar, wenn f in c differenzierbar ist für jedes c ∈ E.
80
11 Mittelwertsätze
81
Im Folgenden sei I ein Intervall, das mehr als einen Punkt enthält. Dann ist
I ◦ auch ein Intervall, das mehr als einen Punkt enthält, und I \ I ◦ besteht aus
höchstens zwei Elementen (den ‘Endpunkten’ von I). Sind a, b ∈ I mit a < b, so
ist [a, b] ⊂ I und (a, b) ⊂ I ◦ .
Satz 11.1 (Satz von Rolle) Sei f : I → R eine stetige Abbildung, die in I ◦
differenzierbar ist, und seien a, b ∈ I mit a < b. Ist f (a) = f (b), dann gibt es ein
ξ ∈ (a, b), so dass f ′ (ξ) = 0 (und hier ist f ′ (ξ) definiert, da ξ ∈ (a, b) ⊂ I ◦ ).
Beweis Da [a, b] folgenkompakt ist, gibt es nach Satz 8.3 u, v ∈ [a, b], so dass
f (u) ≤ f (x) ≤ f (v) für alle x ∈ [a, b]. Ist f (u) = f (v), so ist f (x) = f (u) für alle
x ∈ [a, b] und in diesem Fall ist f ′ (ξ) = 0 für jedes ξ ∈ (a, b). Nehme also an, dass
f (u) 6= f (v), d.h. f (u) < f (v); dann gibt es ξ ∈ {u, v} mit f (ξ) 6= f (a) = f (b).
Insbesondere ist ξ ∈ (a, b) und damit ist ξ ∈ I ◦ . Ferner besitzt f in ξ ein lokales
Extremum, da f (ξ) ≤ f (x) (bzw. f (ξ) ≥ f (x)) für alle x ∈ [a, b]. Daraus folgt
nach Lemma 11.1, dass f ′ (ξ) = 0.
Satz 11.2 (Mittelwertsatz) Sei f : I → R eine stetige Abbildung, die in I ◦
differenzierbar ist, seien a, b ∈ I mit a < b. Dann gibt es ein ξ ∈ (a, b), so dass
f ′ (ξ) =
f (b) − f (a)
b−a
(und wieder ist f ′ (ξ) definiert, da ξ ∈ (a, b) ⊂ I ◦ ).
Beweis Setze c = (f (b) − f (a))/(b − a) und definiere eine Abbildung g : I → R
durch g(x) = f (x) − cx für jedes x ∈ I. Nach Satz 7.4 und Satz 10.3 (1) ist g
stetig und in I ◦ differenzierbare, und es gilt
g(a) = f (a) − ca =
bf (a) − af (b)
= f (b) − cb = g(b) .
b−a
Nach Satz 11.1 gibt es also ξ ∈ (a, b) mit g ′ (ξ) = 0. Damit ist nach Satz 10.3 (1)
f ′ (ξ) = g ′(ξ) + c = 0 + c =
f (b) − f (a)
.
b−a
Satz 11.3 (Zweiter Mittelwertsatz) Seien f, g : I → R stetige Abbildungen,
die in I ◦ differenzierbar sind, und seien a, b ∈ I mit a < b. Nehme an, dass
g ′ (x) 6= 0 für alle x ∈ (a, b). Dann gibt es ein ξ ∈ (a, b), so dass
f (b) − f (a)
f ′ (ξ)
=
′
g (ξ)
g(b) − g(a)
(und nach Satz 11.1 ist hier g(b) 6= g(a), da g ′(x) 6= 0 für alle x ∈ (a, b)).
11 Mittelwertsätze
82
Beweis Da g(b) 6= g(a), kann eine Abbildung h : I → R definiert werden durch
h(x) = f (x) −
f (b) − f (a)
g(x) − g(a)
g(b) − g(a)
für alle x ∈ I. Nach Satz 7.4 und Satz 10.3 (1) ist h eine stetige Abbildung, die
in I ◦ differenzierbar ist. Ferner ist h(a) = h(b) = f (a), und daraus folgt nach
Satz 11.1, dass es ein ξ ∈ (a, b) mit h′ (ξ) = 0 gibt. Damit ist
f ′ (ξ)
f (b) − f (a) ′
1 ′
f (b) − f (a) ′ f (ξ) −
= ′
g (ξ) +
g (ξ)
g ′ (ξ)
g (ξ)
g(b) − g(a)
g(b) − g(a)
f (b) − f (a) ′ 1 ′
h (ξ) +
g (ξ)
= ′
g (ξ)
g(b) − g(a)
1 f (b) − f (a) ′ f (b) − f (a)
g (ξ) =
.
= ′
g (ξ) g(b) − g(a)
g(b) − g(a)
Satz 11.4 Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist.
(1) f ist monoton wachsend (bzw. monoton fallend) genau dann, wenn f ′ (x) ≥ 0
(bzw. f ′ (x) ≤ 0) für alle x ∈ I ◦ .
(2) Gilt f ′ (x) > 0 (bzw. f ′ (x) < 0) für alle x ∈ I ◦ , so ist f streng monoton
wachsend (bzw. streng monoton fallend).
Beweis (1) Nehme zunächst an, dass f monoton wachsend ist und sei x ∈ I ◦ .
Da x ein innerer Punkt von I ist, gibt es ε > 0, so dass (x − ε, x + ε) ⊂ I. Für
jedes n ≥ 2 sei xn = x + εn−1 ; dann ist {xn }n≥2 eine Folge aus I \ {x}, die gegen
x konvergiert und da f (xn ) ≥ f (x) und xn > x für alle n ≥ 2, ist dann nach
Satz 5.3
f (xn ) − f (x)
f ′ (x) = lim
≥0.
n→∞
xn − x
Nehme umgekehrt an, dass f ′ (x) ≥ 0 für alle x ∈ I ◦ und seien x, y ∈ I mit x < y.
Nach Satz 11.2 gibt es dann ein ξ ∈ (x, y), so dass f ′ (ξ) = (f (y) − f (x))/(y − x).
Damit ist f (y) − f (x) = (y − x)f ′ (ξ) ≥ 0 d.h. f (y) ≥ f (x), und dies zeigt, dass
f monoton wachsend ist.
(2) Dies folgt genau wie in dem zweiten Teil von (1).
Die restlichen Aussagen (für ein monoton fallende Abbildung f und die entsprechenden Eigenschaften von ihrer Ableitung f ′ ) sind analog zu beweisen.
Die Umkehrung von Satz 11.4 (2) ist falsch: Sei f : R → R gegeben durch
f (x) = x3 für alle x ∈ R. Dann ist f streng monoton wachsend, aber f ′ (x) = 3x2
für alle x ∈ R und insbesondere ist f ′ (0) = 0.
11 Mittelwertsätze
83
Satz 11.5 Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist. Gilt
f ′ (x) 6= 0 für alle x ∈ I ◦ , so ist entweder f ′ (x) > 0 für alle x ∈ I ◦ oder f ′ (x) < 0
für alle x ∈ I ◦ . Insbesondere ist (nach Satz 11.4 (2)) f streng monoton.
Beweis Die Abbildung f ist injektiv: Gäbe es x, y ∈ I mit x < y und f (x) = f (y),
so wäre nach Satz 11.1 f ′ (ξ) = 0 für ein ξ ∈ (x, y). Damit ist nach Satz 7.10 f
streng monoton und insbesondere monoton. Daraus folgt nach Satz 11.4 (1), dass
entweder f ′ (x) ≥ 0 für alle x ∈ I ◦ oder f ′ (x) ≤ 0 für alle x ∈ I ◦ . Aber nach
Voraussetzung ist f ′ (x) 6= 0 für alle x ∈ I ◦ , und folglich ist entweder f ′ (x) > 0
für alle x ∈ I ◦ oder f ′ (x) < 0 für alle x ∈ I ◦ .
Satz 11.6 Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist.
Dann ist f ′ (I ◦ ) ein Intervall: Sind a, b ∈ I ◦ und ist c eine Zahl zwischen f ′ (a)
und f ′ (b), so gibt es ein u ∈ I ◦ mit f ′ (u) = c.
Beweis Seien a, b ∈ I ◦ und sei c zwischen f ′ (a) und f ′ (b). Ist c = f ′ (a) (bzw.
ist c = f ′ (b)), so kann man einfach u = a (bzw. u = b) nehmen. Es kann also
angenommen werden, dass c verschieden von f ′ (a) und f ′ (b) ist. Definiere eine
Abbildung g : I → R durch g(x) = f (x) − cx für alle x ∈ I. Nach Satz 7.4 und
Satz 10.3 (1) ist g stetig und in I ◦ differenzierbar. Ferner ist g ′(x) = f ′ (x) − c für
alle x ∈ I ◦ , und damit ist entweder g ′(a) > 0 und g ′ (b) < 0 oder g ′ (a) < 0 und
g ′ (b) > 0. Daraus folgt nach Satz 11.5, dass g ′(u) = 0 für ein u ∈ I ◦ , und dann
ist f ′ (u) = c.
Satz 11.6 ist eine Art Zwischenwertsatz für Ableitungen. Man merke aber: Ist
f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist, so ist f ′ im
allgemeinen keine stetige Abbildung.
Satz 11.7 Sei f : I → R eine stetige Abbildung. Dann ist f konstant genau,
wenn f in I ◦ differenzierbar ist und f ′ (x) = 0 für alle x ∈ I ◦ .
Beweis Nehme zunächst an, dass f in I ◦ differenzierbar ist und f ′ (x) = 0 für
alle x ∈ I ◦ . Dann ist nach Satz 11.4 (1) f sowohl monoton wachsend als auch
monoton fallend, und damit ist f konstant. Die Umkehrung ist trivial richtig.
Satz 11.8 Sei a ∈ I und seien b, c ∈ R. Sei f : I → R eine stetige Abbildung,
die in I ◦ differenzierbar ist und für die gilt: f (a) = b und f ′ (x) = cf (x) für alle
x ∈ I ◦ . Dann gilt f (x) = b exp c(x − a) für alle x ∈ I.
11 Mittelwertsätze
84
Beweis Definiere g : I → R durch g(x) = exp −c(x − a) für alle x ∈ I. Nach
Satz 7.1 und Satz 7.5 ist g stetig und nach Satz 10.8 (1), Satz
10.4 und Lemma 10.4
◦
′
ist g differenzierbar in I mit g (x) = −c exp −c(x − a) = −cg(x). Nun ist nach
Satz 7.4 die Produktabbildung f ·g stetig, nach Satz 10.3 (2) ist f ·g differenzierbar
in I ◦ und es gilt
(f · g)′(x) = f (x)g ′ (x) + f ′ (x)g(x) = f (x) −cg(x) + cf (x) g(x) = 0
für alle x ∈ I ◦ . Daraus ergibt sich nach Satz 11.7, dass f · g konstant ist, und
folglich ist (f · g)(x) = (f · g)(a) für alle x ∈ I. Für alle x ∈ I ist also
f (x) = f (a)g(a)
1
1
= b exp c(x − a) .
=b
g(x)
exp −c(x − a)
Eine Abbildung f : I → R heißt konvex, wenn für alle x, y ∈ I und alle t ∈ [0, 1]
f (1 − t)x + ty ≤ (1 − t)f (x) + tf (y) .
Satz 11.9 Für eine Abbildung f : I → R sind äquivalent:
(1) f ist konvex.
(2) Für alle a, b ∈ I mit a < b und alle x ∈ [a, b] gilt
f (x) ≤ f (a) +
f (b) − f (a)
(x − a) .
b−a
(3) Für alle a, b ∈ I mit a < b und alle x ∈ (a, b) gilt
f (x) − f (a)
f (b) − f (a)
f (b) − f (x)
≤
≤
.
x−a
b−a
b−x
(4) Für alle a, b, a′ , b′ ∈ I mit a < b, a′ < b′ , a ≤ a′ und b ≤ b′ gilt
f (b′ ) − f (a′ )
f (b) − f (a)
≤
.
b−a
b′ − a′
(5) Für alle a, b, a′ , b′ ∈ I mit a < b ≤ a′ < b′ gilt
f (b) − f (a)
f (b′ ) − f (a′ )
≤
.
b−a
b′ − a′
11 Mittelwertsätze
85
Beweis (1) ⇒ (2): Seien a, b ∈ I mit a < b und x ∈ [a, b]. Setze t = (x−a)/(b−a);
dann ist t ∈ [0, 1] und x = (1 − t)a + tb, und damit ist
f (x) = f (1 − t)a + tb
(b − x)f (a) + (x − a)f (b)
≤ (1 − t)f (a) + tf (b) =
b−a
(b − a)f (a) + f (b) − f (a) (x − a)
f (b) − f (a)
= f (a) +
(x − a) .
=
b−a
b−a
(2) ⇒ (3): Seien a, b ∈ I mit a < b und x ∈ (a, b). Dann folgt
f (x) − f (a)
f (b) − f (a)
≤
x−a
b−a
unmittelbar aus (2). Ferner gilt aber
f (b) − f (a)
(x − a)
f (b) − f (x) ≥ f (b) − f (a) −
b−a
f (b) − f (a) (b − a) − f (b) − f (a) (x − a)
f (b) − f (a)
=
=
(b − x)
b−a
b−a
und daraus ergibt sich, dass auch (f (b) − f (a))/(b − a) ≤ (f (b) − f (x))/(b − x).
(3) ⇒ (4): Seien a, b, a′ , b′ ∈ I mit a < b, a′ < b′ , a ≤ a′ und b ≤ b′ . Dann ist
b ∈ (a, b′ ] und damit folgt aus der ersten Ungleichung in (3), dass
f (b′ ) − f (a)
f (b) − f (a)
≤
,
b−a
b′ − a
da diese Ungleichung trivial richtig ist, wenn b = b′ . Andererseits ist a′ ∈ [a, b′ ),
und nach der zweiten Ungleichung in (3) ist dann
f (b′ ) − f (a)
f (b′ ) − f (a′ )
≤
,
b′ − a
b′ − a′
da diese Ungleichung trivial richtig ist, wenn a = a′ . Folglich ist
f (b′ ) − f (a)
f (b′ ) − f (a′ )
f (b) − f (a)
≤
≤
.
b−a
b′ − a
b′ − a′
(4) ⇒ (5): Dies ist klar.
(5) ⇒ (1): Seien x, y ∈ I und t ∈ [0, 1]. Zu zeigen ist, dass
f (1 − t)x + ty ≤ (1 − t)f (x) + tf (y) ,
11 Mittelwertsätze
86
und dies ist trivial richtig, wenn x = y oder t ∈ {0, 1}. Es kann also im Folgenden
angenommen werden, dass x 6= y und t ∈ (0, 1); ohne Beschränkung der Allgemeinheit sei x < y. Setze u = (1 − t)x + ty; dann ist u ∈ (x, y), und daraus folgt
nach (5) (mit a = x, b = a′ = u und b′ = y), dass
Daraus ergibt sich, dass
f (y) − f (u)
f (u) − f (x)
≤
.
u−x
y−u
1
(y − u) + (u − x) f (u)
y−x
1
(y − u)f (x) + (u − x)f (y)
≤
y−x
y−u
u−x
=
f (x) +
f (y) = (1 − t)f (x) + tf (y) .
y−x
y−x
f (u) =
Satz 11.10 Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist.
Dann ist f konvex genau, wenn die Abbildung f ′ monoton wachsend ist.
Beweis Nehme zunächst an, das f konvex ist, und seien x, y ∈ I ◦ mit x < y. Es
gibt also ein ε > 0, so dass die beiden Intervalle (x − ε, x + ε) und (y − ε, y + ε)
Teilmengen von I sind. Für jedes n ≥ 2 sei xn = x + εn−1 und yn = y + εn−1 .
Dann ist {xn }n≥2 eine Folge aus I \ {x}, die gegen x konvergiert, und {yn }n≥2 ist
eine Folge aus I \ {y}, die gegen y konvergiert. Daraus ergibt sich, dass
f (xn ) − f (x)
= f ′ (x) und
n→∞
xn − x
lim
f (yn ) − f (y)
= f ′ (y) .
n→∞
yn − y
lim
Aber für jedes n ≥ 2 ist x < xn , y < yn , x ≤ y und xn ≤ yn und folglich ist
f (xn ) − f (x)
f (yn ) − f (y)
≤
xn − x
yn − y
nach Lemma 11.2 ((1) ⇒ (4)). Damit ist nach Satz 5.3 f ′ (x) ≤ f ′ (y), und dies
zeigt, dass f ′ monoton wachsend ist.
Nehme nun umgekehrt an, dass f ′ monoton wachsend ist, und seien a, b, a′ , b′ ∈ I
mit a < b ≤ a′ < b′ . Nach Satz 11.2 gibt es ξ ∈ (a, b) und ξ ′ ∈ (a′ , b′ ), so dass
f (b) − f (a)
= f ′ (ξ) und
b−a
f (b′ ) − f (a′ )
= f ′ (ξ ′ ) .
b′ − a′
Aber ξ < b ≤ a′ < ξ ′, damit ist f ′ (ξ) ≤ f ′ (ξ) und folglich
f (b) − f (a)
f (b′ ) − f (a′ )
≤
.
b−a
b′ − a′
Also ist nach Lemma 11.2 ((5) ⇒ (1)) f konvex.
11 Mittelwertsätze
87
Satz 11.11 Sei f : I → R eine stetige Abbildung, die in I ◦ zweimal differenzierbar ist. Dann ist f konvex genau, wenn f ′′ (x) ≥ 0 für alle x ∈ I ◦ .
Beweis Man merke, dass I ◦ auch ein Intervall ist, das mehr als einen Punkt
enthält. Nach Satz 10.2 ist die Abbildung f ′ : I ◦ → R stetig und per Definition
ist sie in (I ◦ )◦ = I ◦ differenzierbar. Daraus folgt nach Satz 11.4 (1), dass f ′ genau
dann monoton wachsend ist, wenn f ′′ (x) ≥ 0 für alle x ∈ I ◦ . Daraus ergibt sich
nach Satz 11.9, dass f genau dann konvex ist, wenn f ′′ (x) ≥ 0 für alle x ∈ I ◦ .
Satz 11.12 Sei d > 0 und sei h : [0, d] → R eine stetige Abbildung, die in (0, d)
differenzierbar ist. Nehme an, h(0) = 0 und limy→0 y ′ (x) = c für ein c ∈ R. Dann
gilt limy→0 h(y)/y = c.
Beweis Sei {yn }n≥p eine Folge aus (0, d], die gegen 0 konvergiert. Für jedes n ≥ p
gibt es dann nach Satz 11.2 ein ξn ∈ (0, yn ), so dass
h′ (ξn ) =
h(yn ) − h(0)
h(yn )
=
.
yn − 0
yn
Da aber 0 < ξn < yn , ist {ξn }n≥p dann eine Folge aus (0, d), die auch gegen 0
konvergiert, und daraus ergibt sich, dass limn→∞ h(yn )/yn = limn→∞ h′ (ξn ) = c.
Dies zeigt, dass limy→0 h(y)/y = c.
Im Folgenden seien a, b ∈ R mit a < b und sei g : [a, b] → R eine stetige
Abbildung, die in (a, b) differenzierbar ist. Es wird ferner angenommen, dass
g(0) = 0 und dass g ′ (x) 6= 0 für alle x ∈ (a, b). Nach Satz 11.5 ist dann entweder
g ′ (x) > 0 für alle x ∈ (a, b) oder g ′ (x) < 0 für alle x ∈ (a, b). In dem ersteren
Fall ist g streng monoton wachsend und g(x) > 0 für alle x ∈ (0, b], und in dem
letzteren Fall ist g streng monoton fallend und g(x) < 0 für alle x ∈ (0, b]. In
beiden Fällen ist g(x) 6= 0 für alle x ∈ (a, b].
Satz 11.13 (Eine Regel von de l’Hospital) Sei f : [a, b] → R eine weitere
stetige Abbildung mit f (a) = 0, die in (a, b) differenzierbar ist. Gibt es ein c ∈ R,
so dass limx→a f ′ (x)/g ′(x) = c, so gilt auch limx→a f (x)/g(x) = c.
Beweis In Beweis wird angenommen, dass g ′ (x) > 0 für alle x ∈ (a, b); (der
andere Fall wird analog bewiesen). Damit ist g streng monoton wachsend und
g bildet das Intervall [a, b] bijektiv auf das Intervall [0, d] ab, wobei d = g(b).
Nach Satz 7.11 ist die Umkehrabbildung g −1 : [0, d] → [a, b] stetig; ferner ist
nach Satz 10.5 g −1 in (0, d) differenzierbar und (g −1 )′ (g(x)) = 1/g ′(x) für jedes
x ∈ (a, b). Betrachte nun die Zusammensetzung h = f ◦ g −1 : [0, d] → R von g −1
11 Mittelwertsätze
88
und f . Nach Satz 7.5 ist h stetig mit h(0) = f (g −1(0)) = f (a) = 0, und nach
Satz 10.4 ist h in (0, d) differenzierbar und für alle x ∈ (a, b) gilt
f ′ (x)
h (g(x)) = (f ◦ g ) (g(x)) = f g (g(x)) · (g ) (g(x)) = ′
.
g (x)
′
−1 ′
′
−1
−1 ′
Sei jetzt {yn }n≥p eine Folge aus (0, d), die gegen 0 konvergiert, und für jedes
n ≥ p setze xn = g −1(yn ). Dann ist {xn }n≥p eine Folge aus (a, b), die gegen a
konvergiert, da g −1 stetig ist und g −1(0) = a. Nach Voraussetzung gilt also
f ′ (xn )
=c.
n→∞ g ′ (xn )
lim h′ (yn ) = lim h′ (g(xn )) = lim
n→∞
n→∞
Daher ist lim h′ (y) = c und daraus folgt nach Lemma 11.3, dass lim h(y)/y = c.
y→0
y→0
Sei {xn }n≥p eine Folge aus (a, b), die gegen a konvergiert, und für jedes n ≥ p
setze diesmal yn = g(xn ). Dann ist {yn }n≥p eine Folge aus (0, d), die gegen 0
konvergiert, da g stetig ist und g(a) = 0. Damit ist
lim
n→∞
h(g(xn ))
h(yn )
f (xn )
= lim
= lim
=c,
n→∞
n→∞
g(xn )
g(xn )
yn
und dies zeigt, dass lim f (x)/g(x) = c.
x→a
12
Integration von Regelfunktionen
Sei X eine Menge; der K-Vektorraum aller Abbildungen von X nach K wird mit
Abb(X, K) bezeichnet. Eine Abbildung f : X → K heißt beschränkt, wenn es ein
c ≥ 0 gibt, so dass |f (x)| ≤ c für alle x ∈ X, und die Menge aller beschränkten
Abbildungen von X nach K wird dann mit B(X, K) bezeichnet. Es ist klar, dass
B(X, K) ein Untervektorraum von Abb(X, K) ist. Für jedes f ∈ B(X, K) sei
||f || = sup{|f (x)| : x ∈ X} .
Dann hat die Abbildung || · || : B(X, K) → K folgende Eigenschaften:
(1) ||f || ≥ 0 und ||f || = 0 genau dan, wenn f = 0.
(2) ||λf || = |λ| ||f || für alle f ∈ B(X, K), λ ∈ K.
(3) ||f + g|| ≤ ||f || + ||g|| für alle f, g ∈ B(X, K).
Im Folgenden sei I das abgeschlossene Intervall [a, b], wobei a, b ∈ R mit a < b.
Seien a0 , . . . , an ∈ R; dann heißt U = (a0 , . . . , an ) eine Unterteilung von I, falls
a = a0 < · · · < an = b. Sind U = (a0 , . . . , an ) und V = (b0 , . . . , bm ) Unterteilungen
von I, so heißt V Verfeinerung von U, falls die Menge {a0 , . . . , an } Teilmenge der
Menge {b0 , . . . , bm } ist.
Seien U = (a0 , . . . , an ), V = (b0 , . . . , bm ) Unterteilungen von I; dann bezeichnet
U ∨ V die Unterteilung (c0 , . . . , cq ), wobei c0 , . . . , cq die Elemente der Menge
{a0 , . . . , an } ∪ {b0 , . . . , bm } in aufsteigender Reihenfolge sind. Es ist klar, dass
U ∨ V eine Verfeinerung von U und von V ist.
Eine Abbildung f : I → K heißt nun Treppenfunktion, wenn es eine Unterteilung
U = (a0 , . . . , an ) von I gibt, so dass f konstant auf jedem der offenen Intervalle
(aj−1 , aj ), j = 1, . . . , n, ist; U heißt dann eine Unterteilung für f und f ist eine
Treppenfunktion zur Unterteilung U.
Lemma 12.1 Ist U eine Unterteilung für eine Treppenfunktion f : I → K, so
ist jede Verfeinerung von U auch eine Unterteilung für f .
Beweis Dies ist klar.
Die Menge aller Treppenfunktionen f : I → K wird mit T(I, K) bezeichnet; da
jede Treppenfunktion beschränkt ist, ist T(I, K) ⊂ B(I, K).
Satz 12.1 T(I, K) ist ein Untervektorraum von B(I, K).
89
12 Integration von Regelfunktionen
90
Beweis Es ist klar, dass 0 eine Treppenfunktion ist. Seien f, g ∈ T(I, K); wähle
eine Unterteilung U für f und eine Unterteilung V für g. Für alle λ, µ ∈ K ist
dann λf + µg konstant auf jedem der offenen Intervalle der Unterteilung U ∨ V,
und damit ist λf + µg eine Treppenfunktion, d.h. λf + µg ∈ T(I, K).
Sei U = (a0 , . . . , an ) eine Unterteilung für die Treppenfunktion f : I → K, und
für jedes j = 1, . . . , n sei αj der Wert von f auf dem Intervall (aj−1, aj ). Setze
Z
n
X
f=
αj (aj − aj−1 ) ;
U
j=1
dieses Element von K heißt das Integral von f bezüglich der Unterteilung U. Da
n
n
n
X
X
X
αj (aj − aj−1 ) ≤
|αj (aj − aj−1 )| ≤
||f ||(aj − aj−1 ) = (b − a)||f || ,
j=1
ist |
R
U
j=1
j=1
f | ≤ (b − a)||f ||.
Lemma 12.2 Sind U und V Unterteilungen für die Treppenfunktion f , so ist
Z
Z
f=
f.
U
V
Beweis Seien U = (a0 , . . . , an ), V = (b0 , . . . , bm ), für 1 ≤ j ≤ n sei αj der Wert
von f auf dem Intervall (aj−1, aj ) und für 1 ≤ k ≤ m sei βk der Wert von f auf
dem Intervall (ak−1 , ak ). Nehme zunächst an, dass V eine Verfeinerung von U ist.
Dann gibt es Indizes 0 = q0 < · · · < qn = m, so dass aj = bqj für jedes 0 ≤ j ≤ n;
insbesondere ist βk = αj , falls qj−1 + 1 ≤ k ≤ qj . Daraus ergibt sich, dass
Z
n
n
X
X
f =
αj (aj − aj−1 ) =
αj (bqj − bqj−1 )
U
j=1
=
n
X
j=1
=
m
X
k=1
j=1
qj
αj
X
(bk − bk−1 ) =
k=qj−1 +1
βk (bk − bk−1 ) =
Z
n
X
qj
X
j=1 k=qj−1 +1
βk (bk − bk−1 )
f.
V
Sind nun U und V beliebige Unterteilungen für f , so ist U ∨ V eine Verfeinerung
von U und V, die nach Lemma 12.1 eineRUnterteilung
fürRf ist, und folglich gilt
R
nach dem ersten Teil des Beweises, dass U f = U ∨V f = V f .
R
Da nach Lemma 12.2 das Intergral U f nicht von der Unterteilung U abhängt,
Rb
Rb
Rb
wird dieses einfach mit a f (oder etwa a f (x) dx) bezeichnet; das Element a f
von K heißt dann das Integral von f .
12 Integration von Regelfunktionen
91
Rb
Satz 12.2 Die Abbildung f 7→ a f von T(I, K) nach K ist linear, d.h.
Z b
Z b
Z b
(λf + µg) = λ
f +µ
g
a
a
a
für alle f, g ∈ T(I, K) und alle λ, µ ∈ K. Ferner gilt |
f ∈ T(I, K).
Rb
a
f | ≤ (b − a)||f || für alle
Beweis Seien f, g ∈ T(I, K); wie im Beweis für Satz 12.1 gibt es eine Unterteilung
U, die eine Unterteilung von f und von g ist. Für alle λ, µ ∈ K ist dann U auch
eine Unterteilung von λf + µg, und es ist klar, dass
Z
Z
Z
(λf + µg) = λ f + µ g ;
U
Rb
damit
ist a (λf + µg) = λ
R
| U f | ≤ (b − a)||f ||.
U
Rb
a
f +µ
Rb
a
U
g. Schließlich gilt |
Rb
a
f | ≤ (b − a)||f ||, da
Für jedes n ≥ p sei fn : I → K eine Abbildung. Die Funktionenfolge {fn }n≥p
konvergiert dann gleichmäßig gegen eine Abbildung f : I → K, wenn es zu jedem
ε > 0 ein N ≥ p gibt, so dass |fn (x) − f (x)| < ε für alle x ∈ I und alle n ≥ N.
Lemma 12.3 Sei f ∈ B(I, K). Dann sind äquivalent:
(1) Zu jedem ε > 0 gibt es eine Treppenfunktion g ∈ T(I, K) mit ||f − g|| ≤ ε.
(2) Es gibt eine Folge {gn }n≥p von Treppenfunktionen mit lim ||f − gn || = 0.
n→∞
(3) Es gibt eine Folge {gn }n≥p aus T(I, K), die gleichmäßig gegen f konvergiert.
Beweis Dies ist klar.
Eine Abbildung f ∈ B(I, K) heißt Regelfunktion, wenn eine (und damit alle)
der äquivalenten Bedingungen in Lemma 12.3 für f gilt. Die Menge der Regelfunktionen von I nach K wird mit R(I, K) bezeichnet. Es ist klar, dass jede
Treppenfunktion eine Regelfunktion ist, d.h. T(I, K) ⊂ R(I, K).
Satz 12.3 R(I, K) ist ein Untervektorraum von B(I, K).
Beweis Da 0 ∈ T(I, K), ist 0 eine Regelfunktion. Seien f, g ∈ R(I, K), λ, µ ∈ K
und sei ε > 0. Wähle c > 0 mit c ≥ |λ| + |µ|. Da f, g ∈ R(I, K), gibt es
Treppenfunktionen u, v mit ||f − u|| ≤ ε/c und ||g − v|| ≤ ε/c. Nach Satz 12.1
ist dann λf + µg eine Treppenfunktion und es gilt
||(λf + µg) − (λu + µv)|| = ||λ(f − u) + µ(g − v)||
≤ |λ| ||f − u|| + |µ| ||g − v|| ≤ ε .
Dies zeigt, dass λf + µg ∈ R(I, K), und damit ist R(I, K) ein Untervektorraum
von B(I, K).
12 Integration von Regelfunktionen
92
Satz 12.4 Jede stetige Abbildung f : I → K ist eine Regelfunktion.
Beweis Nach Satz 8.5 ist die stetige Abbildung f : I → K gleichmäßig stetig,
da das Intervall I = [a, b] folgenkompakt ist. Sei ε > 0; dann gibt es ein δ > 0,
so dass |f (x) − f (y)| < ε für alle x, y ∈ I mit |x − y| < δ. Wähle nun eine
Unterteilung U = (a0 , . . . , am ) mit aj+1 − aj ≤ δ für jedes 0 ≤ j < m, und sei
g : I → K die Abbildung mit g(x) = f (aj ) für alle x ∈ [aj , aj+1), 0 ≤ j < m, und
mit g(b) = f (b). Dann ist g ∈ T(I, K) und |g(x) − f (x)| < ε für alle x ∈ I, da für
alle x ∈ [aj , aj+1 ) ist |x − aj | < δ und damit |g(x) − f (x)| = |f (aj ) − f (x)| < ε.
Zu jedem ε > 0 gibt es also eine Treppenfunktion g mit ||g − f || ≤ ε. Folglich ist
f eine Regelfunktion.
Satz 12.5 Jede monotone Abbildung f : I → R ist eine Regelfunktion, d.h., ein
Element von R(I, R).
Beweis Ohne Beschränkung der Allgemeinheit nehme an, dass f monoton wachsend ist. Für jedes x ∈ [a, b) sei f (x+) = inf{f (y) : x < y ≤ b} und für jedes
x ∈ (a, b] sei f (x−) = sup{f (y) : a ≤ y < x}. Dann gilt f (x−) ≤ f (x) ≤ f (x+)
für alle x ∈ (a, b), f (a) ≤ f (a+) und f (b−) ≤ f (b). Sei nun ε > 0 und sei {ak }k≥0
die Folge aus I mit a0 = a und
sup{x ∈ I : f (x) < f (ak +) + ε} , falls ak < b,
ak+1 =
b
falls ak = b
für alle k ≥ 0. Ist ak < b, so sieht man leicht, dass ak < ak+1 ; ist ferner ak+1 < b,
so ist f (ak+1+) ≥ f (ak +) + ε und damit
f (ak+1 +) ≥ f (a0 +) + (k + 1)ε ≥ f (ak+1 +) ≥ f (a0 ) + (k + 1)ε .
Daraus ergibt sich dass am = b für ein m ≥ 1 (mit m ≤ 1 + (f (b) − f (a))/ε);
sei also n = min{m ≥ 1 : am = b}. Sei nun g : I → R die Abbildung mit
g(x) = f (aj +) für alle x ∈ (aj , aj+1 ), 0 ≤ j < n, und mit g(aj ) = f (aj ) für
0 ≤ j ≤ n. Dann ist g ∈ T(I, R) und |g(x) − f (x)| ≤ ε für alle x ∈ I, da
|g(x) − f (x)| = |f (aj +) − f (x)| < ε für alle x ∈ (aj , aj+1 ). Zu jedem ε > 0 gibt
es also eine Treppenfunktion g mit |g(x) − f (x)| ≤ ε für alle x ∈ I, und damit
ist f eine Regelfunktion.
Beispiel: Sei f : I → R die Abbildung, die definiert ist durch
1 , falls x ∈ I ∩ Q,
f (x) =
0 , falls x ∈ I \ Q.
Dann sieht man leicht, dass ||f − g|| ≥ 1/2 für jedes g ∈ T(I, R) und damit ist f
keine Regelfunktion.
12 Integration von Regelfunktionen
93
Lemma 12.4 Sei f ∈ R(I, K), sei {gn }n≥p eine Folge von Treppenfunktionen,
Rb
die gleichmäßig gegen f konvergiert, und für jedes n ≥ p setze xn = a f . Dann
konvergiert die Folge {xn }n≥p . Ist ferner {hn }n≥q eine weitere Folge aus T(I, K),
Rb
Rb
die gleichmäßig gegen f konvergiert, so ist lim a hn = lim a gn .
n→∞
n→∞
Beweis Sei ε > 0; dann gibt es ein N ≥ p, so dass |f (x) − gn (x)| < ε/4(b − a)
für alle x ∈ I, n ≥ N und damit gilt ||f − gn || ≤ ε/4(b − a) für alle n ≥ N. Für
alle m, n ≥ N ist also
Z b Z b
Z b
|xn − xm | = gn −
gm = (gn − gm ) ≤ (b − a)||gn − gm ||
a
a
a
= (b − a) ||f − gn || + ||f − gm || ≤ ε/2 < ε ,
und dies zeigt, dass {xn }n≥p eine Cauchy-Folge ist. Damit konvergiert {xn }n≥p
(da jede Cauchy-Folge in K konvergiert). Das gleiche Argument zeigt auch, dass
Rb
Rb
limn→∞ a hn = limn→∞ a gn für jede weitere Folge {hn }n≥q aus T(I, K), die
gleichmäßig gegen f konvergiert.
Sei f ∈ R(I, K) eine Regelfunktion; nach Lemma 12.4 gibt es dann ein eindeutiges
Rb
Element α ∈ K, so dass α = limn→∞ a gn für jede Folge {gn }n≥p aus R(I, K),
die gleichmäßig gegenR f konvergiert. αR heißt das Cauchy-Riemannsche Integral
b
b
von f und wird mit a f (oder etwa a f (x) dx) bezeichnet. (Es gibt hier kein
Problem mit dieser Schreibweise: Für Treppenfunktionen stimmt das CauchyRiemannsche Integral offensichtlich mit dem für Treppenfunktionen definierten
elementaren Integral überein.)
Rb
Satz 12.6 Die Abbildung f 7→ a f von R(I, K) nach K ist linear, d.h.
Z b
Z b
Z b
(λf + µg) = λ
f +µ
g
a
a
a
für alle f, g ∈ R(I, K) und alle λ, µ ∈ K. Ferner gilt |
f ∈ R(I, K).
Rb
a
f | ≤ (b − a)||f || für alle
Beweis Seien f, g ∈ R(I, K) und λ, µ ∈ K. Es gibt also eine Folge {fn }n≥1
(bzw. {gn }n≥1 ) aus T(I, K), die gleichmäßig gegen f (bzw. gegen g) konvergiert.
Wie im Beweis für Satz 12.3 konvergiert dann die Folge von Treppenfunktionen
{λfn + µgn }n≥1 gleichmäßig gegen λf + µg, und daraus folgt, dass
Z b
Z b
Z b Z b
(λf + µg) = lim
(λfn + µgn ) = lim λ
fn + µ
gn
n→∞ a
n→∞
a
a
a
Z b
Z b
Z b
Z b
= λ lim
fn + µ lim
gn = λ
f +µ
g.
n→∞
a
n→∞
a
a
a
12 Integration von Regelfunktionen
94
Rb
Rb
Rb
Damit ist a (λf + µg) = λ a f + λ a g. Sei nun ε > 0; da die Folge {fn }n≥1
Rb
Rb
gleichmäßig gegen f konvergiert und a f = limn→∞ a fn , gibt es ein m ≥ 1, so
Rb
Rb
dass |f (x) − fm (x)| < ε/2(b − a) für alle x ∈ I und | a f − a fm | < ε/2. Daraus
ergibt sich, dass
Z b Z b f < fm + ε/2 ≤ (b − a)||fm || + ε/2
a
a
≤ (b − a) ||f || + ε/2(b − a) + ε/2 = (b − a)||f || + ε
Rb
und daher ist | a f | ≤ (b − a)||f ||.
Lemma 12.5 Das Produkt f g von Regelfunktionen f, g ∈ R(I, K) ist wieder
eine Regelfunktion.
Beweis Setze c = ||f || + ||g|| + 1 und sei ε > 0; dann gibt es Treppenfunktionen
u, v ∈ T(I, K) mit ||f − u|| ≤ min{ε/c, 1} und ||g − v|| ≤ ε/c. Nun ist uv eine
Treppenfunktion und für alle x ∈ I gilt
|f (x)g(x) − u(x)v(x)| = |(f (x) − u(x))g(x) + (g(x) − v(x))u(x)|
≤ |f (x) − u(x)||g(x)| + |g(x) − v(x)|u(x)| ≤ ||f − u|| · ||g|| + ||g − v|| · ||u||
≤ ||f − u|| · ||g|| + ||g − v|| · (||f || + ||f − u||)
≤ ||f − u|| · ||g|| + ||g − v|| · (||f || + 1) ≤ ε .
Damit ist ||f g − uv|| ≤ ε, und dies zeigt, dass f g eine Regelfunktion ist.
Lemma 12.6 Sind f, g ∈ R(I, R) reelle Regelfunktionen mit f ≤ g (d.h., mit
Rb
Rb
f (x) ≤ g(x) für alle x ∈ I), so ist a f ≤ a g.
Beweis Setze h = g − f und sei ε > 0; dann gibt es eine Treppenfunktion
u ∈ T(I, R) mit ||h − u|| ≤ ε/(b − a). Setze nun v = max{u, 0}; dann ist auch
v ∈ T(I, R) und ||h − v|| ≤ ε/(b − a), da |h(x) − v(x)| ≤ |h(x) − u(x)| für alle
Rb
x ∈ I. Aber a v ≥ 0, da v ≥ 0, und damit ist
Z b
Z b
Z b
h≥
(h − v) ≥ − (h − v) ≥ −(b − a)||h − v|| ≥ −ε .
a
Folglich ist
a
Rb
a
a
h ≥ 0 und daher
Rb
a
f≤
Rb
a
g.
Satz 12.7 (Mittelwertsatz der Integralrechnung) Sei f : I → R stetig und
sei g ∈ R(I, R) eine Regelfunktion mit g ≥ 0. Dann gibt es ξ ∈ I, so dass
Z b
Z b
f (x)g(x) dx = f (ξ)
g(x) dx .
a
a
12 Integration von Regelfunktionen
95
Beweis Nach Satz 7.9 und Satz 8.2 ist f (I) ein beschränktes abgeschlossenes
Intervall; es gibt also α, β ∈ R mit α ≤ β, so dass f (I) = [α, β]. Für alle x ∈ I
ist dann αg(x) ≤ f (x)g(x) ≤ βg(x) und daraus folgt nach Lemma 12.6, dass
α
Z
a
b
g(x) dx =
Z
a
b
αg(x) dx ≤
Z
b
a
f (x)g(x) dx ≤
Z
b
βg(x) dx = β
a
Z
b
g(x) dx .
a
Rb
Rb
Rb
Da a g(x) dx ≥ 0, gibt es nun γ ∈ [α, β], so dass a f (x)g(x) dx = γ a g(x) dx.
Aber f (I) = [α, β] und damit gibt es ein ξ ∈ I mit f (ξ) = γ, d.h. mit
Z
b
f (x)g(x) dx = f (ξ)
a
Z
b
g(x) dx .
a
Satz 12.7 wird oft angewendet mit g = 1; in diesem speziellen Fall besagt der
Satz: Sei f : I → R eine stetige Abbildung; dann gibt es ξ ∈ I, so dass
Z b
f (x) dx = f (ξ)(b − a) .
a
Sei U = (a0 , . . . , an ) eine Unterteilung von I und sei S = (ξ1 , . . . , ξn ), wobei
ξk ∈ R mit ξk ∈ [ak−1 , ak ] für jedes k = 1, . . . , n. Dann heißt das Paar Z = (U, S)
eine markierte Unterteilung von I. Die Zahl max{ak − ak−1 : 1 ≤ k ≤ n} wird
dann mit µ(Z) bezeichnet und heißt die Feinheit von Z.
Sei f : I → K eine Abbildung und Z = (U, S) eine markierte Unterteilung von I
mit U = (a0 , . . . , an ) und S = (ξ1 , . . . , ξn ). Dann heißt
S(f, Z) =
n
X
k=1
f (ξk )(ak − ak−1 )
die Riemannsche Summe von f bezüglich Z.
Satz 12.8 Sei f ∈ R(I, K) eine
Regelfunktion. Zu jedem ε > 0 gibt es dann ein
Rb
δ > 0, so dass a f − S(f, Z) < ε für alle markierten Unterteilungen Z von I
mit µ(Z) < δ.
Beweis Zunächst wird der Satz für den speziellen Fall einer Treppenfunktion
bewiesen:
Lemma 12.7 Sei f ∈ T(I,
Zu jedem ε > 0 gibt es
R b K) eine Treppenfunktion.
dann ein δ > 0, so dass a f − S(f, Z) < ε für alle markierten Unterteilungen
Z von I mit µ(Z) < δ.
12 Integration von Regelfunktionen
96
Beweis Da f beschränkt ist, gibt es M ≥ 0, so dass |f (x)| ≤ M für alle x ∈ I;
sei V = (b0 , . . . , bm ) eine Unterteilung für f . Sei nun Z = (U, S) eine markierte
Unterteilung von I mit U = (a0 , . . . , an ) und S = (ξ1 , . . . , ξn ). Definiere eine
Abbildung g : I → K durch
f (ξk ) , falls x ∈ [ak−1 , ak ) für ein k = 1, . . . , n,
g(x) =
f (b) , falls x = b.
Dann ist g eine Treppenfunktion, U ist eine Unterteilung für g und
Z
Z b
n
X
f (ξk )(ak − ak−1 ) =
g=
g.
S(f, Z) =
U
k=1
a
Für jedes k = 1, . . . , n definiere hk : I → K durch
f (x) − g(x) , falls x ∈ [ak−1 , ak ),
hk (x) =
0,
sonst;
P
dann ist hk eine Treppenfunktion und es gilt nk=1 hk = f − g, da g(b) = f (b).
Sei G = {1 ≤ k ≤ n : bj ∈ [ak−1 , ak ) für ein j = 1, . . . , m}; dann ist |G| ≤ m
und man sieht leicht, dass hk = 0, falls k ∈
/ G. Nach Satz 12.2 ist also
Z b
Z b
Z b
Z b
Z bX
n
XZ b
f − S(f, Z) =
f−
g=
(f − g) =
hk =
hk
a
a
a
a
a k=1
k∈G
a
und daraus ergibt sich, dass
Z b
XZ b X
f − S(f, Z) ≤
2M(ak − ak−1 ) ≤ 2Mmµ(Z) .
hk ≤
a
k∈G
a
k∈G
R b
Folglich ist a f − S(f, Z) < ε für alle markierten Unterteilungen Z von I mit
µ(Z) < ε/(2Mm).
Beweis für Satz 12.8: Sei f ∈ R(I, K) eine Regelfunktion und ε > 0. Dann
gibt es eine Treppenfunktion g ∈ T(I, K) mit ||f − g||
≤ ε/3(b − a) und nach
Rb
Lemma 12.7 gibt es ein δ > 0, so dass a g − S(g, Z) < ε/3 für alle markierten
Unterteilungen Z von I mit µ(Z) < δ. Sei nun Z eine markierte Unterteilung
von I mit µ(Z) < δ. Dann gilt
Z b
Z b
Z b
f − S(f, Z) ≤ (f − g) + g − S(g, Z) + S(g − f, Z)
a
a
a
< ||f − g||(b − a) + ε/3 + ||f − g||(b − a) = ε ,
da |S(h, Z)| ≤ ||h||(b − a) für alle h ∈ B(I, K).
12 Integration von Regelfunktionen
97
Lemma 12.8 Sei f ∈ R(I, K), seien c, d ∈ I mit c < d und setze J = [c, d].
Dann ist die Einschränkung fJ von f auf J eine Regelfunktion.
Beweis Sei ε > 0; es gibt also g ∈ T(I, K) mit ||f − g|| < ε. Aber dann is die
Einschränkung gJ von g auf J eine Treppenfunktion und ||fJ −gJ || ≤ ||f −g|| < ε.
Damit ist fJ eine Regelfunktion.
13
Integration und Differentiation
Im Folgenden sei I ein beliebiges Intervall, das mehr als einen Punkt enthält.
Eine Abbildung f : I → K heißt nun Regelfunktion, wenn für alle c, d ∈ I mit
c < d die Einschränkung f[c,d] von f auf [c, d] ein Element von R([c, d], K) ist.
Wenn I = [a, b], so stimmt diese Definition nach Lemma 12.8 mit der Definition
in Kapitel 12 überein.
Die Menge aller Regelfunktionen f : I → K wird mit R(I, K) bezeichnet. Nach
Satz 12.3 ist R(I, K) ein Untervektorraum von Abb(I, K). (Man merke aber, dass
Regelfunktionen im Allgemeinen nicht beschränkt sind.) Da die Einschränkung
einer stetigen Abbildung wieder stetig ist, ist jede stetige Abbildung f : I → K
eine Regelfunktion. Genauso sind monotone Abbildungen von I nach R Regelfunktionen.
Rb
Sei f ∈ R(I, K) und seien a, b ∈ I mit a < b. Dann schreibt man fast immer a f
Rb
statt a f[a,b] für das Integral von f[a,b] .
Lemma 13.1 Für jedes f ∈ R(I, K) und alle a, c, b ∈ I mit a < c < b ist
Z
b
f=
a
Z
c
f+
a
Z
b
f.
c
Beweis Sei {gn }n≥p eine Folge von Treppenfunktionen aus T([a, b], K), die gleichmäßig gegen f[a,b] konvergiert. Dann ist {(gn )[a,c] }n≥p (bzw. {(gn )[c,b] }n≥p ) eine
Folge aus T([a, c], K) (bzw. aus T([c, b], K)), die gleichmäßig gegen f[a,c] (bzw.
Rb
Rc
Rb
gegen f[c,b] ) konvergiert. Ferner ist es klar, dass a gn = a gn + c gn für alle
n ≥ p, und daraus ergibt sich, dass
Z b
Z b
Z c
Z b
Z c
Z b
f = lim
gn = lim
gn + lim
gn =
f+
f.
a
n→∞
a
n→∞
n→∞
a
Für f ∈ R(I, K) ist es nützlich, das ‘Integral’
Z
b
a
f =−
Z
a
c
Rb
a
a
c
f durch
f
b
zu definieren, falls a, b ∈ I mit b < a. Für jedes a ∈ I setzt man schließlich
Z a
f =0.
a
98
13 Integration und Differentiation
99
Lemma 13.2 Sei f ∈ R(I, K); für alle a, b, c ∈ I gilt dann
Z b
Z c
Z b
f=
f+
f.
a
a
c
Beweis Übung.
Ist K = C, so wird I stets als Teilmenge von C betrachtet.
Satz 13.1 Sei f ∈ R(I, K), a ∈ I und definiere eine Abbildung F : I → K durch
Z x
F (x) =
f (t) dt .
a
Ist f an der Stelle b ∈ I stetig, so ist F im Punkt b differenzierbar, und es gilt
F ′ (b) = f (b).
Beweis Sei c ∈ I mit c > b; dann gilt
Z
Z b 1 c
F (c) − F (b)
− f (b) =
f−
f − f (b)
c−b
c−b a
a
Z c
Z
Z c
1
1 c
=
f (t) dt − f (b) =
f (t) dt −
f (b) dt
c−b b
c−b b
b
Z c
1
=
(f (t) − f (b)) dt
c−b b
und daraus ergibt sich, dass
F (c) − F (b)
≤ ||(f − f (b))[b,c]|| = sup{|f (x) − f (b)| : b ≤ x ≤ c} .
−
f
(b)
c−b
Ist dagegen d ∈ I mit d < b, so gilt genauso, dass
F (d) − F (b)
≤ sup{|f (x) − f (b)| : d ≤ x ≤ b} .
−
f
(b)
d−b
Sei nun {xn }n≥p eine Folge aus I \ {b}, die gegen b konvergiert und sei ε > 0. Da
f an der Stelle b stetig ist, gibt es ein δ > 0, so dass |f (x) − f (b)| < ε/2 für alle
x ∈ I mit |x − b| < δ, und dann gibt es ein N ≥ p, so dass |xn − b| < δ für alle
n ≥ N. Für alle n ≥ N ist also
F (xn ) − F (x)
≤ sup{|f (x) − f (b)| : |x − b| < δ} ≤ ε/2 < ε
−
f
(x)
xn − x
und folglich ist limn→∞ (F (xn ) − F (b))/(xn − b) = f (b). Dies zeigt, dass F im
Punkt b differenzierbar ist mit F ′ (b) = f (b).
13 Integration und Differentiation
100
Sei f : I → K eine Abbildung. Eine differenzierbare Abbildung F : I → K heißt
dann Stammfunktion von f , wenn F ′ = f . Nach Satz 13.1 besitzt jede stetige
Abbildung f : I → RK eine Stammfunktion: Wähle einen Punkt a ∈ I; dann ist
x
die Abbildung x 7→ a f (t) dt eine Stammfunktion von f .
Ist F : I → K eine Stammfunktion einer Abbildung f : I → K, so ist F + c auch
eine Stammfunktion von f für jedes c ∈ K, da (F + c)′ = F ′ + 0 = F ′ = f . Die
Umkehrung ist ebenfalls richtig:
Satz 13.2 Sind F und G beide Stammfunktionen einer Abbildung f : I → K, so
ist F − G konstant.
Beweis Setze h = F − G; dann ist h differenzierbar und
h′ = (F − G)′ = F ′ − G′ = f − f = 0 .
Ist K = R, so folgt unmittelbar aus Satz 11.7, dass h konstant ist. Ist dagegen
K = C, so folgt aus Lemma 10.6 und Satz 11.7, dass Re h und Im h konstant
sind, und damit ist h selbt auch konstant.
Beispiele: (1) Seien c0 , . . . , cn ∈ K (mit n ≥ 0) und sei f : I → K gegeben durch
f (x) = c0 + c1 x + c2 x2 + · · · + cn xn .
Dann ist nach Satz 10.6 die Abbildung
1
1
1
x 7→ c0 x + c1 x2 + c2 x3 + · · · +
cn xn+1
2
3
n+1
eine Stammfunktion von f .
(2) Nehme an, dass 0 ∈
/ I und für n ≥ 1 sei gn : I → R gegeben durch
gn (x) =
1
.
xn
Ist n ≥ 2, so ist nach Satz 10.7 die Abbildung
x 7→ −
1
(n − 1)xn−1
eine Stammfunktion von gn . Nach Satz 10.9 ist der natürliche Logarithmus log
eine Stammfunktion von g1 .
(3) Die Exponentialfunktion exp ihre eigene Stammfunktion.
(4) Die Funktion sin ist eine Stammfunktion von cos und die Funktion − cos eine
Stammfunktion von sin.
Das folgende Ergebnis wird Fundamentalsatz der Differential- und Integralrechnung genannt:
13 Integration und Differentiation
101
Satz 13.3 Sei f : I → K eine stetige Abbildung und F : I → K eine Stammfunktion von f . Dann gilt für alle a, b ∈ I
Z b
f (t) dt = F (b) − F (a) .
a
Rx
Beweis Definiere eine Abbildung G : I → K durch G(x) = a f (t) dt. Nach
Satz 13.1 ist G eine Stammfunktion von f , und daraus folgt nach Satz 13.2, dass
G − F konstant ist. Insbesondere ist G(b) − F (b) = G(a) − F (a) und damit ist
Z b
Z a
Z b
F (b) − F (a) = G(b) − G(a) =
f (t) dt −
f (t) dt =
f (t) dt .
a
a
a
Im folgenden Satz seien a, b ∈ R mit a < b und setze J = [a, b].
Satz 13.4 (Substitutionsregel) Sei f : I → K stetig und sei g : J → R eine
stetig differenzierbare Abbildung mit g(J) ⊂ I. Dann gilt
Z b
Z g(b)
′
f (g(t))g (t) dt =
f (x) dx .
a
g(a)
Beweis Sei F : I → K eine Stammfunktion von f . Nach der Kettenregel ist dann
die zusammengesetzte Abbildung F ◦ g : J → K differenzierbar und
(F ◦ g)′(t) = F ′ (g(t))g ′(t) = f (g(t))g ′(t)
für alle t ∈ J. Daraus ergibt sich nach Satz 13.3, dass
Z b
Z b
′
f (g(t))g (t) dt =
(F ◦ g)′ (t) dt
a
a
= (F ◦ g)(b) − (F ◦ g)(a) = F (g(b)) − F (g(a)) =
Z
g(b)
f (x) dx ,
g(a)
da F ◦ g (bzw. F ) eine Stammfunktion von (F ◦ g)′ (bzw. von f ) ist.
√
Beispiel: Nach Satz 13.4 mit f (x) = 1 − x2 und g(t) = sin t ist
Z 1√
Z sin(π/2) √
2
1 − x dx =
1 − x2 dx
−1
sin(−π/2)
=
=
Z
π/2
−π/2
1
2
Z
Z
q
2
1 − sin (t) cos(t) dt =
π/2
−π/2
(1 + cos(2t)) dt =
1π
2 2
π/2
cos2 (t) dt
−π/2
+
π
1
π 1
sin(π) + − sin(−π) = .
2
2 2
2
13 Integration und Differentiation
102
Satz 13.5 (Partielle Integration) Seien f, g : I → K stetig differenzierbare
Abbildungen. Dann gilt für alle a, b ∈ I mit a < b
Z b
Z b
′
f (x)g (x) dx = f (b)g(b) − g(a)g(a) −
g(x)f ′(x) dx .
a
a
Beweis Sei h = f g das Produkt der Abbildungen f und g. Nach der Produktregel
(Satz 10.3 (2)) ist h differenzierbar und h′ (x) = f (x)g ′ (x) + f ′ (x)g(x) für alle
x ∈ I. Damit ist h eine Stammfunktion von f g ′ + f ′ g und daraus folgt nach
Satz 13.3, dass
Z b
Z b
Z b
′
′
f (x)g (x) dx +
f (x)g(x) dx =
(f (x)g ′(x) + f ′ (x)g(x)) dx
a
a
a
= h(b) − h(a) = f (b)g(b) − f (a)g(a) .
Satz 13.6 (Trapezregel) Sei f : I → R zweimal stetig differenzierbar und
seien a, b ∈ I mit a < b. Dann gibt es ξ ∈ [a, b], so dass
Z b
b−a
(b − a)3 ′′
f (x) dx =
(f (a) + f (b)) −
f (ξ) .
2
12
a
Beweis Definere eine Abbildung g : I → R durch g(x) = (x − a)(b − x). Dann
ist g(a) = g(b) = 0, g ′ (x) = a + b − 2x und g ′′ (x) = −2. Durch zweimalige
Anwendung von Satz 13.5 erhält man also, dass
Z b
Z b
′′
′
′
g(x)f (x) dx = g(b)f (b) − g(a)f (a) −
g ′ (x)f ′ (x) dx
a
a
Z b
Z b
′
′
′
′
=−
g (x)f (x) dx = −g (b)f (b) + g (a)f (a) +
g ′′ (x)f (x) dx
a
a
Z b
= (b − a)(f (a) + f (a)) − 2
f (x) dx
a
und daraus ergibt sich, dass
Z
Z b
1 b
b−a
f (a) + f (a) −
(x − a)(b − x)f ′′ (x) dx .
f (x) dx =
2
2
a
a
Aber g(x) = (x − a)(b − x) ≥ 0 für alle x ∈ [a, b], und folglich gibt es nach
Satz 12.11 ein ξ ∈ [a, b], so dass
Z b
Z b
′′
′′
(x − a)(b − x)f (x) dx = f (ξ) (x − a)(b − x) dx
a
a
Z b
Z b−a
′′
′′
= f (ξ)
(x − a)(b − x) dx = f (ξ)
y(b − a − y) dy
a
0
Z b−a
′′
= f (ξ)
(b − a)y − y 2 dy
0
= f ′′ (ξ)
(b − a)
2
(b − a)3
1
(b − a)2 − (b − a)3 =
f ′′ (ξ) .
3
6
13 Integration und Differentiation
103
Satz 13.7 Sei f : I → R zweimal stetig differenzierbar und seien a, b ∈ I mit
a < b. Sei n ∈ N mit n ≥ 1 und setze h = (b − a)/n. Dann ist
Z
!
n−1
b
M
X
1
1
f (x) dx − h
f (a + kh) + f (b) ≤
f (a) +
(b − a)h2 ,
a
12
2
2
k=1
wobei M = sup{|f ′′ (x)| : x ∈ [a, b]}.
Beweis Nach Satz 13.6 ist für jedes k = 0, . . . , n − 1
Z
M
a+(k+1)h
h
f
(a
+
kh)
+
f
(a
+
(k
+
1)h)
h3 ,
f
(x)
dx
−
≤
12
a+kh
2
und daraus ergibt sich, dass
Z
n−1
b
1
X
1
f (a + kh) + f (b) f (x) dx − h f (a) +
a
2
2
k=1
n−1 Z a+(k+1)h
X
h
f (x) dx − f (a + kh) + f (a + (k + 1)h) =
2
a+kh
k=0
Z
n−1 a+(k+1)h
X
h
≤
f (x) dx − f (a + kh) + f (a + (k + 1)h) a+kh
2
≤
k=0
n−1
X
k=0
M 3
M
M
h = n h3 =
(b − a)h2 .
12
12
12
14
Das Riemannsche Integral
Für reellwertige Abbildungen wird manchmal das Riemannsche Integral eingeführt. Dieses ist etwas allgemeiner als das Integral für Regelfunktionen, hat
aber den Nachteil, dass es sich nicht richtig verallgemeinern läßt. Dieses Kapitel
ist für diejenigen, die das Riemannsche Integral kennenlernen wollen.
Sei X eine Menge und f : X → R eine Abbildung. Dann werden Abbildungen
f+ , f− und |f | von X nach R definiert durch
f (x) , falls f (x) > 0,
−f (x) , falls f (x) < 0,
f+ (x) =
f− (x) =
0 , falls f (x) ≤ 0,
0,
falls f (x) ≥ 0,
und |f |(x) = |f (x)| für alle x ∈ X. Dann gilt f+ ≥ 0, f− ≥ 0, f = f+ − f− und
f+ + f− = |f |. Ferner ist f+ = max{f, 0} und f− = max{−f, 0} = − min{f, 0}.
Für jedes A ⊂ X sei χA : X → R die Abbildung, die definiert ist durch
1 , falls x ∈ A,
χA (x) =
0 , falls x ∈
/ A;
χA heißt die charakteristische Funktion von A.
Im Folgenden sei I das Intervall [a, b], wobei a, b ∈ R mit a < b.
Lemma 14.1 (1) Für jedes f ∈ T(I, R) sind f+ , f− und |f | Treppenfunktionen.
(2) Sind f, g ∈ T(I, R), so sind die Abbildungen f g, max{f, g} und min{f, g}
auch Treppenfunktionen.
Beweis Dies ist klar.
Sei
R); nach Lemma 14.1 (2) ist |f | ∈ T(I, R), und nach Satz 12.2 ist
R b f ∈ T(I,
R
f ≤ b |f |, da f ≤ |f | und −f ≤ |f |.
a
a
Lemma 14.2 Sei f : I → R eine beschränkte Abbildung. Dann sind äquivalent:
Rb
Rb
(1) Zu jedem ε > 0 gibt es g, h ∈ T(I, R) mit g ≤ f ≤ h, so dass a h − a g < ε.
(2) Es gibt monotone Folgen {gn }n≥1 und {hn }n≥1 von Treppenfunktionen mit
Rb
Rb
g1 ≤ g2 ≤ · · · ≤ f ≤ · · · ≤ h2 ≤ h1 , so dass lim a gn = lim a hn .
n→∞
(3) Es gilt sup
Rb
a
g : g ∈ T(I, R) mit g ≤ f = inf
104
n→∞
Rb
a
h : h ∈ T(I, R) mit f ≤ h .
14 Das Riemannsche Integral
105
Beweis (2) ⇒ (3) und (3) ⇒ (1) sind klar.
(1) ⇒ (2): Zu jedem n ≥ 1 gibt es nach (1) Treppenfunktionen gn′ , h′n ∈ T(I, R)
Rb
Rb
mit gn′ ≤ f ≤ h′n und a h′n − a gn′ < 1/n. Setze gn = max{gk′ : 1 ≤ k ≤ n} und
hn = min{h′k : 1 ≤ k ≤ n}; nach Lemma 14.1 (2) sind gn , hn ∈ T(I, R) und
g1 ≤ g2 ≤ · · · ≤ f ≤ · · · ≤ h2 ≤ h1 .
Rb
Rb
Ferner ist a hn − a gn < 1/n, da gn′ ≤ gn ≤ hn ≤ h′n , und daraus ergibt sich,
Rb
Rb
dass lim a gn = lim a hn .
n→∞
n→∞
Eine beschränkte Abbildung f : I → R heißt Riemann integrierbar, wenn eine
(und damit alle) der äquivalenten Bedingungen in Lemma 14.2 für f gilt. Die
Menge der Riemann integrierbaren Abbildungen von I nach R wird mit Ri(I)
bezeichnet. Es ist klar, dass T(I, R) ⊂ Ri(I).
Lemma 14.3 Für jedes f ∈ Ri(I) ist −f auch Riemann integrierbar.
Beweis Sei ε > 0; nach Lemma 14.2 (1) gibt es Treppenfunktionen g, h ∈ T(I, R)
Rb
Rb
mit g ≤ f ≤ h, so dass a h − a g < ε. Nach Satz 12.1 sind dann aber −h und
Treppenfunktionen,
Ferner gilt nach Satz 12.2, dass
R−g
Rb
R b und
R b−h ≤R b−f ≤R −g.
b
b
−g − a −h = − a g + a h = a h − a g < ε, und daraus ergibt sich nach
a
Lemma 14.2 (1), dass −f Riemann integrierbar ist.
Satz 14.1 Ri(I) ist ein Untervektorraum von B(I, R).
Beweis Da 0 ∈ T(I, R), ist 0 Riemann integrierbar. Seien f, g ∈ Ri(I) und
λ, µ ∈ R mit λ ≥ 0, µ ≥ 0. Nach Lemma 14.2 (2) gibt es dann monotone Folgen
{sn }n≥1 , {tn }n≥1 , {un }n≥1 und {vn }n≥1 von Treppenfunktionen mit
s1 ≤ s2 ≤ · · · ≤ f ≤ · · · ≤ t2 ≤ t1 und u1 ≤ u2 ≤ · · · ≤ g ≤ · · · ≤ v2 ≤ v1 ,
Rb
Rb
Rb
Rb
so dass limn→∞ a sn = limn→∞ a tn und limn→∞ a un = limn→∞ a vn . Für jedes
n ≥ 1 setze ϕn = λsn + µun und ψn = λtn + µvn . Nach Satz 12.1 sind ϕn und ψn
Treppenfunktionen und ϕ1 ≤ ϕ2 ≤ · · · ≤ λf + µg ≤ · · · ≤ ψ2 ≤ ψ1 ; ferner gilt
nach Satz 12.2 und Satz 5.5, dass
Z b
Z b
Z b
Z b
lim
ϕn = lim
(λsn + µun ) = λ lim
sn + µ lim
un
n→∞ a
n→∞ a
n→∞ a
n→∞ a
Z b
Z b
Z b
Z b
= λ lim
tn + µ lim
vn = lim
(λtn + µvn ) = lim
ψn .
n→∞
a
n→∞
a
n→∞
a
n→∞
a
Daraus folgt nach Lemma 14.2 (2), dass λf + µg Riemann interierbar ist. Dies
zeigt, zusammen mit Lemma 14.3, dass λf + µg Riemann integrierbar ist für alle
f, g ∈ Ri(I) und alle λ, µ ∈ R.
14 Das Riemannsche Integral
106
Lemma 14.4 (1) Die Abbildungen f+ , f− und |f | sind Riemann integrierbar für
jedes f ∈ Ri(I).
(2) Sind f und g Riemann integrierbar, so sind max{f, g} und min{f, g} auch
Riemann integrierbar.
Beweis (1) Sei ε > 0; da f ∈ Ri(I), gibt es g, h ∈ T(I, R) mit g ≤ f ≤ h, so dass
Rb
Rb
h
−
g < ε. Nach Lemma 14.1 (1) sind dann g+ und h+ Treppenfunktionen
a
a
Rb
Rb
und es gilt g+ ≤ f+ ≤ h+ . Ferner ist a h+ − a g+ < ε, da h+ − g+ ≤ h − g,
und dies zeigt, dass f+ Riemann integrierbar ist. Damit sind f− = f+ − f und
|f | = f+ + f− auch Riemann integrierbar.
(2) Dies folgt unmittelbar aus (1) und Satz 14.1, da max{f, g} = 12 (f +g +|f −g|)
und min{f, g} = 21 (f + g − |f − g|).
Lemma 14.5 Das Produkt f g von Riemann integrierbaren Abbildungen f, g ist
Riemann integrierbar.
Beweis Nach Lemma 14.4 (1) sind die Abbildungen f+ , f− , g+ und g− Riemann
integrierbar und f g = (f+ − f− )(g+ − g− ) = f+ g+ + f− g− − f+ g− − f− g+ . Daraus
folgt nach Satz 14.1, dass es genügt, den Satz für den Fall zu beweisen, dass f ≥ 0
und g ≥ 0.
Da f und g beschränkt sind, gibt es N > 0, so dass f (x) ≤ N und g(x) ≤ N
für alle x ∈ I. Sei ε > 0 und setze δ = ε/2N; nach Lemma 14.2 (1) gibt es dann
Rb
Rb
s, t, u, v ∈ T(I, R) mit s ≤ f ≤ t und u ≤ g ≤ v , so dass a t − a s < δ
Rb
Rb
und a v − a u < δ. Da ferner 0 ≤ f ≤ N und 0 ≤ g ≤ N, können nach
Lemma 14.1 (2) s, t, u und v so gewählt werden, dass 0 ≤ s, t ≤ N, 0 ≤ u und
v ≤ N. Nun sind nach Lemma 14.1 (2) su und tv Treppenfunktionen, es gilt
su ≤ f g ≤ tv, da 0 ≤ s ≤ f ≤ t und 0 ≤ u ≤ g ≤ v und nach Satz 12.2 ist
Z b
Z b
Z b
Z b
tv −
su =
(tv − su) =
(tv − tu + tu − su)
a
a
a
a
Z b
Z b
Z b
Z b
=
t(v − u) +
(t − s)u ≤
N(v − u) +
(t − s)N
a
a
a
a
Z b
Z b
Z b Z b
=N
v−
u+
t−
s < 2Nδ = ε .
a
a
a
a
Daraus ergibt sich nach Lemma 14.2 (1), dass f g Riemann integriebar ist.
Satz 14.2 Ist {fn }n≥p eine Folge aus Ri(I), die gleichmäßig gegen f : I → R
konvergiert, so ist f Riemann integrierbar. Insbesondere ist jede Regelfunktion
Riemann integrierbar, d.h., R(I, R) ⊂ Ri(I).
14 Das Riemannsche Integral
107
Beweis Sei ε > 0 und setze η = ε/4(b − a); da {fn }n≥p gleichmäßig gegen f
konvergiert, gibt es ein m ≥ p, so dass |fm (x) − f (x)| < η für alle x ∈ I, und da
Rb
Rb
fm ∈ Ri(I), gibt es u, v ∈ T(I, R) mit u ≤ fm ≤ v, so dass a v − a u < ε/2. Sei
g = u − η, h = v + η; dann sind g und h Treppenfunktionen mit g ≤ f ≤ h, da
g = u − η ≤ fm − η ≤ f ≤ fm + η ≤ v + η = h, und es gilt
Z b
Z b
Z b
Z b
Z b Z b
Z b
h−
g=
(v +η)− (u−η) =
v − u+ 2η < ε/2+2η(b−a) = ε .
a
a
a
a
a
a
a
Damit ist f Riemann integrierbar.
Beispiel: Sei f : I → R die Abbildung, die definiert ist durch
1 , falls x ∈ I ∩ Q,
f (x) =
0 , falls x ∈ I \ Q.
Sind g, h ∈ T(I, R) Treppenfunktionen mit g ≤ f ≤ h, so sieht man leicht, dass
Rb
Rb
Rb
Rb
g ≤ 0 und a h ≥ b − a; insbesondere ist a h − a g ≥ b − a. Folglich ist f
a
nicht Riemann integrierbar.
Es gibt aber Riemann integrierbare Abbildungen, die keine Regelfunktionen sind.
Ein typisches Beispiel ist χC mit C einer Cantor-Menge. (Man siehe: Aufgaben
3 und 4, Blatt 1, Analysis II.)
Lemma 14.6 Für jedes f ∈ Ri(I) gibt es eine eindeutige Zahl κ(f ) ∈ R, so
Rb
Rb
dass a g ≤ κ(f ) für jede Treppenfunktion g ≤ f und a h ≥ κ(f ) für jede
Treppenfunktion h ≥ f .
Beweis Dies folgt unmittelbar aus Lemma 14.2 (3), und es gilt natürlich
Z
b
sup
g : g ∈ T(I, R) mit g ≤ f
a
Z
b
h : h ∈ T(I, R) mit f ≤ h .
= κ(f ) = inf
a
Lemma 14.7 Sei {fn }n≥p eine Folge aus Ri(I), die gleichmäßig gegen f ∈ Ri(I)
konvergiert. Dann konvergiert die Folge {κfn }n≥p gegen κ(f ). Insbesondere ist
Rb
κ(f ) = a f für jede Regelfunktion f ∈ R(I, R).
Beweis Übung.
Sei f ∈ Ri(I); die in Lemma 14.6 definierte Zahl κ(f ) heißt das Riemannsche
Rb
Integral von f und wird mit a f bezeichnet. (Es gibt kein Problem mit dieser
Schreibweise, da nach Lemma 14.7 das Riemannsche Integral für Regelfunktionen
mit dem für Regelfunktionen definierten Integral übereinstimmt.)
14 Das Riemannsche Integral
Lemma 14.8 Für jedes f ∈ Ri(I) ist
Beweis Übung.
Satz 14.3 Die Abbildung f 7→
Z
b
Rb
a
108
Rb
a
−f = −
Rb
f.
a
f von Ri(I) nach R ist linear, d.h.
(λf + µg) = λ
a
Z
b
f +µ
a
Z
b
g
a
für alle f, g ∈ Ri(I) und alle λ, µ ∈ R, und monoton, d.h.
f, g ∈ Ri(I) mit f ≤ g.
Rb
a
f ≤
Rb
a
g, falls
Beweis Seien f, g ∈ Ri(I) und λ, µ ∈ R mit λ ≥ 0, µ ≥ 0. Sei ε > 0 und setze
δ = ε/(λ + µ + 1); nach Lemma 14.2 (1) gibt es dann s, t, u, v ∈ T(I, R) mit
Rb
Rb
Rb
Rb
s ≤ f ≤ t und u ≤ g ≤ v, so dass a t − a s < δ und a v − a u < δ. Nun ist
nach Satz 12.1 λt + µv eine Treppenfunktion und λt + µv ≥ λf + µg. Folglich gilt
Z b
Z b
Z b
Z b
Z b
Z b
(λf + µg) − λ
f −µ
g≤
(λt + µv) − λ
s−µ
u
a
a
a
a
a
a
Z b Z b Z b
Z b
=λ
t−
s +µ
v−
u ≤ λδ + µδ < ε .
a
a
a
a
Aber λs + µu ist auch eine Treppenfunktion, und λs + µu ≤ λf + µg. Also ist
Z b
Z b
Z b
Z b
Z b
Z b
(λf + µg) − λ
f −µ
g≥
(λs + µu) − λ
t−µ
v
a
a
a
a
a
a
Z b Z b Z b
Z b
=λ
s−
t +µ
u−
v ≥ −λδ − µδ > −ε .
a
a
a
a
Rb
Rb
Rb
Daraus ergibt sich, dass a (λf + µg) = λ a f + λ a g. Dies zeigt, zusammen mit
Rb
Rb
Rb
Lemma 14.8, dass a (λf + µg) = λ a f + λ a g für alle f, g ∈ Ri(I) und alle
Rb
λ, µ ∈ R. Die Abbildung f 7→ a f von Ri(I) nach R ist also linear.
Seien nun f, g ∈ Ri(I) mit f ≤ g. Dann ist g − f ∈ Ri(I) und g − f ≥ 0. Aber 0
Rb
Rb
Rb
Rb
ist eine Treppenfunktion und folglich ist 0 = a 0 ≤ a (g − f ) = a g − a f , d.h.
Rb
Rb
f ≤ a g.
a
Sei f ∈ Ri(I) Riemann integrierbar; nach Lemma 14.4 (1) ist dann |f | auch
Riemann integrierbar und nach Satz 14.3 ist (da f ≤ |f | und −f ≤ |f |)
Z b Z b
f ≤
|f | .
a
a
14 Das Riemannsche Integral
109
Satz 14.4 (Mittelwertsatz der Integralrechnung) Sei f : I → R stetig und
sei g ∈ Ri(I) Riemann integrierbar mit g ≥ 0. Dann gibt es ξ ∈ I, so dass
Z
b
f (x)g(x) dx = f (ξ)
a
Z
b
g(x) dx .
a
Beweis Dieser ist identisch mit dem Beweis für Satz 12.7.
Satz 14.5 Sei f ∈ Ri(I) Riemann
integrierbar. Zu jedem ε > 0 gibt es dann ein
Rb
δ > 0, so dass a f − S(f, Z) < ε für alle markierten Unterteilungen Z von I
mit µ(Z) < δ.
Beweis Sei f ∈ Ri(I) und ε > 0. Nach Lemma 14.2 gibt es dann g, h ∈ T(I, R)
Rb
Rb
mit g ≤ f ≤ h, so dass a h − a g < ε/2, und nach Lemma 12.7 gibt es δ > 0,
R b
R b
so dass a g − S(g, Z) < ε/2 und a h − S(h, Z) < ε/2 für alle markierten
Unterteilungen Z von I mit µ(Z) < δ. Sei nun Z eine markierte Unterteilung
von I mit µ(Z) < δ. Es ist dann klar, dass S(g, Z) ≤ S(f, Z) ≤ S(h, Z) und
daraus ergibt sich, dass
Z b
Z b
f − S(f, Z) ≤
h − S(g, Z)
a
a
Z b
Z b
Z b
=
h−
g+
g − S(g, Z) < ε/2 + ε/2 = ε ,
a
a
a
und genauso gilt
Z b
Z b
f − S(f, Z) ≥
g − S(h, Z)
a
a
Z b
Z b
Z b
=
g−
h+
h − S(h, Z) > −ε/2 − ε/2 = −ε .
a
R b
Damit ist a f − S(f, Z) < ε.
a
a
Literatur
[1] Amman, H., Escher, J. (1996): Analysis I. Birkhäuser
[2] Carathéodory, C. (1927): Vorlesungen Über reelle Funktionen. Teubner
[3] Courant, R. (1929): Vorlesungen über Differential- und Integralrechnung.
Springer
[4] Dieudonné, J. (1960): Foundations of Modern Analysis. Academic Press
[5] Forster, O. (1980): Analysis 1. Differential- und Integralrechnung einer
Veränderlichen. vieweg
[6] Forster, O., Wessoly, R. (1986): Übungsbuch zu Analysis 1. wieweg
[7] Hardy, G.H. (1902): A Course of Pure Mathematics. Cambridge University
Press
[8] Königsberger, K. (1999): Analysis 1. Springer
[9] Landau, E. (1930): Grundlagen der Analysis. Chelsea
[10] Lang, S. (1993): Real and Functional Analysis. Springer
(früher: Real Analysis. Addison-Wesley 1968)
[11] Lang, S. (1983): Undergraduate Analysis. Springer
(früher: Analysis I. Addison-Wesley 1968)
[12] Walter, W. (1999): Analysis I. Springer
110
Index
Abbildung, 48
n-mal differenzierbare, 77
n-mal stetig differenzierbare, 77
affine, 68
beschränkte, 89
differenzierbare, 68, 74, 80
gleichmäßig stetige, 59
konvexe, 84
linksseitig differenzierbare, 78
rechtsseitig differenzierbare, 77
Riemann integrierbare, 105
stetige, 49
abgeleitete Größer-Relation, 14
abgeschlossene Menge, 53
Ableitung, 68, 76
linksseitige, 78
rechtsseitige, 78
zweite, 77
absolut konvergente Reihe, 42
Addition, 12
affine Abbildung, 68
angeordneter Körper, 13
Ball
offener, 52
beschränkt, 22, 29
beschränkte Abbildung, 89
beschränkte Folge, 32
Betrag, 16, 28
Cauchy-Folge, 36
Cauchy-Riemannsches Integral, 93
charakteristische Funktion, 104
Cosinus-Funktion, 61
differenzierbare Abbildung, 68, 74, 80
Einheit
imaginäre, 28
Eins, 12
Einselement, 12
erweiterte Zahlengerade, 25
Eulersche Formel, 61
Eulersche Zahl, 45
Exponentialfunktion, 45
Exponentialreihe, 45
Extremum
lokales, 80
Feinheit einer Unterteilung, 95
Folge, 30
beschränkte, 32
konvergente, 30, 54
monoton fallende, 34
monoton wachsende, 34
monotone, 34
streng monoton fallende, 34
streng monoton wachsende, 34
folgenkompakte Menge, 58
Formel
Eulersche, 61
Funktion, 48
charakteristische, 104
Funktionenfolge
gleichmäßig konvergente, 91
geometrische Reihe, 39
gleichmäßig stetige Abbildung, 59
Größer-Relation
abgeleitete, 14
Grenzwert, 30
Häufungspunkt, 67
harmonische Reihe, 40
imaginäre Einheit, 28
Imaginärteil, 28
Infimum, 19
Innere, 80
innerer Punkt, 80
Integral, 90
Cauchy-Riemannsches, 93
111
112
Index
Riemannsches, 107
Intervall, 24
Körper, 12
angeordneter, 13
Körper der reellen Zahlen, 21
Körpererweiterung, 19
ordnungsvollständige, 21
Körperhomomorphismus, 21
Körperisomorphismus, 21
komplexe Zahl
konjugierte, 28
konjugierte komplexe Zahl, 28
konvergente Folge, 30, 54
konvexe Abbildung, 84
Limes, 30
Limes inferior, 37
Limes superior, 37
linear approximierbar, 68
linksseitige Ableitung, 78
Logarithmus
natürlicher, 57
lokales Extremum, 80
lokales Maximum, 80
lokales Minimum, 80
markierte Unterteilung, 95
Maximum, 23
lokales, 80
Menge
abgeschlossene, 53
folgenkompakte, 58
offene, 52
perfekte, 74
Minimum, 23
lokales, 80
monoton fallende Folge, 34
monoton wachsende Folge, 34
monotone Folge, 34
Multiplikation, 12
nach oben beschränkt, 19
nach unten beschränkt, 19
natürlicher Logarithmus, 57
Null, 12
Nullelement, 12
obere Schranke, 19
offene Menge, 52
offener Ball, 52
perfekte Menge, 74
Punkt
innerer, 80
Realteil, 28
rechtsseitige Ableitung, 78
Regelfunktion, 91, 98
Reihe
absolut konvergente, 42
geometrische, 39
harmonische, 40
unendliche, 39
Riemann integrierbar, 105
Riemannsche Summe, 95
Riemannsches Integral, 107
Schranke
obere, 19
untere, 19
Sinus-Funktion, 61
Stammfunktion, 100
stetige Abbildung, 49
Subtraktion, 13
Summe
einer Reihe, 39
Riemannsche, 95
Supremum, 19
Teilfolge, 34
Treppenfunktion, 89
unendliche Reihe, 39
untere Schranke, 19
Unterkörper, 26
Unterteilung, 89
markierte, 95
Index
Verfeinerung einer Unterteilung, 89
Zahlengerade
erweiterte, 25
zweite Ableitung, 77
113
Herunterladen