Ein Skript für Analysis I

Ein Skript für Analysis I
Chris Preston
Wintersemester 2001/02
1
2
Dies ist ein Skript für Analysis I. Die Texte von Lang [10], Königsberger [8] und
Amman und Escher [1] haben die Darstellung beeinflusst.
Chris Preston
Februar, 2003
3
Inhaltsverzeichnis
1
Mengen und Abbildungen
4
2
Der Körper der rationalen Zahlen
12
3
Der Körper der reellen Zahlen
19
4
Der Körper der komplexen Zahlen
26
5
Folgen
30
6
Unendliche Reihen
39
7
Stetige Funktionen
48
8
Folgenkompaktheit
58
9
Trigonometrische Funktionen
61
10 Differentiation
67
11 Mittelwertsätze
80
12 Integration von Regelfunktionen
89
13 Integration und Differentiation
98
14 Das Riemannsche Integral
104
Literatur
110
Index
111
1
Mengen und Abbildungen
Sind α und β (mathematische) Objekte, so bedeutet α = β, dass sie gleich sind.
Sind sie nicht gleich, so schreibt man α 6= β. Die wichtigsten Typen von Objekten
sind Mengen und Abbildungen.
Ist X eine Menge und x ein Objekt, so bedeutet x ∈ X, dass x ein Element von
X ist. Ist x kein Element von X, so schreibt man x ∈
/ X.
Fakt 1 Mengen X und Y sind genau dann gleich, wenn sie aus den gleichen
Elementen bestehen, d.h., wenn für jedes Objekt x gilt: x ∈ X genau dann, wenn
x∈Y.
Bekannte Mengen sind:
— Die Menge N = {0, 1, 2, . . . } der natürlichen Zahlen.
— Die Menge Z = { . . . , −2, −1, 0, 1, 2, . . . } der ganzen Zahlen.
— Die Menge Q der rationalen Zahlen.
Eine Menge Y heißt Teilmenge einer Menge X (geschrieben Y ⊂ X), wenn jedes
Element von Y auch zu X gehört, d.h., wenn y ∈ X für jedes y ∈ Y . Insbesondere
gilt N ⊂ Z ⊂ Q.
Lemma 1.1 Für Mengen X und Y gilt X = Y genau dann, wenn X ⊂ Y und
Y ⊂ X.
Beweis Übung.
Sei X eine Menge. Ist E(x) ein Ausdruck, der eine Aussage darstellt, wenn für x
ein Element von X eingesetzt wird, so heißt E Eigenschaft auf X.
Fakt 2 Sei X eine Menge und sei E eine Eigenschaft auf X; dann gibt es eine
(eindeutige) Teilmenge von X, die aus allen Elementen x von X besteht, für die
E(x) wahr ist; sie wird mit {x ∈ X : E(x)} bezeichnet.
Zum Beispiel sei E(n) der Ausdruck 3 < n < 7; dann ist E eine Eigenschaft auf
N und {n ∈ N : 3 < n < 7} ist die Teilmenge von N, die aus den Elementen 4, 5
und 6 besteht.
Sei Y Teilmenge einer Menge X und sei E(x) der Ausdruck x ∈
/ Y . Dann ist E
eine Eigenschaft auf X und die Teilmenge {x ∈ X : x ∈
/ Y } von X wird mit
X \ Y bezeichnet. Sie heißt das Komplement von Y (in X).
4
1 Mengen und Abbildungen
5
Fakt 3 Es gibt eine Menge ∅, die kein Element enthält: Für jedes Objekt x gilt
also x ∈
/ ∅. Die Menge ∅ heißt leere Menge.
Lemma 1.2 Die leere Menge ∅ ist eindeutig, d.h. sie ist die einzige Menge, die
kein Element enthält: Ist ∅′ eine Menge mit x ∈
/ ∅′ für jedes Objekt x, so ist
∅′ = ∅.
Beweis Übung.
Die leere Menge ist Teilmenge jeder Menge, d.h., ∅ ⊂ X für jede Menge X. Eine
Menge X heißt nichtleer, wenn X 6= ∅, d.h., wenn es mindestens ein Objekt x
mit x ∈ X gibt.
Fakt 4 Sind x1 , . . . , xn endlich viele Objekte, so gibt es eine (eindeutige) Menge
P , die genau aus diesen Elementen besteht: Ist w eine Objekt, so gilt w ∈ P genau
dann, wenn w = xk für (mindestens) ein k = 1, . . . , n. Diese Menge P wird mit
{x1 , . . . , xn } bezeichnet.
Sei I eine nichtleere Menge und für jedes i ∈ I sei Xi eine Menge. Dann heißt
{Xi : i ∈ I} Familie von Mengen und I die Indexmenge für diese Familie. (Man
merke, dass es hier nicht verlangt wird, dass Xi 6= Xj , falls i 6= j.) Das einfachste
Beispiel ist mit I = [n] für ein n ≥ 1, wobei [n] die Teilmenge {1, 2, . . . , n}
von N bezeichnet. Eine Familie {Xi : i ∈ [n]} besteht also aus den n Mengen
X1 , . . . , Xn .
Fakt 5 Zu jeder Familie {Xi : i ∈ I} von Mengen gibt es eine (eindeutige)
Menge V mit der Eigenschaft: Für jedes Objekt x gilt x ∈ V genau dann, wenn
x ∈ Xi für (mindestens) ein i ∈ I. Die Menge
V heißt Vereinigung der Mengen
S
in der Familie {Xi : i ∈ I} und wird mit i∈I Xi bezeichnet.
Fakt 6 Zu jeder Familie {Xi : i ∈ I} von Mengen gibt es eine (eindeutige)
Menge D mit der Eigenschaft: Für jedes Objekt x gilt x ∈ D genau dann, wenn
x ∈ Xi für alle i ∈ I. Die Menge
D heißt Durchschnitt der Mengen in der Familie
T
{Xi : i ∈ I} und wird mit i∈I Xi bezeichnet.
Sind X1 , . . . , Xn endlich viele Mengen, so wird die Vereinigung (bzw. derSDurchschnitt) der Mengen in derTFamilie {Xi : i ∈ [n]} mit X1 ∪ · · · ∪ Xn oder nk=1 Xk
(bzw. X1 ∩ · · · ∩ Xn oder nk=1 Xk ) bezeichnet.
1 Mengen und Abbildungen
6
Fakt 7 Zu jeder Menge X gibt es eine (eindeutige) Menge P(X), deren Elemente
genau die Teilmengen von X sind. Für jedes Objekt Y gilt also Y ∈ P(X) genau
dann, wenn Y eine Menge ist mit Y ⊂ X. Die Menge P(X) heißt Potenzmenge
von X.
Da ∅ ⊂ X, ist ∅ ∈ P(X); insbesondere ist P(X) stets nichtleer. Die Menge
P(∅) besteht aus dem einzigen Element ∅, d.h., P(∅) = {∅}.
Seien X und Y Mengen. Eine Abbildung oder eine Funktion f von X nach Y ist
eine Vorschrift, die jedem Element von X genau ein Element von Y zuordnet. Das
dem Element x ∈ X zugeordnete Element von Y wird mit f (x) bezeichnet. Ist f
eine Abbildung, so schreibt man f : X → Y um zu zeigen, dass f eine Abbildung
von X nach Y ist. Ist f : X → Y eine Abbildung, so heißt X Definitionsbereich
von f und wird mit dom(f ) bezeichnet. Die Teilmenge von Y
{y ∈ Y : es gibt ein x ∈ X mit y = f (x)}
heißt Bild von f und wird mit im(f ) bezeichnet.
Fakt 8 Abbildungen f : X → Y und f ′ : X ′ → Y ′ sind genau dann gleich, wenn
gilt: X = X ′ , Y = Y ′ und f (x) = f ′ (x) für jedes x ∈ X.
Für jede Menge Y gibt es genau eine Abbildung von ∅ nach Y . Es gibt eine
Abbildung von einer Menge X nach ∅ genau dann, wenn X = ∅.
Einfache Beispiele von Abbildungen sind:
(1) Für jede Menge X gibt es die Identitätsabbildung idX : X → X, die definiert
ist durch idX (x) = x für jedes x ∈ X.
(2) Ist X eine Menge und Y eine Teilmenge von X, so gibt es die Inklusionsabbildung inY,X : Y → X, die definiert ist durch inY,X (y) = y für jedes y ∈ Y .
Insbesondere ist idX = inX,X .
(3) Sind X und Y Mengen, so gibt es für jedes y ∈ Y die konstante Abbildung
cony : X → Y , die definiert ist durch cony (x) = y für jedes x ∈ X.
Fakt 9 Sind X, Y, Z Mengen und f : X → Y und g : Y → Z Abbildungen, so
gibt es die Abbildung g ◦ f : X → Z, die definiert ist durch (g ◦ f )(x) = g(f (x))
für alle x ∈ X. Diese Abbildung heißt die Komposition von f und g und wird oft
lediglich mit gf bezeichnet.
Für jede Abbildung f : X → Y gilt f ◦ idX = f = idY ◦ f .
1 Mengen und Abbildungen
7
Lemma 1.3 (Assoziativität der Komposition) Seien W, X, Y, Z Mengen
und f : W → X, g : X → Y und h : Y → Z Abbildungen. Dann gilt
h ◦ (g ◦ f ) = (h ◦ g) ◦ f .
Beweis Übung.
Aufgrund der Assoziativität ist es unnötig, bei Kompositionen Klammern zu
setzen, d.h., die Abbildung in Lemma 1.3 kann einfach mit h ◦ g ◦ f bezeichnet
werden.
Ist f : X → Z eine Abbildung und Y eine Teilmenge von X, so gibt es die
Abbildung f|Y = f ◦ inY,X ; also ist f|Y : Y → Z definiert durch f|Y (y) = f (y) für
jedes y ∈ Y und heißt Restriktionsabbildung. Insbesondere ist f|X = f .
Eine Abbildung f : X → Y heißt injektiv, wenn f (x) 6= f (x′ ) für alle x, x′ ∈ X
mit x 6= x′ , surjektiv, wenn es zu jedem y ∈ Y ein x ∈ X mit y = f (x) gibt (d.h.,
wenn im(f ) = Y ), und bijektiv, wenn sie injektiv und surjektiv ist.
Für jede Menge X ist die Identitätsabbildung idX : X → X bijektiv. Ist Y eine
Teilmenge von X, so ist die Inklusionsabbildung inY,X : Y → X injektiv; sie ist
aber nur dann surjektiv, wenn Y = X. Ist f : X → Z eine injektive Abbildung,
so ist die Restriktionsabbildung f|Y : Y → Z auch injektiv für jede Teilmenge Y
von X.
Lemma 1.4 Seien f : X → Y und g : Y → Z Abbildungen. Sind f und g
injektiv (bzw. surjektiv bzw. bijektiv), so ist die Komposition g ◦ f auch injektiv
(bzw. surjektiv bzw. bijektiv).
Beweis Übung.
Lemma 1.5 Seien X, Y Mengen und sei f : X → Y eine Abbildung.
(1) Gibt es eine Abbildung g : Y → X mit g ◦ f = idX , so ist f injektiv.
(2) Ist X nichtleer und ist f injektiv, so gibt es eine Abbildung g : Y → X mit
g ◦ f = idX .
(3) Gibt es eine Abbildung g : Y → X mit f ◦ g = idY , so ist f surjektiv.
(4) Ist f surjektiv, so gibt es eine Abbildung g : Y → X mit f ◦ g = idY .
Beweis Übung.
Im Beweis für Lemma 1.5 (4) wird das so genannte Auswahlaxiom benötigt:
1 Mengen und Abbildungen
8
Fakt 10 Sei {Xi : i ∈ S
I} eine Familie von nichtleeren Mengen. Dann existiert
eine Abbildung f : I → i∈I Xi mit f (i) ∈ Xi für jedes i ∈ I.
Satz 1.1 Eine Abbildung f : X → Y ist genau dann bijektiv, wenn es eine
Abbildung g : Y → X mit g ◦ f = idX und f ◦ g = idY gibt. In diesem Fall ist g
eindeutig bestimmt.
Beweis Die Behauptung ist trivial richtig, falls X = ∅; es kann also angenommen
werden, dass X nichleer ist.
Nehme zunächst an, dass es eine Abbildung g : Y → X mit g ◦ f = idX und
f ◦ g = idY gibt. Nach Lemma 1.5 (1) (bzw. nach Lemma 1.5 (3)) ist f dann
injektiv (bzw. surjektiv) und damit ist f bijektiv.
Nehme nun umgekehrt an, dass f bijektiv ist. Insbesondere ist f injektiv, und
folglich gibt es nach Lemma 1.5 (4) eine Abbildung g : Y → X mit g ◦ f = idX .
Aber dann gilt auch f ◦ g = idY : Sei y ∈ Y ; da f surjektiv ist, gibt es ein x ∈ X
mit y = f (x) und daraus folgt, dass
(f ◦ g)(y) = (f ◦ g)(f (x)) = ((f ◦ g) ◦ f )(x) = (f ◦ (g ◦ f ))(x)
= (f ◦ idX )(x) = f (idX (x)) = f (x) = y = idY (y) .
Dies zeigt, dass (f ◦g)(y) = idY (y) für alle y ∈ Y , d.h., f ◦g = idY . Schließlich muss
die Eindeutigkeit von g nachgewiesen werden: Seien g, g ′ : Y → X Abbildungen
mit g ◦ f = idX , f ◦ g = idY , g ′ ◦ f = idX und f ◦ g ′ = idY . Dann gilt
g ′ = g ′ ◦ idY = g ′ ◦ (f ◦ g) = (g ′ ◦ f ) ◦ g = idX ◦ g = g .
Sei f : X → Y eine bijektive Abbildung; nach Satz 1.1 gibt es eine eindeutige
Abbildung g : Y → X mit g ◦ f = idX und f ◦ g = idY . Diese Abbildung g heißt
die Umkehrabbildung von f und wird mit f −1 bezeichnet, es gilt also f −1 ◦f = idX
und f ◦ f −1 = idY . Offensichtlich ist id−1
X = idX für jede Menge X.
Lemma 1.6 Sind f : X → Y und g : Y → Z bijektive Abbildungen, so ist
(g ◦ f )−1 = f −1 ◦ g −1 .
(Erinnerung: Nach Lemma 1.4 ist die Abbildung g ◦ f : X → Z bijektiv.)
Beweis Übung.
Sei f : X → Y eine Abbildung. Für jedes A ⊂ X heißt die Teilmenge von Y
{y ∈ Y : es gibt ein x ∈ A mit y = f (x)}
1 Mengen und Abbildungen
9
das Bild von A unter f und wird mit f (A) bezeichnet. Insbesondere ist f (X) das
Bild von f , d.h., f (X) = im(f ). Für jedes B ⊂ Y heißt die Teilmenge von X
{x ∈ X : f (x) ∈ B}
das Urbild von B unter f und wird mit f −1 (B) bezeichnet. Es gibt eigentlich kein
Problem mit dieser Schreibweise, wenn f : X → Y eine bijektive Abbildung ist,
da in diesem Fall das Bild einer Teilmenge B von Y unter der Umkehrabbildung
f −1 gleich dem Urbild von B unter f ist.
Fakt 11 Seien X, Y Mengen; dann gibt es eine (eindeutige) Menge Abb(X, Y ),
deren Elemente genau die Abbildungen von X nach Y sind. Für jedes Objekt f
gilt also f ∈ Abb(X, Y ) genau dann, wenn f eine Abbildung von X nach Y ist.
Sei {Xi : i ∈ I} eine Familie von Mengen und setze V =
S
i∈I
Xi . Die Menge
{f ∈ Abb(I, V ) : f (i) ∈ Xi für alle i ∈ I}
heißtQdas (cartesische) Produkt der Mengen in der Familie {Xi : i ∈ I} und wird
mit i∈I Xi bezeichnet.
LemmaQ
1.7 Ist {Xi : i ∈ I} eine Familie von nichtleeren Mengen, so ist das
Produkt i∈I Xi auch nichtleer.
Beweis Dies ist lediglich eine Umformulierung des Auswahlaxioms.
Seien X1 , . . . , Xn endlich viele Mengen;Qin diesem Fall wird das Produkt der
Mengen in der Familie {Xi : i ∈ [n]} mit nk=1 Xk oder X1 × · · · × Xn bezeichnet.
S
Die Menge X1 × · · · × Xn besteht also aus allen Abbildungen f : [n] → nk=1 Xk
mit f (k) ∈ Xk für jedes k. Für jedes k = 1, . . . , n sei xk ∈ Xk ; dann gibt
es ein eindeutiges Element f ∈ X1 × · · · × Xn mit f (k) = xk für jedes k und
dieses Element wird mit (x1 , . . . , xn ) bezeichnet. Ist umgekehrt f ein Element
von X1 × · · · × Xn , so gibt es für jedes k ein eindeutiges xk ∈ Xk , so dass
f = (x1 , . . . , xn ). Insbesondere gilt (x1 , . . . , xn ) = (x′1 , . . . , x′n ) genau dann, wenn
xk = x′k für jedes k. Das Produkt X1 ×· · ·×Xn kann also als Menge aller n-Tupeln
(x1 , . . . , xn )
angesehen werden, wobei xk ∈ Xk für jedes k = 1, . . . , n.
Seien X und Y Mengen; dann kann und wird das Produkt X × Y angesehen
werden als Menge aller geordneten Paare (x, y) mit x ∈ X und y ∈ Y , wobei
‘geordnet’ hier bedeutet, dass (x, y) = (x′ , y ′) genau dann, wenn x = x′ und
y = y′.
1 Mengen und Abbildungen
10
Sei X eine Menge; eine Teilmenge R von X ×X wird oft als (binäre) Relation auf
X angesehen. In diesem Fall schreibt man meistens x1 R x2 statt (x1 , x2 ) ∈ R.
Für jede Menge X gibt es die Relationen = und 6= auf X sowie die Relation ⊂
auf P(X). Auf den Mengen N, Z und Q gibt es ferner die Ordnungsrelationen <,
≤, > und ≥.
Eine Relation R auf einer Menge X heißt
— reflexiv, wenn x R x gilt für jedes x ∈ X,
— transitiv, wenn aus x1 R x2 und x2 R x3 stets x1 R x3 folgt,
— symmetrisch, wenn x2 R x1 gilt für alle x1 , x2 ∈ X mit x1 R x2 ,
— antisymmetrisch, wenn aus x1 R x2 und x2 R x1 stets x1 = x2 folgt.
Die Relationen =, ⊂, ≤ und ≥ sind reflexiv, =, ⊂, <, ≤, > und ≥ sind transitiv, =
und 6= sind symmetrisch und die Relationen =, ⊂, ≤ und ≥ sind antisymmetrisch.
Eine Relation ∼ auf X, die reflexiv, symmetrisch und auch transitiv ist, heißt
Äquivalenzrelation auf X. Insbesondere ist = eine Äquivalenzrelation.
Wichtiges Beispiel: Sei Q = Z × Z× , wobei Z× = Z \ {0} und definiere eine
Relation ∼ auf Q durch: (m1 , n1 ) ∼ (m2 , n2 ) genau dann, wenn m1 n2 = m2 n1 .
Dann sieht man leicht, dass ∼ eine Äquivalenzrelation auf Q ist. (Natürlich wird
das Element (m, n) von Q normalerweise mit m/n bezeichnet.)
Im Folgenden sei ∼ eine Äquivalenzrelation auf einer Menge X. Setze
[x] = {y ∈ X : y ∼ x}
für jedes x ∈ X; [x] heißt die Äquivalenzklasse (oder Restklasse) von x. Dann gilt
insbesondere x ∈ [x] für jedes x ∈ X, da ∼ reflexiv ist.
Sind x, y ∈ X, so bedeutet x 6∼ y, dass x ∼ y nicht gilt.
Lemma 1.8 (1) Seien x, y ∈ X mit x ∼ y; dann ist [x] = [y].
(2) Seien x, y ∈ X mit x 6∼ y; dann sind die Äquivalenzklassen [x] und [y]
disjunkt, d.h., [x] ∩ [y] = ∅.
(3) Seien x, y ∈ X; dann gilt entweder [x] = [y] oder [x] ∩ [y] = ∅.
Beweis (1) Seien u, v ∈ X mit u ∼ v und sei z ∈ [u]. Dann ist z ∼ u und damit
z ∼ v, da ∼ transitiv ist. Folglich ist z ∈ [v], und dies zeigt, dass [u] ⊂ [v], falls
u ∼ v. Insbesondere ist [x] ⊂ [y]. Aber y ∼ x, da ∼ symmetrisch ist, und also
gilt auch [y] ⊂ [x], d.h., [x] = [y].
(2) Seien x, y ∈ X mit [x] ∩ [y] 6= ∅. Dann gibt es ein Element z ∈ [x] ∩ [y] und
damit gilt z ∼ x und z ∼ y. Aber dann ist x ∼ z, da ∼ symmetrisch ist, und
1 Mengen und Abbildungen
11
daraus ergibt sich, dass x ∼ y, da ∼ transitiv ist. Folglich ist [x] ∩ [y] = ∅, falls
x 6∼ y.
(3) Dies folgt unmittelbar aus (1) und (2).
Definiere nun eine Teilmenge von P(X) durch
X/∼ = {A ∈ P(X) : es gibt ein x ∈ X mit A = [x]} ;
X/∼ heißt die Restklassenmenge modulo ∼.
Eine Teilmenge A von P(X) heißt Partition oder Zerlegung von X, wenn es zu
jedem x ∈ X genau ein A ∈ A mit x ∈ A gibt.
Satz 1.2 Die Restklassenmenge X/∼ ist eine Partition von X.
Beweis Sei x ∈ X; dann ist [x] ∈ X/∼ und x ∈ [x]. Sei nun A ein beliebiges
Element von X/∼ mit x ∈ A; dann gibt es y ∈ X mit A = [y]. Da x ∈ A = [y],
ist damit x ∼ y, und daraus folgt nach Lemma 1.8 (1), dass A = [y] = [x]. Dies
zeigt, dass es genau ein A ∈ X/∼ (nämlich A = [x]) mit x ∈ A gibt.
Ist A eine Partition von X und x ∈ X, so bezeichnet Ax das eindeutige Element
von A mit x ∈ Ax .
Satz 1.3 Sei A eine Partition von X und definiere eine Relation ∼ auf X durch:
x ∼ y genau dann, wenn Ax = Ay . Dann ist ∼ eine Äquivalenzrelation auf X
und A = X/∼.
Beweis Dies ist klar.
Sei X eine Menge; eine Abbildung ⊕ : X × X → X nennt man Verknüpfung
auf X, und in diesem Fall schreibt man meistens x1 ⊕ x2 statt ⊕(x1 , x2 ). Zum
Beispiel gibt es auf N die zwei Verknüpfungen + : N × N → N (Addition) und
× : N × N → N (Multiplikation).
Hier ist eine äußerst wichtige Eigenschaft der natürlichen Zahlen:
Fakt 12 (Prinzip der vollständigen Induktion) Sei N eine Teilmenge von
N mit 0 ∈ N, für die gilt: Für jedes n ∈ N ist auch n + 1 ∈ N. Dann ist N = N.
Satz 1.4 (Beweis durch vollständige Induktion) Für jedes n ∈ N sei An
eine Aussage. Nehme an, A0 ist richtig und es gilt: Aus der Richtigkeit von An
folgt, dass An+1 auch richtig ist. Dann ist An richtig für jedes n ∈ N.
Beweis Sei N = {n ∈ N : An ist richtig}; dann ist 0 ∈ N und für jedes n ∈ N
ist auch n + 1 ∈ N. Daraus folgt nach dem Prinzip der vollständigen Induktion,
dass N = N, d.h., An ist richtig für jedes n ∈ N.
2
Der Körper der rationalen Zahlen
Die rationalen Zahlen Q werden hier als gegeben vorausgesetzt. Insbesondere ist
Q ein Beispiel für einen Körper – ein Begriff, der nun eingeführt wird.
Ein 5-Tupel (K, +, ·, 0, 1) bestehend aus einer Menge K, einer Verknüpfung
+ : K×K →K
(λ, µ) 7→ λ + µ
(genannt Addition), einer Verknüpfung
· : K×K →K
(λ, µ) 7→ λµ
(genannt Multiplikation) und Elementen 0, 1 ∈ K mit 0 6= 1 heißt Körper, wenn
folgendes gilt:
(K1) (λ + µ) + ν = λ + (µ + ν) für alle λ, µ, ν ∈ K.
(K2) λ + µ = µ + λ für alle λ, µ ∈ K.
(K3) 0 + λ = λ für alle λ ∈ K.
(K4) Zu jedem λ ∈ K gibt es ein Element −λ ∈ K mit (−λ) + λ = 0.
(K5) (λµ)ν = λ(µν) für alle λ, µ, ν ∈ K.
(K6) λµ = µλ für alle λ, µ ∈ K.
(K7) Für alle λ ∈ K gilt 1λ = λ.
(K8) Zu jedem λ ∈ K mit λ 6= 0 gibt es ein Element λ−1 ∈ K mit λ−1 λ = 1.
(K9) λ(µ + ν) = λµ + λν für alle λ, µ, ν ∈ K.
Bemerkung: Nach der üblichen Konvention soll die Addition in K weniger stark
binden als die Multiplikation. (λµ + λν bedeutet also (λµ) + (λν).)
Die Elemente 0 und 1 heißen das Nullelement oder die Null bzw. das Einselement
oder die Eins.
Lemma 2.1 Sei (K, +, ·, 0, 1) ein Körper.
(1) Das Nullelement 0 ist eindeutig: Ist 0′ ∈ K ein Element mit 0′ + λ = λ für
alle λ ∈ K, so ist 0′ = 0.
(2) Zu jedem λ ∈ K gibt es genau ein Element −λ ∈ K mit (−λ) + λ = 0.
(3) Das Einselement 1 ist eindeutig: Ist 1′ ∈ K ein Element mit 1′ λ = λ für alle
λ ∈ K, so ist 1′ = 1.
(4) Zu jedem λ ∈ K mit λ 6= 0 gibt es genau ein Element λ−1 ∈ K mit λ−1 λ = 1.
12
2 Der Körper der rationalen Zahlen
13
Beweis (1) Sei 0′ ∈ K ein Element mit 0′ + λ = λ für alle λ ∈ K; insbesondere
ist dann 0′ + 0 = 0. Da aber 0 + λ = λ für alle λ ∈ K, ist auch 0 + 0′ = 0′ , und
nach (K2) ist 0 + 0′ = 0′ + 0. Damit ist 0′ = 0 + 0′ = 0′ + 0 = 0.
(2) Sei λ ∈ K und sei λ′ ∈ K mit λ′ + λ = 0. Unter Anwendung von (K1), (K2),
(K3) und (K4) folgt dann, dass
λ′ = 0 + λ′ = ((−λ) + λ) + λ′ = (−λ) + (λ + λ′ )
= (−λ) + (λ′ + λ) = (−λ) + 0 = 0 + (−λ) = −λ .
(3) Sei 1′ ∈ K ein Element mit 1′ λ = λ für alle λ ∈ K; insbesondere ist dann
1′ · 1 = 1. Da aber 1λ = λ für alle λ ∈ K, ist auch 1 · 1′ = 0′ , und nach (K6) ist
1 · 1′ = 1′ · 1. Damit ist 1′ = 1 · 1′ = 1′ · 1 = 1.
(4) Sei λ ∈ K und sei λ′ ∈ K \ {0} mit λ′ λ = 1. Unter Anwendung von (K5),
(K6), (K7) und (K8) folgt dann, dass
λ′ = 1λ′ = (λ−1 λ)λ′ = λ−1 (λλ′ ) = λ−1 (λ′ λ) = λ−1 1 = 1λ−1 = λ−1 .
Wenn aus dem Kontext klar ist, welche Verknüpfungen + und · und Elemente 0
und 1 gemeint sind, dann wird lediglich K statt (K, +, ·, 0, 1) geschrieben.
Ist K ein Körper, so wird eine Verknüpfung
− : K×K →K
(λ, µ) 7→ λ − µ
(genannt Subtraktion) durch λ − µ = λ + (−µ) definiert.
Die rationalen Zahlen Q mit der üblichen Addition und Multiplikation bilden
einen Körper. (Das Nullelement ist 0 und das Einselement ist 1.)
Ist K ein Körper, so wird die Teilmenge K \ {0} von K mit K × bezeichnet. Ein
Körper K heißt angeordnet bezüglich einer Teilmenge P von K × , wenn gilt:
(1) Für jedes λ ∈ K × ist genau eines von λ und −λ in P .
(2) Für alle λ, µ ∈ P ist λ + µ ∈ P und λµ ∈ P .
Insbesondere ist der Körper Q angeordnet bezüglich der Teilmenge
PQ = {λ ∈ Q : λ > 0}
von Q× . Dies ist aber die einzige Möglichkeit:
Lemma 2.2 Ist Q angeordnet bezüglich einer Teilmenge P , so ist P = PQ .
2 Der Körper der rationalen Zahlen
14
Beweis Übung.
Sei K ein Körper angeordnet bezüglich einer Teilmenge P von K × ; dann wird eine
Relation > auf K definiert durch: Es gilt λ > µ genau dann, wenn λ − µ ∈ P .
Insbesondere ist P = {λ ∈ K : λ > 0}. Vorübergehend wird > die von P
abgeleitete Größer-Relation genannt. Die von PQ abgeleitete Größer-Relation auf
Q ist natürlich nichts anderes als die übliche Größer-Relation > auf den rationalen
Zahlen.
Satz 2.1 Sei K ein Körper angeordnet bezüglich einer Teilmenge P von K × .
Dann besitzt die von P abgeleitete Größer-Relation > folgende Eigenschaften:
(1) Es gilt nicht 0 > 0.
(2) Für jedes λ ∈ K × gilt genau eines von λ > 0 und −λ > 0.
(3) Es gilt λ + µ > 0 und λµ > 0 für alle λ, µ ∈ K mit λ > 0, µ > 0.
(4) Es gilt λ > µ genau dann, wenn λ − µ > 0.
Ist umgekehrt > irgendeine Relation auf einem Körper K, die (1), (2), (3) und
(4) erfüllt, und P = {λ ∈ K : λ > 0}, dann ist P eine Teilmenge von K × , K ist
angeordnet bezüglich P und > ist die von P abgeleitete Größer-Relation.
Beweis (1) Dies ist klar, da 0 ∈
/ P und P = {λ ∈ K : λ > 0}.
(2) Dies ist auch klar, da für jedes λ ∈ K × genau eines von λ ∈ P und −λ ∈ P
gilt, und P = {λ ∈ K : λ > 0}.
(3) Seien λ, µ ∈ K mit λ > 0, µ > 0. Dann ist λ ∈ P und µ ∈ P und damit auch
λ + µ ∈ P und λµ ∈ P . Folglich ist λ + µ > 0 und λµ > 0.
(4) Es gilt λ > µ genau dann, wenn λ − µ ∈ P , d.h., λ > µ gilt genau dann,
wenn λ − µ > 0.
Ist K ein Körper angeordnet bezüglich einer Teilmenge P von K × , so wird dann
meistens lediglich von einem angeordneten Körper K geredet. Die von P abgeleitete Größer-Relation wird mit > bezeichnet und die Teilmenge P nicht mehr
explizit erwähnt.
Im Folgenden sei K ein angeordneter Körper. Wie in Q wird die Relation <
definiert durch: Es gilt λ < µ genau dann, wenn µ > λ. Folglich gilt λ < µ genau
dann, wenn µ − λ ∈ P .
Satz 2.2 Die folgenden Rechenregeln gelten für die Relationen < und >:
(1) Sind λ, µ ∈ K mit λ 6= µ, so ist genau eine der Aussagen λ < µ und µ < λ
richtig.
2 Der Körper der rationalen Zahlen
15
(2) Sind λ, µ, ν ∈ K mit λ < µ und µ < ν, so ist λ < ν.
(3) Es gilt λ < µ genau dann, wenn −λ > −µ.
(4) Sind λ, µ ∈ K mit λ < µ, so ist λ + ν < µ + ν für alle ν ∈ K.
(5) Sind λ, µ, ν, ̺ ∈ K mit λ < µ und ν < ̺, so ist λ + ν < µ + ̺.
(6) Sind λ, µ ∈ K mit λ < µ und ν > 0, so ist νλ < νµ.
(7) Sind λ, µ ∈ K mit λ < µ und ν < 0, so ist νµ < νλ.
(8) Für jedes λ ∈ K × ist λλ > 0; insbesondere ist 1 > 0.
(9) Ist λ ∈ K × mit λ > 0, so ist λ−1 > 0.
(10) Sind λ, µ ∈ K × mit λ > 0 und µ > λ, so ist µ−1 < λ−1 .
Beweis (1) Dies ist klar.
(2) Sind λ, µ, ν ∈ K mit λ < µ und µ < ν, so ist µ − λ ∈ P und ν − µ ∈ P und
damit ν − λ = (ν − µ) + (µ − λ) ∈ P , d.h., λ < ν.
(3) Es gilt λ < µ genau dann, wenn µ − λ ∈ P , und −λ > −µ gilt genau dann,
wenn −λ − (−µ) ∈ P . Aber −λ − (−µ) = −λ + µ = µ − λ.
(4) Sind λ, µ ∈ K mit λ < µ, so ist µ − λ ∈ P und damit (µ + ν) − (λ + ν) =
µ − λ ∈ P für alle ν ∈ K, d.h., λ + ν < µ + ν für alle ν ∈ K.
(5) Sind λ, µ, ν, ̺ ∈ K mit λ < µ und ν < ̺, so ist µ − λ ∈ P und ̺ − ν ∈ P
und damit auch (µ + ̺) − (λ + ν) = (µ − λ) + (̺ − ν) ∈ P , d.h., λ + ν < µ + ̺.
(6) Sind λ, µ ∈ K mit λ < µ und ν > 0, so ist µ − λ ∈ P und ν ∈ P und damit
auch νµ − νλ = ν(µ − λ) ∈ P , d.h., νλ < νµ.
(7) Sind λ, µ ∈ K mit λ < µ und ν < 0, so ist µ − λ ∈ P und −ν ∈ P und damit
auch νλ − νµ = (−ν)(µ − λ) ∈ P , d.h., νµ < νλ.
(8) Ist λ ∈ P , so ist λλ ∈ P und damit λλ > 0. Ist dagegen −λ ∈ P , so ist wieder
λλ = (−λ)(−λ) ∈ P , d.h., λλ > 0. Folglich ist λλ > 0 für alle λ ∈ K × , da für
jedes λ ∈ K × genau eines von λ und −λ in P ist. Insbesondere ist 1 = 1 · 1 > 0.
(9) Sei λ ∈ K × mit λ > 0; dann ist λ−1 ∈ K × und damit ist genau eines von λ−1
und −λ−1 in P . Aber −λ−1 ∈ P ist nicht möglich, da dann −1 = λ(−λ−1 ) ∈ P
wäre und daher 1 ∈
/ P (im Widerspruch zu 1 > 0). Also ist λ−1 ∈ P , d.h.,
−1
λ > 0.
(10) Seien λ, µ ∈ K × mit λ > 0 und µ > λ; also sind λ ∈ P , µ − λ ∈ P und
µ = (µ − λ) + λ ∈ P , und nach (9) ist (µ − λ)−1 > 0, d.h., (µ − λ)−1 ∈ P . Daraus
folgt, dass λµ(µ − λ)−1 ∈ P , d.h., λµ(µ − λ)−1 > 0. Aber
(λ−1 − µ−1 )λµ(µ − λ)−1 = (µ − λ)(µ − λ)−1 = 1 ,
2 Der Körper der rationalen Zahlen
16
d.h., λµ(µ − λ)−1 = (λ−1 − µ−1 )−1 und damit ist nach (9) λ−1 − µ−1 > 0, d.h.,
µ−1 < λ−1 .
Wie in Q werden die Relationen ≤ und ≥ auf K definiert durch: Es gilt λ ≤ µ
genau dann, wenn λ < µ oder λ = µ, und λ ≥ µ genau dann, wenn λ > µ oder
λ = µ. Für jedes λ ∈ K sei der (Absolut)-Betrag |λ| von λ definiert durch
λ , falls λ ≥ 0,
|λ| =
−λ , falls λ < 0.
Satz 2.3 Der Absolut-Betrag hat folgende Eigenschaften:
(1) Für jedes λ ∈ K ist |λ| ≥ 0 und |λ| = 0 gilt genau dann, wenn λ = 0.
(2) Für alle λ, µ ∈ K ist |λµ| = |λ||µ|. Insbesondere ist |−λ| = |λ|.
(3) Für alle λ, µ ∈ K ist |λ + µ| ≤ |λ| + |µ| (Dreiecksungleichung).
(4) Für alle λ, µ ∈ K ist ||λ| − |µ|| ≤ |λ − µ| (Umgekehrte Dreiecksungleichung).
Beweis (1) Für jedes λ ∈ K gilt genau eines von λ = 0, λ > 0 und λ < 0. Ist
λ > 0, so ist |λ| = λ > 0, und |λ| =
6 0. Ist λ < 0, so ist |λ| = −λ > 0, und wieder
ist |λ| =
6 0. Schließlich ist |0| = 0. Für jedes λ ∈ K ist also |λ| ≥ 0 und |λ| = 0
gilt genau dann, wenn λ = 0.
(2) Sind λ ≥ 0 und µ ≥ 0, so ist λµ ≥ 0 und damit |λµ| = λµ = |λ||µ|. Ist λ < 0
und µ ≥ 0, so ist λµ = −(−λ)µ ≤ 0 und damit ist |λµ| = −λµ = (−λ)µ = |λ||µ|.
Genauso gilt |λµ| = |λ||µ|, wenn λ ≥ 0 und µ < 0. Sind schließlich λ < 0 und
µ < 0, so ist λµ = (−λ)(−µ) > 0 und damit ist |λµ| = λµ = (−λ)(−µ) = |λ||µ|.
Insbesondere ist |−λ| = |−1 · λ| = |−1||λ| = 1 · |λ| = |λ| für jedes λ ∈ K.
(3) Gilt λ ≥ 0 und µ ≥ 0 oder λ < 0 und µ < 0, so stellt man leicht fest,
dass |λ + µ| = |λ| + |µ|. Nehme also ohne Beschränkung der Allgemeinheit an,
dass λ ≥ 0 und µ < 0; damit ist |λ| = λ und |µ| = −µ. Ist λ + µ ≥ 0, so ist
|λ + µ| = λ + µ und daraus ergibt sich, dass
|λ| + |µ| − |λ + µ| = λ + (−µ) − (λ + µ) = (−µ) + (−µ) ≥ 0 .
Ist andererseits λ + µ < 0, so ist |λ + µ| = −(λ + µ) und hier ist
|λ| + |µ| − |λ + µ| = λ + (−µ) + (λ + µ) = λ + λ ≥ 0 .
In beiden Fällen ist |λ| + |µ| − |λ + µ| ≥ 0, d.h., |λ + µ| ≤ |λ| + |µ|.
(4) Nach (3) ist |λ| = |(λ −µ) + µ| ≤ |λ −µ| + |µ| und damit ist |λ| −|µ| ≤ |λ −µ|.
Genauso gilt |µ| − |λ| ≤ |µ − λ| = |λ − µ|. Folglich ist ||λ| − |µ|| ≤ |λ − µ|: Ist
|λ| − |µ| ≥ 0, so ist ||λ| − |µ|| = |λ| − |µ| ≤ |λ − µ|; ist andererseits |λ| − |µ| < 0,
so ist wieder ||λ| − |µ|| = −(|λ| − |µ|) = |µ| − |λ| ≤ |λ − µ|.
2 Der Körper der rationalen Zahlen
17
Satz 2.4 Sei n ≥ 2 und seien λ1 , . . . , λn ∈ K.
(1) Es gibt ein eindeutiges λ ∈ K, für das gilt: λk ≤ λ für alle k = 1, . . . , n und
λj = λ für mindestens ein j. Das Element λ wird mit max{λk : 1 ≤ k ≤ n} oder
max{λ1 , . . . , λn } bezeichnet.
(2) Es gibt ein eindeutiges λ′ ∈ K, für das gilt: λk ≥ λ′ für alle k = 1, . . . , n
und λj = λ′ für mindestens ein j. Das Element λ′ wird mit min{λk : 1 ≤ k ≤ n}
oder min{λ1 , . . . , λn } bezeichnet.
Beweis Übung.
Satz 2.5 Sei m ≥ 2 und λ1 , . . . , λm , ε ∈ K mit ε > 0 und 0 < λk+1 − λk < ε
für jedes k = 1, . . . , m − 1. Ferner seien µ, ν ∈ K mit λ1 ≤ µ < ν ≤ λm und
ν − µ ≥ ε. Dann gibt es ein k mit µ < λk < ν.
Beweis Übung.
Für jedes n ∈ N wird das Element |1 + 1 +{z· · · + 1} von K mit n bezeichnet. Da
n−mal
1 = 1 > 0 und n + 1 = n + 1 für jedes n ∈ N, sieht man leicht, dass n > 0 für
alle n ≥ 1. Für jedes λ ∈ K und jedes n ∈ N wird das Element |λλ {z
· · · λ} von K
n−mal
mit λn bezeichnet, wobei λ0 = 1.
Lemma 2.3 (Bernoullische Ungleichung) Sei λ ∈ K mit λ > −1. Dann gilt
(1 + λ)n ≥ 1 + nλ
für alle n ∈ N.
Beweis Für jedes n ∈ N sei An die Aussage, dass (1 + λ)n ≥ 1 + nλ für alle
λ > −1 gilt. Dann ist A0 richtig, da (1 + λ)0 = 1 = 1 + 0λ. Sei also n ∈ N und
nehme an, dass An richtig ist. Für λ ∈ K mit λ > −1 ist dann
(1 + λ)n+1 = (1 + λ)n (1 + λ) ≥ (1 + nλ)(1 + λ) = 1 + nλ + λ + nλ2
= 1 + (n + 1)λ + nλ2 = 1 + n + 1λ + nλ2 ≥ 1 + n + 1λ ,
da λ + 1 > 0 und λ2 ≥ 0, und folglich ist An+1 auch richtig. Daraus ergibt sich
nach Satz 1.4, dass An für alle n ∈ N richtig ist.
Lemma 2.4 Sei λ ∈ K mit 0 < λ < 1. Für jedes n ∈ N gilt dann
(1 + λ)n < 1 + 3n λ .
2 Der Körper der rationalen Zahlen
18
Beweis Für jedes n ∈ N sei An die Aussage, dass (1 + λ)n < 1 + 3n λ für alle
λ ∈ K mit 0 < λ < 1 gilt. Da (1 + λ)0 = 1 < 1 + 30 λ, ist A0 richtig. Sei also
n ∈ N und nehme an, dass An richtig ist. Für λ ∈ K mit 0 < λ < 1 ist dann
(1 + λ)n+1 = (1 + λ)n (1 + λ) < (1 + 3n λ)(1 + λ)
= 1 + 3n λ + λ + 3n λ2 ≤ 1 + 3n λ + λ + 3n λ = 1 + (3n + 3n + 1)λ
≤ 1 + (3n + 3n + 3n )λ = 1 + (3 3n )λ = 1 + 3n+1 λ ,
und folglich ist An+1 auch richtig. Daraus ergibt sich nach Satz 1.4, dass An für
alle n ∈ N richtig ist.
3
Der Körper der reellen Zahlen
Ziel dieses Abschnittes ist es, den Körper R der reellen Zahlen einzuführen.
Ein Körper K heißt Körpererweiterung eines Körpers F , wenn F ⊂ K und die
Addition (bzw. die Multiplikation) in F die Einschränkung der Addition (bzw.
der Multiplikation) in K ist. (Dies bedeutet: Für alle λ, µ ∈ F muss λ+µ = λ⊕µ
und λ × µ = λ ⊗ µ gelten, wobei + und × (bzw. ⊕ und ⊗) die Addition und die
Multiplikation in F (bzw. in K) sind.)
Ist K eine Körpererweiterung von F , so ist die Null (bzw. die Eins) in F auch
die Null (bzw. die Eins) in K.
Der Körper R wird als angeordnete Körpererweiterung von Q eintreten, (d.h. als
ein angeordneter Körper, der gleichzeitig eine Körpererweiterung von Q ist).
Im Folgenden sei K eine beliebige angeordnete Körpererweiterung von Q (wobei
nicht auszuschließen ist, dass K = Q). Als Vorbereitung auf die Definition von R
werden die Eigenschaften von K untersucht.
Lemma 3.1 Die Größer-Relation > auf K ist eine Erweiterung der üblichen
Größer-Relation > auf Q. (Dies bedeutet: Sind x, y ∈ Q, so gilt x > y in K
genau dann, wenn x > y in Q gilt.)
Beweis Sei K angeordnet bezüglich der Teilmenge P von K × , setze P ′ = P ∩ Q,
also ist P ′ Teilmenge von Q× . Ist λ ∈ P ′, so ist genau eines von λ und −λ in
P und damit ist genau eines von λ und −λ in P ′ . Sind ferner λ, µ ∈ P ′ , so ist
λ + µ ∈ P und λµ ∈ P und damit auch λ + µ ∈ P ′ und λµ ∈ P ′ . Folglich
ist Q angeordnet bezüglich der Teilmenge P ′ von Q und daraus ergibt sich nach
Lemma 2.2, dass P ′ = PQ = {λ ∈ Q : λ > 0}. Ist also λ ∈ Q, so gilt λ > 0 in K
genau dann, wenn λ > 0 in Q gilt. Daher ist die Größer-Relation > auf K eine
Erweiterung der Größer-Relation > auf Q.
Sei D eine Teilmenge von K; ein Element z ∈ K heißt dann obere Schranke (bzw.
untere Schranke) von D, wenn x ≤ z für alle x ∈ D (bzw. x ≥ z für alle x ∈ D)
gilt. Die Teilmenge D heißt nach oben (bzw. nach unten) beschränkt, wenn es
eine obere Schranke (bzw. eine untere Schranke) für D gibt.
Sei D eine Teilmenge von K; ein Element z ∈ K heißt dann Supremum von D,
falls z die kleinste obere Schranke von D ist. Genauer bedeutet dies: Einerseits ist
z eine obere Schranke von D, und ist andererseits z ′ irgendeine obere Schranke
von D, so ist z ≤ z ′ . Es ist klar, dass es höchstens ein Element mit diesen zwei
Eigenschaften gibt. Falls es existiert, wird es mit sup(D) bezeichnet.
Analog heißt z ∈ K Infimum von D, falls z die größte untere Schranke von D
ist. Genauer bedeutet dies: Einerseits ist z eine untere Schranke von D, und ist
19
3 Der Körper der reellen Zahlen
20
andererseits z ′ irgendeine untere Schranke von D, so ist z ′ ≤ z. Wieder ist es
klar, dass es höchstens ein Element mit diesen zwei Eigenschaften gibt. Falls es
existiert, wird es mit inf(D) bezeichnet.
Existiert sup(D) (bzw. inf(D)), so ist D natürlich nach oben beschränkt (bzw.
nach unten beschränkt).
Sei n ≥ 2 fest und für jedes x ∈ K mit x > 1 sei Wx = {y ∈ K : y n < x}. Dann
ist Wx nichtleer, da 1 ∈ Wx , und x ist eine obere Schranke von Wx . (Sei y ∈ K
mit y n < x. Ist y ≤ 1, so ist y ≤ 1 < x; ist dagegen y > 1, so ist y < y n < x.)
Also ist Wx eine nichtleere, nach oben beschränkte Teilmenge von K.
Lemma 3.2 Existiert das Supremum z = sup(Wx ), so ist z n = x.
Beweis Da 1 ∈ Wx , ist z ≥ 1. Nehme an, dass z n < x und sei h = min{a, 1/2},
wobei a = (x − z n )(3n z n−1 )−1 . Also ist 0 < h < 1, da a > 0, und damit auch
0 < z −1 h < 1, da z −1 ≤ 1. Nun ist nach Lemma 2.5
(z + h)n = z n (1 + z −1 h)n < z n (1 + 3n z −1 h)
= z n + 3n z n−1 h ≤ z n + 3n z n−1 a = z n + (x − z n ) = x ,
d.h. z + h ∈ Wx . Aber dann wäre z keine obere Schranke von Wx , und dies zeigt,
dass z n ≥ x. Nehme nun an, dass z n > x, setze a = (z n − x)(nz n−1 )−1 und sei
h = min{a, 1/2}. Wieder ist 0 < h < 1, da a > 0, und damit auch −z −1 h > −1,
da z −1 ≤ 1. Daraus ergibt sich nach Lemma 2.4, dass
(z − h)n = z n (1 − z −1 h)n ≥ z n (1 − nz −1 h)
= z n − nz n−1 h ≥ z n − nz n−1 a = z n − (z n − x) = x > y n
für alle y ∈ Wx . Folglich ist z − h > y für alle y ∈ Wx , da z − h ≥ 0. (Sind
u, v ∈ K mit u ≥ 0 und un > v n , so ist u > v.) Aber dann wäre z − h eine
obere Schranke von Wx , die kleiner als z ist, und dies zeigt, dass z n ≤ x. Also ist
z n = x.
Lemma 3.3 Äquivalent sind:
(1) Jede nichtleere, nach oben beschränkte Teilmenge von K besitzt ein Supremum.
(2) Jede nichtleere, nach unten beschränkte Teilmenge von K besitzt ein Infimum.
Beweis (1) ⇒ (2): Sei A eine nichtleere, nach unten beschränkte Teilmenge von
K. Dann ist A− = {x ∈ K : −x ∈ A} eine nichtleere, nach oben beschränkte
Teilmenge von K und damit existiert z = sup(A− ). Aber dann ist −z = inf(A).
3 Der Körper der reellen Zahlen
21
(2) ⇒ (1): Analog.
Die Körpererweiterung K heißt ordnungsvollständig, wenn jede nichtleere, nach
oben beschränkte Teilmenge von K ein Supremum besitzt. Nach Lemma 3.2 ist
Q selbst nicht ordnungsvollständig, da es zum Beispiel keine rationale Zahl z ∈ Q
mit z 2 = 2 gibt.
Es gibt eine im Wesentlichen eindeutige ordnungsvollständige Körpererweiterung
von Q (siehe Satz 3.1 unten): Diese Körpererweiterung ist dann per Definition
der Körper der reellen Zahlen. Für die genaue Formulierung der Eindeutigkeit
muss hier zunächst erklärt werden, was ein Körperisomorphismus ist.
Seien F , F ′ Körper; eine Abbildung ψ : F → F ′ heißt Körperhomomorphismus,
wenn ψ(λ + µ) = ψ(λ) + ψ(µ) und ψ(λµ) = ψ(λ)ψ(µ) für alle λ, µ ∈ F . Ist ψ ein
Körperhomomorphismus, so sieht man leicht, dass ψ(0) = 0 und ψ(1) = 1.
Lemma 3.4 Sei ψ : F → F ′ ein Körperhomomorphismus. Ist ψ bijektiv, so ist
die Umkehrabbildung ψ −1 : F ′ → F auch ein Körperhomomorphismus.
Beweis Seien λ′ , µ′ ∈ F ′ ; da ψ bijektiv ist, gibt es eindeutige Elemente λ, µ ∈ F
mit λ′ = ψ(λ) und µ′ = ψ(µ) und damit auch mit λ = ψ −1 (λ′ ) und µ = ψ −1 (µ′ ).
Da ψ(λ + µ) = ψ(λ) + ψ(µ), gilt nun
ψ −1 (λ′ + µ′ ) = ψ −1 (ψ(λ) + ψ(µ)) = ψ −1 (ψ(λ + µ)) = λ + µ = ψ −1 (λ′ ) + ψ −1 (µ′ )
und da ψ(λµ) = ψ(λ)ψ(µ), gilt auch
ψ −1 (λ′ µ′ ) = ψ −1 (ψ(λ)ψ(µ)) = ψ −1 (ψ(λµ)) = λµ = ψ −1 (λ′ )ψ −1 (µ′ ) .
Dies zeigt dann, dass ψ −1 ein Körperhomomorphismus ist.
Ein bijektiver Körperhomomorphismus heißt ein Körperisomorphismus. Körper
F und F ′ heißen isomorph, wenn es einen Körperisomorphismus ψ : F → F ′ gibt.
Satz 3.1 Es gibt eine ordnungsvollständige Körpererweiterung von Q. Sind ferner K und K ′ zwei solche Körpererweiterungen, so gibt es einen eindeutigen
Körperisomorphismus ψ : K → K ′ , und ψ(x) = x für jedes x ∈ Q.
Beweis Siehe, zum Beispiel, Amman und Escher [1], Seite 99.
Nach Satz 3.1 gibt es bis auf Isomorphie genau eine ordnungsvollständige Körpererweiterung von Q. Die heißt der Körper der reellen Zahlen und wird mit R
bezeichnet.
Nach der Definition besitzt jede nichtleere, nach oben beschränkte Teilmenge von
R ein Supremum. Nach Lemma 3.3 besitzt dann auch jede nichtleere, nach unten
beschränkte Teilmenge von R ein Infimum.
3 Der Körper der reellen Zahlen
22
Lemma 3.5 Sei D eine nichtleere nach oben beschränkte Teilmenge von R und
sei z ∈ R. Dann gilt:
(1) z ≥ sup(D) genau dann, wenn z ≥ x für alle x ∈ D.
(2) z ≤ sup(D) genau dann, wenn es für jedes ε > 0 ein x ∈ D mit z < x + ε
gibt.
(3) z = sup(D) genau dann, wenn z ≥ x für alle x ∈ D und es für jedes ε > 0
ein x ∈ D mit z < x + ε gibt.
Sei D eine nichtleere nach unten beschränkte Teilmenge von R und z ∈ R. Dann
gilt:
(4) z ≤ inf(D) genau dann, wenn z ≤ x für alle x ∈ D.
(5) z ≥ inf(D) genau dann, wenn es für jedes ε > 0 ein x ∈ D mit z > x − ε
gibt.
(6) z = inf(D) genau dann, wenn z ≤ x für alle x ∈ D und es für jedes ε > 0
ein x ∈ D mit z > x − ε gibt.
Beweis (1) Es gilt z ≥ sup(D) genau dann, wenn z eine obere Schranke von D
ist, d.h., genau dann, wenn z ≥ x für alle x ∈ D.
(2) Sei z ≤ sup(D); für jedes ε > 0 ist dann z − ε < sup(D) und damit ist z − ε
keine obere Schranke von D. Es gibt also ein x ∈ D mit z − ε < x, d.h., mit
z < x + ε. Nehme nun umgekehrt an, dass es für jedes ε > 0 ein x ∈ D mit
z < x + ε gibt. Dann ist z − ε < sup(D) für jedes ε > 0, da x ≤ sup(D) für alle
x ∈ D. Damit ist z ≤ sup(D) (sonst wäre z−ε = sup(D) mit ε = z−sup(D) > 0).
(3) Dies folgt unmittelbar aus (1) und (2).
(4), (5) und (6): Wie (1), (2) und (3).
Lemma 3.6 Seien D, D ′ nichtleere Teilmengen von R mit D ⊂ D ′ .
(1) Ist D ′ nach oben beschränkt, dann ist auch D und sup(D) ≤ sup(D ′ ).
(1) Ist D ′ nach unten beschränkt, so ist auch D und inf(D ′ ) ≤ inf(D).
Beweis Dies ist klar.
Eine Teilmenge D von R heißt beschränkt, wenn sie nach oben und nach unten
beschränkt ist, d.h., wenn es u, v ∈ R gibt, so dass u ≤ x ≤ v für alle x ∈ D. Man
sieht leicht, dass D genau dann beschränkt ist, wenn es ein B ∈ R mit B ≥ 0
gibt, so dass |x| ≤ B für alle x ∈ D.
Lemma 3.7 Sei D eine nichtleere beschränkte Teilmenge von R; für jedes x ∈ D
gilt dann inf(D) ≤ x ≤ sup(D). Insbesondere ist inf(D) ≤ sup(D).
3 Der Körper der reellen Zahlen
23
Beweis Dies ist ebenso klar.
Sei D eine nichtleere Teilmenge von R; eine Zahl c ∈ D heißt Maximum (bzw.
Minimum) von D, wenn x ≤ c für alle x ∈ D (bzw. x ≥ c für alle x ∈ D). Es
ist klar, dass das Maximum (bzw. das Minimum) im Falle der Existenz eindeutig
bestimmt ist. Ferner ist es klar, dass D nach oben beschränkt (bzw. nach unten
beschränkt) ist, falls das Maximum (bzw. das Minimum) existiert.
Lemma 3.8 (1) Sei D eine nichtleere, nach oben beschränkte Teilmenge von R.
Dann besitzt D ein Maximum genau, wenn sup(D) ∈ D, und in diesem Fall ist
sup(D) das Maximum.
(2) Sei D eine nichtleere, nach unten beschränkte Teilmenge von R. Dann besitzt
D ein Minimum genau, wenn inf(D) ∈ D, und in diesem Fall ist inf(D) das
Minimum.
Beweis Dies folgt unmittelbar aus den Definitionen.
Sei D eine nichtleere endliche Teilmenge von R; dann besitzt D ein Maximum
und ein Minimum. Ist ferner x1 , . . . , xn irgendeine Aufzählung der Elemente von
D, so ist max{x1 , . . . , xn } das Maximum und min{x1 , . . . , xn } das Minimum.
Satz 3.2 Sei x ∈ R mit x ≥ 0; für jedes n ≥ 2 gibt es dann eine
√ eindeutige reelle
Zahl z mit z √≥ 0, so dass z n = x. Diese Zahl z wird mit n x bezeichnet (oder
lediglich mit x, falls n = 2).
Beweis Es gibt mindestens eine Zahl z ≥ 0 mit z n = x: Dies folgt unmittelbar
aus Lemma 3.2, falls x > 1, und die Fälle x = 0 und x = 1 sind trivial richtig,
da 0n = 0 und 1n = 1. Es bleibt also nur der Fall mit 0 < x < 1. Aber hier
ist x−1 > 1, damit gibt es ein y ≥ 0 mit y n = x−1 ; folglich ist y −1 > 0 und
(y −1)n = x.
Es gibt höchstens eine Zahl z ≥ 0 mit z n = x: Sei y ≥ 0 mit y 6= z. Ist y < z
(bzw. y > z), so ist y n < z n (bzw. y n > z n ) und damit ist y n 6= x.
Satz 3.3 (Satz von Archimedes) Zu jeder reellen Zahl x ∈ R gibt es eine
näturliche Zahl n ∈ N mit n > x. Mit anderen Worten: Die Teilmenge N von R
ist nicht nach oben beschränkt.
Beweis Die Aussage ist trivial richtig, wenn x < 0, da in diesem Fall n > x für
jedes n ∈ N; sei also x ≥ 0. Dann ist A = {n ∈ N : n ≤ x} eine nichtleere
nach oben beschränkte Teilmenge von R, da 0 ∈ A und x eine obere Schranke
von A ist. Folglich existiert das Supremum z = sup(A). Nun gibt es ein m ∈ A
mit z − 1 < m, sonst wäre z − 1 auch eine obere Schranke von A. Damit ist
n = m + 1 ∈ N und n > z. Insbesondere ist n ∈
/ A (sonst wäre z keine obere
Schranke), d.h. n > x.
3 Der Körper der reellen Zahlen
24
Satz 3.4 Zu jedem ε > 0 gibt es ein n ∈ N \ {0} mit 1/n < ε.
Beweis Sei ε > 0; nach Satz 3.3 gibt es dann n ∈ N \ {0} mit n > ε−1 , und
daraus folgt nach Satz 2.2 (10), dass 1/n < (ε−1)−1 = ε.
Satz 3.5 (1) Sei x ∈ R mit x > 1. Zu jedem c ∈ R gibt es dann ein n ∈ N, so
dass xn > c.
(2) Sei x ∈ R mit 0 < x < 1. Zu jedem ε > 0 gibt es dann ein n ∈ N, so dass
xn < ε.
Beweis (1) Setze y = x − 1, also ist y > 0. Sei nun c ∈ R; nach Satz 3.3 gibt es
ein n ∈ N, so dass n > cy −1 . Folglich ist ny > c und damit ist nach Lemma 2.4
xn = (y + 1)n ≥ 1 + ny > 1 + c > c .
(2) Setze y = x−1 ; dann ist y > 1. Sei nun ε > 0; nach (1) gibt es ein n ∈ N, so
dass y n > ε−1 und nach Satz 2.2 (10) ist dann xn = (y n )−1 < (ε−1 )−1 = ε.
Satz 3.6 Seien y, z ∈ R mit y < z. Dann gibt es ein x ∈ Q mit y < x < z.
Beweis Setze w = max{|y|, |z|}; nach Satz 3.3 gibt es dann ein N ∈ N mit
w < N, und damit ist −N < y < x < N. Ferner gibt es nach Satz 3.4 ein
n ∈ N \ {0} mit 1/n < z − y. Sei nun m = 2Nn + 1 und für k = 1, . . . , m sei
xk = −N + (k − 1)/n. Dann ist x1 = −N < y, z < N = xm und für 1 ≤ k < m ist
xk+1 − xk = n−1 < z − y. Folglich gibt es nach Lemma 2.3 ein k mit y < xk < z.
Aber xj ∈ Q für jedes j und daher gibt es ein x ∈ Q mit y < x < z.
Eine nichtleere Teilmenge I von R heißt Intervall, wenn gilt: Sind a, b ∈ I mit
a < b, so ist x ∈ I für jedes x ∈ R mit a < x < b. Offensichtlich ist R selbst ein
Intervall sowie die einpunktige Menge {a} für jedes a ∈ R. Weitere Beispiele für
Intervalle sind:
Für a, b ∈ R mit a < b:
[a, b] = {x ∈ R : a ≤ x ≤ b}, (a, b) = {x ∈ R : a < x < b},
(a, b] = {x ∈ R : a < x ≤ b}, [a, b) = {x ∈ R : a ≤ x < b}.
Für a, b ∈ R:
[a, +∞) = {x ∈ R : a ≤ x}, (a, +∞) = {x ∈ R : a < x},
(−∞, b] = {x ∈ R : x ≤ b}, (−∞, b) = {x ∈ R : x < b}.
In der Tat gibt es dann keine weiteren Beispiele:
3 Der Körper der reellen Zahlen
25
Satz 3.7 Sei I ⊂ R ein Intervall, das mehr als einen Punkt enthält.
(1) Ist I weder nach unten noch nach oben beschränkt, so ist I = R.
(2) Ist I nach unten, aber nicht nach oben beschränkt, dann gibt es a ∈ R, so
dass I = [a, +∞) oder I = (a, +∞).
(3) Ist I nach oben, aber nicht nach unten beschränkt, dann gibt es b ∈ R, so
dass I = (−∞, b] oder I = (−∞, b).
(4) Ist I beschränkt, dann gibt es a, b ∈ R mit a < b, so dass I eines der vier
Intervalle [a, b], (a, b), (a, b] und [a, b) ist.
Beweis Übung.
Es ist oft nützlich, R durch das Hinzufügen der zwei Symbolen −∞ und +∞ zu
ergänzen. Die Menge R ∪ {−∞, +∞} heißt dann erweiterte Zahlengerade und
wird mit R̄ bezeichnet. Die Relation < wird zu einer Relation < auf R̄ erweitert:
Per Definition gilt −∞ < x < +∞ für jedes x ∈ R. Die anderen Relationen ≤,
> und ≥ werden dann entsprechend erweitert.
Genauso wie für Teilmengen von R wird auch das Supremum und das Infimum
für Teilmengen von R̄ definiert.
Satz 3.8 Sei D eine nichtleere Teilmenge von R̄.
(1) Dann besitzt D ein Supremum sup(D) und ein Infimum inf(D).
(2) Ist +∞ ∈ D, so gilt sup(D) = +∞.
(3) Ist +∞ ∈
/ D, so gilt sup(D) = +∞ genau dann, wenn es zu jedem z ∈ R ein
x ∈ D mit x > z gibt, d.h., wenn D keine obere Schranke in R besitzt.
(4) Es gilt sup(D) = −∞ genau dann, wenn D = {−∞}.
(5) Ist −∞ ∈ D, so gilt inf(D) = −∞.
(6) Ist −∞ ∈
/ D, so gilt inf(D) = −∞ genau dann, wenn es zu jedem z ∈ R ein
x ∈ D mit z < x gibt, d.h., wenn D keine untere Schranke in R besitzt.
(7) Es gilt inf(D) = +∞ genau dann, wenn D = {+∞}.
(8) Für jedes x ∈ D gilt inf(D) ≤ x ≤ sup(D).
(9) Ist D ′ eine Teilmenge von R̄ mit D ⊂ D ′ , so ist sup(D) ≤ sup(D ′ ) und auch
inf(D ′ ) ≤ inf(D).
Beweis Übung.
4
Der Körper der komplexen Zahlen
Sind K und F Körper, so heißt F Unterkörper von K, wenn K Körpererweiterung
von F ist.
Für jedes x ∈ R ist x2 ≥ 0; daher gibt es keine reelle Zahl x mit x2 = −1.
Sei K eine Körpererweiterung von R, die ein Element i enthält, für das i2 = −1
gilt; insbesondere ist dann i ∈
/ R. Sei
L = {z ∈ K : es gibt x, y ∈ R mit z = x + iy} ;
da x = x + i0 und i = 0 + i1, ist R ⊂ L und i ∈ L. Jedes Element in L hat eine
eindeutige Darstellung der Form x + iy mit x, y ∈ R: Sind x, y, x′ , y ′ ∈ R mit
x + iy = x′ + iy ′ , so ist zunächst y = y ′ , sonst wäre i = (x′ − x)/(y − y ′) ein
Element von R, und wenn y = y ′, so ist auch x − x′ = i(y ′ − y) = 0, d.h. x = x′ .
Lemma 4.1 (1) L ist Unterkörper von K und damit eine Körpererweiterung
von R, die i enthält.
(2) Ist M ein Unterkörper von K, der eine Körpererweiterung von R ist und i
enthält, so ist L ⊂ M. Damit ist L die kleinste Körpererweiterung von R in K,
die i enthält.
Beweis (1) Seien z, z ′ ∈ L; dann gibt es x, y, x′ , y ′ ∈ R, so dass z = x + iy und
z ′ = x′ + iy ′ , und folglich sind
z + z ′ = (x + iy) + (x′ + iy ′ ) = (x + x′ ) + i(y + y ′) ,
zz ′ = (x + iy)(x′ + iy ′) = (xx′ − yy ′) + i(xy ′ + x′ y)
und −z = −(x + iy) = −x + i(−y) alle Elemente von L. Ist ferner z 6= 0, so ist
σ = x2 + y 2 > 0, und in diesem Fall ist
x
σ
+i
x2 y 2 xy yx −y (x + iy) =
+i
=1,
+
−
σ
σ
σ
σ
σ
d.h. z −1 = (x/σ) + i(−y/σ) ist ein Element von L.
(2) Dies ist klar.
Betrachte nun eine weitere Körpererweiterung K ′ von R, die ein Element j
enthält, für das j 2 = −1 gilt, und sei
L′ = {z ∈ K ′ : es gibt x, y ∈ R mit z = x + jy} ;
nach Lemma 4.1 ist L′ die kleinste Körpererweiterung von R in K ′ , die j enthält.
26
4 Der Körper der komplexen Zahlen
27
Lemma 4.2 Es gibt einen eindeutigen Körperisomorphismus ψ : L → L′ , so
dass ψ(x) = x für alle x ∈ R und ψ(i) = j.
Beweis Ist ψ : L → L′ ein Körperhomomorphismus mit ψ(x) = x für alle x ∈ R
und ψ(i) = j, so ist ψ(x+ iy) = x+ jy für alle x, y ∈ R. Da aber jedes Element in
L eine eindeutige Darstellung der Form x + iy mit x, y ∈ R hat, kann umgekehrt
eine Abbildung ψ : L → L′ definiert werden durch ψ(x + iy) = x + jy für alle
x, y ∈ R. Man sieht leicht, dass diese Abbildung ψ ein Körperisomorphismus mit
ψ(x) = x für alle x ∈ R und ψ(i) = j ist.
Gibt es eine minimale Körpererweiterung von R, die ein Element i enthält, für das
i2 = −1 gilt, so ist nach Lemma 4.2 diese Erweiterung im Wesentlichen eindeutig.
Und in der Tat gibt es eine solche Erweiterung: Sei C = R2 = {(x, y) : x, y ∈ R},
definiere eine Addition + : C × C → C durch
(x, y) + (x′ , y ′) = (x + x′ , y + y ′)
und eine Multiplikation · : C × C → C durch
(x, y)(x′ , y ′) = (xx′ − yy ′, xy ′ + yx′ ) .
Dann ist (C, +, ·, 0, 1) ein Körper, wobei 0 = (0, 0) und 1 = (1, 0): Es wird
als Übungsaufgabe überlassen zu zeigen, dass die Addition und Multiplikation
assoziativ und kommutativ sind und dass das distributative Gesetz gilt. Das
Element (0, 0) (bzw. das Element (1, 0)) ist die Null (bzw. die Eins) in C, da
(0, 0) + (x, y) = (0 + x, 0 + y) = (x, y) und
(1, 0)(x, y) = (1x − 0y, 1y + 0x) = (x, y)
für jedes (x, y) ∈ C. Ferner ist −(x, y) = (−x, −y) für jedes (x, y) ∈ C. Ist
(x, y) ∈ C mit (x, y) 6= (0, 0), so ist σ = x2 + y 2 > 0 und
x2 y 2 xy yx y
= (1, 0) ,
, − (x, y) =
+ ,
−
σ σ
σ
σ σ
σ
x
d.h. (x/σ, −y/σ) = (x, y)−1 .
Nun wird R mit der Teilmenge R × {0} = {(x, 0) : x ∈ R} von C identifiziert.
Etwas genauer: Für jedes x ∈ R wird das Element x mit dem Element (x, 0) ∈ C
identifiziert. Diese Identifizierung von R und R × {0} ⊂ C ist verträglich mit den
Additionen und Multiplikationen in R und C, da (x, 0) + (x′ , 0) = (x + x′ , 0) und
(x, 0)(x′ , 0) = (xx′ , 0) für alle x, x ∈ R. Auf diese Weise kann R als Unterkörper
von C angesehen werden. Mit anderen Worten, C wird als Körpererweiterung von
R angesehen.
4 Der Körper der komplexen Zahlen
28
Setze nun i = (0, 1); dann ist (0, 1)(0, 1) = (−1, 0) = −(1, 0), d.h. i2 = −1. Damit
ist C eine Körpererweiterung von R, die ein Element i enthält, für das i2 = −1
gilt. Ferner ist C eine minimale solche Erweiterung: Ist z = (x, y) ∈ C, so ist
(x, y) = (x, 0) + (0, y) = (x, 0) + (0, 1)(y, 0)
und damit hat z = (x, y) ∈ C die (eindeutige) Darstellung x + iy.
In der Praxis wird diese Darstellung ständig verwendet: Es wird also meistens
x + iy statt (x, y) geschreiben. Das Element i = (0, 1) in C heißt imaginäre
Einheit.
Sei z = x+iy ∈ C mit x, y ∈ R; dann heißt x (bzw. y) Realteil (bzw. Imaginärteil )
von z und wird mit Re z (bzw. mit Im z) bezeichnet. Ferner heißt x − iy die zu z
konjugierte komplexe Zahl und sie wird mit z bezeichnet. Man sieht sofort, dass
die folgenden Rechenregeln gelten:
(1) Re z = (z + z)/2 und Im z = (z − z)/2i für alle z ∈ C.
(2) z = z für alle z ∈ C.
(3) z = z genau dann, wenn z ∈ R.
(4) z + w = z + w und zw = z w für alle z, w ∈ C.
(5) Für z = x + iy (mit x, y ∈ R) ist zz = x2 + y 2.
Sei z ∈ C; nach √
(5) ist zz eine nichtnegative reelle Zahl und ihre (nichtnegative)
Quadratwurzel zz wird mit |z| bezeichnet und heißt der Betrag von z. Also ist
p
|z| = (Re z)2 + (Im z)2 .
Diese Bezeichnung stimmt mit dem auf R definierten Betrag, da für x ∈ R ist
x , falls x ≥ 0,
|x| =
−x , falls x < 0.
Satz 4.1 Folgende Rechenregeln gelten für den Betrag:
(1) |zw| = |z||w| für alle z, w ∈ C.
(2) | Re z| ≤ |z|, | Im z| ≤ |z| und |z| = |z| für alle z ∈ C.
(3) |z| = 0 genau dann, wenn z = 0.
(4) |z + w| ≤ |z| + |w| für alle z, w ∈ C (Dreiecksungleichung).
(5) ||z| − |w|| ≤ |z − w| für alle z, w ∈ C (Umgekehrte Dreiecksungleichung).
4 Der Körper der komplexen Zahlen
√
29
√ √
zzww = zz ww = |z||w|.
p
2 und daraus ergibt
(2) Sei z = x + iy ∈√C mitp
x, y ∈ R; dann ist |z| = px2 + yp
2
2
2
2
2
2
sich, dass
p | Re z| = xp ≤ x + y = |z|, | Im z| = y ≤ x + y = |z| und
|z| = x2 + (−y)2 = x2 + y 2 = |z|.
Beweis (1) Für alle z, w ∈ C ist |zw| =
zwzw =
√
(3) Dies ist klar: Für alle x, y ∈ R ist x2 + y 2 = 0 genau dann, wenn x = y = 0.
(4) Für jedes ζ ∈ C ist ζ + ζ = 2 Re ζ; folglich gilt nach (1) und (2), dass
|z + w|2 = (z + w)(z + w) = (z + w)(z + w)
= zz + zw + zw + ww = |z|2 + 2 Re(zw) + |w|2
≤ |z|2 + 2|zw| + |w|2 = |z|2 + 2|z||w| + |w|2 = (|z| + |w|)2 ,
und damit ist |z + w| ≤ |z| + |w|.
(5) Nach (4) gilt |z| = |z − w + w| ≤ |z − w| + |w| und damit |z| − |w| ≤ |z − w|,
und genauso gilt −(|z| − |w|) = |w| − |z| ≤ |w − z| = |z − w|. Daraus ergibt sich,
dass ||z| − |w|| ≤ |z − w|.
Eine Teilmenge D von C heißt beschränkt, wenn es ein B ∈ R mit B ≥ 0 gibt, so
dass |z| ≤ B für alle z ∈ D.
Lemma 4.3 Eine Teilmenge D von C ist genau dann beschränkt, wenn Re(D)
und Im(D) beschränkte Teilmengen von R sind.
Beweis Sei D beschränkt; dann gibt es ein B ∈ R mit B ≥ 0, so dass |z| ≤ B
für alle z ∈ D. Nach Satz 4.1 (2) ist also | Re z| ≤ B und | Im z| ≤ B für alle
z ∈ D, und damit sind Re(D) und Im(D) beschränkt. Sind umgekehrt Re(D)
und Im(D) beschränkte Teilmengen von R, dann gibt es B1 , B2 ∈ R mit B1 ≥ 0
und B2 ≥ 0, so p
dass | Re z| ≤ B1 und | Im z| ≤ B2 für alle z ∈ D. Daraus ergibt
sich, dass |z| ≤ B12 + B22 für alle z ∈ D, d.h., D ist eine beschränkte Teilmenge
von C.
5
Folgen
Ab jetzt bezeichnet K entweder den Körper R oder den Körper C. Genauer bedeutet dies: K wird in denjenigen Situationen verwendet, in denen die Ersetzung
von K sowohl durch R als auch durch C einen Sinn macht.
Unter einer Folge aus einer Menge X versteht man eine Abbildung
̺ : {n ∈ N : n ≥ p} → X
für ein p ∈ N. Jedem n ≥ p ist also ein Element xn = ̺(n) ∈ X zugeordnet und
man schreibt hierfür meistens {xn }n≥p statt ̺.
Sei {xn }n≥p eine Folge aus K. Die Folge heißt konvergent gegen x ∈ K, falls es zu
jedem ε > 0 ein N ≥ p gibt, so dass |xn − x| < ε für alle n ≥ N.
Bemerkung: Bei einem Ausdruck wie ‘ε > 0’ oder ‘N ≥ p’ muss es aus dem
Kontext entnommen werden, dass ‘ε ∈ R mit ε > 0’ bzw. ‘N ∈ N mit N ≥ p’
gemeint ist.
Lemma 5.1 Sei {xn }n≥p eine Folge aus K und sei q ≥ p. Dann konvergiert die
Folge {xn }n≥p gegen x ∈ K genau, wenn die Folge {xn }n≥q gegen x konvergiert.
Beweis Dies ist klar.
Lemma 5.2 Sei {xn }n≥p eine Folge aus K und seien x, x′ ∈ K. Konvergiert
{xn }n≥p gegen x und gegen x′ , so ist x′ = x.
Beweis Sei ε > 0; da {xn }n≥p gegen x und gegen x′ konvergiert, gibt es N, N ′ ≥ p,
so dass |xn − x| < ε/2 für alle n ≥ N und |xn − x′ | < ε/2 für alle n ≥ N ′ . Für
M = max{N, N ′ } ist dann
|x − x′ | = |x − xM + xM − x′ | ≤ |x − xM | + |xM − x′ | < ε/2 + ε/2 = ε ,
und dies zeigt, dass |x − x′ | < ε für alle ε > 0. Damit ist x′ = x.
Konvergiert eine Folge {xn }n≥p aus K gegen x, so nennt man x den Grenzwert
oder den Limes der Folge und schreibt limn→∞ xn = x. Nach Lemma 5.2 macht
diese Schreibweise einen Sinn. Ferner gibt es nach Lemma 5.1 auch kein Problem
mit dieser Schreibweise, wenn die Folgen {xn }n≥p und {xn }n≥q (für ein q ≥ p)
gleichzeitig behandelt werden.
Wichtige Beispiele: (1) Die Folge {1/n}n≥1 konvergiert gegen 0: limn→∞ 1/n = 0.
(Sei ε > 0; nach Satz 3.3 gibt es ein N ≥ 1, so dass N > ε−1 , und für alle n ≥ N
ist dann |1/n − 0| = 1/n ≤ 1/N < ε; dies zeigt, dass limn→∞ 1/n = 0.)
(2) Für jedes x ∈ K mit |x| < 1 konvergiert die Folge {xn }n≥0 der Potenzen von
x gegen 0: limn→∞ xn = 0. (Dies ist wie in (1), aber mit Hilfe von Satz 3.5 (2).)
30
5 Folgen
31
Satz 5.1 Sei {zn }n≥p eine Folge komplexer Zahlen und z ∈ C.
(1) Die Folge {zn }n≥p konvergiert gegen z genau dann, wenn die Folge {Re zn }n≥p
gegen Re z und die Folge {Im zn }n≥p gegen Im z konvergiert.
(2) Die Folge {zn }n≥p konvergiert gegen z genau dann, wenn die Folge {z n }n≥p
gegen z konvergiert.
Beweis (1) Nehme zunächst an, dass die Folge {zn }n≥p gegen z konvergiert, und
sei ε > 0. Dann gibt es N ≥ p, so dass |zn − z| < ε für alle n ≥ N. Daraus folgt
nach Satz 4.1 (2), dass sowohl | Re zn − Re z| = | Re(zn − z)| ≤ |zn − z| < ε als
auch | Im zn − Im z| = | Im(zn − z)| ≤ |zn − z| < ε für alle n ≥ N, und dies zeigt,
dass {Re zn }n≥p gegen Re z und {Im zn }n≥p gegen Im z konvergiert.
Nehme umgekehrt an, dass {Re zn }n≥p gegen Re z und {Im zn }n≥p gegen Im z
konvergiert, und sei ε > 0. Dann gibt es N1 , N2 ≥ p, so dass | Re zn − Re z| < ε/2
für alle n ≥ N1 und | Im zn −Im z| < ε/2 für alle n ≥ N2 . Setze N = max{N1 , N2 };
für alle n ≥ N ist dann
|zn − z| = | Re zn + i Im zn − Re z − i Im z|
= | Re zn − Re z + i(Im zn − Im z)| ≤ | Re zn − Re z| + |i(Im zn − Im z)|
= | Re zn − Re z| + |i|| Im zn − Im z| = | Re zn − Re z| + | Im zn − Im z|
< ε/2 + ε/2 = ε ,
und dies zeigt, dass {zn }n≥p gegen z konvergiert.
(2) Dies folgt unmittelbar aus der Tatsache, dass |z n − z| = |zn − z|.
Sei {xn }n≥p eine Folge reeller Zahlen. Da R ⊂ C, kann {xn }n≥p auch als Folge
komplexer Zahlen angesehen werden. Es gibt also zwei mögliche Konvergenzbegriffe (Konvergenz in R und Konvergenz in C), die hier angewendet werden
können, die aber übereinstimmen: Aus Satz 5.1 (1) folgt, dass die Folge genau
dann in C konvergiert, wenn sie in R konvergiert.
Ist {xn }n≥p eine Folge aus K, so ist {|xn |}n≥p eine Folge reeller Zahlen.
Satz 5.2 Sei {x
n }n≥p eine konvergente Folge aus K. Dann konvergiert die Folge
{|xn |}n≥p und lim xn = lim |xn |.
n→∞
n→∞
Beweis Sei x = limn→∞ xn und ε > 0. Dann gibt es N ≥ p, so dass |xn − x| < ε
für alle n ≥ p, und daraus folgt nach Satz 2.3 (4) (bzw. nach Satz 4.1 (5)), dass
auch ||xn | − |x|| ≤ |xn − x| < ε für alle n ≥ p, und dies zeigt, dass die Folge
{|xn |}n≥p gegen |x| konvergiert.
5 Folgen
32
Satz 5.3 Seien {yn }n≥p und {xn }n≥p zwei konvergente Folgen reeller Zahlen mit
yn ≤ xn für alle n ≥ p. Dann gilt lim yn ≤ lim xn .
n→∞
n→∞
Beweis Setze x = limn→∞ xn und y = limn→∞ yn . Sei ε > 0; dann gibt es N, N ′ ≥
p, so dass |xn − x| < ε/2 für alle n ≥ N und |yn − y| < ε/2 für alle n ≥ N ′ . Für
M = max{N, N ′ } ist dann
y − x ≤ y − yM + xM − x ≤ |y − yM + xM − x|
≤ |y − yM | + |xM − x| < ε/2 + ε/2 = ε ,
und dies zeigt, dass y − x < ε für alle ε > 0. Damit ist y − x ≤ 0, d.h. y ≤ x.
Wichtiger Spezialfall von Satz 5.3: Ist {xn }n≥p eine konvergente Folge reeller
Zahlen mit xn ≥ 0 für alle n ≥ p, so ist limn→∞ xn ≥ 0 (da die Folge {yn }n≥p mit
yn = 0 für alle n ≥ p offensichtlich gegen 0 konvergiert).
Sei {xn }n≥p eine Folge aus K. Für m ≥ p wird die Teilmenge von K
{x ∈ K : es gibt n ≥ m, so dass x = xn }
kurz mit {xn : n ≥ m} bezeichnet. Die Folge {xn }n≥p heißt beschränkt, wenn
{xn : n ≥ p} eine beschränkte Teilmenge von K ist. Also ist {xn }n≥p beschränkt
genau dann, wenn es ein B ∈ R mit B ≥ 0 gibt, so dass |xn | ≤ B für alle n ≥ p.
Satz 5.4 Jede konvergente Folge aus K ist beschränkt.
Beweis Sei {xn }n≥p eine konvergente Folge mit Grenzwert x. Dann gibt es N ≥ p,
so dass |xn − x| < 1 für alle n ≥ N, und folglich ist |xn | ≤ 1 + |x| für alle n ≥ N.
Sei c = 1 + |x| + |xp | + |xp+1 | + · · · + |xN −1 |; dann ist |xn | ≤ c für alle n ≥ p und
damit ist die Folge {xn }n≥p beschränkt.
Sei {xn }n≥p eine konvergente Folge
aus K mit
|xn | ≤ c für alle n ≥ p. Dann folgt
aus Satz 5.2 und Satz 5.3, dass limn→∞ xn ≤ c.
Satz 5.5 Seien {xn }n≥p und {yn }n≥p zwei konvergente Folgen aus K.
(1) Dann konvergiert auch die Summenfolge {xn + yn }n≥p , und es gilt
lim (xn + yn ) = lim xn + lim yn .
n→∞
n→∞
n→∞
(2) Ebenso konvergiert die Produktfolge {xn yn }n≥p , und es gilt
lim xn yn = lim xn · lim yn .
n→∞
n→∞
n→∞
5 Folgen
33
Beweis Setze x = limn→∞ xn und y = limn→∞ yn .
(1) Sei ε > 0; dann gibt es N, N ′ ≥ p, so dass |xn − x| < ε/2 für alle n ≥ N und
|yn − y| < ε/2 für alle n ≥ N ′ . Sei M = max{N, N ′ }; für alle n ≥ M ist dann
|(xn + yn ) − (x + y)| = |(xn − x) + (yn − y)| ≤ |xn − x| + |yn − y| < ε/2 + ε/2 = ε
und dies zeigt, dass die Summenfolge {xn + yn }n≥p gegen x + y konvergiert.
(2) Nach Satz 5.4 ist die Folge {xn }n≥p beschränkt; es gibt also c > 0, so dass
|xn | ≤ c für alle n ≥ p. Setze b = c + |y| (und also ist b > 0). Sei ε > 0; dann gibt
es N, N ′ ≥ p, so dass |xn − x| < ε/b für alle n ≥ N und |yn − y| < ε/b für alle
n ≥ N ′ . Sei M = max{N, N ′ }; für alle n ≥ M ist dann
|xn yn − xy| = |xn (yn − y) + (xn − x)y|
≤ |xn (yn − y)| + |(xn − x)y| = |xn ||yn − y| + |y||xn − x|
≤ c|yn − y| + |y||xn − x| < cε/b + |y|ε/b = ε ,
und dies zeigt, dass die Produktfolge {xn yn }n≥p gegen xy konvergiert.
Lemma 5.3 Sei {xn }n≥p eine konvergente Folge aus K mit limn→∞ xn = x 6= 0.
Dann gibt es ein q ≥ p, so dass xn 6= 0 für alle n ≥ q.
Beweis Sei ε = |x|/2 (und damit ist ε > 0). Es gibt also q ≥ p, so dass |xn −x| < ε
für alle n ≥ q, und daraus folgt, dass
2ε = |x| = |x − xn + xn | ≤ |x − xn | + |xn | < ε + |xn |
und insbesondere ist |xn | > ε > 0 für alle q ≥ p.
Ist {xn }n≥p eine konvergente Folge reeller Zahlen mit limn→∞ xn = x, so zeigt der
Beweis für Lemma 5.3 tatsächlich folgendes: Ist x > 0 (bzw. ist x < 0), dann gibt
es ein q ≥ p, so dass xn > 0 für alle n ≥ q (bzw. so dass xn < 0 für alle n ≥ q).
Satz 5.6 Sei {xn }n≥p eine konvergente Folge aus K mit xn 6= 0 für alle n ≥ p
und limn→∞ xn 6= 0. Dann konvergiert die Inversefolge {x−1
n }n≥p , und
−1
lim x−1
.
n = lim xn
n→∞
n→∞
Beweis Sei x = limn→∞ xn . Wie im Beweis für Lemma 5.3 gibt es ein q ≥ p, so
dass |xn | ≥ |x|/2 für alle n ≥ q; setze b = 2/|x|2 . Sei nun ε > 0; dann gibt es
M ≥ p, so dass |xn − x| < ε/b für alle n ≥ M. Sei N = max{M, q}; für alle
n ≥ N ist dann
1
1 xn − x |xn − x|
2 1
≤
|xn − x| = b|xn − x| < bε/b = ε ,
− =
=
xn x
xn x
|xn ||x|
|x| |x|
5 Folgen
34
−1
und dies zeigt, dass die Inversefolge {x−1
konvergiert.
n }n≥p gegen x
Sei {xn }n≥p eine Folge aus K und sei nq < nq+1 < · · · eine aufsteigende Folge
natürlicher Zahlen mit p ≤ nq . Dann heißt die Folge {xnk }k≥q (d.h. die Folge
{yk }k≥q mit yk = xnk für alle k ≥ q) Teilfolge der Folge {xn }n≥p .
Bemerkung: Ist nq < nq+1 < · · · eine aufsteigende Folge natürlicher Zahlen mit
p ≤ nq , so ist nq+m ≥ p + m für alle m ∈ N.
Sei {xn }n≥p eine Folge und sei q ≥ p. Dann ist die Folge {xn }n≥q sowie jede ihrer
Teilfolgen eine Teilfolge von {xn }n≥p .
Satz 5.7 Sei {xn }n≥p eine konvergente Folge aus K mit limn→∞ xn = x. Dann
konvergiert jede Teilfolge – auch gegen x.
Beweis Sei {xnk }k≥q Teilfolge von {xn }n≥p und sei ε > 0. Da die Folge {xn }n≥p
gegen x konvergiert, gibt es dann ein M ≥ p, so dass |xn − x| < ε für alle n ≥ M.
Sei N = M − p + q; für jedes k ≥ N ist dann nk ≥ nN = nM −p+q ≥ M und damit
ist |xnk − x| < ε. Folglich konvergiert die Teilfolge {xnk }k≥q gegen x.
Eine Folge {xn }n≥p reeller Zahlen heißt monoton wachsend, falls xn ≤ xn+1 für
alle n ≥ p, streng monoton wachsend, falls xn < xn+1 für alle n ≥ p, monoton
fallend, falls xn+1 ≤ xn für alle n ≥ p, streng monoton fallend, falls xn+1 < xn für
alle n ≥ p und monoton, falls sie monoton wachsend oder monoton fallend ist.
Es ist klar, dass eine monoton wachsende (bzw. ein monoton fallende) Folge
{xn }n≥p reeller Zahlen genau dann beschränkt ist, wenn {xn : n ≥ p} nach oben
(bzw. nach unten) beschränkt ist.
Satz 5.8 Jede beschränkte monotone Folge {xn }n≥p reeller Zahlen konvergiert
mit dem Grenzwert sup({xn : n ≥ p}) (bzw. inf({xn : n ≥ p})), falls {xn }n≥p
monoton wachsend (bzw. monoton fallend) ist.
Beweis Sei {xn }n≥p eine beschränkte monoton wachsende Folge reeller Zahlen
und sei A = {xn : n ≥ p}. Dann ist A eine nichtleere nach oben beschränkte
Teilmenge von R und damit existiert das Supremum x = sup(A). Sei ε > 0; dann
gibt es y ∈ A mit y > x − ε, sonst wäre x − ε eine obere Schranke von A, es gibt
also N ≥ p mit xN = y > x − ε. Aber dann ist x − ε < xn ≤ xn ≤ x < x + ε
für alle n ≥ N, da die Folge {xn }n≥p monoton wachsend ist und x eine obere
Schranke von A ist. Mit anderen Worten: Für alle n ≥ N ist |xn − x| < ε,
und dies zeigt, dass die Folge {xn }n≥p gegen x konvergiert. Der Beweis für eine
beschränkte monoton fallende Folge geht natürlich analog.
5 Folgen
35
Ist {xn }n≥p eine nicht beschränkte monoton wachsende (bzw. monoton fallende)
Folge reeller Zahlen, so ist es nützlich limn→∞ xn = +∞ (bzw. limn→∞ xn = −∞)
zu setzen; nach Satz 5.8 gilt also
lim xn = sup({xn : n ≥ p})
n→∞
für jede monoton wachsende Folge {xn }n≥p und
lim xn = inf({xn : n ≥ p})
n→∞
für jede monoton fallende Folge {xn }n≥p reeller Zahlen.
Satz 5.9 Jede Folge reeller Zahlen besitzt eine monotone Teilfolge.
Beweis Sei {xn }n≥p eine Folge reeller Zahlen; in diesem Beweis wird ein Index
m ≥ p kritisch genannt, wenn xn ≤ xm für alle p ≤ n ≤ m und xn < xm für alle
n > m. Es ist ist klar, dass es höchstens einen Index mit diesen Eigenschaften
gibt, im allgemeinen aber braucht er nicht zu existieren. Das folgende Lemma
wird benötigt:
Lemma 5.4 (1) Eine Folge reeller Zahlen, die keinen kritischen Index hat, besitzt eine monoton wachsende Teilfolge.
(2) Sei {xn }n≥p ein Folge reeller Zahlen und sei q ≥ p. Besitzt die Folge {xn }n≥q
eine monoton wachsende Teilfolge, so besitzt die Folge {xn }n≥p ebenso eine.
(3) Sei {xn }n≥p ein Folge reeller Zahlen und sei q ≥ p. Hat die Folge {xn }n≥q
keinen kritischen Index, so besitzt die Folge {xn }n≥p eine monoton wachsende
Teilfolge.
Beweis (1) ist eine Übung, (2) ist klar, und (3) folgt aus (1) und (2).
Nun zum Beweis für Satz 5.9: Sei {xn }n≥p ein Folge reeller Zahlen und nehme
an, dass diese Folge keine monoton wachsende Teilfolge besitzt. Es wird gezeigt,
dass dann {xn }n≥p eine streng monoton fallende Teilfolge besitzt.
Nach Lemma 5.3 (3) hat die Folge {xn }n≥q einen kritischen Index für jedes q ≥ p.
Folglich gibt es eine aufsteigende Folge n0 < n1 < · · · natürlicher Zahlen mit
n0 dem kritischen Index der Folge {xn }n≥p und mit nk+1 dem kritischen Index
der Folge {xn }n≥nk +1 für jedes k ∈ N. Aber xnk+1 < xnk für jedes k ∈ N (da
nk+1 > nk ), und damit ist {xnk }k≥0 eine streng monoton fallende Teilfolge von
{xn }n≥p . Dies zeigt: Entweder besitzt {xn }n≥p eine monoton wachsende oder eine
streng monoton fallende Teilfolge; insbesondere besitzt {xn }n≥p eine monotone
Teilfolge.
5 Folgen
36
Lemma 5.5 Jede beschränkte Folge reeller Zahlen besitzt eine konvergente Teilfolge.
Beweis Jede Folge reeller Zahlen besitzt eine monotone Teilfolge (Satz 5.9). Ist
die Folge beschränkt, so ist auch diese Teilfolge beschränkt und damit konvergiert
sie nach Satz 5.8.
Satz 5.10 (Bolzano-Weierstraß) Jede beschränkte Folge aus K besitzt eine
konvergente Teilfolge.
Beweis Nach Lemma 5.4 bleibt nur der Fall mit K = C; sei also {zn }n≥p eine
beschränkte Folge komplexer Zahlen. Für jedes n ≥ p sei xn = Re zn ; nach
Satz 4.1 (2) ist {xn }n≥p eine beschränkte Folge reeller Zahlen, die dann nach
Lemma 5.4 eine konvergente Teilfolge {xnk }k≥q besitzt. Setze yk = Im znk für
jedes k ≥ q; nach Satz 4.1 (2) ist {yk }k≥q eine beschränkte Folge reeller Zahlen,
die dann wieder nach Lemma 5.4 eine konvergente Teilfolge {ykj }j≥r besitzt. Setze
mj = nkj für jedes j ≥ r; dann ist {xmj }j≥r eine Teilfolge von {xnk }k≥q und somit
konvergent. Nun ist ykj = Im zmj für jedes j ≥ r und folglich konvergieren die
Folgen {Re zmj }j≥r und {Im zmj }j≥r . Nach Satz 5.1 (1) konvergiert also die Folge
{zmj }j≥r , d.h. die Folge {zn }n≥p besitzt die konvergente Teilfolge {zmj }j≥r .
Eine Folge {xn }n≥p aus K heißt Cauchy-Folge, wenn es zu jedem ε > 0 ein N ≥ p
gibt, so dass |xm − xn | < ε für alle m, n ≥ N.
Lemma 5.6 Jede Cauchy-Folge aus K ist beschränkt.
Beweis (Dies ist sehr ähnlich zu dem Beweis für Satz 5.4) Sei {xn }n≥p eine
Cauchy-Folge. Dann gibt es N ≥ p, so dass |xm − xn | < 1 für alle m, n ≥ N, und
folglich ist |xn | ≤ 1 + |xN | für alle n ≥ N. Sei c = 1 + |xp | + · · · + |xN |; dann ist
|xn | ≤ c für alle n ≥ p und damit ist die Folge {xn }n≥p beschränkt.
Lemma 5.7 Besitzt eine Cauchy-Folge aus K eine konvergente Teilfolge, so ist
sie selbst konvergent.
Beweis Sei {xnk }k≥q eine Teilfolge einer Cauchy-Folge {xn }n≥p und nehme an,
dass {xnk }k≥q gegen x konvergiert. Sei ε > 0; dann gibt es N ≥ q, so dass
|xnk − x| < ε/2 für alle k ≥ N und N ′ ≥ p, so dass |xm − xn | < ε/2 für alle
m, n ≥ N ′ . Wähle r ≥ N, so dass nr ≥ N ′ und setze M = nr ; dann ist
|xn − x| = |xn − xM + xM − x| ≤ |xn − xM | + |xM − x|
= |xn − xM | + |xnr − x| < ε/2 + ε/2 = ε
für alle n ≥ M und dies zeigt, dass auch {xn }n≥p gegen x konvergiert.
5 Folgen
37
Satz 5.11 Eine Folge aus K konvergiert genau dann, wenn sie eine Cauchy-Folge
ist.
Beweis Sei {xn }n≥p eine konvergente Folge mit limn→∞ xn = x. Sei ε > 0; es gibt
also N ≥ p, so dass |xn − x| < ε/2 für alle n ≥ N. Für alle n, m ≥ N ist dann
|xm − xn | = |xm − x + x − xn | ≤ |xm − x| + |x − xn | < ε/2 + ε/2 = ε
und dies zeigt, dass {xn }n≥p eine Cauchy-Folge ist. Die Umkehrung folgt direkt
aus Lemma 5.5, Lemma 5.6 und Satz 5.10.
Sei nun {xn }n≥p eine nach oben beschränkte Folge reeller Zahlen. Für n ≥ p sei
x↑n = sup({xm : m ≥ n}); folglich ist {x↑n }n≥p eine monoton fallende Folge reeller
Zahlen, da {xn : n ≥ m + 1} ⊂ {xn : n ≥ m} für jedes m ≥ p. Setze
x↑ = lim x↑n ,
n→∞
somit ist x↑ ∈ R ∪ {−∞}. Diese ‘Zahl’ x↑ heißt Limes superior der Folge {xn }n≥p
und wird mit lim supn→∞ xn bezeichnet. Ist die Folge nicht nach oben beschränkt,
so setzt man lim supn→∞ xn = +∞.
Analog wird der Limes inferior definiert. Zunächst sei {xn }n≥p eine nach unten
beschränkte Folge reeller Zahlen. Für jedes n ≥ p sei x↓n = inf({xm : m ≥ n});
also ist {x↓n }n≥p eine monoton wachsende Folge reeller Zahlen, da für jedes m ≥ p
gilt {xn : n ≥ m} ⊂ {xn : n ≥ m + 1}. Setze
x↓ = lim x↓n ,
n→∞
somit ist x↓ ∈ R ∪ {+∞}. Diese ‘Zahl’ x↓ heißt Limes inferior der Folge {xn }n≥p
und wird mit lim inf n→∞ xn bezeichnet. Ist die Folge nicht nach unten beschränkt,
so setzt man lim inf n→∞ xn = −∞.
Satz 5.12 Für jede Folge {xn }n≥p reeller Zahlen gilt lim inf xn ≤ lim sup xn .
n→∞
n→∞
Beweis Dies ist klar, wenn lim inf n→∞ xn = −∞ oder lim supn→∞ xn = +∞.
Es kann also angenommen werden, dass die Folge {xn }n≥p beschränkt ist. Aber
nach Lemma 3.7 ist x↓n = inf({xm : m ≥ n}) ≤ sup({xm : m ≥ n}) = x↑n für
jedes n ≥ p. Damit ist die monoton wachsende Folge {x↓n }n≥p nach oben und die
monoton fallende Folge {x↑n }n≥p nach unten beschränkt, und folglich ist
lim inf xn = lim x↓n ≤ lim x↑n = lim sup xn .
n→∞
n→∞
n→∞
n→∞
5 Folgen
38
Lemma 5.8 Sei {xn }n≥p eine Folge reeller Zahlen und sei x ∈ R.
(1) Es gilt lim supn→∞ xn ≤ x genau dann, wenn die Menge {n ≥ p : xn > x + ε}
endlich ist für jedes ε > 0.
(2) Es gilt lim supn→∞ xn ≥ x genau dann, wenn die Menge {n ≥ p : xn > x − ε}
unendlich ist für jedes ε > 0.
(3) Es gilt lim inf n→∞ xn ≥ x genau dann, wenn die Menge {n ≥ p : xn < x − ε}
endlich ist für jedes ε > 0.
(4) Es gilt lim inf n→∞ xn ≤ x genau dann, wenn die Menge {n ≥ p : xn < x + ε}
unendlich ist für jedes ε > 0.
Beweis (1) Dies ist trivial richtig, wenn die Folge {xn }n≥p nicht nach oben beschränkt ist, da in diesem Fall die Menge {n ≥ p : xn > y} unendlich ist für
jedes y ∈ R und lim supn→∞ xn = +∞. Es kann also angenommen werden, dass
{xn }n≥p nach oben beschränkt ist. In diesem Fall gilt lim supn→∞ xn ≤ x genau
dann, wenn es zu jedem ε > 0 ein n ≥ p mit sup({xm : m ≥ n}) ≤ x + ε gibt,
(da die Folge {x↑n }n≥p monoton fallend ist). Aber sup({xm : m ≥ n}) ≤ x + ε
gilt genau dann, wenn xm ≤ x + ε für alle m ≥ n. Daraus ergibt sich, dass
lim supn→∞ xn ≤ x genau dann gilt, wenn es zu jedem ε > 0 ein n ≥ p gibt mit
xm ≤ x + ε für alle m ≥ n, d.h. genau dann, wenn für jedes ε > 0 die Menge
{n ≥ p : xn > x + ε} endlich ist.
(2) Es kann wieder angenommen werden, dass {xn }n≥p nach oben beschränkt ist.
In diesem Fall gilt lim supn→∞ xn ≥ x genau dann, wenn sup({xm : m ≥ n}) ≥ x
für alle n ≥ p und nach Lemma 3.5 (2) gilt dies genau dann, wenn es zu jedem
ε > 0 und jedem n ≥ p ein m ≥ n mit xm > x − ε gibt, d.h. genau dann, wenn
für jedes ε > 0 die Menge {n ≥ p : xn > x − ε} unendlich ist.
(3) und (4): Wie (1) und (2).
Satz 5.13 Sei {xn }n≥p eine Folge reeller Zahlen und sei x ∈ R.
(1) Es gilt lim supn→∞ xn = x genau dann, wenn die Menge {n ≥ p : xn > x + ε}
endlich und die Menge {n ≥ p : xn > x − ε} unendlich ist für jedes ε > 0.
(2) Es gilt lim inf n→∞ xn = x genau dann, wenn die Menge {n ≥ p : xn < x − ε}
endlich und die Menge {n ≥ p : xn < x + ε} unendlich ist für jedes ε > 0.
Beweis Dies folgt unmittelbar aus Lemma 5.7.
Satz 5.14 Eine Folge {xn }n≥p reeller Zahlen konvergiert gegen eine Zahl x ∈ R
genau dann, wenn lim inf xn = x = lim sup xn .
n→∞
Beweis Übung.
n→∞
6
Unendliche Reihen
Sei {xn }n≥p eine Folge aus K und für jedes n ≥ p sei
sn =
n
X
xk
k=p
(= xp + xp+1 + · · · + xn ) .
Dann heißt die Folge {sn }n≥p dieser P
Partialsummen (unendliche) Reihe mit den
bezeichnet. Konvergiert die Reihe
Gliedern xn , n ≥ p, und wird mit ∞
n=p xn P
P
∞
∞
x
,
so
wird
ihr
Grenzwert
ebenfalls
mit
n=p xn bezeichnet und heißt dann
n=p n
Summe der Reihe.
P
n
Wichtiges Beispiel: Die geometrische Reihe ∞
n=0 x konvergiert mit der Summe
∞
X
n=0
xn = (1 − x)−1
P
für jedes x ∈ K mit |x| < 1. (Sei x 6= 1 fest und für jedes n ≥ 0 sei sn = nk=0 xk ;
dann ist sn = (1 − x)−1 (1 − xn+1 ) und damit |sn − (1 − x)−1 | = |1 − x|−1 |x|n+1 .
Daraus folgt, dass
{sn }n≥0 gegen (1 − x)−1 konvergiert, falls |x| < 1.
P∞die Folge
D.h.: die Reihe n=0 xn konvergiert mit der Summe (1 − x)−1 , wenn |x| < 1.)
Lemma 6.1
und sei q ≥ p. Dann konvergiert
P∞Sei {xn }n≥p eine Folge aus KP
∞
die Reihe
Konvergieren
n=p xn genau, wenn die Reihe
n=q xn konvergiert.
P∞
P
∞
x
=
x̄
+
diese Reihen, so gilt für ihre Summen, dass
n=q xn , wobei
n=p n
x̄ = xp + xp+1 + · · · + xq−1 .
P
P
Beweis Für jedes n ≥ p sei sn = nk=p xk und für jedes n ≥ q sei s′n = nk=q xk .
Dann gilt sn = x̄+s′n für jedes n ≥ q, und daraus folgt, dass die Folge {sn }n≥q genau dann konvergiert, wenn die Folge {s′n }n≥q konvergiert. Aber nach Lemma 5.1
konvergiert die Folge
P∞die Folge {sn }n≥p konvergiert.
P∞{sn }n≥q genau dann, wenn
Damit konvergiert n=p xn genau dann, wenn n=q xn konvergiert. Konvergieren
diese Reihen, so ergibt sich aus Lemma 5.1, dass
∞
X
xn = lim sn = x̄ + lim s′n = x̄ +
n→∞
n=p
n→∞
∞
X
xn .
n=q
Lemma
6.2 Ist {zn }n≥p eine Folge komplexer Zahlen,
P∞
P∞ so konvergiert
P∞die Reihe
n=p zn genau dann, wenn die (reellen) Reihen
n=p (Re zn ) und
n=p (Im zn )
konvergieren, und in diesem Fall ist
∞
X
n=p
zn =
∞
X
(Re zn ) + i
n=p
∞
X
n=p
39
(Im zn ) .
6 Unendliche Reihen
Beweis Setze sn =
n ≥ p. Dann gilt
sn =
n
X
k=p
zk =
n
X
40
Pn
k=p zk , tn =
Pn
k=p (Re zk ) und un =
(Re zk ) + i(Im zk ) =
k=p
n
X
(Re zk ) + i
k=p
Pn
n
X
k=p (Im zk )
für jedes
(Im zk ) = tn + iun ,
k=p
d.h., tn =P
Re sn und un = Im sn . Daraus ergibt sich nach Satz
P∞ 5.1 (1), dass
∞
z
genau
dann
konvergiert,
wenn
die
Reihen
die
Reihe
n=p (Re zn ) und
n=p n
P∞
n=p (Im zn ) konvergieren. Außerdem gilt in diesem Fall, dass
∞
X
n=p
∞
∞
X
X
zn = lim sn = lim tn + i lim un =
(Re zn ) + i
(Im zn ) .
n→∞
n→∞
n→∞
n=p
n=p
Satz 6.1 Sei {xn }n≥p eine P
Folge reeller Zahlen mit xn ≥ 0 für alle n ≥ p.
Dann konvergiert die Reihe ∞
n=p xn genau, wenn die Folge der Partialsummen
nach
Pn oben beschränkt ist, d.h., genau dann, wenn es ein M ≥ 0 gibt, so dass
k=p xk ≤ M für alle n ≥ p.
Beweis Für jedes n ≥ p sei sn =
sn+1 =
n+1
X
k=p
Pn
k=p
xk . Dann ist
xk = xn+1 +
n
X
k=p
xk ≥
n
X
xk = sn
k=p
für jedes n ≥ p, die Folge {sn }n≥p ist also monoton wachsend. Daraus ergibt
sich nach Satz 5.4 und Satz 5.8, dass die Folge {sn }n≥p genau dann konvergiert,
wenn sie nach oben beschränkt ist, (da eine monoton wachsende Folge genau
dann beschränkt
P∞ ist, wenn sie nach oben beschränkt ist). Mit anderen Worten:
Die Reihe n=p xn konvergiert genau dann, wenn es ein M ≥ 0 gibt, so dass
P
n
k=p xk ≤ M für alle n ≥ p.
P∞
nicht, da für jedes
Nach Satz 6.1 konvergiert die harmonische Reihe
n=1 1/n
P∞
P2p
p ≥ 0 gilt n=1 1/n ≥ p/2. Dagegen konvergiert die Reihe n=1 1/n2 , da
n
n
n X
X
X
1
1
1
1
1
= 1+ 1−
≤2
≤1+
=1+
−
k2
k(k − 1)
k−1 k
n
k=1
k=2
k=2
für alle n > 1. Im Folgenden sei {xn }n≥p eine Folge aus K.
Satz
P∞ 6.2 (Das Cauchysche Konvergenz-Kriterium) Die unendliche Reihe
xn konvergiert genau dann, wenn es zu jedem ε > 0 ein N ≥ p gibt, so
n=p P
dass | nk=m xk | < ε für alle n ≥ m ≥ N.
6 Unendliche Reihen
41
Pn
Beweis
Für
jedes
n
≥
p
sei
s
=
n
k=p xk . Nehme zunächst an, dass die Reihe
P∞
x
konvergiert.
Dann
konvergiert
die Folge {sn }n≥p und nach Satz 5.11
n=p n
ist also {sn }n≥p eine Cauchy-Folge. Sei ε > 0; dann gibt es M ≥ p, so dass
|sn − sm | < ε für alle n > m ≥ M. Setze N =
PM + 1; für alle n ≥ m ≥ N ist
n > m − 1 ≥ M und daraus ergibt sich, dass | nk=m xk | = |sn − sm−1 | < ε.
Nehme umgekehrt
Pnan, dass diese Bedingung erfüllt ist. Sei ε > 0; dann gibt es
N ≥ p, so dass
P | k=m xk | < ε für alle n ≥ m ≥ N. Für alle n > m ≥ N ist dann
|sn − sm | = nk=m+1 xk < ε,P
und dies zeigt, dass {sn }n≥p eine Cauchy-Folge ist.
Damit konvergiert die Reihe ∞
n=p xn nach Satz 5.11.
Satz 6.3 Für jede konvergente Reihe
gegen 0.
P∞
n=p
xn konvergiert die Folge {xn }n≥p
P
Beweis Sei ε > 0; nach Satz 6.2 gibt es dann N ≥ p, so dass | nk=m xk | < ε für
alle n ≥ m ≥ N. Daraus ergibt sich (mit m = n), dass |xn | < ε für alle n ≥ N.
Dies zeigt, dass die Folge {xn }n≥p gegen 0 konvergiert.
Satz 6.4 Sei {cn }n≥p P
eine Folge reeller Zahlen mit |xn | ≤ cn P
für alle n ≥ p.
∞
Konvergiert die Reihe n=p cn (in R), so konvergiert die Reihe ∞
n=p xn und es
P
P
∞
∞
gilt n=p xn ≤ n=p cn .
P
P∞
P∞
∞
Insbesondere konvergiert
n=p xn mit n=p xn ≤
n=p |xn |, falls die Reihe
P∞
n=p |xn | in R konvergiert.
P
P
BeweisPFür jedes n ≥ p sei sn = nk=p xk und s∗n = nk=p ck . Sei ε > 0; da die
∗
Reihe ∞
n=p cn konvergiert (d.h. die Folge {sn }n≥p konvergiert), ist nach Satz 5.11
∗
{sn }n≥p eine Cauchy-Folge, und folglich gibt es N ≥ p, so dass |s∗n − s∗m | < ε für
alle n > m ≥ N. Für alle n > m ≥ N ist dann
n
n
n
X
X
X
ck = |s∗n − s∗m | < ε ,
|xk | ≤
xk ≤
|sn − sm | = k=m+1
k=m+1
k=m+1
und dies zeigt, dass die Folge {sn }n≥p eine Cauchy-Folge
und damit nach Satz 5.11
P
x
konvergiert.
Ferner ist
eine konvergente Folge ist, d.h. die Reihe ∞
n=p n
n
n
n
X
X
X
|sn | = xk ≤
|xk | ≤
ck = s∗n
k=p
k=p
k=p
für alle n ≥ p, und daraus folgt nach Satz 5.2 und Satz 5.3, dass
∞
∞
X
X
∗
cn .
xn = | lim sn | = lim |sn | ≤ lim sn =
n=p
n→∞
n→∞
n→∞
n=p
6 Unendliche Reihen
42
Die letzte Aussage folgt nun mit cn = |xn |.
P
P∞
Die Reihe ∞
n=p xn heißt absolut konvergent, falls die Reihe
n=p |xn | konvergiert
(in R). Die letzte Aussage in Satz 6.4 sagt also, dass eine absolut konvergente
Reihe auch im gewöhnlichen Sinn konvergiert.
P
n
Insbesondere konvergiert die geometrische Reihe ∞
n=0 x absolut für jedes x ∈ K
mit |x| < 1.
Lemma
q ≥ p. Dann konvergiert die
P 6.3 Sei {xn }n≥p eine Folge aus K und
Psei
∞
Reihe ∞
x
absolut
genau,
wenn
die
Reihe
n=p n
n=q xn absolut konvergiert.
Beweis Dies folgt unmittelbar aus Lemma 6.1.
Lemma
6.4 Ist {zn }n≥p eine Folge komplexer Zahlen,
P∞die Reihe
P∞ so konvergiert
P∞
(Re
z
)
und
z
absolut
genau
dann,
wenn
die
Reihen
n
n=p (Im zn )
n=p
n=p n
absolut konvergieren.
Beweis Dies folgt aus Satz 6.4, da | Re zn | ≤ |zn |, | Im zn | ≤ |zn | und
|zn | =
für alle n ≥ p.
p
| Re zn |2 + | Im zn |2 ≤ | Re zn | + | Im zn |
Nun werden einige Konvergenz-Kriterien für Reihen betrachtet. Im Folgenden sei
wieder {xn }n≥p eine Folge aus K.
Satz 6.5 (Majoranten-Kriterium) Sei {cn }n≥p eine Folge reeller Zahlen mit
|xn | ≤P
cn (und insbesondere ist dann cn ≥ 0) P
für alle n ≥ p. Konvergiert die
∞
c
(in
R),
so
konvergiert
die
Reihe
Reihe ∞
n=p n
n=p xn absolut und
∞
∞
X
X
xn ≤
cn .
n=p
n=p
Beweis Dies ist lediglich eine Umformulierung von Satz 6.4.
Satz 6.6 (Quotienten-Kriterium) Nehme an, dass xn 6= 0 für alle n ≥ p und
dass es ein θ ∈ R mit 0 < P
θ < 1 gibt, so dass |xn+1 |/|xn | ≤ θ für alle n ≥ p.
Dann konvergiert die Reihe ∞
n=p xn absolut.
6 Unendliche Reihen
43
Beweis Für alle n ≥ p ist |xn+1 | ≤ θ|xn |, und daraus ergibt sich mit vollständiger
n
Induktion, dass |xn | ≤ MθP
für alle n ≥ p, wobei M = θ−p |xp |. Nach P
Satz 6.5
∞
n
konvergiert also die Reihe P n=p xn absolut, da die geometrische Reihe ∞
n=0 θ
∞
n
und damit auch die Reihe n=p Mθ absolut konvergiert.
Satz 6.7 (Wurzelkriterium) Sei α = lim sup
(1) Ist α < 1, so
(2) Ist α > 1, so
p
n
|xn | (also gilt 0 ≤ α ≤
n→∞
P
konvergiert die Reihe ∞
n=p xn absolut.
P∞
divergiert die Reihe n=p xn (d.h. die Reihe konvergiert
+∞).
nicht).
Beweis (1) Wähle βpmit α < β < 1; da α < β, gibt es nach Lemma 5.7 (1)
n
ein q ≥ p, so dass P
|xn | ≤ β und damit |xn | ≤ β n für alle n ≥ q. Aber die
∞
geometrische Reihe n=qP
β n kovergiert, weil β < 1, und daraus ergibt sich nach
∞
Satz 6.5, dass
P∞ die Reihe n=q xn absolut konvergiert. Folglich konvergiert auch
die Reihe n=p xn absolut.
p
(2) Da α > 1, ist nach Lemma 5.7 (2) die Menge {n ≥ p : n |xn | ≥ 1} und damit
auch die Menge {n ≥ p : |xn | ≥ 1} unendlich, und folglich konvergiert die
P∞Folge
{xn }n≥p nicht gegen 0. Daraus ergibt sich nach Satz 6.3, dass die Reihe n=p xn
divergiert.
Satz 6.8 (Leibnizsches Kriterium) Sei {xn }n≥p eine monoton fallende Folge
reeller Zahlen, die gegen 0 konvergiert (insbesondere
xn ≥ 0 für alle
P ist also
n
(−1)
x
n ≥ p). Dann konvergiert die alternierende Reihe ∞
n.
n=p
Beweis Für n ≥ p sei sn =
Pn
k
k=p (−1) xk .
Für jedes n ≥ p ist dann
s2n+2 = s2n − x2n+1 + x2n+2 ≤ s2n und
s2n+3 = s2n+1 − x2n+2 + x2n+3 ≥ s2n+1 .
Damit ist die Folge {s2n }n≥p monoton fallend und die Folge {s2n+1 }n≥p monoton
wachsend. Ferner ergibt sich daraus, dass s2p+1 ≤ s2n+1 = s2n −x2n+1 ≤ s2n ≤ s2p ,
und insbesondere ist dann s2n ≥ s2p+1 und s2n+1 ≤ s2p für alle n ≥ p. Die
Folgen {s2n }n≥p und {s2n+1 }n≥p sind also monoton und beschränkt und daher
nach Satz 5.8 konvergent. Setze s = limn→∞ s2n und s′ = limn→∞ s2n+1 ; nach
Satz 5.5 (1) ist
s′ − s = lim s2n+1 − lim s2n = lim (s2n+1 − s2n ) = lim x2n+1 = 0 ,
n→∞
n→∞
n→∞
n→∞
d.h., s′ = s. Sei nun ε > 0; dann gibt es N, N ′ ≥ p, so dass |s − s2m | < ε für alle
m ≥ N und |s′ − s2m+1 | < ε für alle m ≥ N ′ ; setze M = max{2N, 2N ′ + 1}. Sei
6 Unendliche Reihen
44
n ≥ M; ist n gerade, so ist m = 2n mit m ≥ N, ist dagegen n ungerade, so ist
m = 2n + 1 mit m ≥ N ′ ; in beiden Fällen
P∞ist alson |s − sn | < ε. Dies zeigt, dass
die Folge {sn }n≥p und damit die Reihe
n=p (−1) xn konvergiert.
Nun muss das sogenannte Cauchy-Produkt von Reihen behandelt werden. Dies
wird zum Beweis der Funktionalgleichung der Exponentialfunktion gebraucht. Im
Folgenden seien {xn }n≥0 und {yn }n≥0 Folgen aus K.
P
P∞
Satz 6.9 Nehme an, dieP
Reihen ∞
absolut und
n=0 xn und
n=0 yn konvergieren
P∞
n
für jedes n ∈ N sei cn = k=0 xk yn−k . Dann konvergiert n=0 cn absolut und
∞
X
cn =
n=0
P∞
(Die Reihe
n=0 cn
∞
X
n=0
xn
∞
X
n=0
yn .
heißt das Cauchy-Produkt der Reihen
Beweis
P Für jedes n ∈ NPsetze sn =
s∗n = nk=0 |xk | und t∗n = nk=0 |yk |.
Pn
k=0
xk , tn =
P∞
n=0
Pn
xn und
k=0 yk ,
P∞
un =
n=0
yn .)
Pn
k=0 ck ,
Lemma 6.5 Seien m, n ≥ 1 mit n ≥ 2m. Dann gilt |un − sn tn | ≤ |s∗n t∗n − s∗m t∗m |.
Beweis Setze Qn = {(p, q) ∈ N2 : p ≤ n, q ≤ n}, Dn = {(p, q) ∈ N2 : p + q ≤ n}
für jedes n ∈ N. Dann sieht man leicht, dass
X
X
xp yq .
xp yq und sn tn =
un =
(p,q)∈Qn
(p,q)∈Dn
Seien m, n ≥ 1 mit n ≥ 2m. Dann gilt Qm ⊂ Dn ⊂ Qn und daraus folgt, dass
X
X
xp yq xp yq −
|un − sn tn | = (p,q)∈Qn
(p,q)∈Dn
=
X
(p,q)∈Qn \Dn
=
X
(p,q)∈Qn
Setze nun s =
∞
P
xp yq ≤
|xp ||yq | −
(p,q)∈Qn \Dn
X
(p,q)∈Qm
xn und t =
n=0
Lemma 6.6 Die Reihe
X
∞
P
|xp ||yq | ≤
|xp ||yq | =
s∗n t∗n
X
(p,q)∈Qn \Qm
|xp ||yq |
− s∗m t∗m = |s∗n t∗n − s∗m t∗m | .
yn .
n=0
∞
P
n=0
cn konvergiert mit der Summe st.
6 Unendliche Reihen
45
P
P∞
Beweis Da die Reihen ∞
x
und
n
n=0
n=0 yn absolut konvergieren, konvergieren
die Folgen {s∗n }n≥0 und {t∗n }n≥0 . Damit konvergiert nach Satz 5.5 (2) auch die
Folge {s∗n t∗n }n≥0 und folglich ist nach Satz 5.11 {s∗n t∗n }n≥0 eine Cauchy-Folge. Sei
nun ε > 0; es gibt also ein N ∈ N, so dass |s∗n t∗n − s∗m t∗m | < ε für alle m, n ≥ N.
Nach Lemma 6.5 ist |un − sn tn | ≤ |s∗n t∗n − s∗N t∗N | < ε für alle n ≥ 2N, und dies
zeigt, dass limn→∞ (un − sn tn ) = 0. Aber s = limn→∞ sn und t = limn→∞ tn und
damit nach Satz 5.5 (2) auch st = limn→∞ sn tn , und daraus ergibt sich, dass die
Folge {un }n≥0 konvergiert und
lim un = lim (un − sn tn ) + lim sn tn = 0 + st = st .
n→∞
n→∞
n→∞
P∞
konvergiert mit der Summe st.
P
Nach Lemma 6.6
nur zu zeigen,
dass die Reihe ∞
n=0 cn absolut konvergiert.
P
Pbleibt
∞
∞
Da die Reihen n=0 |xn | und n=0 |yn | absolut konvergieren, kann Lemma
P∞ 6.6∗
auf diese Reihen angewendet
werden,
und
daraus
folgt,
dass
die
Reihe
n=0 cn
Pn
∗
konvergiert, wobei cn = k=0 |xk ||yn−k |. Aber für jedes n ≥ 0 gilt
Mit anderen Worten: Die Reihe
n=0 cn
n
n
X
X
|xk ||yn−k | = c∗
xk yn−k ≤
|cn | =
n
k=0
und damit konvergiert
∞
P
k=0
cn absolut nach Satz 6.5.
n=0
Als nächstes wird die Exponentialreihe behandelt.
Satz 6.10 Für jedes x ∈ K konvergiert die Reihe
∞
P
xn /n! absolut.
n=0
Beweis Sei x ∈ K fest und wähle p ∈ N mit p ≥ 2|x|. Für jedes n ≥ p ist dann
n+1 n
n
x
= |x| x ≤ 1 x (n + 1)! n + 1 n! 2 n! P
n
und daraus ergibt sich nach Satz 6.6 (mit θ = 1/2), dass die Reihe P∞
n=p x /n!
∞
n
absolut konvergiert. Nach Lemma 6.3 konvergiert dann die Reihe
n=0 x /n!
absolut.
P
P∞ n
n
Die Reihe ∞
n=0 x /n! wird Exponentialreihe genannt und die Summe
n=0 x /n!
mit exp(x) bezeichnet. Insbesondere ist exp(0) =
Die Zahl exp(1) wird meistens
P1.
∞
mit e bezeichnet (Eulersche Zahl ); es gilt e = n=0 1/n! = 2, 71828 . . ..
Da exp(x) für jedes x ∈ K erklärt ist, gibt es die Exponentialfunktion x 7→ exp(x)
als Abbildung von K nach K.
6 Unendliche Reihen
46
Satz 6.11 (Funktionalgleichung der Exponentialfunktion) Es gilt
exp(x + y) = exp(x) exp(y)
für alle x, y ∈ K.
n
Beweis Seien
yn = y n /n! und
n = x /n!, P
Pn x, y ∈ K fest und für jedes n ≥ 0 seiPx∞
konvergieren n=0 xn und ∞
sei cn = k=0 xk yn−k . Nach Satz 6.10 P
n=0 yn absolut
∞
und daraus folgt nach Satz 6.9, dass n=0 cn absolut konvergiert und
∞
X
∞
X
cn =
n=0
n=0
xn
∞
X
yn = exp(x) exp(y) .
n=0
Nach dem binomischen Lehrsatz gilt aber, dass
cn =
und damit ist
n
n
X
1 k
1
1 X 1
1
n!
x
y n−k =
xk y n−k
k!
(n
−
k)!
n!
k!
(n
−
k)!
k=0
k=0
n X
1
1
n k n−k
=
x y
= (x + y)n ,
n! k=0 k
n!
∞
P
n=0
cn =
∞
P
(x + y)n /n! = exp(x + y).
n=0
Mit vollständiger Induktion folgt unmittelbar aus Satz 6.11, dass
exp
n
X
k=1
xk =
n
Y
exp(xk )
k=1
für alle x1 , . . . , xn ∈ K, n ≥ 1. Das folgende Ergebnis beschäftigt sich mit der
Exponentialfunktion im Komplexen.
Satz 6.12 (1) Für alle z ∈ C ist exp(z) 6= 0 und exp(−z) = exp(z)−1 .
(2) Es gilt exp(z) = exp(z) für jedes z ∈ C.
(3) Für alle z, ξ ∈ C gilt | exp(z + ξ) − exp(z)| ≤ |ξ| exp(|ξ|) exp(|z|).
(4) Für alle z, ξ ∈ C mit ξ 6= 0 gilt
|ξ|
exp(z + ξ) − exp(z)
− exp(z) ≤
exp(|ξ|) exp(|z|) .
ξ
2
6 Unendliche Reihen
47
Beweis (1) Nach Satz 6.11 ist exp(z) exp(−z) = exp(z − z) = exp(0) = 1; damit
ist exp(z) 6= 0 und exp(−z) = exp(z)−1 .
P
P
(2) Für jedes n ≥ 0 sei sn = nk=0 z k /k! und s′n = nk=0 z k /k! und folglich ist
exp(z) = limn→∞ sn und exp(z) = limn→∞ s′n . Aber für jedes n ≥ 0 ist s′n = sn
und daraus ergibt sich nach Satz 5.1 (2), dass exp(z) = exp(z).
(3) und (4): Übungen.
Folgende Ergebnisse beschäftigen sich mit der Exponentialfunktion im Reellen.
Lemma 6.7 Für alle x ∈ R mit x > 0 gilt exp(x) ≥ 1 + x.
Beweis Sei x ∈ R mit x > 0; für jedes m ≥ 2 ist dann
m
m
X
X
1 n
1 n
x =1+x+
x ≥1+x,
n!
n!
n=0
n=2
Pm n
und damit ist nach Satz 5.3 exp(x) = lim
n=0 x /n! ≥ 1 + x.
m→∞
Satz 6.13 (1) exp(x) > 0 für alle x ∈ R.
(2) exp(x) > exp(y), falls x, y ∈ R mit x > y.
(3) exp(n) = en für alle n ∈ N.
(4) limx→∞ exp(x) = ∞: Zu jedem N > 0 gibt es ein M > 0, so dass exp(x) > N
für alle x ∈ R mit x > M.
(5) limx→−∞ exp(x) = 0: Zu jedem ε > 0 gibt es ein M > 0, so dass exp(x) < ε
für alle x ∈ R mit x < −M.
Beweis (1) Falls x ≥ 0, so ist nach Lemma 6.7 exp(x) ≥ 1 + x > 0. Ist dagegen
x < 0, so ist −x > 0 und damit exp(−x) ≥ 1; nach Satz 6.12 (1) ist dann auch
exp(x) = exp(−x)−1 > 0.
(2) Sei x > y; dann ist nach Satz 6.11 exp(x) = exp(y+x−y) = exp(y) exp(x−y).
Aber nach (1) ist exp(y) > 0 und nach Lemma 6.7 ist exp(x − y) ≥ 1 + x − y > 1.
Damit ist exp(x) > exp(y).
P
Q
Q
n
(3) Nach Satz 6.11 ist exp(n) = exp
1
= nk=1 exp(1) = nk=1 e = en .
k=1
(4) Sei N > 0; nach Lemma 6.7 ist e = exp(1) ≥ 2 > 1 und damit gibt es nach
Satz 3.6 (1) ein n ∈ N, so dass en > N. Daraus ergibt sich nach (2) und (3), dass
exp(x) > exp(n) = en > N für alle x ∈ R mit x > n.
(5) Sei ε > 0; nach (4) gibt es dann M > 0, so dass exp(y) > ε−1 für alle y > M,
und daraus folgt nach Satz 6.12 (1), dass exp(−y) = exp(y)−1 < (ε−1 )−1 = ε für
alle y > M, d.h., exp(x) < ε für alle x ∈ R mit x < −M.
7
Stetige Funktionen
Die Wörter Funktion und Abbildung sind Synonyme, wobei das Letztere hier
bevorzugt wird.
Sind X und Y Mengen, so wird die Menge aller Abbildungen von X nach Y mit
Abb(X, Y ) bezeichnet. (Oft wird diese Menge mit Y X bezeichnet.)
Sei nun X eine nichtleere Menge und K ein Körper. Für f, g ∈ Abb(X, K) und
λ ∈ K definiere Elemente f + g, f g und λf von Abb(X, K) durch
(f + g)(x) = f (x) + g(x), (f g)(x) = f (x) · g(x) und (λf )(x) = λf (x)
für jedes x ∈ X. Dies liefert dann die Verknüpfungen
+ : Abb(X, K) × Abb(X, K) → Abb(X, K) mit (f, g) 7→ f + g ,
× : Abb(X, K) × Abb(X, K) → Abb(X, K) mit (f, g) 7→ f g ,
· : K × Abb(X, K) → Abb(X, K) mit (λ, f ) 7→ λf .
Lemma 7.1 (1) Mit den Verknüpfungen + und · ist Abb(X, K) ein Vektorraum
über K. Die Nullabbildung 0 : X → K (mit 0(x) = 0 für alle x ∈ X) ist
die Null in Abb(X, K); zu jedem f ∈ Abb(X, K) ist −f ∈ Abb(X, K) durch
(−f )(x) = −f (x) für alle x ∈ X gegeben.
(2) Mit den Verknüpfungen + und × ist Abb(X, K) ein kommutativer Ring mit
Eins. Die Einsabbildung 1 : X → K (mit 1(x) = 1 für alle x ∈ X) ist die Eins
in Abb(X, K).
(3) In dem kommutativen Ring Abb(X, K) ist ein Element f invertierbar genau
dann, wenn f (x) 6= 0 für alle x ∈ X, und in diesem Fall ist die Inverse f −1 die
Abbildung, die durch f −1 (x) = (f (x))−1 für alle x ∈ X gegeben ist.
Beweis Dies ist klar.
Für den Rest des Kapitels sei K′ entweder R oder C und sei D stets eine nichtleere
Teilmenge von K′ . Abbildungen von D nach K werden hier untersucht. Es gibt
also eigentlich die vier verschiedenen Fälle:
(1) Reelle Abbildungen definiert auf einer Teilmenge von R.
(2) Reelle Abbildungen definiert auf einer Teilmenge von C.
(3) Komplexe Abbildungen definiert auf einer Teilmenge von R.
(4) Komplexe Abbildungen definiert auf einer Teilmenge von C.
In einem gewissen Sinne aber ist alles unter dem vierten Fall subsumiert: Jede
Abbildung von einer Menge X nach R kann auch als Abbildung von X nach C
angesehen werden; ferner ist jede Teilmenge E von R auch Teilmenge von C.
48
7 Stetige Funktionen
49
Sei f : D → K eine Abbildung. Dann heißt f an einer Stelle x ∈ D stetig, wenn
es zu jedem ε > 0 ein δ > 0 gibt, so dass |f (y) − f (x)| < ε für alle y ∈ D mit
|y − x| < δ.
Sei f : D → R eine Abbildung. Da f auch als Abbildung von D nach C angesehen
werden kann, gibt es zwei mögliche Stetigkeitsbegriffe (Stetigkeit mit K = R und
Stetigkeit mit K = C), die hier angewendet werden können, die aber übereinstimmen: Die Stetigkeit von g an einer Stelle x ∈ D hängt nicht davon ab, ob
man K = R oder K = C nimmt (da der Betrag | · | in R die Einschränkung vom
Betrag | · | in C ist).
Sei nun E eine nichtleere Teilmenge von R und g : E → K eine Abbildung. Da E
auch als Teilmenge von C angesehen werden kann, gibt es wieder zwei mögliche
Stetigkeitsbegriffe (Stetigkeit mit K′ = R und Stetigkeit mit K′ = C), die hier
angewendet werden kann. Wieder stimmen sie aber überein: Die Stetigkeit von g
an einer Stelle x ∈ E hängt nicht davon ab, ob man K′ = R oder K′ = C nimmt.
Eine Abbildung f : D → K heißt stetig, wenn sie an jeder Stelle x ∈ D stetig ist.
Sei idK : K → K die durch idK (x) = x definierte Identitätsabbildung, und für
jedes a ∈ K′ sei conaK : K → K′ die durch conaK (x) = a definierte konstante
Abbildung. Es ist klar, dass diese Abbildungen alle stetig sind.
Die Abbildung | · | : K → R ist stetig: Sei x ∈ K; zu jedem ε > 0 gilt ||y| − |x|| < ε
für alle y ∈ K mit |y − x| < ε (da ||y| − |x|| ≤ |y − x|), und dies zeigt, dass | · |
an der Stelle x stetig ist.
Satz 7.1 Die Exponentialfunktion exp : K → K ist stetig.
Beweis Sei z ∈ K und ε > 0; setze η = exp(−1 − |z|)ε und sei δ = min{η, 1}.
Für alle w ∈ K mit |w − z| < δ ist dann nach Satz 6.12 (3)
| exp(w) − exp(z)| ≤ |w − z| exp(|w − z|) exp(|z|)
≤ |w − z| exp(1 + |z|) < η exp(1 + |z|) = ε ,
und dies zeigt, dass exp an der Stelle z stetig ist.
Ist f : D → C, so gibt es dann die Abbildungen f : D → C, Re f : D → R und
Im f : D → R, die gegeben sind durch f (x) = f (x), (Re f )(x) = Re(f (x)) und
(Im f )(x) = Im(f (x)) für alle x ∈ D.
Satz 7.2 Sei f : D → C eine Abbildung und x ∈ D. Dann sind äquivalent:
(1) f ist an der Stelle x stetig.
(2) Re f und Im f sind beide an der Stelle x stetig.
(3) f ist an der Stelle x stetig.
7 Stetige Funktionen
50
Beweis Übung.
Lemma 7.2 Sei f : D → K eine Abbildung und E eine nichtleere Teilmenge von
D. Ist f an der Stelle x ∈ E stetig, so ist auch die Einschränkung fE von f auf
E. (Die Einschränkung fE : E → K ist die durch fE (x) = f (x) für alle x ∈ E
definierte Abbildung.)
Beweis Sei ε > 0; da f an der Stelle x stetig ist, gibt es ein δ > 0, so dass
|f (y) − f (x)| < ε für alle y ∈ D mit |y − x| < δ. Insbesondere ist dann
|fE (y) − fE (x)| = |f (y) − f (x)| < ε
für alle y ∈ E mit |y − x| < δ, und dies zeigt, dass fE an der Stelle x stetig ist.
Satz 7.3 Sei f : D → K eine Abbildung und x ∈ D. Dann sind äquivalent:
(1) f ist an der Stelle x stetig.
(2) Die Folge {f (xn )}n≥p konvergiert gegen f (x) für jede Folge {xn }n≥p aus D,
die gegen x konvergiert.
Beweis Nehme zunächst an, dass f an der Stelle x stetig ist, und sei {xn }n≥p eine
Folge aus D, die gegen x konvergiert. Sei ε > 0; dann gibt es ein δ > 0, so dass
|f (y) − f (x)| < ε für alle y ∈ D mit |y − x| < δ. Da {xn }n≥p gegen x konvergiert,
gibt es also ein N ≥ p, so dass |xn − x| < δ für alle n ≥ N. Daraus folgt, dass
|f (xn ) −f (x)| < ε für alle n ≥ N, und dies zeigt, dass die Folge {f (xn )}n≥p gegen
f (x) konvergiert.
Nehme umgekehrt an, dass f an der Stelle x nicht stetig ist. Dann gibt es ein
ε > 0, so dass zu jedem δ > 0 ein y ∈ D existiert mit |y − x| < δ aber mit
|f (y) − f (x)| ≥ ε. Insbesondere bedeutet dies, dass es für jedes n ≥ 1 ein xn ∈ D
gibt mit |xn − x| < n1 aber |f (xn ) − f (x)| ≥ ε. Dann ist {xn }n≥1 eine Folge aus
D, die offensichtlich gegen x konvergiert, aber die Folge {f (xn )}n≥1 kann nicht
gegen f (x) konvergieren, da |f (xn ) − f (x)| ≥ ε für alle n ≥ 1.
Lemma 7.3 Sei f : D → K eine Abbildung, die an der Stelle x ∈ D stetig ist.
Dann gibt es δ > 0 und c ≥ 0, so dass |f (y)| ≤ c für alle y ∈ D mit |y − x| < δ.
Beweis Da f an der Stelle x stetig ist, gibt es δ > 0, so dass |f (y) − f (x)| < 1
für alle y ∈ D mit |y − x| < δ. Sei c = 1 + |f (x)|; dann ist
|f (y)| = |f (y) − f (x) + f (x)| ≤ |f (y) − f (x)| + |f (x)| ≤ 1 + |f (x)| = c
für alle y ∈ D mit |y − x| < δ.
7 Stetige Funktionen
51
Satz 7.4 Seien f, g : D → K Abbildungen, die beide an der Stelle x ∈ D stetig
sind. Dann sind die Abbildungen f + g, f g und λf (für jedes λ ∈ K) auch an der
Stelle x stetig. Ist ferner f (y) 6= 0 für jedes y ∈ D, so ist die Abbildung f −1 an
der Stelle x stetig.
Beweis Dies folgt eigentlich unmittelbar aus Satz 7.3, Satz 5.5 und Satz 5.6.
Dennoch werden Beweise für diese Behauptungen gegeben, die die Definition von
Stetigkeit direkt verwenden.
Die Abbildung f + g ist an der Stelle x stetig: Sei ε > 0; dann gibt es δ1 > 0,
so dass |f (y) − f (x)| < ε/2 für alle y ∈ D mit |y − x| < δ1 , und genauso gibt
es δ2 > 0, so dass |g(y) − g(x)| < ε/2 für alle y ∈ D mit |y − x| < δ2 . Sei
δ = min{δ1 , δ2 }; für alle y ∈ D mit |y − x| < δ ist dann
|(f (y) + g(y)) − (f (x) + g(x))| = |(f (y) − f (x)) + (g(y) − g(x))|
≤ |f (y) − f (x)| + |g(y) − g(x)| < ε/2 + ε/2 = ε ,
und dies zeigt, dass f + g an der Stelle x stetig ist.
Die Abbildung f g ist an der Stelle x stetig: Nach Lemma 7.3 gibt es δ0 > 0 und
c ≥ 0, so dass |f (y)| ≤ c für alle y ∈ D mit |y − x| < δ0 ; wähle b > c + |g(x)|.
Sei ε > 0; dann gibt es δ1 > 0, so dass |f (y) − f (x)| < b−1 ε für alle y ∈ D mit
|y − x| < δ1 , und genauso gibt es δ2 > 0, so dass |g(y) − g(x)| < b−1 ε für alle
y ∈ D mit |y − x| < δ2 . Sei δ = min{δ0 , δ1 , δ2 }; dann ist
|f (y)g(y) − f (x)g(x)| = |f (y)g(y) − f (y)g(x) + f (y)g(x) − f (x)g(x)|
= f (y) g(y) − g(x) + f (y) − f (x) g(x)
≤ |f (y)||g(y) − g(x)| + |f (y) − f (x)||g(x)| ≤ cb−1 ε + b−1 ε|g(x)| < ε
für alle y ∈ D mit |y − x| < δ und dies zeigt, dass f g an der Stelle x stetig ist.
Für jedes λ ∈ R ist die Abbildung λf an der Stelle x stetig: Wähle b mit |λ| < b.
Sei ε > 0; dann gibt es δ > 0, so dass |f (y) − f (x)| < b−1 ε für alle y ∈ D mit
|y − x| < δ. Für alle y ∈ D mit |y − x| < δ ist dann
|λf (y) − λf (x)| = |λ||f (y) − f (x)| ≤ |λ|b−1 ε < ε ,
und dies zeigt, dass λf an der Stelle x stetig ist.
Schließlich nehme an, dass f (y) 6= 0 für alle y ∈ D. Dann ist die Abbildung f −1
an der Stelle x stetig: Setze η = |f (x)|/2. Zunächst gibt es ein δ0 > 0, so dass
|f (y)−f (x)| < η und damit auch |f (y)| ≥ |f (x)|−|f (y)−f (x)| > η für alle y ∈ D
mit |y − x| < δ0 . Sei nun ε > 0; dann gibt es δ1 > 0, so dass |f (y) − f (x)| < 2η 2 ε
für alle y ∈ D mit |y − x| < δ1 . Sei δ = min{δ0 , δ1 }; dann ist
−1
|f −1(y) − f −1 (x)| = |f (y)||f (x)| |f (y) − f (x)|
−1
−1
≤ 2η 2 |f (y) − f (x)| ≤ 2η 2 2η 2 ε = ε
für alle y ∈ D mit |y − x| < δ, und daher ist f −1 an der Stelle x stetig.
7 Stetige Funktionen
52
Satz 7.5 Sei E eine nichtleere Teilmenge von K und seien f : D → K und
g : E → K′′ Abbildungen mit f (D) ⊂ E, wobei K′′ auch entweder R oder C
ist. Ist f an der Stelle x ∈ D und g an der Stelle f (x) ∈ E stetig, so ist die
zusammengesetzte Abbildung g ◦ f : D → K′′ an der Stelle x stetig.
Beweis Setze z = f (x). Sei ε > 0; da g an der Stelle z stetig ist, gibt es η > 0, so
dass |g(w) − g(z)| < ε für alle w ∈ E mit |w − z| < η. Da nun f an der Stelle x
stetig ist, gibt es δ > 0, so dass |f (y) − f (x)| < η für alle y ∈ D mit |y − x| < δ.
Für alle y ∈ D mit |y − x| < δ ist dann |f (y) − z| = |f (y) − f (x)| < η, und
f (y) ∈ E. Damit ist |g(f (y)) − g(z)| < ε, d.h. |g(f (y)) − g(f (x))| < ε. Daraus
ergibt sich, dass g ◦ f an der Stelle x stetig ist.
Seien f, g : D → R Abbildungen; dann können Abbildungen max{f, g} : D → R
und min{f, g} : D → R definiert werden durch
max{f, g}(x) = max{f (x), g(x)} ,
min{f, g}(x) = min{f (x), g(x)} .
Sind f und g beide an der Stelle x ∈ D stetig, so sind auch max{f, g} und
min{f, g}. Dies folgt aus Satz 7.4 undSatz 7.5, da max{f, g} = 21 (f +g)+|f −g|
und min{f, g} = 12 (f + g) − |f − g| , und die Abbildung | · | : R → R stetig ist.
Für jedes x ∈ D, r > 0 sei BD (x, r) = {y ∈ D : |y − x| < r} (offener Ball in D
um x mit Radius r). Insbesondere ist BR (x, r) = (x − r, x + r) für alle x ∈ R,
r > 0.
Bemerkung: Ist D eine Teilmenge von R – und damit auch Teilmenge von C –,
dann hängt die Definition von BD (x, r) nicht davon ab, ob man K = R oder
K = C nimmt.
Eine Teilmenge U von D heißt offen in D (oder offene Teilmenge von D), wenn
es zu jedem x ∈ U ein ε > 0 gibt, so dass BD (x, ε) ⊂ U.
Man sieht leicht, dass die Intervalle (a, b), (−∞, b) und (a, +∞) offene Teilmengen
von R sind.
Lemma 7.4 Für jedes x ∈ K, r > 0 ist BK (x, r) eine offene Teilmenge von K.
Beweis Sei y ∈ BK (x, r); dann ist |y − x| < r und damit ist ε = r − |y − x| > 0.
Für alle z ∈ BK (y, ε) ist dann nach der Dreiecksungleichung
|z − x| = |z − y + y − x| ≤ |z − y| + |y − x| < ε + |y − x| = r ,
d.h. BK (y, ε) ⊂ BK (x, r) und dies zeigt, dass BK (x, r) offen in K ist.
Insbesondere ist U eine offene Teilmenge von R, wenn es zu jedem x ∈ U ein
ε > 0 gibt, so dass (x − ε, x + ε) ⊂ U.
7 Stetige Funktionen
53
Lemma 7.5 (1) Die leere Menge ∅ und die Menge D selbst sind offen in D.
(2) Ist {Uα }α∈A
S eine beliebige Familie von offenen Teilmengen von D, so ist ihre
Vereinigung α∈A Uα offen in D.
T
(3) Sind U1 , . . . , Un (mit n ≥ 1) offen in D, so ist ihr Durchschnitt nk=1 Uk
eine offene Teilmenge von D.
Beweis (1) Dies ist klar.
S
(2) Setze U = α∈A Uα , und sei x ∈ U. Dann ist x ∈ Uα für ein α ∈ A und
folglich gibt es ε > 0, so dass BD (x, ε) ⊂ Uα , da Uα offen in D ist. Damit ist
BD (x, ε) ⊂ U, und dies zeigt, dass U offen in D ist.
T
(3) Setze U = nk=1 Uk , und sei x ∈ U. Für jedes k gibt es dann εk > 0, so dass
BD (x, ε) ⊂ Uk da x ∈ Uk und
T Sei ε = min{εk : 1 ≤ k ≤ n}; also
T Uk offen in D ist.
ist ε > 0 und BD (x, ε) = nk=1 BD (x, εk ) ⊂ nk=1 Uk = U, und dies zeigt, dass U
offen in D ist.
Satz 7.6 Eine Abbildung f : D → K ist genau dann stetig, wenn für jede offene
Teilmenge U von K die Menge f −1 (U) offen in D ist.
Beweis Nehme zunächst an, dass f stetig ist. Sei U eine offene Teilmenge von
K und sei x ∈ f −1 (U). Dann ist f (x) ∈ U und folglich gibt es ε > 0, so dass
BK (f (x), ε) ⊂ U. Da aber f an der Stelle x stetig ist, gibt es δ > 0, so dass
|f (y) − f (x)| < ε für alle y ∈ D mit |y − x| < δ. Also ist BD (x, δ) ⊂ f −1 (U), und
dies zeigt, dass f −1 (U) offen in D ist.
Nehme umgekehrt an, dass für jede offene Teilmenge U von K die Menge f −1 (U)
offen in D ist. Sei x ∈ D und ε > 0. Nach Lemma 7.4 ist U = BK (f (x), ε) eine
offene Teilmenge von K und folglich ist f −1 (U) offen in D. Ferner ist x ∈ f −1 (U)
und damit gibt es δ > 0, so dass BD (x, δ) ⊂ f −1 (U). Für jedes y ∈ D mit
|y − x| < δ ist also f (y) ∈ U, d.h. |f (y) − f (x)| < ε. Dies zeigt, dass f an der
Stelle x stetig ist und daher, da x ∈ D beliebig war, dass f stetig ist.
Eine Teilmenge F von D heißt abgeschlossen in D (oder abgeschlossene Teilmenge
von D), wenn die Menge D \ F = {x ∈ D : x ∈
/ F } offen in D ist.
Die Intervalle [a, b], (−∞, b] und [a, +∞) sind abgeschlossene Teilmengen von R.
Lemma 7.6 (1) Die leere Menge ∅ und die Menge D selbst sind abgeschlossene
Teilmengen von D.
(2) Ist {Fα }α∈A eine beliebige
Familie von abgeschlossenen Teilmengen von D,
T
so ist ihr Durchschnitt α∈A Fα abgeschlossen in D.
(3) Sind F1 , . . . , Fn (mit n ≥ 1) abgeschlossen in D, so ist ihre Vereinigung
S
n
k=1 Fk eine abgeschlossene Teilmenge von D.
7 Stetige Funktionen
54
Beweis Dies folgt unmittelbar aus Lemma 7.5, da
D\
\
Fα =
α∈A
[
α∈A
(D \ Fα ) und D \
n
[
k=1
Fk =
n
\
(D \ Fk ) .
k=1
Eine Folge {xn }n≥p aus D heißt konvergent in D, wenn {xn }n≥p konvergiert und
x = lim xn ∈ D.
n→∞
Satz 7.7 Eine Teilmenge F von D ist genau dann abgeschlossen in D, wenn der
Grenzwert von jeder Folge aus F , die in D konvergent ist, auch in F liegt.
Beweis Nehme zunächst an, dass F eine abgeschlossene Teilmenge von D ist,
und sei {xn }n≥p eine Folge aus F , die in D konvergent ist. Setze x = limn→∞ xn ;
also ist x ∈ D. Sei ε > 0; dann gibt es ein N ≥ p, so dass |xn − x| < ε für alle
n ≥ N, d.h. xn ∈ BD (x, ε) für alle n ≥ N. Insbesondere ist BD (x, ε) ∩ F 6= ∅ für
jedes ε > 0. Wäre nun x ∈ D \ F , so gäbe es ein ε > 0 mit BD (x, ε) ⊂ D \ F und
daher mit BD (x, ε) ∩ F = ∅, da D \ F offen ist. Daraus ergibt sich, dass x ∈ F .
Nehme umgekehrt an, dass F nicht abgeschlossen in D ist; dann ist D \ F nicht
offen in D. Es gibt daher ein x ∈ D\F , so dass für jedes ε > 0 die Menge BD (x, ε)
keine Teilmenge von D \ F ist, oder, anders ausgedrückt: so dass für jedes ε > 0
ein y ∈ F mit |y − x| < ε existiert. Für jedes n ≥ 1 gibt es insbesondere also
ein xn ∈ F mit |xn − x| < 1/n und damit konvergiert die Folge {xn }n≥p gegen
x. Aber dann ist {xn }n≥1 eine Folge aus F , die konvergent in D ist, für die der
Grenzwert x nicht in F liegt.
Lemma 7.7 Sei F eine nichtleere abgeschlossene Teilmenge von R.
(1) Ist F nach oben beschränkt, so besitzt F ein Maximum: Es gibt v ∈ F , so
dass x ≤ v für alle x ∈ F .
(2) Ist F nach unten beschränkt, so besitzt F ein Minimum: Es gibt u ∈ F , so
dass u ≤ x für alle x ∈ F .
Beweis (1) Nach Satz 4.1 (1) besitzt F ein Supremum v und nach Lemma 4.1 (1)
besitzt F ein Maximum genau dann, wenn v ∈ F (und in diesem Fall ist v das
Maximum). Nehme an, dass v ∈
/ F . Dann liegt v in der offenen Teilmenge R \ F
von R und also gibt es ein ε > 0, so dass (v − ε, v + ε) ⊂ R \ F . Da v eine obere
Schranke von F ist, ist x ≤ v für jedes x ∈ F . Aber das Intervall (v − ε, v] enthält
kein Element von F und daraus ergibt sich, dass v − ε auch eine obere Schranke
von F ist. Damit ist v nicht die kleinste obere Schranke, und dieser Widerspruch
zeigt, dass v in F liegen muss.
(2) Analog zu (1).
7 Stetige Funktionen
55
Lemma 7.8 Sei f : D → R eine Abbildung, die an der Stelle x ∈ D stetig ist.
Ist f (x) > 0 (bzw. ist f (x) < 0), dann gibt es ein η > 0, so dass f (y) > 0 (bzw.
so dass f (y) < 0) für alle y ∈ D mit |y − x| < η.
Beweis (Dies ist schon im letzten Teil vom Beweis für Satz 7.4 enthalten.) Nehme
an, dass f (x) > 0; dann gibt es ein η > 0, so dass |f (y) − f (x)| < f (x)/2 und
damit auch f (y) = f (x) + f (y) − f (x) ≥ f (x) − |f (x) − f (y)| > f (x)/2 > 0 für
alle y ∈ D mit |y − x| < η. Der andere Fall (mit f (x) < 0) ist ähnlich.
Im Folgenden seien a, b ∈ R mit a < b.
Lemma 7.9 Sei f : [a, b] → R eine stetige Abbildung mit f (a) < 0 and f (b) > 0.
Dann gibt es c ∈ (a, b) mit f (c) = 0.
Beweis Sei A = {x ∈ [a, b] : f (x) < 0}. Dann ist a ∈ A und x ≤ b für alle x ∈ A,
d.h. A ist eine nichtleere nach oben beschränkte Teilmenge von R. Also existiert
das Supremum c = sup(A).
Nehme an, dass f (c) < 0; dann ist c 6= b und nach Lemma 7.8 gibt es ein η > 0,
so dass f (y) < 0 für alle y ∈ [a, b] mit |y − c| < η. Insbesondere existiert ein
x ∈ (c, b) mit f (x) < 0, und dann wäre aber c keine obere Schranke von A.
Nehme nun an, dass f (c) > 0; hier ist c 6= a und nach Lemma 7.8 gibt es ein
η > 0, so dass f (y) > 0 für alle y ∈ [a, b] mit |y − c| < η. Aber dann ist jedes
x ∈ (c − η, c) ∩ [a, b] eine obere Schranke von A, und damit wäre c nicht die
kleinste obere Schranke.
Daraus ergibt sich, dass f (c) = 0 (und damit auch, dass c ∈ (a, b)).
Satz 7.8 (Zwischenwertsatz) Sei f : [a, b] → R eine stetige Abbildung und sei
z eine reelle Zahl zwischen f (a) und f (b). Dann gibt es c ∈ [a, b] mit f (c) = z.
Beweis Ist z = f (a) (bzw. ist z = f (b)), so kann man c = a (bzw. c = b)
nehmen. Es kann also angenommen werden, dass entweder f (a) < z < f (b) oder
f (b) < z < f (a).
Nehme zunächst an, dass f (a) < z < f (b) und sei g = f − z, d.h. g : [a, b] → R
ist definiert durch g(x) = f (x) − z für jedes x ∈ [a, b]. Nach Satz 7.4 ist g stetig
und g(a) = f (a) − z < 0, g(b) = f (b) − z > 0. Daraus folgt nach Lemma 7.9,
dass g(c) = 0 für ein c ∈ (a, b), und damit ist f (c) = g(c) + z = z.
Nehme nun an, dass f (b) < z < f (a) und sei hier g = z − f , d.h. g : [a, b] → R
ist definiert durch g(x) = z − f (x) für jedes x ∈ [a, b]. Nach Satz 7.4 ist g stetig
und g(a) = z − f (a) < 0, g(b) = z − f (b) > 0. Daraus folgt nach Lemma 7.9,
dass g(c) = 0 für ein c ∈ (a, b), und damit ist f (c) = z − g(c) = z.
7 Stetige Funktionen
56
Satz 7.9 Sei f : D → R eine stetige Abbildung. Für jedes Intervall I ⊂ R mit
I ⊂ D ist dann f (I) auch ein Intervall.
Beweis Seien a, b ∈ f (I) mit a < b. Dann gibt es α, β ∈ I mit a = f (α) und
b = f (β). Setze ᾰ = min{α, β} und β̆ = max{α, β}. Dann sind ᾰ, β̆ Elemente
von I mit ᾰ < β̆, und also ist J = [ᾰ, β̆] ⊂ I ⊂ D, da I ein Intervall ist. Nach
Lemma 7.2 ist die Einschränkung fJ von f auf J stetig. Sei nun c ∈ (a, b); dann
ist c eine Zahl zwischen fJ (ᾰ) und fJ (β̆), und daraus ergibt sich nach Satz 7.7,
dass es ein γ ∈ J ⊂ I gibt mit f (γ) = fJ (γ) = c. Damit ist c ∈ f (I), und dies
zeigt, dass f (I) ein Intervall ist.
Im Folgenden sei f : I → R eine stetige Abbildung, wobei I ein Intervall ist, das
mehr als einen Punkt enthält.
Lemma 7.10 Nehme an, es gibt a, b, c, d ∈ I mit a < b und c < d, so dass
f (a) < f (b) und f (c) > f (d). Dann ist f nicht injektiv.
Beweis Für jedes t ∈ [0, 1] liegt (1 − t)a + tc zwischen a und c und (1 − t)b + td
zwischen b und d; insbesondere liegen (1 − t)a + tc und (1 − t)b + td beide im
Intervall I. Folglich kann eine Abbildung h : [0, 1] → R definiert werden durch
h(t) = f ((1 − t)a + tc) − f ((1 − t)b + d)
für jedes t ∈ [0, 1]. Nach Satz 7.4 und Satz 7.5 ist h stetig, da die Abbildungen
t 7→ (1 − t)a + tc und t 7→ (1 − t)b + d (von [0, 1] nach R) stetig sind. Nun ist
h(0) = f (a) − f (b) < 0 und h(1) = f (c) − f (d) > 0, und daher gibt es nach
dem Zwischenwertsatz ein s ∈ [0, 1] mit h(s) = 0, d.h, mit f ((1 − s)a + sc) =
f ((1 − s)b + d). Aber (1 − s)a + sc 6= (1 − s)b + d, da
(1 − s)b + d − (1 − s)a + sc = (1 − s)(b − a) + s(d − c) ,
und dies zeigt, dass f nicht injektiv ist.
Satz 7.10 Die Abbildung f ist injektiv genau dann, wenn sie streng monoton ist.
Beweis Es ist klar, dass eine streng monotone Abbildung injektiv ist. Nehme nun
umgekehrt an, dass f nicht streng monoton ist. Dann gibt es a, b, c, d ∈ I mit
a < b und c < d, so dass f (a) ≤ f (b) und f (c) ≥ f (d). Ist f (a) = f (b) oder
f (c) = f (d), so ist f offensichtlich nicht injektiv. Ist andererseits f (a) < f (b) und
f (c) > f (d), so ergibt sich aus Lemma 7.10, dass f wieder nicht injektiv ist.
Nehme nun zusätzlich an, dass f injektiv ist (und damit streng monoton).
7 Stetige Funktionen
57
Lemma 7.11 Sei x ∈ I und ε > 0; dann gibt es ein δ > 0, so dass |y − x| < ε
für alle y ∈ I mit |f (y) − f (x)| < δ.
Beweis Nehme zunächst an, dass x kein Endpunkt des Intervalls I ist. Dann gibt
es ein η > 0 mit η ≤ ε, so dass die Punkte x − η und x + η beide in I liegen. Setze
δ = min{|f (x) − f (x − η)|, |f (x) − f (x + η)|}; also ist δ > 0, da f streng monoton
ist. Sei y ∈ I mit |f (y)−f (x)| < δ; dann liegt f (y) im Intervall (f (x)−δ, f (x)+δ)
und damit zwischen f (x−η) und f (x+ η). Da f streng monoton ist, folgt daraus,
dass y ∈ (x − η, x + η) und daher ist |y − x| < ε.
Nehme nun an, dass x Endpunkt des Intervalls I ist und ohne Beschränkung der
Allgemeinheit sei x der linke Endpunkt von I. Da I mehr als einen Punkt enthält,
gibt es ein η > 0 mit η ≤ ε, so dass x + η ∈ I. Setze hier δ = |f (x) − f (x + η)|;
also ist δ > 0, da f streng monoton ist. Wie im anderen Fall ist wieder |y − x| < ε
für alle y ∈ I mit |f (y) − f (x)| < δ.
Setze nun J = f (I); nach Satz 7.9 ist J ein Intervall, und f bildet das Intervall
I bijektiv auf J ab. Ist f streng monoton wachsend, dann ist f −1 das auch: Sind
x, y ∈ J mit x < y, so sind f (f −1(x)) = x < y = f (f −1(y)) und daraus ergibt
sich, dass f −1 (x) < f −1 (y). Genauso ist f −1 streng monoton fallend, wenn f das
ist.
Satz 7.11 Die Umkehrabbildung f −1 : J → I ist stetig.
Beweis Sei x ∈ J und ε > 0; also ist f −1 (x) ∈ I und nach Lemma 7.11 gibt es
dann ein δ > 0, so dass |v − f −1 (x)| < ε für alle v ∈ I mit
|f (v) − x| = |f (v) − f (f −1 (x))| < δ .
Sei nun y ∈ J mit |y − x| < δ; dann gibt es ein eindeutiges v ∈ I mit f (v) = y.
Damit ist |f (v) − x| < δ und folglich ist |f −1 (y) − f −1 (x)| = |v − f −1 (x)| < ε.
Dies zeigt, dass f −1 an der Stelle x stetig ist.
Nach Satz 7.1 und Satz 6.13 (2) ist die Abbildung exp : R → R stetig und streng
monoton wachsend, und nach Satz 6.13 (4) und (5) ist exp(R) = (0, +∞). Die
Umkehrabbildung exp−1 : (0, +∞) → R heißt natürlicher Logarithmus und wird
mit log bezeichnet. Also ist log streng monoton wachsend und bildet das Intervall
(0, +∞) bijektiv auf R ab. Ferner ist nach Satz 7.11 die Abbildung log stetig.
Satz 7.12 Es gilt log(1) = 0 und für alle x, y ∈ (0, +∞)
log(xy) = log(x) + log(y) .
Beweis Da exp(0) = 1, ist log(1) = 0. Seien x, y ∈ (0, +∞); dann gibt es u, v ∈ R
mit x = exp(u) und y = exp(v), und damit ist nach Satz 6.11
log(xy) = log(exp(u) exp(v)) = log(exp(u + v)) = u + v = log(x) + log(y) .
8
Folgenkompaktheit
Eine Teilmenge F von K heißt folgenkompakt, wenn jede Folge aus F eine Teilfolge
besitzt, die in F konvergent ist. D.h.: Ist {xn }n≥p eine Folge aus F , so gibt es
eine Teilfolge {xnk }k≥q und x ∈ F , so dass x = lim xnk .
k→∞
Für eine Teilmenge F von R gibt es anscheinend zwei mögliche Definitionen
für die Folgenkompaktheit (mit K = R und mit K = C). Es gibt aber keinen
Unterschied: F ist folgenkompakt als Teilmenge von R genau dann, wenn sie
folgenkompakt als Teilmenge von C ist.
Lemma 8.1 Jede folgenkompakte Teilmenge von K ist beschränkt.
Beweis Übung.
Satz 8.1 Eine Teilmenge F von K ist folgenkompakt genau dann, wenn sie abgeschlossen und beschränkt ist.
Beweis Nehme zunächst an, dass F abgeschlossen und beschränkt ist. Sei {xn }n≥p
eine Folge aus F ; dann ist diese Folge auch beschränkt und damit besitzt sie nach
Satz 5.10 (Bolzano-Weierstraß) eine konvergente Teilfolge: Es gibt eine Teilfolge
{xnk }k≥q und x ∈ K, so dass x = limk→∞ xnk . Also ist {xnk }k≥q eine Folge aus F ,
die konvergent (d.h. konvergent in K) ist, und daraus folgt nach Satz 7.7, dass
x ∈ F , da F abgeschlossen ist. Dies zeigt, dass F folgenkompakt ist.
Nehme umgekehrt an, dass F folgenkompakt ist; nach Lemma 8.1 ist also F
beschränkt und es bleibt nur zu zeigen, dass F abgeschlossen ist. Sei {xn }n≥p
eine Folge aus F , die konvergiert. Da F folgenkompakt ist, gibt es eine Teilfolge
{xnk }k≥q und x ∈ F , so dass x = limk→∞ xnk und nach Satz 5.7 ist dann auch
x = limn→∞ xn . Daraus ergibt sich nach Satz 7.7, dass F abgeschlossen ist.
Sei a, b ∈ R mit a < b. Nach Satz 8.1 ist insbesondere das Intervall [a, b] eine
folgenkompakte Teilmenge von R. Im Folgenden sei D wieder eine nichtleere
Teilmenge von K′ , wobei K′ entweder R oder C ist.
Satz 8.2 Sei f : D → K eine stetige Abbildung und sei F eine folgenkompakte
Teilmenge von K′ mit F ⊂ D. Dann ist das Bild f (F ) eine folgenkompakte
Teilmenge von K.
Beweis Sei {yn }n≥p eine Folge aus f (F ); für jedes n ≥ p gibt es dann ein xn ∈ F
mit yn = f (xn ). Damit ist {xn }n≥p eine Folge aus der folgenkompakten Teilmenge
F ; es gibt also eine Teilfolge {xnk }k≥q und x ∈ F , so dass {xnk }k≥q gegen x
58
8 Folgenkompaktheit
59
konvergiert, und da f stetig ist, konvergiert nach Satz 7.3 {f (xnk )}k≥q gegen
f (x), d.h. {ynk )}k≥q konvergiert gegen das Element y = f (x) ∈ f (F ). Mit anderen
Worten: Die Folge {yn }n≥p besitzt eine Teilfolge, die in f (F ) konvergent ist, und
dies zeigt, dass f (F ) eine folgenkompakte Teilmenge von K ist.
Satz 8.3 (Satz von Minimum und Maximum) Sei f : D → R eine stetige
Abbildung und F eine nichtleere folgenkompakte Teilmenge von K′ mit F ⊂ D.
Dann gibt es u, v ∈ F , so dass f (u) ≤ f (x) ≤ f (v) für alle x ∈ F .
Beweis Nach Satz 8.2 ist f (F ) folgenkompakt und damit nach Satz 8.1 eine
nichtleere Teilmenge von R, die beschränkt und abgeschlossen ist. Daraus folgt
nach Lemma 7.9, dass f (F ) ein Minimum und ein Maximum besitzt: Es gibt
u′ , v ′ ∈ f (F ), so dass u′ ≤ y ≤ v ′ für alle y ∈ f (F ). Wähle u, v ∈ F mit
f (u) = u′ und f (v) = v ′ ; dann ist f (u) ≤ f (x) ≤ f (v) für alle x ∈ F .
Satz 8.4 Sei {Fn }n≥p eine Folge von nichtleeren abgeschlossenen Teilmengen von
K mit Fp beschränkt und T
Fn+1 ⊂ Fn für alle n ≥ p. Dann hat die Folge einen
nichtleeren Durchschnitt:
Fn 6= ∅.
n≥p
Beweis Für jedes n ≥ p wähle xn ∈ Fn . Dann ist {xn }n≥p eine Folge aus Fp
und nach Satz 8.1 ist Fp folgenkompakt. Es gibt also eine Teilfolge {xnk }k≥q und
x ∈ Fp , so dass x = limk→∞ xnk . Nun ist x ∈ Fn für jedes n ≥ p: Sei n ≥ p; dann
gibt es m ≥ q mit nm ≥ n und daher auch nk ≥ n für alle k ≥ m; folglich ist
xnk ∈ Fnk ⊂ Fn für alle k ≥ m, d.h. {xnk }k≥m ist eine Folge aus Fn . Aber nach
Lemma 5.1 konvergiert {xnk }k≥m gegen x, und daraus
ergibtTsich nach Satz 7.7,
T
dass x ∈ Fn . Da x ∈ Fn für jedes n ≥ p, ist x ∈
Fn , d.h.
Fn 6= ∅.
n≥p
n≥p
Beispiel: Für jedes n ≥ 0 sei En = [n, +∞); En ist eine T
nichtleere abgeschlossene
Teilmenge von R und En+1 ⊂ En für alle n ≥ 0. Aber n≥0 En = ∅. (Natürlich
ist hier E0 nicht beschränkt.)
Erinnerung: Eine Abbildung f : D → K ist stetig, wenn es zu jedem x ∈ D und
zu jedem ε > 0 ein δ > 0 gibt, so dass |f (y) − f (x)| < ε für alle y ∈ D mit
|y − x| < δ.
Eine Abbildung f : D → K heißt nun gleichmäßig stetig, wenn es zu jedem ε > 0
ein δ > 0 gibt, so dass |f (y) − f (x)| < ε für alle x, y ∈ D mit |y − x| < δ.
Insbesondere ist jede gleichmäßig stetige Abbildung stetig.
Beispiel: Sei h : (0, 1) → R die durch h(x) = 1/x gegebene Abbildung. Nach
Satz 7.4 ist h stetig, da h = (id(0,1) )−1 , aber h ist nicht gleichmäßig stetig. (Der
Beweis dafür ist eine Übung.)
8 Folgenkompaktheit
60
Satz 8.5 Ist die Menge D folgenkompakt, so ist jede stetige Abbildung f : D → K
gleichmäßig stetig.
Beweis Nehme an, dass f nicht gleichmäßig stetig ist. Dann gibt es ein ε > 0, für
das gilt: Zu jedem δ > 0 existieren x, y ∈ D mit |y −x| < δ aber |f (y)−f (x)| ≥ ε.
Zu jedem n ≥ 1 gibt es dann insbesondere xn , yn ∈ D mit |yn − xn | < 1/n, aber
mit |f (yn ) − f (xn )| ≥ ε. Nun ist {xn }n≥1 eine Folge aus der folgenkompakten
Teilmenge D, es gibt also eine Teilfolge {xnk }k≥q , die gegen ein Element x ∈ D
konvergiert. Da |yn −xn | < 1/n für alle n ≥ p, sieht man leicht, dass auch die Folge
{ynk }k≥q gegen x konvergiert. Aber f ist an der Stelle x stetig und daraus folgt
nach Satz 7.3, dass sowohl limk→∞ f (xnk ) = f (x) als auch limk→∞ f (ynk ) = f (x).
Dies steht nun im Widerspruch zu der Tatsache, dass |f (ynk ) − f (xnk )| ≥ ε für
alle k ≥ q. Daher muss f gleichmäßig stetig sein.
9
Trigonometrische Funktionen
Lemma 9.1 Es gilt |exp(ix)| = 1 für jedes x ∈ R.
Beweis Sei x ∈ R und setze z = exp(ix). Dann ist nach Satz 6.12 (1) und (2)
z = exp(ix) = exp(ix) = exp(−ix) = exp(ix)−1 = z −1
√
und damit ist zz = zz −1 = 1. Daraus folgt, dass |z| = zz = 1.
Sei cis : R → C die Abbildung, die definiert ist durch
cis(x) = exp(ix) .
Dann ist cis(0) = 1, |cis(x)| = 1 für alle x ∈ R und für x, y ∈ R ist nach Satz 6.11
cis(x + y) = cis(x) cis(y) .
Die Cosinus-Funktion cos : R → R und die Sinus-Funktion sin : R → R werden
nun definiert durch cos = Re cis und sin = Im cis. Diese Definitionen sind in der
Eulerschen Formel zusammengefasst: Es gilt
exp(ix) = cos(x) + i sin(x)
für alle x ∈ R.
Satz 9.1 (1) Für alle x ∈ R gilt
1
1
exp(ix) + exp(−ix) und sin(x) =
exp(ix) − exp(−ix) .
2
2i
2
(2) Für alle x ∈ R ist cos2 (x) + sin2 (x) = 1 (wobei cos2 (x) für cos(x) und
2
sin2 (x) für sin(x) geschrieben wird).
cos(x) =
(3) Es gilt cos(−x) = cos(x) und sin(−x) = − sin(x) für alle x ∈ R.
(4) cos(0) = 1 und sin(0) = 0.
Beweis (1) Für alle z ∈ C ist Re z = (z + z)/2 und Im z = (z − z)/2i.
(2) Für alle z ∈ C ist (Re z)2 + (Im z)2 = |z|2 und |exp(ix)| = 1 für jedes x ∈ R
nach Lemma 9.1.
(3) Für alle x ∈ R ist
cos(−x) + i sin(−x) = exp(−ix) = exp(ix)
= cos(x) + i sin(x) = cos(x) − i sin(x) ,
und damit ist cos(−x) = cos(x) und sin(−x) = − sin(x).
(4) Es gilt cos(0) + i sin(0) = exp(i0) = exp(0) = 1 = 1 + i0 und daraus folgt,
dass cos(0) = 1 und sin(0) = 0.
61
9 Trigonometrische Funktionen
62
Satz 9.2 Die Abbildung cis : R → C ist stetig und damit auch (nach Satz 7.2)
die Abbildungen cos : R → R und sin : R → R.
Beweis Sei f : C → C die durch f (z) = exp(iz) gegebene Abbildung. Dann ist
f die Zusammensetzung der Abbildungen h und exp, wobei h : C → C durch
h(z) = iz gegeben ist. Nun ist nach Satz 7.1 exp stetig und nach Satz 7.4 ist h
stetig und damit ist nach Satz 7.5 auch f stetig. Aber cis ist die Einschränkung
von f auf R und daraus folgt nach Lemma 7.3, dass cis stetig ist.
Satz 9.3 (Additionstheoreme) Für alle x, y ∈ R gilt
cos(x + y) = cos(x) cos(y) − sin(x) sin(y) ,
sin(x + y) = sin(x) cos(y) + cos(x) sin(y) .
Beweis Für alle x, y ∈ R gilt nach Satz 6.11
cos(x + y) + i sin(x + y) = exp(i(x + y)) = exp(ix + iy)
= exp(ix) exp(iy) = cos(x) + i sin(x) cos(y) + i sin(y)
= cos(x) cos(y) − sin(x) sin(y) + i sin(x) cos(y) + cos(x) sin(y) .
Nach Satz 9.1 (3) und Satz 9.3 gilt auch für alle x, y ∈ R
cos(x − y) = cos(x) cos(y) + sin(x) sin(y) ,
sin(x − y) = sin(x) cos(y) − cos(x) sin(y) .
Satz 9.4 Für alle x, y ∈ R gilt
x + y x − y
sin(x) − sin(y) = 2 cos
sin
,
x2 + y x2 − y sin
.
cos(x) − cos(y) = −2 sin
2
2
Beweis Setze u = (x + y)/2, v = (x − y)/2; also ist x = u + v und y = u − v,
und daraus folgt nach Satz 9.3, dass
sin(x) − sin(y) = sin(u + v) − sin(u − v)
= sin(u) cos(v) + cos(u) sin(v) + sin(u) cos(v) − cos(u) sin(v)
x + y x − y
= 2 sin(u) cos(v) = 2 cos
sin
.
2
2
Die andere Gleichung ist analog zu beweisen.
9 Trigonometrische Funktionen
63
Satz 9.5 Für jedes x ∈ R gilt
∞
X
∞
X
1
1
m 2m
cos(x) =
(−1) x
und sin(x) =
(−1)m x2m+1 .
(2m)!
(2m
+
1)!
m=0
m=0
In beiden Fällen konvergieren diese Reihen absolut.
Beweis Dies folgt unmittelbar aus Lemma 6.2 und Lemma 6.4, da
∞
X
1
cos(x) + i sin(x) = cis(x) = exp(ix) =
(ix)n
n!
n=0
und i4k = 1, i4k+1 = i, i4k+2 = −1 und i4k+3 = −i für alle k ∈ N.
Satz 9.5 sagt also, dass für jedes x ∈ R gilt:
x2 x4 x6
+
−
+··· ,
2!
4!
6!
x3 x5 x7
sin(x) = x −
+
−
+··· .
3!
5!
7!
cos(x) = 1 −
Lemma 9.2 Es gilt cos(x) ≤ 1 − x2 /2! + x4 /4! und sin(x) ≥ x − x3 /3! für jedes
x ∈ [0, 2]. Insbesondere ist cos(2) < 0 und sin(x) > 0 für alle x ∈ (0, 2].
Beweis Übung.
Lemma 9.3 Die Abbildung cos ist im Intervall [0, 2] streng monoton fallend.
Beweis Seien 0 ≤ y < x ≤ 2; dann folgt aus Lemma 9.2 und Satz 9.4, dass
x + y x − y cos(x) − cos(y) = −2 sin
sin
<0,
2
2
(x + y)/2 und (x − y)/2 beide im Intervall [0, 2] liegen.
Satz 9.6 Die Abbildung cos hat im Intervall [0, 2] genau eine Nullstelle: Es gibt
genau einen Punkt x ∈ [0, 2] mit cos(x) = 0.
Beweis Nach Satz 9.2 und Lemma 7.2 ist die Einschränkung von cos auf [0, 2]
stetig. Ferner ist cos(0) = 1 > 0 und nach Lemma 9.2 ist cos(2) < 0. Folglich gibt
es nach Satz 7.8 (Zwischenwertsatz) ein x ∈ (0, 2) mit cos(x) = 0. Eine weitere
Nullstelle von cos in [0, 2] kann es nicht geben, da nach Lemma 9.3 cos in diesem
Intervall streng monoton fallend ist.
Nun wird das Zweifache der eindeutigen Nullstelle von cos im Intervall [0, 2] mit
π
bezeichnet. Also ist 0 < π < 4 und π/2 ist die kleinste positive Nullstelle von cos.
9 Trigonometrische Funktionen
64
Lemma 9.4 Es gilt cis(π/2) = i.
Beweis Da cos(π/2) = 0, ist nach Satz 9.1 (3) sin2 (π/2) = 1. Aber π/2 < 2 und
nach Lemma 9.4 (2) ist sin > 0 im Intervall (0, 2]; damit ist sin(π/2) = 1. Folglich
ist cis(π/2) = cos(π/2) + i sin(π/2) = i.
Satz 9.7 (1) 2π ist die kleinste positive Zahl σ mit cis(σ) = 1.
(2) Für jedes x ∈ R und jedes n ∈ Z ist cis(x + 2πn) = cis(x) und damit auch
cos(x + 2πn) = cos(x) und sin(x + 2πn) = sin(x).
Beweis (1) Nach Satz 6.11 ist cis(2x) = cis(x + x) = cis(x) cis(x) = cis2 (x) für
jedes x ∈ R. Insbesondere ist nach Lemma 9.4 cis(π) = cis2 (π/2) = i2 = −1
und daher cis(2π) = cis2 (π) = (−1)2 = 1. Sei nun σ > 0 mit cis(σ) = 1; dann
ist cis4 (σ/4) = cis(σ/4 + σ/4 + σ/4 + σ/4) = cis(σ) = 1, daraus folgt, dass
cis(σ/4) ∈ {1, −1, i, −i}, und damit ist cos(σ/4) = Re cis(σ/4) ∈ {1, −1, 0}.
Aber 0 < cos(x) < 1 für alle x ∈ (0, π/2) und also ist σ/4 ≥ π/2, d.h., σ ≥ 2π.
Dies zeigt, dass 2π die kleinste positive Zahl σ mit cis(σ) = 1 ist.
(2) Da cis(2π) = 1, gilt für jedes n ∈ Z, dass
cis(2π(n + 1)) = cis(2πn + 2π) = cis(2πn) cis(2π) = cis(2πn) .
Daraus ergibt sich durch Induktion nach n, dass cis(2πn) = 1 für alle n ∈ N und
−1
damit für alle n ∈ Z, da cis(−y) = cis(y)
für alle y ∈ R. Für jedes x ∈ R,
n ∈ Z ist nun cis(x + 2πn) = cis(x) cis(2πn) = cis(x).
Nach Satz 9.7 wird insbesondere jede der Abbildungen cos und sin bestimmt
durch die periodische Fortsetzung ihrer Einschränkung auf dem Intervall [0, 2π].
Das Verhalten von cos und sin in [0, 2π] ist im folgenden Satz beschrieben.
Satz 9.8 (1a) Die Abbildung cos ist streng monoton fallend im Intervall [0, π]
und streng monoton wachsend im Intervall [π, 2π].
(1b) Für alle x ∈ [0, π/2] ist cos(π − x) = −cos(x).
(1c) Für alle x ∈ [0, π] ist cos(2π − x) = cos(x).
(1d) cos(0) = 1, cos(π/2) = 0, cos(π) = −1, cos(3π/2) = 0 und cos(2π) = 1.
(2a) Die Abbildung sin ist streng monoton wachsend im Intervall [0, π/2] sowie
im Intervall [3π/2, 2π] und streng monoton fallend im Intervall [π/2, 3π/2].
(2b) Für alle x ∈ [0, π/2] ist sin(π − x) = sin(x).
(2c) Für alle x ∈ [0, π] ist sin(2π − x) = − sin(x).
(2d) sin(0) = 0, sin(π/2) = 1, sin(π) = 0, sin(3π/2) = −1 und sin(2π) = 0.
9 Trigonometrische Funktionen
65
Beweis (1d) Es ist schon gesehen worden, dass cos(0) = cos(2π) = 1, cos(π/2) =
0 und cos(π) = −1, und nach Satz 9.3 ist dann
cos(3π/2) = cos(π + π/2) = cos(π) cos(π/2) − sin(π) sin(π/2) = 0 ,
da cos(π/2) = sin(π) = 0.
(1b) Für alle x ∈ [0, π/2] ist nach Satz 9.3
cos(π − x) = cos(π) cos(x) + sin(π) sin(x) = − cos(x) ,
da cos(π) = −1 und damit auch sin(π) = 0.
(1c) Für alle x ∈ [0, π] ist nach Satz 9.3
cos(2π − x) = cos(2π) cos(x) + sin(2π) sin(x) = cos(x) ,
da cos(π) = 1 und damit wieder sin(π) = 0.
(1a) Nach Lemma 9.3 und Satz 9.6 ist cos streng monoton fallend im Intervall
[0, π/2] und damit nach (1b) auch streng monoton fallend im Intervall [π/2, π],
d.h. cos ist streng monoton fallend im Intervall [0, π]. Daraus folgt nach (1c), dass
cos streng monoton wachsend im Intervall [π, 2π] ist.
Die Aussagen über sin sind analog zu beweisen.
Lemma 9.5 Es gilt cos(R) = cos([0, 2π]) = [−1, 1].
Beweis Setze I = cos([0, 2π]). Nach Satz 7.9 und Satz 9.2 ist I ein Intervall und
nach Satz 9.1 (2) ist I ⊂ [−1, 1]. Aber nach Satz 9.8 (1d) liegen −1 und 1 in I und
daher ist cos([0, 2π]) = I = [−1, 1]. Da ferner cos([0, 2π]) ⊂ cos(R) ⊂ [−1, 1], ist
auch cos(R) = [−1, 1].
Setze S 1 = {z ∈ C : |z| = 1}.
Satz 9.9 Es gilt cis(R) = cis([0, 2π)) = S 1 .
Beweis Nach Lemma 9.1 ist cis([0, 2π)) ⊂ cis(R) ⊂ S 1 . Sei nun z ∈ S 1 und setze
x = Re z, y = Im z. Damit ist x2 + y 2 = |z|2 = 1 und insbesondere ist x ∈ [−1, 1];
nach Lemma 9.5 gibt es also t ∈ [0, 2π] mit cos(t) = x. Dann ist nach Satz 9.1 (2)
y 2 = 1 − x2 = 1 − cos2 (t) = sin2 (t) ,
d.h. y ist entweder sin(t) oder − sin(t). Aber nach Satz 9.1 (3) ist cos(−t) = cos(t)
und sin(−t) = − sin(t) und daher ist z entweder cos(t) + i sin(t) = cis(t) oder
cos(−t)+i sin(−t) = cis(−t) = cis(2π−t). In beiden Fällen ist z ∈ cis([0, 2π]), und
dies zeigt, dass cis([0, 2π]) = S 1 . Folglich ist cis([0, 2π)) = S 1 , da cis(0) = cis(2π),
und damit ist auch cis(R) = S 1 .
Nach Satz 9.7 wird auch die Abbildung cis bestimmt durch die periodische Fortsetzung ihrer Einschränkung auf dem Intervall [0, 2π].
9 Trigonometrische Funktionen
66
Satz 9.10 Die Abbildung cis bildet das Intervall [0, 2π) bijektiv auf S 1 ab.
Beweis Seien x, y ∈ [0, 2π) mit x ≤ y und cis(x) = cis(y). Da 0 ≤ y − x < 2π
und cis(y − x) = cis(x)(cis(y))−1 = 1, folgt dann aus Satz 9.6 (1), dass y − x = 0,
d.h., y = x. Damit ist die Einschränkung der Abbildung cis auf dem Intervall
[0, 2π) injektiv. Folglich bildet cis das Intervall [0, 2π) bijektiv auf S 1 ab, da nach
Satz 9.9 cis([0, 2π)) = S 1 .
Satz 9.11 Sei w ∈ C und n ≥ 1; dann gibt es ein z ∈ C mit z n = w.
Beweis Da 0n = 0, kann man annehmen, dass w 6= 0. Sei r = |w|; also ist r > 0,
und nach Satz 3.2 gibt es ein ̺ > 0 mit ̺n = r. Setze nun u = r −1 w; dann ist
|u| = |r −1 w| = r −1 |w| = r −1 r = 1, d.h., u ∈ S 1 . Folglich gibt es nach Satz 9.10
ein x ∈ [0, 2π) mit cis(x) = u. Sei jetzt z = ̺ cis(x/n); dann ist
z n = (̺ cis(x/n))n = ̺n (cis(x/n))n = r cis(x) = ru = w .
10
Differentiation
Im Folgenden sei D stets eine nichtleere Teilmenge von K. In diesem Kapitel
werden Abbildungen f : D → K untersucht. Es gibt also hier zwei Fälle (im
Gegensatz zu Kapitel 7, wo es vier Fälle gab):
— Reelle Abbildungen definiert auf einer Teilmenge von R, d.h. f : D → R
mit D ⊂ R.
— Komplexe Abbildungen definiert auf einer Teilmenge von C. d.h. f : D → C
mit D ⊂ C.
Ein Punkt a ∈ K heißt Häufungspunkt von D, wenn für jedes ε > 0 die Menge
BD (a, ε) \ {a} = {x ∈ D : 0 < |x − a| < ε} nichtleer ist.
Ist U eine offene Teilmenge von K, so ist jedes a ∈ U ein Häufungspunkt von U
(da die Menge BK (a, ε) \ {a} das Element a + η für alle 0 < η < ε enthält). Ist
ferner I ein Intervall, das mehr als einen Punkt enthält, so ist jedes a ∈ I ein
Häufungspunkt von I (da es für jedes a ∈ I ein ε > 0 gibt, so dass (a − ε, a) oder
(a, a + ε) eine Teilmenge von I ist).
Lemma 10.1 Sei a ∈ D ein Häufungspunkt von D; dann gibt es mindestens
eine Folge aus D \ {a}, die gegen a konvergiert.
Beweis Für jedes n ≥ 1 wähle xn ∈ D mit 0 < |xn − a| < 1/n. Dann ist {xn }n≥p
eine Folge aus D \ {a}, die offensichtlich gegen a konvergiert.
Im Folgenden sei stets a ∈ D ein Häufungspunkt von D. Sei g : D \ {a} → K
eine Abbildung und sei y ∈ K. Konvergiert die Folge {g(xn )}n≥p gegen y für jede
Folge {xn }n≥p aus D \ {a}, die gegen a konvergiert, so schreibt man
y = lim g(x) .
x→a
Nach Lemma 5.2 und Lemma 10.1 kann es höchstens ein y mit y = limx→a g(x)
geben, und folglich macht diese Schreibweise einen Sinn.
Lemma 10.2 Sei g : D \ {a} → K eine Abbildung und y ∈ K. Dann sind
äquivalent:
(1) Es gilt y = limx→a g(x).
(2) Zu jedem ε > 0 gibt es ein δ > 0, so dass |g(x) − y| < ε für alle x ∈ D \ {a}
mit |x − a| < δ.
(3) Die Abbildung ğ : D → K, die definiert ist durch
g(x) , falls x ∈ D \ {a},
ğ(x) =
y , falls x = a,
ist stetig an der Stelle a.
67
10 Differentiation
68
Beweis Übung.
Eine Abbildung h : K → K heißt affin, wenn es Elemente b, c ∈ K gibt, so dass
h(x) = b + cx für alle x ∈ K.
Lemma 10.3 Sei f : D → K eine Abbildung; dann kann es höchstens eine affine
Abbildung h : K → K geben mit h(a) = f (a) und
f (x) − h(x)
=0.
x→a
x−a
lim
Beweis Seien h1 , h2 : K → K affine Abbildungen mit h1 (a) = h2 (a) = f (a) und
f (x) − h1 (x)
f (x) − h2 (x)
= lim
=0.
x→a
x→a
x−a
x−a
lim
Definiere g : D \ {a} → K durch g(x) = (h1 (x) − h2 (x))/(x − a) und sei {xn }n≥p
eine Folge aus D \ {a}, die gegen a konvergiert. Da für alle x ∈ D \ {a}
h1 (x) − h2 (x)
f (x) − h2 (x) f (x) − h1 (x)
−
=
= g(x) ,
x−a
x−a
x−a
konvergiert nach Satz 5.5 die Folge {g(xn )}n≥p gegen 0. Seien nun b1 , b2 , c1 , c2
mit h1 (x) = b1 + c1 x und h2 (x) = b2 + c2 x; dann ist
h1 (x) − h2 (x) = b1 + c1 x − b2 − c2 x
= b1 + c1 a + c1 (x − a) − b2 − c2 a − c2 (x − a) = (c1 − c2 )(x − a) ,
da b1 + c1 a = h1 (a) = h2 (a) = b2 + c2 a. Damit ist g(x) = c1 − c2 für alle
x ∈ D \ {a}, und insbesondere konvergiert die Folge {g(xn )}n≥p gegen c1 − c2 .
Folglich ist c1 = c2 und dann ist ebenfalls b1 = b2 , da b1 − b2 = a(c2 − c1 ), d.h.
h1 = h2 .
Eine Abbildung f : D → K heißt in a linear approximierbar, wenn es eine affine
Abbildung h : K → K mit h(a) = f (a) gibt, so dass
f (x) − h(x)
=0.
x→a
x−a
lim
Nach Lemma 10.3 ist diese affine Abbildung h dann eindeutig bestimmt. Eine
Abbildung f : D → K heißt in a differenzierbar, wenn es ein y ∈ K gibt, so dass
f (x) − f (a)
.
x→a
x−a
y = lim
Dieser Grenzwert y heißt die Ableitung von f in a und er wird meistens mit f ′ (a)
bezeichnet, aber manchmal auch mit f˙(a), ∂f (a) oder Df (a).
10 Differentiation
69
Satz 10.1 Für eine Abbildung f : D → K sind äquivalent:
(1) f ist in a differenzierbar.
f (x) − f (a) − c(x − a)
= 0.
x→a
x−a
(3) Es gibt ein c ∈ K und eine an der Stelle a stetige Abbildung r : D → K mit
r(a) = 0, so dass f (x) = f (a) + c(x − a) + r(x)(x − a) für alle x ∈ D.
(2) Es gibt ein c ∈ K, so dass lim
(4) f ist in a linear approximierbar.
In den Fällen (2) und (3) ist c = f ′ (a). Im Fall (4) ist die eindeutig bestimmte
affine Abbildung h durch h(x) = f (a) + f ′ (a)(x − a) gegeben.
Beweis (1) ⇒ (2): Sei f˘ : D \ {a} → K die Abbildung, die definiert ist durch
˘ = f (x) − f (a)
f(x)
x−a
für alle x ∈ D \ {a}. Nach Voraussetzung konvergiert die Folge {f˘(xn )}n≥p gegen
f ′ (a) – und damit die Folge {f˘(xn ) − f ′ (a)}n≥p gegen 0 – für jede Folge {xn }n≥p
aus D \ {a}, die gegen a konvergiert. Aber
′
˘ − f ′ (a) = f (x) − f (a) − f (a)(x − a)
f(x)
x−a
für alle x ∈ D \ {a} und dies zeigt, dass
f (x) − f (a) − f ′ (a)(x − a)
=0.
x→a
x−a
lim
(2) ⇒ (3): Definiere eine Abbildung r : D → K durch
(f (x) − f (a) − c(x − a))/(x − a) , falls x ∈ D \ {a},
r(x) =
0,
falls x = a.
Nach Lemma 10.2 ist r an der Stelle a stetig. Per Definition ist r(a) = 0 und
f (x) = f (a) + c(x − a) + r(x)(x − a) für alle x ∈ D \ {a}. Das Letztere gilt aber
trivialerweise auch für x = a.
(3) ⇒ (4): Es gibt also ein c ∈ K und eine an der Stelle a stetige Abbildung
r : D → K mit r(a) = 0, so dass f (x) = f (a) + c(x − a) + r(x)(x − a) für alle
x ∈ D. Sei h : K → K die affine Abbildung, die gegeben ist durch
h(x) = f (a) − ca + cx = f (a) + c(x − a)
für alle x ∈ K. Dann ist
f (x) − h(x)
−r(x)(x − a)
=
= −r(x)
x−a
x−a
10 Differentiation
70
für alle x ∈ D \ {a}, und daraus folgt nach Lemma 10.2, dass
f (x) − h(x)
=0.
x−a
Ferner ist h(a) = f (a), und damit ist f in a linear approximierbar.
lim
x→a
(4) ⇒ (1): Es gibt eine eindeutige affine Abbildung h : K → K mit h(a) = f (a)
und limx→a (f (x) − h(x))/(x − a) = 0. Seien b, c ∈ K, so dass h(x) = b + cx; da
h(a) = f (a), ist h(x) = f (a) + h(x) − h(a) = f (a) + c(x − a) für alle x ∈ K. Sei
˘ = (f (x)−f (a))/(x−a)
f˘ : D\{a} → K die Abbildung, die definiert ist durch f(x)
für alle x ∈ D \ {a}. Dann ist
˘ − c = f (x) − f (a) − c(x − a) = f (x) − h(x)
f(x)
x−a
x−a
˘ n ) − c}n≥p
für alle x ∈ D \ {a}. Nach Voraussetzung konvergiert die Folge {f(x
gegen 0 – und damit die Folge {f˘(xn )}n≥p gegen c – für jede Folge {xn }n≥p aus
D \ {a}, die gegen a konvergiert. Daraus ergibt sich, dass
f (x) − f (a)
=c,
x−a
d.h. f ist in a differenzierbar mit f ′ (a) = c (und daher ist h die affine Abbildung
x 7→ f (a) + f ′ (a)(x − a)).
lim
x→a
Satz 10.2 Ist f : D → K in a differenzierbar, so ist f an der Stelle a stetig.
Beweis Sei f : D → K in a differenzierbar. Nach Satz 10.2 gibt es dann eine an
der Stelle a stetige Abbildung r : D → K mit r(a) = 0, so dass
f (x) = f (a) + f ′ (a)(x − a) + r(x)(x − a)
für alle x ∈ D. Daraus folgt nach Satz 7.4, dass f an der Stelle a stetig ist, da
die Abbildung x 7→ x − a stetig ist.
Satz 10.3 Seien f, g : D → K Abbildungen, die beide in a differenzierbar sind.
(1) Für alle λ, µ ∈ K ist die Abbildung λf + µg in a differenzierbar, und es gilt
(λf + µg)′ (a) = λf ′ (a) + µg ′(a) .
(2) Die Abbildung f · g ist in a differenzierbar und es gilt
(f · g)′ (a) = f (a)g ′ (a) + f ′ (a)g(a) .
(3) Nehme an, dass g(x) 6= 0 für alle x ∈ D. Dann ist die Abbildung f /g in a
differenzierbar, und es gilt
′
f
f ′ (a)g(a) − f (a)g ′ (a)
.
(a) =
g
g(a)2
10 Differentiation
71
Beweis Seien f˘, ğ : D \ {a} → K die Abbildungen, die definiert sind durch
f (x) − f (a)
f˘(x) =
x−a
und ğ(x) =
g(x) − g(a)
x−a
für alle x ∈ D \ {a}. Nach Voraussetzung konvergiert die Folge {f˘(xn )}n≥p gegen
f ′ (a) und die Folge {ğ(xn )}n≥p gegen g ′(a) für jede Folge {xn }n≥p aus D \ {a},
die gegen a konvergiert.
(1) Sei {xn }n≥p eine Folge aus D \ {a}, die gegen a konvergiert. Nach Satz 5.5 (1)
˘ n ) + µğ(xn )}n≥p gegen λf ′ (a) + µg ′(a). Aber
konvergiert dann die Folge {λf(x
f (x) − f (a)
g(x) − g(a)
+µ
x−a
x−a
(λf + µg)(x) − (λf + µg)(a)
=
x−a
λf˘(x) + µğ(x) = λ
für jedes x ∈ D \ {a}. Daraus ergibt sich, dass
(λf + µg)(x) − (λf + µg)(a)
;
x→a
x−a
λf ′ (a) + µg ′(a) = lim
d.h. λf + µg ist in a differenzierbar und (λf + µg)′(a) = λf ′ (a) + µg ′(a).
(2) Sei {xn }n≥p eine Folge aus D\{a}, die gegen a konvergiert. Damit konvergiert
nach Satz 5.5 die Folge {f (xn )ğ(xn ) + f˘(xn )g(a)}n≥p gegen f (a)g ′(a) + f ′ (a)g(a),
da nach Satz 10.2 und Satz 7.3 die Folge {f (xn )}n≥p gegen f (a) konvergiert. Aber
g(x) − g(a) f (x) − f (a)
f (x)ğ(x) + f˘(x)g(a) = f (x)
+
g(a)
x−a
x−a
f (x)(g(x) − g(a)) + (f (x) − f (a))g(a)
f (x)g(x) − f (a)g(a)
=
=
x−a
x−a
für jedes x ∈ D \ {a}. Daraus ergibt sich, dass
f (a)g ′ (a) + f ′ (a)g(a) = lim
x→a
(f · g)(x) − (f · g)(a)
;
x−a
d.h. f · g ist in a differenzierbar und (f · g)′ (a) = f (a)g ′(a) + f ′ (a)g(a).
(3) Sei {xn }n≥p eine Folge aus D\{a}, die gegen a konvergiert. Damit konvergiert
nach Satz 5.5 die Folge {f˘(xn )g(a) − f (a)ğ(xn )}n≥p gegen f ′ (a)g(a) − f (a)g ′ (a).
Aber
h f (x) − f (a)
˘
1
g(x) − g(a) i
f(x)g(a)
− f (a)ğ(x)
=
g(x) − f (a)
g(x)g(a)
g(x)g(a)
x−a
x−a
h
i
(f (x) − f (a))g(a) − f (a)(g(x) − g(a))
1
=
g(x)g(a)
x−a
h
f i
1
f (x)g(a) − f (a)g(x) i
1 h f =
=
(x) −
(a)
g(x)g(a)
x−a
x−a g
g
10 Differentiation
72
für jedes x ∈ D \ {a}, und nach Satz 10.2 und Satz 7.3 konvergiert die Folge
{g(xn )}n≥p gegen g(a). Daraus folgt, nach Satz 5.5 und Satz 5.6, dass
f i
1 h f f ′ (a)g(a) − f (a)g ′ (a)
(x) −
(a) ,
= lim
x→a x − a
g(a)2
g
g
d.h. die Abbildung f /g ist in a differenzierbar, und es gilt
f ′
g
(a) =
f ′ (a)g(a) − f (a)g ′(a)
.
g(a)2
Lemma 10.4 Sei E eine Teilmenge von D, die a enthält, und nehme an, dass
a ein Häufungspunkt von E ist; sei f : D → K in a differenzierbar. Dann ist die
Einschränkung fE von f auf E auch in a differenzierbar und fE′ (a) = f ′ (a).
Beweis Dies ist klar.
Seien f, g : D → K Abbildungen, die beide in a differenzierbar sind und mit
g(a) 6= 0 (obwohl nicht unbedingt mit g(x) 6= 0 für alle x ∈ D). Nach Satz 10.2
ist g an der Stelle a stetig und damit gibt es ein ε > 0, so dass g(x) 6= 0 für alle x ∈
BD (a, ε). Nun ist a Häufungspunkt von E = BD (a, ε) und nach Lemma 10.4 sind
fE und gE in a differenzierbar mit fE′ (a) = f ′ (a) und gE′ (a) = g ′ (a). Dies bedeutet,
dass, obwohl g die Bedingung in Satz 10.3 (3) nicht unbedingt erfüllt, dieser Satz
immer noch auf die Abbildungen fE und gE angewendet werden können.
Satz 10.4 (Kettenregel) Sei E eine weitere nichtleere Teilmenge von K und
sei b ∈ E ein Häufungspunkt von E. Sei f : D → K differenzierbar in a mit
f (D) ⊂ E und f (a) = b und sei g : E → K differenzierbar in b. Dann ist die
zusammengesetzte Abbildung g ◦ f : D → K differenzierbar in a und es gilt
(g ◦ f )′ (a) = g ′(f (a))f ′ (a) .
Beweis Da f in a differenzierbar ist, gibt es nach Satz 10.1 eine an der Stelle a
stetige Abbildung r : D → K mit r(a) = 0, so dass
f (x) = f (a) + f ′ (a)(x − a) + r(x)(x − a) = f (a) + f ′ (a) + r(x) (x − a)
für alle x ∈ D, und da g in b differenzierbar ist, gibt es eine an der Stelle b stetige
Abbildung s : E → K mit s(b) = 0, so dass
g(y) = g(b) + g ′(b)(y − b) + s(y)(y − b) = g(b) + g ′(b) + s(y) (y − b)
10 Differentiation
73
für alle y ∈ E. Für alle x ∈ D ist dann
(g ◦ f )(x) = g(f (x)) = g(f (a)) + g ′ (f (a)) + s(f (x)) f (x) − f (a)
= g(f (a)) + g ′ (f (a)) + s(f (x)) f ′ (a) + r(x) (x − a)
= (g ◦ f )(a) + g ′ (f (a))f ′ (a)(x − a) + t(x)(x − a) ,
wobei t : D → K durch t(x) = s(f (x))r(x) + g ′(f (a))r(x) + s(f (x))f ′ (a) für alle
x ∈ D gegeben ist. Aber nach Satz 7.4 und Satz 7.5 ist t and der Stelle a stetig
und t(a) = s(f (a))r(a) + g ′(f (a))r(a) + s(f (a))f ′ (a) = 0. Daraus ergibt sich nach
Satz 10.1, dass g ◦ f in a differenzierbar ist und (g ◦ f )′ (a) = g ′ (f (a))f ′ (a).
Lemma 10.5 Sei f : D → K injektiv und stetig an der Stelle a. Dann ist f (b)
Häufungspunkt von E = f (D).
Beweis Sei ε > 0; da f an der Stelle a stetig ist, gibt es ein δ > 0, so dass
|f (x) − f (a)| < ε für alle x ∈ D mit |x − a| < δ. Damit ist f (x) ∈ BE (f (a), ε) für
alle x ∈ BD (a, δ), d.h. f (BD (a, δ)) ⊂ BE (f (a), ε). Folglich ist f (BD (a, δ) \ {a}
Teilmenge von BE (f (a), ε) \ {f (a)}, da f injektiv ist. Aber BD (a, δ) \ {a} ist
nichtleer, da a Häufungspunkt von D ist, und also ist BE (f (a), ε) \ {f (a)} auch
nichtleer. Dies zeigt, dass f (a) Häufungspunkt von E ist.
Ist f : D → K injektiv und differenzierbar in a, so ist nach Satz 10.2 und
Lemma 10.5 f (b) Häufungspunkt von E = f (D).
Satz 10.5 Sei f : D → K injektiv und in a differenzierbar. Setze E = f (D) und
nehme an, dass die Umkehrabbildung f −1 : E → K an der Stelle b = f (a) stetig
ist. Dann ist f −1 in b differenzierbar genau, wenn f ′ (a) 6= 0. In diesem Fall ist
(f −1 )′ (b) =
1
f ′ (a)
.
Beweis Nehme zunächst an, dass f ′ (a) 6= 0, und sei {yn }n≥p eine Folge aus E\{b},
die gegen b konvergiert. Für jedes n ≥ p setze xn = f −1 (yn ); dann ist {xn }n≥p
eine Folge aus D \ {a} (da f (xn ) = y 6= f (a)), die gegen a konvergiert, da f −1 an
der Stelle b stetig ist. Nach Voraussetzung ist f in a differenzierbar, und daher
ist limn→∞ (f (xn ) − f (a))/(xn − a) = f ′ (a) 6= 0. Ferner ist f (xn ) − f (a) 6= 0 für
alle n ≥ p, da xn 6= a und f injektiv ist, und daraus folgt nach Satz 5.6, dass
f −1 (yn ) − f −1 (b)
1
xn − a
lim
= lim
= ′
.
n→∞
n→∞
yn − b
f (xn ) − f (a)
f (a)
Damit ist f −1 in b differenzierbar und es gilt (f −1 )′ (b) = 1/f ′ (a).
10 Differentiation
74
Nehme nun umgekehrt an, dass f −1 in b differenzierbar ist. Nach Satz 10.4 ist
f −1 ◦ f in a differenzierbar und (f −1 ◦ f )′(a) = (f −1 )′ (b)f ′ (a). Aber f −1 ◦ f = idD
und offensichtlich ist id′D (a) = 1; d.h. (f −1 )′ (b)f ′ (a) = 1. Daher ist f ′ (a) 6= 0 und
(f −1 )′ (b) = 1/f ′(a).
Lemma 10.6 Sei D Teilmenge von R; eine Abbildung f : D → C ist genau dann
in a differenzierbar, wenn Re f und Im f in a differenzierbar sind. In diesem Fall
gilt f ′ (a) = (Re f )′ (a) + i(Im f )′ (a).
Bemerkung: Die Differenzierbarkeit von f in a ist hier natürlich mit K = C
definiert und insbesondere wird D als Teilmenge von C angesehen.
Beweis Übung.
Die Teilmenge D heißt perfekt, wenn jedes a ∈ D ein Häufungspunkt von D ist.
Lemma 10.7 (1) Jede offene Teilmenge von K ist perfekt.
(2) Jede perfekte Teilmenge von R ist auch eine perfekte Teilmenge von C.
(3) Jedes Intervall, das mehr als einen Punkt enthält, ist perfekt.
Beweis Übung.
Im Folgenden sei D eine nichtleere perfekte Teilmenge von K. Eine Abbildung
f : D → K heißt differenzierbar, wenn f in a differenzierbar ist für jedes a ∈ D.
Satz 10.6 Seien c0 , . . . , cn ∈ K (mit n ≥ 0) und sei f : D → K die durch
f (x) = c0 + c1 x + c2 x2 + · · · + cn xn
für alle x ∈ D gegebene Abbildung. Dann ist f differenzierbar und
f ′ (a) = c1 + 2c2 a + · · · + ncn an−1
für alle a ∈ D.
Beweis Für jedes n ≥ 0 definiere hn : D → R durch hn (x) = xn für alle x ∈ D;
(insbesondere ist dann h0 (x) = 1 für alle x ∈ D). Es ist klar, dass h0 und h1
differenzierbar sind und h′0 (a) = 0 und h′1 (a) = 1 für alle a ∈ D. Sei nun n ≥ 1
und nehme an, dass hn differenzierbar ist und dass h′n (a) = nan−1 für alle a ∈ D.
Da hn+1 = h1 · hn , ist dann nach Satz 10.3 (2) auch hn+1 differenzierbar und
h′n+1 (a) = (h1 · hn )′ (a) = h1 (x)h′n (a) + h′1 (x)hn (a)
= a · nan−1 + 1 · an = (n + 1)an
10 Differentiation
75
für alle a ∈ D. Daraus folgt durch Induktion nach n, dass hn differenzierbar
ist für jedes n ≥ 0 und h′n (a) = nan−1 für alle a ∈ D, n ≥ 1. Damit ist nach
Satz 10.3 (1) f = c0 h0 + c1 h1 + · · · + cn hn differenzierbar und es gilt
f ′ (a) = c0 h′0 (a) + c1 h′1 (a) + · · · + cn h′n (a) = c1 + 2c2 a + · · · + ncn an−1
für alle a ∈ D.
Satz 10.7 Nehme an, dass 0 ∈
/ D und sei n ≥ 1. Dann ist die durch gn (x) = 1/xn
definierte Abbildung gn : D → K differenzierbar und für alle a ∈ D gilt
gn′ (a) = −
n
an+1
.
Beweis Es gilt gn = 1/hn , wobei hn : D → K wie im Beweis für Satz 10.6 ist,
und daraus folgt nach Satz 10.3 (3), dass gn differenzierbar ist und
gn′ (a) =
1 ′
−nan−1
n
0 · hn (a) − 1 · h′n (a)
=
= − n+1
(a) =
2
2n
hn
hn (a)
a
a
für alle a ∈ D.
Satz 10.8 (1) Die Abbildung exp : K → K ist differenzierbar und exp′ = exp.
(2) Die Abbildung cis : R → C ist differenzierbar und cis′ = i cis.
(3) Die Abbildungen cos, sin : R → R sind beide differenzierbar mit cos′ = − sin
und sin′ = cos.
Beweis (1) Sei a ∈ K und ε > 0; setze η = exp −(1 + |a|) ε und δ = min{η, 1}.
Für alle x ∈ K \ {a} mit |x − a| < δ ist dann nach Satz 6.10 (4)
exp(x) − exp(a)
|x − a|
− exp(a) ≤
exp(|x − a|) exp(|a|)
x−a
2
|x − a|
exp(1 + |a|) < η exp(1 + |a|) = ε ,
≤
2
und daraus folgt, dass limx→a (exp(x) − exp(a))/(x − a) = exp(a). Damit ist exp
in a differenzierbar und exp′ (a) = exp(a).
(2) Definiere f : C → C durch f (z) = exp(iz) für alle z ∈ C. Dann ist f = exp ◦h,
wobei h(z) = iz für alle z ∈ C, und daraus ergibt sich nach (1), Satz 10.4 und
Satz 10.6, dass f differenzierbar ist und
f ′ (a) = (exp ◦h)′ (a) = exp′ (h(a))h′ (a) = i exp(ia) = if (a) .
10 Differentiation
76
Aber cis ist die Einschränkung von f auf R und folglich gilt nach Lemma 10.4,
dass cis differenzierbar ist und cis′ (a) = f ′ (a) = if (a) = i cis(a) für alle a ∈ R.
(3) Da cos = Re cis und sin = Im cis, sind nach (2) und Lemma 10.6 cos und sin
differenzierbar und cos′ (a) = Re(cis′ (a)) = Re(i cis(a)) = − Im cis(a) = − sin(a)
und sin′ (a) = Im(cis′ (a)) = Im(i cis(a)) = Re cis(a) = cos(a) für alle a ∈ R.
Satz 10.9 Die Abbildung log : (0, +∞) → R ist differenzierbar und es gilt
log′ (a) =
1
a
für alle a ∈ (0, +∞).
Beweis Sei a ∈ (0, +∞) und setze c = log(a). Nun ist exp in c differenzierbar, log
ist an der Stelle a = exp(c) stetig und exp′ (c) 6= 0. Daraus folgt nach Satz 10.5,
dass die Abbildung log in a differenzierbar ist und
log′ (a) =
1
1
1
=
=
.
exp′ (c)
exp(c)
a
Sei f : D → K differenzierbar; es gibt also eine Abbildung f ′ : D → K, d.h. die
Abbildung x 7→ f ′ (x). Sie heißt die Ableitung von f .
In vielen Anwendungen sind die auftretenden Abbildungen differenzierbar (und
nicht nur differenzierbar in einem Punkt). Es ist also nützlich, über Versionen
der Sätze 10.3, 10.4 und 10.5 zu verfügen, die auf diesen Fall zugeschnitten sind.
Satz 10.10 Seien f, g : D → K differenzierbare Abbildungen
(1) Für alle λ, µ ∈ K ist die Abbildung λf + µg differenzierbar mit
(λf + µg)′ = λf ′ + µg ′ .
(2) Die Abbildung f · g ist differenzierbar mit
(f · g)′ = f · g ′ + f ′ · g .
(3) Ist g(x) 6= 0 für alle x ∈ D, so ist die Abbildung f /g differenzierbar mit
f ′
g
=
f ′ · g − f · g′
.
g2
Beweis Dies folgt unmittelbar aus Satz 10.3.
10 Differentiation
77
Satz 10.11 (Kettenregel) Sei E eine weitere nichtleere perfekte Teilmenge von
K. Seien f : D → K und g : E → K differenzierbare Abbildungen mit f (D) ⊂ E.
Dann ist die zusammengesetzte Abbildung g ◦ f : D → K differenzierbar mit
(g ◦ f )′ = (g ′ ◦ f ) · f ′ .
Beweis Dies folgt unmittelbar aus Satz 10.4, da für alle a ∈ D
(g ◦ f )′ (a) = g ′(f (a))f ′ (a) = (g ′ ◦ f ) · f ′ (a) .
Ist die Abbildung f : D → K injektiv und differenzierbar, so ist nach Satz 10.2
und Lemma 10.5 E = f (D) eine perfekte Teilmenge von K.
Satz 10.12 Sei f : D → K injektiv und differenzierbar. Setze E = f (D) und
nehme an, dass die Umkehrabbildung f −1 : E → K stetig ist. Dann ist f −1
differenzierbar genau, wenn f ′ (a) 6= 0 für alle a ∈ D. In diesem Fall ist
(f −1 )′ =
1
◦ f −1 .
′
f
Beweis Dies folgt unmittelbar aus Satz 10.5, da für alle a ∈ D
1
1
−1
−1 ′
(a) .
=
◦f
(f ) (a) = ′ −1
f (f (a))
f′
Sei f : D → K differenzierbar; im Folgenden wird die Abbleitung f ′ auch mit ∂f
bezeichnet. Sei nun a ∈ D; ist die Abbildung ∂f : D → K in a differenzierbar, so
heißt die Ableitung (∂f )′ (a) von ∂f in a die zweite Ableitung von f in a und sie
wird mit ∂ 2 f (a) oder f ′′ (a) bezeichnet.
Ist ∂f : D → K differenzierbar, so gibt es eine Abbildung ∂ 2 f : D → K. Natürlich
kann dieser Prozeß induktiv fortgesetzt werden: Setze ∂ 0 f = f , ∂ 1 f = ∂f und
sei n ≥ 1; f : D → K heißt n-mal in a differenzierbar, wenn sie (n − 1)-mal
differenzierbar ist und die Abbildung ∂ n−1 f : D → K in a differenzierbar ist.
Nun heißt f n-mal differenzierbar, wenn sie (n − 1)-mal differenzierbar ist und
die Abbildung ∂ n−1 f : D → K differenzierbar ist.
Die Ableitung (∂ n−1 f )′ (a) von ∂ n−1 f in a wird mit ∂ n f (a) bezeichnet. Ist f n-mal
differenzierbar, so gibt es eine Abbildung ∂ n f : D → K.
Schließlich heißt eine Abbildung f : D → K n-mal stetig differenzierbar, wenn sie
n-mal differenzierbar ist und die Abbildung ∂ n f : D → K stetig ist.
Im Folgenden sei K = R, also ist D nun eine Teilmenge von R. Eine Abbildung
f : D → R heißt in a rechtsseitig differenzierbar, wenn a ein Häufungspunkt von
10 Differentiation
78
D ∩ [a, +∞) ist und die Einschränkung von f auf D ∩ [a, +∞) in a differenzierbar
ist. In diesem Fall heißt die Ableitung in a von dieser Einschränkung rechtsseite
Abbleitung von f in a und wird mit ∂+ f (a) bezeichnet.
Analog wird linksseitige Differenzierbarkeit definiert: Die Abbildung f heißt in
a linksseitig differenzierbar, wenn a ein Häufungspunkt von D ∩ (−∞, a] ist und
die Einschränkung von f auf D ∩ (−∞, a] in a differenzierbar ist. In diesem Fall
heißt die Ableitung in a von dieser Einschränkung linksseite Abbleitung von f in
a und wird mit ∂− f (a) bezeichnet.
Ist a ein Häufungspunkt von D ∩ [a, +∞), so ist f in a rechtsseitig differenzierbar
genau dann, wenn es ein c ∈ R gibt, so dass
f (xn ) − f (a)
=c
n→∞
xn − a
lim
für jede Folge {xn }n≥p aus D ∩ (a, +∞), die gegen a konvergiert; ferner ist in
diesem Fall c = ∂+ f (a). Eine analoge Aussage gilt natürlich für linksseitige Differenzierbarkeit in a.
Lemma 10.8 Ein Punkt b ∈ R ist Häufungspunkt von D genau dann, wenn b
Häufungspunkt von mindestens einer der Mengen D ∩ [b, +∞) und D ∩ (−∞, b]
ist.
Beweis Dies ist klar.
Im Folgenden sei f : D → R eine Abbildung.
Lemma 10.9 (1) Sei a ein Häufungspunkt von D ∩[a, +∞), der kein Häufungspunkt von D ∩ (−∞, a] ist. Dann ist f in a differenzierbar genau, wenn f in a
rechtsseitig differenzierbar ist, und in diesen Fall ist ∂f (a) = ∂+ f (a).
(2) Sei a ein Häufungspunkt von D ∩ (−∞, a]), der kein Häufungspunkt von
D ∩ [a, +∞) ist. Dann ist f in a differenzierbar genau, wenn f in a linksseitig
differenzierbar ist, und hier ist ∂f (a) = ∂− f (a).
Beweis (1) Dies folgt aus der folgenden Tatsache: Da a kein Häufungspunkt von
D ∩ (−∞, a] ist, gibt es ein ε > 0, so dass D ∩ (a − ε, a) = ∅. Ist also {xn }n≥p
eine Folge aus D \ {a}, die gegen a konvergiert, dann existiert ein q ≥ p, so dass
xn ∈ D ∩ (a, +∞) für alle n ≥ q.
(2) Dies ist analog zu beweisen.
Nehme nun an, a ist Häufungspunkt von sowohl D∩(−∞, a] als auch D∩[a, +∞).
10 Differentiation
79
Satz 10.13 Die Abbildung f ist in a differenzierbar genau dann, wenn f in a
linksseitig und rechtseitig differenzierbar ist und ∂− f (a) = ∂+ f (a). In diesem Fall
ist ∂f (a) = ∂− f (a) = ∂+ f (a).
Beweis Sei f+ (bzw. f− ) die Einschränkung von f auf D ∩ [a, +∞) (bzw. auf
D ∩ (−∞, a]). Ist f in a differenzierbar, so sind nach Lemma 10.4 f+ und f− in
a differenzierbar und es gilt f+′ (a) = f ′ (a) = f−′ (a). Mit anderen Worten: Ist f
in a differenzierbar, so ist f in a linksseitig und rechtseitig differenzierbar und es
gilt ∂− f (a) = f+′ (a) = f−′ (a) = ∂+ f (a).
Nehme nun an, f ist in a sowohl linksseitig als auch rechtsseitig differenzierbar
und es gilt ∂− f (a) = ∂+ f (a). Dann sind f+ und f− in a differenzierbar und
f+′ (a) = f−′ (a). Nach Satz 10.1 gibt es also an der Stelle a stetige Abbildungen
r+ : D ∩ [a, +∞) → R und r− : D ∩ (−∞, a] → R mit r+ (a) = r− (a) = 0, so dass
f (x) = f+ (x) = f (a) + f+′ (a)(x − a) + r+ (x)(x − a) für alle x ∈ D ∩ [a, +∞) und
f (x) = f− (x) = f (a) + f−′ (a)(x − a) + r− (x)(x − a) für alle x ∈ D ∩ (−∞, a]. Sei
nun r : D → R die Abbildung, die definiert ist durch
r+ (x) , falls x ∈ D ∩ [a, +∞),
r(x) =
r− (x) , falls x ∈ D ∩ (−∞, a).
Dann ist r(a) = 0 und man sieht leicht, dass r an der Stelle a stetig ist. Ferner
ist f (x) = f (a) + c(x − a) + r(x)(x − a) für alle x ∈ D, wobei c = f+′ (a) = f−′ (a).
Daraus folgt nach Satz 10.1, das f in a differenzierbar ist und es gilt f ′ (a) = c,
d.h. ∂f (a) = ∂− f (a) = ∂+ f (a), da ∂− f (a) = f+′ (a) und ∂+ f (a) = f−′ (a).
11
Mittelwertsätze
Im Folgenden sei D stets eine nichtleere Teilmenge von R (es wird hier nur der
Fall K = R betrachtet).
Sei f : D → R eine Abbildung; dann hat f in a ∈ D ein lokales Minimum
(bzw. lokales Maximum), wenn es ein ε > 0 gibt, so dass f (a) ≤ f (x) (bzw.
f (a) ≥ f (x)) für alle x ∈ D mit |x − a| < ε. Man sagt dann, dass f in a ein
lokales Extremum besitze, wenn f in a entweder ein lokales Minimum oder ein
lokales Maximum hat.
Ein Punkt a ∈ D heißt innerer Punkt von D, wenn es ein ε > 0 gibt, so dass
{x ∈ R : |x − a| < ε} ⊂ D. Mit anderen Worten: wenn es ein ε > 0 gibt, so
dass BR (a, ε) = (a − ε, a + ε) ⊂ D. Insbesondere ist jeder innere Punkt von D
Häufungspunkt von D. Ferner ist D eine offene Teilmenge von R genau dann,
wenn jeder Punkt in D ein innerer Punkt ist.
Die Menge der inneren Punkte von D heißt das Innere von D und wird mit D ◦
bezeichnet.
Lemma 11.1 Sei f : D → R eine Abbildung und a ∈ D ◦ . Besitzt f in a ein
lokales Extremum und is f in a differenzierbar, so ist f ′ (a) = 0.
Beweis Da a innerer Punkt von D ist, gibt es ein ε > 0, so dass (a−ε, a+ε) ⊂ D.
Definiere eine Abbildung g : D \ {a} → R durch
g(x) =
f (x) − f (a)
x−a
für alle x ∈ D \ {a}; also ist limx→a g(x) = f ′ (a). Nehme an, f besitzt in a ein
lokales Minimum. Dann gibt es ein ε′ > 0, so dass f (a) ≤ f (x) für alle x ∈ D mit
|x − a| < ε′ . Setze δ = min{ε, ε′}; dann ist (a − δ, a + δ) ⊂ D und f (a) ≤ f (x) für
alle x ∈ (a − δ, a + δ). Für jedes n ≥ 2 sei xn = a − δn−1 und x′n = a + δn−1 ; dann
sind {xn }n≥2 und {x′n }n≥2 beide Folgen aus D\{a}, die gegen a konvergieren, und
daraus folgt, dass die Folgen {g(xn )}n≥2 und {g(x′n )}n≥2 gegen f ′ (a) konvergieren.
Aber für jedes n ≥ 2 ist g(xn ) ≤ 0 und g(x′n ) ≥ 0, da f (xn ) − f (a) ≥ 0,
f (x′n ) − f (a) ≥ 0, xn − a < 0 und x′n − a > 0. Damit ist nach Satz 5.3
0 ≤ lim g(x′n ) = f ′ (a) = lim g(xn ) ≤ 0 ; ,
n→∞
n→∞
d.h. f ′ (a) = 0. Für ein lokales Maximum ist das Lemma analog zu beweisen.
Sei E eine nichtleere Teilmenge von D, die perfekt ist. Eine Abbildung f : D → R
heißt dann in E differenzierbar, wenn f in c differenzierbar ist für jedes c ∈ E.
80
11 Mittelwertsätze
81
Im Folgenden sei I ein Intervall, das mehr als einen Punkt enthält. Dann ist
I ◦ auch ein Intervall, das mehr als einen Punkt enthält, und I \ I ◦ besteht aus
höchstens zwei Elementen (den ‘Endpunkten’ von I). Sind a, b ∈ I mit a < b, so
ist [a, b] ⊂ I und (a, b) ⊂ I ◦ .
Satz 11.1 (Satz von Rolle) Sei f : I → R eine stetige Abbildung, die in I ◦
differenzierbar ist, und seien a, b ∈ I mit a < b. Ist f (a) = f (b), dann gibt es ein
ξ ∈ (a, b), so dass f ′ (ξ) = 0 (und hier ist f ′ (ξ) definiert, da ξ ∈ (a, b) ⊂ I ◦ ).
Beweis Da [a, b] folgenkompakt ist, gibt es nach Satz 8.3 u, v ∈ [a, b], so dass
f (u) ≤ f (x) ≤ f (v) für alle x ∈ [a, b]. Ist f (u) = f (v), so ist f (x) = f (u) für alle
x ∈ [a, b] und in diesem Fall ist f ′ (ξ) = 0 für jedes ξ ∈ (a, b). Nehme also an, dass
f (u) 6= f (v), d.h. f (u) < f (v); dann gibt es ξ ∈ {u, v} mit f (ξ) 6= f (a) = f (b).
Insbesondere ist ξ ∈ (a, b) und damit ist ξ ∈ I ◦ . Ferner besitzt f in ξ ein lokales
Extremum, da f (ξ) ≤ f (x) (bzw. f (ξ) ≥ f (x)) für alle x ∈ [a, b]. Daraus folgt
nach Lemma 11.1, dass f ′ (ξ) = 0.
Satz 11.2 (Mittelwertsatz) Sei f : I → R eine stetige Abbildung, die in I ◦
differenzierbar ist, seien a, b ∈ I mit a < b. Dann gibt es ein ξ ∈ (a, b), so dass
f ′ (ξ) =
f (b) − f (a)
b−a
(und wieder ist f ′ (ξ) definiert, da ξ ∈ (a, b) ⊂ I ◦ ).
Beweis Setze c = (f (b) − f (a))/(b − a) und definiere eine Abbildung g : I → R
durch g(x) = f (x) − cx für jedes x ∈ I. Nach Satz 7.4 und Satz 10.3 (1) ist g
stetig und in I ◦ differenzierbare, und es gilt
g(a) = f (a) − ca =
bf (a) − af (b)
= f (b) − cb = g(b) .
b−a
Nach Satz 11.1 gibt es also ξ ∈ (a, b) mit g ′ (ξ) = 0. Damit ist nach Satz 10.3 (1)
f ′ (ξ) = g ′(ξ) + c = 0 + c =
f (b) − f (a)
.
b−a
Satz 11.3 (Zweiter Mittelwertsatz) Seien f, g : I → R stetige Abbildungen,
die in I ◦ differenzierbar sind, und seien a, b ∈ I mit a < b. Nehme an, dass
g ′ (x) 6= 0 für alle x ∈ (a, b). Dann gibt es ein ξ ∈ (a, b), so dass
f (b) − f (a)
f ′ (ξ)
=
′
g (ξ)
g(b) − g(a)
(und nach Satz 11.1 ist hier g(b) 6= g(a), da g ′(x) 6= 0 für alle x ∈ (a, b)).
11 Mittelwertsätze
82
Beweis Da g(b) 6= g(a), kann eine Abbildung h : I → R definiert werden durch
h(x) = f (x) −
f (b) − f (a)
g(x) − g(a)
g(b) − g(a)
für alle x ∈ I. Nach Satz 7.4 und Satz 10.3 (1) ist h eine stetige Abbildung, die
in I ◦ differenzierbar ist. Ferner ist h(a) = h(b) = f (a), und daraus folgt nach
Satz 11.1, dass es ein ξ ∈ (a, b) mit h′ (ξ) = 0 gibt. Damit ist
f ′ (ξ)
f (b) − f (a) ′
1 ′
f (b) − f (a) ′ f (ξ) −
= ′
g (ξ) +
g (ξ)
g ′ (ξ)
g (ξ)
g(b) − g(a)
g(b) − g(a)
f (b) − f (a) ′ 1 ′
h (ξ) +
g (ξ)
= ′
g (ξ)
g(b) − g(a)
1 f (b) − f (a) ′ f (b) − f (a)
g (ξ) =
.
= ′
g (ξ) g(b) − g(a)
g(b) − g(a)
Satz 11.4 Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist.
(1) f ist monoton wachsend (bzw. monoton fallend) genau dann, wenn f ′ (x) ≥ 0
(bzw. f ′ (x) ≤ 0) für alle x ∈ I ◦ .
(2) Gilt f ′ (x) > 0 (bzw. f ′ (x) < 0) für alle x ∈ I ◦ , so ist f streng monoton
wachsend (bzw. streng monoton fallend).
Beweis (1) Nehme zunächst an, dass f monoton wachsend ist und sei x ∈ I ◦ .
Da x ein innerer Punkt von I ist, gibt es ε > 0, so dass (x − ε, x + ε) ⊂ I. Für
jedes n ≥ 2 sei xn = x + εn−1 ; dann ist {xn }n≥2 eine Folge aus I \ {x}, die gegen
x konvergiert und da f (xn ) ≥ f (x) und xn > x für alle n ≥ 2, ist dann nach
Satz 5.3
f (xn ) − f (x)
f ′ (x) = lim
≥0.
n→∞
xn − x
Nehme umgekehrt an, dass f ′ (x) ≥ 0 für alle x ∈ I ◦ und seien x, y ∈ I mit x < y.
Nach Satz 11.2 gibt es dann ein ξ ∈ (x, y), so dass f ′ (ξ) = (f (y) − f (x))/(y − x).
Damit ist f (y) − f (x) = (y − x)f ′ (ξ) ≥ 0 d.h. f (y) ≥ f (x), und dies zeigt, dass
f monoton wachsend ist.
(2) Dies folgt genau wie in dem zweiten Teil von (1).
Die restlichen Aussagen (für ein monoton fallende Abbildung f und die entsprechenden Eigenschaften von ihrer Ableitung f ′ ) sind analog zu beweisen.
Die Umkehrung von Satz 11.4 (2) ist falsch: Sei f : R → R gegeben durch
f (x) = x3 für alle x ∈ R. Dann ist f streng monoton wachsend, aber f ′ (x) = 3x2
für alle x ∈ R und insbesondere ist f ′ (0) = 0.
11 Mittelwertsätze
83
Satz 11.5 Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist. Gilt
f ′ (x) 6= 0 für alle x ∈ I ◦ , so ist entweder f ′ (x) > 0 für alle x ∈ I ◦ oder f ′ (x) < 0
für alle x ∈ I ◦ . Insbesondere ist (nach Satz 11.4 (2)) f streng monoton.
Beweis Die Abbildung f ist injektiv: Gäbe es x, y ∈ I mit x < y und f (x) = f (y),
so wäre nach Satz 11.1 f ′ (ξ) = 0 für ein ξ ∈ (x, y). Damit ist nach Satz 7.10 f
streng monoton und insbesondere monoton. Daraus folgt nach Satz 11.4 (1), dass
entweder f ′ (x) ≥ 0 für alle x ∈ I ◦ oder f ′ (x) ≤ 0 für alle x ∈ I ◦ . Aber nach
Voraussetzung ist f ′ (x) 6= 0 für alle x ∈ I ◦ , und folglich ist entweder f ′ (x) > 0
für alle x ∈ I ◦ oder f ′ (x) < 0 für alle x ∈ I ◦ .
Satz 11.6 Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist.
Dann ist f ′ (I ◦ ) ein Intervall: Sind a, b ∈ I ◦ und ist c eine Zahl zwischen f ′ (a)
und f ′ (b), so gibt es ein u ∈ I ◦ mit f ′ (u) = c.
Beweis Seien a, b ∈ I ◦ und sei c zwischen f ′ (a) und f ′ (b). Ist c = f ′ (a) (bzw.
ist c = f ′ (b)), so kann man einfach u = a (bzw. u = b) nehmen. Es kann also
angenommen werden, dass c verschieden von f ′ (a) und f ′ (b) ist. Definiere eine
Abbildung g : I → R durch g(x) = f (x) − cx für alle x ∈ I. Nach Satz 7.4 und
Satz 10.3 (1) ist g stetig und in I ◦ differenzierbar. Ferner ist g ′(x) = f ′ (x) − c für
alle x ∈ I ◦ , und damit ist entweder g ′(a) > 0 und g ′ (b) < 0 oder g ′ (a) < 0 und
g ′ (b) > 0. Daraus folgt nach Satz 11.5, dass g ′(u) = 0 für ein u ∈ I ◦ , und dann
ist f ′ (u) = c.
Satz 11.6 ist eine Art Zwischenwertsatz für Ableitungen. Man merke aber: Ist
f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist, so ist f ′ im
allgemeinen keine stetige Abbildung.
Satz 11.7 Sei f : I → R eine stetige Abbildung. Dann ist f konstant genau,
wenn f in I ◦ differenzierbar ist und f ′ (x) = 0 für alle x ∈ I ◦ .
Beweis Nehme zunächst an, dass f in I ◦ differenzierbar ist und f ′ (x) = 0 für
alle x ∈ I ◦ . Dann ist nach Satz 11.4 (1) f sowohl monoton wachsend als auch
monoton fallend, und damit ist f konstant. Die Umkehrung ist trivial richtig.
Satz 11.8 Sei a ∈ I und seien b, c ∈ R. Sei f : I → R eine stetige Abbildung,
die in I ◦ differenzierbar ist und für die gilt: f (a) = b und f ′ (x) = cf (x) für alle
x ∈ I ◦ . Dann gilt f (x) = b exp c(x − a) für alle x ∈ I.
11 Mittelwertsätze
84
Beweis Definiere g : I → R durch g(x) = exp −c(x − a) für alle x ∈ I. Nach
Satz 7.1 und Satz 7.5 ist g stetig und nach Satz 10.8 (1), Satz
10.4 und Lemma 10.4
◦
′
ist g differenzierbar in I mit g (x) = −c exp −c(x − a) = −cg(x). Nun ist nach
Satz 7.4 die Produktabbildung f ·g stetig, nach Satz 10.3 (2) ist f ·g differenzierbar
in I ◦ und es gilt
(f · g)′(x) = f (x)g ′ (x) + f ′ (x)g(x) = f (x) −cg(x) + cf (x) g(x) = 0
für alle x ∈ I ◦ . Daraus ergibt sich nach Satz 11.7, dass f · g konstant ist, und
folglich ist (f · g)(x) = (f · g)(a) für alle x ∈ I. Für alle x ∈ I ist also
f (x) = f (a)g(a)
1
1
= b exp c(x − a) .
=b
g(x)
exp −c(x − a)
Eine Abbildung f : I → R heißt konvex, wenn für alle x, y ∈ I und alle t ∈ [0, 1]
f (1 − t)x + ty ≤ (1 − t)f (x) + tf (y) .
Satz 11.9 Für eine Abbildung f : I → R sind äquivalent:
(1) f ist konvex.
(2) Für alle a, b ∈ I mit a < b und alle x ∈ [a, b] gilt
f (x) ≤ f (a) +
f (b) − f (a)
(x − a) .
b−a
(3) Für alle a, b ∈ I mit a < b und alle x ∈ (a, b) gilt
f (x) − f (a)
f (b) − f (a)
f (b) − f (x)
≤
≤
.
x−a
b−a
b−x
(4) Für alle a, b, a′ , b′ ∈ I mit a < b, a′ < b′ , a ≤ a′ und b ≤ b′ gilt
f (b′ ) − f (a′ )
f (b) − f (a)
≤
.
b−a
b′ − a′
(5) Für alle a, b, a′ , b′ ∈ I mit a < b ≤ a′ < b′ gilt
f (b) − f (a)
f (b′ ) − f (a′ )
≤
.
b−a
b′ − a′
11 Mittelwertsätze
85
Beweis (1) ⇒ (2): Seien a, b ∈ I mit a < b und x ∈ [a, b]. Setze t = (x−a)/(b−a);
dann ist t ∈ [0, 1] und x = (1 − t)a + tb, und damit ist
f (x) = f (1 − t)a + tb
(b − x)f (a) + (x − a)f (b)
≤ (1 − t)f (a) + tf (b) =
b−a
(b − a)f (a) + f (b) − f (a) (x − a)
f (b) − f (a)
= f (a) +
(x − a) .
=
b−a
b−a
(2) ⇒ (3): Seien a, b ∈ I mit a < b und x ∈ (a, b). Dann folgt
f (x) − f (a)
f (b) − f (a)
≤
x−a
b−a
unmittelbar aus (2). Ferner gilt aber
f (b) − f (a)
(x − a)
f (b) − f (x) ≥ f (b) − f (a) −
b−a
f (b) − f (a) (b − a) − f (b) − f (a) (x − a)
f (b) − f (a)
=
=
(b − x)
b−a
b−a
und daraus ergibt sich, dass auch (f (b) − f (a))/(b − a) ≤ (f (b) − f (x))/(b − x).
(3) ⇒ (4): Seien a, b, a′ , b′ ∈ I mit a < b, a′ < b′ , a ≤ a′ und b ≤ b′ . Dann ist
b ∈ (a, b′ ] und damit folgt aus der ersten Ungleichung in (3), dass
f (b′ ) − f (a)
f (b) − f (a)
≤
,
b−a
b′ − a
da diese Ungleichung trivial richtig ist, wenn b = b′ . Andererseits ist a′ ∈ [a, b′ ),
und nach der zweiten Ungleichung in (3) ist dann
f (b′ ) − f (a)
f (b′ ) − f (a′ )
≤
,
b′ − a
b′ − a′
da diese Ungleichung trivial richtig ist, wenn a = a′ . Folglich ist
f (b′ ) − f (a)
f (b′ ) − f (a′ )
f (b) − f (a)
≤
≤
.
b−a
b′ − a
b′ − a′
(4) ⇒ (5): Dies ist klar.
(5) ⇒ (1): Seien x, y ∈ I und t ∈ [0, 1]. Zu zeigen ist, dass
f (1 − t)x + ty ≤ (1 − t)f (x) + tf (y) ,
11 Mittelwertsätze
86
und dies ist trivial richtig, wenn x = y oder t ∈ {0, 1}. Es kann also im Folgenden
angenommen werden, dass x 6= y und t ∈ (0, 1); ohne Beschränkung der Allgemeinheit sei x < y. Setze u = (1 − t)x + ty; dann ist u ∈ (x, y), und daraus folgt
nach (5) (mit a = x, b = a′ = u und b′ = y), dass
Daraus ergibt sich, dass
f (y) − f (u)
f (u) − f (x)
≤
.
u−x
y−u
1
(y − u) + (u − x) f (u)
y−x
1
(y − u)f (x) + (u − x)f (y)
≤
y−x
y−u
u−x
=
f (x) +
f (y) = (1 − t)f (x) + tf (y) .
y−x
y−x
f (u) =
Satz 11.10 Sei f : I → R eine stetige Abbildung, die in I ◦ differenzierbar ist.
Dann ist f konvex genau, wenn die Abbildung f ′ monoton wachsend ist.
Beweis Nehme zunächst an, das f konvex ist, und seien x, y ∈ I ◦ mit x < y. Es
gibt also ein ε > 0, so dass die beiden Intervalle (x − ε, x + ε) und (y − ε, y + ε)
Teilmengen von I sind. Für jedes n ≥ 2 sei xn = x + εn−1 und yn = y + εn−1 .
Dann ist {xn }n≥2 eine Folge aus I \ {x}, die gegen x konvergiert, und {yn }n≥2 ist
eine Folge aus I \ {y}, die gegen y konvergiert. Daraus ergibt sich, dass
f (xn ) − f (x)
= f ′ (x) und
n→∞
xn − x
lim
f (yn ) − f (y)
= f ′ (y) .
n→∞
yn − y
lim
Aber für jedes n ≥ 2 ist x < xn , y < yn , x ≤ y und xn ≤ yn und folglich ist
f (xn ) − f (x)
f (yn ) − f (y)
≤
xn − x
yn − y
nach Lemma 11.2 ((1) ⇒ (4)). Damit ist nach Satz 5.3 f ′ (x) ≤ f ′ (y), und dies
zeigt, dass f ′ monoton wachsend ist.
Nehme nun umgekehrt an, dass f ′ monoton wachsend ist, und seien a, b, a′ , b′ ∈ I
mit a < b ≤ a′ < b′ . Nach Satz 11.2 gibt es ξ ∈ (a, b) und ξ ′ ∈ (a′ , b′ ), so dass
f (b) − f (a)
= f ′ (ξ) und
b−a
f (b′ ) − f (a′ )
= f ′ (ξ ′ ) .
b′ − a′
Aber ξ < b ≤ a′ < ξ ′, damit ist f ′ (ξ) ≤ f ′ (ξ) und folglich
f (b) − f (a)
f (b′ ) − f (a′ )
≤
.
b−a
b′ − a′
Also ist nach Lemma 11.2 ((5) ⇒ (1)) f konvex.
11 Mittelwertsätze
87
Satz 11.11 Sei f : I → R eine stetige Abbildung, die in I ◦ zweimal differenzierbar ist. Dann ist f konvex genau, wenn f ′′ (x) ≥ 0 für alle x ∈ I ◦ .
Beweis Man merke, dass I ◦ auch ein Intervall ist, das mehr als einen Punkt
enthält. Nach Satz 10.2 ist die Abbildung f ′ : I ◦ → R stetig und per Definition
ist sie in (I ◦ )◦ = I ◦ differenzierbar. Daraus folgt nach Satz 11.4 (1), dass f ′ genau
dann monoton wachsend ist, wenn f ′′ (x) ≥ 0 für alle x ∈ I ◦ . Daraus ergibt sich
nach Satz 11.9, dass f genau dann konvex ist, wenn f ′′ (x) ≥ 0 für alle x ∈ I ◦ .
Satz 11.12 Sei d > 0 und sei h : [0, d] → R eine stetige Abbildung, die in (0, d)
differenzierbar ist. Nehme an, h(0) = 0 und limy→0 y ′ (x) = c für ein c ∈ R. Dann
gilt limy→0 h(y)/y = c.
Beweis Sei {yn }n≥p eine Folge aus (0, d], die gegen 0 konvergiert. Für jedes n ≥ p
gibt es dann nach Satz 11.2 ein ξn ∈ (0, yn ), so dass
h′ (ξn ) =
h(yn ) − h(0)
h(yn )
=
.
yn − 0
yn
Da aber 0 < ξn < yn , ist {ξn }n≥p dann eine Folge aus (0, d), die auch gegen 0
konvergiert, und daraus ergibt sich, dass limn→∞ h(yn )/yn = limn→∞ h′ (ξn ) = c.
Dies zeigt, dass limy→0 h(y)/y = c.
Im Folgenden seien a, b ∈ R mit a < b und sei g : [a, b] → R eine stetige
Abbildung, die in (a, b) differenzierbar ist. Es wird ferner angenommen, dass
g(0) = 0 und dass g ′ (x) 6= 0 für alle x ∈ (a, b). Nach Satz 11.5 ist dann entweder
g ′ (x) > 0 für alle x ∈ (a, b) oder g ′ (x) < 0 für alle x ∈ (a, b). In dem ersteren
Fall ist g streng monoton wachsend und g(x) > 0 für alle x ∈ (0, b], und in dem
letzteren Fall ist g streng monoton fallend und g(x) < 0 für alle x ∈ (0, b]. In
beiden Fällen ist g(x) 6= 0 für alle x ∈ (a, b].
Satz 11.13 (Eine Regel von de l’Hospital) Sei f : [a, b] → R eine weitere
stetige Abbildung mit f (a) = 0, die in (a, b) differenzierbar ist. Gibt es ein c ∈ R,
so dass limx→a f ′ (x)/g ′(x) = c, so gilt auch limx→a f (x)/g(x) = c.
Beweis In Beweis wird angenommen, dass g ′ (x) > 0 für alle x ∈ (a, b); (der
andere Fall wird analog bewiesen). Damit ist g streng monoton wachsend und
g bildet das Intervall [a, b] bijektiv auf das Intervall [0, d] ab, wobei d = g(b).
Nach Satz 7.11 ist die Umkehrabbildung g −1 : [0, d] → [a, b] stetig; ferner ist
nach Satz 10.5 g −1 in (0, d) differenzierbar und (g −1 )′ (g(x)) = 1/g ′(x) für jedes
x ∈ (a, b). Betrachte nun die Zusammensetzung h = f ◦ g −1 : [0, d] → R von g −1
11 Mittelwertsätze
88
und f . Nach Satz 7.5 ist h stetig mit h(0) = f (g −1(0)) = f (a) = 0, und nach
Satz 10.4 ist h in (0, d) differenzierbar und für alle x ∈ (a, b) gilt
f ′ (x)
h (g(x)) = (f ◦ g ) (g(x)) = f g (g(x)) · (g ) (g(x)) = ′
.
g (x)
′
−1 ′
′
−1
−1 ′
Sei jetzt {yn }n≥p eine Folge aus (0, d), die gegen 0 konvergiert, und für jedes
n ≥ p setze xn = g −1(yn ). Dann ist {xn }n≥p eine Folge aus (a, b), die gegen a
konvergiert, da g −1 stetig ist und g −1(0) = a. Nach Voraussetzung gilt also
f ′ (xn )
=c.
n→∞ g ′ (xn )
lim h′ (yn ) = lim h′ (g(xn )) = lim
n→∞
n→∞
Daher ist lim h′ (y) = c und daraus folgt nach Lemma 11.3, dass lim h(y)/y = c.
y→0
y→0
Sei {xn }n≥p eine Folge aus (a, b), die gegen a konvergiert, und für jedes n ≥ p
setze diesmal yn = g(xn ). Dann ist {yn }n≥p eine Folge aus (0, d), die gegen 0
konvergiert, da g stetig ist und g(a) = 0. Damit ist
lim
n→∞
h(g(xn ))
h(yn )
f (xn )
= lim
= lim
=c,
n→∞
n→∞
g(xn )
g(xn )
yn
und dies zeigt, dass lim f (x)/g(x) = c.
x→a
12
Integration von Regelfunktionen
Sei X eine Menge; der K-Vektorraum aller Abbildungen von X nach K wird mit
Abb(X, K) bezeichnet. Eine Abbildung f : X → K heißt beschränkt, wenn es ein
c ≥ 0 gibt, so dass |f (x)| ≤ c für alle x ∈ X, und die Menge aller beschränkten
Abbildungen von X nach K wird dann mit B(X, K) bezeichnet. Es ist klar, dass
B(X, K) ein Untervektorraum von Abb(X, K) ist. Für jedes f ∈ B(X, K) sei
||f || = sup{|f (x)| : x ∈ X} .
Dann hat die Abbildung || · || : B(X, K) → K folgende Eigenschaften:
(1) ||f || ≥ 0 und ||f || = 0 genau dan, wenn f = 0.
(2) ||λf || = |λ| ||f || für alle f ∈ B(X, K), λ ∈ K.
(3) ||f + g|| ≤ ||f || + ||g|| für alle f, g ∈ B(X, K).
Im Folgenden sei I das abgeschlossene Intervall [a, b], wobei a, b ∈ R mit a < b.
Seien a0 , . . . , an ∈ R; dann heißt U = (a0 , . . . , an ) eine Unterteilung von I, falls
a = a0 < · · · < an = b. Sind U = (a0 , . . . , an ) und V = (b0 , . . . , bm ) Unterteilungen
von I, so heißt V Verfeinerung von U, falls die Menge {a0 , . . . , an } Teilmenge der
Menge {b0 , . . . , bm } ist.
Seien U = (a0 , . . . , an ), V = (b0 , . . . , bm ) Unterteilungen von I; dann bezeichnet
U ∨ V die Unterteilung (c0 , . . . , cq ), wobei c0 , . . . , cq die Elemente der Menge
{a0 , . . . , an } ∪ {b0 , . . . , bm } in aufsteigender Reihenfolge sind. Es ist klar, dass
U ∨ V eine Verfeinerung von U und von V ist.
Eine Abbildung f : I → K heißt nun Treppenfunktion, wenn es eine Unterteilung
U = (a0 , . . . , an ) von I gibt, so dass f konstant auf jedem der offenen Intervalle
(aj−1 , aj ), j = 1, . . . , n, ist; U heißt dann eine Unterteilung für f und f ist eine
Treppenfunktion zur Unterteilung U.
Lemma 12.1 Ist U eine Unterteilung für eine Treppenfunktion f : I → K, so
ist jede Verfeinerung von U auch eine Unterteilung für f .
Beweis Dies ist klar.
Die Menge aller Treppenfunktionen f : I → K wird mit T(I, K) bezeichnet; da
jede Treppenfunktion beschränkt ist, ist T(I, K) ⊂ B(I, K).
Satz 12.1 T(I, K) ist ein Untervektorraum von B(I, K).
89
12 Integration von Regelfunktionen
90
Beweis Es ist klar, dass 0 eine Treppenfunktion ist. Seien f, g ∈ T(I, K); wähle
eine Unterteilung U für f und eine Unterteilung V für g. Für alle λ, µ ∈ K ist
dann λf + µg konstant auf jedem der offenen Intervalle der Unterteilung U ∨ V,
und damit ist λf + µg eine Treppenfunktion, d.h. λf + µg ∈ T(I, K).
Sei U = (a0 , . . . , an ) eine Unterteilung für die Treppenfunktion f : I → K, und
für jedes j = 1, . . . , n sei αj der Wert von f auf dem Intervall (aj−1, aj ). Setze
Z
n
X
f=
αj (aj − aj−1 ) ;
U
j=1
dieses Element von K heißt das Integral von f bezüglich der Unterteilung U. Da
n
n
n
X
X
X
αj (aj − aj−1 ) ≤
|αj (aj − aj−1 )| ≤
||f ||(aj − aj−1 ) = (b − a)||f || ,
j=1
ist |
R
U
j=1
j=1
f | ≤ (b − a)||f ||.
Lemma 12.2 Sind U und V Unterteilungen für die Treppenfunktion f , so ist
Z
Z
f=
f.
U
V
Beweis Seien U = (a0 , . . . , an ), V = (b0 , . . . , bm ), für 1 ≤ j ≤ n sei αj der Wert
von f auf dem Intervall (aj−1, aj ) und für 1 ≤ k ≤ m sei βk der Wert von f auf
dem Intervall (ak−1 , ak ). Nehme zunächst an, dass V eine Verfeinerung von U ist.
Dann gibt es Indizes 0 = q0 < · · · < qn = m, so dass aj = bqj für jedes 0 ≤ j ≤ n;
insbesondere ist βk = αj , falls qj−1 + 1 ≤ k ≤ qj . Daraus ergibt sich, dass
Z
n
n
X
X
f =
αj (aj − aj−1 ) =
αj (bqj − bqj−1 )
U
j=1
=
n
X
j=1
=
m
X
k=1
j=1
qj
αj
X
(bk − bk−1 ) =
k=qj−1 +1
βk (bk − bk−1 ) =
Z
n
X
qj
X
j=1 k=qj−1 +1
βk (bk − bk−1 )
f.
V
Sind nun U und V beliebige Unterteilungen für f , so ist U ∨ V eine Verfeinerung
von U und V, die nach Lemma 12.1 eineRUnterteilung
fürRf ist, und folglich gilt
R
nach dem ersten Teil des Beweises, dass U f = U ∨V f = V f .
R
Da nach Lemma 12.2 das Intergral U f nicht von der Unterteilung U abhängt,
Rb
Rb
Rb
wird dieses einfach mit a f (oder etwa a f (x) dx) bezeichnet; das Element a f
von K heißt dann das Integral von f .
12 Integration von Regelfunktionen
91
Rb
Satz 12.2 Die Abbildung f 7→ a f von T(I, K) nach K ist linear, d.h.
Z b
Z b
Z b
(λf + µg) = λ
f +µ
g
a
a
a
für alle f, g ∈ T(I, K) und alle λ, µ ∈ K. Ferner gilt |
f ∈ T(I, K).
Rb
a
f | ≤ (b − a)||f || für alle
Beweis Seien f, g ∈ T(I, K); wie im Beweis für Satz 12.1 gibt es eine Unterteilung
U, die eine Unterteilung von f und von g ist. Für alle λ, µ ∈ K ist dann U auch
eine Unterteilung von λf + µg, und es ist klar, dass
Z
Z
Z
(λf + µg) = λ f + µ g ;
U
Rb
damit
ist a (λf + µg) = λ
R
| U f | ≤ (b − a)||f ||.
U
Rb
a
f +µ
Rb
a
U
g. Schließlich gilt |
Rb
a
f | ≤ (b − a)||f ||, da
Für jedes n ≥ p sei fn : I → K eine Abbildung. Die Funktionenfolge {fn }n≥p
konvergiert dann gleichmäßig gegen eine Abbildung f : I → K, wenn es zu jedem
ε > 0 ein N ≥ p gibt, so dass |fn (x) − f (x)| < ε für alle x ∈ I und alle n ≥ N.
Lemma 12.3 Sei f ∈ B(I, K). Dann sind äquivalent:
(1) Zu jedem ε > 0 gibt es eine Treppenfunktion g ∈ T(I, K) mit ||f − g|| ≤ ε.
(2) Es gibt eine Folge {gn }n≥p von Treppenfunktionen mit lim ||f − gn || = 0.
n→∞
(3) Es gibt eine Folge {gn }n≥p aus T(I, K), die gleichmäßig gegen f konvergiert.
Beweis Dies ist klar.
Eine Abbildung f ∈ B(I, K) heißt Regelfunktion, wenn eine (und damit alle)
der äquivalenten Bedingungen in Lemma 12.3 für f gilt. Die Menge der Regelfunktionen von I nach K wird mit R(I, K) bezeichnet. Es ist klar, dass jede
Treppenfunktion eine Regelfunktion ist, d.h. T(I, K) ⊂ R(I, K).
Satz 12.3 R(I, K) ist ein Untervektorraum von B(I, K).
Beweis Da 0 ∈ T(I, K), ist 0 eine Regelfunktion. Seien f, g ∈ R(I, K), λ, µ ∈ K
und sei ε > 0. Wähle c > 0 mit c ≥ |λ| + |µ|. Da f, g ∈ R(I, K), gibt es
Treppenfunktionen u, v mit ||f − u|| ≤ ε/c und ||g − v|| ≤ ε/c. Nach Satz 12.1
ist dann λf + µg eine Treppenfunktion und es gilt
||(λf + µg) − (λu + µv)|| = ||λ(f − u) + µ(g − v)||
≤ |λ| ||f − u|| + |µ| ||g − v|| ≤ ε .
Dies zeigt, dass λf + µg ∈ R(I, K), und damit ist R(I, K) ein Untervektorraum
von B(I, K).
12 Integration von Regelfunktionen
92
Satz 12.4 Jede stetige Abbildung f : I → K ist eine Regelfunktion.
Beweis Nach Satz 8.5 ist die stetige Abbildung f : I → K gleichmäßig stetig,
da das Intervall I = [a, b] folgenkompakt ist. Sei ε > 0; dann gibt es ein δ > 0,
so dass |f (x) − f (y)| < ε für alle x, y ∈ I mit |x − y| < δ. Wähle nun eine
Unterteilung U = (a0 , . . . , am ) mit aj+1 − aj ≤ δ für jedes 0 ≤ j < m, und sei
g : I → K die Abbildung mit g(x) = f (aj ) für alle x ∈ [aj , aj+1), 0 ≤ j < m, und
mit g(b) = f (b). Dann ist g ∈ T(I, K) und |g(x) − f (x)| < ε für alle x ∈ I, da für
alle x ∈ [aj , aj+1 ) ist |x − aj | < δ und damit |g(x) − f (x)| = |f (aj ) − f (x)| < ε.
Zu jedem ε > 0 gibt es also eine Treppenfunktion g mit ||g − f || ≤ ε. Folglich ist
f eine Regelfunktion.
Satz 12.5 Jede monotone Abbildung f : I → R ist eine Regelfunktion, d.h., ein
Element von R(I, R).
Beweis Ohne Beschränkung der Allgemeinheit nehme an, dass f monoton wachsend ist. Für jedes x ∈ [a, b) sei f (x+) = inf{f (y) : x < y ≤ b} und für jedes
x ∈ (a, b] sei f (x−) = sup{f (y) : a ≤ y < x}. Dann gilt f (x−) ≤ f (x) ≤ f (x+)
für alle x ∈ (a, b), f (a) ≤ f (a+) und f (b−) ≤ f (b). Sei nun ε > 0 und sei {ak }k≥0
die Folge aus I mit a0 = a und
sup{x ∈ I : f (x) < f (ak +) + ε} , falls ak < b,
ak+1 =
b
falls ak = b
für alle k ≥ 0. Ist ak < b, so sieht man leicht, dass ak < ak+1 ; ist ferner ak+1 < b,
so ist f (ak+1+) ≥ f (ak +) + ε und damit
f (ak+1 +) ≥ f (a0 +) + (k + 1)ε ≥ f (ak+1 +) ≥ f (a0 ) + (k + 1)ε .
Daraus ergibt sich dass am = b für ein m ≥ 1 (mit m ≤ 1 + (f (b) − f (a))/ε);
sei also n = min{m ≥ 1 : am = b}. Sei nun g : I → R die Abbildung mit
g(x) = f (aj +) für alle x ∈ (aj , aj+1 ), 0 ≤ j < n, und mit g(aj ) = f (aj ) für
0 ≤ j ≤ n. Dann ist g ∈ T(I, R) und |g(x) − f (x)| ≤ ε für alle x ∈ I, da
|g(x) − f (x)| = |f (aj +) − f (x)| < ε für alle x ∈ (aj , aj+1 ). Zu jedem ε > 0 gibt
es also eine Treppenfunktion g mit |g(x) − f (x)| ≤ ε für alle x ∈ I, und damit
ist f eine Regelfunktion.
Beispiel: Sei f : I → R die Abbildung, die definiert ist durch
1 , falls x ∈ I ∩ Q,
f (x) =
0 , falls x ∈ I \ Q.
Dann sieht man leicht, dass ||f − g|| ≥ 1/2 für jedes g ∈ T(I, R) und damit ist f
keine Regelfunktion.
12 Integration von Regelfunktionen
93
Lemma 12.4 Sei f ∈ R(I, K), sei {gn }n≥p eine Folge von Treppenfunktionen,
Rb
die gleichmäßig gegen f konvergiert, und für jedes n ≥ p setze xn = a f . Dann
konvergiert die Folge {xn }n≥p . Ist ferner {hn }n≥q eine weitere Folge aus T(I, K),
Rb
Rb
die gleichmäßig gegen f konvergiert, so ist lim a hn = lim a gn .
n→∞
n→∞
Beweis Sei ε > 0; dann gibt es ein N ≥ p, so dass |f (x) − gn (x)| < ε/4(b − a)
für alle x ∈ I, n ≥ N und damit gilt ||f − gn || ≤ ε/4(b − a) für alle n ≥ N. Für
alle m, n ≥ N ist also
Z b Z b
Z b
|xn − xm | = gn −
gm = (gn − gm ) ≤ (b − a)||gn − gm ||
a
a
a
= (b − a) ||f − gn || + ||f − gm || ≤ ε/2 < ε ,
und dies zeigt, dass {xn }n≥p eine Cauchy-Folge ist. Damit konvergiert {xn }n≥p
(da jede Cauchy-Folge in K konvergiert). Das gleiche Argument zeigt auch, dass
Rb
Rb
limn→∞ a hn = limn→∞ a gn für jede weitere Folge {hn }n≥q aus T(I, K), die
gleichmäßig gegen f konvergiert.
Sei f ∈ R(I, K) eine Regelfunktion; nach Lemma 12.4 gibt es dann ein eindeutiges
Rb
Element α ∈ K, so dass α = limn→∞ a gn für jede Folge {gn }n≥p aus R(I, K),
die gleichmäßig gegenR f konvergiert. αR heißt das Cauchy-Riemannsche Integral
b
b
von f und wird mit a f (oder etwa a f (x) dx) bezeichnet. (Es gibt hier kein
Problem mit dieser Schreibweise: Für Treppenfunktionen stimmt das CauchyRiemannsche Integral offensichtlich mit dem für Treppenfunktionen definierten
elementaren Integral überein.)
Rb
Satz 12.6 Die Abbildung f 7→ a f von R(I, K) nach K ist linear, d.h.
Z b
Z b
Z b
(λf + µg) = λ
f +µ
g
a
a
a
für alle f, g ∈ R(I, K) und alle λ, µ ∈ K. Ferner gilt |
f ∈ R(I, K).
Rb
a
f | ≤ (b − a)||f || für alle
Beweis Seien f, g ∈ R(I, K) und λ, µ ∈ K. Es gibt also eine Folge {fn }n≥1
(bzw. {gn }n≥1 ) aus T(I, K), die gleichmäßig gegen f (bzw. gegen g) konvergiert.
Wie im Beweis für Satz 12.3 konvergiert dann die Folge von Treppenfunktionen
{λfn + µgn }n≥1 gleichmäßig gegen λf + µg, und daraus folgt, dass
Z b
Z b
Z b Z b
(λf + µg) = lim
(λfn + µgn ) = lim λ
fn + µ
gn
n→∞ a
n→∞
a
a
a
Z b
Z b
Z b
Z b
= λ lim
fn + µ lim
gn = λ
f +µ
g.
n→∞
a
n→∞
a
a
a
12 Integration von Regelfunktionen
94
Rb
Rb
Rb
Damit ist a (λf + µg) = λ a f + λ a g. Sei nun ε > 0; da die Folge {fn }n≥1
Rb
Rb
gleichmäßig gegen f konvergiert und a f = limn→∞ a fn , gibt es ein m ≥ 1, so
Rb
Rb
dass |f (x) − fm (x)| < ε/2(b − a) für alle x ∈ I und | a f − a fm | < ε/2. Daraus
ergibt sich, dass
Z b Z b f < fm + ε/2 ≤ (b − a)||fm || + ε/2
a
a
≤ (b − a) ||f || + ε/2(b − a) + ε/2 = (b − a)||f || + ε
Rb
und daher ist | a f | ≤ (b − a)||f ||.
Lemma 12.5 Das Produkt f g von Regelfunktionen f, g ∈ R(I, K) ist wieder
eine Regelfunktion.
Beweis Setze c = ||f || + ||g|| + 1 und sei ε > 0; dann gibt es Treppenfunktionen
u, v ∈ T(I, K) mit ||f − u|| ≤ min{ε/c, 1} und ||g − v|| ≤ ε/c. Nun ist uv eine
Treppenfunktion und für alle x ∈ I gilt
|f (x)g(x) − u(x)v(x)| = |(f (x) − u(x))g(x) + (g(x) − v(x))u(x)|
≤ |f (x) − u(x)||g(x)| + |g(x) − v(x)|u(x)| ≤ ||f − u|| · ||g|| + ||g − v|| · ||u||
≤ ||f − u|| · ||g|| + ||g − v|| · (||f || + ||f − u||)
≤ ||f − u|| · ||g|| + ||g − v|| · (||f || + 1) ≤ ε .
Damit ist ||f g − uv|| ≤ ε, und dies zeigt, dass f g eine Regelfunktion ist.
Lemma 12.6 Sind f, g ∈ R(I, R) reelle Regelfunktionen mit f ≤ g (d.h., mit
Rb
Rb
f (x) ≤ g(x) für alle x ∈ I), so ist a f ≤ a g.
Beweis Setze h = g − f und sei ε > 0; dann gibt es eine Treppenfunktion
u ∈ T(I, R) mit ||h − u|| ≤ ε/(b − a). Setze nun v = max{u, 0}; dann ist auch
v ∈ T(I, R) und ||h − v|| ≤ ε/(b − a), da |h(x) − v(x)| ≤ |h(x) − u(x)| für alle
Rb
x ∈ I. Aber a v ≥ 0, da v ≥ 0, und damit ist
Z b
Z b
Z b
h≥
(h − v) ≥ − (h − v) ≥ −(b − a)||h − v|| ≥ −ε .
a
Folglich ist
a
Rb
a
a
h ≥ 0 und daher
Rb
a
f≤
Rb
a
g.
Satz 12.7 (Mittelwertsatz der Integralrechnung) Sei f : I → R stetig und
sei g ∈ R(I, R) eine Regelfunktion mit g ≥ 0. Dann gibt es ξ ∈ I, so dass
Z b
Z b
f (x)g(x) dx = f (ξ)
g(x) dx .
a
a
12 Integration von Regelfunktionen
95
Beweis Nach Satz 7.9 und Satz 8.2 ist f (I) ein beschränktes abgeschlossenes
Intervall; es gibt also α, β ∈ R mit α ≤ β, so dass f (I) = [α, β]. Für alle x ∈ I
ist dann αg(x) ≤ f (x)g(x) ≤ βg(x) und daraus folgt nach Lemma 12.6, dass
α
Z
a
b
g(x) dx =
Z
a
b
αg(x) dx ≤
Z
b
a
f (x)g(x) dx ≤
Z
b
βg(x) dx = β
a
Z
b
g(x) dx .
a
Rb
Rb
Rb
Da a g(x) dx ≥ 0, gibt es nun γ ∈ [α, β], so dass a f (x)g(x) dx = γ a g(x) dx.
Aber f (I) = [α, β] und damit gibt es ein ξ ∈ I mit f (ξ) = γ, d.h. mit
Z
b
f (x)g(x) dx = f (ξ)
a
Z
b
g(x) dx .
a
Satz 12.7 wird oft angewendet mit g = 1; in diesem speziellen Fall besagt der
Satz: Sei f : I → R eine stetige Abbildung; dann gibt es ξ ∈ I, so dass
Z b
f (x) dx = f (ξ)(b − a) .
a
Sei U = (a0 , . . . , an ) eine Unterteilung von I und sei S = (ξ1 , . . . , ξn ), wobei
ξk ∈ R mit ξk ∈ [ak−1 , ak ] für jedes k = 1, . . . , n. Dann heißt das Paar Z = (U, S)
eine markierte Unterteilung von I. Die Zahl max{ak − ak−1 : 1 ≤ k ≤ n} wird
dann mit µ(Z) bezeichnet und heißt die Feinheit von Z.
Sei f : I → K eine Abbildung und Z = (U, S) eine markierte Unterteilung von I
mit U = (a0 , . . . , an ) und S = (ξ1 , . . . , ξn ). Dann heißt
S(f, Z) =
n
X
k=1
f (ξk )(ak − ak−1 )
die Riemannsche Summe von f bezüglich Z.
Satz 12.8 Sei f ∈ R(I, K) eine
Regelfunktion. Zu jedem ε > 0 gibt es dann ein
Rb
δ > 0, so dass a f − S(f, Z) < ε für alle markierten Unterteilungen Z von I
mit µ(Z) < δ.
Beweis Zunächst wird der Satz für den speziellen Fall einer Treppenfunktion
bewiesen:
Lemma 12.7 Sei f ∈ T(I,
Zu jedem ε > 0 gibt es
R b K) eine Treppenfunktion.
dann ein δ > 0, so dass a f − S(f, Z) < ε für alle markierten Unterteilungen
Z von I mit µ(Z) < δ.
12 Integration von Regelfunktionen
96
Beweis Da f beschränkt ist, gibt es M ≥ 0, so dass |f (x)| ≤ M für alle x ∈ I;
sei V = (b0 , . . . , bm ) eine Unterteilung für f . Sei nun Z = (U, S) eine markierte
Unterteilung von I mit U = (a0 , . . . , an ) und S = (ξ1 , . . . , ξn ). Definiere eine
Abbildung g : I → K durch
f (ξk ) , falls x ∈ [ak−1 , ak ) für ein k = 1, . . . , n,
g(x) =
f (b) , falls x = b.
Dann ist g eine Treppenfunktion, U ist eine Unterteilung für g und
Z
Z b
n
X
f (ξk )(ak − ak−1 ) =
g=
g.
S(f, Z) =
U
k=1
a
Für jedes k = 1, . . . , n definiere hk : I → K durch
f (x) − g(x) , falls x ∈ [ak−1 , ak ),
hk (x) =
0,
sonst;
P
dann ist hk eine Treppenfunktion und es gilt nk=1 hk = f − g, da g(b) = f (b).
Sei G = {1 ≤ k ≤ n : bj ∈ [ak−1 , ak ) für ein j = 1, . . . , m}; dann ist |G| ≤ m
und man sieht leicht, dass hk = 0, falls k ∈
/ G. Nach Satz 12.2 ist also
Z b
Z b
Z b
Z b
Z bX
n
XZ b
f − S(f, Z) =
f−
g=
(f − g) =
hk =
hk
a
a
a
a
a k=1
k∈G
a
und daraus ergibt sich, dass
Z b
XZ b X
f − S(f, Z) ≤
2M(ak − ak−1 ) ≤ 2Mmµ(Z) .
hk ≤
a
k∈G
a
k∈G
R b
Folglich ist a f − S(f, Z) < ε für alle markierten Unterteilungen Z von I mit
µ(Z) < ε/(2Mm).
Beweis für Satz 12.8: Sei f ∈ R(I, K) eine Regelfunktion und ε > 0. Dann
gibt es eine Treppenfunktion g ∈ T(I, K) mit ||f − g||
≤ ε/3(b − a) und nach
Rb
Lemma 12.7 gibt es ein δ > 0, so dass a g − S(g, Z) < ε/3 für alle markierten
Unterteilungen Z von I mit µ(Z) < δ. Sei nun Z eine markierte Unterteilung
von I mit µ(Z) < δ. Dann gilt
Z b
Z b
Z b
f − S(f, Z) ≤ (f − g) + g − S(g, Z) + S(g − f, Z)
a
a
a
< ||f − g||(b − a) + ε/3 + ||f − g||(b − a) = ε ,
da |S(h, Z)| ≤ ||h||(b − a) für alle h ∈ B(I, K).
12 Integration von Regelfunktionen
97
Lemma 12.8 Sei f ∈ R(I, K), seien c, d ∈ I mit c < d und setze J = [c, d].
Dann ist die Einschränkung fJ von f auf J eine Regelfunktion.
Beweis Sei ε > 0; es gibt also g ∈ T(I, K) mit ||f − g|| < ε. Aber dann is die
Einschränkung gJ von g auf J eine Treppenfunktion und ||fJ −gJ || ≤ ||f −g|| < ε.
Damit ist fJ eine Regelfunktion.
13
Integration und Differentiation
Im Folgenden sei I ein beliebiges Intervall, das mehr als einen Punkt enthält.
Eine Abbildung f : I → K heißt nun Regelfunktion, wenn für alle c, d ∈ I mit
c < d die Einschränkung f[c,d] von f auf [c, d] ein Element von R([c, d], K) ist.
Wenn I = [a, b], so stimmt diese Definition nach Lemma 12.8 mit der Definition
in Kapitel 12 überein.
Die Menge aller Regelfunktionen f : I → K wird mit R(I, K) bezeichnet. Nach
Satz 12.3 ist R(I, K) ein Untervektorraum von Abb(I, K). (Man merke aber, dass
Regelfunktionen im Allgemeinen nicht beschränkt sind.) Da die Einschränkung
einer stetigen Abbildung wieder stetig ist, ist jede stetige Abbildung f : I → K
eine Regelfunktion. Genauso sind monotone Abbildungen von I nach R Regelfunktionen.
Rb
Sei f ∈ R(I, K) und seien a, b ∈ I mit a < b. Dann schreibt man fast immer a f
Rb
statt a f[a,b] für das Integral von f[a,b] .
Lemma 13.1 Für jedes f ∈ R(I, K) und alle a, c, b ∈ I mit a < c < b ist
Z
b
f=
a
Z
c
f+
a
Z
b
f.
c
Beweis Sei {gn }n≥p eine Folge von Treppenfunktionen aus T([a, b], K), die gleichmäßig gegen f[a,b] konvergiert. Dann ist {(gn )[a,c] }n≥p (bzw. {(gn )[c,b] }n≥p ) eine
Folge aus T([a, c], K) (bzw. aus T([c, b], K)), die gleichmäßig gegen f[a,c] (bzw.
Rb
Rc
Rb
gegen f[c,b] ) konvergiert. Ferner ist es klar, dass a gn = a gn + c gn für alle
n ≥ p, und daraus ergibt sich, dass
Z b
Z b
Z c
Z b
Z c
Z b
f = lim
gn = lim
gn + lim
gn =
f+
f.
a
n→∞
a
n→∞
n→∞
a
Für f ∈ R(I, K) ist es nützlich, das ‘Integral’
Z
b
a
f =−
Z
a
c
Rb
a
a
c
f durch
f
b
zu definieren, falls a, b ∈ I mit b < a. Für jedes a ∈ I setzt man schließlich
Z a
f =0.
a
98
13 Integration und Differentiation
99
Lemma 13.2 Sei f ∈ R(I, K); für alle a, b, c ∈ I gilt dann
Z b
Z c
Z b
f=
f+
f.
a
a
c
Beweis Übung.
Ist K = C, so wird I stets als Teilmenge von C betrachtet.
Satz 13.1 Sei f ∈ R(I, K), a ∈ I und definiere eine Abbildung F : I → K durch
Z x
F (x) =
f (t) dt .
a
Ist f an der Stelle b ∈ I stetig, so ist F im Punkt b differenzierbar, und es gilt
F ′ (b) = f (b).
Beweis Sei c ∈ I mit c > b; dann gilt
Z
Z b 1 c
F (c) − F (b)
− f (b) =
f−
f − f (b)
c−b
c−b a
a
Z c
Z
Z c
1
1 c
=
f (t) dt − f (b) =
f (t) dt −
f (b) dt
c−b b
c−b b
b
Z c
1
=
(f (t) − f (b)) dt
c−b b
und daraus ergibt sich, dass
F (c) − F (b)
≤ ||(f − f (b))[b,c]|| = sup{|f (x) − f (b)| : b ≤ x ≤ c} .
−
f
(b)
c−b
Ist dagegen d ∈ I mit d < b, so gilt genauso, dass
F (d) − F (b)
≤ sup{|f (x) − f (b)| : d ≤ x ≤ b} .
−
f
(b)
d−b
Sei nun {xn }n≥p eine Folge aus I \ {b}, die gegen b konvergiert und sei ε > 0. Da
f an der Stelle b stetig ist, gibt es ein δ > 0, so dass |f (x) − f (b)| < ε/2 für alle
x ∈ I mit |x − b| < δ, und dann gibt es ein N ≥ p, so dass |xn − b| < δ für alle
n ≥ N. Für alle n ≥ N ist also
F (xn ) − F (x)
≤ sup{|f (x) − f (b)| : |x − b| < δ} ≤ ε/2 < ε
−
f
(x)
xn − x
und folglich ist limn→∞ (F (xn ) − F (b))/(xn − b) = f (b). Dies zeigt, dass F im
Punkt b differenzierbar ist mit F ′ (b) = f (b).
13 Integration und Differentiation
100
Sei f : I → K eine Abbildung. Eine differenzierbare Abbildung F : I → K heißt
dann Stammfunktion von f , wenn F ′ = f . Nach Satz 13.1 besitzt jede stetige
Abbildung f : I → RK eine Stammfunktion: Wähle einen Punkt a ∈ I; dann ist
x
die Abbildung x 7→ a f (t) dt eine Stammfunktion von f .
Ist F : I → K eine Stammfunktion einer Abbildung f : I → K, so ist F + c auch
eine Stammfunktion von f für jedes c ∈ K, da (F + c)′ = F ′ + 0 = F ′ = f . Die
Umkehrung ist ebenfalls richtig:
Satz 13.2 Sind F und G beide Stammfunktionen einer Abbildung f : I → K, so
ist F − G konstant.
Beweis Setze h = F − G; dann ist h differenzierbar und
h′ = (F − G)′ = F ′ − G′ = f − f = 0 .
Ist K = R, so folgt unmittelbar aus Satz 11.7, dass h konstant ist. Ist dagegen
K = C, so folgt aus Lemma 10.6 und Satz 11.7, dass Re h und Im h konstant
sind, und damit ist h selbt auch konstant.
Beispiele: (1) Seien c0 , . . . , cn ∈ K (mit n ≥ 0) und sei f : I → K gegeben durch
f (x) = c0 + c1 x + c2 x2 + · · · + cn xn .
Dann ist nach Satz 10.6 die Abbildung
1
1
1
x 7→ c0 x + c1 x2 + c2 x3 + · · · +
cn xn+1
2
3
n+1
eine Stammfunktion von f .
(2) Nehme an, dass 0 ∈
/ I und für n ≥ 1 sei gn : I → R gegeben durch
gn (x) =
1
.
xn
Ist n ≥ 2, so ist nach Satz 10.7 die Abbildung
x 7→ −
1
(n − 1)xn−1
eine Stammfunktion von gn . Nach Satz 10.9 ist der natürliche Logarithmus log
eine Stammfunktion von g1 .
(3) Die Exponentialfunktion exp ihre eigene Stammfunktion.
(4) Die Funktion sin ist eine Stammfunktion von cos und die Funktion − cos eine
Stammfunktion von sin.
Das folgende Ergebnis wird Fundamentalsatz der Differential- und Integralrechnung genannt:
13 Integration und Differentiation
101
Satz 13.3 Sei f : I → K eine stetige Abbildung und F : I → K eine Stammfunktion von f . Dann gilt für alle a, b ∈ I
Z b
f (t) dt = F (b) − F (a) .
a
Rx
Beweis Definiere eine Abbildung G : I → K durch G(x) = a f (t) dt. Nach
Satz 13.1 ist G eine Stammfunktion von f , und daraus folgt nach Satz 13.2, dass
G − F konstant ist. Insbesondere ist G(b) − F (b) = G(a) − F (a) und damit ist
Z b
Z a
Z b
F (b) − F (a) = G(b) − G(a) =
f (t) dt −
f (t) dt =
f (t) dt .
a
a
a
Im folgenden Satz seien a, b ∈ R mit a < b und setze J = [a, b].
Satz 13.4 (Substitutionsregel) Sei f : I → K stetig und sei g : J → R eine
stetig differenzierbare Abbildung mit g(J) ⊂ I. Dann gilt
Z b
Z g(b)
′
f (g(t))g (t) dt =
f (x) dx .
a
g(a)
Beweis Sei F : I → K eine Stammfunktion von f . Nach der Kettenregel ist dann
die zusammengesetzte Abbildung F ◦ g : J → K differenzierbar und
(F ◦ g)′(t) = F ′ (g(t))g ′(t) = f (g(t))g ′(t)
für alle t ∈ J. Daraus ergibt sich nach Satz 13.3, dass
Z b
Z b
′
f (g(t))g (t) dt =
(F ◦ g)′ (t) dt
a
a
= (F ◦ g)(b) − (F ◦ g)(a) = F (g(b)) − F (g(a)) =
Z
g(b)
f (x) dx ,
g(a)
da F ◦ g (bzw. F ) eine Stammfunktion von (F ◦ g)′ (bzw. von f ) ist.
√
Beispiel: Nach Satz 13.4 mit f (x) = 1 − x2 und g(t) = sin t ist
Z 1√
Z sin(π/2) √
2
1 − x dx =
1 − x2 dx
−1
sin(−π/2)
=
=
Z
π/2
−π/2
1
2
Z
Z
q
2
1 − sin (t) cos(t) dt =
π/2
−π/2
(1 + cos(2t)) dt =
1π
2 2
π/2
cos2 (t) dt
−π/2
+
π
1
π 1
sin(π) + − sin(−π) = .
2
2 2
2
13 Integration und Differentiation
102
Satz 13.5 (Partielle Integration) Seien f, g : I → K stetig differenzierbare
Abbildungen. Dann gilt für alle a, b ∈ I mit a < b
Z b
Z b
′
f (x)g (x) dx = f (b)g(b) − g(a)g(a) −
g(x)f ′(x) dx .
a
a
Beweis Sei h = f g das Produkt der Abbildungen f und g. Nach der Produktregel
(Satz 10.3 (2)) ist h differenzierbar und h′ (x) = f (x)g ′ (x) + f ′ (x)g(x) für alle
x ∈ I. Damit ist h eine Stammfunktion von f g ′ + f ′ g und daraus folgt nach
Satz 13.3, dass
Z b
Z b
Z b
′
′
f (x)g (x) dx +
f (x)g(x) dx =
(f (x)g ′(x) + f ′ (x)g(x)) dx
a
a
a
= h(b) − h(a) = f (b)g(b) − f (a)g(a) .
Satz 13.6 (Trapezregel) Sei f : I → R zweimal stetig differenzierbar und
seien a, b ∈ I mit a < b. Dann gibt es ξ ∈ [a, b], so dass
Z b
b−a
(b − a)3 ′′
f (x) dx =
(f (a) + f (b)) −
f (ξ) .
2
12
a
Beweis Definere eine Abbildung g : I → R durch g(x) = (x − a)(b − x). Dann
ist g(a) = g(b) = 0, g ′ (x) = a + b − 2x und g ′′ (x) = −2. Durch zweimalige
Anwendung von Satz 13.5 erhält man also, dass
Z b
Z b
′′
′
′
g(x)f (x) dx = g(b)f (b) − g(a)f (a) −
g ′ (x)f ′ (x) dx
a
a
Z b
Z b
′
′
′
′
=−
g (x)f (x) dx = −g (b)f (b) + g (a)f (a) +
g ′′ (x)f (x) dx
a
a
Z b
= (b − a)(f (a) + f (a)) − 2
f (x) dx
a
und daraus ergibt sich, dass
Z
Z b
1 b
b−a
f (a) + f (a) −
(x − a)(b − x)f ′′ (x) dx .
f (x) dx =
2
2
a
a
Aber g(x) = (x − a)(b − x) ≥ 0 für alle x ∈ [a, b], und folglich gibt es nach
Satz 12.11 ein ξ ∈ [a, b], so dass
Z b
Z b
′′
′′
(x − a)(b − x)f (x) dx = f (ξ) (x − a)(b − x) dx
a
a
Z b
Z b−a
′′
′′
= f (ξ)
(x − a)(b − x) dx = f (ξ)
y(b − a − y) dy
a
0
Z b−a
′′
= f (ξ)
(b − a)y − y 2 dy
0
= f ′′ (ξ)
(b − a)
2
(b − a)3
1
(b − a)2 − (b − a)3 =
f ′′ (ξ) .
3
6
13 Integration und Differentiation
103
Satz 13.7 Sei f : I → R zweimal stetig differenzierbar und seien a, b ∈ I mit
a < b. Sei n ∈ N mit n ≥ 1 und setze h = (b − a)/n. Dann ist
Z
!
n−1
b
M
X
1
1
f (x) dx − h
f (a + kh) + f (b) ≤
f (a) +
(b − a)h2 ,
a
12
2
2
k=1
wobei M = sup{|f ′′ (x)| : x ∈ [a, b]}.
Beweis Nach Satz 13.6 ist für jedes k = 0, . . . , n − 1
Z
M
a+(k+1)h
h
f
(a
+
kh)
+
f
(a
+
(k
+
1)h)
h3 ,
f
(x)
dx
−
≤
12
a+kh
2
und daraus ergibt sich, dass
Z
n−1
b
1
X
1
f (a + kh) + f (b) f (x) dx − h f (a) +
a
2
2
k=1
n−1 Z a+(k+1)h
X
h
f (x) dx − f (a + kh) + f (a + (k + 1)h) =
2
a+kh
k=0
Z
n−1 a+(k+1)h
X
h
≤
f (x) dx − f (a + kh) + f (a + (k + 1)h) a+kh
2
≤
k=0
n−1
X
k=0
M 3
M
M
h = n h3 =
(b − a)h2 .
12
12
12
14
Das Riemannsche Integral
Für reellwertige Abbildungen wird manchmal das Riemannsche Integral eingeführt. Dieses ist etwas allgemeiner als das Integral für Regelfunktionen, hat
aber den Nachteil, dass es sich nicht richtig verallgemeinern läßt. Dieses Kapitel
ist für diejenigen, die das Riemannsche Integral kennenlernen wollen.
Sei X eine Menge und f : X → R eine Abbildung. Dann werden Abbildungen
f+ , f− und |f | von X nach R definiert durch
f (x) , falls f (x) > 0,
−f (x) , falls f (x) < 0,
f+ (x) =
f− (x) =
0 , falls f (x) ≤ 0,
0,
falls f (x) ≥ 0,
und |f |(x) = |f (x)| für alle x ∈ X. Dann gilt f+ ≥ 0, f− ≥ 0, f = f+ − f− und
f+ + f− = |f |. Ferner ist f+ = max{f, 0} und f− = max{−f, 0} = − min{f, 0}.
Für jedes A ⊂ X sei χA : X → R die Abbildung, die definiert ist durch
1 , falls x ∈ A,
χA (x) =
0 , falls x ∈
/ A;
χA heißt die charakteristische Funktion von A.
Im Folgenden sei I das Intervall [a, b], wobei a, b ∈ R mit a < b.
Lemma 14.1 (1) Für jedes f ∈ T(I, R) sind f+ , f− und |f | Treppenfunktionen.
(2) Sind f, g ∈ T(I, R), so sind die Abbildungen f g, max{f, g} und min{f, g}
auch Treppenfunktionen.
Beweis Dies ist klar.
Sei
R); nach Lemma 14.1 (2) ist |f | ∈ T(I, R), und nach Satz 12.2 ist
R b f ∈ T(I,
R
f ≤ b |f |, da f ≤ |f | und −f ≤ |f |.
a
a
Lemma 14.2 Sei f : I → R eine beschränkte Abbildung. Dann sind äquivalent:
Rb
Rb
(1) Zu jedem ε > 0 gibt es g, h ∈ T(I, R) mit g ≤ f ≤ h, so dass a h − a g < ε.
(2) Es gibt monotone Folgen {gn }n≥1 und {hn }n≥1 von Treppenfunktionen mit
Rb
Rb
g1 ≤ g2 ≤ · · · ≤ f ≤ · · · ≤ h2 ≤ h1 , so dass lim a gn = lim a hn .
n→∞
(3) Es gilt sup
Rb
a
g : g ∈ T(I, R) mit g ≤ f = inf
104
n→∞
Rb
a
h : h ∈ T(I, R) mit f ≤ h .
14 Das Riemannsche Integral
105
Beweis (2) ⇒ (3) und (3) ⇒ (1) sind klar.
(1) ⇒ (2): Zu jedem n ≥ 1 gibt es nach (1) Treppenfunktionen gn′ , h′n ∈ T(I, R)
Rb
Rb
mit gn′ ≤ f ≤ h′n und a h′n − a gn′ < 1/n. Setze gn = max{gk′ : 1 ≤ k ≤ n} und
hn = min{h′k : 1 ≤ k ≤ n}; nach Lemma 14.1 (2) sind gn , hn ∈ T(I, R) und
g1 ≤ g2 ≤ · · · ≤ f ≤ · · · ≤ h2 ≤ h1 .
Rb
Rb
Ferner ist a hn − a gn < 1/n, da gn′ ≤ gn ≤ hn ≤ h′n , und daraus ergibt sich,
Rb
Rb
dass lim a gn = lim a hn .
n→∞
n→∞
Eine beschränkte Abbildung f : I → R heißt Riemann integrierbar, wenn eine
(und damit alle) der äquivalenten Bedingungen in Lemma 14.2 für f gilt. Die
Menge der Riemann integrierbaren Abbildungen von I nach R wird mit Ri(I)
bezeichnet. Es ist klar, dass T(I, R) ⊂ Ri(I).
Lemma 14.3 Für jedes f ∈ Ri(I) ist −f auch Riemann integrierbar.
Beweis Sei ε > 0; nach Lemma 14.2 (1) gibt es Treppenfunktionen g, h ∈ T(I, R)
Rb
Rb
mit g ≤ f ≤ h, so dass a h − a g < ε. Nach Satz 12.1 sind dann aber −h und
Treppenfunktionen,
Ferner gilt nach Satz 12.2, dass
R−g
Rb
R b und
R b−h ≤R b−f ≤R −g.
b
b
−g − a −h = − a g + a h = a h − a g < ε, und daraus ergibt sich nach
a
Lemma 14.2 (1), dass −f Riemann integrierbar ist.
Satz 14.1 Ri(I) ist ein Untervektorraum von B(I, R).
Beweis Da 0 ∈ T(I, R), ist 0 Riemann integrierbar. Seien f, g ∈ Ri(I) und
λ, µ ∈ R mit λ ≥ 0, µ ≥ 0. Nach Lemma 14.2 (2) gibt es dann monotone Folgen
{sn }n≥1 , {tn }n≥1 , {un }n≥1 und {vn }n≥1 von Treppenfunktionen mit
s1 ≤ s2 ≤ · · · ≤ f ≤ · · · ≤ t2 ≤ t1 und u1 ≤ u2 ≤ · · · ≤ g ≤ · · · ≤ v2 ≤ v1 ,
Rb
Rb
Rb
Rb
so dass limn→∞ a sn = limn→∞ a tn und limn→∞ a un = limn→∞ a vn . Für jedes
n ≥ 1 setze ϕn = λsn + µun und ψn = λtn + µvn . Nach Satz 12.1 sind ϕn und ψn
Treppenfunktionen und ϕ1 ≤ ϕ2 ≤ · · · ≤ λf + µg ≤ · · · ≤ ψ2 ≤ ψ1 ; ferner gilt
nach Satz 12.2 und Satz 5.5, dass
Z b
Z b
Z b
Z b
lim
ϕn = lim
(λsn + µun ) = λ lim
sn + µ lim
un
n→∞ a
n→∞ a
n→∞ a
n→∞ a
Z b
Z b
Z b
Z b
= λ lim
tn + µ lim
vn = lim
(λtn + µvn ) = lim
ψn .
n→∞
a
n→∞
a
n→∞
a
n→∞
a
Daraus folgt nach Lemma 14.2 (2), dass λf + µg Riemann interierbar ist. Dies
zeigt, zusammen mit Lemma 14.3, dass λf + µg Riemann integrierbar ist für alle
f, g ∈ Ri(I) und alle λ, µ ∈ R.
14 Das Riemannsche Integral
106
Lemma 14.4 (1) Die Abbildungen f+ , f− und |f | sind Riemann integrierbar für
jedes f ∈ Ri(I).
(2) Sind f und g Riemann integrierbar, so sind max{f, g} und min{f, g} auch
Riemann integrierbar.
Beweis (1) Sei ε > 0; da f ∈ Ri(I), gibt es g, h ∈ T(I, R) mit g ≤ f ≤ h, so dass
Rb
Rb
h
−
g < ε. Nach Lemma 14.1 (1) sind dann g+ und h+ Treppenfunktionen
a
a
Rb
Rb
und es gilt g+ ≤ f+ ≤ h+ . Ferner ist a h+ − a g+ < ε, da h+ − g+ ≤ h − g,
und dies zeigt, dass f+ Riemann integrierbar ist. Damit sind f− = f+ − f und
|f | = f+ + f− auch Riemann integrierbar.
(2) Dies folgt unmittelbar aus (1) und Satz 14.1, da max{f, g} = 12 (f +g +|f −g|)
und min{f, g} = 21 (f + g − |f − g|).
Lemma 14.5 Das Produkt f g von Riemann integrierbaren Abbildungen f, g ist
Riemann integrierbar.
Beweis Nach Lemma 14.4 (1) sind die Abbildungen f+ , f− , g+ und g− Riemann
integrierbar und f g = (f+ − f− )(g+ − g− ) = f+ g+ + f− g− − f+ g− − f− g+ . Daraus
folgt nach Satz 14.1, dass es genügt, den Satz für den Fall zu beweisen, dass f ≥ 0
und g ≥ 0.
Da f und g beschränkt sind, gibt es N > 0, so dass f (x) ≤ N und g(x) ≤ N
für alle x ∈ I. Sei ε > 0 und setze δ = ε/2N; nach Lemma 14.2 (1) gibt es dann
Rb
Rb
s, t, u, v ∈ T(I, R) mit s ≤ f ≤ t und u ≤ g ≤ v , so dass a t − a s < δ
Rb
Rb
und a v − a u < δ. Da ferner 0 ≤ f ≤ N und 0 ≤ g ≤ N, können nach
Lemma 14.1 (2) s, t, u und v so gewählt werden, dass 0 ≤ s, t ≤ N, 0 ≤ u und
v ≤ N. Nun sind nach Lemma 14.1 (2) su und tv Treppenfunktionen, es gilt
su ≤ f g ≤ tv, da 0 ≤ s ≤ f ≤ t und 0 ≤ u ≤ g ≤ v und nach Satz 12.2 ist
Z b
Z b
Z b
Z b
tv −
su =
(tv − su) =
(tv − tu + tu − su)
a
a
a
a
Z b
Z b
Z b
Z b
=
t(v − u) +
(t − s)u ≤
N(v − u) +
(t − s)N
a
a
a
a
Z b
Z b
Z b Z b
=N
v−
u+
t−
s < 2Nδ = ε .
a
a
a
a
Daraus ergibt sich nach Lemma 14.2 (1), dass f g Riemann integriebar ist.
Satz 14.2 Ist {fn }n≥p eine Folge aus Ri(I), die gleichmäßig gegen f : I → R
konvergiert, so ist f Riemann integrierbar. Insbesondere ist jede Regelfunktion
Riemann integrierbar, d.h., R(I, R) ⊂ Ri(I).
14 Das Riemannsche Integral
107
Beweis Sei ε > 0 und setze η = ε/4(b − a); da {fn }n≥p gleichmäßig gegen f
konvergiert, gibt es ein m ≥ p, so dass |fm (x) − f (x)| < η für alle x ∈ I, und da
Rb
Rb
fm ∈ Ri(I), gibt es u, v ∈ T(I, R) mit u ≤ fm ≤ v, so dass a v − a u < ε/2. Sei
g = u − η, h = v + η; dann sind g und h Treppenfunktionen mit g ≤ f ≤ h, da
g = u − η ≤ fm − η ≤ f ≤ fm + η ≤ v + η = h, und es gilt
Z b
Z b
Z b
Z b
Z b Z b
Z b
h−
g=
(v +η)− (u−η) =
v − u+ 2η < ε/2+2η(b−a) = ε .
a
a
a
a
a
a
a
Damit ist f Riemann integrierbar.
Beispiel: Sei f : I → R die Abbildung, die definiert ist durch
1 , falls x ∈ I ∩ Q,
f (x) =
0 , falls x ∈ I \ Q.
Sind g, h ∈ T(I, R) Treppenfunktionen mit g ≤ f ≤ h, so sieht man leicht, dass
Rb
Rb
Rb
Rb
g ≤ 0 und a h ≥ b − a; insbesondere ist a h − a g ≥ b − a. Folglich ist f
a
nicht Riemann integrierbar.
Es gibt aber Riemann integrierbare Abbildungen, die keine Regelfunktionen sind.
Ein typisches Beispiel ist χC mit C einer Cantor-Menge. (Man siehe: Aufgaben
3 und 4, Blatt 1, Analysis II.)
Lemma 14.6 Für jedes f ∈ Ri(I) gibt es eine eindeutige Zahl κ(f ) ∈ R, so
Rb
Rb
dass a g ≤ κ(f ) für jede Treppenfunktion g ≤ f und a h ≥ κ(f ) für jede
Treppenfunktion h ≥ f .
Beweis Dies folgt unmittelbar aus Lemma 14.2 (3), und es gilt natürlich
Z
b
sup
g : g ∈ T(I, R) mit g ≤ f
a
Z
b
h : h ∈ T(I, R) mit f ≤ h .
= κ(f ) = inf
a
Lemma 14.7 Sei {fn }n≥p eine Folge aus Ri(I), die gleichmäßig gegen f ∈ Ri(I)
konvergiert. Dann konvergiert die Folge {κfn }n≥p gegen κ(f ). Insbesondere ist
Rb
κ(f ) = a f für jede Regelfunktion f ∈ R(I, R).
Beweis Übung.
Sei f ∈ Ri(I); die in Lemma 14.6 definierte Zahl κ(f ) heißt das Riemannsche
Rb
Integral von f und wird mit a f bezeichnet. (Es gibt kein Problem mit dieser
Schreibweise, da nach Lemma 14.7 das Riemannsche Integral für Regelfunktionen
mit dem für Regelfunktionen definierten Integral übereinstimmt.)
14 Das Riemannsche Integral
Lemma 14.8 Für jedes f ∈ Ri(I) ist
Beweis Übung.
Satz 14.3 Die Abbildung f 7→
Z
b
Rb
a
108
Rb
a
−f = −
Rb
f.
a
f von Ri(I) nach R ist linear, d.h.
(λf + µg) = λ
a
Z
b
f +µ
a
Z
b
g
a
für alle f, g ∈ Ri(I) und alle λ, µ ∈ R, und monoton, d.h.
f, g ∈ Ri(I) mit f ≤ g.
Rb
a
f ≤
Rb
a
g, falls
Beweis Seien f, g ∈ Ri(I) und λ, µ ∈ R mit λ ≥ 0, µ ≥ 0. Sei ε > 0 und setze
δ = ε/(λ + µ + 1); nach Lemma 14.2 (1) gibt es dann s, t, u, v ∈ T(I, R) mit
Rb
Rb
Rb
Rb
s ≤ f ≤ t und u ≤ g ≤ v, so dass a t − a s < δ und a v − a u < δ. Nun ist
nach Satz 12.1 λt + µv eine Treppenfunktion und λt + µv ≥ λf + µg. Folglich gilt
Z b
Z b
Z b
Z b
Z b
Z b
(λf + µg) − λ
f −µ
g≤
(λt + µv) − λ
s−µ
u
a
a
a
a
a
a
Z b Z b Z b
Z b
=λ
t−
s +µ
v−
u ≤ λδ + µδ < ε .
a
a
a
a
Aber λs + µu ist auch eine Treppenfunktion, und λs + µu ≤ λf + µg. Also ist
Z b
Z b
Z b
Z b
Z b
Z b
(λf + µg) − λ
f −µ
g≥
(λs + µu) − λ
t−µ
v
a
a
a
a
a
a
Z b Z b Z b
Z b
=λ
s−
t +µ
u−
v ≥ −λδ − µδ > −ε .
a
a
a
a
Rb
Rb
Rb
Daraus ergibt sich, dass a (λf + µg) = λ a f + λ a g. Dies zeigt, zusammen mit
Rb
Rb
Rb
Lemma 14.8, dass a (λf + µg) = λ a f + λ a g für alle f, g ∈ Ri(I) und alle
Rb
λ, µ ∈ R. Die Abbildung f 7→ a f von Ri(I) nach R ist also linear.
Seien nun f, g ∈ Ri(I) mit f ≤ g. Dann ist g − f ∈ Ri(I) und g − f ≥ 0. Aber 0
Rb
Rb
Rb
Rb
ist eine Treppenfunktion und folglich ist 0 = a 0 ≤ a (g − f ) = a g − a f , d.h.
Rb
Rb
f ≤ a g.
a
Sei f ∈ Ri(I) Riemann integrierbar; nach Lemma 14.4 (1) ist dann |f | auch
Riemann integrierbar und nach Satz 14.3 ist (da f ≤ |f | und −f ≤ |f |)
Z b Z b
f ≤
|f | .
a
a
14 Das Riemannsche Integral
109
Satz 14.4 (Mittelwertsatz der Integralrechnung) Sei f : I → R stetig und
sei g ∈ Ri(I) Riemann integrierbar mit g ≥ 0. Dann gibt es ξ ∈ I, so dass
Z
b
f (x)g(x) dx = f (ξ)
a
Z
b
g(x) dx .
a
Beweis Dieser ist identisch mit dem Beweis für Satz 12.7.
Satz 14.5 Sei f ∈ Ri(I) Riemann
integrierbar. Zu jedem ε > 0 gibt es dann ein
Rb
δ > 0, so dass a f − S(f, Z) < ε für alle markierten Unterteilungen Z von I
mit µ(Z) < δ.
Beweis Sei f ∈ Ri(I) und ε > 0. Nach Lemma 14.2 gibt es dann g, h ∈ T(I, R)
Rb
Rb
mit g ≤ f ≤ h, so dass a h − a g < ε/2, und nach Lemma 12.7 gibt es δ > 0,
R b
R b
so dass a g − S(g, Z) < ε/2 und a h − S(h, Z) < ε/2 für alle markierten
Unterteilungen Z von I mit µ(Z) < δ. Sei nun Z eine markierte Unterteilung
von I mit µ(Z) < δ. Es ist dann klar, dass S(g, Z) ≤ S(f, Z) ≤ S(h, Z) und
daraus ergibt sich, dass
Z b
Z b
f − S(f, Z) ≤
h − S(g, Z)
a
a
Z b
Z b
Z b
=
h−
g+
g − S(g, Z) < ε/2 + ε/2 = ε ,
a
a
a
und genauso gilt
Z b
Z b
f − S(f, Z) ≥
g − S(h, Z)
a
a
Z b
Z b
Z b
=
g−
h+
h − S(h, Z) > −ε/2 − ε/2 = −ε .
a
R b
Damit ist a f − S(f, Z) < ε.
a
a
Literatur
[1] Amman, H., Escher, J. (1996): Analysis I. Birkhäuser
[2] Carathéodory, C. (1927): Vorlesungen Über reelle Funktionen. Teubner
[3] Courant, R. (1929): Vorlesungen über Differential- und Integralrechnung.
Springer
[4] Dieudonné, J. (1960): Foundations of Modern Analysis. Academic Press
[5] Forster, O. (1980): Analysis 1. Differential- und Integralrechnung einer
Veränderlichen. vieweg
[6] Forster, O., Wessoly, R. (1986): Übungsbuch zu Analysis 1. wieweg
[7] Hardy, G.H. (1902): A Course of Pure Mathematics. Cambridge University
Press
[8] Königsberger, K. (1999): Analysis 1. Springer
[9] Landau, E. (1930): Grundlagen der Analysis. Chelsea
[10] Lang, S. (1993): Real and Functional Analysis. Springer
(früher: Real Analysis. Addison-Wesley 1968)
[11] Lang, S. (1983): Undergraduate Analysis. Springer
(früher: Analysis I. Addison-Wesley 1968)
[12] Walter, W. (1999): Analysis I. Springer
110
Index
Abbildung, 48
n-mal differenzierbare, 77
n-mal stetig differenzierbare, 77
affine, 68
beschränkte, 89
differenzierbare, 68, 74, 80
gleichmäßig stetige, 59
konvexe, 84
linksseitig differenzierbare, 78
rechtsseitig differenzierbare, 77
Riemann integrierbare, 105
stetige, 49
abgeleitete Größer-Relation, 14
abgeschlossene Menge, 53
Ableitung, 68, 76
linksseitige, 78
rechtsseitige, 78
zweite, 77
absolut konvergente Reihe, 42
Addition, 12
affine Abbildung, 68
angeordneter Körper, 13
Ball
offener, 52
beschränkt, 22, 29
beschränkte Abbildung, 89
beschränkte Folge, 32
Betrag, 16, 28
Cauchy-Folge, 36
Cauchy-Riemannsches Integral, 93
charakteristische Funktion, 104
Cosinus-Funktion, 61
differenzierbare Abbildung, 68, 74, 80
Einheit
imaginäre, 28
Eins, 12
Einselement, 12
erweiterte Zahlengerade, 25
Eulersche Formel, 61
Eulersche Zahl, 45
Exponentialfunktion, 45
Exponentialreihe, 45
Extremum
lokales, 80
Feinheit einer Unterteilung, 95
Folge, 30
beschränkte, 32
konvergente, 30, 54
monoton fallende, 34
monoton wachsende, 34
monotone, 34
streng monoton fallende, 34
streng monoton wachsende, 34
folgenkompakte Menge, 58
Formel
Eulersche, 61
Funktion, 48
charakteristische, 104
Funktionenfolge
gleichmäßig konvergente, 91
geometrische Reihe, 39
gleichmäßig stetige Abbildung, 59
Größer-Relation
abgeleitete, 14
Grenzwert, 30
Häufungspunkt, 67
harmonische Reihe, 40
imaginäre Einheit, 28
Imaginärteil, 28
Infimum, 19
Innere, 80
innerer Punkt, 80
Integral, 90
Cauchy-Riemannsches, 93
111
112
Index
Riemannsches, 107
Intervall, 24
Körper, 12
angeordneter, 13
Körper der reellen Zahlen, 21
Körpererweiterung, 19
ordnungsvollständige, 21
Körperhomomorphismus, 21
Körperisomorphismus, 21
komplexe Zahl
konjugierte, 28
konjugierte komplexe Zahl, 28
konvergente Folge, 30, 54
konvexe Abbildung, 84
Limes, 30
Limes inferior, 37
Limes superior, 37
linear approximierbar, 68
linksseitige Ableitung, 78
Logarithmus
natürlicher, 57
lokales Extremum, 80
lokales Maximum, 80
lokales Minimum, 80
markierte Unterteilung, 95
Maximum, 23
lokales, 80
Menge
abgeschlossene, 53
folgenkompakte, 58
offene, 52
perfekte, 74
Minimum, 23
lokales, 80
monoton fallende Folge, 34
monoton wachsende Folge, 34
monotone Folge, 34
Multiplikation, 12
nach oben beschränkt, 19
nach unten beschränkt, 19
natürlicher Logarithmus, 57
Null, 12
Nullelement, 12
obere Schranke, 19
offene Menge, 52
offener Ball, 52
perfekte Menge, 74
Punkt
innerer, 80
Realteil, 28
rechtsseitige Ableitung, 78
Regelfunktion, 91, 98
Reihe
absolut konvergente, 42
geometrische, 39
harmonische, 40
unendliche, 39
Riemann integrierbar, 105
Riemannsche Summe, 95
Riemannsches Integral, 107
Schranke
obere, 19
untere, 19
Sinus-Funktion, 61
Stammfunktion, 100
stetige Abbildung, 49
Subtraktion, 13
Summe
einer Reihe, 39
Riemannsche, 95
Supremum, 19
Teilfolge, 34
Treppenfunktion, 89
unendliche Reihe, 39
untere Schranke, 19
Unterkörper, 26
Unterteilung, 89
markierte, 95
Index
Verfeinerung einer Unterteilung, 89
Zahlengerade
erweiterte, 25
zweite Ableitung, 77
113

Zugehörige Unterlagen

Lieblingsbeweise - Mathematik, Uni

Achtes Übungsblatt (Abgabe bis Freitag 30.11., 17:00 Uhr)

Blatt 5 - Mathematik, TU Dortmund

Ein Skript für Analysis I

Zugehörige Unterlagen

Produkte

Unterstützung

Ein Skript für Analysis I

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können