Skript zur Vorlesung Mathematik II für Informationswirtschaft

Skript zur Vorlesung
Mathematik II für Informationswirtschaft
Markus Richter
Institut für Angewandte und Numerische Mathematik
Karlsruher Institut für Technologie (KIT)
Sommersemester 2011
Dieses Skript unterliegt dem Urheberrecht und ist ausschließlich für den privaten
Gebrauch bestimmt. Vervielfältigungen jeder Art, auch auszugsweise, sind nur mit
Erlaubnis des Autors gestattet.
Inhaltsverzeichnis
1 Normen und Skalarprodukte
1.1 Normen . . . . . . . . . . . . . . .
1.2 Skalarprodukte . . . . . . . . . . .
1.3 Induzierte Normen . . . . . . . . .
1.4 Orthonormalbasen . . . . . . . . .
1.5 Definitheit symmetrischer Matrizen
2 Grundbegriffe der Analysis
2.1 Folgen und Familien . . . . . .
2.2 Algebren . . . . . . . . . . . . .
2.3 Infimum, Supremum, Minimum
2.4 Monotonie . . . . . . . . . . . .
2.5 Grenzwerte von Folgen . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . . . . . .
. . . . . . . . .
und Maximum
. . . . . . . . .
. . . . . . . . .
3 Topologische Begriffe
3.1 Inneres, Rand und Abschluss von Mengen
3.2 Offene und abgeschlossene Mengen . . . .
3.3 Beschränktheit . . . . . . . . . . . . . . .
3.4 Kompakte Mengen . . . . . . . . . . . . .
3.5 Vollständigkeit . . . . . . . . . . . . . . .
3.6 Zusammenhängende Mengen . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
8
8
14
17
20
25
.
.
.
.
.
30
30
34
37
44
47
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
53
53
56
59
62
65
67
4 Konvergenzbegriffe und Konvergenzkriterien
4.1 Konvergenz reeller Zahlenfolgen . . . . . . . . .
4.2 Konvergenz von Reihen . . . . . . . . . . . . .
4.3 Absolute Konvergenz von Reihen . . . . . . . .
4.4 Punktweise Konvergenz von Funktionenfolgen .
4.5 Gleichmäßige Konvergenz von Funktionenfolgen
4.6 Konvergenz von Potenzreihen . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
70
70
75
82
87
90
93
.
.
.
.
.
99
99
105
111
114
115
5 Stetige Funktionen
5.1 Grenzwerte von Funktionen . . . . . . .
5.2 Stetigkeit . . . . . . . . . . . . . . . . .
5.3 Der Zwischenwertsatz . . . . . . . . . .
5.4 Der Satz vom Minimum und Maximum
5.5 Äquivalenz von Normen . . . . . . . . .
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
INHALTSVERZEICHNIS
6 Differentialrechnung
6.1 Differenzierbarkeit . . . . .
6.2 Der Mittelwertsatz . . . . .
6.3 Stetige Differenzierbarkeit .
6.4 Der Satz von Taylor . . . .
6.5 Partielle Differenzierbarkeit
6.6 Gradient und Hesse–Matrix
6.7 Totale Differenzierbarkeit .
7 Integralrechnung
7.1 Das Lebesgue–Maß . . . . .
7.2 Das Lebesgue–Integral . . .
7.3 Berechnung von Integralen .
7.4 Der Transformationssatz . .
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
119
. 119
. 127
. 131
. 134
. 139
. 147
. 154
.
.
.
.
159
. 159
. 168
. 177
. 186
A Wichtige Resultate
193
Symbolverzeichnis
198
Index
200
4
INHALTSVERZEICHNIS
Vorbemerkungen
Zahlenmengen
Mit N bezeichnen wir die Menge der natürlichen Zahlen. Die Menge N enthält die Zahl
1 und mit jeder Zahl n auch die Zahl n + 1, d.h. N = {1, 2, 3, . . . }. Die Zahl 0 ist in der
Menge N nicht enthalten. Wir definieren daher die Menge N0 := N ∪ {0}.
Mit Z bezeichnen wir die Menge der ganzen Zahlen, mit Q die Menge der rationalen
Zahlen und mit R die Menge der reellen Zahlen. Mit C bezeichnen wir schließlich die
Menge der komplexen Zahlen. Für jede komplexe Zahl z ∈ C existieren zwei eindeutig
bestimmte reelle Zahlen x = <(z) ∈ R und y = =(z) ∈ R, so dass z = x + yi gilt, wobei i
die imaginäre Einheit bezeichnet. Die imaginäre Einheit erfüllt die Gleichung i2 = −1.
In den folgenden Kapiteln verwenden wir das Symbol K als Platzhalter für R oder C.
Der Ausdruck α ∈ K besagt also, dass α entweder eine reelle oder eine komplexe Zahl ist.
Betrags- und Signumfunktion
Die reelle Betragsfunktion R → R, x 7→ |x| ist durch
(
x falls x ≥ 0,
|x| :=
−x falls x < 0
für alle x ∈ R definiert.
Ist x ∈ R eine reelle Zahl, so heißt |x| der Betrag von x. Man kann
√
2
zeigen, dass |x| = x für alle x ∈ R gilt.
Die Signum- oder Vorzeichenfunktion sgn : R → R ist durch


 1 falls x > 0,
sgn(x) :=
0 falls x = 0,


−1 falls x < 0
für alle x ∈ R definiert. Ist x ∈ R eine reelle Zahl, so heißt sgn(x) das Vorzeichen von x.
Für jede reelle Zahl x ∈ R gilt x = sgn(x)|x|.
Die komplexe Betragsfunktion C → R, z 7→ |z| ist durch
p
|z| := <(z)2 + =(z)2
für alle z ∈ C definiert.
Man rechnet leicht nach, dass für jede komplexe Zahl z ∈ C die
√
Identität |z| = zz gilt, wobei z := <(z) − =(z)i die konjugierte komplexe Zahl zu z
bezeichnet.
Intervalle
Seien a, b ∈ R zwei reelle Zahlen. Dann nennt man die Mengen
(a, b) := {x ∈ R | a < x < b},
[a, b] := {x ∈ R | a ≤ x ≤ b},
(a, b] := {x ∈ R | a < x ≤ b},
[a, b) := {x ∈ R | a ≤ x < b},
(−∞, b) := {x ∈ R | x < b},
INHALTSVERZEICHNIS
5
(−∞, b] := {x ∈ R | x ≤ b},
(a, ∞) := {x ∈ R | a < x},
[a, ∞) := {x ∈ R | a ≤ x}
(reelle) Intervalle. Insbesondere wird die Menge (a, b) ein offenes Intervall und die Menge
[a, b] ein abgeschlossenes Intervall genannt. Die Intervalle (a, b), (a, b] und [a, b) sind genau
dann nichtleere Mengen, wenn a < b gilt. Ein abgeschlossenes Intervall [a, b] ist genau
dann nichtleer, wenn a ≤ b gilt. Im Fall a = b gilt [a, b] := {a}. Die Zahlen a und b werden
auch als Intervallgrenzen bezeichnet. Gelegentlich wird auch die Menge der reellen Zahlen
R durch (−∞, ∞) als Intervall dargestellt.
Vektoren und Matrizen
Ist n ∈ N eine natürliche Zahl und x ∈ Kn ein Vektor, dann bezeichnen wir mit xi oder mit
(x)i die i-te Komponente von x, wobei i ∈ {1, 2, . . . , n} gelte. Es gilt also ganz allgemein
 
x1
 x2 
 
x =  . .
 .. 
xn
Für einen Vektor x mit den Komponenten x1 , x2 , . . . , xn wählen wir gelegentlich auch die
etwas kompaktere Darstellung (x1 , x2 , . . . , xn )T .
Sind m ∈ N und n ∈ N zwei natürliche Zahlen, und ist A ∈ Km×n eine Matrix mit m
Zeilen und n Spalten über K, dann bezeichnen wir mit Aij oder (A)ij die Komponente in
der i-ten Zeile und der j-ten Spalte von A, wobei i ∈ {1, 2, . . . , m} und j ∈ {1, 2, . . . , n}
gelte. Es gilt also ganz allgemein


A11 A12 . . . A1n
 A21 A22 . . . A2n 


A= .
..
..  .
 ..
.
. 
Am1 Am2 . . . Amn
Mit AT bezeichnen wir die transponierte Matrix zu einer Matrix A ∈ Rm×n . Es gilt dann
AT ∈ Rn×m und (AT )ij = Aji für alle i = 1, 2, . . . , n und alle j = 1, 2, . . . , m.
Vektorwertige Funktionen
Sei X eine nichtleere Menge und m ∈ N eine natürliche Zahl. Dann heißt eine Funktion
f : X → Km eine vektorwertige Funktion. Für jeden Index i ∈ {1, 2, . . . , m} bezeichnen
wir dann mit fi oder (f )i die i-te Komponente von f . Die i-te Komponente von f ist dabei
die Funktion fi : X → K, welche durch fi (x) := (f (x))i für alle x ∈ X definiert ist. Man
betrachte hierzu folgendes Beispiel: Die vektorwertige Funktion γ : [0, 2π] → R2 sei durch
cos(t)
γ(t) :=
sin(t)
für alle t ∈ [0, 2π] definiert. Die beiden Komponenten γ1 : [0, 2π] → R und γ2 : [0, 2π] → R
sind dann durch γ1 (t) = cos(t) und γ2 (t) = sin(t) für alle t ∈ [0, 2π] gegeben.
6
INHALTSVERZEICHNIS
Gruppen
Sei G eine nichtleere Menge. Unter einer Verknüpfung auf G versteht man eine Funktion
G × G → G, (g, h) 7→ g ∗ h, welche man mit ∗ bezeichnet. Ein Element e ∈ G heißt
neutrales Element bezüglich ∗, wenn g ∗ e = e ∗ g = g für alle g ∈ G gilt. Sind ferner g ∈ G
und h ∈ G zwei Elemente für die g ∗ h = h ∗ g = e gilt, so heißt h das inverse Element
zu g bezüglich ∗. Man bezeichnet das Element h dann mit g −1 . Die Verknüpfung ∗ wird
assoziativ genannt, wenn (g ∗ h) ∗ i = g ∗ (h ∗ i) für alle g, h, i ∈ G gilt. Falls g ∗ h = h ∗ g
für alle g, h ∈ G gilt, nennt man die Verknüpfung kommutativ.
Eine nichtleere Menge G wird eine Gruppe bezüglich einer Verknüfung ∗ auf G genannt, wenn die Verknüpfung ∗ assoziativ ist, wenn ein neutrales Element bezüglich der
Verknüpfung ∗ existiert, und wenn für jedes Element von G ein inverses Element bezüglich
der Verknüpfung ∗ existiert. Ist die Verknüpfung ∗ zusätzlich kommutativ, so spricht man
von einer kommutativen Gruppe.
Die Mengen Z, Q, R und C sind beispielsweise kommutative Gruppen bezüglich der
Addition. Das neutrale Element ist dabei die Zahl 0, und zu jeder Zahl z ist −z das inverse
Element. Für jede natürliche Zahl n ∈ N mit n ≥ 2 ist die Menge der regulären (n × n)Matrizen über R eine nichtkommutative Gruppe bezüglich der Matrixmultiplikation. Das
neutrale Element ist hierbei die n-zeilige Einheitsmatrix 1n . Das zu einer regulären Matrix
A ∈ Rn×n inverse Element ist die so genannte inverse Matrix A−1 .
Körper
Sei K eine Menge, auf der zwei Verknüpfungen K × K → K, (k, l) 7→ k ⊕ l und K × K →
K, (k, l) 7→ k l definiert sind, so dass K und K \ {0} kommutative Gruppen bezüglich
⊕ bzw. sind. Hierbei bezeichne 0 das neutrale Element bezüglich der Verknüpfung ⊕.
Die Menge K wird ein Körper bezüglich ⊕ und genannt, wenn außerdem k (l ⊕ m) =
(k l) ⊕ (k m) für alle k, l, m ∈ K gilt. Die Verknüpfung ⊕ nennt man üblicherweise die
Addition auf K, und die Verknüpfung nennt man die Multiplikation auf K.
Die Mengen Q, R und C sind Körper bezüglich der gewöhnlichen Addition + und der
gewöhnlichen Multiplikation · .
Vektorräume
Sei K ein Körper. Eine nichtleere Menge V heißt ein Vektorraum über K, wenn zwei
Verknüpfungen V × V → V, (v, w) 7→ v + w und K × V → V, (α, v) 7→ α · v existieren, so
dass V bezüglich der Verknüpfung + eine kommutative Gruppe ist, und sowohl α·(v+w) =
(α · v) + (α · w) als auch α · (β · v) = (αβ) · v für alle v, w ∈ V und alle α, β ∈ K gilt.
Die Verknüpfung + nennt man dann die Addition oder Vektoraddition auf V , und die
Verknüpfung · nennt man die skalare Multiplikation auf V . Die Elemente von V werden
ganz allgemein als Vektoren bezeichnet. Die Elemente des Körpers K nennt man auch
Skalare. Eine Menge U ⊆ V wird Untervektorraum von V genannt, wenn U selbst ein
Vektorraum ist.
Man nennt eine endliche Anzahl von Vektoren v1 , v2 , . . . , vn ∈ V linear unabhängig,
wenn für alle α1 , α2 , . . . , αn ∈ K aus α1 v1 + α2 v2 + · · · + αn vn = 0 stets α1 = α2 = · · · =
αn = 0 folgt. Andernfalls werden die Vektoren linear abhängig genannt.
Eine Menge linear unabhängiger Vektoren {v1 , v2 , . . . , vn } wird eine Basis von V genannt, wenn für jeden Vektor v ∈ V eindeutig bestimmte Skalare α1 , α2 , . . . , αn ∈ K
existieren, so dass v = α1 v1 + α2 v2 + . . . + αn vn gilt. Existiert für einen Vektorraum V eine
solche Basis {v1 , v2 , . . . , vn }, so heißt der Vektorraum endlichdimensional. Die natürliche
INHALTSVERZEICHNIS
7
Zahl n ∈ N nennt man dann auch die Dimension von V , und bezeichnet sie mit dim(V ).
Ein endlichdimensionaler Vektorraum der Dimension n wird auch n-dimensional genannt.
Für jede natürliche Zahl n ∈ N ist die Menge Rn ein n-dimensionaler Vektorraum
über R. Die Menge Cn ist ein n-dimensionaler Vektorraum über C. Jeweils zwei Vektoren
x, y ∈ Kn sind genau dann linear abhängig, wenn ein α ∈ K existiert, so dass y = αx gilt.
Lineare Funktionen
Seien V und W zwei Vektorräume über demselben Körper K. Eine Funktion f : V → W
wird linear genannt, wenn f (v+w) = f (v)+f (w) und f (αv) = αf (v) für alle v, w ∈ V und
alle α ∈ K gilt. Das Bild Bild(f ) := {w ∈ W | ∃v ∈ V : f (v) = w} einer linearen Funktion
f : V → W ist ein Untervektorraum von W , und der Kern Kern(f ) := {v ∈ V | f (v) = 0}
ist ein Untervektorraum von V . Sind die Vektorräume V und W endlichdimensional, so
gilt darüber hinaus die Gleichung dim(Bild(f )) + dim(Kern(f )) = dim(V ). Eine lineare
Funktion f ist genau dann injektiv, wenn Kern(f ) = {0} gilt.
Für je zwei natürliche Zahlen m ∈ N und n ∈ N ist eine Funktion f : Rn → Rm genau
dann linear, wenn eine Matrix A ∈ Rm×n existiert, so dass f (x) = Ax für alle x ∈ Rn gilt.
Äquivalenz- und Ordnungsrelationen
Sei X eine nichtleere Menge. Unter einer (zweistelligen) Relation auf X versteht man eine
Teilmenge R von X × X. Sind x, y ∈ X zwei Elemente, für die (x, y) ∈ R gilt, so sagt
man, dass zwischen x und y die Relation R besteht und schreibt x R y. Eine Relation
R auf X wird reflexiv genannt, wenn x R x für alle x ∈ X gilt. Die Relation R heißt
symmetrisch, wenn für alle x, y ∈ X aus x R y stets auch y R x folgt. Die Relation heißt
antisymmetrisch, wenn für alle x, y ∈ X aus x R y und y R x stets x = y folgt. Schließlich
wird eine Relation R auf X transitiv genannt, wenn für alle x, y, z ∈ X aus x R y und
y R z stets auch x R z folgt.
Eine Relation reflexive, symmetrische und transitive Relation heißt Äquivalenzrelation.
Ist ∼ eine Äquivalenzrelation auf einer nichtleeren Menge X, so nennt man für jedes
Element x ∈ X die Menge [x]∼ := {y ∈ X | x ∼ y} die Äquivalenzklasse von x bezüglich
∼. Die Menge aller Äquivalenzklassen wird die Faktormenge bezüglich ∼ genannt und mit
X/ ∼ bezeichnet.
Auf jeder nichtleeren Menge ist die Relation = ( ist gleich“) eine Äquivalenzrelation.
”
Die Relation k ( ist parallel zu“) ist eine Äquivalenzrelation auf der Menge aller Geraden
”
in R2 .
Eine reflexive, antisymmetrische und transitive Relation heißt Ordnungsrelation. Eine
Ordnungsrelation auf einer nichtleeren Menge X wird Totalordnung genannt, wenn für
je zwei Elemente x, y ∈ X stets x y oder y x gilt.
Die Relation ≤ ( ist kleiner oder gleich“) ist eine Totalordnung auf N, Z, Q und R. Die
”
Relation ⊆ ( ist Teilmenge von“) ist eine Ordnungsrelation, jedoch keine Totalordnung auf
”
P(R), der Potenzmenge von R. Die Potenzmenge P(X) zu einer Menge X ist dabei als
die Menge aller Teilmengen von X definiert.
Kapitel 1
Normen und Skalarprodukte
1.1
Normen
Definition (Norm). Sei V ein Vektorraum über K. Eine Funktion
V → R,
v 7→ kvk
heißt eine Norm auf V , wenn sie die nachfolgenden vier Eigenschaften erfüllt:
(1) Nichtnegativität: Für alle v ∈ V gilt kvk ≥ 0.
(2) Definitheit: Für alle v ∈ V gilt kvk = 0 ⇐⇒ v = 0.
(3) Homogenität: Für alle v ∈ V und alle α ∈ K gilt
kαvk = |α| kvk.
(4) Dreiecksungleichung: Für alle v, w ∈ V gilt
kv + wk ≤ kvk + kwk.
Es ist allgemein üblich, eine Norm V → R, v 7→ kvk vereinfachend mit k · k zu bezeichnen.
Da eine solche Norm eine Funktion von V nach R ist, kann man sie auch als
k·k : V → R
in Funktionsschreibweise darstellen. Der Punkt deutet hierbei die Stelle der Variable an.
Ist v ∈ V ein beliebiger Vektor, so nennt man die reelle Zahl kvk üblichweise die Norm
von v. Der Begriff Norm“ wird also sowohl als Bezeichnung für die Funktion k · k als auch
”
für einzelne Funktionswerte von k · k verwendet. Nachfolgend geben wir einige wichtige
Beispiele für Normen an.
Beispiele.
(a) Die reelle Betragsfunktion R → R, a 7→ |a| ist eine Norm auf R.
(b) Die komplexe Betragsfunktion C → R, z 7→ |z| ist eine Norm auf C.
8
1.1. NORMEN
9
(c) Für jede natürliche Zahl n ∈ N definiert man auf dem Vektorraum Rn die so genannte
euklidische Norm | · | : Rn → R durch
n
X
|x| :=
!1/2
x2i
=
q
x21 + x22 + . . . + x2n
i=1
für alle x = (x1 , x2 , . . . , xn )T ∈ Rn . Die euklidische Norm auf Rn wird gelegentlich
auch als die Standardnorm auf Rn bezeichnet.
Man beachte, dass für n√= 1 die euklidische Norm genau der Betragsfunktion auf
R = R1 entspricht, da x2 = |x| für alle x ∈ R gilt. Die euklidische Norm kann
also als Verallgemeinerung der Betragsfunktion angesehen werden, weshalb wir auch
Betragsstriche zur Kennzeichnung dieser Norm verwenden. Im Mathematikunterricht
der Oberstufe wird die euklidische Norm eines Vektors im R3 als der Betrag des
”
Vektors“ eingeführt.
(d) Für jede natürliche Zahl n ∈ N definiert man auf dem Vektorraum Cn die so genannte
Standardnorm | · | : Cn → R durch
|x| :=
n
X
!1/2
2
|xi |
=
p
|x1 |2 + |x2 |2 + . . . + |xn |2
i=1
für alle x = (x1 , x2 , . . . , xn )T ∈ Cn .
Für n = 1 entspricht die Standardnorm auf Cn genau der komplexen Betragsfunktion.
(e) Für jede natürliche Zahl n ∈ N definiert man auf Kn die so genannte Betragssummennorm k · k1 : Kn → R durch
kxk1 :=
n
X
|xi | = |x1 | + |x2 | + . . . + |xn |
i=1
für alle x = (x1 , x2 , . . . , xn )T ∈ Kn . Die Betragssummennorm wird gelegentlich auch
als Einsnorm bezeichnet.
(f) Für jede natürliche Zahl n ∈ N definiert man auf Kn die so genannte Maximumnorm
k · k∞ : Kn → R durch
kxk∞ := max |xi | = max |x1 |, |x2 |, . . . , |xn |
i=1,...,n
für alle x = (x1 , x2 , . . . , xn)T ∈ Kn . Hierbei bezeichnet
max |x1 |, |x2 |, . . . , |xn | das
größte Element der Menge |x1 |, |x2 |, . . . , |xn | . Die Maximumnorm wird gelegentlich
auch als Tschebyschev–Norm oder als Unendlichnorm bezeichnet.
(g) Für jede natürliche Zahl n ∈ N und jede reelle Zahl p ≥ 1 definiert man auf dem
Vektorraum Rn die so genannte p-Norm k · kp : Kn → R durch
kxkp :=
n
X
!1/p
|xi |p
i=1
für alle x = (x1 , x2 , . . . , xn )T ∈ Kn .
=
q
p
|x1 |p + |x2 |p + . . . + |xn |p
10
KAPITEL 1. NORMEN UND SKALARPRODUKTE
Abbildung 1.1: Die Bedeutung der Dreiecksungleichung: Der Abstand zwischen v und
w ist stets kleiner oder gleich der Summe der Abstände zwischen v und u sowie zwischen
u und w.
Für p = 1 entspricht die p-Norm genau der Betragssummennorm, und für p = 2
genau der euklidischen Norm auf Rn bzw. der Standardnorm auf Cn . Die Betragssummennorm, die euklidische Norm auf Rn und die Standardnorm auf Cn sind also
spezielle p-Normen.
(h) Sei n ∈ N eine natürliche Zahl, und sei w = (w1 , w2 , . . . , wn )T ∈ Rn ein Vektor mit
positiven Komponenten, d.h. es gelte wi > 0 für alle i = 1, 2, . . . , n. Dann ist die
Abbildung k · kw : Rn → R, definiert durch
!1/2 q
n
X
kxkw :=
wi x2i
= w1 x21 + w2 x22 + . . . + wn x2n
i=1
für alle x = (x1 , x2 , . . . , xn )T ∈ Rn , eine Norm auf Rn .
Man beachte, dass für w = (1, 1, . . . , 1)T die Norm k · kw genau der euklidischen
Norm entspricht.
♦
Definition (normierter Raum). Sei V ein Vektorraum über K, und sei k · k eine Norm
auf V . Dann heißt das Paar (V, k · k) ein normierter Raum über K.
Der Begriff normierter Raum“ ist ähnlich allgemein wie der Begriff Gruppe“ oder der
”
”
Begriff Vektorraum“. Die Aussage, dass ein Paar (V, k · k) ein normierter Raum über K
”
ist, bedeutet nicht mehr und nicht weniger als dass V ein Vektorraum über K ist, und
dass k · k eine Norm auf V ist. Man sagt auch, dass der Vektorraum V mit der Norm k · k
versehen und so zum normierten Raum (V, k · k) wird.
In der Regel gibt es eine Vielzahl unterschiedlicher Normen, mit denen ein gegebener
Vektorraum versehen werden kann. Man betrachte dazu etwa die zuvor genannten Beispiele. Für manche Vektorräume ist es jedoch in gewisser Weise natürlich“, diese mit einer
”
ganz bestimmten Norm zu versehen. Das gilt auch für die Vektorräume Rn , n ∈ N, für die
man die folgende Vereinbarung trifft.
Vereinbarung. Ist nichts gegenteiliges ausgesagt, so ist für alle n ∈ N der Vektorraum
Rn mit der euklidischen Norm versehen.
Wir wenden uns nun einigen Begriffen zu, die man in einem normierten Raum definieren
kann. Ist (V, k · k) ein normierter Raum über K, so kann man auf V den Abstand d(v, w)
zwischen je zwei Vektoren v, w ∈ V gemäß
d(v, w) := kw − vk
1.1. NORMEN
(a)
11
(b)
(c)
Abbildung 1.2: (a) Die offene Kugel Br (v) in R2 bezüglich der euklidischen Norm. (b)
Die abgeschlossene Kugel Br (v) in R2 bezüglich der euklidischen Norm. (c) Die Sphäre
Sr (v) in R2 bezüglich der euklidischen Norm.
definieren. Aufgrund der Nichtnegativität der Norm k · k, ist der Abstand zwischen zwei
beliebigen Vektoren stets größer oder gleich Null. Aufgrund der Definitheit von k · k beträgt
der Abstand zwischen zwei Vektoren genau dann Null, wenn die beiden Vektoren identisch
sind. Die Homogenität von k · k garantiert außerdem, dass d(v, w) = d(w, v) für alle v, w ∈
V gilt. Die Dreiecksungleichung impliziert schließlich, dass
d(v, w) ≤ d(v, u) + d(u, w)
für alle Vektoren u, v, w ∈ V gilt. Anschaulich bedeutet dies, dass die Länge der Verbindungsstrecke zwischen den Punkten“ v und w stets kleiner oder gleich groß ist wie die
”
Summe der Längen zweier Verbindungsstrecken, welche den Punkt v bzw. den Punkt w
mit einem beliebigen dritten Punkt u verbinden. Die Verbindungsstreck zwischen v und
w gibt also den kürzesten Weg zwischen beiden Punkten an.
Man beachte, dass die hier diskutierten Eigenschaften des Abstandes zwischen zwei
Vektoren oder Punkten unabhängig von der Norm gelten, durch die der Abstand definiert
ist. Die Norm bestimmt lediglich die Größe des Abstandes zwischen zwei gegebenen Vektoren. Es zeigt sich, dass in den Vektorräumen R1 , R2 und R3 der Abstand, welchen man
für die euklidische Norm erhält, genau dem geometrischen Abstand entspricht. Dies ist mit
ein Grund dafür, weshalb man zu gegebenem n ∈ N den Vektorraum Rn standardmäßig
mit der euklidischen Norm versieht.
Betrachtet man zu einem vorgegebenen Punkt x ∈ R2 sowie zu einer vorgegebenen
Zahl r > 0 die Menge aller Punkte, deren Abstand (bezüglich der euklidischen Norm) zum
Punkt x kleiner oder gleich r ist, so stellt man fest, dass diese Menge eine Kreisscheibe
mit Mittelpunkt x und Radius r ist. Im Vektorraum R3 ist eine solche Menge eine Kugel
mit Mittelpunkt x und Radius r. Man kann also Kreisscheiben und Kugeln anhand von
Abständen zwischen Punkten in R2 und R3 definieren. In gleicher Weise kann man auch
in beliebigen normierten Räumen so genannte Kugeln definieren.
Definition (offene Kugel). Sei (V, k · k) ein normierter Raum. Zu jedem Vektor v ∈ V
und jeder positiven Zahl r > 0 definiert man die Menge
Br (v) := w ∈ V kw − vk < r .
Diese Menge heißt die offene Kugel in V mit Mittelpunkt v und Radius r.
Definition (abgeschlossene Kugel). Sei (V, k · k) ein normierter Raum. Zu jedem Vektor v ∈ V und jeder positiven Zahl r > 0 definiert man die Menge
Br (v) := w ∈ V kw − vk ≤ r .
12
KAPITEL 1. NORMEN UND SKALARPRODUKTE
(a)
(b)
(c)
Abbildung 1.3: Offene Einheitskugeln um den Ursprung in R2 bezüglich (a) der Betragssummennorm k · k1 , (b) der euklidische Norm | · | und (c) der Maximumnorm k · k∞ .
Diese Menge heißt die abgeschlossene Kugel in V mit Mittelpunkt v und Radius r.
Die Menge aller Punkte im Vektorraum R2 , welche denselben Abstand r > 0 (bezüglich der
euklidischen Norm) zu einem vorgegebenen Punkt x haben, ist bekanntlich ein Kreis mit
Radius r und Mittelpunkt x. Im Vektorraum R3 ist bildet eine solche Menge die Oberfläche
einer Kugel. Eine solche Menge wird auch Sphäre genannt. Solche Sphären kann man auch
in allgemeinen normierten Räumen definieren.
Definition (Sphäre). Sei (V, k · k) ein normierter Raum. Zu jedem Vektor v ∈ V und
jeder positiven Zahl r > 0 definiert man die Menge
Sr (v) := w ∈ V kw − vk = r .
Man nennt diese Menge die Sphäre in V mit Mittelpunkt v und Radius r.
Offenbar gilt
Br (v) = Br (v) \ Sr (v),
Br (v) = Br (v) ∪ Sr (v),
Sr (v) = Br (v) \ Br (v)
für alle positiven Radien r > 0 und für alle Vektoren v eines normierten Raums.
Von besonderer Bedeutung sind oft Kugeln und Sphären mit dem Radius 1. Solche
Kugeln und Sphären werden als Einheitskugeln bzw. als Einheitssphären bezeichnet. Ist
der Mittelpunkt einer Kugel oder einer Sphäre der Nullvektor, so spricht man von einer
Kugel bzw. einer Sphäre um den Ursprung.
Man sollte sich klar machen, dass die geometrische Gestalt einer Kugel oder einer
Sphäre stets von der Norm abhängt, mit der ein Vektorraum versehen wurde. So sind
beispielsweise alle in Abbildung 1.3 skizzierten Mengen offene Kugeln in R2 , jede jedoch
bezüglich einer anderen Norm auf R2 . Man erkennt, dass die nur die offene Kugel bezüglich
der euklidischen Norm die geometrische Gestalt einer Kreisscheibe besitzt.
Am Ende dieses Abschnitts geben wir noch ein nützliches Resultat an, welches als
umgekehrte Dreieckungleichung bekannt ist.
Satz 1.1 (Umgekehrte Dreiecksungleichung). Sei (V, k · k) ein normierter Raum.
Dann gilt
kvk − kwk ≤ kv − wk
für alle Vektoren v, w ∈ V .
1.1. NORMEN
13
Da bekanntlich x ≤ |x| für alle x ∈ R gilt, folgt aus der umgekehrten Dreiecksungleichung
auch, dass für alle Vektoren v und w eines mit einer Norm k · k versehenden Vektorraums
die Ungleichung kvk − kwk ≤ kv − wk gilt. Ersetzt man w durch −w, so erhält man
außerdem die Ungleichung kvk − kwk ≤ kv + wk. Da jede Norm die Dreiecksungleichung
erfüllt, erhält man somit die Ungleichungskette
kvk − kwk ≤ kv ± wk ≤ kvk + kwk
für alle Vektoren v, w ∈ V .
Übungsaufgaben
1. Berechnen Sie die euklidische Norm, die Maximumnorm und die Betragssummennorm der
folgenden Vektoren:
 
 
 
 
2
1
1
0
a := −1 , b := 0 , c := 1 , d := −4 .
5
0
1
3
2. Skizzieren Sie die Einheitssphären S1 (0) in R2 bezüglich der Betragssummennorm, der euklidischen Norm und der Maximumnorm.
3. Sei V ein reeller Vektorraum, und sei k · k eine Norm auf V . Zeigen Sie, dass die nachfolgenden
Gleichung und Ungleichungen für alle Vektoren u, v, w ∈ V und alle nichtnegativen Zahlen
α, β ≥ 0 gelten.
• k−vk = kvk.
• kv − wk ≤ kv − uk + ku − wk.
• kαv + βwk ≤ αkvk + βkwk.
4. Berechnen Sie (evtl. unter Zuhilfenahme eines Rechners) die p-Norm des Vektors
1
x=
2
für p = 1, p = 2, p = 4, p = 8 und p = 16, sowie dessen Maximumnorm. Was fällt Ihnen
auf?
5. Sei (V, k · k) ein normierter Raum. Zeigen Sie, dass für alle Vektoren v, w ∈ V und alle
positiven Zahlen r, s > 0 die folgenden Aussagen gelten:
• kv − wk ≤ s − r =⇒ Br (v) ⊆ Bs (w).
• kv − wk ≥ r + s =⇒ Br (v) ∩ Bs (w) = ∅.
Hierbei bezeichnen Br (v) und Bs (w) die offenen Kugeln in V mit den Mittelpunkten v bzw.
w und den Radien r bzw. s.
6. Weisen Sie nach, dass die Betragsfunktion eine Norm auf R ist.
7. Weisen Sie nach, dass die Betragssummennorm für alle n ∈ N eine Norm auf Rn ist.
14
1.2
KAPITEL 1. NORMEN UND SKALARPRODUKTE
Skalarprodukte
Definition (Skalarprodukt, inneres Produkt). Sei V ein reeller Vektorraum. Eine
Funktion
V × V → R, (v, w) 7→ hv , wi
heißt ein Skalarprodukt oder ein inneres Produkt auf V , wenn die nachfolgenden vier Eigenschaften gelten:
(1) Bilinearität: Für alle v, v1 , v2 , w, w1 , w2 ∈ V und alle α, β ∈ R gilt
hv1 + v2 , wi = hv1 , wi + hv2 , wi,
hαv , wi = αhv , wi,
hv , w1 + w2 i = hv , w1 i + hv , w2 i,
hv , βwi = βhv , wi.
(2) Nichtnegativität: Für alle v ∈ V gilt hv , vi ≥ 0.
(3) Definitheit: Für alle v ∈ V gilt hv , vi = 0 ⇐⇒ v = 0.
(4) Symmetrie: Für alle v, w ∈ V gilt hv , wi = hw , vi.
Gemäß obiger Definition ist ein Skalarprodukt auf einem reellen Vektorraum eine Funktion,
welche von zwei Variablen (oder Argumenten) abhängt, und welche bilinear, nichtnegativ,
definit und symmetrisch ist. Bilinear“ bedeutet hierbei, dass die Funktion linear bezüglich
”
der ersten wie auch bezüglich der zweiten Variable ist. Symmetrisch“ bedeutet, dass sich
”
der Wert eines Skalarprodukts nicht ändert, wenn man beide Variablen vertauscht.
Es ist allgemein üblich, ein Skalarprodukt V × V → R, (v, w) 7→ hv , wi vereinfachend
mit h · , · i zu bezeichnen. Da ein solches Skalarprodukt eine Funktion von V × V nach R
ist, kann man es auch in Funktionsschreibweise gemäß
h· , ·i : V × V → R
darstellen. Die Punkte deuten hierbei die Stellen an, an denen die Variablen des Skalarprodukts stehen. Nachfolgend geben wir einige wichtige Beispiele für Skalarprodukte
an.
Beispiele.
(a) Die gewöhnliche Multiplikation R × R → R, (a, b) 7→ ab ist ein Skalarprodukt auf R.
(b) Für alle n ∈ N definiert man auf dem Vektorraum Rn das so genannte euklidische
Skalarprodukt Rn × Rn → R, (x, y) 7→ x · y durch
x · y :=
n
X
xi yi = x1 y1 + x2 y2 + · · · + xn yn
i=1
für alle x = (x1 , x2 , . . . , xn )T ∈ Rn und alle y = (y1 , y2 , . . . , yn )T ∈ Rn . Das euklidische Skalarprodukt auf Rn wird gelegentlich auch als das Standardskalarprodukt auf
Rn bezeichnet.
Man beachte, dass für n = 1 das euklidische Skalarprodukt genau der gewöhnlichen
Multiplikation auf R = R1 entspricht. Das euklidische Skalarprodukt kann also als
1.2. SKALARPRODUKTE
15
Verallgemeinerung der gewöhnlichen Multiplikation angesehen werden. Daher verwenden wir auch den Malpunkt · zur Kennzeichnung dieses Skalarprodukts. Im Mathematikunterricht der Oberstufe wird das euklidische Skalarprodukt auf R3 als das
”
Skalarprodukt“ eingeführt. Tatsächlich ist es aber eines von vielen Skalarprodukten,
die man auf dem Vektorraum R3 definieren kann.
(c) Sei n ∈ N vorgegeben, und sei w = (w1 , w2 , . . . , wn )T ∈ Rn ein Vektor mit positiven
Komponenten, d.h. es gelte wi > 0 für alle i = 1, 2, . . . , n. Dann ist die Abbildung
Rn × Rn → R, (x, y) 7→ hx , yiw , welche durch
hx , yiw :=
n
X
wi x i y i
i=1
für alle x = (x1 , x2 , . . . , xn )T ∈ Rn und alle y = (y1 , y2 , . . . , yn )T ∈ Rn definiert ist,
ein Skalarprodukt auf Rn .
Für w = (1, 1, . . . , 1)T entspricht das Skalarprodukt h · , · iw genau dem euklidischen
Skalarprodukt.
(d) Die Abbildung h · , · i# : R2 → R2 → R, welche durch
hx , yi# := 2x1 y1 − x1 y2 − x2 y1 + 2x2 y2
für alle x = (x1 , x2 )T ∈ R2 und alle y = (y1 , y2 )T ∈ R2 definiert ist, ist ein Skalarprodukt auf R2 .
♦
Definition (Innenproduktraum). Sei V ein reeller Vektorraum und sei h · , · i ein Skalarprodukt auf V . Dann heißt das Paar (V, h · , · i) ein reeller Innenproduktraum.
Die Aussage, dass ein Paar (V, h · , · i) ein reeller Innenproduktraum ist, bedeutet nicht
mehr und nicht weniger als dass V ein Vektorraum über R ist, und dass h · , · i ein Skalarprodukt auf V ist. Man sagt auch, dass der Vektorraum V mit dem Skalarprodukt h · , · i
versehen und so zum Innenproduktraum (V, h · , · i) wird. Ähnlich wie bei den normierten
Räumen, ist es üblich gewisse Vektorräume mit ganz bestimmten Normen standardmäßig
zu versehen. Insbesondere trifft man die nachfolgende Vereinbarung.
Vereinbarung. Ist nichts gegenteiliges ausgesagt, so ist für alle n ∈ N der Vektorraum
Rn mit dem euklidischen Skalarprodukt versehen.
Abschließend erwähnen wir noch eine wichtige Eigenschaft transponierter Matrizen in
Bezug auf das euklidische Skalarprodukt.
Satz 1.2. Seien m, n ∈ N zwei natürliche Zahlen, sei A ∈ Rm×n eine beliebige Matrix,
und sei AT ∈ Rn×m die Transponierte zu A. Dann gilt
x · Ay = (AT x) · y
für alle x ∈ Rm und alle y ∈ Rn .
16
KAPITEL 1. NORMEN UND SKALARPRODUKTE
Übungsaufgaben
1. Geben seien die Vektoren
 
−2
a := −5 ,
3
 
1
b := 2 ,
4


0
c :=  1 .
−1
Berechnen Sie a · b, a · c und b · c, sowie a · a, b · b und c · c.
2. Sei V ein reeller Vektorraum, und sei h · , · i ein Skalarprodukt auf V . Weisen Sie nach, dass
die nachfolgenden Rechenregeln für alle v, w, x, y ∈ V und alle α, β ∈ R gelten:
• hαv + βw , xi = αhv , xi + βhw , xi.
• hv , αx + βyi = αhv , xi + βhv , yi.
• hv + w , x + yi = hv , xi + hv , yi + hw , xi + hw , yi.
• h−v , −wi = hv , wi.
• h−v , wi = −hv , wi = hv , −wi.
• hv , 0i = h0 , wi = 0.
1.3. INDUZIERTE NORMEN
1.3
17
Induzierte Normen
Bislang wurden Innenprodukträume und normierte Räume separat eingeführt. In diesem
Abschnitt wird gezeigt, dass jeder Innenproduktraum auch als normierter Raum aufgefasst
werden kann.
Satz und Definition 1.3 (induzierte Norm). Sei (V, h · , · i) ein reeller Innenproduktraum. Dann kann man V mit einer Norm V → R, v 7→ kvk versehen, welche durch
p
kvk := hv , vi
für alle v ∈ V definiert ist. Diese Norm wird als die vom Skalarprodukt h · , · i induzierte
Norm auf V bezeichnet.
Da jedes Skalarprodukt auf einem Vektorraum gemäß Satz und Definition 1.3 auch eine
Norm auf dem Vektorraum induziert, ist jeder Innenproduktraum in natürlicher Weise
auch ein normierter Raum. Man versieht einen Innenproduktraum nämlich standardmäßig
mit der Norm, die vom jeweiligen Skalarprodukt induziert wird.
Beispiele.
(a) Die reelle Betragsfunktion wird als
√ Norm auf R von der gewöhnlichen Multiplikation
auf R induziert, da bekanntlich x2 = |x| für alle x ∈ R gilt.
(b) Die euklidische Norm wird vom euklidischen Skalarprodukt induziert, d.h. es gilt
|x| =
√
x·x
für alle x ∈ Rn und alle n ∈ N, wie man leicht nachrechnet.
(c) Für jedes fest gewählte n ∈ N und jeden fest gewählten Vektor w ∈ Rn mit positiven Komponenten, wird die Norm k · kw (siehe Beispiel (f) auf Seite 10) vom
Skalarprodukt h · , · iw (Beispiel (c) auf Seite 15) induziert.
♦
Für Normen, die von Skalarprodukten induziert werden, gelten eine Reihe wichtiger Gleichungen und Ungleichungen, die im nachfolgenden Satz zusammengetragen wurden.
Satz 1.4. Sei (V, h · , · i) ein Innenproduktraum über R, und sei k · k die vom Skalarprodukt
h · , · i induzierte Norm auf V . Dann gelten die folgenden Resultate:
(1) Binomische Formeln: Für alle v, w ∈ V gilt
kv + wk2 = kvk2 + 2hv , wi + kwk2 ,
kv − wk2 = kvk2 − 2hv , wi + kwk2 ,
hv − w , v + wi = kvk2 − kwk2 .
(2) Für alle v, w ∈ V gilt
1
1
|hv , wi| ≤ kvk2 + kwk2 .
2
2
18
KAPITEL 1. NORMEN UND SKALARPRODUKTE
(3) Cauchy–Schwarzsche Ungleichung: Für alle v, w ∈ V gilt
|hv , wi| ≤ kvk kwk.
(4) Dreiecksungleichung: Für alle v, w ∈ V gilt
kv + wk ≤ kvk + kwk.
(5) Parallelogrammgleichung: Für alle v, w ∈ V gilt
kv + wk2 + kv − wk2 = 2kvk2 + 2kwk2 .
(6) Für alle v, w ∈ V gilt
hv , wi =
1
kv + wk2 − kv − wk2 .
4
Die Cauchy–Schwarzsche Ungleichung und die Dreiecksungleichung sind wichtige Hilfsmittel der Analysis. Hinsichtlich der Frage, ob eine gegebene Norm auf einem Vektorraum
von einem Skalarprodukt induziert wird, kommt der Parallelogrammgleichung kommt eine
besondere Bedeutung zu. Man kann nämlich zeigen, dass eine Norm genau dann von einem
Skalarprodukt induziert wird, wenn sie die Parallelogrammgleichung erfüllt.
Auf reellen Innenprodukträumen kann man in der folgenden Weise Winkel zwischen
zwei Vektoren definieren.
Definition (Winkel). Sei (V, h · , · i) ein Innenproduktraum über R, und sei k · k die von
h · , · i induzierte Norm auf V . Dann definiert man zu je zwei Vektoren v, w ∈ V \ {0} die
Zahl ∠(v, w) ∈ [0, π] durch
hv , wi
∠(v, w) := arccos
.
kvk kwk
Die Zahl ∠(v, w) heißt der Winkel zwischen v und w bezüglich h · , · i.
Es muss betont werden, dass der Winkel zwischen zwei gegebenen Vektoren eines reellen
Vektorraums V von dem Skalarprodukt abhängt, mit dem V versehen ist. Man betrachte
beispielsweise die Vektoren
1
1
x :=
, y := √
0
3
des R2 . Der Winkel zwischen beiden Vektoren bezüglich dem euklidischen Skalarprodukt
beträgt
x·y
1
π
= arccos
=
(= 60◦ ).
∠(x, y) = arccos
|x| |y|
2
3
Bezüglich dem Skalarprodukt h · , · iw auf R2 mit w := (3, 1)T (siehe Beispiel (c) auf
Seite 15) hingegen, gilt
√ hx , yiw
2
π
∠(x, y) = arccos
= arccos
=
(= 45◦ ).
kxkw kykw
2
4
Man stellt fest, dass der Winkel zwischen je zwei Vektoren des R2 bzw. des R3 bezüglich euklidischen Skalarprodukt genau dem geometrischen Winkel entspricht, den man
beispielsweise mit Hilfe eines Geodreiecks messen kann. Dies ist mit ein Grund dafür, weshalb man für jede natürliche Zahl n ∈ N den Vektorraum Rn standardmäßig mit dem
euklidische Skalarprodukt versieht.
1.3. INDUZIERTE NORMEN
19
Übungsaufgaben
1. Zeigen Sie mit Hilfe der Cauchy–Schwarzschen Ungleichung, dass
(x1 y1 + x2 y2 + · · · + xn yn )2 ≤ x21 + x22 + · · · + x2n y12 + y22 + · · · + yn2
für beliebige reelle Zahlen x1 , x2 , . . . , xn , y1 , y2 , . . . , yn ∈ R gilt.
2. Geben Sie die Norm k · k# : R2 → R an, die vom Skalarprodukt h · , · i# induziert wird (siehe
Beispiel (d) auf Seite 15). Berechnen Sie anschließend kak# , kbk# und kck# , wobei
√ 1
2
1
√2 .
a :=
, b :=
, c :=
−1
0
2
2
3. Berechnen Sie für die Vektoren
a :=
4
,
0
b :=
√ √2 ,
2
c :=
−1
1
die Winkel ∠(a, a), ∠(a, b), ∠(−a, b), ∠(a, c) und ∠(b, c). Der Vektorraum R2 sei hierbei mit
dem euklidischen Skalarprodukt versehen.
4. Sei (V, h · , · i) ein Innenproduktraum über R. Zeigen Sie, dass ∠(αv, βw) = ∠(v, w) für alle
Vektoren v, w ∈ V \ {0} und alle positiven reellen Zahlen α, β > 0 gilt.
20
KAPITEL 1. NORMEN UND SKALARPRODUKTE
Abbildung 1.4: Die Vektoren v, w und v + w bzw. v − w bilden die Kanten eines
rechtwinkligen Dreiecks. Für die entsprechenden Kantenlängen
1.4
Orthonormalbasen
Ein wichtiger Begriff, den man in Innenprodukträumen definieren kann, ist der Begriff der
Orthogonalität.
Definition (Orthogonalität). Sei (V, h · , · i) ein Innenproduktraum über R. Man sagt
dass zwei Vektoren v, w ∈ V zueinander orthogonal sind, wenn
hv , wi = 0
gilt. In diesem Fall schreibt man v ⊥ w.
Bekanntlich gilt cos(π/2) = 0. Daher sind zwei von Null verschiedene Vektoren w und v
eines reellen Vektorraums V genau dann orthogonal zueinander bezüglich einem Skalarprodukt h · , · i auf V , wenn
hv , wi
π
∠(v, w) = arccos
=
(= 90◦ )
kvk kwk
2
gilt, wobei k · k die von h · , · i induzierte Norm auf V bezeichnet. Die Vektoren sind
also genau dann zueinander orthogonal, wenn sie im rechten Winkel zueinander stehen.
Man muss sich jedoch immer wieder klar machen, dass der Winkel zwischen zwei Vekoren
ebenso wie die Eigenschaft der Orthogonalität von dem Skalarprodukt abhängig sind, mit
dem ein reeller Vektorraum versehen ist. Bezüglich dem euklidischen Skalarprodukt gilt
beispielsweise, dass zwei von Null verschiedene Vektoren des R2 bzw. des R3 genau dann
zueinander orthogonal sind, wenn sie im geometrischen Sinne senkrecht zueinander stehen.
Versieht man die Räume R2 bzw. R3 mit anderen Skalarprodukten, gilt diese Aussage im
allgemeinen jedoch nicht.
Ein wichtiges Resultat, welches für orthogonale Vektoren gilt, ist der berühmte Satz
des Pythagoras. Man betrachte dazu auch die Abbildung 1.4.
Satz 1.5 (Pythagoras). Sei (V, h · , · i) ein Innenproduktraum über R, und sei k · k die von
h · , · i induzierte Norm. Seien außerdem v, w ∈ V zwei zueinander orthogonale Vektoren.
Dann gilt
kv + wk2 = kvk2 + kwk2 = kv − wk2 .
Mit dem Satz des Pythagoras kann man insbesondere das folgende Lemma beweisen.
1.4. ORTHONORMALBASEN
21
Lemma 1.6. Sei (V, h · , · i) ein Innenproduktraum über R, und seien v1 , v2 , . . . , vn ∈
V \ {0} von Null verschiedene Vektoren, die paarweise zueinander orthogonal sind, d.h. es
gelte hvi , vj i = 0 für alle i, j ∈ {1, 2, . . . , n} mit i 6= j. Dann sind diese Vektoren linear
unabhängig.
Als nächstes betrachten wir Basen von endlichdimensionalen Vektorräumen, die aus zueinander orthogonalen Vektoren bestehen.
Definition (Orthogonalbasis). Sei U ein Untervektorraum eines reellen Vektorraums
V , welcher mit einem Skalarprodukt h · , · i versehen ist. Eine Basis {p1 , p2 , . . . , pm } von
U heißt Orthogonalbasis bezüglich h · , · i, wenn hpi , pj i = 0 für alle i, j ∈ {1, 2, . . . , m}
mit i 6= j gilt, d.h. wenn die Basisvektoren paarweise orthogonal zueinander sind.
Im Rest dieses Abschnitts wenden wir uns eine speziellen Klasse von Orthogonalbasen,
den so genannten Orthonormalbasen, zu.
Definition (Orthonormalbasis). Sei U ein Untervektorraum eines reellen Vektorraums
V , welcher mit einem Skalarprodukt h · , · i versehen ist. Eine Basis {q1 , q2 , . . . , qm } von
U heißt Orthonormalbasis (abgekürzt ONB ) bezüglich h · , · i, wenn
(
1 falls i = j,
hqi , qj i =
für alle i, j = 1, 2, . . . , m
0 falls i 6= j
gilt.
Man vergegenwärtige sich noch einmal, dass für alle Vektoren v eines reellen Vektorraums
V , welcher mit einem Skalarprodukt h · , · i versehen ist, die Gleichung
hv , vi = kvk2
gilt, wobei k · k die von h · , · i induzierte Norm auf V bezeichnet. Daher ist die Basis
{q1 , q2 , . . . , qm } eines Untervektorraums genau dann eine Orthonormalbasis, wenn sie eine
Orthogonal basis ist, und wenn alle Basisvektoren bezüglich der induzierten Norm auf Eins
normiert sind, d.h. wenn
kqi k = 1
für alle i = 1, 2, . . . , m
gilt. Nachfolgend geben wir einige Beispiele für Orthonormalbasen endlichdimensionale
Vektorräume über R an.
Beispiele.
(a) Für jede natürliche Zahl n ∈ N ist die so genannte Standardbasis {e(1) , e(2) , . . . , e(n) }
des Rn , welche durch
 
 
 
0
1
0
1
0
0
 
 
 
 
 
 
e(1) := 0 , e(2) := 0 , . . . , e(n) :=  ... 
 
 .. 
 .. 
0
.
.
1
0
0
gegeben ist, eine Orthonormalbasis bezüglich dem euklidischen Skalarprodukt.
22
KAPITEL 1. NORMEN UND SKALARPRODUKTE
(b) Die Vektoren
√
v (1)


1
2 
−1 ,
:=
2
0
v (2)
 
√
1
3 
1 ,
:=
3
1
√
v (3)


1
6 
1
:=
6
−2
bilden eine Orthonormalbasis des R3 bezüglich dem euklidischen Skalarprodukt.
Für Orthonormalbasen gelten eine Reihe wichtiger Resultate, welche im folgenden Satz
zusammengefasst sind.
Satz 1.7. Sei (V, h · , · i) ein endlichdimensionaler, reeller Innenproduktraum, und sei k · k
die von h · , · i induzierte Norm. Sei außerdem {q1 , q2 , . . . , qn } eine Orthonormalbasis von
V . Dann gelten die folgenden Aussagen.
(1) Orthogonalentwicklung: Für alle v ∈ V gilt
v = hq1 , viq1 + hq2 , viq2 + · · · + hqn , viqn .
(2) Parsevalsche Gleichung: Für alle v ∈ V gilt
kvk2 = |hq1 , vi|2 + |hq2 , vi|2 + · · · + |hqn , vi|2 .
(3) Äquidistanz: Für alle i, j ∈ {1, 2, . . . , n} gilt
(
0
falls i = j,
kqi − qj k = √
2 falls i 6= j.
Abschließend soll hier noch diskutiert werden, wie man zu einem gegebenen Vektorraum
eine Orthonormalbasis konstruieren kann. Wichtigstes Hilfsmittel einer solchen Konstruktion ist das so genannte Gram–Schmidtsche Orthogonalsierungsverfahren, welches durch
das nachfolgende Lemma motiviert ist.
Lemma 1.8. Sei (V, h · , · i) ein reeller Innenproduktraum und {p1 , p2 , . . . , pm } ⊆ V \ {0}
eine Menge von Vektoren, die paarweise zueinander orthogonal sind. Sei außerdem v ∈ V
ein beliebiger Vektor. Dann ist der Vektor
p := v −
hp1 , vi
hp2 , vi
hpm , vi
p1 −
p2 − · · · −
pm
hp1 , p1 i
hp2 , p2 i
hpm , pm i
zu jedem Vektor der Menge {p1 , p2 , . . . , pm } orthogonal.
Algorithmus (Gram–Schmidtsches Orthogonalisierungsverfahren).
Sei (V, h · , · i) ein reeller Innenproduktraum, und seien v1 , v2 , . . . , vm ∈ V linear unabhängige Vektoren. Berechnet man die Vektoren p1 , p2 , . . . , pm ∈ V gemäß
p1 := v1 ,
p2 := v2 −
hp1 , v2 i
p1 ,
hp1 , p1 i
1.4. ORTHONORMALBASEN
p3 := v3 −
23
hp1 , v3 i
hp2 , v3 i
p1 −
p2 ,
hp1 , p1 i
hp2 , p2 i
..
.
pm := vm −
hp1 , vm i
hp2 , vm i
hpm−1 , vm i
p1 −
p2 − · · · −
pm−1 ,
hp1 , p1 i
hp2 , p2 i
hpm−1 , pm−1 i
dann ist {p1 , p2 , . . . , pm } eine Orthogonalbasis von span{v1 , v2 , . . . , vm }.
Mit Hilfe des Gram–Schmidtschen Orthogonalisierungsverfahrens kann man aus einer gegebenen Basis {v1 , v2 , . . . , vm } eines Vektorraums eine Orthogonalbasis {p1 , p2 , . . . , pm }
desselben Vektorraums konstruieren. Normiert man die Vektoren dieser Orthogonalbasis
auf Eins, so erhält man eine Orthonormalbasis des Vektorraums.
Beispiel. Gegeben seien die linear unabhängigen Vektoren
 
 
2
−1
v (1) :=  1 , v (2) :=  2 .
−1
2
Gesucht ist eine Orthonormalbasis {q (1) , q (2) } von span{v (1) , v (2) } bezüglich des euklidischen Skalarprodukts.
• Orthogonalisierung (Gram–Schmidtsches Orthogonalisierungsverfahren):
 
2
(1)
(1)

1 ,
p := v =
−1
  

 
 
2
−1/3
−1
−1
(1)
(2)
p ·v
1 
(−2)   
(2)
(2)
(1)



1 =
7/3 =
7 .
2 −
p := v − (1) (1) p =
6
3
p ·p
−1
5/3
5
2
• Normierung:
q (1) :=
q (2) :=
1
|p(1) |
1
|p(2) |
√
p(1)
p(2)


2
6 
1 ,
=
6
−1
 
 
√
√
−1
−1
3 1 
3 
7 =
7 .
=
·
5 3
15
5
5
♦
Zum Abschluss dieses Abschnitts wenden wird uns nun noch einer besonderen Klasse von
Funktionen zu, die eine besondere Rolle in vielen Teilbereichen der Mathematik spielen.
Definition (Funktional). Sei V ein Vektorraum über K. Eine Funktion f : V → K heißt
ein Funktional auf V .
Ein Funktional ist also eine Funktion, welche die Vektoren eines Vektorraums auf Elemente
des Körpers abbildet, über dem der Vektorraum definiert ist. Für lineare Funktionale auf
den Vektorräumen Rn gilt ein wichtiger Satz, der als Rieszscher Darstellungssatz bekannt
ist.
24
KAPITEL 1. NORMEN UND SKALARPRODUKTE
Satz 1.9 (Rieszscher Darstellungssatz). Sei n ∈ N eine natürliche Zahl, f : Rn → R
ein lineares Funktional auf Rn und h · , · i ein Skalarprodukt auf Rn . Dann existiert ein
eindeutig bestimmter Vektor vf ∈ Rn , so dass
f (x) = hvf , xi
für alle x ∈ Rn gilt.
Der Rieszsche Darstellungssatz besagt, dass jedes lineare Funktional auf Rn durch ein
beliebig gewähltes Skalarprodukt dargestellt werden kann. Insbesondere existiert zu jedem
linearen Funktional f : Rn → R ein eindeutig bestimmter Vektor vf ∈ V , so dass f (x) =
vf · x für alle x ∈ Rn gilt.
Übungsaufgaben
1. Bestimmen Sie die Orthogonalentwicklungen der Vektoren
 
 
 
1
1
1
x := 2 , y := 0 , z := −1
3
0
0
bezüglich der Orthormalbasis {q (1) , q (2) , q (3) } des R3 , welche durch
 
 
 
√
√
√
1
1
1
3 
2 
6 
1 , q (2) :=
−1 , q (3) :=
1
q (1) :=
3
2
6
1
0
−2
gegeben ist.
2. Bestimmen Sie zwei Orthonormalbasen des R3 bezüglich dem euklidischen Skalarprodukt,
indem Sie die folgenden Basen unter Verwendung des Gram–Schmidtschen Orthogonalisierungsverfahrens orthonormalsieren:
     
     
1 
1
−1 
1
 −1
 2
 1 , 1 1 .
1 , 5 ,  1 ,




2
1
1
1
2
2
3. Bestimmen Sie eine Orthonormalbasis des R2 bezüglich h · , · i# (siehe Beispiel (d) auf
Seite 15), indem Sie die Standardbasis des R2 entsprechend orthonormalisieren.
4. Sei n ∈ N eine natürliche Zahl. Für jedes j = 1, 2, . . . , n sei das lineare Funktional pj :
Rn → R durch pj (x) = xj für alle x = (x1 , x2 , . . . , xn )T ∈ Rn definiert. Geben Sie für jedes
j = 1, 2, . . . , n einen Vektor vpj ∈ Rn an, so dass pj (x) = vpj · x für alle x ∈ Rn gilt.
1.5. DEFINITHEIT SYMMETRISCHER MATRIZEN
1.5
25
Definitheit symmetrischer Matrizen
Definition (symmetrische Matrix). Zu einer gegebenen natürlichen Zahl n ∈ N heißt
eine Matrix A ∈ Rn×n symmetrisch, wenn AT = A gilt. Die Menge aller symmetrischen
n×n bezeichnet.
n × n-Matrizen mit reellen Matrixkomponenten wird gelegentlich mit Rsym
Beispiele.
(a) Die folgenden Matrizen

1
0
0
sind symmetrisch:



0 0
2 1 0
2 0 , 1 2 1 ,
0 3
0 1 2


1 2 3
2 4 5 .
3 5 6
(b) Die folgenden Matrizen sind nicht symmetrisch:




1 2 3
1 2 0
0 4 5 , 3 1 2 .
0 0 6
0 2 1
Ist n ∈ N eine natürliche Zahl und A ∈ Rn×n
sym eine symmetrische Matrix, so gilt nach
Satz 1.2 insbesondere
x · Ay = (Ax) · y
für alle Vektoren x, y ∈ Rn . Der folgende Satz macht weiterhin Aussagen darüber, welche
Matrixoperationen die Symmetrie einer Matrix erhalten.
Satz 1.10. Sei n ∈ N eine beliebige natürliche Zahl. Dann gelten für alle symmetrischen
Matrizen A, B ∈ Rn×n
sym und für alle reellen Zahlen α ∈ R die folgenden Aussagen
(1) A + B ∈ Rn×n
sym .
(2) αA ∈ Rn×n
sym .
(3) A−1 ∈ Rn×n
sym , falls A regulär ist.
(4) Ak ∈ Rn×n
sym für alle k ∈ N0 .
n×n ein
Die Aussagen in Teil (1) und (2) von Satz 1.10 implizieren, dass die Menge Rsym
n×n
n×n
Untervektorraum von R
ist. Die Menge Rsym ist jedoch keine Gruppe bezüglich der
Matrixmultiplikation, da das Produkt zweier symmetrischer Matrizen im allgemeinen keine
symmetrische Matrix ist. Man betrachte etwa die beiden Matrix A, B ∈ R2×2
sym , welche durch
0 0
2 1
A :=
, B :=
0 1
1 2
gegeben sind. Für das Produkt der beiden Matrizen gilt
0 0
0 1
AB =
6=
= (AB)T ,
1 2
0 2
was AB 6∈ R2×2
sym impliziert.
Als nächstes führen wir das Konzept der positiven bzw. negativen Definitheit für quadratische Matrizen ein. Dieses spielt eine wichtige Rolle bei der Identifikation lokaler Extrema von Funktionalen auf Rn (siehe Abschnitt 6.6).
26
KAPITEL 1. NORMEN UND SKALARPRODUKTE
Definition (positiv definite Matrix). Sei n ∈ N eine natürliche Zahl. Eine quadratische
Matrix A ∈ Rn×n heißt positiv definit, wenn x · Ax > 0 für alle x ∈ Rn \ {0} gilt.
Definition (negativ definite Matrix). Sei n ∈ N eine beliebige natürliche Zahl. Eine
quadratische Matrix A ∈ Rn×n heißt negativ definit, wenn −A positiv definit ist, d.h. wenn
x · Ax < 0 für alle x ∈ Rn \ {0} gilt.
Im allgemeinen ist es nicht leicht zu erkennen, ob eine Matrix positiv bzw. negativ definit
ist. Für symmetrische Matrizen kann man jedoch ein hinreichendes Kriterium für die
positive Definitheit wie auch für die negative Definitheit angeben, welches auf den so
genannten Hauptminoren der Matrix beruht.
Definition (Hauptminor). Sei n ∈ N eine natürliche Zahl und A ∈ Rn×n eine quadratische Matrix. Für jede natürliche Zahl k ∈ {1, 2, . . . , n} definiert man die reelle Zahl
A[k] ∈ R durch


A11 A12 . . . A1k
A21 A22 . . . A2k 


A[k] := det  .
..
..  .
.
 .
.
. 
Ak1 Ak2 . . . Akk
Die Zahl A[k] wird der k-te Hauptminor von A genannt.
Offenbar gilt A[1] = A11 und A[n] = det A für jede natürliche Zahl n ∈ N und jede quadratische Matrix A ∈ Rn×n . Alle übrigen Hauptminoren berechnet man, indem man die
Determinante einer quadratischen Teilmatrix“ von A berechnet, welche die Matrixkom”
ponente A11 enthält. Man betrachte dazu die nachfolgenden Beispiele.
Beispiele.
(a) Die beiden Hauptminoren der Matrix
−4
1
A :=
−2 −1
lauten
A[1]
= det −4 = −4,
A[2]
−4
1
= det
= 6.
−2 −1
(b) Die drei Hauptminoren der Matrix


2 1 0
B := −2 3 1
−1 0 2
sind durch
B[1] = det 2 = 2,
gegeben.
B[2] = det
2 1
−2 3

2 1 0
= det −2 3 1 = 15
−1 0 2

= 8,
B[3]
♦
1.5. DEFINITHEIT SYMMETRISCHER MATRIZEN
27
Es sollte noch erwähnt werden, dass in der mathematischen Fachliteratur keine einheitliche
Bezeichnungsweise für die Hauptminoren einer Matrix existiert. Auch die hier gewählte
Schreibweise A[k] ist keinesfalls allgemein üblich.
Als nächstes zeigen wir, wie man mit Hilfe von Hauptminoren die positive bzw. die
negative Definitheit einer symmetrischen Matrix nachweisen kann.
n×n
Satz 1.11 (Hauptminorenkriterium). Sei n ∈ N eine natürliche Zahl und A ∈ Rsym
eine symmetrische Matrix. Dann gelten die folgenden Aussagen.
(1) A ist genau dann positiv definit, wenn alle Hauptminoren von A positiv sind, d.h.
wenn
sgn(A[k] ) = 1
für alle k = 1, 2, . . . , n gilt.
(2) A ist genau dann negativ definit, wenn die Vorzeichen der Hauptminoren von A mit
Minus beginnend alternieren, d.h. wenn
sgn(A[k] ) = (−1)k
für alle k = 1, 2, . . . , n gilt.
In den nachfolgenden Beispielen wird gezeigt, wie man das Hauptminorenkriterium anwendet.
Beispiele.
(a) Für die Hauptminoren der symmetrischen Matrix


2 −1
0
2 −1
A := −1
0 −1
2
gilt A[1] = 2 > 0, A[2] = 3 > 0 und A[3] = 4 > 0. Daher ist A positiv definit.
(b) Für die Hauptminoren der symmetrischen Matrix


−4
0
1
0
B :=  0 −2
1
0 −3
gilt B[1] = −4 < 0, B[2] = 8 > 0 und B[3] = −22 < 0. Daher ist B negativ definit.
(c) Für die Hauptminoren der symmetrischen Matrix


3
2 3
C := 2 −2 0
3
0 1
gilt C[1] = 3 > 0, C[2] = −10 < 0 und C[3] = 8 > 0. Die Matrix C ist daher
weder positiv definit noch negativ definit. Tatsächlich gilt e(1) · Ce(1) = 3 > 0 und
e(2) · Ce(2) = −2 < 0, wobei e(1) = (1, 0, 0)T und e(2) = (0, 1, 0)T .
Der Vollständigkeit halber geben wir zum Abschluss diese Abschnitts noch das folgende
Resultat an, welches es einem erlaubt, auch nicht-symmetrische Matrizen mit dem Hauptminorenkriterium auf positive oder negative Definitheit hin zu untersuchen.
Lemma 1.12. Eine quadratische Matrix A ∈ Rn×n ist genau dann positiv definit bzw.
negativ definit, wenn die symmetrische Matrix A + AT positiv definit bzw. negativ definit
ist.
28
KAPITEL 1. NORMEN UND SKALARPRODUKTE
Übungsaufgaben
1. Sei n ∈ N eine natürliche Zahl, und sei A ∈ Rn×n eine quadratische Matrix. Zeigen Sie, dass
die Matrizen AT A und AAT symmetrisch sind.
2. Zeigen Sie, dass für jede natürliche Zahl n ∈ N eine Matrix A ∈ Rn×n genau dann symmetrisch ist, wenn
1
A = A + AT
2
gilt.
3. Untersuchen Sie die folgenden symmetrischen Matrizen auf positive oder negative Definitheit.






−4
2
0
1
1
2
4 −1 −1
3 −1 , C := −1
4 −1 .
A :=  2 −3 −2 , B := 1
0 −2 −1
2 −1
5
−1 −1
4
4. Sei n ∈ N eine natürliche Zahl, und sei A ∈ Rn×n eine symmetrische und positiv definite
Matrix. Zeigen Sie, dass dann die Funktion h · , · iA : Rn × Rn → R, welche durch hx , yiA :=
x · Ay für alle x, y ∈ Rn definiert ist, ein Skalarprodukt auf Rn ist.
Lernzielkontrolle
Nach dem Durcharbeiten dieses Kapitels sollten Sie ...
... die definierenden Eigenschaften von Normen und Skalarprodukten kennen.
... wissen, wie offene Kugeln, abgeschlossene Kugeln und Sphären in einem normierten
Raum definiert sind.
... wissen, auf welche Weise ein Skalarprodukt eine Norm induziert.
... wichtige Gleichungen und Ungleichungen für Normen und Skalarprodukte kennen.
Sie sollten insbesondere die Dreiecksungleichung, die umgekehrte Dreiecksungleichung
und die Cauchy–Schwarzsche Ungleichung kennen.
... das euklidische Skalarprodukt, die euklidische Norm, die Betragssummennorm und
die Maximumnorm kennen.
... wissen, dass die euklidische Norm vom euklidischen Skalarprodukt induziert wird.
... wissen, was eine Orthonormalbasis ist.
... das Gram–Schmidtsche Orthogonalisierungsverfahren anwenden können.
... wissen, was eine positiv definite und was eine negativ definite, symmetrische Matrix
ist.
... die Hauptminoren einer quadratischen Matrix berechnen können.
... das Hauptminorenkriterium für die positive bzw. die negative Definitheit einer symmetrischen Matrix kennen.
29
Kapitel 2
Grundbegriffe der Analysis
2.1
Folgen und Familien
Definition (Folge). Sei X eine nichtleere Menge. Unter einer Folge in X versteht man
eine Abbildung x : N → X. Üblicherweise nennt man für eine gegebene Zahl n ∈ N den
Funktionswert x(n) das n-te Glied der Folge und bezeichnet ihn mit xn oder x(n) . Die Zahl
n wird hierbei als der Index des Folgenglieds bezeichnet. Die Folge x : N → X selbst wird
üblichweise mit (xn )n∈N , (xn )∞
n=1 , (xn ) oder x bezeichnet. Es ist darüber hinaus üblich
eine Folge durch Angabe der ersten Folgenglieder in der Form (x1 , x2 , . . . ) darzustellen.
Die Menge aller Folgen in X wird mit X N bezeichnet.
Eine Folge ist tatsächlich nichts anderes als eine Funktion, deren Definitionsmenge die Menge der natürlichen Zahlen N ist. Mit einer Folge (xn )n∈N verbindet man oft die Vorstellung
einer Anordnung von abzählbar unendlich vielen Elementen einer gegebenen Menge X. Das
erste Folgenglied ist dabei das erste Element in der Anordnung, das zweite Folgenglied ist
das zweite Element usw.
Oft ist es sinnvoll, auch solche Funktionen als Folgen zu betrachten, deren Definitionsbereich die Menge N0 = N ∪ {0} oder eine Menge von der Form N ∪ {0, −1, −2, . . . , −m}
mit m ∈ N ist. Eine Folge mit einer solchen Indexmenge stellt man üblicherweise durch
(vn )∞
n=−m dar. Wir geben nun einige Beispiele für Folgen an.
Beispiele.
(a) Die Folge der ungeraden Zahlen (un )n∈N ist eine Folge in N, welche durch un := 2n−1
für alle n ∈ N definiert ist. Die ersten vier Folgenglieder lauten u1 = 1, u2 = 3, u3 = 5
und u4 = 7. Man stellt die Folge (un )n∈N darher gelegentlich auch als (1, 3, 5, 7, . . . )
dar.
(b) Ist X eine nichtleere Menge, so wird eine Folge (cn )n∈N , welche durch cn := x für
alle n ∈ N und ein fest gewähltes Element x ∈ X definiert ist, als eine konstante
Folge bezeichnet.
(c) Für jede natürliche Zahl k ∈ N definiert man die Folge e(k) ∈ {0, 1}N durch
(
1 falls n = k,
e(k)
n :=
0 falls n 6= k
für alle n ∈ N. Es gilt also e(1) = (1, 0, 0, 0, . . . ), e(2) = (0, 1, 0, 0, . . . ), e(3) =
(0, 0, 1, 0, . . . ) usw.
♦
30
2.1. FOLGEN UND FAMILIEN
31
Grundsätzlich gibt es zwei Möglichkeiten, eine Folge zu definieren. Die erste Möglichkeit
ist die so genannte explizite Definition oder explizite Darstellung, bei der jedes Folgenglied
unabhängig von allen übrigen Folgengliedern definiert wird. Eine explizite Definition einer
Folge (xn )n∈N ist dabei von der Form
xn := F (n)
für alle n ∈ N,
wobei F (n) ein Ausdruck ist, der lediglich vom Index n abhängig sein darf. Die Folgen in
den zuvor genannten Beispielen etwa wurden alle explizit definiert.
Die zweite Möglichkeit eine Folge zu definieren ist die so genannte rekursive Definition
oder rekursive Darstellung. Bei der rekursiven Darstellung gibt man die ersten Glieder
der Folge explizit an. Alle übrigen Folgenglieder werde in Abhängigkeit von anderen, bereits bekannten Folgengliedern definiert. Ist X eine nichtleere Menge, so ist eine rekursive
Definition einer Folge (xn )n∈N in X von der Form
x1 := y1 ,
x2 := y2 ,
..
.
xk := yk ,
für alle n ∈ N mit n ≥ k + 1,
xn := F (n, xn−1 , xn−2 , . . . , xn−k )
wobei k ∈ N eine natürliche Zahl und y1 , y2 , . . . , yk ∈ X vorgegebene Elemente sind. In der
rekursiven Definition bezeichnet F (n, xn−1 , xn−2 , . . . , xn−k+1 ) einen Ausdruck, der lediglich vom Index n des Folgenglieds sowie von den Folgendgliedern xn−1 , xn−2 , . . . , xn−k+1
abhängig sein darf. Im Fall k = 1 wird eine Folge (xn )n∈N in X oftmals auch in der Form
x1 := y1 ,
für alle n ∈ N
xn+1 := F (n, xn )
mit y1 ∈ X rekursiv definiert. Hierbei bezeichnet F (n, xn ) einen Ausdruck, der nur von n
und xn abhängen darf.
Oft ist es von Vorteil, wenn man die explizite Darstellung einer Folge kennt. Ist jedoch
nur eine rekursive Definition der Folge bekannt, so kann man versuchen, eine explizite Darstellung zu erraten. Dafür ist es oft hilfreich, einige Folgenglieder mit Hilfe der rekursiven
Definition auszurechnen. Die geratene explizite Darstellung kann dannn mittels vollständiger Induktion und unter Verwendung der rekursiven Definition bewiesen werden. Man
betrachte dazu auch die nachfolgenden Beispiele.
Beispiele.
(a) Gegeben sei die Folge (rn )n∈N in N, welche gemäß
r1 := 2,
rn := rn−1 + 2n
für alle n ∈ N mit n ≥ 2
rekursiv definiert ist. Die ersten Glieder dieser Folge lauten r1 = 2, r2 = 6, r3 = 12
und r4 = 20. Mit etwas Nachdenken erkennt man, dass r1 = 1 · 2, r2 = 2 · 3, r3 = 3 · 4
und r4 = 4 · 5 gilt. Die Vermutung ist also, dass
rn = n(n + 1)
für alle n ∈ N
32
KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS
gilt. Dies wäre eine explizite Darstellung der Folge (rn )n∈N . Wir beweisen diese Vermutung nun mittels vollständiger Induktion nach n. Für den Induktionsanfang erhält
man r1 = 1 · (1 + 1) = 2, was offenbar richtig ist. Für den Induktionsschritt von n − 1
nach n nehmen wir an, dass rn−1 = (n−1)n für irgendeine natürliche Zahl n ∈ N gilt.
Man erhält dann rn = rn−1 + 2n = (n − 1)n + 2n = n2 − n + 2n = n2 + n = n(n + 1).
Damit ist die Vermutung bewiesen.
(b) Gegeben sei die Folge (an )n∈N in Q, welche gemäß
a1 := 1,
an :=
an−1
an−1 + 2
für alle n ∈ N mit n ≥ 2
rekursiv definiert ist. Die ersten Glieder dieser Folge lauten a1 = 1, a2 = 1/3,
a3 = 1/7 und a4 = 1/15. Betrachtet man die Nenner der Brüche, so fällt auf, dass
3 = 4 − 1 = 22 − 1 sowie 7 = 8 − 1 = 23 − 1 und 15 = 16 − 1 = 24 − 1 gilt. Eine
naheliegende Vermutung ist also, dass
an =
1
2n − 1
für alle n ∈ N
gilt. Tatsächlich kann man dies mittels vollständiger Induktion nach n beweisen. Für
den Induktionsanfang erhält man a1 = 1/(21 − 1) = 1/1 = 1. Für den Induktionsschritt nimmt man an, dass an−1 = 1/(2n−1 −1) für irgendeine natürliche Zahl n ∈ N
gilt. Man erhält dann
an =
an−1
=
an−1 + 2
1
2n−1 −1
1
+
2n−1 −1
2
=
1
1+
2(2n−1
− 1)
=
1
1
= n
n
1+2 −2
2 −1
Damit ist die Vermutung bewiesen.
♦
Zum Abschluss dieses Kapitels führen wir noch den nützlichen Begriff der Familie ein.
Definition (Familie). Ist X eine nichtleere Menge, so versteht man unter einer Familie
in X eine Funktion x : I → X, wobei I eine nichtleere Menge ist. Die Menge I wird als die
Indexmenge der Familie bezeichnet. Es ist üblich, für jeden Index i ∈ I den zugehörigen
Funktionswert x(i) ∈ X mit xi oder x(i) zu bezeichnen und ihn das i-te Mitglied der Familie
zu nennen. Die Familie x : I → X selbst wird üblicherweise mit (xi )i∈I bezeichnet.
In der Regel stellt man sich eine Familie als Zusammenfassung einer beliebigen Anzahl von
gleichartigen Objekten (wie z.B. Zahlen, Mengen oder Funktionen) zu einem Ganzen vor.
Jedes Objekt wird dabei mit einem Index versehen, so dass es eindeutig identifiziert werden
kann. Im Unterschied zu Mengen können Familien ein und dasselbe Objekt mehrfach
enthalten. Wir wollen dies anhand einiger Beispiele verdeutlichen.
Beispiele.
(a) Sei I := {1, 2, 3} und F := {4, }. Dann ist (fi )i∈I mit f1 := 4, f2 := , f3 := 4
eine Familie in F , welche aus genau drei Mitgliedern besteht. Das Element 4 tritt
genau zweimal als Mitglied in dieser Familie auf, das Element genau einmal.
(b) Für jede ganze Zahl k ∈ Z sei σk := sgn(k) das Vorzeichen von k. Dann ist (σk )k∈Z
eine Familie in {−1, 0, 1}, welche aus abzählbar unendlich vielen Mitgliedern besteht.
Die Zahlen −1 und 1 treten jeweils abzählbar unendlich oft in dieser Familie auf, die
Zahl 0 jedoch nur genau einmal.
2.1. FOLGEN UND FAMILIEN
33
(c) Für jede natürliche Zahl k ∈ N definieren wir die Menge Nk := {1, 2, . . . , k}. Dann ist
(Nk )k∈N eine Familie bestehend aus Teilmengen von N. Die Mitglieder dieser Familie
sind paarweise verschieden, d.h. es gilt Ni 6= Nj für alle i, j ∈ N mit i 6= j.
(d) Für jede reelle Zahl α ∈ R sei die Funktion fα : R → R, x 7→ αx definiert. Dann
ist (fα )α∈R eine Familie bestehend aus linearen Funktionen von R nach R. Diese
Familie besteht aus überabzahlbar unendlich vielen Mitgliedern, welche paarweise
verschieden sind.
♦
Oft ist es sinnvoll, bestimmte Mitglieder einer gegebenen Familie zu einer neuen Familie
zusammenzufassen. Dies führt dann auf den Begriff der Teilfamilie.
Definition (Teilfamilie). Sei X eine nichtleere Menge und (xi )i∈I eine Familie in X. Sei
ferner J ⊆ I eine Teilmenge der Indexmenge von (xi )i∈I und (yj )j∈J eine Familie in X, so
dass für jeden Index j ∈ J ein Index i ∈ I mit yj = xi existiert. Dann heißt (yj )j∈J eine
Teilfamilie von (xi )i∈I . Man bezeichnet eine solche Teilfamilie in der Regel mit (xi )i∈J .
Übungsaufgaben
1. Geben Sie die ersten 10 Folgenglieder der so genannten Fibonacci–Folge (fn )n∈N an, die
folgendermaßen definiert ist
f1 := 1,
f2 := 1,
für alle n ∈ N mit n ≥ 3.
fn := fn−1 + fn−2
2. Geben Sie für die reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N jeweils eine
explizite Darstellung an. Die Folgen sind gemäß
a1 := 1,
b1 := 2,
c1 := 1/2,
d1 := 1,
an := an−1 + 2n − 1,
bn−1
,
2
1
cn :=
cn−1 +
bn :=
2
n
,
dn := n2 − dn−1 − (n − 2)2
für alle n ≥ N mit n ≥ 2 rekursiv definiert. Beweisen Sie mittels vollständiger Induktion,
dass die jeweilige explizite Darstellung korrekt ist.
3. Sei (pα )α∈R eine Familie von Polynomen, welche gemäß pα (x) = x2 + (1 − α2 )x − 1 für alle
x ∈ R und alle α ∈ R definiert sind. Untersuchen Sie, ob die Polynome
f1 : R → R, x 7→ x2 ,
f2 : R → R, x 7→ x2 + x − 1,
f3 : R → R, x 7→ x2 + 2x − 1,
f4 : R → R, x 7→ (x − 1)(x + 1),
Mitglieder dieser Familie sind. Untersuchen Sie auch, wie oft das jeweilige Polynom als
Mitglied in der Familie (pα )α∈R auftritt.
34
2.2
KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS
Algebren
Definition (Algebra). Ein Vektorraum V über K wird eine Algebra über K genannt,
wenn auf V eine bilineare Funktion
V × V → V, (v, w) 7→ vw
definiert ist, welche die Multiplikation auf V genannt wird.
Ist V eine Algebra über K, so folgt aus der Bilinearität der Multiplikation auf V , dass für
alle Vektoren v, v1 , v2 , w, w1 , w2 ∈ V und für alle Skalare α, β ∈ K die Gleichungen
(v1 + v2 )w = v1 w + v2 w,
(αv)w = α(vw),
v(w1 + w2 ) = vw1 + vw2 ,
v(βw) = β(vw)
gelten. Die Multiplikation auf einer Algebra erfüllt also insbesondere die Distributivgesetze.
Es wird jedoch nicht gefordert, dass die Multiplation assoziativ oder gar kommutativ ist.
Nachfolgend geben wir einige Beispiele für Algebren an.
Beispiele.
(a) Die Menge der reellen Zahlen ist eine Algebra über R.
(b) Die Menge der komplexen Zahlen ist sowohl eine Algebra über C als auch eine
Algebra über R.
(c) Für jede natürliche Zahl n ∈ N ist die Menge Rn×n eine Algebra über R. Die Multiplikation auf dieser Algebra ist die gewöhnliche Matrixmultiplikation. Diese ist
bekanntlich assoziativ, aber nicht kommutativ.
(d) Ist V eine Algebra über K, so ist auch die Menge V N aller Folgen in V eine Algebra
über K. Addition, skalare Multiplikation und Multiplikation auf V N werden dabei
folgengliedweise definiert, d.h. für je zwei Folgen (vn )n∈N und (wn )n∈N in V und jedes
Element α ∈ K definiert man
(vn )n∈N + (wn )n∈N := (vn + wn )n∈N ,
α(vn )n∈N := (αvn )n∈N ,
(vn )n∈N (wn )n∈N := (vn wn )n∈N .
(e) Ist V eine Algebra über K und X eine nichtleere Menge, so ist die Menge aller
Funktionen von X nach V eine Algebra über K. Addition, skalare Multiplikation
und Multiplikation werden dabei punktweise definiert, d.h. für je zwei Folgen f :
X → V und g : X → V und für jedes Element α ∈ K definiert man die Funktionen
f + g : X → V , αf : X → V und f g : X → V durch
(f + g)(x) := f (x) + g(x),
(αf )(x) := αf (x),
(f g)(x) := f (x)g(x)
für alle x ∈ X.
2.2. ALGEBREN
35
(f) Die Menge aller Polynome R → R, x 7→ α0 + α1 x + α2 x2 + · · · + αn xn mit reellen
Koeffizienten α1 , α2 , . . . , αn ∈ R ist eine Algebra über R. Die Multiplikation auf
dieser Algebra ist die punktweise Multiplikation, welche sowohl assoziativ als auch
kommutativ ist.
♦
Wie man anhand der obigen Beispiele sieht, gibt es zahlreiche Mengen, auf denen man eine
Addition, eine skalare Multiplikation und eine Multiplikation definieren kann, so dass die
Menge zu einer Algebra über K wird. Ist die Multiplikation eine assoziative Verknüpfung,
für die ein neutrales Element existiert, so kann man die Elemente der Algebra insbesondere
in Polynome einsetzen. Man betrachte etwa die Algebra R2 . Die Funktion p : R2×2 → R2×2 ,
welche durch
p(X) = X 2 + 2X − 3 := X 2 + 2X 1 − 3X 0
für alle X ∈ R2×2 definiert ist, ist ein Polynom vom Grad 2. Setzt man beispielsweise die
Matrix A ∈ R2×2 , welche durch
0 1
A :=
0 0
gegeben ist, in das Polynom ein, so erhält man die Matrix
−3
2
2
.
p(A) = A + 2A − 312 =
0 −3
Definition (submultiplikative Norm). Sei V eine Algebra über K. Eine k · k auf V ,
heißt submultiplikativ, wenn
kvwk ≤ kvk kwk
für alle v, w ∈ V gilt.
Wird ein Vektorraum über K mit einer Norm versehen, so erhält man einen normierten
Raum über K. Analog dazu kann man auch eine Algebra über K mit einer Norm versehen.
Ist diese submultiplikativ, so erhält man eine normierte Algebra.
Definition (normierte Algebra). Sei V eine Algebra über K und k · k eine submultiplikative Norm auf V . Dann heißt das Paar (V, k · k) eine normierte Algebra über K.
Die Submultiplikativität der Norm auf einer normierten Algebra ist quasi das multiplikative Pendant zur Dreiecksungleichung. Nachfolgend geben wir noch einige Beispiele für
normierte Algebren an.
Beispiele.
(a) Die Menge der reellen Zahlen R, versehen mit der Betragsfunktion | · | : R → R, ist
eine normierte Algebra über R.
(b) Die Menge der komplexen Zahlen C, versehen mit der komplexen Betragsfunktion
| · | : C → R, ist sowohl eine normierte Algebra über R als auch eine normierte
Algebra über C.
♦
36
KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS
Übungsaufgabe
1. Zeigen Sie, dass der Vektorraum R2 zusammen mit der Funktion R2 × R2 → R2 , welche
durch
x1 y2 + x2 y1
x ~ y :=
x2 y2
für alle x = (x1 , x2 )T ∈ R2 und alle y = (y1 , y2 )T ∈ R2 definiert ist, eine Algebra über R ist.
2. Die Funktion k · kmax : R2×2 → R, welche durch
kAkmax := max |A11 |, |A12 |, |A21 |, |A22 |
für alle A ∈ R2×2 ist, ist eine Norm auf R2×2 . Zeigen Sie anhand eines Gegenbeispiels, dass
diese Norm nicht submultiplikativ ist.
3. Wir betrachten die Menge
a
M :=
b
−b
a
∈R
a,
b
∈
R
2×2 und die Funktion k · kM : M → R, welche durch kAk2M := a2 + b2 für alle A ∈ M mit
a −b
A=
b
a
definiert ist.
• Zeigen Sie, dass M eine Algebra auf R ist.
• Zeigen Sie, dass k · kM eine Norm auf M ist.
• Zeigen Sie, dass (M, k · kM ) eine normierte Algebra ist.
2.3. INFIMUM, SUPREMUM, MINIMUM UND MAXIMUM
2.3
37
Infimum, Supremum, Minimum und Maximum
Definition (nach unten beschränke Menge). Sei M eine Teilmenge von R. Ein reelle
Zahl u ∈ R heißt eine untere Schranke von M , wenn u ≤ x für alle x ∈ M gilt. Existiert
eine solche untere Schranke, so nennt man die Menge M nach unten beschränkt.
Definition (nach oben beschränkte Menge). Sei M eine Teilmenge von R. Ein reelle
Zahl o ∈ R heißt eine obere Schranke von M , wenn x ≤ o für alle x ∈ M gilt. Existiert
eine solche obere Schranke, so nennt man die Menge M nach oben beschränkt.
Eine Menge M ⊆ R ist offenbar nicht nach unten beschränkt, wenn für jede reelle Zahl
y ∈ R ein Element x ∈ M existiert, so dass x < y gilt. Ebenso die Menge M nicht nach
oben beschränkt, wenn für jede reelle Zahl y ∈ R ein Element x ∈ M existiert, so dass
y < x gilt. Nachfolgend geben wir einige Beispiele für Teilmengen von R an, welche nach
unten oder nach oben beschränkt sind.
Beispiele.
(a) Offenbar gilt für jede reelle Zahl a ≤ 1 und jede natürliche Zahl n ∈ N die Ungleichung a ≤ 1. Daher ist jede reelle Zahl a ≤ 1 eine untere Schranke von N, und N ist
somit nach unten beschränkt. Die Menge N ist jedoch nicht nach oben beschränkt,
da man zu jeder reellen Zahl x ∈ R eine natürliche Zahl n ∈ N finden kann, so dass
n > x gilt. Daher existiert keine obere Schranke von N.
(b) Sei (a, b) ein nichtleeres, offenes Intervall mit Intervallgrenzen a, b ∈ R. Dann ist jede
reelle Zahl u ≤ a eine untere Schranke von (a, b). Ebenso ist jede reelle Zahl o ≥ b
eine obere Schranke für (a, b). Das Intervall (a, b) ist also eine nach unten und nach
oben beschränkte Menge. Dasselbe gilt für nichtleere, abgeschlossene Intervalle [a, b],
sowie für Intervalle der Form [a, b) und (a, b] mit a, b ∈ R.
(c) Intervalle der Form (−∞, b) und (−∞, b] mit b ∈ R sind durch jede reelle Zahl o ≥ b
nach oben, nicht aber nach unten beschränkt.
(d) Intervalle der Form (a, ∞) und [a, ∞) mit a ∈ R sind durch jede reelle Zahl u ≤ a
nach unten, nicht aber nach oben beschränkt.
Ist u ∈ R untere Schranke einer Menge M ⊂ R, so ist jede reelle Zahl v ≤ u ebenfalls eine
untere Schranke von M . Ebenso ist jede reelle Zahl p ≥ o obere Schranke einer Menge
M ⊂ R, wenn die Zahl o ∈ R eine obere Schranke von M ist. Daher macht es keinen Sinn,
von der oberen Schranke“ oder der unteren Schranke“ einer Menge zu sprechen. Sinnvoll
”
”
ist jedoch die Suche nach einer möglichst großen unteren Schranke bzw. einer möglichst
kleinen oberen Schranke.
Definition (Infimum). Sei M ⊂ R eine nach unten beschränkte Menge, und sei u∗ ∈ R
eine untere Schranke von M mit der Eigenschaft, dass für jede positive Zahl ε > 0 die
Zahl u∗ + ε keine untere Schranke von M ist. Dann heißt u∗ das Infimum von M , und
man bezeichnet u∗ mit inf M .
Definition (Supremum). Sei M ⊂ R eine nach oben beschränkte Menge, und sei o∗ ∈ R
eine obere Schranke von M mit der Eigenschaft, dass für jede positive Zahl ε > 0 die Zahl
o∗ − ε keine obere Schranke von M ist. Dann heißt o∗ das Supremum von M , und man
bezeichnet o∗ mit sup M .
38
KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS
Gemäß Definition ist das Infimum die größte untere Schranke einer Menge, und das Supremum die kleinste obere Schranke. Die Existenz eines Infimums und eines Supremums
wird für nichtleere, nach unten bzw. nach oben beschränkte Teilmengen der reellen Zahlen
axiomatisch festgelegt.
Axiom (Vollständigkeitsaxiom). Jede nichtleere, nach unten beschränkte Teilmenge
von R besitzt ein Infimum. Jede nichtleere, nach oben beschränkte Teilmenge von R besitzt
ein Supremum.
Es sollte hier noch erwähnt werden, dass man für eine Teilmenge M der reellen Zahlen oft
inf M = −∞
schreibt, falls M nicht nach unten beschränkt ist. Analog dazu schreibt man
sup M = ∞,
falls M nicht nach oben beschränkt ist.
Nachfolgend geben wir einige Beispiele für Infima und Suprema von Mengen an.
Beispiele.
(a) Betrachtet man die Menge der natürlichen Zahlen N als Teilmenge von R, so ist N
nach unten beschränkt. Genauer: Jede reelle Zahl u ≤ 1 ist eine untere Schranke von
N. Für jede positive Zahl ε > 0 hingegen existiert eine natürliche Zahl n ∈ N, so
dass 1 + ε > n gilt, nämlich n = 1. Also ist 1 die größte untere Schranke und damit
das Infimum von N, d.h. inf N = 1.
(b) Für jedes nichtleere, offene Intervall (a, b), für jedes nichtleere, abgeschlossene Intervall [a, b] und für alle nichtleeren Intervalle der Form [a, b) oder (a, b] mit Intervallgrenzen a, b ∈ R gilt
inf (a, b) = inf [a, b] = inf [a, b) = inf (a, b] = a,
sup (a, b) = sup [a, b] = sup [a, b) = sup (a, b] = b.
Man beachte, dass die Zahl a kein Element der Intervalle (a, b) und (a, b] ist, und
dass die Zahl b kein Element der Intervalle (a, b) und [a, b) ist.
♦
Anhand der zuletzt aufgeführten Beispiele erkennt man, dass das Infimum einer Menge
M ⊂ R nicht notwendigerweise ein Element von M sein muss. Dasselbe gilt für das Supremum von M . Es gibt jedoch auch Mengen M ⊆ R für die inf M ∈ M bzw. sup M ∈ M
gilt. In diesem Fall bezeichnet man das Infimum bzw. das Supremum als das Minimum“
”
bzw. das Maximum“ der Menge.
”
Definition (Minimum). Sei M ⊂ R eine nach unten beschränkte Menge. Eine reelle
Zahl x∗ ∈ R wird das Minimum von M genannt, wenn x∗ ∈ M und x∗ = inf M gilt. Das
Minimum von M wird mit min M bezeichnet.
Definition (Maximum). Sei M ⊂ R eine nach oben beschränkte Menge. Eine reelle
Zahl x∗ ∈ R wird das Maximum von M genannt, wenn x∗ ∈ M und x∗ = sup M gilt. Das
Maximum von M wird mit max M bezeichnet.
2.3. INFIMUM, SUPREMUM, MINIMUM UND MAXIMUM
(a)
39
(b)
Abbildung 2.1: (a) Infimum und Supremum eines nichtleeren, offenen Intervalls (a, b).
(b) Minimum und Maximum eines nichtleeren, abgeschlossenen Intervalls [a, b]
Das Minimum einer nach unten beschränkten Menge M ⊆ R ist also ein Element von
M , welches gleichzeitig eine untere Schranke von M ist. Es folgt daher, dass min M das
kleinste Element von M ist. Ebenso ist max M das größte Element von M . Es muss betont
werden, dass eine nach unten bzw. nach oben beschränkte Menge M ⊂ R nicht notwendigerweise ein kleinstes bzw. größtes Element besitzt. Es existiert lediglich eine größte untere
bzw. eine kleinste obere Schranke. Daher besitzt jede nichtleere, nach unten beschränkte
Teilmenge von R zwar ein Infimum, nicht aber unbedingt ein Minimum. Ebenso besitzt
jede nichtleere, nach oben beschränkte Teilmenge von R ein Supremum, nicht aber unbedingt ein Maximum. Man betrachte dazu die Abbildung 2.1 wie auch die nachfolgenden
Beispiele.
Beispiele.
(a) Wir haben bereits gezeigt, dass inf N = 1 gilt. Da auch 1 ∈ N gilt, ist die Zahl 1
nicht nur die größte untere Schranke von N sondern auch das kleinste Element von
N, d.h. es gilt min N = 1.
(b) Seien x1 , x2 , . . . , xn ∈ R reelle Zahlen mit x1 ≤ x2 ≤ · · · ≤ xn . Dann gilt
min {x1 , x2 , . . . , xn } = x1 ,
max {x1 , x2 , . . . , xn } = xn .
(c) Sei [a, b] ein nichtleeres, abgeschlossenes Intervall mit a, b ∈ R. Dann gilt
min [a, b] = a,
max [a, b] = b.
(d) Für nichtleere Intervalle der Form [a, b) und (a, b] mit Intervallgrenzen a, b ∈ R gilt
min [a, b) = a,
max (a, b] = b.
Außerdem gilt sup [a, b) = b und inf (a, b] = a. Da jedoch b 6∈ [a, b) und a 6∈ (a, b] gilt,
besitzt das Intervall [a, b) kein Maximum und das Intervall (a, b] kein Minimum.
(e) Jedes nichtleere, offene Intervall (a, b) mit Intervallgrenzen a, b ∈ R besitzt weder ein
Mininum noch ein Maximum.
♦
Man überlegt sich leicht, dass jede nach unten beschränkte Teilmenge von Z ein Minimum
besitzt. Ebenso offensichtlich ist, dass jede nach oben beschränkte Teilmenge von Z ein
Maximum besitzt. Daher kann man die folgenden beiden Funktionen definieren.
40
KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS
Definition (Abrundungsfunktion, Gauß–Klammer). Die Abrundungsfunktion oder
Gaußklammer R → Z, x 7→ bxc ist durch
bxc := max{k ∈ Z | k ≤ x}
für alle x ∈ R definiert.
Definition (Aufrundungsfunktion). Die Aufrundungsfunktion R → Z, x 7→ dxe ist
durch
dxe := min{k ∈ Z | x ≤ k}
für alle x ∈ R definiert.
Die Abrundungsfunktion b · c wird gelegentlich auch mit [ · ] bezeichnet. Für jede reelle
Zahl x ∈ R nennt man den zugehörigen Funktionswert der Abrundungsfunktion bxc den
Ganzteil von x. Die Zahl x − bxc nennt man den Nachkommaanteil von x. Offenbar ist
eine Zahl k ∈ R genau dann Element von Z, wenn ihr Nachkommaanteil verschwindet, d.h.
wenn k = bkc bzw. k − bkc = 0 gilt. Für jede reelle Zahl x ∈ R gilt ferner die Abschätzung
bxc ≤ x ≤ dxe.
Daraus folgt insbesondere, dass man für jede noch so große, positive nichtnegative Zahl
R ≥ 0 eine natürliche Zahl N ∈ N wählen kann, so dass N > R gilt: Man wählt einfach
die Zahl N := dRe + 1. Außerdem existiert für jede noch so kleine, positive reelle Zahl
ε > 0 eine natürliche Zahl n ∈ N, so dass
1
<ε
n
gilt, nämlich n := d1/εe + 1. Obwohl diese Überlegungen trivial erscheinen, werden sie
doch häufig in Beweisen benötigt.
Beschränktheit nach unten und Beschränktheit nach oben kann man auch für reellwertige Funktionen definieren.
Definition (nach unten beschränkte Funktion). Sei X eine nichtleere Menge. Eine
Funktion f : X → R heißt nach unten beschränkt, wenn ihre Wertemenge nach unten
beschränkt ist.
Definition (nach oben beschränkte Funktion). Sei X eine nichtleere Menge. Eine
Funktion f : X → R heißt nach oben beschränkt, wenn ihre Wertemenge nach oben
beschränkt ist.
Die Wertemenge f (X) einer Funktion f : X → R ist bekanntlich durch
f (X) := y ∈ R ∃x ∈ X : f (x) = y
gegeben. Entsprechend definiert man das Infimum einer nach unten beschränkten Funktion
f : X → R als
inf f (x) := inf f (X)
x∈X
Wenn außerdem ein Element x∗ ∈ X existiert, so dass f (x∗ ) = inf f (X) gilt, definiert man
das Minimum der Funktion f als
min f (x) := f (x∗ ).
x∈X
2.3. INFIMUM, SUPREMUM, MINIMUM UND MAXIMUM
41
Das Element x∗ wird dann ein Minimierer der Funktion f genannt. Für eine nach oben
beschränkte Funktion f : X → R definiert man das Supremum durch
sup f (x) := sup f (X).
x∈X
Falls außerdem ein Element x∗ ∈ X existiert, für dass f (x∗ ) = sup f (X) gilt, so definiert
man das Maximum der Funktion f als
max f (x) := f (x∗ ).
x∈X
Das Element x∗ wird dann ein Maximierer von f genannt.
Beispiele.
(a) Die Funktion f : R → R, welche durch f (x) := x2 für alle x ∈ R definiert ist, ist
beispielsweise durch 0 nach unten beschränkt, und es gilt
inf f (x) = min f (x) = 0
x∈X
x∈R
Wegen f (0) = 0 ist die Zahl 0 ein Minimierer von f . Tatsächlich ist 0 der einzige
Minimierer von f , wie man leicht zeigen kann. Die Funktion f ist nicht nach oben
beschränkt.
(b) Die Funktion g : R\{0} → R, welche durch g(x) := 1/x2 für alle x ∈ R\{0} definiert
ist, ist nach unten beschränkt, und es gilt
inf
g(x) = 0.
x∈R\{0}
Allerdings besitzt die Funktion g kein Minimum, da g(x) > 0 für alle x ∈ R \ {0}
gilt. Die Funktion g ist außerdem nicht nach oben beschränkt.
♦
Reelle Zahlenfolgen sind bekanntlich nichts anderes als Funktionen von N nach R. Daher
definiert man nach unten bzw. nach oben beschränkte Folgen in R wie folgt.
Definition (nach unten beschränkte Folge). Eine Folge in R heißt nach unten beschränkt, wenn die Menge ihrer Folgenglieder nach unten beschränkt ist.
Definition (nach oben beschränkte Folge). Eine Folge in R heißt nach oben beschränkt, wenn die Menge ihrer Folgenglieder nach oben beschränkt ist.
Die Menge der Folgenglieder einer reellen Zahlenfolge (an )n∈N ist durch
{an | n ∈ N} = {a1 , a2 , a3 , . . . }
gegeben. In Analogie zu den nach unten beschränkten Teilmengen von R definiert man
das Infimum einer nach unten beschränkten reellen Zahlenfolge (an )n∈N als das Infimum
der Menge aller Folgenglieder, d.h. man definiert
inf an := inf{an | n ∈ N}.
n∈N
42
KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS
Falls außerdem eine natürliche Zahl n∗ ∈ N existiert, so dass an∗ = inf{an | n ∈ N} gilt,
definiert man das Minimum der Folge (an )n∈N als
min an := an∗ .
n∈N
Das Supremum einer nach oben beschränkten reellen Zahlenfolge (an )n∈N definiert man
gemäß
sup an := sup{an | n ∈ N}.
n∈N
Wenn außerdem eine natürliche Zahl n∗ ∈ N existiert, für die an∗ = sup{an | n ∈ N} gilt,
dann definiert man das Maximum der Folge als
max an := an∗ .
n∈N
Gelegentlich werden das Infimum, das Minimum, das Supremum und das Maximum einer
reellen Zahlenfolge (an )n∈N auch mit inf (an )n∈N , min (an )n∈N , sup (an )n∈N und max (an )n∈N
bezeichnet.
Beispiele.
(a) Die so genannte Folge der Quadratzahlen (qn )n∈N , welche durch qn := n2 für alle
n ∈ N definiert ist, ist beispielsweise durch 1 nach unten beschränkt, und es gilt
inf qn = min qn = 1.
n∈N
n∈N
Die Folge (qn )n∈N ist jedoch nicht nach oben beschränkt.
(b) Die so genannte Folge der Stammbrüche (sn )n∈N , welche durch sn := 1/n für alle
n ∈ N definiert ist, ist nach oben beschränkt, und es gilt
sup sn = max sn = 1.
n∈N
n∈N
Die Folge (sn )n∈N ist außerdem nach unten beschränkt mit
inf sn = 0.
n∈N
Da jedoch 1/n 6= 0 für alle n ∈ N gilt, besitzt die Folge der Stammbrüche kein
Minimum.
♦
Übungsaufgaben
1. Gegeben seien die reellen Zahlen x1 := −3/2, x2 := π, x3 :=
Berechnen Sie die ganzen Zahlen bxi c und dxi e für i = 1, 2, 3, 4.
√
2 und x4 := log10 (124).
2. Skizzieren Sie die Funktionsgraphen der Funktionen [−3, 3] → R, x 7→ bxc und [−3, 3] →
R, x − bxc.
3. Bestimmen Sie, falls dieses existiert, das Infimum, das Supremum, das Minimum und das
Maximum der folgenden Teilmengen von R.
M1 = {x2 | x ∈ (0, 1]}
M2 = {−12, 1, 0, −4},
M3 = [−2, −1) ∪ (1, ∞),
M4 = {2k | k ∈ Z}
2.3. INFIMUM, SUPREMUM, MINIMUM UND MAXIMUM
43
4. Bestimmen Sie, falls dieses existiert, das Infimum, das Supremum, das Minimum und das
Maximum der reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N , welche durch
an := 4n − n2 ,
(−1)n
,
n πn
,
cn := sin
2
d1 := 4,
dn+1 := dn /2
bn :=
für alle n ∈ N definiert sind.
5. Bestimmen Sie, falls dieses existiert, das Infimum, das Supremum, das Minimum und das
Maximum der nachfolgend angegebenen Funktionen.
f1 : [1, 2) → R, x 7→ 3x,
f2 : R → R, x 7→ −x3 ,
√
f3 : [0, ∞) → R, x 7→ x,
f4 : (0, 1] → R, x 7→ 1/x.
44
2.4
KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS
Monotonie
Definition (monoton wachsende Funktion). Sei D ⊆ R eine nichtleere Menge. Eine
Funktion f : D → R heißt monoton wachsend, wenn f (x) ≤ f (y) für alle x, y ∈ D mit
x ≤ y gilt.
Definition (streng monoton wachsende Funktion). Sei D ⊆ R eine nichtleere Menge.
Eine Funktion f : D → R heißt streng monoton wachsend, wenn f (x) < f (y) für alle
x, y ∈ D mit x < y gilt.
Definition (monoton fallende Funktion). Sei D ⊆ R eine nichtleere Menge. Eine
Funktion f : D → R heißt monoton wachsend, wenn f (x) ≥ f (y) für alle x, y ∈ D mit
x ≤ y gilt.
Definition (streng monoton fallende Funktion). Sei D ⊆ R eine nichtleere Menge.
Eine Funktion f : D → R heißt streng monoton fallend, wenn f (x) > f (y) für alle x, y ∈ D
mit x < y gilt.
Die Monotonie einer Funktion f : D → R, wobei D ⊆ R eine nichtleere Menge ist, lässt
sich bekannterweise am Funktionsgraphen
graph(f ) := {(x, y)T ∈ R2 | x ∈ D, y = f (x)}
ablesen. Falls eine solcher Graph von links nach rechts stets ansteigt, so ist die Funktion
monoton wachsend. Verläuft der Graph dabei an keiner Stelle waagrecht, so ist die Funktion streng monoton wachsend. Falls der Graph von links nach rechts stets abfällt, ist die
Funktion monoton fallend. Verläuft der Graph dabei an keiner Stelle waagrecht, so ist die
Funktion streng monoton fallend (siehe auch Abbildun 2.2).
Beispiele.
(a) Eine affine Funktion g : R → R, welche für gegebene reelle Zahlen m, c ∈ R durch
g(x) = mx + c für alle x ∈ R definiert ist, ist genau dann streng monoton wachsend
bzw. streng monoton fallend, wenn m > 0 bzw. m < 0 gilt.
(b) Jede konstante Funktion ist sowohl monoton wachsend als auch monoton fallend. Ist
D ⊆ R eine nichtleere Menge, so wird eine Funktion f : D → R konstant genannt,
wenn eine Zahl y0 ∈ R existiert, so dass f (x) = y0 für alle x ∈ D gilt.
Wir erinnern uns, dass Folgen nichts anderes sind als Funktionen, deren Definitionsmenge
die Menge der natürlichen Zahlen N ist. Daher kann man den Monotoniebegriff auch auf
Folgen übertragen. Dementsprechend heißt eine Folge (an )n∈N in R monoton wachsend,
wenn
an ≤ an+1
für alle n ∈ N gilt. Die Folge heißt streng monoton wachsend, wenn
an < an+1
für alle n ∈ N gilt. Die Folge wird monoton fallend genannt, wenn
an ≥ an+1
2.4. MONOTONIE
45
(a)
(b)
(c)
(d)
Abbildung 2.2: Funktionsgraphen einer (a) monoton wachsenden, (b) streng monoton
wachsenden, (c) monoton fallenden, (d) streng monoton fallenden Funktion von R nach
R.
für alle n ∈ N gilt. Falls
an > an+1
für alle n ∈ N gilt, wird die Folge streng monoton fallend genannt.
Die Monotonie einer Folge in R wird letztlich von der Ordnungsrelation ≤ auf R bestimmt. Man kann den Monotoniebegriff jedoch auch auf Folgen in einer beliebigen Menge
X übertragen, sofern auf X eine Ordnungsrelation definiert ist. Wir geben hier zwei Beispiele dafür an.
Beispiele.
(a) Die Teilmengenrelation ⊆ ist bekanntlich eine Ordnungsrelation auf P(N), der Potenzmenge von N. Definiert man die Folge (Nn )n∈N in P(N) gemäß Nn := {1, 2, . . . , n}
für alle n ∈ N, so ist (Nn )n∈N eine monoton wachsende Folge bezüglich der Teilmengenrelation. Es gilt nämlich
Mn ⊆ Mn+1
für alle n ∈ N.
(b) Die Teilbarkeitsrelation | ist eine Ordnungsrelation auf N. Definiert man die Folge
(fn )n∈N gemäß fn := n! = n(n − 1) · · · 1 für alle n ∈ N, so gilt
fn | fn+1
(fn ist ein Teiler von fn+1 )
für alle n ∈ N. Also ist (fn )n∈N eine monoton wachsende Folge bezüglich der Teilbarkeitsrelation.
♦
Zum Abschluss dieses Abschnitts führen wir noch den Begriff der Teilfolge ein.
Definition (Teilfolge). Sei X eine nichtleere Menge und (xn )n∈N eine Folge in X. Eine
Folge (yn )n∈N in X heißt eine Teilfolge von (xn )n∈N , wenn eine streng monoton wachsende
Funktion ϕ : N → N existiert, so dass yn = xϕ(n) für alle n ∈ N gilt. Die Folge (yn )n∈N
wird dann auch mit (xϕ(n) )n∈N bezeichnet.
46
KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS
Beispiele.
(a) Sei (sn )n∈N die Folge R, welche durch sn := (−1)n für alle n ∈ N gegeben ist. Dann
ist beispielsweise die Folge (en )n∈N , welche durch en := 1 für alle n ∈ N gegeben ist,
eine Teilfolge von (sn )n∈N . Es gilt nämlich en = s2n für alle n ∈ N.
(b) Die Folge (sn )n∈N aus Teil (a) ist eine Teilfolge der Folge (zn )n∈N in C, welche durch
zn := in für alle n ∈ N definiert ist. Hierbei bezeichnet i die imaginäre Einheit. Es
gilt nämlich sn = z2n für alle n ∈ N. Auch die Folge (en )n∈N aus Teil (a) ist eine
Teilfolge von (zn )n∈N . Es gilt nämlich en = s2n = z4n für alle n ∈ N.
♦
Übungsaufgaben
1. Untersuchen Sie die reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N hinsichtlich
ihrer Monotonie. Die Folgen sind dabei durch
1
2n
bn := 2n ,
an :=
πn ,
cn := cos
2
d1 := 1,
dn+1 := 1 + 2dn
für alle n ∈ N definiert.
2. Geben Sie jeweils die ersten 5 Folgenglieder der Teilfolgen (a2n )n∈N , (an2 )n∈N , (a6n+1 )n∈N
und (an! )n∈N der Folge (an )n∈N an, welche durch


1 falls n ≡ 0 mod 3,
an := 2 falls n ≡ 1 mod 3,


3 falls n ≡ 2 mod 3
für alle n ∈ N definiert ist.
3. Entscheiden Sie, ob die Folgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N Teilfolgen der Folge
(xn )n∈N in R sind. Die Folge (xn )n∈N ist dabei durch
xn := dn/2e
für alle n ∈ N definiert. Die übrigen Folgen sind gemäß
an := n,
bn := dn/3e,
cn := n2 ,
dn := 4n − n2
für alle n ∈ N definiert. Für jede reelle Zahl α ∈ R bezeichnet hierbei dαe die kleinste
ganze Zahl, welche größer oder gleich α ist. Die ersten Glieder der Folge (xn )n∈N lauten
dementsprechend x1 = x2 = 1, x3 = x4 = 2, x5 = x6 = 3 u.s.w.
2.5. GRENZWERTE VON FOLGEN
2.5
47
Grenzwerte von Folgen
Definition (konvergente Folge, Grenzwert). Sei (V, k · k) ein normierter Raum über
K. Eine Folge (vn )n∈N in V heißt konvergent, wenn ein Vektor v ∈ V existiert, so dass für
jede positive Zahl ε > 0 eine natürliche Zahl N ∈ N existiert, so dass
kvn − vk < ε für alle n ≥ N
gilt. Der Vektor v heißt in diesem Fall der Grenzwert der Folge, und man sagt, dass die
Folge (vn )n∈N gegen v konvergiert. Außerdem schreibt man
lim vn = v
n→∞
oder auch vn → v (n → ∞).
Definition (divergente Folge). Sei (V, k · k) ein normierter Raum über K. Eine Folge
in V heißt divergent, wenn sie nicht konvergent ist.
Anschaulich gesprochen konvergiert eine Folge genau dann gegen einen bestimmten Grenzwert, wenn die Folgenglieder für wachsende Indizes diesem Grenzwert immer näher kommen. Man sagt auch, dass die Folgenglieder einer konvergenten Folge, dem Grenzwert
beliebig nahe kommen. Dabei ist zu beachten, dass der Grenzwert selbst ein Folgenglied
sein kann. Im allgemeinen ist dies jedoch nicht der Fall.
Der nachfolgende Satz zeigt, weshalb es sinnvoll ist, von dem Grenzwert einer konvergenten Folge zu sprechen.
Satz 2.1. Der Grenzwert einer konvergenten Folge ist eindeutig bestimmt.
Eine spezielle Klasse konvergenter Folgen bilden die so genannten Nullfolgen.
Definition (Nullfolge). Sei (V, k · k) ein normierter Raum über K. Eine Folge in V heißt
Nullfolge, wenn sie gegen den Nullvektor 0 ∈ V konvergiert.
Ist (V, k · k) ein normierter Raum, so konvergiert eine Folge (vn )n∈N offenbar genau dann
gegen einen Vektor v ∈ V , wenn (kvn − vk)n∈N eine Nullfolge ist, d.h. wenn
lim kvn − vk = 0
n→∞
gilt. In den nachfolgenden Beispielen geben wir die Grenzwerte einiger grundlegender Zahlenfolgen an. Vereinzelt geben wir eine kurze Begründung für das Resultat an.
Beispiele.
(a) Für jede reelle Zahl α ∈ R, und für jede reelle Zahl β ∈ R, welche n + β 6= 0 für alle
n ∈ N erfüllt, gilt
α
lim
= 0.
n→∞ n + β
Ist nämlich ε > 0 eine beliebig gewählte, positive Zahl, so existiert eine natürliche
Zahl N ∈ N, so dass n + β > α/ε für alle n ∈ N mit n ≥ N gilt. Daraus folgt, dass
|α/(n + β) − 0| < ε für alle n ∈ N mit n ≥ N gilt. Also ist die Folge (an )n∈N , definiert
durch an := α/(n + β) für alle n ∈ N, eine Nullfolge in R.
48
KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS
(b) Für jede reelle Zahl β ∈ R und für jede reelle Zahl α ∈ R, welche n + β 6= 0 für alle
n ∈ N erfüllt, gilt
n+α
lim
= 1.
n→∞ n + β
Es gilt nämlich
α − β n + α
n + β − 1 = n + β ,
und in Beispiel (a) wurde gezeigt, dass die Folge (bn )n∈N , definiert durch bn :=
(α − β)/(n + β) für alle n ∈ N, eine Nullfolge in R ist.
(c) Für jede komplexe Zahl q ∈ C mit |q| < 1 gilt
lim q n = 0.
n→∞
(d) Für jede Nullfolge (an )n∈N in C und für jede natürliche Zahl p ∈ N gilt
p
lim p |an | = 0.
n→∞
Wählt man nämlich eine beliebige, positive Zahl ε > 0, dann gilt auch εp > 0. Da
(an )n∈N eine Nullfolge ist, existiert eine natürliche Zahl N ∈ N, so dass |an | < εp
für alle n ∈ N mit n ≥ Npgilt. Zieht man
p auf beiden Seiten der Ungleichung die p-te
Wurzel, so erhält man | p |an | − 0| = |an | < εp für alle n ∈ N mit n ≥ N .
(e) Es gilt
lim
n→∞
√
n
n = 1.
(f) Für jede komplexe Zahl q ∈ C mit |q| < 1 und jede natürliche Zahl p ∈ N gilt
lim np q n = 0.
n→∞
(g) Sei (V, k · k) ein normierter Raum über K, und sei (vn )n∈N eine konstante Folge in
V , d.h. es existiere ein Vektor v0 ∈ V , so dass vn := v0 für alle n ∈ N gilt. Dann
konvergiert (vn )n∈N gegen v0 .
♦
Die Eigenschaft einer Folge, konvergent oder nicht konvergent zu sein, wird oft als das
Konvergenzverhalten der Folge bezeichnet. Der folgende Satz liefert ein wichtiges Resultat
hinsichtlich des Konvergenzverhaltens der Teilfolgen einer konvergenten Folge.
Satz 2.2. Sei (V, k · k) ein normierter Raum über K. Eine Folge (vn )n∈N in V konvergiert
genau dann gegen einen Grenzwert v ∈ V , wenn alle Teilfolgen von (vn )n∈N gegen v
konvergieren.
Satz 2.2 liefert offenbar auch ein notwendiges Kriterium für die Konvergenz einer Folge.
Falls man nämlich aus einer beliebigen Folge zwei Teilfolgen extrahieren kann, die gegen
unterschiedliche Grenzwerte konvergieren, so folgt aus Satz 2.2, dass die ursprüngliche
Folge nicht konvergent sein kann.
Als nächstes untersuchen wir, was man über die Normen der Folgenglieder einer konvergenten Folge aussagen kann.
2.5. GRENZWERTE VON FOLGEN
49
Satz 2.3. Sei (V, k · k) ein normierter Raum, und sei (vn )n∈N eine konvergente Folge in V .
Dann gilt
lim kvn k = lim vn .
n→∞
n→∞
Als nächstes wollen wir einige Resultate zusammengestellen, die es erlauben, Grenzwerte
von bestimmten Folgen aus bereits bekannten Grenzwerten zu berechnen. Die nachfolgenden zwei Sätze liefern solche Rechenregeln für Grenzwerte.
Satz 2.4. Sei (V, k · k) ein normierter Raum über K. Seien außerdem (vn )n∈N und (wn )n∈N
zwei konvergente Folgen in V , und sei (αn )n∈N eine konvergente Folge in K. Dann gilt
(1) lim vn + wn = lim vn + lim wn .
n→∞
(2) lim αn vn =
n→∞
n→∞
lim αn
n→∞
n→∞
lim vn .
n→∞
Ist (V, k · k) eine normierte Algebra über K, so gilt außerdem
(3) lim vn wn = lim vn
lim wn .
n→∞
n→∞
n→∞
Man beachte, dass die Aussage in Teil (2) von Satz 2.4 insbesondere auch für jede konstante
Folge in K gilt. Eine konstante Folgen (αn )n∈N ist bekanntlich durch αn := α für alle n ∈ N
gegeben, wobei α ∈ K eine fest gewählte Zahl ist. Diese Zahl ist dann auch der Grenzwert
von (αn )n∈N . Aus Teil (2) von Satz 2.4 folgt daher, dass
lim αvn = α lim vn
n→∞
n→∞
für jede konvergente Folge (vn )n∈N und für jede Zahl α ∈ K gilt. Da außerdem v − w =
v + (−1)w für beliebige Vektoren v, w ∈ V gilt, implizieren die Teile (1) und (2) von
Satz 2.4 auch, dass
lim vn − wn = lim vn − lim wn
n→∞
n→∞
n→∞
für alle konvergenten Folge (vn )n∈N und (wn )n∈N gilt.
Die bisher eingeführten Rechenregeln für die Addition, die skalare Multiplikation und
die Multiplikation von Grenzwerten gelten alle konvergenten Folgen in einer normierten
Algebra V über K. Im Fall V = R oder V = C kann man darüber hinaus eine Rechenregel
für die Division von Grenzwerten beweisen.
Satz 2.5. Sei (αn )n∈N eine konvergente Folge in K \ {0}, deren Grenzwert ebenfalls ein
Element von K \ {0} ist. Dann gilt
lim
n→∞
1
1
=
.
αn
lim αn
n→∞
Laut Satz 2.5 konvergiert die Folge der Kehrbrüche einer konvergenten Folge in K gegen
den Kehrbruch des Grenzwertes. Da bekanntlich α/β = α · (1/β) für alle α, β ∈ K gilt,
folgt aus Teil (3) von Satz 2.4 und Satz 2.5 die Rechenregel
lim αn
αn
= n→∞
n→∞ βn
lim βn
lim
n→∞
50
KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS
für alle konvergenten Folgen (αn )n∈N in K und alle konvergenten Folgen (βn )n∈N in K\{0},
sofern der Grenzwert der Folge (βn )n∈N von Null verschieden ist.
Zum Abschluss dieses Kapitels wenden wir uns noch zwei Spezialfällen von Divergenz
zu, die man für reelle Zahlenfolgen definiert.
Definition (gegen ∞ bestimmt divergente Folge). Eine Folge (an )n∈N in R heißt
gegen ∞ bestimmt divergent, wenn für jede reelle Zahl R ∈ R eine natürliche Zahl N ∈ N
existiert, so dass
an > R für alle n ∈ N mit n ≥ N
gilt. In diesem Fall schreibt man
lim an = ∞
n→∞
oder an → ∞ (n → ∞).
Definition (gegen −∞ bestimmt divergente Folge). Eine Folge (an )n∈N in R heißt
gegen −∞ bestimmt divergent, wenn für jede reelle Zahl R ∈ R eine natürliche Zahl N ∈ N
existiert, so dass
an < R für alle n ∈ N mit n ≥ N
gilt. In diesem Fall schreibt man
lim an = −∞
n→∞
oder an → −∞ (n → ∞).
Man nennt eine reelle Zahlenfolge ganz allgemein bestimmt divergent, wenn sie entweder
gegen ∞ oder gegen −∞ bestimmt divergent ist. Man sollte sich klar machen, dass jede
nach ∞ bestimmt divergente Folge nach unten, nicht aber nach oben beschränkt ist. Die
Umkehrung dieser Aussage gilt jedoch nicht. Es gibt nämlich reelle Zahlenfolgen die nach
unten, nicht aber nach oben beschränkt sind, und die nicht gegen ∞ bestimmt divergieren.
Man betrachte hierzu auch die nachfolgenden Beispiele.
Beispiele.
(a) Die reelle Zahlenfolge (an )n∈N , welche durch an := −n für alle n ∈ N definiert ist,
ist gegen −∞ bestimmt divergent.
(b) Die reelle Zahlenfolge (bn )n∈N , welche durch bn := (−2)n für alle n ∈ N definiert ist,
ist divergent, aber nicht bestimmt divergent.
(c) Die nach unten, nicht aber nach oben beschränkte reelle Zahlenfolge (cn )n∈N , welche
durch
(
1
falls n gerade ist,
cn :=
2
n falls n ungerade ist
für alle n ∈ N definiert ist, ist divergent, aber nicht bestimmt divergent.
Das nachfolgende Lemma ist oft hilfreich, wenn man reelle Zahlenfolgen auf Konvergenz
hin untersucht.
Lemma 2.6. Sei (an )n∈N eine bestimmt divergente Zahlenfolge in R \ {0}. Dann gilt
lim
n→∞
1
= 0.
an
2.5. GRENZWERTE VON FOLGEN
51
Beweis. Da die Folge (an )n∈N bestimmt divergiert, ist die Folge (|an |)n∈N gegen ∞ bestimmt
divergent. Wählt man eine beliebige positive Zahl ε > 0, dann existiert demnach eine natürliche
Zahl N ∈ N derart, dass |an | > 1/ε für alle n ∈ N mit n ≥ N gilt. Entsprechend gilt dann
1/|an | < ε für alle n ∈ N mit n ≥ N . Damit ist gezeigt, dass die Folge (1/an )n∈N eine Nullfolge
ist.
Die Frage ob eine Folge konvergiert oder divergiert ist nicht immer leicht zu beantworten.
Wir werden im Kapitel 4 auf diese Frage näher eingehen.
Übungsaufgaben
1. Die konvergenten, reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N , (dn )n∈N und (en )n∈N sind
durch
an :=
bn :=
cn :=
dn :=
en :=
2n + 1
,
3n2 + 2n + 1
√
n
n2 ,
1 + 2 + ··· + n
,
2
√n
n+ n
,
3n
(2n − 1)(3n − 2)(n + 1)
(5n − 1)(2n + 1)(3n − 1)
für alle n ∈ N definiert. Berechnen Sie die Grenzwerte dieser Folgen. Um den Grenzwert
der Folge (cn )n∈N zu berechnen, sollten Sie zunächst mittels vollständiger Induktion nach n
zeigen, dass 1 + 2 + . . . + n = n(n + 1)/2 für alle n ∈ N gilt.
2. Untersuchen Sie die reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N auf Konvergenz hin, und bestimmen Sie gegebenenfalls den Grenzwert. Die Folgen seien dabei durch
√
√
an := n − 1 − n,
n
n
,
bn := −
2
2
n 4
cn :=
,
4 n
√
p
dn := n(n2 + 1) − n3
für alle n ∈ N definiert.
3. Sei (V, k · k) eine normierte Algebra über K, sei (vn )n∈N eine konvergente Folge in V mit
Grenzwert v, und sei p : V → V, x 7→ α0 + α1 x + α2 x2 + . . . + αn xn ein Polynom mit
Koeffizienten in α0 , α1 , . . . , αn ∈ K. Begründen Sie, weshalb die Folge (p(vn ))n∈N gegen p(v)
konvergiert.
4. Zeigen Sie, dass die reellen Zahlenfolgen (an )n∈N , (bn )n∈N und (cn )n∈N , definiert durch
an := (−1)n ,
(
1
falls n ungerade ist,
bn :=
n/2 falls n gerade ist,
cn :=
für alle n ∈ N, divergent sind.
n2 − 2
n−1
Lernzielkontrolle
Nach dem Durcharbeiten diese Kapitels sollten Sie...
... wissen, was eine Folge und was eine Teilfolge ist.
... zu einer gegebenen rekursiven Definition die explizite Darstellung einer reellen Zahlenfolge bestimmen können.
... wissen, was eine Familie und was eine Teilfamilie ist.
... wissen, was eine Algebra und was eine normierte Algebra ist.
... wissen, was das nach unten beschränkte und nach oben beschränkte Teilmengen von
R sind.
... wissen, was das Infimum und das Minimum einer nach unten beschränkten Menge,
Folge oder Funktion ist. Insbesondere sollten Sie den Unterschied zwischen Infima
und Minima kennen.
... wissen, was das Supremum und das Maximum einer nach oben beschränkten Menge,
Folge oder Funktion ist. Insbesondere sollten Sie den Unterschied zwischen Suprema
und Maxima kennen.
... das Vollständigkeitsaxiom kennen.
... wissen, was monoton wachsende, streng monoton wachsende, monoton fallende und
streng monoton fallende Funktionen und Folgen sind.
... wissen, was konvergente und divergente Folgen sind.
... wissen, was eine Nullfolge ist.
... wissen, was bestimmt divergente Folgen sind.
... die Rechenregeln für Grenzwerte von Folgen kennen, und mit Hilfe dieser Regeln
Grenzwerte von konvergenten Folgen berechnen können, wo dies möglich ist.
52
Kapitel 3
Topologische Begriffe
3.1
Inneres, Rand und Abschluss von Mengen
Definition (innerer Punkt und Inneres). Sei (V, k · k) ein normierter Raum über K,
und sei M ⊆ V eine Menge. Ein Vektor v ∈ M heißt innerer Punkt von M , falls eine
positive Zahl ε > 0 existiert, so dass Bε (v) ⊆ M gilt. Die Menge aller inneren Punkte von
M wird das Innere von M genannt und mit M ◦ bezeichnet.
Wir erinnern uns, dass mit Bε (v) die offene Kugel in einem normierten Raum mit Mittelpunkt v und Radius ε bezeichnet wird. Gemäß Definition sind die inneren Punkte einer
Menge M stets Element von M . Daher gilt
M◦ ⊆ M
für jede eine Teilmenge M eines normierten Raums über K. Zu beachten ist, dass das
Innere einer Menge leer sein kann. Das ist bespielsweise für einpunktige Mengen der Fall.
Unter einpunktigen Mengen versteht man dabei Mengen von der Form {v} mit v ∈ V .
Definition (Randpunkt und Rand). Sei (V, k · k) ein normierter Raum über K, und
sei M ⊆ V eine Menge. Ein Vektor v ∈ V heißt Randpunkt von M , für jede positive Zahl
ε > 0 zwei Vektoren v0 , v1 ∈ Bε (v) existieren, so dass v0 6∈ M und v1 ∈ M gilt. Die Menge
aller Randpunkte von M wird der Rand von M genannt und mit ∂M bezeichnet.
Man beachte, dass die Randpunkte einer Menge M nicht notwendigerweise Elemente von
M sind. Daher ist ∂M in der Regel keine Teilmenge von M .
Man kann leicht zeigen, dass das Innere einer Menge und der Rand einer Menge disjunkt
sind, d.h. dass
M ◦ ∩ ∂M = ∅
für jede Menge M gilt. Außerdem überlegt man sich leicht, dass der Rand einer Menge
selbst keine inneren Punkte enthält, d.h. dass
(∂M )◦ = ∅
für jede Menge M gilt. Schließlich kann man zeigen, dass für jede Menge M die Identität
∂(∂M ) = ∂M
gilt. Neben dem Inneren und dem Rand einer Menge betrachtet man häufig auch den so
genannten Abschluss einer Menge.
53
54
KAPITEL 3. TOPOLOGISCHE BEGRIFFE
(a)
(b)
(c)
(d)
Abbildung 3.1: (a) Eine Teilmenge M des R2 . (b) Das Innere von M . (c) Der Rand
von M . (d) Der Abschluss von M .
Definition (Abschluss, abgeschlossene Hülle). Sei (V, k · k) ein normierter Raum über
K, und sei M ⊆ V eine Menge. Dann heißt die Menge
M := M ∪ ∂M
der Abschluss oder die abgeschlossene Hülle von M .
Da der Abschluss einer Menge M die Vereinigung von M selbst und dem Rand von M ist,
folgt unmittelbar, dass
M ⊆M
für jede eine Teilmenge M eines reellen oder komplexen normierten Raums. In Abbildung 3.1 werden das Innere, der Rand und der Abschluss einer Menge durch Skizzen
veranschaulicht. Nachfolgend geben wir außerdem einige wichtige Beispiele an.
Beispiele.
(a) Wir betrachten den normierten Raum (R, | · |). Inneres, Rand und Abschluss eines
nichtleeren Intervalls [a, b) = {x ∈ R | a ≤ x < b} mit Intervallgrenzen a, b ∈ R sind
dann durch
[a, b)◦ = (a, b),
∂[a, b) = {a, b},
[a, b) = [a, b]
gegeben. Die Randpunkte des Intervalls [a, b) sind also genau die Intervallgrenzen
a und b. Man beachte außerdem, dass man für die Intervalle (a, b), [a, b] und (a, b]
dasselbe Innere, denselben Rand sowie denselben Abschluss erhält wie für das hier
betrachtete Intervall [a, b).
(b) Für jede offene Kugel Br (v) in einem normierten Raum gilt
Br (v)◦ = Br (v),
∂Br (v) = Sr (v).
3.1. INNERES, RAND UND ABSCHLUSS VON MENGEN
55
(c) In jedem normierten Raum ist die abgeschlossene Kugel Br (v) der Abschluss der
offenen Kugel Br (v).
(d) Im normierten Raum (R2 , | · |) betrachten wir die Verbindungsstrecke
S := {x = (x1 , x2 )T ∈ R2 | x1 ∈ [0, 1], x2 = x1 },
zwischen den Punkten (0, 0)T und (1, 1)T . Dann gilt S ◦ = ∅, ∂S = S und S = S.
(e) Ist (V, k · k) ein normierter Raum über K, so überlegt man sich leicht, dass
V ◦ = V,
∂V = ∅,
V = V.
gilt. Fass man die leere Menge ∅ als Teilmenge von V auf, so erhält man außerdem
∅◦ = ∂∅ = ∅ = ∅.
♦
Übungsaufgaben
1. Bestimmen Sie für i = 1, 2, 3, 4 die Mengen (Mi )◦ und Mi ∩ ∂Mi , wobei
M1 := (−1, 0),
M2 := [1, 2],
M3 := (−2, 0) ∪ (0, 2),
M4 := Z.
Fassen Sie dabei alle Mengen als Teilmengen von R auf.
2. Bestimmen Sie ∂S \ S für die Menge S := {1/n | n ∈ N} ⊂ R.
3. Sei (V, k · k) ein normierter Raum über K. Zeigen Sie, dass für jede Teilmenge M ⊆ V die
folgenden Aussagen gelten:
• M ◦ ∩ ∂M = ∅
• (∂M )◦ = ∅
• ∂(∂M ) = ∂M
4. Sei (V, k · k) ein normierter Raum über K. Zeigen Sie, dass für je zwei Teilmengen A, B ⊆ V
die Identität ∂(A ∩ B) = (∂A ∩ B) ∪ (A ∩ ∂B) gilt.
56
KAPITEL 3. TOPOLOGISCHE BEGRIFFE
(a)
(b)
(c)
Abbildung 3.2: (a) Offene Teilmengen des R2 . (b) Abgeschlossene Teilmengen des R2
(c) Teilmengen des R2 , welche weder offen noch abgeschlossen sind.
3.2
Offene und abgeschlossene Mengen
Definition (offene Menge). Sei (V, k · k) ein normierter Raum über K. Eine Menge
O ⊆ V heißt offen, wenn jedes Element v ∈ O ein innerer Punkt von O ist.
Definition (abgeschlossene Menge). Sei (V, k · k) ein normierter Raum über K. Eine
Menge A ⊆ V heißt abgeschlossen, wenn die Menge V \ A offen ist.
Die Adjektive offen“ und abgeschlossen“ legen nahe, dass eine Menge genau dann offen
”
”
ist, wenn sie nicht abgeschlossen ist. Dies ist aber nicht der Fall! Wie wir anhand
einzelner Beispiele sehen werden, gibt es Mengen, die weder offen noch abgeschlossen sind.
Ferner gibt es Mengen, die sowohl offen als auch abgeschlossen sind.
Für die Identifizierung offener und abgeschlossener Mengen ist der nachfolgende Satz
sehr hilfreich.
Satz 3.1 (Charakterisierung offener und abgeschlossener Mengen). Sei (V, k · k)
ein normierter Raum über K, und sei M eine Teilmenge von V eine Menge. Dann gelten
die folgenden Aussagen.
(1) M ist genau dann offen, wenn M = M ◦ gilt.
(2) M ist genau dann abgeschlossen, wenn M = M gilt.
Aus Satz 3.1 folgt insbesondere, dass das Innere einer Menge offen, und dass der Abschluss
einer Menge abgeschlossen ist. Ferner gilt
∂M = ∂M ∪ ∂(∂M ) = ∂M ∪ ∂M = ∂M,
für jede Menge M , weshalb der Rand einer Menge abgeschlossen ist. Wir geben nun noch
einige Beispiele für offene und abgeschlossene Mengen an, wie auch Beispiel für Mengen,
die weder offen noch abgeschlossen sind.
Beispiele.
(a) Jedes offene Intervall (a, b) mit Intervallgrenzen a, b ∈ R ist eine offene Teilmenge
von R, und jedes abgeschlossene Intervall [a, b] ist eine abgeschlossene Teilmenge von
R.
(b) Unbeschränkte Intervalle der Form (a, ∞) und (−∞, b) mit a, b ∈ R sind offene
Teilmengen von R. Unbeschränkte Intervalle der Form [a, ∞) und (−∞, b] sind abgeschlossene Teilmengen von R.
3.2. OFFENE UND ABGESCHLOSSENE MENGEN
57
(c) Intervalle der Form [a, b) und (a, b] mit Intervallgrenzen a, b ∈ R sind weder offen
noch abgeschlossen.
(d) Jede offene Kugel Br (v) in einem normierten Raum ist offen. Wegen Sr (v) = ∂Br (v)
ist jede Sphäre in einem normierten Raum abgeschlossen. Ferner ist jede abgeschlossene Kugel Br (v) in einem normierten Raum abgeschlossen.
(e) Sei (V, k · k) ein normierter Raum über K. Fasst man die leere Menge ∅ als Teilmenge
von V auf, so gilt ∅ = ∅◦ . Also ist ∅ offen. Außerdem gilt V ◦ = V , weshalb V offen
ist. Offenbar gilt aber auch V \ ∅ = V und V \ V = ∅, woraus folgt, dass die Mengen
∅ und V sowohl offen als auch abgeschlossen sind.
Die Abgeschlossenheit einer Menge A kann auch über das Konvergenzverhalten der Folgen
in A charakterisiert werden.
Satz 3.2 (Folgenkriterium für Abgeschlossenheit). Sei (V, k · k) ein normierter Raum
über K. Eine Teilmenge A ⊆ V ist genau dann abgeschlossen, wenn der Grenzwert jeder
konvergenten Folge in A ein Element von A ist.
Mit Hilfe des von Satz 3.2 bereit gestellten Folgenkriteriums, kann man oft die Abgeschlossenheit einer Menge widerlegen. Man betracht dazu das folgende Beispiel.
Beispiel. Wir betrachten das Intervall (0, 1] ⊂ R. Die Folge (an )n∈N , definiert durch
an := 1/n für alle n ∈ N, ist offenbar eine Folge in (0, 1], die gegen Null konvergiert. Da
die Zahl 0 jedoch kein Element von (0, 1] ist, kann das Intervall (0, 1] nach Satz 3.2 nicht
abgeschlossen sein.
Als nächstes untersuchen wir, was man über Vereinigungen oder Durchschnitte offener
bzw. abgeschlossener Mengen aussagen kann.
Satz 3.3. Sei (V, k · k) ein normierter Raum über K. Dann gelten die folgenden Aussagen.
(1) Sei (Oi )i∈I eine Familie offener Teilmengen von V . Dann ist die Vereinigung
[
Oi := v ∈ V ∃i ∈ I : v ∈ Oi
i∈I
ebenfalls eine offene Teilmenge von V .
(2) Sei O1 , O2 , . . . , Om eine endliche Anzahl offener Teilmengen von V . Dann ist der
Durchschnitt O1 ∩ O2 ∩ · · · ∩ Om ebenfalls eine offene Teilmenge von V .
(3) Sei (Ai )i∈I eine Familie abgeschlossener Teilmengen von V . Dann ist der Durchschnitt
\
Ai := v ∈ V ∀i ∈ I : v ∈ Ai
i∈I
ebenfalls eine abgeschlossene Teilmenge von V .
(4) Sei A1 , A2 , . . . , Am eine endliche Anzahl abgeschlossener Teilmengen von V . Dann
ist die Vereinigung A1 ∪ A2 ∪ · · · ∪ Am ebenfalls eine abgeschlossene Teilmenge von
V.
58
KAPITEL 3. TOPOLOGISCHE BEGRIFFE
Die Aussagen von Satz 3.3 können folgendermaßen zusammengefasst werden: Die Vereinigung beliebig vieler, sowie der Durschnitt endlich vieler offenen Mengen ist offen, und der
Durchschnitt beliebig vieler, sowie die Vereinigung endlich vieler abgeschlossener Mengen
ist abgeschlossen. Dass die Aussagen (2) und (4) von Satz 3.3 tatsächlich nur für endlich
viele offene bzw. abgeschlossene Mengen gelten können, soll anhand der folgenden Beispiele
verdeutlicht werden.
Beispiele.
(a) Für jedes n ∈ N sei das offene Intervall In ⊂ R durch In := (−1/n, 1/n) definiert.
Man kann leicht zeigen, dass
\
In = {0}
n∈N
gilt. Die einpunktige Menge {0} ist eine abgeschlossene Teilmenge von R.
(b) Für jedes n ∈ N sei das abgeschlossene Intervall In ⊂ R durch In := [−n, n] definiert.
Man überlegt sich leicht, dass dann
[
In = R
n∈N
gilt. Offenbar ist R eine offene Menge.
Übungsaufgaben
1. Zeigen Sie, dass die folgenden Mengen offene Teilmengen von R sind.
O1 := (−1, 1) \ {0},
[
O2 :=
(α, α + 1),
α∈[0,1]
O3 := R \ [−3, −2] ∪ [2, 3] ,
O4 := {1/x | x > 0}.
2. Sei (V, k · k) ein normierter Raum über K, und sei O ⊆ V eine offene und A ⊆ V eine
abgeschlossene Menge. Zeigen Sie, dass O \ A offen und A \ O abgeschlossen ist.
3. Zeigen Sie mit Hilfe des Folgenkriteriums für Abgeschlossenheit, dass jede nach unten beschränkte, abgeschlossene Teilmenge von R ein Minimum besitzt. Zeigen Sie außerdem, dass
jede nach oben beschränkte, abgeschlossene Menge ein Maximum besitzt.
4. Untersuchen Sie die folgenden Mengen Teilmengen von R2 auf Offenheit und Abgeschlossenheit.
M1 := [0, 1] × (0, 1],
M2 := B1 (0) \ {0},
M3 := (x1 , x2 )T ∈ R2 x2 > 1 ,
M4 := R2 \ Z2 .
Der Vektorraum R2 sei dabei mit der euklidischen Norm versehen.
3.3. BESCHRÄNKTHEIT
3.3
59
Beschränktheit
Definition (beschränkte Menge). Sei (V, k · k) ein normierter Raum über K. Eine Menge B ⊆ V heißt beschränkt, wenn es eine positive Zahl R > 0 gibt, so dass kbk ≤ R für
alle b ∈ B gilt.
Ist (V, k · k) ein normierter Raum, so ist eine Teilmenge B ⊆ V offenbar genau dann
beschränkt, wenn eine nichtnegative Zahl R ≥ 0 existiert, so dass
B ⊆ BR (0)
gilt, wobei BR (0) die abgeschlossene Kugel um den Ursprung in V mit Radius R bezeichnet. Dies bedeutet insbesondere, dass die leere Menge ∅ eine beschränkte Menge ist. Eine
Menge B ⊆ V ist auch dann beschränkt, wenn ein Vektor v ∈ V und eine nichtnegative
Zahl r ≥ 0 existiert, so dass
B ⊆ Br (v)
gilt. Man kann nämlich leicht zeigen, dass dann
Br (v) ⊆ Bkvk+r (0)
für alle v ∈ V und alle r > 0 gilt. Da kvk+r eine nichtnegative Zahl ist, hat man somit eine
abgeschlossene Kugel um den Ursprung in V gefunden, welcher die Menge B als Teilmenge
enthält.
In Abschnitt 2.3 wurden bereits das Konzept der Beschränktheit nach oben sowie das
Konzept der Beschränktheit nach unten für Teilmengen von R eingeführt. Das folgende Lemma bringt diese Konzepte mit dem Konzept der Beschränktheit für Teilmengen
normierter Räume in Verbindung.
Lemma 3.4. Eine nichtleere Teilmenge von R ist genau dann beschränkt, wenn sie nach
unten und nach oben beschränkt ist.
Als nächstes gehen wir der Frage nach, was man über Vereinigungen und Durchschnitte
beschränkter Mengen aussagen kann.
Satz 3.5. Sei (V, k · k) ein normierter Raum über K. Dann gelten die folgenden Aussagen.
(1) Sei (Bi )i∈I eine Familie beschränkter Teilmengen von V . Dann ist der Durchschnitt
\
Bi
i∈I
ebenfalls eine beschränkte Teilmenge von V .
(2) Sei B1 , B2 , . . . , Bm eine endliche Anzahl beschränkter Teilmengen von V . Dann ist
die Vereinigung B1 ∪ B2 ∪ · · · ∪ Bm ebenfalls eine beschränkte Teilmenge von V .
Satz 3.5 besagt, dass der Durchschnitt beliebig vieler und die Vereinigung endlich vieler
beschränkter Mengen wieder beschränkt ist. Die Vereinigung unendlich vieler beschränkter
Mengen, muss hingegen nicht beschränkt sein, wie das nachfolgende Beispiel verdeutlicht.
60
KAPITEL 3. TOPOLOGISCHE BEGRIFFE
(a)
(b)
Abbildung 3.3: (a) Beschränkte Teilmengen des R2 . (b) Die Gerade M1 und der
Halbraum M2 sind Teilmengen des R2 , welche nicht beschränkt sind.
Beispiel. Für jede ganze Zahl k ∈ Z sei das abgeschlossene Intervall Ik := [k, k + 1]
definiert. Offenbar ist jedes dieser Intervalle beschränkt. Als Vereinigung aller Intervalle
erhält man jedoch die Menge
[
Ik = R,
k∈Z
welche nicht beschränkt ist.
♦
Als nächsten übertragen wir das Konzept der Beschränktheit auf Folgen in einem normierten Raum.
Definition (beschränkte Folge). Sei (V, k · k) ein normierter Raum über K. Eine Folge
(vn )n∈N in V heißt beschränkt, wenn die Menge aller Folgenglieder beschränkt ist.
Offenbar ist eine Folge genau dann beschränkt, wenn man eine positive Zahl R > 0 finden
kann, so dass alle Folgenglieder Elemente der abgeschlossenen Kugel BR (v) sind. Dies ist
genau dann der Fall, wenn
kvn k ≤ R
für alle n ∈ N gilt. Eine reelle Zahlenfolge ist nach Lemma 3.4 genau dann beschränkt,
wenn sie sowohl nach oben als auch nach unten beschränkt ist. Man betrachte hierzu auch
die folgenden Beispiele.
Beispiele.
(a) Jede konstante Folge ist beschränkt.
(b) Die reelle Zahlenfolge (an )n∈N , definiert durch an := 1 − 1/n für alle n ∈ N, ist durch
0 nach unten und durch 1 nach oben beschränkt. Also ist (an )n∈N eine beschränkte
Folge in R.
(c) Die Folge (x(k) )k∈N in R2 sei durch
(k)
x
:=
sin(k)
cos(k)
für alle k ∈ N definiert. Man rechnet leicht nach, dass |x(k) | = 1 für alle k ∈ N gilt,
weshalb die Folge (x(k) )k∈N beschränkt ist.
3.3. BESCHRÄNKTHEIT
61
(d) Die Folge (y (k) )k∈N in R2 , welche durch
y
(k)
:=
k
1/k
für alle k ∈ N definiert ist, ist nicht beschränkt. Man kann nämlich leicht zeigen,
dass |y (k) | > k für alle k ∈ N gilt. Entsprechend findet man zu jeder positiven Zahl
R > 0 eine natürliche Zahl k ∈ N, so dass x(k) 6∈ BR (0) gilt.
Für konvergente Folgen gilt die folgende Aussage.
Lemma 3.6. Jede konvergente Folge ist beschränkt.
Beschränktheit ist also ein notwendiges Kriterium für die Konvergenz von Folgen. Abschließend führen wir noch das Konzept beschränkter Funktionen ein.
Definition (beschränkte Funktion). Sei X eine nichtleere Menge, und sei (W, k · k)
ein normierter Raum. Eine Funktion f : X → W heißt beschränkt, wenn ihre Wertemenge
beschränkt ist. Die Menge aller beschränkten Funktionen von X nach W wird mit B(X, W )
bezeichnet. Falls W = R gilt, bezeichnet man diese Menge auch mit B(X).
Übungsaufgaben
1. Sei (V, k · k) ein normierter Raum über K. Zeigen Sie, dass
Br (v) ⊆ Bkvk+r (0)
für jeden Vektor v ∈ V und jede positive Zahl r > 0 gilt.
2. Untersuchen Sie die reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N auf Beschränktheit. Die Folgen sind durch
an := (−1)n ,
2n3 + n
,
n3 + 1
n4 − 3
,
cn := − 2
n +2
dn := sin(n)
bn :=
für alle n ∈ N definiert.
3. Untersuchen Sie die folgenden Funktionen auf Beschränktheit.
f1 : (−1, 1] → R, x 7→ x2 ,
1 − x1
f2 : R2 → R2 , x 7→
x22
f3 : R2 \ {0} → R, x 7→ 1/|x|,
sin(t)
f4 : R → R2 , t 7→
.
cos(t)
4. Sei (V, k · k) ein normierter Raum über K und M ⊆ V eine Menge, die nicht beschränkt ist.
Zeigen Sie, dass dann eine Folge (vn )n∈N in M existiert, so dass kvn k ≥ n für alle n ∈ N gilt.
62
3.4
KAPITEL 3. TOPOLOGISCHE BEGRIFFE
Kompakte Mengen
Definition (Überdeckung). Sei X eine beliebige Menge, und sei M ⊆ X eine Teilmenge
von X. Eine Familie (Mi )i∈I bestehend aus Teilmengen von X wird eine Überdeckung von
M genannt, wenn
[
M⊆
Mi
i∈I
gilt, d.h. wenn die Vereinigung aller zur Familie gehörenden Mengen die Menge M überdeckt.
Definition (offene Überdeckung). Sei (V, k · k) ein normierter Raum über K, und sei
M eine Teilmenge von V . Eine Überdeckung (Oi )i∈I von M heißt offen, wenn für jeden
Index i ∈ I die Menge Oi offen ist.
Definition (kompakte Menge). Sei (V, k · k) ein normierter Raum über K. Eine Menge
K ⊆ V heißt kompakt, wenn man aus jeder offenen Überdeckung (Oi )i∈I der Menge K
endlich viele offene Mengen Oi1 , Oi2 , . . . , Oim auswählen kann, so dass K ⊆ Oi1 ∪ Oi2 ∪
· · · ∪ Oim gilt.
Die definierende Eigenschaft kompakter Mengen kann nur schwer veranschaulicht werden.
Es genügt nicht sich vorzustellen, dass eine Menge kompakt ist, wenn sie mit einer endlichen Anzahl offener Mengen überdeckt werden kann. Das gilt nämlich für jede Teilmenge
eines normierten Raums. Vielmehr ist eine Menge M genau dann kompakt, wenn man aus
jeder Familie offener Mengen, deren Vereinigung M überdeckt, eine endliche Teilfamilie
auswählen kann, deren Vereinigung die Menge M ebenfalls überdeckt. Im allgemeinen ist
es schwierig zu entscheiden, ob eine Menge kompakt ist oder nicht. Wir wollen hier zwei
sehr einfache Fälle betrachten, in denen dies möglich ist.
Beispiel.
(a) Sei (V, k · k) ein normierter Raum, und sei v ∈ V ein beliebiger Vektor. Dann ist
die einpunktige Menge {v} kompakt. Ist nämlich (Oi )i∈I eine beliebige offene Überdeckung von {v}, so gilt
[
{v} ⊆
Oi ,
i∈I
und somit auch
v∈
[
Oi .
i∈I
Daraus folgt wiederum, dass mindestens ein Index i1 ∈ I existiert, so dass v ∈ Oi1
gilt. Dann gilt aber auch {v} ⊆ Oi1 , was bedeutet, dass Oi1 die Menge {v} bereits
überdeckt.
(b) Die Menge der ganzen Zahlen Z ist eine Teilmenge von R. Definiert man zu jeder
ganzen Zahl k ∈ Z das offene Intervall Ik := (k − 1/3, k + 1/3), so ist (Ik )k∈Z
eine offene Überdeckung von Z, welche aus unendlich vielen Intervallen besteht.
Man erkennt leicht, dass für jede nichtleere Teilmenge N ⊆ Z die Familie (Ik )k∈Z\N
keine Überdeckung von Z ist. Daher kann es keine endliche Anzahl von Intervallen
Ik1 , Ik2 , . . . , Ikm geben, so dass Ik1 ∪ Ik2 ∪ · · · ∪ Ikm die Menge Z überdeckt. Also ist
Z keine kompakte Teilmenge von R.
3.4. KOMPAKTE MENGEN
(a)
63
(b)
Abbildung 3.4: (a) Kompakte Teilmengen des R2 . (b) Teilmengen des R2 , welche nicht
kompakt sind.
Die Kompaktheit einer Menge K kann man auch über das Konvergenzverhalten aller
Folgen in K charakterisieren.
Satz 3.7 (Folgenkriterium für Kompaktheit). Sei (V, k · k) ein normierter Raum über
K. Eine Teilmenge K ⊆ V ist genau dann kompakt, wenn jede Folge in K eine konvergente
Teilfolge mit Grenzwert in K besitzt.
Als nächstes untersuchen wir die Eigenschaften kompakter Mengen.
Satz 3.8. Sei (V, k · k) ein normierter Raum über K, und sei K ⊆ V eine kompakte
Teilmenge. Dann ist K beschränkt und abgeschlossen.
Satz 3.8 besagt, dass Abgeschlossenheit und Beschränktheit notwendige Bedingungen für
die Kompaktheit sind. Entsprechend kann man diesen Satz verwenden, um zu zeigen, dass
bestimmte Mengen nicht kompakt sind.
Beispiele.
(a) Offene Intervalle (a, b), sowie Intervalle der Form (a, b] und [a, b) mit Intervallgrenzen
a, b ∈ R sind nicht abgeschlossen. Daher sind sie auch nicht kompakt.
(b) Intervalle der Form [a, ∞) und (−∞, b] mit Intervallgrenzen a, b ∈ R sind nicht
beschränkt, weshalb sie auch nicht kompakt sind.
♦
Für Teilmengen der Vektorräume Rn kann man zeigen, dass Beschränktheit und Abgeschlossenheit nicht nur notwendige, sondern auch hinreichende Bedingungen für Kompaktheit sind. Der entsprechende Satz ist als Satz von Heine–Borel bekannt.
Satz 3.9 (Heine–Borel). Eine Teilmenge des Kn ist genau dann kompakt, wenn sie
beschränkt und abgeschlossen ist. Dies gilt für alle n ∈ N.
Die praktische Anwendung des Satzes von Heine–Borel soll hier durch einige Beispiele
verdeutlicht werden.
Beispiele.
(a) Die Menge der reellen Zahlen R kann als eindimensionaler Vektorraum über R aufgefasst werden. Abgeschlossene Intervalle [a, b] mit Intervallgrenzen a, b ∈ R sind
sowohl abgeschlossen als auch beschränkt. Nach dem Satz von Heine–Borel sind solche Intervalle also kompakt.
64
KAPITEL 3. TOPOLOGISCHE BEGRIFFE
(b) Für jede natürliche Zahl n ∈ N sind die abgeschlossenen Kugeln Br (x) und die
Sphären Sr (x) in Kn sowohl abgeschlossen als auch beschränkt. Nach dem Satz von
Heine–Borel sind diese Mengen also kompakt.
♦
Eine wichtige Folgerung aus dem Folgenkriterium für Kompaktheit (siehe Satz 3.7) und
dem Satz von Heine–Borel (siehe Satz 3.9) ist der Satz von Bolzano–Weierstraß.
Satz 3.10 (Bolzano–Weierstraß). Jede beschränkte Folge in Kn besitzt eine konvergente Teilfolge. Dies gilt für alle n ∈ N.
Übungsaufgaben
1. Untersuchen Sie die folgenden Teilmengen von R auf Kompaktheit:
M1 := [1, 2] ∪ [3, 4],
M2 := [−1, 1] \ {0},
M3 := {1/n | n ∈ N} ∪ {0},
M4 := N.
2. Zeigen Sie unter Verwendung der Sätze 3.3, 3.5 und 3.9, dass für jede natürliche Zahl n ∈ N
der Durchschnitt beliebig vieler und die Vereinigung endlich vieler kompakter Teilmengen
von Kn ebenfalls kompakt ist.
3.5. VOLLSTÄNDIGKEIT
3.5
65
Vollständigkeit
Definition (Cauchy–Folge). Sei (V, k · k) ein normierter Raum über K. Eine Folge
(vn )n∈N in V heißt Cauchy–Folge, wenn für jede positive Zahl ε > 0 eine natürliche Zahl
N ∈ N existiert, so dass
kvn − vm k < ε für alle m, n ∈ N mit n ≥ m ≥ N
gilt.
Anschaulich gesprochen ist eine Folge genau dann eine Cauchy–Folge, wenn ihre Folgenglieder für wachsende Indizes immer enger zusammenrücken. Oft ist die folgende Charakterisierung von Cauchy–Folgen hilfreich: Eine Folge (vn )n∈N in einem normierten Raum
(V, k · k) über K ist genau dann eine Cauchy–Folge, wenn für jede positive Zahl ε > 0
eine natürliche Zahl N ∈ N existiert, so dass für alle m, n ∈ N aus min{m, n} ≥ N stets
kvn − vm k < ε folgt. Das nachfolgende Lemma besagt, dass dies insbesondere dann der
Fall ist, wenn die Folge gegen einen Grenzwert konvergiert.
Lemma 3.11. Jede konvergente Folge ist eine Cauchy–Folge.
Wir wissen bereits, dass jede konvergente Folge beschränkt ist. Das folgende Lemma liefert
eine analoge Aussage für Cauchy–Folgen und somit eine notwendige Bedingung dafür, dass
eine Folge eine Cauchy–Folge sein kann.
Lemma 3.12. Jede Cauchy–Folge ist beschränkt.
Es stellt sich nun die folgende Frage: Angenommen, man hat eine Cauchy–Folge, deren
Glieder allesamt Elemente einer nichtleeren Teilmenge M eines normierten Raums sind.
Kann man dann schließen, dass die Folge einen Grenzwert besitzt, der ebenfalls ein Element
von M ist? Es zeigt sich, dass dies im Allgemeinen nicht der Fall ist. Aus diesem Grund
führt man die Eigenschaft der Vollständigkeit für Teilmengen eines normierten Raums ein.
Definition (vollständige Menge). Sei (V, k · k) ein normierter Raum über K. Eine Teilmenge M ⊆ V heißt vollständig, wenn jede Cauchy–Folge in M gegen ein Element von M
konvergiert.
Eine nicht vollständige Teilmenge eines normierten Raums wird unvollständig genannt. Ist
(V, k · k) ein normierter Raum über K, dann ist der Vektorraum V selbst ebenfalls eine Teilmenge von V . Daher kann man die Eigenschaft der Vollständigkeit auch für V definieren.
Dies führt auf den wichtigen Begriff eines Banach–Raums bzw. den eines Hilbert–Raums.
Definition (Banach–Raum). Ein normierter Raum (V, k · k) über K heißt Banach–
Raum über K, wenn V vollständig ist.
Definition (Hilbert–Raum). Ein Innenproduktraum (V, h · , · i) über K heißt Hilbert–
Raum über K, wenn V bezüglich der vom Skalarprodukt h · , · i induzierten Norm k · k
vollständig ist, d.h. wenn (V, k · k) ein Banach–Raum über K ist.
Da jede normierte Algebra insbesondere auch ein normierter Raum ist, kann man den
Begriff der Vollständigkeit auch auf normierte Algebren übertragen. Man kommt dann zu
so genannten Banach–Algebren.
66
KAPITEL 3. TOPOLOGISCHE BEGRIFFE
Definition (Banach–Algebra). Eine normierte Algebra (V, k · k) über K heißt Banach–
Algebra über K, wenn V vollständig ist.
Wir geben hier noch ein hinreichendes Kriterium für die Vollständigkeit einer Menge an.
Satz 3.13. Jede kompakte Menge ist vollständig.
Von besonderem Interesse sind die vollständigen Teilmengen der normierten Räume Rn
und Cn mit n ∈ N. Der folgende Satz liefert eine entsprechende Charakterisierung.
Satz 3.14. Eine Teilmenge von Kn ist genau dann vollständig, wenn sie abgeschlossen ist.
Dies gilt für alle n ∈ N.
Wie wir bereits wissen, ist der normierte Raum Kn für jede natürliche Zahl n ∈ N abgeschlossen. Nach Satz 3.14 ist Kn also vollständig und somit ein Banach–Raum über K.
Versieht den Vektorraum Rn darüber hinaus mit einem Skalarprodukt, so erhält man einen
Hilbert–Raum über R.
Es ist wichtig zu wissen, dass in allgemeinen normierten Räumen über K die Abgeschlossenheit einer Menge nicht gleichbedeutend mit deren Vollständigkeit ist. Die Teilmengen der normierten Räume Kn nehmen in dieser Hinsicht also eine Sonderstellung
ein.
Als nächstes wollen wir noch ein wichtiges Beispiel für eine unvollständige Teilmenge
von R kennen lernen.
Beispiel. Die Menge der rationalen Zahlen Q ist eine unvollständige Teilmenge von R.
Man betrachte dazu die Folge (an )n∈N , welche gemäß
a1 := 1,
an+1 :=
a2n + 2
2an
für alle n ∈ N rekursiv definiert ist. Da jedes Glied dieser Folge durch Addition, Multiplikation und Division von Bruchzahlen entsteht, ist (an )n∈N eine Folge
√ in Q. Man kann
außerdem zeigen, dass die Folge (an )n∈N gegen die irrationale Zahl 2 konvergiert. Da
die Folge konvergent ist, ist sie auch eine Cauchy–Folge. Die Folge (an )n∈N ist also eine
Cauchy–Folge in Q, die gegen einen Grenzwert konvergiert, der nicht Element von Q ist.
Man beachte, dass aufgrund von Satz 3.14 die Menge Q auch nicht abgeschlossen ist.
Dies kann man auch mit Hilfe des Folgenkriteriums für die Abgeschlossenheit einer Menge
zeigen (siehe Satz 3.2).
Übungsaufgaben
1. Zeigen Sie, dass die reellen Zahlenfolgen (an )n∈N und (bn )n∈N Cauchy–Folgen in R sind. Die
Folgen seien dabei durch
(−1)n
,
n
1
bn := n
3
für alle n ∈ N definiert. Lösen Sie diese Aufgabe ohne Verwendung von Lemma 3.11, indem
Sie die definierende Eigenschaft von Cauchy–Folgen nachweisen.
an :=
2. Sei (V, k · k) ein normierter Raum über K, seien (vn )n∈N und (wn )n∈N zwei Cauchy–Folgen
in V , und sei α ∈ K ein beliebiger Skalar. Zeigen Sie, dass die Folgen (vn + wn )n∈N und
(αvn )n∈N ebenfalls Cauchy–Folgen in V sind.
3.6. ZUSAMMENHÄNGENDE MENGEN
(a)
67
(b)
Abbildung 3.5: (a) Zusammenhängende Teilmengen des R2 (b) Eine nicht zusammenhängende Teilmenge des R2 .
3.6
Zusammenhängende Mengen
Definition (zusammenhängende Menge). Sei (V, k · k) ein normierter Raum über K.
Eine Menge M ⊆ V wird nicht zusammenhängend genannt, wenn es zwei offene Mengen
O1 , O2 ⊆ V gibt, so dass M ⊆ O1 ∪ O2 und O1 ∩ M 6= ∅ und O2 ∩ M 6= ∅ und O1 ∩ O2 = ∅
gilt. Anderfalls heißt die Menge M zusammenhängend.
Die mathematische Definition zusammenhängender Mengen ist auf den ersten Blick eher
unanschaulich. In den meisten Fällen genügt die Vorstellung, dass eine Menge genau dann
zusammenhängend ist, wenn sie nicht aus mehreren separaten, nichtleeren Teilmengen
besteht (siehe Abbdildung 3.5). Was genau mit separat“ gemeint ist, wird durch die ma”
thematische Definition präzisiert: Zwei nichtleere Teilmengen werden als separat angesehen, wenn sie in verschiedenen, disjunkten, offenen Mengen enthalten sind. Man betrachte
hierzu auch die nachfolgenden Beispiele.
Beispiele.
(a) Jede offene Kugel Br (v) und jede abgeschlossene Kugel Br (v) in einem normierten
Raum über K ist zusammenhängend.
(b) Die Menge M = [−2, −1] ∪ [1, 2] ist nicht zusammenhängend. Definiert man nämlich
die offenen Intervalle O1 := (−3, 0) und O2 := (0, 3), so gilt M ⊆ O1 ∪ O2 , O1 ∩ M =
[−2, 1], O2 ∩ M = [1, 2] und O1 ∩ O2 6= ∅.
Das folgende Lemma ist oft nützlich, um zusammenhängende Mengen zu identifizieren.
Lemma 3.15. Sei (V, k · k) ein normierter Raum über K, sei M ⊂ V eine zusammenhängende Menge, und sei Z ⊆ V eine weitere Menge, so dass M ⊆ Z ⊆ M gilt. Dann ist Z
ebenfalls zusammenhängend.
Der folgende wichtige Satz charakterisiert die nichtleeren, zusammenhängenden Teilmengen von R.
Satz 3.16. Eine nichtleere Teilmenge von R ist genau dann zusammenhängend, wenn sie
ein Intervall ist.
Wir erinnern daran, dass der Begriff Intervall“ sämtliche Teilmengen von R einschließt,
”
welche von der Form (a, b), [a, b], (a, b], [a, b), (−∞, b), (−∞, b], (a, ∞) und [a, ∞) sind.
Auch die Menge der reellen Zahlen R selbst ist ein Intervall, welches gelegentlich als
(−∞, ∞) bezeichnet wird. Der Satz 3.16 besagt also auch, dass die Menge R zusammenhängend ist.
68
KAPITEL 3. TOPOLOGISCHE BEGRIFFE
Übungsaufgaben
1. Untersuchen Sie, ob die folgenden Teilmengen von R zusammenhängend sind.
M1 := (−∞, 2) ∩ (−2, ∞),
M2 := Z,
M3 := (−1, 1) \ {0},
[
M4 :=
[n − 1, n).
n∈N
Verwenden Sie nach Möglichkeit Satz 3.16.
2. Zeigen Sie durch Angabe jeweils eines Gegenbeispiels, dass die Vereinigung und der Durchschnitt von zwei zusammenhängenden Mengen im Allgemeinen nicht zusammenhängend ist.
3. Sei (V, k · k) ein normierter Raum über K. Zeigen Sie, dass jede einpunktige Menge {v}, mit
v ∈ V , zusammenhängend ist.
4. Zeigen Sie, dass jede abgeschlossene und zusammenhängende Teilmenge von R, welche nach
oben, nicht aber nach unten beschränkt ist, ein Intervall von der Form (−∞, b] mit b ∈ R
ist.
Lernzielkontrolle
Nach dem Durcharbeiten diese Kapitels sollten Sie...
... wissen, was ein innerer Punkt und was das Innere einer Menge ist.
... wissen, was ein Randpunkt und was der Rand einer Menge ist.
... wissen, was der Abschluss einer Menge ist.
... wissen, was eine offene und was eine abgeschlossene Menge ist.
... wissen, was beschränkte Mengen, Folgen und Funktionen sind.
... den Satz von Heine–Borel kennen.
... wissen, was eine Cauchy–Folge ist.
... wissen, dass jede konvergente Folge eine Cauchy–Folge ist.
... wissen, dass jede konvergente Folge und jede Cauchy–Folge beschränkt ist.
... wissen, was es bedeutet, dass die Menge R vollständig ist, und dass die Menge Q
nicht vollständig ist.
... wissen, was ein Banach–Raum und was ein Hilbert–Raum ist.
... wissen, was eine zusammenhängende Menge ist.
... wissen, dass Intervalle die einzigen zusammenhängenden Teilmengen von R sind.
69
Kapitel 4
Konvergenzbegriffe
und Konvergenzkriterien
4.1
Konvergenz reeller Zahlenfolgen
Im Abschnitt 2.5 haben wir bereits den Begriff des Grenzwerts einer Folge eingeführt
und Rechenregeln für Folgengrenzwerte aufgestellt. In diesem Abschnitt widmen wir uns
speziell den Folgen in R. Im Mittelpunkt unserer Untersuchungen steht dabei die Frage,
ob eine gegebene Folge in R konvergiert oder divergiert. Insbesondere wollen wir hinreichende Bedingungen für die Konvergenz einer reellen Zahlenfolge zusammenstellen. Solche
Bedingungen nennt man Konvergenzkriterien.
Das erste Konvergenzkriterium, welches wir betrachten, ist als Cauchy–Kriterium bekannt. Das Cauchy–Kriterium folgt direkt aus der Tatsache, dass R ein vollständiger normierter Raum ist (siehe Satz 3.14).
Satz 4.1 (Cauchy–Kriterium). Eine Folge (an )n∈N in R ist genau dann konvergent,
wenn sie eine Cauchy–Folge ist, d.h. wenn zu jeder positiven Zahl ε > 0 eine natürliche
Zahl N ∈ N existiert, so dass
|an − am | < ε für alle m, n ∈ N mit n ≥ m ≥ N
gilt.
Das Cauchy–Kriterium liefert sowohl ein notwendiges als auch ein hinreichendes Kriterium
für die Konvergenz einer reellen Zahlenfolge. Es ist jedoch nur selten geeignet, um die
Konvergenz einer gegebenen Folge nachzuweisen. Deshalb geben wir noch zwei weitere
Konvergenzkriterien an, welche auf der Tatsache beruhen, dass R ein angeordneter Körper
ist (und zwar durch die Ordnungsrelation ≤). Dem nachfolgenden Satz kommt dabei eine
zentrale Rolle zu.
Satz 4.2. Seien (an )n∈N und (bn )n∈N zwei konvergente Folgen in R derart, dass eine
natürliche Zahl N ∈ N existiert, so dass an ≤ bn für alle n ∈ N mit n ≥ N gilt. Dann gilt
lim an ≤ lim bn .
n→∞
n→∞
Gemäß Satz 4.2 bleibt die Ordnungsrelation ≤ beim Grenzübergang von reellen
Zahlenfolgen erhalten. Seien also (an )n∈N und (bn )n∈N zwei reelle Zahlenfolgen, die
70
4.1. KONVERGENZ REELLER ZAHLENFOLGEN
71
gegen Grenzwerte a ∈ R bzw. b ∈ R konvergieren, und deren Folgenglieder die Ungleichung
an ≤ bn für alle n ∈ N erfüllen, dann gilt auch a ≤ b. Die strikte Ordnungsrelation <
bleibt im Allgemeinen jedoch nicht erhalten! Selbst wenn also die Glieder der Zahlenfolgen
(an )n∈N und (bn )n∈N die strikte Ungleichung an < bn für alle n ∈ N erfüllen, gilt für die
Grenzwerte im Allgemeinen nur noch a ≤ b. So erfüllen beispielsweise die Glieder der
Folgen (an )n∈N und (bn )n∈N , welche durch an := 1/(n + 1) und bn := 1/n für alle n ∈ N
definiert sind, die strikte Ungleichung an < bn für alle n ∈ N. Die Grenzwerte a = 0 und
b = 0 dieser Folgen erfüllt jedoch nur noch die Ungleichung a ≤ b.
Eine wichtige Folgerung aus Satz 4.2 ist das folgende Konvergenzkriterium für reelle
Zahlenfolgen, welches unter dem Namen Sandwichtheorem bekannt ist.
Satz 4.3 (Sandwichtheorem). Seien (pn )n∈N und (qn )n∈N zwei Folgen in R, die gegen
denselben Grenzwert a ∈ R konvergieren. Sei außerdem (an )n∈N eine Folge in R mit der
Eigenschaft, dass eine natürliche Zahl N ∈ N existiert, so dass pn ≤ an ≤ qn für alle n ∈ N
mit n ≥ N gilt. Dann konvergiert die Folge (an )n∈N ebenfalls gegen a.
Das folgende Beispiel verdeutlicht, wie man das Sandwichtheorem bei bestimmten reellen
Zahlenfolgen dazu verwenden kann, den Grenzwert zu bestimmen.
Beispiel. Wir betrachten die reelle Zahlenfolge (an )n∈N , welche durch
an :=
für alle n ∈ N definiert ist. Offenbar gilt
n
1
2n
2
1
= n ≤ an ≤ 2 =
2
2
n
n
sowie
2n
2n
für alle n ∈ N mit n ≥ 4,
n
1
2
= lim
= 0.
n→∞ 2
n→∞ n
lim
Nach dem Sandwichtheorem konvergiert die Folge (an )n∈N also ebenfalls gegen Null.
♦
Ein weiteres wichtiges Konvergenzkriterium für reelle Zahlenfolgen ist das so genannte
Monotoniekriterium.
Satz 4.4 (Monotoniekriterium). Sei (an )n∈N eine Folge in R, welche monoton wachsend
und nach oben beschränkt ist. Dann konvergiert die Folge (an )n∈N gegen ihr Supremum.
Falls die Folge (an )n∈N monoton fallend und nach unten beschränkt ist, konvergiert sie
gegen ihr Infimum.
Eine monoton wachsende oder monoton fallende Zahlenfolge (an )n∈N , welche gegen einen
Grenzwert a ∈ R konvergiert, wird gelegentlich auch monoton konvergent genannt. Falls
die Folge monoton wachsend ist, schreibt man häufig
an % a
(n → ∞),
um die monotone Konvergenz anzudeuten. Ist die Folge monoton fallend, so schreibt man
auch
an & a (n → ∞).
Aus dem Monotoniekriterium kann man noch ein weiteres, etwas schwächeres“ Konver”
genzkriterium für reelle Zahlenfolgen herleiten.
72
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
Satz 4.5. Sei (an )n∈N eine Folge in R, welche nach oben beschränkt und ab einem bestimmten Index monoton wachsend ist. Dann ist die Folge konvergent. Dasselbe gilt, wenn
die Folge nach unten beschränkt und ab einem bestimmten Index monoton fallend ist.
Im nachfolgenden Beispiel demonstrieren wir, wie man das Monotoniekriterium verwenden
kann, um die Existenz der so genannten Eulerschen Zahl e zu beweisen.
Beispiel (Die Eulersche Zahl e). Wir betrachten die Folge (an )n∈N in R, welche durch
1 n
an := 1 +
n
für alle n ∈ N definiert ist. Gemäß der verallgemeinerten ersten binomischen Formel gilt
n X
n 1
n
n 1
n 1
n 1
an =
=
+
+
+ ··· +
.
2
k
k n
0
1 n
2 n
n nn
k=0
Als erstes zeigen wir, dass die Folge (an )n∈N streng monoton wachsend ist. Dabei verwenden wir die Tatsache, dass für je zwei positive Zahlen p > 0 und q > 0 mit p ≤ q die
Ungleichung p/q ≤ (p + 1)/(q + 1) gilt. Man erhält daher die Abschätzung
n!
n 1
=
k
k n
k!(n − k)!nk
1 n n−1 n−2
n−k+1
=
· ·
·
···
k! n
n
n
n
n
n−1
n−k+2
1 n+1
·
·
·
···
≤
k! n + 1 n + 1 n + 1
n+1
(n + 1)!
=
k!(n − k + 1)!(n + 1)k
n+1
1
=
.
k
(n + 1)k
für alle n ∈ N und für alle k ∈ {1, 2, . . . , n}. Daraus folgt wiederum
n n n+1
X
X
X n + 1
n 1
1
1
n+1
an =
≤
<
= an+1
k
k
k n
k
k
(n + 1)
(n + 1)k
k=0
k=0
k=0
für alle n ∈ N. Als nächstes zeigen wir, dass die Folge (an )n∈N durch die Zahl 3 nach oben
beschränkt ist. Für jede natürliche Zahl k ∈ {1, 2, . . . , n} gilt offenbar
n!
1 n n−1
n−k+1
1
n 1
=
=
· ·
···
≤ .
k
k
k n
k! n
n
n
k!
k!(n − k)!n
Daher erhält man die Abschätzung
1
1
1
1
1
+ + + ... +
+
1! 2! 3!
(n − 1)! n!
1
1
1
1
1
≤1+ +
+
+ ··· +
+
1 1·2 2·3
(n − 2)(n − 1) (n − 1)n
1 1
1 1
1
1
1
1
=1+1+
−
+
−
+ ··· +
−
+
−
1 2
2 3
n−2 n−1
n−1 n
an ≤ 1 +
4.1. KONVERGENZ REELLER ZAHLENFOLGEN
=1+1+
=3−
73
1 1
−
1 n
1
n
≤3
für alle n ∈ N. Nach dem Monotoniekriterium konvergiert die Folge (an )n∈N also gegen
eine reelle Zahl. Diese Zahl wird die Eulersche Zahl genannt, und mit e bezeichnet. Es gilt
also
1 n
e := lim 1 +
n→∞
n
Die Eulersche Zahl e ist irrational, und es gilt e ≈ 2,7182818.
♦
Die im voran gegangenen Beispiel untersuchte Folge (an )n∈N gehört zu einer ganzen Familie
konvergenter Folgen in R, deren Grenzwerte durch Potenzen der Eulerschen Zahl gegeben
sind.
Lemma 4.6. Für jede rationale Zahl x ∈ Q gilt
x n
lim 1 +
= ex .
n→∞
n
Man kann die Aussage von Lemma 4.6 dazu verwenden, um die Exponentialfunktion x 7→
ex für alle rationalen Zahlen x ∈ Q zu definieren. Darüber hinaus kann man zeigen, dass
die Aussage von Lemma 4.6 auch für irrationale Zahlen x ∈ R \ Q gilt.
Übungsaufgaben
1. Bestimmen Sie die Grenzwerte der Folgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N in R. Die
Folgen sind durch
n+1
1
an := 1 +
,
n
n
n
bn :=
,
n+1
n
1
cn := 1 − 2 ,
n
n
0 + 2 + 4 + · · · + 2(n − 1)
dn :=
n2
für alle n ∈ N definiert. Verwenden Sie das Lemma 4.6.
2. Bestimmen Sie die Grenzwerte der reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N , (dn )n∈N .
Die Folgen sind durch
√
n
an := 100,
p
n
bn := 1 + n2 ,
3n
cn := n ,
3 √
3
n
dn := √
3
n +n
für alle n ∈ N definiert. Verwenden Sie das Sandwichtheorem.
74
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
3. Beweisen Sie mit Hilfe des Sandwich–Theorems die folgende Aussage. Ist (an )n∈N eine Nullfolge in R und (bn )n∈N eine beschränkte Folge in R, dann konvergiert die Folge (an bn )n∈N
gegen Null.
4. Sei n ∈ N eine natürliche Zahl und x ∈ Kn ein beliebiger Vektor. Die reelle Zahlenfolge
(ap )p∈N sei durch ap := kxkp für alle p ∈ N definiert, wobei kxkp die p-Norm von x bezeichnet
(siehe Beispiel (g) auf Seite 9). Zeigen Sie mit Hilfe des Sandwichtheorems, dass die Folge
(ap )p∈N gegen kxk∞ konvergiert. Hierbei bezeichnet kxk∞ die Maximumnorm von x.
5. Untersuchen Sie, ob die reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N konvergent sind. Die Folgen sind durch
1
1
1
+
+ ··· +
,
n+1 n+2
2n
p
b1 := 0, bn+1 = 2 + bn
1
1
c1 := , cn+1 := cn 1 −
,
2
n+1
1
d1 := 1, dn+1 =
d1 + d2 + · · · + dn
an :=
für alle n ∈ N definiert. Verwenden Sie das Monotoniekriterium.
4.2. KONVERGENZ VON REIHEN
4.2
75
Konvergenz von Reihen
Definition (Reihe). Sei V ein Vektorraum über K, und sei (vn )n∈N eine Folge in V . Dann
heißt die Folge (sN )N ∈N in V , welche durch
sN :=
N
X
vn = v1 + v2 + . . . + vN
n=1
für alle N ∈ N gegeben ist, die von (vn )n∈N erzeugte Reihe in V . Für jeden Index N ∈ N
nennt man das Folgenglied sN die N -te Partialsumme der Reihe (sN )N ∈N , und für jeden
Index n ∈ N heißt das Folgenglied vn der n-te Summand der Reihe (sN )N ∈N . Die Reihe
(sN )N ∈N wird üblicherweise durch die Schreibweise
∞
X
vn
n=1
dargestellt. Manchmal stellt man die Reihe auch durch Angabe der ersten Summanden in
der Form v1 + v2 + · · · + vN + · · · dar.
Eine Reihe ist also nichts anderes als eine Folge, deren Glieder durch sukzessives Aufsummieren der Glieder einer anderen Folge entstehen. Jedes Glied einer Reihe ist somit
eine Summe, welche aus endlich vielen Summanden besteht. Dennoch ist die Vorstellung
weit verbreitet, eine Reihe seiPeine Summe mit unendlich vielen Summanden, was vor
allem durch die Schreibweise ∞
n=1 vn nahegelegt wird. Wie wir noch sehen werden, hat
diese Vorstellung sogar eine gewisse Berechtigung, wenn es sich bei der Reihe um eine
konvergente Reihe (s.u.) handelt.
Ähnlich wie bei Folgen, ist es bei Reihen oft nützlich die Menge N0 oder eine Menge
von der Form N ∪ {0, −1, −2, . . . , −m} mit m ∈ N als Indexmenge zu wählen. Man stellt
die von einer Folge (vn )∞
n=−m erzeugte Reihe dann durch
∞
X
vn
n=−m
dar. Im folgenden geben wir einige Beispiele für Reihen in R an.
Beispiele.
(a) Die Reihe
∞
X
1 = 1 + 1 + 1 + 1 + ···
k=1
wird von der konstanten Folge (an )n∈N erzeugt, welche durch an := 1 für alle n ∈ N
definiert ist. Man erkennt
leicht, dass für jeden Index N ∈ N die N -te Partialsumme
P
dieser Reihe durch N
1
k=1 = N gegeben ist.
(b) Die Reihe
∞
X
1
1 1 1
= 1 + + + + ···
n
2 3 4
n=1
wird
P1 die harmonische
P2 Reihe genannt. Die ersten
P3 Partialsummen dieser Reihe lauten
n=1 1/n = 1,
n=1 1/n = 1 + 1/2 = 3/2,
n=1 1/n = 1 + 1/2 + 1/3 = 11/6.
76
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
(c) Sei q ∈ C eine komplexe Zahl. Dann heißt die Reihe
∞
X
qn = 1 + q + q2 + q3 + · · ·
n=0
die geometrische Reihe zu q.
♦
Eine wichtige Rolle in der Analysis spielen so genannte konvergente Reihen.
Definition
(konvergente Reihe). Sei (V, k · k) ein normierter Raum über K. Eine Reihe
P∞
n=1 vn in V heißt konvergent, wenn ein Vektor v ∈ V existiert, so dass
lim
N →∞
N
X
vn = v
n=1
gilt. Der Vektor v heißt dann der Grenzwert von
∞
X
P∞
n=1 vn ,
und man schreibt
vn = v.
n=1
Definition (divergente Reihe). Sei (V, k · k) ein normierter Raum über K. Eine Reihe
in V heißt divergent, wenn sie nicht konvergent ist.
P
Man beachte, dass das Symbol ∞
n=1 vn tatsächlich zwei Bedeutungen hat. Zunächst bezeichnet es die Reihe, welche von einer Folge (vn )n∈N erzeugt wird. Ist diese Reihe konvergent, so bezeichnet das Symbol jedoch auch den Grenzwert der Reihe. Welche Bedeutung dem Symbol zukommt muss jeweils aus dem Kontext erschlossen werden, was im
Allgemeinen jedoch keine Schwierigkeiten bereitet.
PN Um eine Verwechselung gänzlich auszuschließen,
kann
man
die
Reihe
auch
durch
n=1 vn N ∈N darstellen, und das Symbol
P∞
v
ausschließlich
für
den
Grenzwert
der
Reihe
verwenden, was jedoch eher unüblich
n=1 n
ist. Nachfolgend geben wir einige wichtige Beispiele für konvergente Reihen in R an.
Beispiele.
(a) Der Mathematiker Leonhard Euler konnte zeigen, dass die Reihe
∞
X
1
1 1
1
=1+ + +
+ ···
2
n
4 9 16
n=1
gegen die Zahl π 2 /6 konvergiert.
(b) Die Reihe
∞
X
1
1 1 1
= 1 + + + + ···
n!
1 2 6
n=0
konvergiert gegen die Eulersche Zahl e.
(c) Die so genannte alternierende harmonische Reihe
∞
X
(−1)n+1
n=1
n
konvergiert gegen die Zahl ln(2).
=1−
1 1 1
+ − ± ···
2 3 4
4.2. KONVERGENZ VON REIHEN
77
(d) Die so genannte Leibniz–Reihe
∞
X
(−1)n
1 1 1
= 1 − + − ± ···
2n + 1
3 5 7
n=0
konvergiert gegen die Zahl π/4.
♦
Als nächstes wollen wir einige Rechenregeln für die Grenzwerte konvergenter Reihen zusammenstellen.
P
P∞
Satz 4.7. Sei (V, k · k) ein normierter Raum über K, seien ∞
n=1 vn und
n=1 wn zwei
konvergente Reihen in V , und sei α ∈ K ein beliebiger Skalar. Dann gelten die folgenden
Aussagen.
(1)
∞
X
(vn + wn ) =
n=1
(2)
∞
X
(αvn ) = α
n=1
∞
X
vn +
n=1
∞
X
∞
X
wn .
n=1
vn .
n=1
Wir kommen nun zur Untersuchung des Konvergenzverhaltens von Reihen. Im allgemeinen
ist es schwierig zu erkennen, ob eine gegebene Reihe konvergiert oder divergiert. Das
folgende Lemma liefert zunächst eine notwendige Bedingung für die Konvergenz einer
Reihe.
P
Lemma 4.8. Sei (V, k · k) ein normierter Raum über K, und sei ∞
n=1 vn eine konvergente
Reihe in V . Dann bildet die Folge der Reihensummanden (vn )n∈N eine Nullfolge in V .
Es muss noch einmal betont werden, dass das Lemma 4.8 lediglich ein notwendiges, nicht
aber ein hinreichendes Kriterium für die Konvergenz einer Reihe liefert. Es gibt nämlich
auch divergente Reihen, deren Summanden eine Nullfolge bilden.
Eine wichtige Klasse konvergenter Reihen bilden die geometrischen Reihen zu den
komplexen Zahlen, welche betragsmäßig echt kleiner als Eins sind. Die Grenzwerte dieser
Reihen können darüber hinaus explizit berechnet werden, wie der nachfolgende Satz zeigt.
Satz 4.9. Die geometrische Reihe zu einer komplexen Zahl q ∈ C ist genau dann konvergent, wenn |q| < 1 gilt. Für den Grenzwert der Reihe gilt dann
∞
X
qn =
n=0
1
.
1−q
Man betrachte die nachfolgenden Beispiele.
Beispiele.
(a) Nach Satz 4.9 gilt
∞
∞ n
X
X
1
1
1
=
=
n
3
3
1−
n=0
n=0
1
3
3
= .
2
78
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
Abbildung 4.1: Die Reihe
P∞
n=1
1/2n konvergiert gegen die Zahl 1.
(b) Für die komplexe Zahl z = i/2 gilt |z| = 1/2 < 1. Also konvergiert die geometrische
Reihe zu z, und wir erhalten die komplexe Zahl
∞
X
n=0
zn =
1
1−
i
2
=
4 2
+ i
5 5
als Grenzwert der Reihe.
♦
Ein besonders interessantes Ergebnis erhält man, wenn man die Reihe
∞
X
1 1 1
1
1
= + + +
+ ···
n
2
2 4 8 16
n=1
auf Konvergenz hin untersucht. Fasst man nämlich jede N -te Partialsumme sN := 1/2 +
1/4 + · · · + 1/2N dieser Reihe als die Position eines Punktes P auf der reellen Zahlengerade
auf, so erkennt man, dass sich der Punkt P der Zahl 1 immer weiter annähert. Beim
Übergang von einem Index N ∈ N zum jeweils nächsten Index N + 1 legt der Punkt P
dabei immer genau die Hälfte der Distanz zurück, die zwischen ihm und der Zahl 1 liegt
(siehe Abbildung 4.1). Eine solche Bewegung“ des Punktes P bezeichnen wir im folgenden
”
als Annäherungsschritt“. Es stellt sich die Frage, ob der Punkt jemals die Zahl 1 erreicht.
”
Mit Hilfe von Satz 4.9 kann man diese Frage beantworten. Es gilt nämlich
!
∞
∞ n
X
X
1
1
1
=
−1=
− 1 = 1.
n
2
2
1 − 12
n=1
n=0
Der Punkt P kommt der Zahl 1 also beliebig nahe, d.h. für jede positive Zahl ε > 0
existiert eine natürliche Zahl N ∈ N, so dass nach N Annäherungsschritten der Abstand
zwischen dem Punkt P und der Zahl 1 kleiner als ε ist. Da die Zahl 1 der Grenzwert
der Folge (sN )n∈N ist, kommt man leicht zu der Vorstellung, der Punkt P würde die
Zahl 1 nach unendlich vielen Annäherungsschritten erreichen. Es ist dabei allerdings nicht
wirklich klar, was genau unter nach unendlich vielen Annäherungsschritten“ zu verstehen
”
sein soll. Daher ist eine gewisse Vorsicht bei dieser Interpretation des Ergebnisses geboten.
Betrachtet man die alternierende harmonische Reihe sowie die Leibniz–Reihe, so fällt
auf, dass die Summanden beider Reihen abwechselnd positiv und negativ sind. Reihen
in R mit dieser Eigenschaft werden alternierend genannt. Die genaue Definition lautet
folgendermaßen:
P
Definition (alternierende Reihe). Eine Reihe ∞
n=1 an in R wird alternierend genannt,
n
wenn sgn(an ) = (−1) für alle n ∈ N oder sgn(an ) = (−1)n+1 für alle n ∈ N gilt.
4.2. KONVERGENZ VON REIHEN
79
Für alternierende Reihen gilt das folgende Konvergenzkriterium, welches unter dem Namen
Leibniz–Kriterium bekannt ist.
P
Satz 4.10 (Leibniz–Kriterium). Sei ∞
n=1 an eine alternierende Reihe in R mit der
Eigenschaft, dass die Folge (|an |)n∈N der Beträge der Reihensummanden monoton gegen
Null konvergiert. Dann ist die Reihe konvergent.
Das Leibniz–Kriterium garantiert offenbar insbesondere die Konvergenz der Leibniz–Reihe
(siehe Beispiel (d) auf Seite 77). Zu
ist, dass das Leibniz–Kriterium für die KonPbeachten
∞
vergenz einer alternierende Reihe n=1 an in R voraussetzt, dass die Folge (|an |)n∈N monoton gegen Null konvergiert. Tatsächlich gibt es divergente, alternierende Reihen in R, bei
denen die Folge der Beträge der Reihesummanden nichtmonoton gegen Null konvergiert.
Man betrachte dazu die nachfolgenden zwei Beispiele.
Beispiele.
(a) Die Reihe
√
√
√
∞
X
(−1)n
2
3
4
√
= −1 +
−
+
∓ ···
2
3
4
n
n=1
erfüllt die Voraussetzungen des Leibniz–Kriteriums und ist daher konvergent.
(b) Sei (an )n∈N die reelle Zahlenfolge, welche durch
(
1/n falls n ungerade,
an :=
−1/n2 falls n gerade
für alle n ∈ N definiert ist, und sei
∞
X
n=1
an = 1 −
1
1 1
+ −
± ··· ,
4 3 16
die zugehörige Reihe. Dann konvergiert die Folge (|an |)n∈N zwar gegen Null, jedoch
nicht monoton. Daher sind die Voraussetzungen fürPdas Leibniz–Kriterium nicht
erfüllt. Tatsächlich kann man zeigen, dass die Reihe ∞
♦
n=1 an divergent ist.
Mit dem Satz 4.9 und dem Leibniz–Kriterium stehen uns zwei Werkzeuge zur Verfügung,
um die Konvergenz von geometrischen und alternierenden Reihen nachzuweisen. Als nächstes befassen wir uns mit der Frage, wie man die Divergenz von Reihen nachweisen kann.
Zunächst geben wir zwei wichtige Beispiele für divergente Reihen in R an.
Beispiele.
(a) Die harmonische Reihe ist divergent. Betrachtet man nämlich die Partialsummen sN := 1 + 1/2 + 1/3 + . . . + 1/N der harmonischen Reihe, so erhält man die
Abschätzung
|s2N − sN | =
1
1
1
1
1
+
+ ··· +
≥N·
=
N +1 N +2
2N
2N
2
für alle N ∈ N. Dies bedeutet aber, dass die Folge (sn )n∈N der Partialsummen der
harmonischen Reihe keine Cauchy–Folge sein kann. Nach dem Cauchy–Kriterium
(siehe Satz 4.1) ist die Folge (sn )n∈N und damit die harmonische Reihe also divergent.
80
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
(b) Die geometrische Reihe zu jeder komplexen Zahl q ∈ C mit |q| ≥ 1 ist divergent. ♦
Als nächstes führen wir den Begriff der Minorante ein. Dieser wird benötigt, um ein Kriterium für die Divergenz einer Reihe in R zu formulieren.
P∞
P∞
Definition (Minorante).
Sei
a
eine
Reihe
in
R.
Eine
Reihe
n
n=1
n=1 mn in R heißt
P∞
eine Minorante für n=1 an , wenn eine natürliche Zahl N ∈ N existiert, so dass 0 ≤ mn ≤
an für alle n ∈ N mit n ≥ N gilt.
Eine Minorante ist also eine Reihe, deren Summanden bis auf endlich viele Ausnahmen
nichtnegativ und indexweise kleiner oder gleich wie die Summanden einer gegebenen Reihe
in R sind. Entsprechend ist jede N -te Partialsumme der Minorante kleiner oder gleich wie
die N -te Partialsumme der ursprünglichen Reihe für N ∈ N. Daraus ergibt sich aber, dass
die Divergenz der Minorante auch die Divergenz der ursprünglichen Reihe impliziert. Dies
ist die Idee, die dem so genannten Minorantenkriterium zugrunde liegt.
Satz 4.11 (Minorantenkriterium). Jede Reihe in R, für die eine divergente Minorante
existiert, divergiert bestimmt gegen ∞.
Aus dem Minorantenkriterium folgt auch, dass jede divergente Reihe in R mit nichtnegativen Summanden gegen ∞ bestimmt divergeriert. Jede solche Reihe ist nämlich eine
divergente Majorante für sich selbst. Das nachfolgende Beispiel verdeutlicht, wie man mit
Hilfe des Minorantenkriteriums die bestimmte Divergenz einer Reihe in R beweisen kann.
Beispiel. Wir betrachten die Reihe
∞
X
n=1
√
1
n2
+1
.
Bezeichnet man den n-ten Summanden der Reihe mit an , so gilt
an = √
1
n2
+1
≥√
1
1
=√
2
2n
+n
n2
für alle n ∈ N.
√
√
P
P∞
Die Reihe ∞
Minorante
für
die
Reihe
1/
n2 + 1.
n=1 1/( 2n) ist also eine divergente
n=1
√
P∞
2
Nach dem Minorantenkriterium ist die Reihe n=1 1/ n + 1 somit gegen ∞ bestimmt
divergent.
♦
Übungsaufgaben
1. Geben Sie die ersten vier Partialsummen der nachfolgenden Reihen in R an.
∞
X
n=1
n,
∞
X
1
,
2
n
n=1
∞
X
(−1)n
,
2n + 1
n=0
∞
X
(−2)n .
n=1
2. Zeigen Sie, dass die folgenden Reihen konvergent sind, und bestimmen Sie den Grenzwert
jeder Reihe.
∞ ∞ ∞
X
X
X
1
1
n−1
n
3
−
,
−
,
.
2
2
2+n
n
n
+
1
n
(n
+
1)
n
n=1
n=1
n=1
Hinweis: Leiten Sie allgemeine Formeln für die Partialsummen der Reihen her.
4.2. KONVERGENZ VON REIHEN
81
3. Untersuchen Sie die folgenden Reihen auf Konvergenz und berechnen Sie gegebenenfalls die
Grenzwerte.
∞
∞
∞ √ n
∞
∞
∞
X
X
X
X
X
X
6
6n
2
1
n
,
,
,
,
(1
+
i)
,
(1 + i)−n .
n
n
n
4
5
5
2
n=0
n=0
n=2
n=1
n=0
n=0
4. Für jede natürliche Zahl z ∈ {0, 1, 2, . . . , 9} bezeichne 0,z die Dezimaldarstellung einer reellen
Zahl mit periodischer Nachkommastelle z. Zeigen Sie mit Hilfe von Satz 4.9, dass
0,z =
z
9
für alle z ∈ {0, 1, 2, . . . , 9} gilt. Beachten Sie, dass dies insbesondere die Identität 0,9 = 1
beweist.
5. Zeigen Sie, dass die folgenden Reihen divergent sind.
∞ √
X
n
,
n
n=1
∞
X
(n + 1)(n − 1)
,
n2
n=1
∞
X
n
,
2
n +4
n=1
∞
X
1
√ .
n+ n
n=1
6. Sei q ∈ C eine komplexe Zahl, für die |q| < 1 gilt. Zeigen Sie, dass dann
∞
X
n=k
für alle k ∈ N0 gilt.
qn =
qk
1−q
82
4.3
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
Absolute Konvergenz von Reihen
Neben der Konvergenz und der Divergenz definiert man für Reihen noch ein weiteres
Konvergenzverhalten, welches als absolute Konvergenz bezeichnet wird. Es zeigt sich, dass
absolut konvergente Reihen im wesentlichen wie gewöhnliche Summen behandelt werden
können.
Definition
(absolut konvergente Reihe). Sei (V, k · k) ein
normierter Raum. Eine ReiP
P∞
he ∞
v
in
V
heißt
absolut
konvergent,
wenn
die
Reihe
n=1 n
n=1 kvn k konvergent ist.
P
Man beachte, dass die Reihe ∞
n=1 kvn k in der obigen Definition stets eine Reihe in R ist.
Wir erinnern außerdem daran, dass die Menge der reellen Zahlen R sowie die Menge der
komplexen Zahlen C standardmäßig mit der jeweiligen
Betragsfunktion als Norm verseP
a
absolute Konvergenz
hen sind. Will man also beispielsweise eine Reihe ∞
n=1 n in R aufP
hin untersuchen, so muss man das Konvergenzverhalten der Reihe ∞
n=1 |an | bestimmen.
Nachfolgend geben wir einige Beispiele für absolut konvergente Reihen an.
Beispiele.
(a) Die geometrische Reihe zu jeder komplexen Zahl q ∈ C mit |q| < 1 ist absolut
konvergent.
(b) Man kann zeigen, dass für jede reelle Zahl α > 1 die Reihe
∞
X
1
nα
n=1
absolut konvergent ist. Für α ≤ 1 ist die Reihe hingegen divergent.
(c) Jede konvergente Reihe in R mit nichtnegativen Summanden ist trivialerweise auch
absolut konvergent.
(d) Nach dem Leibniz–Kriterium ist die Reihe
∞
X
(−1)n
n=0
n
konvergent. Die Reihe ist jedoch nicht absolut konvergent, da die harmonische Reihe
divergent ist.
♦
Der nachfolgende Satz klärt, wie die Konvergenz und die absolute Konvergenz einer Reihe
in einem Banach–Raum (d.h. in einem vollständigen normierten Raum) zusammenhängen.
Satz 4.12. Jede absolut konvergente Reihe in einem Banach–Raum ist konvergent.
Man beachte, dass für jede natürliche Zahl n ∈ N die mit einer Norm versehenen Vektorräume Rn und Cn nach Satz 3.14 vollständig und somit Banach–Räume über R bzw. C
sind. Gemäß Satz 4.12 ist daher insbesondere jede absolut konvergente Reihe in R und in
C konvergent.
Wie eingangs bereits erwähnt wurde, können absolut konvergente Reihen in vielerlei
Hinsicht wie gewöhnliche Summen behandelt werden. Einen erster Hinweis hierauf liefert
der nachfolgende Satz, der besagt, dass für absolut konvergente Reihen eine Variante der
Dreiecksungleichung gilt.
4.3. ABSOLUTE KONVERGENZ VON REIHEN
83
Satz 4.13 (Dreiecksungleichung
P∞ für absolut konvergente Reihen). Sei (V, k · k) ein
Banach–Raum über K, und sei n=1 vn eine absolut konvergente Reihe in V . Dann gilt
∞
∞
X X
vn ≤
kvn k.
n=1
n=1
Die Addition in einem Vektorraum ist bekanntlich eine kommutative Verknüpfung. Dies
bedeutet, dass sich die Summe endlich vieler Vektoren nicht ändert, wenn man die Reihenfolge der Vektoren vertauscht. Ein analoges Resultat kann für absolut konvergente Reihen
gezeigt werden. Der entsprechende Satz ist als Umordnungssatz bekannt.
P
Satz 4.14 (Umordnungssatz). Sei (V, k · k) ein Banach–Raum über K, sei ∞
n=1 vn eine
absolutPkonvergente Reihe in V , und sei ϕ : N → N eine bijektive Abbildung. Dann ist die
Reihe ∞
n=1 vϕ(n) ebenfalls absolut konvergent, und es gilt
lim
N →∞
N
X
n=1
vϕ(n) = lim
N →∞
N
X
vn .
n=1
Der Umordnungssatz besagt, dass der Grenzwert einer absolut konvergenten Reihe invariant gegenüber einer Umordnung der Reihensummanden ist. Es stellt sich die Frage, ob
diese Aussage auch für solche Reihen gilt, die zwar konvergent, nicht aber absolut konvergent sind. Die überraschende Antwort lautet: Nein! Tatsächlich kann man zeigen, dass
sich der Grenzwert einer nicht absolut konvergenten Reihe in der Regel ändert, wenn man
die Reihenfolge der Reihensummanden ändert. Mehr noch: Durch Umordnung der Reihensummanden kann man die Reihe gegen jeden beliebigen Grenzwert konvergieren und
sogar bestimmt divergieren lassen. Diese Aussage ist als Riemannscher Umordnungssatz
bekannt.
Im Rest dieses Abschnitts stellen wir einige hinreichende Kriterien für die absolute
Konvergenz von Reihen zusammen. Zu diesem Zweck führen wir zunächst den Begriff der
Majorante ein.
P
Definition (Majorante). Sei ∞
n=1 an eine Reihe
P∞in R mit nichtnegativen Summanden,
d.h. es gelte an ≥ 0 für alle n ∈ N. Eine Reihe n=1 Mn in R heißt eine Majorante für
P
∞
n=1 an , wenn eine natürliche Zahl N ∈ N existiert, so dass an ≤ Mn für alle n ∈ N mit
n ≥ N gilt.
Existiert für eine Reihe in R mit nichtnegativen Summanden eine absolut konvergente
Majorante, so kann man zeigen, dass auch die ursprüngliche Reihe absolut konvergiert.
Auf diesem Prinzip beruht das so genannte Majorantenkriterium.
Satz
normierter Raum über K, und sei
P∞ 4.15 (Majorantenkriterium). Sei (V, k · k)
Pein
∞
dass für die Reihe n=1 kvn k eine konvergente Majorante
n=1 vn eine Reihe in V , soP
existiert. Dann ist die Reihe ∞
n=0 vn absolut konvergent.
Das nachfolgende Beispiel verdeutlicht, wie man das Majorantenkriterium anwendet.
84
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
Beispiel. Wir betrachten die Reihe
∞
X
√
n=1
1
n3
+1
.
Bezeichnet man den n-ten Summanden der Reihe mit an , so gilt
|an | = √
1
n3
1
1
≤ √ = 3/2
3
n
+1
n
für alle n ∈ N.
√
P∞
P∞
3/2 ) ist also Majorante für die Reihe
Die Reihe
1/(n
|1/
n3 + 1|. Da diese
n=1
n=1
√
P∞
3
Majorante konvergent ist, ist die Reihe
n=1 1/ n + 1 absolut konvergent nach dem
Majorantenkriterium .
♦
Um mit dem Majorantenkriterium arbeiten zu können, muss man natürlich wissen, welche Reihen in R absolut konvergieren. Wir erinnern uns, dass beispielsweise sämtliche
geometrische Reihen
reellen Zahlen q ∈ (0, 1) absolut konvergieren. Auch die Reihen
P
P∞ zu−α
∞
mit α > 1 sind absolut konvergent.
n=1 1/n! und
n=1 n
Ein weiteres Kriterium, mit dem man entweder die absolute Konvergenz oder aber die
Divergenz einer Reihe nachweisen kann, ist das so genannte Wurzelkriterium.
Satz
P∞ 4.16 (Wurzelkriterium). Sei (V, k · k) ein normierter Raum über K. Eine Reihe
n=0 vn in V ist absolut konvergent, wenn eine Zahl q ∈ (0, 1) und eine natürliche Zahl
N ∈ N existiert, so dass
p
n
kvn k ≤ q für alle n ∈ N mit n ≥ N
gilt. Falls hingegen eine natürliche Zahl N ∈ N existiert, so dass
p
n
kvn k ≥ 1 für alle n ∈ N mit n ≥ N
gilt, dann ist die Reihe divergent.
In den nachfolgenden Beispielen demonstrieren wir die Anwendung des Wurzelkriteriums.
Beispiele.
(a) Wir betrachten die Reihe
∞ X
n=1
n
2n + 1
n
.
Bezeichnet man den n-ten Summanden der Reihe mit an für n ∈ N, so erhält man
p
n
n
1
n
≤
=
für alle n ∈ N.
|an | =
2n + 1
2n
2
Nach dem Wurzelkriterium ist die Reihe also absolut konvergent.
(b) Das Konvergenzverhalten der Reihe
∞ X
2n n
.
n+4
n=1
soll untersucht werden. Bezeichnet man den n-ten Summanden der Reihe mit an für
n ∈ N, so erhält man die Abschnätzung
p
2n
n
|an | =
≥ 1 für alle n ∈ N mit n ≥ 4.
n+4
Nach dem Wurzelkriterium ist die Reihe demzufolge divergent.
♦
4.3. ABSOLUTE KONVERGENZ VON REIHEN
85
Bei der Verwendung des Wurzelkriteriums ist eine gewisse Vorsicht geboten.
P∞ Will man
nämlich mit Hilfe dieses Kriteriums die absolute Konvergenz einer Reihe n=1 vn nachweisen, so genügt es nicht zu zeigen, dass die strikte Ungleichung
p
n
kvn k < 1
ab einem bestimmten
P Index N ∈ N gilt. Dies gilt nämlich beispielsweise auch für die
divergente Reihe ∞
n=1 1/2.
Neben dem Wurzelkriterium gibt es noch ein zweites Kriterium, mit dem man die absolute Konvergenz oder aber die Divergenz einer Reihe nachweisen kann. Dieses Kriterium
wird das Quotientenkriterium genannt.
Satz 4.17
P∞ (Quotientenkriterium). Sei (V, k · k) ein normierter Raum über K. Eine
Reihe
n=0 vn in V ist absolut konvergent, wenn eine reelle Zahl q ∈ (0, 1) und eine
natürliche Zahl N ∈ N existiert, so dass
kvn+1 k
≤q
kvn k
für alle n ∈ N mit n ≥ N
gilt. Falls hingegen eine natürliche Zahl N ∈ N existiert, so dass
kvn+1 k
≥1
kvn k
für alle n ∈ N mit n ≥ N
gilt, dann ist die Reihe divergent.
In den nachfolgenden Beispielen wird das Quotientenkriterium angewendet.
Beispiele.
(a) Wir betrachten die Reihe
∞
X
n=1
2n
(n + 1)!
in R. Bezeichnet man den jeweils n-ten Summanden der Reihe mit an für n ∈ N, so
erhält man
|an+1 |
2n+1 (n + 1)!
2
2
= n
=
≤
für alle n ∈ N.
|an |
2 (n + 2)!
n+2
3
Nach dem Quotientenkriterium ist die Reihe also absolut konvergent.
(b) Sei an der n-te Summand der Reihe
∞
X
n=1
n!
(n + 1)2
in R für n ∈ N. Dann erhält man die Abschnätzung
|an+1 |
(n + 1)! (n + 1)2
(n + 1)3
=
=
≥1
|an |
(n + 2)2 n!
(n + 2)2
für alle n ∈ N mit n ≥ 2,
weshalb die Reihe nach dem Quotientenkriterium divergent ist.
♦
86
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
Man beachte, dass es für die Anwendung
P∞ des Quotientenkriteriums nicht genügt zu zeigen,
dass die Summanden einer Reihe n=1 vn die strikte Ungleichung
kvn+1 k
<1
kvn k
ab einem bestimmten Index N ∈ N erfüllen. Dies ist nämlich auch für die Summanden der
harmonischen Reihe der Fall. Die harmonische Reihe ist jedoch bekanntlich divergent.
Zum Abschluss dieses Abschnitts geben noch ein Lemma an, welches sich oft als nützlich erweist, wenn man eine Reihe mittels dem Quotienten- oder dem Wurzelkriterium auf
absolute Konvergenz hin untersucht.
Lemma 4.18. Sei (an )n∈N eine konvergente Reihe in R mit Grenzwert a. Weiterhin seien
p ∈ R und q ∈ R zwei reelle Zahlen, so dass p < a < q gilt. Dann existiert eine natürliche
Zahl N ∈ N, so dass
p ≤ an ≤ q für alle n ∈ N mit n ≥ N
gilt.
P∞
Warum ist dieses Lemma nützlich? Man stelle sich vor, dass man eine Reihe
n=1 vn
p
auf absolute Konvergenz hin untersucht und dabei feststellt, dass die Folge ( n kvn k)n∈N
konvergent ist. Wenn nun
p
lim n kvn k < 1
n→∞
gilt, dann folgt aus Lemma 4.18, dass die Voraussetzungen für die absolute Konvergenz
der Reihe aus dem Wurzelkriterium erfüllt sind. Wenn hingegen
p
lim n kvn k > 1
n→∞
gilt, dann folgt aus Lemma 4.18, dass die Voraussetzungen für die Divergenz der Reihe aus
dem Wurzelkriterium erfüllt sind. Ähnlich verhält es sich mit dem Quotientenkriterium.
Wenn also die Folge (kvn+1 k/kvn k)n∈N konvergent ist, und darüber hinaus
lim
n→∞
kvn+1 k
<1
kvn k
gilt, dann kann man mit Hilfe des Quotientenkriteriums folgern, dass die Reihe absolut
konvergent ist. Wenn hingegen
kvn+1 k
lim
>1
n→∞ kvn k
gilt, dann folgt aus Lemma 4.18 und dem Quotientenkriterium die Divergenz der Reihe. Ist
einer der zuvor behandelten Grenzwerte genau gleich 1, dann ist keine Aussage möglich.
Übungsaufgaben
1. Untersuchen Sie die folgenden Reihen auf absolute Konvergenz.
∞
X
1
√
,
n
n
+1
n=1
∞
X
(−1)n+1
,
2n − 1
n=1
P∞
∞
X
n2
,
2n
n=1
!
∞
n
X
X
1
,
3k
n=1
k=1
∞
X
n=1
2n
.
+1
n3
2. Zeigen Sie, dass die Reihe n=1 cos(n)/2n absolut konvergent ist, und dass für den Grenzwert s dieser Reihe die Ungleichung |s| ≤ 1 gilt.
P∞
3. Zeigen Sie, dass die Reihe n=1 4−n−cos(πn) absolut konvergent ist, und bestimmen Sie den
Grenzwert dieser Reihe. Verwenden Sie dazu den Umordnungssatz.
4.4. PUNKTWEISE KONVERGENZ VON FUNKTIONENFOLGEN
4.4
87
Punktweise Konvergenz von Funktionenfolgen
Definition (Funktionenfolge). Seien X und Y zwei nichtleere Mengen. Eine Folge
(fn )n∈N heißt eine Funktionenfolge von X nach Y , wenn für jeden Index n ∈ N das n-te
Folgenglied fn eine Funktion von X nach Y ist.
Unter einer Funktionenfolge versteht man also eine Folge, deren Glieder allesamt Funktionen mit sind, welche einen gemeinsamen Definitions- und Wertebereich besitzen. Im
folgenden geben wir einige Beispiele für Funktionenfolgen an.
Beispiele.
n
(a) Die Funktionenfolge (fn )∞
n=0 von R nach R, deren Glieder durch fn (x) := x für alle
x ∈ R und alle n ∈ N definiert sind, wird die Folge der Monome genannt. Die ersten
drei Glieder dieser Funktionenfolge sind offenbar durch f0 (x) = 1, f1 (x) = x und
f2 (x) = x2 für alle x ∈ R gegeben.
(b) Die Funktionenfolgen (sn )n∈N und (cn )n∈N von [0, 2π] nach R, welche durch sn (x) :=
sin(nx) und cn (x) := cos(nx) für alle x ∈ [0, 2π] und alle n ∈ N gegeben sind, sind
für die Analyse bestimmter Schwingungsvorgänge von entscheidender Bedeutung.
(c) Betrachtet man die Glieder der Funktionenfolge (δn )n∈N von R nach R, welche durch

2

 n x + n x ∈ [−1/n, 0)
δn (x) := −n2 x + n x ∈ [0, 1/n]


0
sonst
für alle x ∈ R und alle n ∈ N definiert sind, so stellt man folgendes fest: Für jede
natürliche Zahl n ∈ N schließt der Graph von δn mit der x-Achse ein gleichschenkliges Dreieck mit einer Grundseite der Länge 2/n und einer Höhe von n ein. Der
Flächeninhalt eines solchen Dreiecks beträgt bekanntlich 1.
♦
Ist (fn )n∈N eine Funktionenfolge von X nach Y , wobei X und Y zwei nichtleere Mengen
sind, so kann man zu jeder fest gewählten Stelle x ∈ X eine Folge (fn (x))n∈N in Y , dem
Wertebereich der Funktionenfolge, definieren. Die Glieder der Folge (fn (x))n∈N sind dabei
durch die Funktionswerte der Glieder von (fn )n∈N an der Stelle x gegeben. Man beachte:
(fn )n∈N bezeichnet eine Folge von Funktionen, (fn (x))n∈N bezeichnet eine Folge
von Funktionswerten.
Ist der Wertebereich einer Funktionenfolge ein normierter Raum, so gelangt man in natürlicher Weise zu einem Konvergenzbegriff, welcher als punktweise Konvergenz bezeichnet
wird.
Definition (punktweise Konvergenz, Grenzfunktion). Sei X eine nichtleere Menge,
sei x ∈ X ein Element dieser Menge, und sei (W, k · k) ein normierter Raum über K.
Eine Funktionenfolge (fn )n∈N von X nach W heißt konvergent an der Stelle x, wenn die
Folge (fn (x))n∈N in W konvergent ist. Ist D ⊆ X eine nichtleere Menge, so heißt die
Funktionenfolge punktweise konvergent auf D, falls sie an jeder Stelle x ∈ D konvergent
ist. In diesem Fall definiert man die so genannte Grenzfunktion f : D → W von (fn )n∈N
auf D durch
f (x) := lim fn (x)
n→∞
für alle x ∈ D.
88
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
(a)
(b)
Abbildung 4.2: (a) Graphen der ersten vier Glieder der Funktionenfolge (pn )n∈N von
[0, 1] nach R, welche durch pn (x) := xn für alle x ∈ [0, 1] und alle n ∈ N definiert ist. (b)
Graph der zugehörigen Grenzfunktion.
Definition (divergente Funktionenfolge). Eine Funktionenfolge heißt an einer Stelle
ihres Definitionsbereichs divergent, wenn sie an jener Stelle nicht punktweise konvergent
ist. Ist M eine nichtleere Teilmenge des Definitionsbereichs, so heißt die Funktionenfolge
divergent auf M , wenn sie an jeder Stelle x ∈ M divergent ist.
Ist X eine nichtleere Menge, D ⊆ X eine nichtleere Teilmenge, und (W, k · k) ein normierter
Raum, so konvergiert eine Funktionenfolge (fn )n∈N von X nach W offenbar genau dann
punktweise gegen eine Grenzfunktion f : D → W , wenn für jede Stelle x ∈ D die folgende
Aussage wahr ist: Zu jeder positiven Zahl ε > 0 existiert eine natürliche Zahl N ∈ N, so
dass
kfn (x) − f (x)k < ε
für alle n ∈ N mit n ≥ N
gilt. Die punktweise Konvergenz einer Funktionenfolge auf wird also über die Konvergenz
der Funktionswerte ihrer Glieder auf der Menge D definiert.
Als nächstes führen wir den Begriff des Konvergenzbereiches einer Funktionenfolge ein.
Definition (Konvergenzbereich). Sei X eine nichtleere Menge, sei (W, k · k) ein normierter Raum über K, und sei (fn )n∈N eine Funktionenfolge von X nach W . Sei außerdem
D ⊆ X eine nichtleere Menge, so dass (fn )n∈N auf punktweise konvergent auf D und
divergent auf jeder Teilmenge von X \ D ist. Dann heißt D der Konvergenzbereich von
(fn )n∈N .
Der Konvergenzbereich einer Funktionenfolge ist also die größtmögliche Teilmenge des
Definitionsbereichs, auf der die Funktionenfolge punktweise konvergent ist. Im folgenden
geben wir einige Beispiele für Funktionenfolgen und deren Konvergenzbereiche an.
Beispiele.
√
(a) Die Funktionenfolge (fn )n∈N von R nach R, welche durch fn (x) := x2 − x/ n + 1/n
für alle x ∈ R und alle n ∈ N definiert ist, konvergiert punktweise auf ganz R gegen
die Grenzfunktion f : R → R, welche durch f (x) := x2 für alle x ∈ R definiert ist.
Der Konvergenzbereich der Funktionenfolge ist also R.
(b) Die Funktionenfolge (pn )n∈N von [0, ∞] nach R, welche durch pn (x) := xn für alle
x ∈ R und alle n ∈ N definiert ist, konvergiert punktweise im Intervall [0, 1] gegen
die Grenzfunktion p : [0, 1] → R, welche durch
(
0 falls x ∈ [0, 1),
p(x) :=
1 falls x = 1
4.4. PUNKTWEISE KONVERGENZ VON FUNKTIONENFOLGEN
89
für alle x ∈ [0, 1] definiert ist (siehe auch Abbildung 4.2). Für jede reelle Zahl x > 1
divergiert die Folge (pn (x))n∈N bestimmt gegen ∞. Das Intervall [0, 1] ist demnach
Konvergenzbereich der Funktionenfolge (pn )n∈N .
(c) Die Funktionenfolge (hn )n∈N von R nach R, welche durch
(
1 falls x ∈ [n − 1, n],
hn (x) :=
0 sonst
für alle x ∈ R und alle n ∈ N definiert ist, konvergiert punktweise auf ganz R gegen
die Nullfunktion auf R. Wählt man nämlich eine beliebige Stelle x ∈ R aus, so gilt
offenbar hn (x) = 0 für alle n ≥ dxe + 1. Der Konvergenzbereich der Funktionenfolge
(hn )n∈N ist also R, und die Grenzfunktion h : R → R ist durch h(x) = 0 für alle
x ∈ R gegeben.
♦
Übungsaufgaben
1. Die Funktionenfolgen (sn )n∈N und (cn )n∈N von [0, 2π] nach R seien durch sn (x) := sin(nx)
und cn (x) := cos(nx) für alle x ∈ [0, 2π] und alle n ∈ N definiert. Skizzieren Sie die Graphen
der ersten drei Glieder beider Funktionenfolgen.
2. Die Funktionenfolge von R nach R der so genannten Legendre–Polynome (Pn )∞
n=0 ist rekursiv
durch P0 (x) := 1, P1 (x) := x und nPn (x) := (2n − 1)xPn−1 (x) − (n − 1)Pn−2 (x) für alle
x ∈ R und alle n ∈ N mit n ≥ 2 definiert. Geben Sie die Polynome P2 , P3 und P4 dieser
Funktionenfolge an.
3. Bestimmen Sie den Konvergenzbereich der Funktionenfolgen (fn )n∈N , (gn )n∈N , (hn )n∈N und
(rn )n∈N von R nach R, und geben Sie die jeweilige Grenzfunktion an. Die Funktionenfolgen
sind durch
fn : R → R, x 7→ nx/(n + 1),
p
gn : R → R, x 7→ n |x|,
hn : R → R, x 7→ (2x)n + 1,
(
n/2 falls x ∈ [−1/n, 1/n],
rn : R → R, x 7→
0
sonst
für alle n ∈ N definiert.
4. Die Funktionenfolge (fn )∞
n=0 von R nach R ist rekursiv durch f0 (x) := 1 und fn (x) :=
fn−1 (x) + xn für alle x ∈ R und alle n ∈ N definiert. Geben Sie den Konvergenzbereich und
die Grenzfunktion dieser Funktionenfolge an.
90
4.5
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
Gleichmäßige Konvergenz von Funktionenfolgen
Im voran gegangenen Abschnitt haben wir die punktweise Konvergenz bei Funktionenfolgen kennen gelernt. Neben diesem Konvergenzbegriff gibt es bei Funktionenfolgen noch
den Begriff der gleichmäßigen Konvergenz, den wir im folgenden einführen.
Definition (gleichmäßige Konvergenz). Seien X und D ⊆ X zwei nichtleere Mengen,
und sei (W, k · k) ein normierter Raum über K. Eine Funktionenfolge (fn )n∈N von X nach
W heißt gleichmäßig konvergent auf D, wenn eine Funktion f : D → W existiert, so dass
folgendes gilt: Für jede positive Zahl ε > 0 existiert eine natürliche Zahl N ∈ N, so dass
kfn (x) − f (x)k < ε
für alle n ∈ N mit n ≥ N und für alle x ∈ D
gilt.
Das nachfolgende Lemma besagt, dass die gleichmäßige Konvergenz stets auch die punktweise Konvergenz einer Funktionenfolge impliziert. Gleichmäßige Konvergenz ist also eine
stärkere“ Eigenschaft als punktweise Konvergenz.
”
Lemma 4.19. Jede Funktionenfolge, die auf einer bestimmten Menge gleichmäßig konvergent ist, ist auf derselben Menge auch punktweise konvergent.
Betrachtet man noch einmal die Definitionen für punktweise und gleichmäßige Konvergenz, so stellt man fest, dass eine Funktionenfolge (fn )n∈N genau dann punktweise bzw.
gleichmäßig auf einer Menge D gegen eine Grenzfunktion f konvergiert, wenn man für
jede Stelle x ∈ D und für jede positive Zahl ε > 0 eine natürliche Zahl N ∈ N wählen
kann, so dass
kfn (x) − f (x)k < ε
für alle n ∈ N mit n ≥ N gilt. Der wesentliche Unterschied besteht nun darin, dass man bei
gleichmäßiger Konvergenz die Zahl N unabhängig von der Stelle x wählen kann. Die Zahl
N ist bei gleichmäßiger Konvergenz also eine Funktion von ε. Bei punktweiser Konvergenz
ist die Zahl N hingegen eine Funktion von ε und x.
Will man gleichmäßige Konvergenz nachweisen, so ist die folgende Beobachtung hilfreich: Eine Funktionenfolge (fn )n∈N konvergiert gleichmäßig auf einer Menge D gegen eine
Grenzfunktion f , wenn der Abstand
kfn (x) − f (x)k
durch einen Ausdruck nach oben abgeschätzt werden kann, der von n, nicht aber von x abhängt, und für n → ∞ gegen Null konvergiert. Man betrachte dazu auch die nachfolgenden
Beispiele.
Beispiele.
(a) Die Funktionenfolge (fn )n∈N von R nach R, die durch fn (x) := x + sin(nx)/n für
alle x ∈ R und alle n ∈ N definiert ist, konvergiert gleichmäßig auf ganz R gegen die
Grenzfunktion f : R → R, welche durch f (x) := x für alle x ∈ R definiert ist. Es gilt
nämlich
|sin(nx)|
1
|fn (x) − f (x)| =
≤
n
n
für alle x ∈ R und alle n ∈ N. Es ist also möglich, zu jeder positive Zahl ε > 0 einen
Index N ∈ N zu wählen, so dass |fn (x) − f (x)| < 1/n < ε für alle n ∈ N mit n ≥ N
und alle x ∈ R gilt.
4.5. GLEICHMÄSSIGE KONVERGENZ VON FUNKTIONENFOLGEN
91
(b) Die Funktionenfolge (gn )n∈N von R nach R, die durch gn (x) := x/n für alle x ∈ R
und alle n ∈ N definiert ist, konvergiert auf jeder nichtleeren, beschränkten Menge
M ⊂ R gleichmäßig gegen die Nullfunktion g : M → R auf M , welche durch g(x) := 0
für alle x ∈ M definiert ist. Es gilt nämlich
|gn (x) − g(x)| =
|x|
1
≤ sup {|x| | x ∈ M }
n
n
für alle x ∈ M und alle n ∈ N. Man beachte hierbei, dass sup {|x| | x ∈ M } eine
reelle Zahl ist, die nicht von der Stelle x abhängt.
Im Rest dieses Abschnitts wollen wir einen weiteren Zugang zur gleichmäßigen Konvergenz
von Funktionenfolgen vorstellen. Dazu nehmen wir im folgenden an, dass D eine nichtleere
Menge und (W, k · k) ein normierter Raum über K ist.
Die Menge aller beschränkten Folgen von D nach W wird dann bekanntlich mit
B(D, W ) bezeichnet. Man zeigt leicht, dass die Menge B(D, W ) ein Vektorraum über
K ist. Die Menge B(D, W ) wird darüber hinaus zu einem normierten Raum über K, wenn
man sie mit der so genannten Supremumsnorm k · k∞,D : B(D, W ) → R versieht. Die
Supremumsnorm ist dabei durch
kf k∞,D := sup kf (x)k
x∈D
für alle f ∈ B(D, W ) definiert. Im normierten Raum (B(D, W ), k · k∞,D ) ist dann die
Konvergenz von Folgen in gewohnter Weise definiert: Eine Folge (fn )n∈N in B(D, W )
konvergiert genau dann gegen einen Grenzwert f ∈ B(D, W ), wenn für jede positive
Zahl ε > 0 eine natürliche Zahl N ∈ N existiert, so dass kfn − f k∞,D < ε für alle
n ∈ N mit n ≥ N gilt. Man beachte hierbei, dass die Folge (fn )n∈N eine Funktionenfolge
von D nach W ist. Daher stellt sich die Frage, inwieweit die Konvergenz im normierten
Raum (B(D, W ), k · k∞,D ) mit der punktweisen oder der gleichmäßigen Konvergenz auf
der Menge D zusammenhängen. Das nachfolgende Lemma gibt hierauf eine abschließende
Antwort.
Lemma 4.20. Sei D eine nichtleere Menge und (W, k · k) ein normierter Raum über K.
Eine Folge beschränkter Funktionen (fn )n∈N von D nach W konvergiert genau dann gleichmäßig auf D gegen eine Grenzfunktion f : D → W , wenn sie bezüglich der Supremumsnorm gegen f konvergiert, d.h. wenn für jede positive Zahl ε > 0 eine natürliche Zahl
N ∈ N existiert, so dass
kfn − f k∞,D < ε
für alle n ∈ N mit n ≥ N
gilt.
Betrachtet man die Aussage von Lemma 4.20 sowie die voran gegangenen Überlegungen,
so erkennt man, dass gleichmäßige Konvergenz verglichen mit punktweiser Konvergenz
der natürlichere“ Konvergenzbegriff für Funktionenfolgen ist. Die gleichmäßige Konver”
genz entspricht nämlich genau dem üblichen Konvergenzbegriff, den man für Folgen im
normierten Raum (B(D, W ), k · k∞,D ) hat.
92
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
Übungsaufgaben
1. Bestimmen Sie für die Funktionenfolgen (fn )n∈N , (gn )n∈N , (hn )n∈N und (pn )n∈N von [0, 1]
nach R die jeweilige Grenzfunktion. Zeigen Sie außerdem, dass die Funktionenfolgen gleichmäßig auf [0, 1] gegen ihre Grenzfunktionen konvergieren. Die Funktionenfolgen sind durch
fn : [0, 1] → R, x 7→
x
,
x+n
r
1
,
n
n sin(πx) + cos(nπx)
hn : [0, 1] → R, x 7→
,
n
nx2
pn : [0, 1] → R, x 7→
nx + 1
gn : [0, 1] → R, x 7→
x+
für alle n ∈ N definiert.
2. Sei D eine nichtleere Menge, und sei (W, k · k) ein normierter Raum über K. Zeigen Sie dass
die Menge B(D, W ) aller beschränkten Funktionen von D nach W ein Vektorraum über K
ist.
3. Sei D eine nichtleere Menge, sei (W, k · k) ein normierter Raum über K, und sei B(D, W ) die
Menge aller beschränkten Funktionen von D nach W . Zeigen Sie, dass die Supremumsnorm
eine Norm auf B(D, W ) ist.
4.6. KONVERGENZ VON POTENZREIHEN
4.6
93
Konvergenz von Potenzreihen
Definition (Potenzreihe). Sei (an )∞
n=0 eine Folge in K. Dann heißt die Funktionenfolge
(fN )∞
von
K
nach
K,
deren
Glieder
gemäß
N =0
fN (v) :=
N
X
an (x − x0 )n = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · + aN (x − x0 )N
n=0
für alle x ∈ V und alle N ∈ N definiert sind, die zur Folge (an )∞
n=0 gehörende Potenzreihe
auf K mit der Entwicklungsstelle x0 . Die Glieder der Folge (an )∞
n=0 werden die Koeffizienten der Potenzreihe genannt. Für jeden Index N ∈ N bezeichnet man die Funktion fN
als das N -te Partialpolynom der Potenzreihe. Die Potenzreihe selbst wird oft durch die
Schreibweise
∞
X
an (x − x0 )n
n=0
dargestellt, wobei man vereinbart, dass x die Variable der Potenzreihe sei. Es ist auch
üblich, eine Potenzreihe durch Angabe der ersten Terme als a0 +a1 (x−x0 )+a2 (x−x0 )2 +· · ·
darzustellen.
Wie der Begriff Partialpolynom bereits andeutet, ist jedes Glied fN einer Potenzreihe
(fN )∞
N =0 ein Polynom vom Grad N . Dies erkennt man besonders gut, wenn die Entwicklungsstelle der Potenzreihe der Nullvektor ist. Die Potenzreihe ist dann nämlich von der
Form
∞
X
an xn ,
n=0
wobei x die Variable der Potenzreihe bezeichnet. Für jede Zahl N ∈ N0 ist das N -te
Partialpolynom der Potenzreihe dann durch
N
X
an xn = a0 + a1 x + a2 x2 + · · · + aN xN
n=0
gegeben. Es sollte noch erwähnt werden, dass der Begriff Partialpolynom in der mathematischen Fachliteratur keineswegs üblich ist. Wir verwenden ihn dennoch, da er deutlich
macht, dass eine Potenzreihe im wesentlichen eine Folge von Polynomen ist.
Wie bei allen Funktionenfolgen stellt sich auch bei Potenzreihen die Frage nach Konvergenzbereichen. Der nachfolgende Satz macht dazu eine erste Aussage.
Satz 4.21. Sei
P∞
n=0 an (x
− x0 )n eine Potenzreihe auf K mit der Variable x, so dass
lim
n→∞
p
n
|an | = 0
gilt. Dann konvergiert die Potenzreihe punktweise auf ganz K.
Das nachfolgende Beispiel verdeutlicht die Anwendung von Satz 4.21. Darüber hinaus
liefert es eine wichtige Darstellung der Exponentialfunktion x 7→ ex .
94
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
Beispiel (Die Exponentialfunktion). Wir betrachten die Potenzreihe
∞
X
xn
n=0
n!
=1+x+
x2 x3
+
+ ···
2!
3!
auf R mit der Variable x. Die Entwicklungsstelle dieser Potenzreihe ist die Zahl Null, und
die Folge der Koeffizienten lautet (1/n!)∞
n=0 . Unser Ziel ist es zu zeigen, dass die Potenzreihe
auf ganz R punktweise konvergiert. Dazu untersuchen wir zunächst die Zahlenfolge (cn )n∈N ,
welche durch cn := nn /(n!en ) für alle n ∈ N definiert ist. Man rechnet leicht nach, dass
cn+1
1
1 n 1
1 n e
=
1+
≤ lim 1 +
= =1
cn
e
n
e n→∞
n
e
für alle n ∈ N gilt. Die Folge (cn )n∈N ist also monoton fallend. Daher gilt insbesondere
c1 ≥ cn für alle n ∈ N. Da außerdem 1 ≥ c1 gilt, erhält man 1 ≥ cn für alle n ∈ N. Durch
Umformung der letzten Ungleichung erhält man die Abschätzung
n
n
n! ≥
e
√
für
alle n ∈ N. Entsprechend gilt n n! ≥ n/e für alle n ∈ N, woraus folgt, dass die Folge
√
( n n!)n∈N gegen ∞ bestimmt divergiert. Man erhält daher
s 1
1
lim n = lim √
= 0.
n
n→∞
n→∞
n!
n!
Nach Satz 4.21 konvergiert die Potenzreihe also punktweise auf ganz R. Die Grenzfunktion
ist dabei die Exponentialfunktion exp : R → R, welche durch exp(x) := ex für alle x ∈ R
definiert ist.
♦
Im Allgemeinen ist der Konvergenzbereich einer Potenzreihe auf K eine echte Teilmenge
von K. Man überlegt sich leicht, dass jede Potenzreihe an ihrer Entwicklungsstelle gegen
Null konvergiert. Daher ist die Entwicklungsstelle immer ein Element des Konvergenzbereichs. Mit Hilfe des nachfolgenden Satzes lässt sich darüber hinaus eine Teilmenge des
Konvergenzbereichs angeben.
P
n
Satz 4.22. Sei ∞
n=0 an (x − x0 ) eine Potenzreihe auf K mit der Variable x. Sei außerdem
s > 0 eine positive Zahl mit der Eigenschaft, dass eine natürliche Zahl N ∈ N existiert, so
dass
p
n
|an | ≤ s für alle n ∈ N mit n ≥ N
gilt. Dann konvergiert die Potenzreihe punktweise auf der offenen Kugel Br (x0 ) in K,
wobei r := 1/s gilt.
Die Anwendung von Satz 4.22 wird im nachfolgenden Beispiel verdeutlicht.
Beispiel. Wir betrachten die Potenzreihe
∞
X
n + (−1)n
n=0
n+2
(x − 2)n
4.6. KONVERGENZ VON POTENZREIHEN
95
in R mit der Variable x und der Entwicklungsstelle 2. Offenbar gilt
s
r
n
√
n
n n + 1
n n + (−1) ≤ 1≤1
n+2 ≤
n+2
für alle n ∈ N. Nach Satz 4.22 konvergiert die Potenzreihe also punktweise auf dem Intervall
(1, 3) = B1 (2).
♦
Satz 4.22 legt nahe, dass der Konvergenzbereich einer Potenzreihe stets die Obermenge
einer offenen Kugel ist. Der Mittelpunkt der Kugel ist dabei durch die Entwicklungsstelle
der Potenzreihe gegeben. Der Radius der Kugel hängt von der Rate ab, mit der die Absolutbeträge der Koeffizienten der Potenzreihe gegen Null konvergieren. Man kann zeigen,
dass für jede Potenzreihe auf K, die nicht auf ganz K konvergiert, eine größte offene Kugel
existiert, auf der die Potenzreihe punktweise konvergiert. Der Radius dieser Kugel wird
der Konvergenzradius der Potenzreihe genannt.
P
n
Definition (Konvergenzradius). Sei ∞
n=0 an (x − x0 ) eine Potenzreihe auf K mit der
Variable x. Eine positive Zahl R > 0 wird der Konvergenzradius der Potenzreihe genannt,
wenn die Potenzreihe auf der offenen Kugel BR (x0 ) in K punktweise konvergiert, und auf
jeder Teilmenge von K \ BR (x0 ) divergiert. Falls die Potenzreihe auf ganz K punktweise
konvergiert, sagt man, dass ihr Konvergenzradius ∞ sei.
Wie der nachfolgende Satz zeigt, kann der Konvergenzradius bestimmter Potenzreihen auf
K, die nicht auf ganz K punktweise konvergieren, explizit berechnet werden.
Satz 4.23. Sei
P∞
n=0 an (x
− x0 )n eine Potenzreihe auf K mit der Variable x, so dass
p
S := lim n |an | > 0
n→∞
gilt. Dann ist R := 1/S der Konvergenzradius der Potenzreihe.
Die Anwendung des Satzes 4.23 wird im nachfolgenden Beispiel demonstriert.
Beispiel. Betrachtet man die Koeffizienten der Potenzreihe
∞
X
n3n (x − 1)n
n=0
in R mit der Variable x und der Entwicklungsstelle 1, so stellt man fest, dass
p
√
lim n |n3n | = lim 3 n n = 3
n→∞
n→∞
gilt. Nach Satz 4.23 konvergiert die Potenzreihe also punktweise auf dem offenen Intervall
(2/3, 4/3) = B1/3 (1) und divergiert außerhalb des abgeschlossenen Intervalls [2/3, 4/3]. ♦
Mit Hilfe von Potenzreihen werden eine Reihe wichtiger Funktionen in der Mathematik
definiert. Wir haben bereits gesehen, dass die Exponentialfunktion exp : R → R, x 7→ ex
als Grenzfunktion der Potenzreihe
∞
X
xn
n=0
n!
definiert werden kann. Nachfolgend geben wir weitere wichtige Beispiele für Potenzreihen
an, deren Grenzfunktionen explizit bekannt sind.
96
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
(b)
(a)
Abbildung 4.3: (a) Die Graphen der Funktionen Sinus Hyperbolicus und Cosinus
Hyperbolicus. (b)
der Funktion Logarithmus Naturalis. Der Konvergenzbereich
PGraph
∞
der Potenzreihe n=1 (−1)n+1 (x − 1)n /n ist grau dargestellt.
Beispiele.
(a) Die Sinusfunktion sin : R → R ist die Grenzfunktion der Potenzreihe
∞
X
(−1)n
x3 x5 x7
x2n+1 = x −
+
−
± ···
(2n + 1)!
3!
5!
7!
n=0
auf R mit der Variable x. Anhand der Potenzreihe erkennt man insbesondere, dass
sin(0) = 0 gilt.
(b) Die Cosinusfunktion cos : R → R ist die Grenzfunktion der Potenzreihe
∞
X
(−1)n
n=0
(2n)!
x2n = 1 −
x2 x4 x6
+
−
± ···
2!
4!
6!
auf R mit der Variable x. Anhand der Potenzreihe erkennt man insbesondere, dass
cos(0) = 1 gilt.
(c) Die so genannte hyperbolische Sinusfunktion sinh : R → R, welche auch Sinus Hyperbolicus genannt wird, ist durch
ex − e−x
2
für alle x ∈ R definiert (siehe auch Abbildung 4.3(a)). Man kann zeigen, dass der
Sinus Hyperbolicus die Grenzfunktion der Potenzreihe
sinh(x) :=
∞
X
x2n+1
x3 x5 x7
=x+
+
+
+ ···
(2n + 1)!
3!
5!
7!
n=0
auf R mit der Variable x ist.
(d) Die so genannte hyperbolische Cosinusfunktion cosh : R → R, welche auch Cosinus
Hyperbolicus genannt wird, ist durch
ex + e−x
2
für alle x ∈ R definiert (siehe auch Abbildung 4.3(a)). Der Cosinus Hyperbolicus ist
die Grenzfunktion der Potenzreihe
∞
X
x2n
x2 x4 x6
=1+
+
+
+ ···
(2n)!
2!
4!
6!
cosh(x) :=
n=0
auf R mit der Variable x.
4.6. KONVERGENZ VON POTENZREIHEN
97
(e) Die Potenzreihe
n
X
(−1)n+1
n
n=1
1
1
1
(x − 1)n = (x − 1) − (x − 1)2 + (x − 1)3 − (x − 1)4 ± · · ·
2
3
4
mit der Variable x konvergiert punktweise auf dem Intervall (0, 2] gegen den Logarithmus Naturalis, also gegen die Funktion f : (0, 2] → R, welche duch f (x) := ln(x)
für alle x ∈ (0, 2] definiert ist (siehe auch Abbildung 4.3(b)).
♦
Mit Hilfe der Potenzreihendarstellungen der Sinusfunktion, der Cosinusfunktion und der
Exponentialfunktion kann man sehr leicht die Eulersche Formel
eix = cos(x) + i sin(x)
für alle x ∈ R nachweisen. Es gilt nämlich
eix =
=
∞
X
(ix)n
n=0
∞ X
k=0
=
n!
(ix)2k+1
(ix)2k
+
(2k)!
(2k + 1)!
∞
X
(ix)2k+1
+
(2k)!
(2k + 1)!
∞
X
(ix)2k
k=0
k=0
∞
∞
X
(i2 )k 2k X i(i2 )k 2k+1
x +
x
=
(2k)!
(2k + 1)!
k=0
=
∞
X
(−1)k
k=0
(2k)!
k=0
∞
X
x2k + i
k=0
(−1)k 2k+1
x
(2k + 1)!
= cos(x) + i sin(x).
Desweiteren kann man die die Potenzreihendarstellungen verwenden, um beispielsweise die
Exponentialfunktion auf normierten Algebren zu definieren.
Übungsaufgaben
1. Bestimmen Sie die Konvergenzradien der folgenden Potenzreihen auf R.
!
n
n2
∞
∞ ∞
∞ ∞
n
X
X
X
X
X
X
1
n2 n
1
1
n n
n
n
2 x ,
1+
x ,
x ,
x ,
xn .
1−
n
n!
n
k
n=1
n=1
n=0
n=1
n=0
k=1
Hierbei bezeichnet x jeweils die Variable der Potenzreihe.
2. Bestimmen Sie für jede der nachfolgend angegebenen Potenzreihen auf R eine möglichst
große Zahl r > 0, so dass die jeweilige Potenzreihe auf dem Intervall (−r, r) punktweise
konvergiert.
∞
X
n=0
2n cos(n)xn ,
∞
X
n=0
4n + (−1)n xn ,
∞
X
x2n ,
n=0
∞
X
sin(n) cos(n)xn .
n=0
Hierbei bezeichnet x jeweils die Variable der Potenzreihe.
3. Weisen Sie mit Hilfe der Potenzreihendarstellungen der hyperbolischen Sinusfunktion, der
hyperbolischen Cosinusfunktion und der Exponentialfunktion die Formel ex = cosh(x) +
sinh(x) nach. Die Formel folgt übrigens direkt aus der Definition von sinh und cosh.
Lernzielkontrolle
Nach dem Durcharbeiten dieses Kapitels sollten Sie ...
... die folgenden Kriterien für die Konvergenz einer reellen Zahlenfolgen kennen: Das
Cauchy–Kriterium, das Sandwichtheorem und das Monotoniekriterium.
... wissen, was eine Reihe ist.
... wissen, was man unter einer konvergenten und unter einer absolut konvergenten Reihe
versteht.
... den Grenzwert der geometrischen Reihe zu einer komplexen Zahl q ∈ C mit |q| < 1
berechnen können.
... das Leibniz–Kriterium für die Konvergenz und das Minorantenkriterium für die Divergenz einer Reihe kennen.
... wissen, dass die harmonische Reihe divergent ist.
... sie folgenden Kriterien für die absolute Konvergenz einer Reihe kennen und anwenden
können: Das Majorantenkriterium, das Wurzelkriterium und das Quotientenkriterium.
... wissen, was eine Funktionenfolge ist.
... wissen, was man unter einer punktweise konvergenten und unter einer gleichmäßig
konvergenten Funktionenfolge versteht.
... wissen, was der Konvergenzbereich einer Funktionenfolge ist.
... wissen, was eine Potenzreihe ist.
... wissen, was man unter dem Konvergenzradius einer Potenzreihe versteht.
... den Konvergenzradius einer Potenzreihe bestimmen können, falls dies möglich ist.
... die Potenzreihen der Exponentialfunktion, der Sinusfunktion und der Cosinusfunktion kennen.
98
Kapitel 5
Stetige Funktionen
5.1
Grenzwerte von Funktionen
In diesem Abschnitt soll der Grenzwertbegriff auf Funktionen erweitert werden. Im Unterschied zu den Gliedern einer Folge sind die Funktionswerte einer Funktion im Allgemeinen
nicht durch Indizes in aufsteigender Folge angeordnet. Daher muss man einen anderen
Zugang wählen, um den Grenzwert einer Funktion zu definieren.
Definition (Grenzwert einer Funktion). Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, sei D ⊆ V eine nichtleere Menge, sei v0 ∈ D ein Punkt des Abschlusses
dieser Menge, und sei f : D → W eine Funktion. Ein Vektor w0 ∈ W wird der Grenzwert
von f in v0 genannt, wenn für jede positive Zahl ε > 0 eine positive Zahl δ > 0 existiert,
so dass
kf (v) − w0 kW < ε für alle v ∈ (Bδ (v0 ) ∩ D) \ {v0 }
gilt. Man schreibt dann
lim f (v) = w0
v→v0
oder auch f (v) → w0 (v → v0 ).
Anschaulich gesprochen ist ein Element w0 ∈ W genau dann Grenzwert einer Funktion
f : D → W im Punkt v0 ∈ D, wenn folgendes gilt: Wenn sich ein Punkt v ∈ D dem Punkt
v0 immer weiter annähert, ohne dabei die Definitionsmenge D zu verlassen, dann nähern
sich die zugehörigen Funktionswerte f (v) dem Wert w0 immer weiter an. Zu beachten ist,
dass der Grenzwert w0 selbst kein Funktionswert von f sein muss. Die Funktion f muss an
der Stelle v0 nicht einmal definiert sein. Man betrachte dazu die nachfolgenden Beispiele.
Beispiele.
(a) Wir betrachten die Funktion f : [0, 1) → R, welche durch f (x) = (x2 − 1)/(x − 1)
für alle x ∈ (0, 1) definiert ist. Es gilt
lim f (x) = 2.
x→1
Für alle x ∈ [0, 1) gilt nämlich
2
f (x) − 2 = x − 1 − 2 = (x + 1)(x − 1) − 2 = |(x + 1) − 2| = |x − 1|.
x−1
x−1
Ist ε > 0 vorgegeben, so wählt man δ = ε. Für alle x ∈ (Bδ (1)∩[0, 1))\{1} ⊆ (1−δ, 1)
gilt dann |x − 1| < δ und somit |f (x) − 2| < ε. Man beachte, dass die Funktion f an
der Stelle x = 1 nicht definiert ist, da dort x − 1 = 0 gilt.
99
100
KAPITEL 5. STETIGE FUNKTIONEN
Abbildung 5.1: Eine Funktion f : D → W besitzt in v0 ∈ D den Grenzwert w0 , wenn
für alle ε > 0 ein δ > 0 existiert, so dass das Bild von (Bδ (v0 ) ∩ D) \ {v0 } unter f eine
Teilmenge von Bε (w0 ) ist.
(b) Die Funktion g : R → R sei durch
(
x2
g(x) =
1
falls x 6= 0,
falls x = 0
für alle x ∈ R definiert. Es gilt
lim g(x) = 0.
x→0
√
Ist nämlich eine positive Zahl ε > 0 vorgegeben, so kann man beispielsweise δ = ε
wählen. Für alle x ∈ (Bδ (0) ∩ R) \ {0} = (−δ, 0) ∪ (0, δ) gilt dann die Abschätzung
|g(x) − 0| = |x2 | < δ 2 = ε. Man beachte, dass der Grenzwert der Funktion g in
x = 0 nicht mit dem Funktionswert von g an der Stelle x = 0 übereinstimmt. Der
Grenzwert ist nämlich 0, wie wir gezeigt haben, und der Funktionswert ist 1.
Lässt sich der Grenzwertbegriff für Funktionen auf den Grenzwertbegriff für Folgen zurückführen? In gewisser Weise ja. Man betrachte dazu das nachfolgende Lemma.
Lemma 5.1. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, sei D ⊆ V
eine nichtleere Menge, sei v0 ∈ D ein Punkt des Abschlusses von D, und sei f : D → W
eine Funktion. Ein Vektor w0 ∈ W ist genau dann Grenzwert von f in v0 , wenn für jede
gegen v0 konvergente Folge (vn )n∈N in D \ {v0 } die Folge der Funktionswerte (f (vn ))n∈N
gegen w0 konvergiert.
Mit Hilfe von Lemma 5.1, sowie den Sätzen 2.4 und 2.5 kann man leicht zeigen, dass die
folgenden Rechenregeln für Funktionsgrenzwerte gelten.
Satz 5.2. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, sei D ⊆ V
eine nichtleere Menge und sei v0 ∈ D ein Punkt des Abschlusses von D. Seien außerdem
f : D → W , g : D → W und α : D → W Funktionen, welche einen Grenzwert in v0
besitzen. Dann gilt
(1) lim f (v) + g(v) = lim f (v) + lim g(v).
v→v0
(2) lim α(v)f (v) =
v→v0
v→v0
v→v0
lim α(v) lim f (v) .
v→v0
v→v0
Ist (W, k · kW ) eine normierte Algebra über K, so gilt außerdem
(3) lim f (v)g(v) = lim f (v) lim g(v) .
v→v0
v→v0
v→v0
5.1. GRENZWERTE VON FUNKTIONEN
101
(b)
(a)
Abbildung 5.2: (a) Graph der Funktion f : R → R \ {0}, x 7→ sin(x)/x. (b) Graph
der Heaviside–Funktion.
Satz 5.3. Sei (V, k · k) ein normierter Raum über K, sei D eine nichtleere Menge und sei
v0 ∈ D ein Punkt des Abschlusses von D. Sei ferner f : V → K \ {0} eine Funktion, welche
einen Grenzwert in v0 besitzt, der von Null verschieden ist. Dann gilt
lim
v→v0
1
1
=
.
f (v)
lim f (v)
v→v0
Für die Bestimmung von Funktionsgrenzwerten ist es oft hilfreich, die Potenzreihendarstellungen bestimmter Funktionen zu kennen. Dies ist insbesondere dann der Fall, wenn
eine Funktion in Abhängigkeit der Sinus-, Cosinus- oder Exponentialfunktion definiert ist.
Man betrachte hierzu die nachfolgenden Beispiele.
Beispiele.
(a) Wir betrachten die Funktion f : R \ {0} → R, welche durch f (x) = sin(x)/x für alle
x ∈ R \ {0} definiert ist (siehe auch Abbildung 5.2(a)). Mit der Potenzreihendarstellung der Sinusfunktion ergibt sich
x3 x5 x7
x2 x4 x6
1
x−
+
−
± ··· = 1 −
+
−
± ···
f (x) =
x
3!
5!
7!
3!
5!
7!
Anhand dieser Darstellung von f als Potenzreihe erkennt man, dass
lim f (x) = 1
x→0
gilt. Setzt man nämlich in der Potenzreihendarstellung für x die Zahl 0 ein, so verschwinden alle Potenzen von x, und es bleibt lediglich die Zahl 1 stehen.
(b) Gegeben sei die Funktion g : R\{1} → R, definiert durch g(x) = (x−1)/ ln(x) für alle
x ∈ R \ {1}. Mit der Potenzreihendarstellung der natürlichen Logarithmusfunktion
erhält man
1
1
(x − 1)2 (x − 1)3
x − 1 (x − 1)2
=
(x − 1) −
+
∓ ··· = 1 −
+
∓ ···
g(x)
x−1
2
3
2
3
Demnach gilt
lim g(x) =
x→1
1
lim
x→1 g(x)
−1
= 1.
In der Potenzreihendarstellung der Funktion 1/g verschwinden nämlich die Potenzen
von (x − 1), wenn man für x die Zahl 1 einsetzt.
♦
102
KAPITEL 5. STETIGE FUNKTIONEN
Für Funktionen, die auf Teilmengen der reellen Zahlen definiert sind, betrachtet man
gelegentlich so genannte einseitige Grenzwerte. Je nachdem, ob man sich von links“ oder
”
von rechts“ dem Punkt annähert, an dem der Grenzwert bestimmt werden soll, spricht
”
man von linksseitigen bzw. rechtsseitigen Grenzwerten.
Definition (linksseitiger Grenzwert). Sei (W, k · k) ein normierter Raum, sei D ⊂ R
eine nichtleere Menge, sei x0 ∈ D ein Punkt des Abschlusses von D, und sei f : D → W
eine Funktion. Ein Vektor w0 ∈ W heißt linksseitiger Grenzwert von f in x0 , wenn für
jede positive Zahl ε > 0 eine positive Zahl δ > 0 existiert, so dass
kf (x) − w0 k < ε für alle x ∈ (x0 − δ, x0 ) ∩ D
gilt. Man schreibt dann
lim f (x) = w0
x→x0 −
oder auch f (x) → w0 (x → x0 −).
Definition (rechtsseitiger Grenzwert). Sei (W, k · k) ein normierter Raum, sei D ⊂ R
eine nichtleere Menge, sei x0 ∈ D ein Punkt des Abschlusses von D, und sei f : D → W
eine Funktion. Ein Vektor w0 ∈ W heißt rechtsseitiger Grenzwert von f in x0 , wenn für
jede positive Zahl ε > 0 eine positive Zahl δ > 0 existiert, so dass
kf (x) − w0 k < ε für alle x ∈ (x0 , x0 + δ) ∩ D
gilt. Man schreibt dann
lim f (x) = w0
x→x0 +
oder auch f (x) → w0 (x → x0 +).
Der linksseitige und der rechtsseitige Grenzwert einer Funktion f an einem gegebenen
Punkt x ∈ R können verschieden sein. Es kann auch vorkommen, dass einer der beiden
einseitigen Grenzwerte existiert, während der andere Grenzwert nicht existiert. Man betrachte dazu die nachfolgenden Beispiele.
Beispiele.
(a) Wir betrachten die Funktion f : R \ {0} → R, welche durch f (x) := xsgn(x) für alle
x ∈ R\{0} definiert ist. Gesucht sind die einseitigen Grenzwerte von f in 0. Offenbar
gilt f (x) = x−1 = 1/x = −1/|x| für alle x < 0. Daher erhält man
lim f (x) = −∞.
x→0−
Der linksseitige Grenzwert von f in 0 existiert also nicht. Für x > 0 erhält man
hingegen f (x) = x1 = x = |x|. Daher gilt
lim f (x) = 0.
x→0+
(b) Die so genannte Heaviside–Funktion H : R → R ist durch
(
0 falls x < 0,
H(x) :=
1 falls x ≥ 0
5.1. GRENZWERTE VON FUNKTIONEN
103
für alle x ∈ R definiert (siehe auch Abbildung 5.2(b)). Man erkennt leicht, dass
lim H(x) = 0,
x→0−
sowie
lim H(x) = 1
x→0+
gilt. Die Heaviside–Funktion besitzt also an der Stelle 0 unterschiedliche links- und
rechtsseitige Grenzwerte.
♦
Existiert für eine Funktion f , die auf einer Teilmenge von R definiert ist, der Grenzwert
an einer Stelle x0 , so existieren auch der linksseitige und der rechtsseitige Grenzwert von
f in x0 , und es gilt
lim f (x) = lim f (x) = lim f (x).
x→x0
x→x0 −
x→x0 +
Existiert einer der beiden einseitigen Grenzwerte nicht, oder gilt
lim f (x) 6= lim f (x),
x→x0 +
x→x0 −
dann existiert kein Grenzwert von f in x0 .
Bei Funktionen, die auf unbeschränkten Teilmengen von R definiert sind, interessiert
man sich gelegentlich für das Verhalten sehr weit links bzw. sehr weit rechts vom Ursprung.
Man untersucht dann das Konvergenzverhalten solcher Funktionen, wenn deren Argument
gegen −∞ bzw. gegen ∞ strebt.
Definition (Grenzwert gegen −∞). Sei (W, k · k) ein normierter Raum, sei D ⊂ R eine
Menge, die nicht nach unten beschränkt ist, und sei f : D → W eine Funktion. Ein Vektor
w0 ∈ W wird der Grenzwert von f gegen −∞ genannt, wenn für jede positive Zahl ε > 0
eine reelle Zahl R ∈ R existiert, so dass
kf (x) − w0 k < ε für alle x ∈ (−∞, R] ∩ D
gilt. Man schreibt dann
lim f (x) = w0
x→−∞
oder auch f (x) → w0 (x → −∞).
Definition (Grenzwert gegen ∞). Sei (W, k · k) ein normierter Raum, sei D ⊂ R eine
Menge, die nicht nach oben beschränkt ist, und sei f : D → W eine Funktion. Ein Vektor
w0 ∈ W wird der Grenzwert von f gegen ∞ genannt, wenn für jede positive Zahl ε > 0
eine reelle Zahl R ∈ R existiert, so dass
kf (x) − w0 k < ε für alle x ∈ [R, ∞) ∩ D
gilt. Man schreibt dann
lim f (x) = w0
x→∞
oder auch f (x) → w0 (x → ∞).
Man betrachte die nachfolgenden Beispiele.
104
KAPITEL 5. STETIGE FUNKTIONEN
Beispiele.
(a) Wir betrachten die Funktion f : R → R, welche durch f (x) := (3x2 + 2x + 1)/(4x2 +
x + 2) für alle x ∈ R definiert ist. Es gilt dann
3+
3x2 + 2x + 1
lim f (x) = lim
= lim
x→∞
x→∞ 4x2 + x + 2
x→∞ 4 +
2
x
1
x
+
+
1
x2
2
x2
3
= .
4
(b) Sei p : R → R irgendein Polynom. Dann gilt
p(x)
= 0.
x→∞ ex
lim
Die Exponentialfunktion wächst also stärker als jedes Polynom, wenn ihr Argument
gegen ∞. Außerdem gilt
lim p(x)ex = 0.
x→−∞
Die Exponentialfunktion dominiert also auch hier das Konvergenzverhalten.
♦
Ist D eine Teilmenge von R, welche nicht nach oben beschränkt ist, ist f : D → R eine
reellwertige Funktion, und ist y0 ∈ R eine reelle Zahl, dann ist die Aussage
lim f (x) = y0
x→∞
gleichbedeutend damit, dass die Gerade {(x, y)T ∈ R2 | y = y0 } waagrechte Asymptote für
den Funktionsgraphen von f ist, wenn x gegen ∞ strebt.
Übungsaufgaben
1. Bestimmen Sie die folgenden Grenzwerte:
1 − x2
1
x3 + 6x2 + 11x + 6
lim
,
lim x sin
,
lim
,
x→−1 3x + 3
x→0
x→−2
x
x2 + x − 2
√
lim
x→0
2x + 1 −
x
√
x+1
.
2. Bestimmen Sie die folgenden Grenzwerte:
ex − cos(x)
,
x→0
x
lim
lim
x→1
2 ln(x)
,
x−1
lim
x→0
1 − cos(x)
,
x2
lim
x→0
2x
.
e2x − 1
Verwenden Sie Potenzreihendarstellungen, wo dies möglich ist.
3. Untersuchen Sie, ob für die folgenden Funktionen ein links- bzw. rechtsseitiger Grenzwert in
x0 = 0 existiert, und bestimmen Sie diesen gegebenenfalls:
x
f1 : R → R, x 7→ p ,
|x|
f2 : R → R, x 7→ bxc − 2x,
bxc
,
x
|x| sin(x)
f4 : R → R, x 7→
.
x2
f3 : R → R, x 7→
4. Bestimmen Sie die nachfolgenden Grenzwerte
3x3 + 4x2 + 5
,
x→∞ 1 + 10x − 7x2
lim
lim (x10 + 4x2 ) e−x ,
x→∞
x5 + 4x3 + 8
,
x→−∞ 2x7 − 4x6 + 13
lim
sin(x)
.
x→∞
x
lim
5.2. STETIGKEIT
5.2
105
Stetigkeit
In diesem Abschnitt führen wir den wichtigen Begriff der Stetigkeit für Funktionen ein.
Wie sich zeigen wird, ist dieser Begriff eng mit dem Grenzwertbegriff für Funktionen
verbunden.
Definition (stetige Funktion). Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume
über K, sei D ⊆ V eine nichtleere Menge, und sei v0 ∈ D ein Punkt dieser Menge. Eine
Funktion f : D → W heißt stetig an der Stelle v0 , wenn für jede positive Zahl ε > 0 eine
positive Zahl δ > 0 existiert, so dass
kf (v) − f (v0 )kW < ε für alle v ∈ Bδ (v0 ) ∩ D
gilt. Hierbei bezeichnet Bδ (v0 ) die offene Kugel in V mit Mittelpunkt v0 und Radius δ.
Die Funktion heißt stetig, wenn sie an jeder Stelle in D stetig ist. Die Menge aller stetigen
Funktionen von D nach W wird mit C(D, W ) bezeichnet. Falls W = R gilt, bezeichnet
man diese Menge auch mit C(D).
Nachfolgend geben wir einige einfache Beispiele für stetige Funktionen an.
Beispiele.
(a) Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, und sei D ⊆ V eine
nichtleere Menge. Dann ist jede konstante Funktion von D nach W stetig.
(b) Sei (V, k · k) ein normierter Raum über K. Dann ist die identische Funktion auf V
stetig. Die identische Funktion idV : V → V auf V ist bekanntlich durch idV (v) := v
für alle v ∈ V definiert.
(c) Die Exponentialfunktion und der natürliche Logarithmus sind stetige Funktionen von
R nach R bzw. von (0, ∞) nach R.
(d) Die Sinusfunktion und die Cosinusfunktion sind stetige Funktionen von R nach R.
Die Tangensfunktion ist an jeder Stelle ihres Definitionsbereichs stetig.
(e) Jede lineare Abbildung von Km nach Kn , wobei m ∈ N und n ∈ N zwei natürliche
Zahlen sind, ist stetig.
Betrachtet man die Definition für die Stetigkeit einer Funktion f an einer Stelle v0 genauer, so erkennt man, dass diese große Ähnlichkeit mit der Definition des Grenzwertes
von f in v0 hat. Tatsächlich kann man die Stetigkeit einer Funktion auch mit Hilfe von
Funktionsgrenzwerten charakterisieren, wie das nachfolgende Lemma zeigt.
Lemma 5.4. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, sei D ⊆ V
eine nichtleere Menge, und sei v0 ∈ D ein Punkt dieser Menge. Eine Funktion f : D → W
ist genau dann stetig an der Stelle v0 , wenn
lim f (v) = f (v0 )
v→v0
gilt.
106
KAPITEL 5. STETIGE FUNKTIONEN
Abbildung 5.3: Eine Funktion f : D → W ist an einer Stelle v0 ∈ D stetig, wenn für
alle ε > 0 ein δ > 0 existiert, so dass das Bild von Bδ (v0 ) ∩ D unter f eine Teilmenge
von Bε (f (v0 )) ist.
Gemäß Lemma 5.4 ist eine Funktion f also genau dann an einer Stelle v0 ihres Definitionsbereichs stetig, wenn der Grenzwert von f in v0 mit dem Funktionswert von f in
v0 übereinstimmt. Mit diesem Prinzip kann man sehr leicht die Stetigkeit einer Funktion
zeigen bzw. widerlegen. Man betrachte dazu auch die folgenden Beispiele.
Beispiele.
√
(a) Die Quadratwurzelfunktion · : [0, ∞) → R ist stetig. Ist nämlich x0 > 0 eine
beliebige Stelle, so erhält man
√
|x − x0 |
0 f (x) − f (x0 ) = x − √x0 = √x − x
x + √x0 ≤ √x0
für alle x ∈ R. Daher gilt
lim f (x) − f (x0 ) = 0,
x→x0
d.h. der Funktionswert f (x0 ) ist auch der Grenzwert von f in x0 . Für x0 = 0 lässt
sich dies ebenfalls zeigen.
(b) Die Funktion sinc : R → R, welche durch
(
sin(x)/x
sinc(x) :=
1
falls x 6= 0,
falls x = 0
für alle x ∈ R definiert ist, wird Sinus Cardinalis genannt. Sie ist an der Stelle x0 = 0
stetig, da
sin(x)
lim sinc(x) = lim
= 1 = sinc(0)
x→0
x→0
x
gilt. An allen übrigen Stellen ist sinc ebenfalls stetig.
(c) Die Funktion f : R → R, welche durch
(
x2
f (x) :=
1
falls x 6= 0,
falls x = 0
für alle x ∈ R definiert ist, ist an der Stelle x0 = 0 nicht stetig. Es gilt nämlich
lim f (x) = lim x2 = 0 6= 1 = f (0).
x→0
x→0
An allen übrigen Stellen ist die Funktion f jedoch stetig.
♦
5.2. STETIGKEIT
107
Bei Funktionen, die auf Teilmengen D von R definiert sind, kann man bekanntlich einseitige
Grenzwerte an einer Stelle x0 ∈ D betrachten. Der Grenzwert von f in x0 existiert in
diesem Fall genau dann, wenn der linksseitige und der rechtsseitige Grenzwert von f in x0
existieren, und wenn beide einseitigen Grenzwerte übereinstimmen. Entsprechend ist die
Funktion f genau dann an der Stelle x0 stetig, wenn
lim f (x) = lim f (x) = f (x0 )
x→x0 +
x→0−
gilt. Dieses Kriterium ist nützlich, wenn man abschnittsweise definierte Funktionen auf
Stetigkeit hin untersucht. Man betrachte dazu die nachfolgenden Beispiele.
Beispiele.
(a) Für die Heaviside–Funktion (siehe Beispiel (b) auf Seite 2) gilt bekanntlich
lim H(x) = 0 6= 1 = lim H(x).
x→0−
x→0+
Daher ist die Heaviside–Funktion an der Stelle x0 = 0 nicht stetig.
(b) Betrachtet man die Funktion f : R → R, welche durch
(
x
falls x < 0,
f (x) :=
−x
1−e
falls x ≥ 0
für alle x ∈ R definiert ist, so stellt man fest, dass
lim f (x) = lim x = 0 = lim 1 − e−x = lim f (x)
x→0−
x→0−
x→0+
x→0+
gilt. Die Funktion ist also an der Stelle x0 = 0 stetig.
♦
Wir kommen nun zu einem weiteren Kriterium für die Stetigkeit von Funktionen.
Satz 5.5 (Folgenkriterium für Stetigkeit). Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, und sei D ⊆ V eine nichtleere Menge. Eine Funktion f : D → W
ist genau dann stetig an einer Stelle v0 ∈ D, wenn für jede Folge (vn )n∈N in D, welche
gegen v0 konvergiert, die Folge der Funktionswerte (f (vn ))n∈N gegen f (v0 ) konvergiert.
Aus dem Folgenkriterium für Stetigkeit folgt insbesondere, dass die Gleichung
lim f (vn ) = f lim vn
n→∞
n→∞
für jede stetige Funktion f und jede konvergente Folge (vn )n∈N gilt. Diese Tatsache kann
man unter anderem dazu verwenden, die Grenzwerte bestimmter Folgen zu berechnen.
Man betrachte dazu die nachfolgenden Beispiele.
Beispiele.
(a) Man betrachte die Folge (an )n∈N , welche durch
1
1
1
an := ln 1 + + + · · · +
1! 2!
n!
für alle n ∈ N definiert ist. Offenbar gilt dann an = ln(sn ) für alle n ∈PN, wobei
∞
sn := 1 + 1/1! + 1/2! + · · · + 1/n! die n-te Partialsumme der Reihe
k=1 1/k!
bezeichnet. Wir wissen bereits, dass die Folge (sn )n∈N gegen die Eulersche Zahl
e konvergiert. Da der natürliche Logarithmus eine stetige Funktion ist, gilt demnach
lim an = lim ln(sn ) = ln lim sn = ln(e) = 1.
n→∞
n→∞
n→∞
108
KAPITEL 5. STETIGE FUNKTIONEN
Abbildung 5.4: Die Verkettung zweier Funktionen f und g, welche an den Stellen u0
und v0 = f (u0 ) stetig sind, ist an der Stelle u0 stetig.
(b) Aus Satz 2.3 und dem Folgenkriterium für Stetigkeit ergibt sich, dass jede Norm eine
stetige Funktion ist.
♦
Mit dem Folgenkriterium für Stetigkeit (d.h. mit Satz 5.5), sowie mit den Sätzen 2.4 und
2.5 kann man weiterhin ganz leicht die nachfolgenden beiden Sätze beweisen.
Satz 5.6. Seien (V, k · kV ) und (W, k · kW ) normierte Räume über K, und sei D ⊆ V eine
nichtleere Menge. Seien außerdem f : D → W , g : D → W und α : D → K Funktionen,
die an einer Stelle v0 ∈ D stetig sind. Dann gelten die folgenden Aussagen.
(1) Die Funktion f + g : D → W ist an der Stelle v0 stetig.
(2) Die Funktion αf : D → W ist an der Stelle v0 stetig.
Ist (W, k · kW ) eine normierte Algebra über K, so gilt außerdem
(3) Die Funktion f g : D → W ist an der Stelle v0 stetig.
Satz 5.7. Sei (V, k · k) ein normierter Raum über K, sei D ⊆ V eine nichtleere Menge,
und sei f : D → K \ {0} eine Funktion, welche an einer Stelle v0 ∈ D stetig ist. Dann ist
die Funktion
1
:D→K
f
ebenfalls an der Stelle v0 stetig.
Man beachte dass die Vektoraddition, die skalare Multiplikation, die Multiplikation, sowie
die Division in den Sätzen 5.6 und 5.7 jeweils punktweise zu verstehen ist (siehe Beispiel
(e) auf Seite 34). Ist D eine nichtleere Teilmenge eines normierten Raumes, und ist W ein
normierter Raum über K, so folgt aus den Teilen (1) und (2) von Satz 5.6, dass die Menge
aller stetigen Funktionen von D nach W ein Vektorraum über K ist. Wie bereits erwähnt,
wird die Menge aller stetigen Funktionen von D nach W mit C(D, W ) bezeichnet. Ist W
eine normierte Algebra über K, dann folgt aus Teil (3) von Satz 5.6, dass C(D, W ) eine
Algebra über K ist.
Der nachfolgende Satz macht eine Aussage über die Verkettung von Funktionen, die
an bestimmten Stellen ihrer Definitionsbereiche stetig sind.
Satz 5.8. Seien (U, k · kU ), (V, k · kV ) und (W, k · kW ) normierte Räume über K, und seien
C ⊆ U und D ⊆ V zwei nichtleere Mengen. Sei außerdem g : C → D eine Funktion, die an
einer Stelle u0 ∈ U stetig ist, und f : D → E eine Funktion, die an der Stelle v0 := g(u0 )
stetig ist. Dann ist die Funktion f ◦ g : C → W ebenfalls an der Stelle u0 stetig.
5.2. STETIGKEIT
109
Die Voraussetzungen für Satz 5.8 sind in Abbildung 5.4 noch einmal anschaulich dargestellt. Die Sätze 5.6, 5.7 und 5.8 werden in der Regel dazu verwendet, die Stetigkeit von
gegebenen Funktionen nachzuweisen. Der Nachweis gelingt, wenn man zeigen kann, dass
sich eine gegebene Funktion als Addition, Subtraktion, Multiplikation, Division oder Verkettung von stetigen Funktionen darstellen lässt. Eine weitere Möglichkeit, die Stetigkeit
einer Funktion nachzuweisen, liefert der nachfolgende Satz.
Satz 5.9. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume, sei D ⊆ V eine nichtleere
Menge, und sei (fn )n∈N eine Folge stetiger Funktionen von D nach W , welche gleichmäßig
auf D gegen eine Grenzfunktion f : D → W konvergiert. Dann ist f ebenfalls stetig.
Die Aussage von Satz 5.9 kann auch dazu verwendet werden, die gleichmäßige Konvergenz
einer Funktionenfolge zu widerlegen. Man betrachte dazu das nachfolgende Beispiel.
Beispiel.
Die Funktionenfolge (pn )n∈N von [0, 1] nach R, welche durch pn (x) := xn für alle x ∈ [0, 1]
und alle n ∈ N definiert ist, konvergiert bekanntlich punktweise gegen die Grenzfunktion
p : [0, 1] → R, welche durch
(
0 falls x ∈ [0, 1),
p(x) :=
1 falls x = 1
für alle x ∈ R definiert ist. Jedes Glied der Folge (pn )n∈N ist eine stetige Funktion. Die
Grenzfunktion p ist hingegen nicht stetig. Gemäß Satz 5.9 kann die Konvergenz von (pn )n∈N
gegen p also nicht gleichmäßig sein.
♦.
Wir beschließen diesen Abschnitt mit einer weiteren Charakterisierung stetiger Funktionen, die in den nachfolgenden Abschnitten von großer Bedeutung sein wird.
Satz 5.10. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, und sei D ⊆ V
eine nichtleere Menge. Eine Funktion f : D → W ist genau dann stetig, wenn für jede
offene Menge Θ ⊆ W eine offene Menge O ⊆ V existiert, so dass f −1 (Θ) = D ∩ O gilt.
Übungsaufgaben
1. Geben seien die stetigen Funktionen
f1 : R → R, x 7→ 1,
f2 : R → R, x 7→ x,
f3 : [0, ∞) → R, x 7→
√
x,
x
f4 : R → R, x 7→ e ,
f5 : (0, ∞) → R, x 7→ ln(x).
Stellen Sie die nachfolgend angegebenen Funktionen als Verknüpfungen (d.h. als Summen,
Differenzen, Produkte, Quotienten, Vielfache oder Verkettungen) von f1 , f2 , . . . , f5 dar:
2
g1 : R → R, x 7→ e−x ,
g2 : R → R, x 7→ 2x2 − 3x + 2,
g3 : R → R, x 7→ 2x ,
110
KAPITEL 5. STETIGE FUNKTIONEN
g4 : [0, ∞) → R, x3/2 ,
g5 : (0, ∞) → R, x 7→ xx .
Verwenden Sie dabei, dass ab = eb ln(a) für alle a > 0 und alle b ∈ R gilt. Sind die Funktionen
g1 , g2 , . . . , g5 stetig?
2. Zeigen Sie mit Hilfe von Satz 5.6, dass jedes Polynom eine stetige Funktion von R nach R ist.
Verwenden Sie dabei die Tatsache, dass die Funktionen f : R → R und g : R → R, welche
durch f (x) = x bzw. g(x) = 1 für alle x ∈ R definiert sind, stetig sind.
3. Wie muss α ∈ R gewählt werden, damit die Funktion fα : R → R, definiert durch
(
2
(1 + x2 − ex )/x4 falls x 6= 0,
fα (x) :=
α
falls x = 0
für alle x ∈ R, stetig ist?
4. Bestimmen Sie jeweils Menge aller Stellen, an denen die folgenden Funktionen stetig sind.
(
(x3 − 1)/(x − 1) falls x 6= 1,
f1 : R → R, x 7→
3
falls x = 1
(
(cos(x) − 1)/x falls x 6= 0,
f2 : R → R, x 7→
0
falls x = 0
( √
x + 1 falls x ≥ 0,
√
,
f3 : R → R, x 7→
− 1 − x falls x < 0,
(
0 falls x ∈ Q,
f4 : R → R, x 7→
.
1 falls x 6∈ Q
5. Bestimmen Sie die Grenzwerte der reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N .
Die Folgen sind durch
nπ
π
an = sin
cos π +
,
2n + π
n
1 1 1
(−1)n+1
bn = tan 1 − + − ± · · · +
,
3 5 7
2n − 1
2
cn = n ln 1 +
,
n
d1 := e,
n
dn+1 := dn e(−1)
/(n+1)
für alle n ∈ N definiert. Verwenden Sie dabei die Tatsache, dass der natürliche Logarithmus,
die Funktionen Sinus und Tangens, sowie die Exponentialfunktion stetige Funktionen sind.
5.3. DER ZWISCHENWERTSATZ
5.3
111
Der Zwischenwertsatz
In diesem Abschnitt lernen wir den wichtigen Zwischenwertsatz kennen der für jede stetige
Funktion gilt, die auf einer zusammenhängenden Menge definiert ist. Aus dem Zwischenwertsatz lassen sich eine Reihe wichtiger Folgerungen ableiten. Ein paar davon stellen wir
in diesem Abschnitt vor. Die Grundlage für alle Resultate in diesem Abschnitt bildet der
nachfolgende Satz.
Satz 5.11. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, sei D ⊆ V eine
nichtleere, zusammenhängende Menge, und sei f : D → W eine stetige Funktion. Dann
ist f (D) ebenfalls zusammenhängend.
Umgangssprachlich kann die Aussage von Satz 5.11 wie folgt formuliert werden: Eine stetige Funktion bildet zusammenhängende Mengen auf zusammenhängende Mengen ab. Dies
ist in der Tat eine bemerkenswerte Eigenschaft stetiger Funktionen. Erinnert man sich nun
daran, dass die nichtleeren, zusammenhängenden Teilmengen von R genau die Intervalle
sind (siehe Satz 3.16), dann kommt man leicht zum so genannten Zwischenwertsatz für
stetige Funktionen.
Satz 5.12 (Zwischenwertsatz). Sei (V, k · k) ein normierter Raum über K, D ⊆ V eine nichtleere, zusammenhängende Menge, f : D → R eine stetige Funktion. Seien ferner
y1 , y2 ∈ f (D) zwei Funktionswerte von f mit y1 < y2 . Dann existiert zu jedem Zwischenwert y ∈ [y1 , y2 ] eine Stelle v ∈ D, so dass f (v) = y gilt.
Die Aussage des Zwischenwertsatzes kann man folgendermaßen ausdrücken: Eine stetige
Funktion, welche auf einer zusammenhängenden Menge definiert ist und zwei Funktionswerte y1 und y2 annimmt, nimmt auch jeden Funktionswert zwischen y1 und y2 an. In den
nachfolgenden Beispielen wird die Aussage des Zwischenwertsatzes noch einmal verdeutlicht. Ferner wird eine mögliche Anwendung des Zwischenwertsatzes demonstriert.
Beispiele.
(a) Wir betrachten Funktion f : [−π, π] → R, welche durch f (x) := x cos(x cos(x))/π
für alle x ∈ R definiert ist. Offenbar ist f als Verknüpfung stetiger Funktionen stetig.
Das Intervall [−π, π] ist zusammenhängend. Wir interessieren uns für die Bildmenge
von f . Man rechnet leicht nach, dass f (−π) = 1 und f (π) = −1 gilt. Nach dem
Zwischenwertsatz nimmt f daher jeden Funktionswert zwischen −1 und 1 an. Das
Intervall [−1, 1] ist somit eine Teilmenge der Bildmenge von f .
(b) Die Funktion g : [0, 1] × [0, 1] → R sei durch g(x, y) = x2 − 6xy + 2y definiert. Die
Funktion g kann als Verknüpfung stetiger Funktionen dargestellt werden, weshalb sie
stetig ist. Das Quadrat [0, 1] × [0, 1] ist eine zusammenhängende Teilmenge des R2 .
Ferner gilt g(1, 1) = −3 und g(0, 1) = 2. Aufgrund des Zwischenwertsatzes nimmt die
Funktion g auf [0, 1] × [0, 1] alle Funktionswerte zwischen −3 und 2 an. Die Funktion
g besitzt also insbesondere eine Nullstelle.
(c) Besitzt die Gleichung
sin(2x) − ex = −5
für x eine Lösung im Intervall [0, π]? Um diese Frage zu beantworten, kann man
die linke Seite der Gleichung als Funktion f : R → R auffassen, welche durch
f (x) := sin(2x) − ex für alle x ∈ R definiert ist. Die Funktion f ist als Verknüpfung
112
KAPITEL 5. STETIGE FUNKTIONEN
stetiger Funktionen stetig. Ferner gilt f (0) = −1 und f (π) = −eπ . Nach dem Zwischenwertsatz nimmt die Funktion f auf dem Intervall [0, π] jeden Funktionswert
zwischen −eπ und −1 an. Wegen −eπ < −2π < −23 = −8 gilt −5 ∈ [−eπ , −1].
Daher existiert eine Stelle x ∈ [0, π], für die f (x) = −5 gilt. Die obige Gleichung
besitzt also eine Lösung im Intervall [0, π].
♦
Eine wichtige Folgerung aus dem Zwischenwertsatz ist der so genannte Nullstellensatz von
Bolzano.
Satz 5.13 (Nullstellensatz von Bolzano). Sei I ⊆ R ein reelles Intervall, und sei
f : I → R eine stetige Funktion. Seien ferner a, b ∈ I zwei reelle Zahlen, so dass a < b und
f (a)f (b) < 0 gilt. Dann besitzt die Funktion f eine Nullstelle im offenen Intervall (a, b),
d.h. es existiert eine reelle Zahl z ∈ (a, b) mit f (z) = 0.
Der Nullstellensatz von Bolzano bildet die theoretische Grundlage für ein einfaches numerisches Verfahren, mit dem Näherungswerte für die Nullstelle einer stetigen Funktion
berechnet werden können. Dieses Verfahren beruht auf der Konstruktion immer kleine”
rer“Intervalle, welche mindestens eine Nullstelle der Funktion enthalten. Es wird Bisektionsverfahren genannt.
Algorithmus (Bisektionsverfahren). Gegeben sei ein reelles Intervall I ⊆ R, eine stetige Funktion f : I → R sowie zwei Stellen a0 , b0 ∈ I mit a < b, für die f (a0 )f (b0 ) < 0
gilt. Zu einer vorgegebenen positiven Zahl ε > 0 sind zwei Zahlen a, b ∈ I mit a < b und
b − a < ε gesucht, so dass f in dem Intervall [a, b] eine Nullstelle besitzt. Man berechnet
dann die Intervalle [a0 , b0 ], [a1 , b1 ], [a2 , b2 ], . . . gemäß
ak−1 + bk−1
,
2
(
[ak−1 , ck ] falls f (ak−1 )f (ck ) < 0,
[ak , bk ] :=
[ck , bk−1 ] sonst
ck :=
für k = 1, 2, 3, . . . , solange bis bn − an < ε für ein n ∈ N gilt. Das gesuchte Intervall ist
dann durch [a, b] := [an , bn ] gegeben.
Der Parameter ε im Bisektionsverfahren gibt die Genauigkeit vor, mit der eine Nullstelle
der Funktion f angenähert werden soll. Je kleiner ε gewählt wird, desto genauer ist die
Näherung. Allerdings wächst mit kleiner werdendem ε auch die Anzahl der Schritte, die das
Bisektionsverfahren benötigt, um die geforderte Genauigkeit zu erreichen. Im Vergleich zu
anderen numerischen Verfahren, mit denen Näherungswerte für Nullstellen von Funktionen
berechnet werden können, ist das Bisektionsverfahren eher ineffizient bzw. langsam“. Die
”
Vorteil des Bisektionsverfahrens besteht jedoch darin, dass nur wenige Voraussetzungen
an die Funktion f stellt, und dass es relativ leicht implementiert werden kann.
Übungsaufgaben
1. Gibt es eine stetige und surjektive Funktion, die vom Intervall (0, 1) in die Menge M1 :=
(0, ∞) bzw. in die Menge M2 := (−1, 1) \ {0} abbildet? Geben Sie ggf. eine entsprechende
Funktion an.
5.3. DER ZWISCHENWERTSATZ
113
2. Zeigen Sie mit Hilfe des Zwischenwertsatzes, dass die Gleichung
e2x − ln(1 + x) = 2
eine Lösung x im Intervall [0, 1] besitzt.
3. Man betrachte die Funktion f : (−1, 1) \ {0} → R, welche durch f (x) := sgn(x) für alle
x ∈ [−1, 1] \ {0} definiert ist. Zeigen Sie, dass f stetig ist. Erfüllt f die Voraussetzungen des
Zwischenwertsatzes?
4. Berechnen Sie von Hand die ersten drei Intervalle [a1 , b1 ], [a2 , b2 ], [a3 , b3 ], welche das Bisektionsverfahren für die Funktion f : R → R, x 7→ x5 − 3x3 + 1 und die Startwerte a1 := 0
und b1 := 1 liefert.
114
5.4
KAPITEL 5. STETIGE FUNKTIONEN
Der Satz vom Minimum und Maximum
Neben dem Zwischenwertsatz gibt es noch einen weiteren wichtigen Satz, der für alle
stetigen Funktionen gilt. Dieser Satz als der Satz vom Minimum und Maximum bekannt.
Der Satz vom Minimum und Maximum beruht auf der folgenden wichtigen Aussage über
das Abbildungsverhalten stetiger Funktionen.
Satz 5.14. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, sei D ⊂ V
eine nichtleere, kompakte Menge, und sei f : D → R eine stetige Funktion. Dann ist f (D)
kompakt.
Satz 5.14 besagt, dass stetige Funktionen kompakte Mengen auf kompakte Mengen abbilden. Dieses Wissen benötigt man, um den nachfolgenden Satz zu beweisen.
Satz 5.15 (Satz vom Minimum und Maximum). Sei (V, k · k) ein normierter Raum
über K, sei D ⊂ V eine nichtleere, kompakte Menge, und sei f : D → R eine stetige
Funktion. Dann existieren zwei Vektoren v∗ , v ∗ ∈ D mit
f (v∗ ) = min f (v),
v∈D
∗
f (v ) = max f (v).
v∈D
Umgangssprachlich kann der Satz vom Minimum und Maximum folgendermaßen formuliert werden: Jede stetige Funktion nimmt auf einer kompakten Menge ihr Minimum und
ihr Maximum an. Die Kompaktheit der Definitionsmenge ist hierbei von entscheidender
Bedeutung, wie man anhand der nachfolgenden Beispiele erkennt.
Beispiele.
(a) Die Funktion f : [−1, 1] → R, welche durch f (x) := x7 − 4x6 + 3x − 5 für alle x ∈
[−1, 1] definiert ist, ist offenbar ein Polynom und somit stetig. Die Definitionsmenge
von f ist abgeschlossen und beschränkt, und nach dem Satz von Heine–Borel (siehe
Satz 3.9) somit kompakt. Nach dem Satz vom Minimum und Maximum besitzt die
Funktion f also einen minimalen und einen maximalen Funktionswert.
(b) Die Funktion g : (0, 1) → R, welche durch g(x) := 1/x für alle x ∈ (0, 1) definiert
ist, ist zwar stetig, ihre Definitionsmenge ist aber nicht kompakt. Daher kann man
den Satz von Minimum und Maximum nicht auf die Funktion g anwenden. Wie
man leicht zeigt, besitzt die Funktion g tatsächlich kein Minimum und auch kein
Maximum.
Mit dem Satz vom Minimum und Maximum lassen sich eine Reihe wichtiger Aussagen
beweisen. Im folgenden Abschnitt werden wir eine solche wichtige Aussage kennen lernen.
Übungsaufgaben
1. Gibt es eine stetige und surjektive Funktion, die vom Intervall [0, 1] in die Menge M1 :=
[−1, 1] bzw. in die Menge M2 := (0, 1) abbildet? Geben Sie ggf. eine entsprechende Funktion
an.
2. Zeigen Sie, dass die Funktion f : [−1, 1] → R2 , definiert durch
3
−t + 2t − t
f (t) :=
et − t2
für alle t ∈ [−1, 1] beschränkt ist.
5.5. ÄQUIVALENZ VON NORMEN
5.5
115
Äquivalenz von Normen
In den zurück liegenden Abschnitten wurden zahlreiche Begriffe und Eigenschaften mit
Hilfe von Normen definiert. Insbesondere die Konzepte von Konvergenz und Stetigkeit
wurden in normierten Räumen (V, k · k) und somit in Abhängigkeit einer Norm k · k definiert. Bereits im Abschnitt 1.1 haben wir aber gesehen, dass man auf einem Vektorraum
V im Allgemeinen unterschiedliche Normen definieren kann. Es stellt sich daher die folgende Frage: Angenommen, k · k(1) und k · k(2) sind zwei unterschiedliche Normen auf einem
Vektorraum V . Ferner sei (vn )n∈N eine Folge in V , von der man weiß, dass sie bezüglich
der Norm k · k(1) konvergent ist. Ist diese Folge dann auch bezüglich der Norm k · k(2) konvergent? Am Ende dieses Abschnitts werden wir darauf folgende Antwort geben können:
Ja, sofern V = Kn gilt oder die Normen k · k(1) und k · k(2) äquivalent sind.
Definition (äquivalente Normen). Sei V ein Vektorraum über K. Zwei Normen k · k(1)
und k · k(2) auf V heißen zueinander äquivalent, wenn zwei positive Konstanten c > 0 und
C > 0 existieren, so dass
ckvk(2) ≤ kvk(1) ≤ Ckvk(2)
für alle v ∈ V gilt.
Man kann leicht zeigen, dass die Äquivalenz von Normen tatsächlich eine Äquivalenzrelation auf der Menge aller Normen auf einem gegebenen Vektorraum ist. Für die offenen
Kugeln äquivalenter Normen gilt das folgende wichtige Lemma.
Lemma 5.16. Sei V ein normierter Raum über K, und seien k · k(1) und k · k(2) zwei
äquivalente Normen auf V . Sei außerdem v ∈ V ein beliebiger Vektor und r > 0 eine
beliebige, positive Zahl. Dann existieren positive Zahlen s > 0 und S > 0, so dass
(2)
Bs(2) (v) ⊆ Br(1) (v) ⊆ BS (v)
(1)
gilt. Hierbei bezeichnet Br (v) die offene Kugel in V mit Mittelpunkt v und Radius
(2)
(2)
r bezüglich der Norm k · k(1) . Mit Bs (v) und BS (v) werden die offenen Kugeln mit
Mittelpunkt v und den Radien s bzw. S bezüglich der Norm k · k(2) bezeichnet.
Vergegenwärtigen wir uns die Bedeutung von Lemma 5.16. In den zurück liegenden Abschnitten dieses Skripts wurden sämtliche topologische Begriffe wie auch sämtlich Konvergenzbegriffe letztlich über offene Kugeln definiert. Eine Folge (vn )n∈N in einem normierten
Raum wird beispielsweise konvergent gegen einen Vektor v genannt, wenn für alle ε > 0
ein N ∈ N existiert, so dass
kvn − vk < ε
für alle n ∈ N mit n ≥ N gilt. Die strikte Ungleichung bedeutet jedoch nichts anderes, als
dass vn ∈ Bε (v) gilt, wobei Bε (v) die offene Kugel mit Mittelpunkt v und Radius ε bezüglich der Norm k · k bezeichnet. Ein typisches Beispiel für einen topologischen Begriff, der
mit Hilfe von offenen Kugeln definiert wird, ist die Offenheit von Mengen. Eine Teilmenge
O eines normierten Raumes wird bekanntlich als offen bezeichnet, wenn für jeden Punkt
v der Menge eine offene Kugel Bε (v) existiert, so dass Bε (x) ⊆ O gilt.
Lemma 5.16 besagt nun folgendes: Wenn eine Folge bezüglich einer gegebenen Norm
k · k konvergent ist, dann ist sie auch bezüglich jeder zu k · k äquivalenten Norm konvergent. Man kann nämlich zu jeder offenen Kugel Bε (v) bezüglich k · k eine offene Kugel
bezüglich der äquivalenten Norm finden, so dass diese eine Teimenge von Bε (v) ist. Aus
116
KAPITEL 5. STETIGE FUNKTIONEN
demselben Grund ist jede Menge, die bezüglich einer gegebenen Norm k · k offen ist, auch
bezüglich jeder anderen, zu k · k äquivalenten Norm offen. Grundsätzlich kann man also folgendes sagen: Sämtliche Konvergenzeigenschaften von Folgen, Reihen, etc. und sämtliche
topologischen Eigenschaften von Mengen bleiben für äquivalente Normen erhalten.
Welche in diesem Skript bereits eingeführten Normen sind zueinander äquivalent? Das
folgende Lemma macht dazu eine wichtige Aussage.
Lemma 5.17. Jede Norm auf Kn ist zur Maximumnorm k · k∞ auf Kn äquivalent. Diese
Aussage gilt für alle n ∈ N.
Da die Äquivalenz von Normen eine Äquivalenzrelation auf der Menge aller Normen eines
Vektorraums ist, folgt aus Lemma 5.17 unmittelbar der nachfolgende Satz.
Satz 5.18. Alle Normen auf Kn sind zueinander äquivalent. Diese Aussage gilt für alle
n ∈ N.
Eine weitere wichtige Folgerung aus Lemma 5.17 ist der nachfolgende Satz, der eine Aussage über die Konvergenz vektorwertiger Folgen und Funktionen macht. Mit vektorwertig“
”
ist hierbei gemeint, dass die Glieder einer Folge Elemente des Vektorraums Kn sind, bzw.
dass eine Funktion in diesen Vektorraum abbildet, wobei man implizit n > 1 voraussetzt.
Satz 5.19. Eine Folge (x(k) )k∈N in Kn konvergiert genau dann gegen einen Vektor x ∈ Kn ,
wenn die Komponenten der Folgenglieder gegen die Komponenten von x konvergieren. Eine
Funktion f mit Bild in Kn besitzt genau dann in einem Punkt v0 den Grenzwert w0 ∈ Kn ,
wenn die Komponenten von w0 die Grenzwerte der Komponenten von f in v0 sind.
Umgangssprachlich können die Aussagen von Satz 5.19 folgendermaßen formuliert werden:
Eine vektorwertige Folge konvergiert genau dann gegen einen bestimmten Vektor, wenn
sie komponentenweise gegen diesen konvergiert. Der Grenzwert einer Funktion ist genau
dann ein bestimmter Vektor, wenn dies komponentenweise der Fall ist. Zur Erläuterung
dieser Aussagen betrachte man die nachfolgenden Beispiele.
Beispiele.
(a) Die Folge (x(k) )k∈N in R2 , deren Glieder durch
√
n
n
(k)
x :=
1/n
für alle k ∈ N gegeben sind, soll auf Konvergenz hin untersucht werden. Laut
Satz 5.19 kann diese Untersuchung komponentenweise erfolgen. Die erste Komponente der Folgenglieder konvergiert offenbar gegen 1, während die zweite Komponente
gegen 0 konvergiert. Also gilt
1
(k)
lim x =
.
0
k→∞
(b) Die Funktion f : R \ {0} → R2 sei durch
sin(x)/x
f (x) =
(x2 − 2x)/(2x)
5.5. ÄQUIVALENZ VON NORMEN
117
für alle x ∈ R \ {0} definiert. Es soll der Grenzwert von f in 0 bestimmt werden.
Wieder geht man komponentenweise vor und erhält so
1
lim f (x) =
−1
x→0
als Grenzwert.
♦
Übungsaufgaben
1. Für je zwei Normen k · k(1) und k · k(2) auf einem Vektorraum V über K gelte k · k(1) ∼
k · k(2) genau dann, wenn die Normen zueinander äquivalent sind. Zeigen Sie, dass ∼ eine
Äquivalenzrelation auf der Menge aller Normen auf V ist.
2. Sei V ein Vektorraum über K, und sei k · k(0) eine Norm auf V mit der Eigenschaft, dass alle
Normen auf V zu k · k(0) äquivalent sind. Zeigen Sie, dass dann alle Normen auf V zueinander
äquivalent sind.
3. Es seien | · | und k · k∞ die euklidischen Norm bzw. die Maximumnorm auf Rn , wobei n ∈ N
beliebig, aber fest gewählt sei. Bestimmen Sie zwei Zahlen c > 0 und C > 0 in Abhängigkeit
von n, so dass ckxk∞ ≤ |x| ≤ Ckxk∞ für alle x ∈ Rn gilt.
4. Bestimmen Sie die folgenden Funktionsgrenzwerte:
5
(3x − 3)/(2x5 + 7)
sin(x2 )/x
2
lim
, lim
,
2
x→∞
x→0 x + 3x + 1
x4 e−x
lim
x→1
(x2 − 1)/(x3 − 1)
.
x ln(x)
Lernzielkontrolle
Nach dem Durcharbeiten dieses Kapitels sollten Sie ...
... Grenzwerte von Funktionen bestimmen können.
... einseitige Grenzwerte von Funktionen bestimmen können.
... Grenzwerte von Funktionen gegen ∞ und gegen −∞ bestimmen können.
... wissen, dass eine Funktion genau dann an einer Stelle ihres Definitionsbereichs stetig
ist, wenn der Grenzwert an der Stelle mit dem Funktionswert übereinstimmt.
... stetige Funktionen anhand ihrer Definition erkennen können.
... das Folgenkriterium für Stetigkeit kennen.
... den Zwischenwertsatz sowie den Nullstellensatz von Bolzano kennen.
... den Satz vom Minimum und Maximum kennen.
... wissen, dass eine vektorwertige Folge bzw. eine vektorwertige Funktion genau dann
gegen einen bestimmten Grenzwert konvergiert, wenn sie gegen diesen komponentenweise konvergiert.
118
Kapitel 6
Differentialrechnung
6.1
Differenzierbarkeit
Definition (differenzierbare Funktion, Ableitung). Sei (W, k · k) ein normierter Raum
über K, sei D ⊆ R eine nichtleere Menge und x0 ∈ D◦ ein innerer Punkt dieser Menge. Eine
Funktion f : D → W wird differenzierbar an der Stelle x0 genannt, wenn der Grenzwert
f (x0 + h) − f (x0 )
h→0
h
f 0 (x0 ) := lim
existiert. Der Grenzwert f 0 (x0 ) ∈ Rm wird dann die Ableitung von f an der Stelle x0
genannt. Die Funktion f wird differenzierbar genannt, wenn der Grenzwert f 0 (x0 ) an
jeder Stelle x0 ∈ D◦ existiert. Die Funktion f 0 : D◦ → W, x 7→ f 0 (x) wird dann die
Ableitung von f genannt.
Bei in der obigen Definition ist zu beachten, dass die Ableitung einer Funktion an einer
gegebenen Stelle und die Ableitung einer Funktion zwei unterschiedliche Klassen von Objekten bezeichnen. Der erstgenannte Begriff bezeichnet nämlich ein Element des Wertebereichs der Funktion, während der zweite Begriff eine Funktion bezeichnet. Die Bestimmung
der Ableitung f 0 einer Funktion f wird auch als Ableiten von f bezeichnet.
Ist D eine Teilmenge von R und f eine auf D definierte, differenzierbare Funktion, so
ist der Ableitung f 0 von f zunächst nur auf dem Inneren von D definiert. Unter gewissen
Voraussetzungen ist es jedoch möglich, den Definitionsbereich von f 0 auf ganz D zu erweitern. Dies ist beispielsweise dann der Fall, wenn die Funktion f auf einem abgeschlossenen
Intervall [a, b] definiert ist, und die einseitigen Grenzwerte
f 0 (a) := lim
f (a + h) − f (a)
h
f 0 (b) := lim
f (b + h) − f (b)
h
h→a+
und
h→b−
existieren.
Ableitungen von Funktionen, die von einer Teilmenge D der reellen Zahlen nach R
abbilden, sind aus dem Schulunterricht bereits gut bekannt. Ist f : D → R eine solche
Funktion, die an einer Stelle x0 ∈ D◦ differenzierbar ist, dann interpretiert man die Ableitung f 0 (x0 ) als Steigung des Graphen von f an der Stelle x0 . Man betrachte beispielsweise
eine affine Funktion g : R → R, welche durch
g(x) := mx + c
119
120
KAPITEL 6. DIFFERENTIALRECHNUNG
(a)
(b)
Abbildung 6.1: (a) Sekante an den Graph der Funktion f an den Stellen x0 und x0 +h.
(b) Tangente an den Graph von f an der Stelle x0 .
für alle x ∈ R gegeben ist. Hierbei sein m ∈ R und c ∈ R zwei fest gewählte, reelle Zahlen
sind. Der Graph von g ist bekanntlich eine Gerade mit der Steigung m. Die Ableitung
g 0 : R → R von g ist an jeder Stelle x0 ∈ R durch
g(x0 + h) − g(x0 )
m(x0 + h) + c − mx0 − c
mh
= lim
= lim
=m
h→0
h→0
h→0 h
h
h
g 0 (x0 ) = lim
gegeben. An jeder Stelle x0 ∈ R entspricht die Ableitung von g an der Stelle x0 also genau
der Steigung der Gerade. Allgemein kann man den so genannten Differenzenquotienten
f (x0 + h) − f (x0 )
h
einer Funktion f : D → R an der Stelle x0 ∈ D als die Steigung einer Sekante interpretieren, welche die Punkte des Funktionsgraphen an den Stellen x0 und x0 + h verbindet.
Wenn h gegen Null strebt, wird die Sekante einer Tangente immer ähnlicher, welche den
Funktionsgraphen an der Stelle x0 berührt. Die Steigung dieser Tangente ist genau durch
f 0 (x0 ) gegeben, und man definiert diese Steigung als Steigung des Funktionsgraphen an
der Stelle x0 . Man betrachte dazu auch Abbildung 6.1.
Nachfolgend geben wir einige Beispiele für differenzierbare Funktionen und deren Ableitungen an. Man beachte, dass der Ableitungsbegriff auch für vektorwertige Funktionen
definiert ist.
Beispiele.
(a) Für jede Zahl n ∈ N sei die Funktion pn : R → R durch pn (x) := xn für alle x ∈ R
definiert. Gemäß der verallgemeinerten binomischen Formel gilt dann
pn (x0 + h) − pn (x0 )
h→0
h
(x0 + h)n − xn0
= lim
h→0
h
!
n
1 X n n−k k
= lim
x
h − x0
h→0 h
k 0
k=0
!
1
n n−2 2
n−1
n
n−1
n
= lim
x0 + nx0 h +
x
h + · · · + nx0 h
+ h − x0
h→0 h
2 0
!
1
n
= lim
nxn−1
h+
xn−2 h2 + · · · + nx0 hn−1 + hn
0
h→0 h
2 0
p0n (x0 ) = lim
6.1. DIFFERENZIERBARKEIT
= lim
h→0
nxn−1
0
121
!
n n−2 1
n−2
n−1
+
x
h + · · · + nx0 h
+h
2 0
|
{z
}
| {z } | {z }
→0
→0
→0
= nxn−1
0
an jeder Stelle x0 ∈ R. Für jede Zahl n ∈ N ist die Funktion pn also differenzierbar.
Die Ableitung von pn ist durch p0n : R → R, x 7→ nxn−1 gegeben.
(b) Jede konstante Funktion f : R → Rm , wobei m ∈ N eine natürliche Zahl bezeichnet,
ist differenzierbar. Wie man leicht nachrechnet, ist die Ableitung f 0 : R → Rm
ebenfalls eine konstante Funktion, welche jede Stelle x ∈ R auf den Nullvektor 0 ∈
Rm abbildet.
(c) Wir betrachten die Funktion g : R → R2 , welche durch
t
g(t) := 2
t
für alle t ∈ R definiert ist. Mit dem Resultat von Beispiel (a) weist man leicht nach,
dass g differenziertbar ist, und dass die Ableitung g 0 : R → R2 durch
1
g 0 (t) :=
2t
für alle t ∈ R gegeben ist.
♦
Am Beispiel (c) wird deutlich, dass man die Ableitung einer vektorwertigen Funktion
berechnet, indem man diese komponentenweise ableitet.
Das nachfolgende Lemma ist grundlegend für das Verständnis von Ableitungen.
Lemma 6.1. Sei (W, k · k) ein normierter Raum über K, und sei D ⊆ R eine nichtleere
Menge. Eine Funktion f : D → W ist genau dann an einer Stelle x0 ∈ D◦ differenzierbar,
wenn es einen Vektor w0 ∈ W , eine positive Zahl r > 0 und eine Funktion ε : Br (0) → W
gibt, so dass Br (x0 ) ⊆ D, sowie
f (x0 + h) = f (x0 ) + w0 h + ε(h)h
für alle h ∈ Br (0) und
lim ε(h) = 0
h→0
gilt. Es ist dann w0 = f 0 (x0 ).
Ist f eine Funktion, die an einer Stelle x0 im Innern ihres Definitionsbereichs differenzierbar
ist, so kann die Funktion h 7→ f (x0 +h) gemäß Lemma 6.1 als Summe der affinen Funktion
h 7→ f (x0 ) + f 0 (x0 )h und der Funktion h 7→ hε(h) dargestellt werden. Die Funktion
h 7→ f (x0 ) + f 0 (x0 )h nennt man auch die Linearisierung von f in der Nähe von x0 . In der
Physik und den Ingenieurwissenschaften wird die Linearisierung einer Funktion f häufig
dazu verwendet, um das Änderungsverhalten von f nahe einer gegebenen Stelle x0 zu
untersuchen. Oft stellt der Funktionswert f (x0 ) dabei den Zustand eines Systems und
f (x0 + h) den Zustand nach einer Störung des Systems dar. Die Funktion h 7→ ε(h)h kann
bei einer Untersuchung des Änderungsverhaltens oft vernachlässigt werden, da sie sehr
schnell gegen Null konvergiert, wenn h gegen Null strebt.
Wir wiederholen nun einige bekannte Resultate über die Differenzierbarkeit von Funktionen. Zunächst geht es um den Zusammenhang zwischen der Stetigkeit und der Differenzierbarkeit einer Funktion.
122
KAPITEL 6. DIFFERENTIALRECHNUNG
(b)
(a)
(c)
Abbildung 6.2: (a) Graph der Signum–Funktion.
(b) Graph der Betragsfunktion. (c)
p
Graph der Funktion f : R → R, x 7→ sgn(x) |x|. Keine der drei Funktionen ist an der
Stelle x0 = 0 differenzierbar.
Lemma 6.2. Sei (W, k · k) ein normierter Raum über K, sei D ⊆ R eine nichtleere Menge,
und sei f : D → W eine Funktion, die an einer Stelle x0 ∈ D◦ differenzierbar ist. Dann ist
f an der Stelle x0 auch stetig.
Laut Lemma 6.2 impliziert die Differenzierbarkeit einer Funktion an einer bestimmten
Stelle ihres Definitionsbereichs auch die Stetigkeit der Funktion an dieser Stelle. Damit
liefert das Lemma ein notwendiges Kriterium für die Differenzierbarkeit: Eine Funktion
kann nur dann an einer gegebenen Stelle differenzierbar sein, wenn sie an dieser Stelle auch
stetig ist. Dass Lemma 6.2 kein hinreichendes Kriterium für die Differenzierbarkeit einer
Funktion liefert, wird anhand der nachfolgenden Beispiele deutlich.
Beispiele.
(a) Die Signum–Funktion sgn : R → R ist an jeder Stelle x0 ∈ R\{0} stetig und differenzierbar. An der Stelle x0 = 0 ist die Signum–Funktion jedoch nicht stetig, weshalb
sie an dieser Stelle auch nicht differenzierbar sein kann (siehe auch Abbildung 6.2
(a)).
(b) Die Betragsfunktion | · | : R → R ist an der Stelle x0 = 0 zwar stetig, aber nicht
differenzierbar. Es gilt nämlich
|0 + h| − |0|
|h|
−h
= lim
= lim
= −1,
h→0−
h→0− h
h→0− h
h
lim
sowie
|0 + h| − |0|
|h|
h
= lim
= lim
= 1.
h→0+
h→0+ h
h→0+ h
h
lim
Da sich der rechtsseitige und linksseitige Grenzwert unterscheiden, existiert der
Grenzwert, der die Ableitung an der Stelle x0 = 0 definiert, nicht (siehe auch Abbildung 6.2 (b)).
(c) Wir betrachten die Funktion f : R → R, welche durch f (x) := sgn(x)|x| für alle
x ∈ R definiert ist. Die Funktion f ist an der Stelle x0 = 0 offenbar stetig, da
p lim f (x) = lim sgn(x) |x| = 0 = f (0)
x→0
x→0
6.1. DIFFERENZIERBARKEIT
123
gilt. Sie ist an der Stelle x0 = 0 jedoch nicht differenzierbar. Es gilt nämlich
p
p
sgn(h) |h|
sgn(h) |h|
1
f (0 + h) − f (0)
= lim
= lim
= lim p
= ∞.
lim
h→0
h→0 sgn(h)|h|
h→0
h→0
h
h
|h|
Der Differenzenquotient divergiert also bestimmt gegen ∞, wenn h gegen 0 strebt.
Anschaulich gesprochen, wird der Graph der Funktion f an der Stelle x0 = 0 un”
endlich steil“ (siehe auch Abbildung 6.2 (c)).
♦
Als nächstes kommen wir zu den bekannten Rechenregeln für differenzierbare Funktionen,
welche in den nachfolgenden Sätzen zusammengefasst sind.
Satz 6.3. Seien (W, k · k) ein normierter Raum über K, und sei D ⊆ R eine nichtleere
Menge. Seien außerdem f : D → W , g : D → W und α : D → K Funktionen, die an einer
Stelle x0 ∈ D◦ differenzierbar sind. Dann gelten die folgenden Aussagen.
(1) Die Funktion f + g : D → W ist an der Stelle x0 differenzierbar, und es gilt
(f + g)0 (x0 ) = f 0 (x0 ) + g 0 (x0 ).
(2) Die Funktion αf : D → W ist an der Stelle x0 differenzierbar, und es gilt
(αf )0 (x0 ) = α0 (x0 )f (x0 ) + α(x0 )f 0 (x0 )
Ist (W, k · k) eine normierte Algebra über K, so gilt außerdem
(3) Die Funktion f g : D → W ist an der Stelle x0 differenzierbar, und es gilt
(f g)0 (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ).
Die Aussagen von Satz 6.3 sind auch als Summen- und Produktregeln der Differentialrechnung bekannt. Da für jede konstante Funktion α : D → K, x 7→ α0 stets α0 (x) = 0 für alle
x ∈ D gilt, folgt aus der Aussage (2) auch die Regel des konstanten Faktors. Diese besagt
folgendes: Ist f : D → W eine Funktion, welche an einer Stelle x0 ∈ D◦ differenzierbar
ist, und ist α0 ∈ K eine Konstante, dann ist die Funktion α0 f : D → W ebenfalls an der
Stelle x0 differenzierbar, und es gilt
(α0 f )0 (x0 ) = α0 f 0 (x0 ).
Den nachfolgenden Satz nennt man auch die Quotientenregel der Differentialrechnung.
Satz 6.4. Sei D ⊆ R eine nichtleere Menge, und seien f : D → K und g : D → K \ {0}
zwei Funktionen, welche an einer Stelle x0 ∈ D◦ differenzierbar sind. Dann ist die Funktion
f
:D→K
g
an der Stelle x0 ebenfalls differenzierbar, und es gilt
0
f
f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 )
(x0 ) =
2
g
g(x0 )
124
KAPITEL 6. DIFFERENTIALRECHNUNG
Die Liste der Rechenregeln für Ableitungen wird komplettiert durch die so genannte Kettenregel.
Satz 6.5. Sei (W, k · k) ein normierter Raum über K, und seien C ⊆ R und D ⊆ R zwei
nichtleere Mengen. Seien ferner f : D → W und g : C → D zwei Funktionen, so dass g an
einer Stelle x0 ∈ C ◦ differenzierbar ist, und so dass f an der Stelle g(x0 ) differenzierbar
ist. Dann ist die Funktion f ◦ g : C → W an der Stelle x0 ebenfalls differenzierbar, und es
gilt
(f ◦ g)0 (x0 ) = (f 0 ◦ g)(x0 )g 0 (x0 ).
Mit Hilfe der Sätze 6.3, 6.4 und 6.5 kann man die Ableitungen zahlreicher Funktionen
berechnen. Besonders wichtig ist dabei die Kettenregel, da sich viele Funktionen als Verkettung einfacherer Funktionen schreiben lassen, deren Ableitungen man kennt.
Beispiele.
(a) Wir betrachten die Funktion f : R → R, welche durch
f (x) := x6 (7 + x + x2 )4
für alle x ∈ R definiert ist. Als Verknüpfung differenzierbarer Funktionen ist f differenzierbar. Durch Anwendung der Summen-, Produkt- und Kettenregel (Satz 6.3
und Satz 6.5) ergibt sich für die Ableitung f : R → R die Zuordnungsvorschrift
f 0 (x) = 6x5 (7 + x + x2 )4 + 4x6 (7 + x + x2 )3 (1 + 2x)
für alle x ∈ R.
(b) Die Funktion g : R → R sei durch
g(x) :=
x + x3
1 + x2
für alle x ∈ R definiert. Als Verknüpfung differenzierbarer Funktionen ist g differenzierbar. Zur Bestimmung der Ableitung g 0 : R → R verwendet man die Quotientenregel (Satz 6.3 und Satz 6.4) und erhält
g 0 (x) =
(1 + x3 )(1 + x2 ) − 2x(x + x3 )
(1 + x2 )2
für alle x ∈ R.
♦
Wir kommen nun noch zu einem wichtigen Satz, der es uns erlaubt, Ableitungen von
solchen Funktionen zu bestimmen, die als Grenzfunktionen von Potenzreihen definiert
sind.
P
n
Satz 6.6. Sei ∞
n=0 an (x − x0 ) eine Potenzreihe auf R mit der Variable x, welche auf
einer offenen Kugel Br (x0 ) gegen eine Grenzfunktion f : Br (x0 ) konvergiert. Dann ist f
differenzierbar, und die Ableitung f 0 : Br (x0 ) → R ist durch
0
f (x) =
n
X
n=1
für alle x ∈ Br (x0 ) gegeben.
nan (x − x0 )n−1
6.1. DIFFERENZIERBARKEIT
125
Beispiele.
(a) Wir betrachten die Exponentialfunktion exp : R → R, x 7→ ex . Diese ist bekanntlich
die Grenzfunktion der Potenzreihe
∞
X
xn
n!
n=0
=1+x+
x2 x3
+
+ ··· ,
2!
3!
welche auf ganz R konvergiert. Gemäß Satz 6.6 gilt
exp0 (x) =
∞
∞
∞
X
X
xn−1 X xn−1
xn
=
=
= exp(x)
n
n!
(n − 1)!
n!
n=1
n=1
n=0
für alle x ∈ R. Die Ableitung der Exponentialfunktion ist also die Exponentialfunktion selbst.
(b) Mit Hilfe von Satz 6.6 kann man ebenfalls zeigen, dass sin0 = cos und cos0 = − sin
gilt.
Bekanntlich ist der natürliche Logarithmus ln : (0, ∞) → R die Umkehrfunktion der
Exponentialfunktion exp : R → R, d.h. es gilt x = exp(ln(x)) für alle x > 0. Diese
Identität kann bei der Bestimmung gewisser Ableitungen hilfreich sein.
Beispiele.
(a) Sei f : (0, ∞) → R die identische Funktion auf (0, ∞), welche gemäß f (x) = x für
alle x > 0 definiert ist. Die Ableitung f 0 : (0, ∞) → R dieser Funktion ist dann durch
f 0 (x) = 1 für alle x > 0 definiert. Nun stellt man fest, dass auch f (x) = exp(ln(x))
für alle x > 0 gilt. Nach der Kettenregel muss also 1 = f 0 (x) = ln0 (x) exp(ln(x)) =
ln0 (x)x für alle x > 0 gelten. Daraus folgt, dass ln0 (x) = 1/x für alle x > 0 gilt.
(b) Für jede Zahl α ∈ R sei die Funktion fα : (0, ∞) → R durch fα (x) = xα für alle
x > 0 definiert. Aufgrund der Identität x = exp(ln(x)) erhält man für die Funktion fα
die Darstellung fα (x) = exp(α ln(x)). Die Kettenregel liefert entsprechend fα0 (x) =
αx−1 exp(α ln(x)) = αx−1 xα = αxα−1 für alle x > 0.
(c) Für jede reelle Zahl α > 0 sei die Funktion gα : R → R durch gα (x) = αx für
alle x ∈ R definiert. Wegen α = exp(ln(α)) ist kann die Funktion gα auch durch
gα (x) = exp(x ln(α)) dargestellt werden. Mit der Kettenregel ergibt sich somit
g 0 (x) = ln(α) exp(x ln(α)) = ln(α)αx für alle x ∈ R.
Übungsaufgaben
1. Berechnen Sie die Ableitungen der folgenden Funktionen:
f1 : R → R, x 7→ 3x4 + 2x2 − 5x + 1,
f2 : (−∞, 0) → R, x 7→
√
1 − x,
f5 : (0, π) → R, x 7→ cot(x) =
cos(x)
,
sin(x)
f6 : R → R → R, x 7→ 4x ln(x2 + 1),
e3x
f3 : (0, ∞) → R, x 7→ √ ,
x
f7 : (0, ∞) → R, x 7→ xx ,
f4 : R → R, x 7→ sin(x) cos(2x),
f8 : R \ Z → R, x 7→ x − bxc.
126
KAPITEL 6. DIFFERENTIALRECHNUNG
2. Berechnen Sie die Ableitungen der vektorwertigen Funktionen f : (0, 2π) → R2 , g : [0, 1] →
R2 und h : R → R2 , welche durch
√
te2t
t cos(t)
4t
√
f (t) = √
, g(t) =
,
h(t)
=
1 − t2
1 + t2
t sin(t)
definiert sind.
3. Bestimmen Sie die Menge aller Stellen, an denen die folgenden Funktionen differenzierbar
sind:
(
sin(x)/x falls x 6= 0,
f1 : R → R, x 7→
1
falls x = 0,
(
(x − 1)2 falls x < 0,
f2 : R → R, x 7→
(x + 1)2 falls x ≥ 0,
(
√
sin( −x) falls x < 0,
f3 : R → R, x 7→
√
− sin( x) falls x ≥ 0,
(
(2x − 2)/(1 + x2 ) falls x < 1,
f4 : R → R, x 7→
ln(x)
falls x ≥ 1,
4. Weisen Sie mit Hilfe von Satz 6.6 die folgenden Identitäten nach: sin0 = cos, cos0 = − sin,
sinh = cosh und cosh0 = sinh.
5. Weisen Sie mit Hilfe von Satz 6.6 nach, dass ln(x) = 1/x für alle x ∈ (0, 2) gilt. Verwenden
Sie dazu die Potenzreihendarstellung des natürlichen Logarithmus zur Entwicklungsstelle 1
(siehe Beispiel (e) auf Seite 5).
6. Berechnen Sie die Ableitung der Funktion f : (0, 2) → R, welche durch
f (x) =
für alle x ∈ (0, 2) definiert ist.
∞
X
(−1)n
(x − 1)n
2−n
n
n=2
6.2. DER MITTELWERTSATZ
6.2
127
Der Mittelwertsatz
In diesem Abschnitt kommen wir zu einem wichtigen Satz, der für alle differenzierbaren
Funktionen gilt, die auf Teilmengen der reellen Zahlen definiert sind. Dieser Satz ist als
Mittelwertsatz der Differentialrechnung oder einfach als Mittelwertsatz bekannt. Zunächst
benötigen wir jedoch das folgende Lemma.
Lemma 6.7. Sei D ⊆ R ein nichtleere Menge, und sei f : D → R eine differenzierbare
Funktion, die an einer Stelle ξ ∈ D◦ ihr Minimum bzw. ihr Maximum annimmt. Dann gilt
f 0 (ξ) = 0.
Man beachte dass im Lemma 6.7 vorausgesetzt wird, dass ξ ein innerer Punkt der Definitionsmenge D von f ist. Wenn die Funktion f ihr Minimum bzw. ihr Maximum an einem
Randpunkt ξ von D annimmt, dann gilt f 0 (ξ) = 0 im Allgemeinen nicht. Die Funktion
f : [0, 1] → R, x 7→ x nimmt ihr Minimum beispielsweise an der Stelle x = 0 und ihr
Maximum an der Stelle x = 1 an. Es gilt jedoch f 0 (0) = f 0 (1) = 1.
Mit Lemma 6.7 und dem Satz von Minimum und Maximum (Satz 5.15) kann man den
folgenden Satz beweisen, der als Satz von Rolle bekannt ist.
Satz 6.8 (Satz von Rolle). Sei D ⊆ R eine nichtleere Menge, und sei f : D → R eine
differenzierbare Funktion. Seien ferner a, b ∈ R zwei reelle Zahlen, so dass a < b, [a, b] ⊆ D
und f (a) = f (b) gilt. Dann existiert eine Zahl ξ ∈ (a, b), so dass f 0 (ξ) = 0 gilt.
Die Aussage des Satzes von Rolle kann folgendermaßen formuliert werden: Jede differenzierbare Funktion, die auf einem abgeschlossenen Intervall definiert ist, und die an den Intervallgrenzen dieselben Funktionswerte aufweist, besitzt mindestens eine stationäre Stelle
im Innern des Intervalls. Ähnlich wie der Nullstellensatz von Bolzano (Satz 5.13) nur die
Existenz von mindestens einer Nullstelle sichert, sichert der Satz von Rolle lediglich die
Existenz von mindestens einer stationären Stelle. Darüber hinausgehende Informationen,
etwa zur genauen Anzahl stationärer Stellen oder zu deren Lage, liefert der Satz von Rolle
nicht. Dennoch ist er oft nützlich, weshalb er hier erwähnt wird. Außerdem folgt aus dem
Satz von Rolle der Mittelwertsatz der Differentialrechnung.
Satz 6.9 (Mittelwertsatz). Sei D ⊆ R eine nichtleere Menge, und sei f : D → R eine
differenzierbare Funktion. Seien ferner a, b ∈ R zwei reelle Zahlen, so dass a < b und
[a, b] ⊆ D gilt. Dann existiert eine Zahl ξ ∈ (a, b), so dass
f (b) − f (a)
= f 0 (ξ)
b−a
gilt.
Der Mittelwertsatz bedeutet anschaulich folgendes: Ist die reellwertige Funktion f auf
einem abgeschlossenen Intervall [a, b] definiert, dann existiert eine Stelle ξ ∈ (a, b) derart,
dass die Tangente an den Graphen von f an der Stelle ξ dieselbe Steigung besitzt wie die
Sekante an den Graphen von f an den Stellen a und b. Der Mittelwertsatz zählt neben
dem Zwischenwertsatz und dem Satz vom Minimum und Maximum zu den bekanntesten
und wichtigsten Sätzen der Analysis. Eine wichtige Folgerung aus dem Mittelwertsatz der
Differentialrechnung ist die so genannte Regel von de l’Hôpital (alternative Schreibweise:
Regel von de l’Hospital).
128
KAPITEL 6. DIFFERENTIALRECHNUNG
(b)
(a)
Abbildung 6.3: (a) Veranschaulichung des Satzes von Rolle: Die Funktion f besitzt im
Intervall (a, b) eine stationäre Stelle ξ. (b) Veranschaulichung des Mittelwertsatzes: Die
Tangente an den Graphen von f an der Stelle ξ besitzt dieselbe Steigung wie die Sekante
durch die Punkte (a, f (a)) und (b, f (b)).
Satz 6.10 (Regel von de l’Hôpital). Sei D ⊆ R eine nichtleere Menge, und sei x0 ∈ D
ein Punkt dieser Menge. Ferner seien f : D → R und g : D → R zwei Funktionen, für die
entweder
lim f (x) = lim g(x) = 0
x→x0
x→x0
oder
lim |f (x)| = lim |g(x)| = ∞
x→x0
gilt. Dann gilt
lim
x→x0
x→x0
f 0 (x)
f (x)
= lim 0
,
g(x) x→x0 g (x)
wenn der Grenzwert auf der rechten Seite existiert. Wenn die Funktion f 0 /g 0 für x → x0
bestimmt divergiert, dann divergiert auch die Funktion f /g. Dieser Satz gilt auch, wenn
man den Ausdruck x → x0 jeweils durch x → x0 +, x → x0 −, x → ∞ oder x → −∞
ersetzt.
Die Regel von de l’Hôpital kann verwendet werden, um gewisse Funktionsgrenzwerte zu
bestimmen. Man betrachte dazu die nachfolgenden Beispiele.
Beispiele.
(a) Bei der Bestimmung des Grenzwerts
ex − e
lim √
x→1
x−1
kann die Regel von de l’Hôpital angewendet werden, da sowohl der Zähler als auch
der Nenner des Bruchs gegen Null konvergiert, wenn x gegen 1 strebt. Man erhält
√
ex − e l’H
ex
lim √
= lim 1 −1/2 = lim 2 xex = 2e.
x→1
x→1 x
x→1
x−1
2
Mit l’H“ wird hierbei die Stelle angedeutet, an der die Regel von de l’Hôpital ver”
wendet wird.
(b) Auch der Grenzwert
lim x ln(x)
x→0+
6.2. DER MITTELWERTSATZ
129
kann mit der Regel von de l’Hôpital bestimmt werden. Es gilt nämlich
x ln(x) =
ln(x)
.
x−1
Der Zähler des Bruchs auf der rechten Seite divergiert bestimmt gegen −∞, während
der Nenner gegen ∞ bestimmt divergiert, wenn x von rechts gegen Null strebt. Man
erhält daher
ln(x) l’H
x−1
=
lim
= lim −x = 0
x→0+ x−1
x→0+ −x−2
x→0+
lim x ln(x) = lim
x→0+
als rechtsseitigen Grenzwert.
(c) Manchmal muss die Regel von de l’Hôpital mehrfach angewendet werden, um den
Grenzwert bestimmter Funktionen zu bestimmen. Man betrachte etwa den Grenzwert
sin(x2 ) − x2
lim
x→0
x3
Durch zweimaliges Anwenden der Regel von de l’Hôpital erhält man
2x cos(x2 ) − 2x
2 cos(x2 ) − 2
sin(x2 ) − x2 l’H
=
lim
=
lim
x→0
x→0
x→0
x3
3x2
3x
2
−4x sin(x )
l’H
= 0.
= lim
x→0
3
lim
Dasselbe Ergebnis erhält man, wenn man die Funktion x 7→ sin(x2 ) als Potenzreihe
darstellt.
♦
Die Regel von de l’Hôpital ist eine Rechenregel, mit der Funktionsgrenzwerte bestimmt
werden können. Sie darf keinesfalls mit der Quotientenregel der Differentialrechnung verwechselt werden. Außerdem muss man bei der Bestimmung von Funktionsgrenzwerten
immer genau nachprüfen, ob die Voraussetzungen für die Regel von de l’Hôpital erfüllt
sind. Oft wird dies nicht beachtet. Man betrachte dazu das nachfolgende Beispiel
Beispiel. Bei der Bestimmung des einseitigen Grenzwerts
ln(x)
x→0+ x
lim
kann die Regel von de l’Hôpital nicht angewendet werden. Der Zähler des Bruches konvergiert nämlich bestimmt gegen −∞, während der Nenner gegen Null konvergiert. Wendet
man die Regel von de l’Hôpital dennoch an, erhält man das falsche Ergebnis, dass die
Funktion gegen ∞ bestimmt divergiert. Tatsächlich divergiert die Funktion bestimmt gegen −∞. Dies erkennt man, wenn man den Ansatz x = 1/t mit t > 0 verwendet. Man
erhält dann nämlich
ln(x)
ln(1/t)
= lim
= lim −t ln(t) = −∞.
t→∞ 1/t
t→∞
x→0+ x
lim
Hierbei wurde verwendet, dass ln(1/t) = ln(1) − ln(t) = − ln(t) für alle t > 0 gilt.
♦
130
KAPITEL 6. DIFFERENTIALRECHNUNG
Übungsaufgaben
1. Zeigen Sie: Eine differenzierbare Funktion f : R → R, die n ∈ N verschiedene Nullstellen
besitzt, besitzt auch mindestens n − 1 verschiedene stationäre Stellen.
2. Berechnen Sie die folgenden Grenzwerte mit der Regel von de l’Hôpital:
√
2
ln(x)
x2 − ex−1
x−1
,
lim x ln(x) , lim x
lim
,
lim √
.
x→0+
x→1
x→1 x3 − 1
x→1+
e
−e
x−1
3. Zeigen Sie, dass
xα − 1
α
=
x→1 xβ − 1
β
lim
für alle α ∈ R und alle β ∈ R \ {0} gilt.
4. Zeigen Sie, dass die Funktion f : R → R, welche durch
(
x1/x falls x > 0,
f (x) :=
0
falls x ≤ 0
für alle x ∈ R definiert ist, an jeder Stelle ihres Definitionsbereichs stetig und differenzierbar
ist.
6.3. STETIGE DIFFERENZIERBARKEIT
6.3
131
Stetige Differenzierbarkeit
Im letzten Abschnitt wurde gezeigt, dass eine Funktion nur dann differenzierbar sein kann,
wenn sie auch stetig ist. Es stellt sich nun die Frage, ob die Ableitung einer differenzierbaren
Funktion selbst wieder eine stetige Funktion ist. Tatsächlich ist dies im Allgemeinen nicht
der Fall. Daher führt man die Eigenschaft der Stetigen Differenzierbarkeit ein.
Definition (stetig differenzierbare Funktion). Sei (W, k · k) ein normierter Raum,
und sei D ⊆ R ein nichtleere, offene Menge. Eine Funktion f : D → W heißt stetig
differenzierbar, wenn sie differenzierbar ist, und wenn ihre Ableitung f 0 : D → W stetig
ist.
Wie die nachfolgenden Beispiele zeigen, ist nicht jede differenzierbare Funktion auch stetig
differenzierbar.
Beispiele.
(a) Die Funktion f : R → R sei durch
(
−x2
f (x) :=
x3
falls x < 0,
falls x ≥ 0
für alle x ∈ R definiert. Man kann sehr leicht zeigen, dass die Funktion f differenzierbar ist. Die Ableitung f 0 : R → R ist durch
(
−2x falls x < 0,
f (x) :=
3x2 falls x ≥ 0
für alle x ∈ R gegeben. Wie man leicht nachweist, ist die Ableitung f 0 stetig. Die
Funktion f ist also stetig differenzierbar.
(b) Die Funktion g : R → R, welche durch
(
x2 cos(1/x) falls x 6= 0,
g(x) :=
0
falls x = 0
für alle x ∈ R definiert ist, ist differenzierbar. Ihre Ableitung g 0 : R → R ist durch
(
2x cos(1/x) + sin(1/x) falls x 6= 0,
g 0 (x) :=
0
falls x = 0
für alle x ∈ R definiert. Da der Grenzwert der Ableitung g 0 in x0 = 0 jedoch nicht
existiert, ist g 0 nicht stetig. Die Funktion g ist also differenzierbar, aber nicht stetig
differenzierbar.
♦
Im folgenden nehmen wir an, dass D eine offene Teilmenge von R ist, und dass (W, k · k)
ein normierter Raum ist. Wenn eine Funktion f : D → W stetig differenzierbar ist, und
wenn die Ableitung f 0 : D → W sogar differenzierbar ist, dann kann man bekanntlich die
so genannte zweite Ableitung f 00 : D → W von f bestimmen. An jeder Stelle x0 ∈ D ist
die zweite Ableitung durch
f 0 (x0 + h) − f 0 (x0 )
h→0
h
f 00 (x0 ) := lim
132
KAPITEL 6. DIFFERENTIALRECHNUNG
definiert. Für k ∈ N definiert man allgemein die k-te Ableitung f (k) : D → W einer
Funktion f : D → W durch
f (k−1) (x0 + h) − f (k−1) (x0 )
h→0
h
f (k) (x0 ) := lim
für alle x0 ∈ D, wobei man f (0) := f setzt. Man erhält die k-te Ableitung von f also, indem
man jeweils die (k − 1)-te Ableitung von f erneut ableitet. Dies setzt natürlich voraus,
dass die (k − 1)-te Ableitung eine differenzierbare Funktion ist. In diesem Fall nennt man
f eine k-mal differenzierbare Funktion.
Definition (k-mal differenzierbare Funktion). Sei (W, k · k) ein normierter Raum, sei
D ⊆ R ein nichtleere, offene Menge, und sei k ∈ N eine natürliche Zahl. Eine Funktion
f : D → W heißt k-mal differenzierbar, wenn die ersten k Ableitungen f 0 : D → W ,
f 00 : D → W , . . . , f (k) : D → W von f existieren.
Die k-te Ableitung f (k) einer k-mal differenzierbaren Funktion f kann stetig sein oder auch
nicht. Man kommt daher zu der folgenden Definition.
Definition (k-mal stetig differenzierbare Funktion). Sei (W, k · k) ein normierter
Raum, sei D ⊆ R ein nichtleere, offene Menge, und sei k ∈ N eine natürliche Zahl. Eine
Funktion f : D → W heißt k-mal stetig differenzierbar, wenn sie k-mal differenzierbar ist,
und wenn die k-te Ableitung von f stetig ist. Die Menge aller k-mal stetig differenzierbaren
Funktionen von D nach W wird üblicherweise mit C k (D, W ) bezeichnet. Falls W = R gilt,
bezeichnet man die Menge C k (D, W ) auch mit C k (D).
Gemäß der obigen Definition besteht für jede natürliche Zahl k ∈ N die Menge C k (D, W )
aus allen Funktionen von D nach W , die k-mal stetig differenzierbar sind. Es sollte noch
erwähnt werden, dass mit C 0 (D, W ) gelegentlich die Menge aller stetigen Funktionen von
D nach W bezeichnet wird. Man macht sich leicht klar, dass
C(D, W ) = C 0 (D, W ) ⊃ C 1 (D, W ) ⊃ C 2 (D, W ) ⊃ . . .
gilt. Mit wachsendem k gibt es also immer weniger Funktionen, die Elemente der Menge
C k (D, W ) sind. Sind f : D → W und g : D → W zwei Funktionen, für die eine natürliche
Zahl m ∈ N existiert, so dass f ∈ C k+m (D, W ) und g ∈ C k (D, W ) \ C k+m (D, W ) gilt, so
sagt man, dass f regulärer sei als g. Es stellt sich die Frage, ob es Funktionen gibt, die in
allen Mengen C 0 (D, W ), C 1 (D, W ), C 2 (D, W ), . . . . Solche Funktionen gibt es in der Tat,
und man nennt sie glatte Funktionen.
Definition (glatte Funktion). Sei (W, k · k) ein normierter Raum, und sei D ⊆ R ein
nichtleere, offene Menge. Eine Funktion f : D → W heißt glatt, wenn für jede natürliche
Zahl k die k-te Ableitungen f (k) : D → W von f existieren, und wenn f (k) stetig ist.
Die Menge aller glatten Funktionen von D nach W wird üblicherweise mit C ∞ (D, W )
bezeichnet. Falls W = R gilt, bezeichnet man die Menge C ∞ (D, W ) auch mit C ∞ (D).
Ist D eine nichtleere, offene Teilmenge der reellen Zahlen und (W, k · k) ein normierter
Raum, so ist die Menge aller glatten Funktionen von D nach W genau die Schnittmenge
aller Mengen C k (D, W ) mit k ∈ N, d.h. es gilt
∞
C (D, W ) =
∞
\
C k (D, W ).
k=1
Abschließend geben wir einige wichtige Beispiele für glatte Funktionen an.
6.3. STETIGE DIFFERENZIERBARKEIT
133
Beispiele.
(a) Jedes Polynom vom Grad n ∈ N ist stetig und differenzierbar. Die Ableitung eines
solchen Polynoms ist wieder ein Polynom vom Grad n − 1. Ferner ist die Ableitung
eines Polynoms vom Grad Null ist immer die Nullfunktion, welche ebenfalls stetig
und differenzierbar ist. Daher ist jedes Polynom eine glatte Funktion.
(b) Die Exponentialfunktion exp : R → R, x 7→ ex ist stetig und differenzierbar. Die
Ableitung der Exponentialfunktion ist die Exponentialfunktion selbst. Dementsprechend ist die Exponentialfunktion glatt.
(c) Die Funktionen Sinus und Cosinus sind glatt.
♦
Übungsaufgaben
1. Bestimmen Sie die ersten drei Ableitungen der folgenden Funktionen:
f1 : R → R, x 7→ x3 + 2x2 − 3x + 4,
2
f2 : R → R, x 7→ e−x ,
f3 : R → R, x 7→ sin(2πx),
f4 : R → R, x 7→ x ln(x2 + 1).
2. Für jede natürliche Zahl n ∈ N sei die Funktion pn : R → R durch pn (x) := xn für alle n ∈ N
definiert. Geben Sie allgemein die k-te Ableitung von pn für k ∈ {1, . . . , n} an. Wie lautet
jeweils die (n + 1)-te Ableitung von pn ?
3. Zeigen Sie, dass die Funktion f : R → R, definiert durch
(
x3 sin(1/x) falls x 6= 0,
f (x) :=
0
falls x = 0
für alle x ∈ R, stetig differenzierbar ist.
4. Zeigen Sie, dass die Funktion f : R → R, welche durch
(
x3 sin(1/x2 ) falls x 6= 0,
f (x) :=
0
falls x = 0
für alle x ∈ R, differenzierbar, aber nicht stetig differenzierbar ist.
5. Für jede natürliche Zahl n ∈ N, sei die Funktion fn : R → R durch
(
xn+1 falls x ≥ 0,
fn (x) :=
0
falls x < 0
für alle x ∈ R definiert. Zeigen Sie, dass f ∈ C n (R) \ C n+1 (R) für alle n ∈ N gilt.
134
6.4
KAPITEL 6. DIFFERENTIALRECHNUNG
Der Satz von Taylor
Funktionen von der Form f : D → R, wobei D eine nichtleere Teilmenge der reellen
Zahlen ist, dienen oft zur Modellierung von physikalischen oder wirtschaftswissenschaftlichen Zusammenhängen. Da solche Zusammenhänge sehr komplex sein können, ist auch die
Funktion f in der Regel nicht von einfacher Form, also insbesondere kein Polynom oder
keine einfache Exponentialfunktion. Man ist daher oft bestrebt, eine komplizierte Funktion, zumindest in der Nähe einer bestimmten Stelle ihres Definitionsbereichs, durch ein
Polynom anzunähern. Eine wichtige Rolle spielt dabei der so genannte Satz von Taylor,
um den es in diesem Abschnitt gehen soll. Zunächst machen wir die folgende Beobachtung.
P
n
Lemma 6.11. Sei ∞
n=0 an (x − x0 ) eine Potenzreihe auf R, die in einer offenen Kugel
Br (x0 ) gegen eine Grenzfunktion f : Br (x0 ) → R konvergiert. Dann gilt f ∈ C ∞ (Br (x0 )),
sowie
∞
X
f (n) (x0 )
f (x) =
(x − x0 )n
n!
n=0
für alle x ∈ Br (x0 ).
Gemäß
6.11 sind alle Ableitungen f 0 , f 00 , f 000 , . . . der Grenzfunktion f einer PotenzPLemma
∞
reihe n=0 an (x − x0 )n an der Entwicklungsstelle x0 durch die Koeffizienten a1 , a2 , a3 , . . .
der Potenzreihe bestimmt. Es gilt nämlich
an =
f (n) (x0 )
n!
für alle n ∈ N0 . Hierbei bezeichnet f (n) die n-te Ableitung von f . Wie üblich definiert man
f (0) := f . Es fällt auf, dass die Ausdrücke auf der rechten Seite des Gleichheitszeichens
nicht nur für solche Funktionen f gebildet werden können, die Grenzfunktionen einen
Potenzreihe sind. Tatsächlich können die Ausdrücke für alle glatten Funktionen f gebildet
werden. Fasst man diese Ausdrücke dann als Koeffizienten einer Potenzreihe auf, so gelangt
man zu den so genannten Taylor–Reihen.
Definition (Taylor–Reihe). Sei D ⊆ R eine nichtleere, offene Menge, sei x0 ∈ D ein
Punkt dieser Menge, und sei f ∈ C ∞ (D) eine glatte, reellwertige Funktion. Dann heißt
die Potenzreihe
∞
X
f (n) (x0 )
(x − x0 )n
n!
n=0
auf R mit der Variable x die Taylor–Reihe von f zur Entwicklungsstelle x0 .
Eine Potenzreihe ist bekanntlich zunächst nichts anderes als eine Folge von Polynomen,
den so genannten Partialpolynomen der Potenzreihe. Wir erinnernPuns, dass zu jeder Zahl
n
N ∈ N0 das N -te Partialpolynom fN : R → R einer Potenzreihe ∞
n=0 an (x − x0 ) auf R
durch fN (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · + aN (x − x0 )N für alle x ∈ R gegeben
ist. Die Partialpolynome einer Taylor–Reihe bezeichnet man als Taylor–Polynome. Solche
Taylor–Polynome können auch für nichtglatte Funktionen definiert werden.
6.4. DER SATZ VON TAYLOR
135
Definition (Taylor–Polynom). Sei D ⊆ R eine nichtleere Menge, sei x0 ∈ D◦ ein
innerer Punkt dieser Menge, sei N ∈ N0 eine natürliche Zahl, und sei f : D → R eine
N -mal differenzierbare Funktion. Dann heißt das Polynom TN,x0 : R → R, welches durch
TN,x0 (x) :=
N
X
f (n) (x0 )
n=0
n!
(x − x0 )n
= f (x0 ) + f 0 (x0 )(x − x0 ) +
f 00 (x0 )
f N (x0 )
(x − x0 )2 + · · · +
(x − x0 )N
2!
N!
für alle x ∈ R definiert ist, das N -te Taylor–Polynom von f zur Entwicklungsstelle x0 .
In den nachfolgenden Beispielen wird verdeutlicht, wie man Taylor–Polynome zu gegebenen Funktionen bestimmt.
Beispiele.
√
(a) Wir betrachten die Funktion f : (−1, ∞) → R, welche durch f (x) := 1 + x für alle
x ∈ (−1, 1) definiert ist. Es soll das dritte Taylor–Polynom T3,0 : R → R von f zur
Entwicklungsstelle x0 = 0 bestimmt werden. Für alle x ∈ R gilt
T3,0 (x) = f (0) + f 0 (0)x +
f 00 (0) 2 f 000 (0) 3
x +
x .
2
3!
Die ersten drei Ableitungen der Funktion f sind durch
1
,
f 0 (x) = √
2 x+1
1
f 00 (x) = − p
,
4 (x + 1)3
3
f 000 (x) = p
8 (x + 1)5
für alle x ∈ (−1, 1) gegeben. Es gilt also f (0) = 1, f 0 (0) = 1/2, f 00 (0) = −1/4, sowie
f 000 (0) = 3/8. Demzufolge erhält man
T3,0 (x) = 1 +
x x2 x3
−
+
2
8
16
für alle x ∈ R.
(b) Wir bestimmen das dritte Taylor–Polynom T3,1 : R → R des natürlichen Logarithmus ln : (0, ∞) → R zur Entwicklungsstelle x0 = 1. Dieses ist durch
T3,1 (x) = ln(1) + ln0 (1)(x − 1) +
ln00 (1)
ln000 (1)
(x − 1)2 +
(x − 1)3
2
3!
für alle x ∈ R gegeben. Offenbar gilt
ln0 (x) =
1
,
x
ln00 (x) = −
1
,
x2
ln000 (x) =
2
x3
für alle x ∈ (0, ∞), und so erhält man ln(1) = 0, ln0 (1) = 1, ln00 (1) = −1 und
ln000 (1) = 2. Das Taylor–Polynom besitzt also die Darstellung
T3,1 (x) = (x − 1) −
für alle x ∈ R.
(x − 1)2 (x − 1)3
+
2
3
136
KAPITEL 6. DIFFERENTIALRECHNUNG
(c) Zu jeder Zahl N ∈ N0 soll das jeweilige N -te Taylor–Polynom der Exponentialfunktion exp : R → R, x 7→ ex zur Entwicklungsstelle x0 = 0 bestimmt werden. Zunächst
erhält man, dass die N -te Ableitung der Exponentialfunktion wieder die Exponentialfunktion ist. Entsprechend gilt exp(n) (x0 ) = exp(0) = 1 für alle N ∈ N0 . Das N -te
Taylor–Polynom TN,0 : R → R ist also durch
TN,0 (x) = 1 + x +
x2
xN
+ ··· +
2!
N!
P
n
gegeben. Offenbar ist TN,0 das N -te Partialpolynom der Potenzreihe ∞
n=0 x /n!,
die ja bekanntlich auf ganz R punktweise gegen die Exponentialfunktion konvergiert.
Wegen Lemma 6.11 war dies auch zu erwarten.
♦
Im Beispiel (c) wurde deutlich, dass die Taylor–Polynome der Exponentialfunktion
zur
P∞ n
Entwicklungsstelle Null genau den Partialpolynomen der Potenzreihe
x
/n!
entn=0
sprechen. Demzufolge entspricht auch die Taylor–Reihe der Exponentialfunktion zur Entwicklungsstelle Null genau dieser Potenzreihe. Das Beispiel verdeutlicht ein allgemeines
Prinzip, das im nachfolgenden Lemma formuliert ist.
P
n
Lemma 6.12. Sei ∞
n=0 an (x − x0 ) eine Potenzreihe auf R, die in einer offenen Kugel
Br (x0 ) gegen eine Grenzfunktion f : Br (x0 ) → R konvergiert.
Dann ist die Taylor–Reihe
P
a
(x − x0 )n .
von f zur Entwicklungsstelle x0 genau die Potenzreihe ∞
n
n=0
Kennt man also die Potenzreihendarstellung einer Funktion f für eine bestimmte Entwicklungsstelle x0 , so kennt man laut Lemma 6.12 auch die Taylor–Reihe sowie sämtliche
Taylor–Polynome von f zur Entwicklungsstelle x0 .
Wir wissen nun, wie man Taylor–Polynome zu einer gegebenen Funktion f berechnet.
Ist f die Grenzfunktion einer Potenzreihe auf R mit der Entwicklungsstelle x0 , so sind die
Taylor–Polynome zur Entwicklungsstelle x0 genau die Partialpolynome der Potenzreihe.
Mit wachsendem N approximiert das N -te Taylor–Polynom die Funktion f also immer
besser. Es stellt sich nun die Frage, ob dies auch für die Taylor–Polynome von Funktionen gilt, die nicht als Grenzfunktionen von Potenzreihen dargestellt werden können. Eine
Aussage dazu liefert der wichtige Satz von Taylor.
Satz 6.13 (Taylor). Sei D ⊆ R eine nichtleere, offene Menge, sei x0 ∈ D ein Punkt dieser
Menge, und sei r > 0 eine reelle Zahl, so dass Br (x0 ) ⊆ D gilt. Sei außerdem N ∈ N0
eine natürliche Zahl und f ∈ C N +1 (D) eine (N + 1)-mal stetig differenzierbare Funktion.
Dann existiert für alle x ∈ Br (x0 ) eine Stelle ξ ∈ Br (x0 ), mit
(
(x0 , x) falls x > x0 ,
ξ∈
(x, x0 ) falls x < x0 ,
so dass
f (x) = TN,x0 (x) +
f (N +1) (ξ)
(x − x0 )N +1
(N + 1)!
gilt. Hierbei bezeichnet TN,x0 das N -te Taylor–Polynom von f zur Entwicklungsstelle x0 .
Die Bedeutung des Satzes von Taylor wird klar, wenn man sich vorstellt, dass man eine
gegebene Funktion f ∈ C N +1 (D), wobei D eine offene Teilmenge von R ist, nahe einer
Stelle x0 ∈ D durch das entsprechende Taylor–Polynom TN,x0 approximieren will. Die
6.4. DER SATZ VON TAYLOR
137
Abbildung 6.4: Graph der Funktion f : (−1, ∞) → R, x 7→
drei Taylor–Polynome T0,0 , T1,0 und T2,0 .
√
1 + x so wie der ersten
Frage ist dann nämlich, wie gut diese Approximation ist. Wertet man nämlich anstatt
der Funktion f das Taylor–Polynom TN,x0 an einer Stelle x aus, so erhält man einen
Funktionswert TN,x0 (x), der sich in der Regel von Funktionswert f (x) unterscheidet. Der
Approximationsfehler beträgt ist dabei durch |f (x) − TN,x0 (x)| gegeben. Der Satz von
Taylor ermöglicht nun eine Abschätzung dieses Fehlers nach oben. Es gilt nämlich
f (N +1) (ξ)
f (x) − TN,x (x) =
|x − x0 |N +1
0
(N + 1)!
für eine Stelle ξ die zwischen x und der Entwicklungsstelle x0 liegt. Anhand dieser Darstellung des Approximationsfehlers erkennt man, dass der Funktionswert f (x) durch den
Funktionswert TN,x0 (x) des Taylor–Polynoms umso besser approximiert wird, je größer N
ist, je kleiner |f (N +1) (ξ)| ist, und je näher x an der Entwicklungsstelle x0 liegt. Oftmals
kann der Ausdruck auf der rechten Seite des Gleichheitszeichens nach oben abgeschätzt
werden, wodurch man eine obere Schranke für den Approximationsfehler erhält. Man betrachte dazu die nachfolgenden Beispiele.
Beispiele.
(a) In den Ingenieurswissenschaften wird häufig die Näherungsformel
√
1+x≈1+
x
2
verwendet. Betrachtet man noch einmal das Beispiel (a) auf Seite 135, so erkennt
man,
dass hier offenbar die Funktion f : (−1, ∞) → R, definiert durch f (x) :=
√
1 + x für alle x > −1, durch das erste Taylor–Polynom T1,0 : R → R zur Entwicklungsstelle x0 = 0 approximiert wurde. Wie groß ist der maximale Approximationsfehler, wenn beispielsweise −0, 5 ≤ x ≤ 0, 5 gilt? Nach dem Satz von Taylor existiert
für jedes x ∈ (−1, 1) eine Stelle ξ ∈ R, die zwischen x und x0 liegt, so dass
2
00
f (x) − T1,0 (x) = |f (ξ)| |x|2 = p |x|
2!
8 (ξ + 1)3
gilt. Der Ausdruck auf der rechten Seite wird also für x = ξ = −0, 5 maximal. Daher
gilt
2
f (x) − T1,0 (x) ≤ p |−0, 5|
≈ 0, 0884
8 (−0, 5 + 1)3
für −0, 5 ≤ x ≤ 0, 5. Je nach Anwendung muss ein Ingenieur nun entscheiden, ob
ein maximaler Approximationsfehler von 0, 0884 akzeptabel ist oder nicht.
138
KAPITEL 6. DIFFERENTIALRECHNUNG
(b) Die Cosinusfunktion soll in der Nähe der Stelle x0 = 0 durch ihr zweites Taylor–
Polynom T2,0 : R → R approximiert werden, welches durch
T2,0 (x) = 1 −
x2
2
für alle x ∈ R gegeben ist. Aus welcher Menge kann dann x gewählt werden, so dass
der Approximationsfehler |cos(x) − T2,0 (x)| garantiert kleiner als eine vorgegebene
Fehlerschranke ε > 0 ist? Nach dem Satz von Taylor existiert für jedes x ∈ R eine
Zahl ξ zwischen 0 und x, so dass
000
cos(x) − T2,0 (x) = |cos (ξ)| |x|3 = |sin(ξ)| |x|3
3!
3!
gilt. Eine Abschätzung der rechten Seite nach oben erhält man, wenn man die Un3 /6.
gleichung |sin(ξ)| ≤ 1 verwendet. Es ergibt sich dann |cos(x) − T2,0 (x)| ≤ |x|√
Wenn der Approximationsfehler kleiner als ε bleiben soll, muss man also |x| ≤ 3 6ε
wählen.
Übungsaufgaben
1. Bestimmen Sie die jeweils das dritte Taylor–Polynom zur Entwicklungsstelle x0 = 0 der
folgenden Funktionen:
f1 : R → R, x 7→ 2x ,
f2 : (−1, 1) → R, x 7→ 1/(1 − x),
f3 : (−1, 1) → R, x 7→ 1/(1 − x)2 ,
f4 : R → R, x 7→ xex .
Bestimmen Sie außerdem das dritte Taylor–Polynom der Tangensfunktion zur Entwicklungsstelle x0 = 0.
2. Bestimmen Sie die ersten drei Taylor–Polynome zur Entwicklungsstelle x0 = 0 der Funktion
f : R → R, welche durch f (x) = 3x2 − x + 4 für alle x ∈ R gegeben ist. Was fällt Ihnen auf?
Wie lautet die Taylor–Reihe der Funktion f zur Entwicklungsstelle x0 = 0?
3. Geben Sie die sechs Taylor–Polynome der Sinusfunktion zur Entwicklungsstelle x0 = 0 an.
Wie lautet die Taylor–Reihe der Sinusfunktion zur Entwicklungsstelle x0 = 0?
4. Zeigen Sie mit Hilfe des Satzes von Taylor, dass
lim
h→0+
f (x − h) − 2f (x) + f (x + h)
= f 00 (x)
h2
für jede Funktion f ∈ C 3 (R) und jede Stelle x ∈ R gilt.
5. Zur Herleitung der Schwingungsgleichung für ein idealisiertes Pendel verwendet man die
Näherungsformel sin(x) ≈ x. Geben Sie eine obere Schranke für den Approximationsfehler
an, wenn −1 ≤ x ≤ 1 gilt? Wie groß darf |x| maximal werden, wenn der Approximationsfehler
garantiert durch 10−1 nach oben beschränkt sein soll?
6.5. PARTIELLE DIFFERENZIERBARKEIT
6.5
139
Partielle Differenzierbarkeit
Bisher haben wir Ableitung von Funktionen betrachtet, die auf Teilmengen von R definiert
waren. In diesem Abschnitt wenden wir uns Funktionen zu, die auf Teilmengen von Rn
mit n ∈ N definiert sind. Für solche Funktionen führen wir zunächst das Konzept der
partiellen Differenzierbarkeit ein.
Definition (partiell differenzierbare Funktion, partielle Ableitung). Seien n ∈ N
und k ∈ {1, 2, . . . , n} zwei natürliche Zahlen. Sei ferner D ⊆ Rn eine nichtleere Menge, sei
x(0) ∈ D◦ ein innerer Punkt dieser Menge, und sei (W, k · k) ein normierter Raum über K.
Eine Funktion f : D → W heißt nach der k-ten Koordinate partiell differenzierbar an der
Stelle x(0) , wenn der Grenzwert
f x(0) + he(k) − f x(0)
(0)
∂k f x
:= lim
h→0
h
existiert. Hierbei bezeichnet e(k) den k-ten Vektor der Standardbasis des Rn . Die Zahl
∂k f (x) heißt dann die partielle Ableitung von f nach der k-ten Koordinate an der Stelle
x(0) . Die Funktion f wird partiell differenzierbar an der Stelle x(0) genannt, wenn alle partiellen Ableitungen ∂1 f (x(0) ), ∂2 f (x(0) ), . . . , ∂n f (x(0) ) von f an der Stelle x(0) existieren.
Die Funktion wird schließlich partiell differenzierbar genannt, wenn alle partiellen Ableitungen von f an jeder Stelle x(0) ∈ D existieren. In diesem Fall definiert man für jede Zahl
k ∈ {1, 2, . . . , n} die Funktion ∂k f : D◦ → W, x 7→ ∂k f (x), welche die partielle Ableitung
von f nach der k-ten Koordinate genannt wird.
Wir wollen einige der soeben eingeführten Begriffe anhand eines einfachen Beispiels erläutern.
Beispiel. Die Funktion f : R2 → R sei durch f (x) = x21 + x1 x2 + 3x2 für alle Vektoren
x = (x1 , x2 )T ∈ R2 definiert. An der Stelle x(0) = (0, 0)T gilt dann
f x(0) + he(1) − f x(0)
f (0, 0)T + h(1, 0)T − f (0, 0)T
(0)
∂1 f (x ) = lim
= lim
h→0
h→0
h
h
T
T
2
f (h, 0) − f (0, 0)
h
= lim
= lim
= lim h
h→0
h→0 h
h→0
h
= 0.
Die Funktion f ist also an der Stelle x(0) = (0, 0)T nach der ersten Koordinate partiell
differenzierbar. Die partielle Ableitung von f nach der ersten Koordinate an der Stelle
x(0) = (0, 0)T ist Null. Es gilt außerdem
f x(0) + he(2) − f x(0)
f (0, h)T − f (0, 0)T
(0)
∂2 f (x ) = lim
= lim
h→0
h→0
h
h
= 3.
Also ist die Funktion f an der Stelle x(0) = (0, 0)T auch nach der zweiten Koordinate
partiell differenzierbar, und die partielle Ableitung nach der zweiten Koordinate an dieser
Stelle beträgt 3. Da die partiellen Ableitungen nach beiden Koordinaten existieren, ist f
an der Stelle x(0) = (0, 0)T partiell differenzierbar.
♦
140
KAPITEL 6. DIFFERENTIALRECHNUNG
Als nächstes wenden wir uns der Frage zu, wie man partielle Ableitungen einer Funktion
berechnen kann. Das folgende Lemma liefert dazu die Grundlage.
Lemma 6.14. Seien n ∈ N und k ∈ {1, 2, . . . , n} zwei natürliche Zahlen. Sei ferner
(0) (0)
(0) T
D ⊆ Rn eine nichtleere Menge, sei x(0) = x1 , x2 , . . . , xn
∈ D◦ ein innerer Punkt
dieser Menge, und sei (W, k · k) ein normierter Raum über K. Weiterhin sei r > 0 eine
(0)
(0)
positive Zahl derart, dass Br (x(0) ) ⊆ D gilt, und I := (xk − r, xk + r) ein offenes
Intervall. Sei außerdem f : D → W eine Funktion, welche an der Stelle x(0) nach der k-ten
Koordinate partiell differenzierbar ist, und sei g : I → W diejenige Funktion, welche durch
T (0)
(0)
(0)
g(z) := f x1 , . . . , xk−1 , z, xk−1 , . . . , x(0)
n
(0) für alle z ∈ I definiert ist. Dann gilt ∂k f x(0) = g 0 xk .
Man mache sich folgendes klar: Die Funktion g in Lemma 6.14 gibt die Abhängigkeit der
Funktion f bezüglich der k-ten Komponente der vektorwertigen Variable in der Nähe der
Stelle x(0) wieder. Die partielle Ableitung von f nach der k-ten Koordinate an der Stelle
x(0) ist dann genau durch die Ableitung von g an der entsprechenden Stelle gegeben. Das
Lemma 6.14 stellt also einen Zusammenhang zwischen den partiellen Ableitungen einer
Funktion mit vektorwertiger Variable und der gewöhnlichen Ableitung von Funktionen
mit reellwertiger Variable her.
Hinsichtlich der Berechnung von partiellen Ableitungen besagt das Lemma 6.14 folgendes: Ist eine Funktion f gegeben, welche von den Komponenten x1 , x2 , . . . , xn eines
Vektors x ∈ Rn abhängt, so berechnet man zu gegebenem k ∈ {1, 2, . . . , n} die partielle
Ableitung nach der k-Koordinate ∂k f , indem man die Funktion f nach xk ableitet. Man
betrachtet also lediglich die Komponente xk als Variable und alle übrigen Komponenten
x1 , . . . , xk−1 , xk+1 , . . . , xn als Konstanten. Bei der Bestimmung der partiellen Ableitung
∂k f spielen also nur solche Terme eine Rolle, die von der Vektorkomponente xk abhängen.
Dabei gelten wieder alle bekannten Ableitungsregeln.
Beispiele.
(a) Die Funktion f : R2 → R sei durch f (x) := 3 sin(x1 ) sin(x2 ) + x1 + 2x2 für alle
Vektoren x = (x1 , x2 )T ∈ R2 definiert. Die Funktion f ist partiell differenzierbar.
Ihre partiellen Ableitungen ∂1 f : R2 → R und ∂2 f : R2 → R sind durch
∂1 f (x) = 3 cos(x1 ) sin(x2 ) + 1,
∂2 f (x) = 3 sin(x1 ) cos(x2 ) + 2
für alle x = (x1 , x2 )T ∈ R2 gegeben. Man erhält die partielle Ableitung ∂1 f , indem
man f nach der Variable x1 ableitet. In gleicher Weise erhält man die partielle
Ableitung ∂2 f , indem man f nach der Variable x2 ableitet.
(b) Die Funktion g : R3 → R sei durch g(x) := x1 x2 + x2 x3 + x3 x1 für alle Vektoren
x = (x1 , x2 , x3 )T ∈ R3 definiert. Die partiellen Ableitungen von f sind dann durch
∂1 g(x) = x2 + x3 ,
∂2 g(x) = x1 + x3 ,
∂3 g(x) = x2 + x1
für alle x = (x1 , x2 , x3 )T ∈ R3 gegeben.
♦
6.5. PARTIELLE DIFFERENZIERBARKEIT
141
Der Begriff der partiellen Ableitung wird auch auf Funktionen übertragen, welche von
mehreren reellwertigen Variablen abhängen. Sind beispielsweise X ⊆ R und Y ⊆ R zwei
nichtleere Mengen, ist (W, k · k) ein normierter Raum über K, und ist f : X × Y → W
eine Funktion, deren Variablen mit x und y bezeichnet werden, so definiert man zu je zwei
vorgegebenen Punkten x0 ∈ X ◦ und y0 ∈ Y die so genannte partielle Ableitung von f nach
x an der Stelle x = x0 und y = y0 durch
∂f
f (x0 + h, y0 ) − f (x0 , y0 )
(x0 , y0 ) := lim
.
h→0
∂x
h
In gleicher Weise definiert man zu je zwei vorgegebenen Punkten x0 ∈ X und y0 ∈ Y ◦
man die so genannte partielle Ableitung von f nach y an der Stelle x = x0 und y = y0
durch
f (x0 , y0 + h) − f (x0 , y0 )
∂f
(x0 , y0 ) := lim
.
h→0
∂y
h
Man erkennt, dass die partielle Ableitung von f nach x an der Stelle x = x0 und y = y0
ähnlich definiert ist, wie die Ableitung einer Funktion, die nur von einer reellwertigen
Variable abhängt. Dasselbe gilt für die partielle Ableitung von f nach y an der Stelle
x = x0 und y = y0 . Wenn die partiellen Ableitungen von f nach x bzw. nach y an jeder
möglichen Stelle existieren, so definiert man die Funktionen
∂f
: X ◦ × Y → W, (x, y) 7→
∂x
∂f
: X × Y ◦ → W, (x, y) 7→
∂y
∂f
(x, y),
∂x
∂f
(x, y),
∂y
welche die partiellen Ableitungen von f nach x bzw. nach y genannt werden.
Partielle Ableitungen nach den Variablen einer Funktion tauchen oft in der Physik und
in den Ingenieurswissenschaften auf. Die Variablen einer Funktion stellen dabei häufig bestimmte physikalische Größen dar. Leitet man eine Funktion partiell nach einer bestimmten
Variable ab, so erhält Informationen über das Änderungsverhalten der Funktion bezüglich
der jeweiligen physikalischen Größe. Von besonderer Wichtigkeit ist oft die partielle Ableitung einer Funktion f nach einer Zeitvariable, welche oft mit t bezeichnet wird. Eine
solche partiellen Ableitungen nach der Zeit“ wird oft mit f˙ bezeichnet. Man betrachte
”
dazu die nachfolgenden Beispiele.
Beispiele.
(a) Die Funktion f : R × R × R → R sei durch f (x, y, z) := x2 y + sin(x + πz) für alle
x ∈ R, alle y ∈ R und alle z ∈ R definiert. Die partiellen Ableitungen ∂f /∂x, ∂f /∂y
und ∂f /∂z von f sind dann durch
∂f
(x, y, z) = 2xy + cos(x + πz),
∂x
∂f
(x, y, z) = x2 ,
∂y
∂f
(x, y, z) = π cos(x + πz)
∂z
für alle x ∈ R, alle y ∈ R und alle z ∈ R gegeben sind.
(b) Die kinetische Energie T eines Körpers mit der Masse m und der konstanten Geschwindigkeit v ist durch
1
T = mv 2
2
142
KAPITEL 6. DIFFERENTIALRECHNUNG
gegeben. Die kinetische Energie kann also als eine Funktion T : [0, ∞) × [0, ∞) → R
betrachtet werden, welche durch T (m, v) := mv 2 /2 für alle m ≥ 0 und alle v ≥ 0
definiert ist. Die Änderungsraten der kinetischen Energie bezüglich der Masse m bzw.
bezüglich der Geschwindigkeit v werden durch die partiellen Ableitungen von T nach
m bzw. nach v beschrieben. Die partiellen Ableitungen ∂T /∂m : [0, ∞) × [0, ∞) → R
und ∂T /∂v : [0, ∞) × [0, ∞) → R sind dabei durch ∂T /∂m (m, v) = v 2 /2 und
∂T /∂v (m, v) = mv für alle m ≥ 0 und alle v ≥ 0 gegeben. Oftmals werden lediglich
die Formeln
∂T
v2
= ,
∂m
2
∂T
= mv
∂v
für die Änderungsraten angegeben.
(c) Ein Körper, der sich während einer Zeitspanne t mit einer konstanten Geschwindigkeit v fortbewegt, legt die Strecke s = vt zurück. Die zeitliche Änderungsrate
der Strecke ist durch die partielle Ableitung ṡ = v, also durch die Geschwindigkeit
gegeben.
♦
Wie man leicht erkennt, sind die partiellen Ableitungen in den zuvor genannten Beispielen allesamt stetige Funktionen. Im Allgemeinen kann man jedoch nicht erwarten, die
eine partielle Ableitung einer Funktion stetig ist. Man führt daher, ähnlich wie bei den
gewöhnlichen Ableitungen, den Begriff der stetigen partiellen Differenzierbarkeit ein.
Definition (stetig partiell differenzierbare Funktion). Sei n ∈ N eine natürliche
Zahl, sei D ⊆ Rn eine nichtleere, offene Menge, sei x(0) ∈ D◦ ein Punkt dieser Menge, und
sei (W, k · k) ein normierter Raum über K. Eine Funktion f : D → W heißt stetig partiell
differenzierbar, wenn sie partiell differenzierbar ist, und wenn die partiellen Ableitungen
∂1 f, ∂2 f, . . . , ∂n f stetige Funktionen sind.
Ähnlich wie man höhere Ableitungen f 00 , f 000 , . . . einer Funktion f bilden kann, die auf
einer Teilmenge von R definiert ist, kann man unter gewissen Voraussetzungen auch partielle Ableitungen höherer Ordnung von Funktion bilden, die auf Teilmengen des Rn mit
n ∈ N definiert sind. Sei n ∈ N eine natürliche Zahl, (W, k · k) ein normierter Raum und
f : D → W eine partiell differenzierbare Funktion, wobei D eine nichtleere, offene Teilmenge des Rn ist. Dann nennt man ∂1 f, ∂2 f, . . . , ∂n f die partiellen Ableitungen der Ordnung 1
von f . Eine partielle Ableitung der Ordnung 2 von f erhält man, indem man eine partielle
Ableitung der Ordnung 1 erneut partiell ableitet. Die so entstehenden partiellen Ableitungen ∂1 ∂1 f, ∂2 ∂1 f, . . . , ∂n ∂1 f, ∂1 ∂2 f, ∂2 ∂2 f, . . . , ∂n ∂2 f, ∂1 ∂n f, ∂2 ∂n f, . . . , ∂n ∂n f sind an
jeder Stelle x(0) ∈ D durch
∂l f x(0) + he(k) − ∂l f x(0)
(0)
∂k ∂l f x
:= lim
,
h→0
h
also durch ∂k ∂l f x(0) := ∂k (∂l f ) x(0) für alle k, l ∈ {1, 2, . . . , n} definiert. Dies setzt natürlich voraus, dass die partielle Ableitung ∂l f an der Stelle x(0) nach der k-ten Koordinate
partiell differenzierbar ist.
Allgemein erhält man eine partielle Ableitung der Ordnung k einer Funktion f , indem
man eine partielle Ableitung der Ordnung k−1 von f erneut partiell ableitet. Hierbei ist k ∈
N eine natürliche Zahl mit n ≥ 2. Man überlegt sich leicht, dass es zu einer Funktion, die auf
einer Teilmenge des Rn definiert ist, maximal nk partielle Ableitungen der Ordnung k gibt.
Dies setzt jedoch voraus, dass alle Ableitungen der Ordnungen k −1 partiell differenzierbar
sind. Man spricht in diesem Fall von einer k-mal partiell differenzierbaren Funktion.
6.5. PARTIELLE DIFFERENZIERBARKEIT
143
Definition (k-mal partiell differenzierbare Funktion). Seien n ∈ N und k ∈ N zwei
natürliche Zahlen. Sei außerdem D ⊆ Rn eine nichtleere, offene Menge und (W, k · k) ein
normierter Raum. Eine Funktion f : D → W heißt k-mal partiell differenzierbar, wenn
alle partiellen Ableitungen der Ordnung k von f existieren.
Die partiellen Ableitungen der Ordnung k einer k-mal partiell differenzierbaren Funktion
f können stetig sein oder auch nicht. Falls alle partiellen Ableitungen stetige Funktionen
sind, so nennt man f eine k-mal stetig partiell differenzierbare Funktion.
Definition (k-mal stetig partiell differenzierbare Funktion). Seien n ∈ N und k ∈ N
zwei natürliche Zahlen. Sei außerdem D ⊆ Rn eine nichtleere, offene Menge und (W, k · k)
ein normierter Raum. Eine Funktion f : D → W heißt k-mal stetig partiell differenzierbar,
wenn sie k-mal partiell differenzierbar ist, und wenn alle partiellen Ableitungen der Ordnung k von f stetig sind. Die Menge alle k-mal stetig partiell differenzierbaren Funktionen
von D nach W wird mit C k (D, W ) bezeichnet. Falls W = R gilt, bezeichnet man die
Menge C k (D, W ) auch mit C k (D).
In den nachfolgenden Beispielen werden partielle Ableitungen höherer Ordnung von zwei
Funktionen bestimmt. Dabei werden die folgenden Konventionen verwendet: Um anzudeuten, dass eine Funktion p-mal nach der k-ten Koordinate partiell abgeleitet wurde,
verwendet man das Symbol ∂km . Es ist gilt also
∂km f := ∂k · · · ∂k f
| {z }
p-mal
für jede Funktion f . Die partielle Ableitung, die durch p-maliges partielles Ableiten einer
Funktion f nach einer Variable x entsteht, wird mit ∂ p f /∂xp bezeichnet, d.h.
∂pf
∂
∂
f
:=
···
p
∂x
|∂x {z ∂x}
p-mal
Ferner bezeichnet man die partielle Ableitung, welche durch q-maliges partielles Ableiten
einer Funktion f nach einer Variable y und anschließendes p-maliges partielles Ableiten
von f nach einer zweiten Variable x entsteht, mit ∂ p+q f /(∂xp ∂y q ), also
∂ p+q f
∂
∂ ∂
∂
:=
···
···
f.
∂xp ∂y q
∂x
∂x
∂y
∂y
| {z } | {z }
p-mal
q-mal
Man beachte, dass bei einer solchen Ableitung zuerst nach y und dann nach x partiell
abgeleitet wird.
Beispiele.
(a) Die Funktion f : R2 → R sei durch f (x) := x31 x2 − x1 x42 für alle x ∈ R2 definiert.
Die beiden partiellen Ableitungen der Ordnung 1 von f sind durch
∂1 f (x) = 3x21 x2 − x42 ,
∂2 f (x) = x31 − 4x1 x32
144
KAPITEL 6. DIFFERENTIALRECHNUNG
für alle x ∈ R2 gegeben. Die vier partiellen Ableitungen der Ordnung 2 von f sind
durch
∂12 f (x) = 6x1 x2 ,
∂2 ∂1 f (x) = 3x21 − 4x32 ,
∂1 ∂2 f (x) = 3x21 − 4x32
∂22 f (x) = −12x1 x22
für alle x ∈ R2 gegeben. Die acht partiellen Ableitungen der Ordnung 3 von f sind
schließlich durch
∂13 f (x) = 6x2 ,
∂12 ∂2 f (x) = 6x1 ,
∂2 ∂12 f (x) = 6x1 ,
∂2 ∂1 ∂2 f (x) = −12x22 ,
∂1 ∂2 ∂1 f (x) = 6x1 ,
∂1 ∂22 f (x) = −12x22 ,
∂22 ∂1 f (x) = −12x22 ,
∂23 f (x) = −24x1 x2
für alle x ∈ R2 gegeben. Da alle partiellen Ableitungen bis zur Ordnung 3 stetige
Funktionen sind, ist f mindestens dreimal stetig partiell differenzierbar.
(b) Es sei z : [0, 1] × [0, 2π) → R die Funktion, die durch z(r, ϕ) := sin(πr) cos(4ϕ) für
alle r ∈ [0, 1] und alle ϕ ∈ [0, 2π) definiert ist. Die beiden partiellen Ableitungen der
Ordnung 1 von z sind dann durch
∂z
(r, ϕ) = π cos(πr) cos(4ϕ),
∂r
∂z
(r, ϕ) = −4 sin(πr) sin(4ϕ)
∂ϕ
für alle r ∈ [0, 1] und alle ϕ ∈ [0, 2π) gegeben. Die partiellen Ableitungen der Ordnung 2 sind durch
∂2z
(r, ϕ) = −π 2 sin(πr) cos(4ϕ),
∂r2
∂2z
(r, ϕ) = −4π cos(πr) sin(4ϕ)
∂ϕ∂r
∂2z
(r, ϕ) = −4π cos(πr) sin(4ϕ),
∂r∂ϕ
∂2z
(r, ϕ) = −16 sin(πr) cos(4ϕ)
∂ϕ2
für alle für alle r ∈ [0, 1] und alle ϕ ∈ [0, 2π) gegeben. Da alle partiellen Ableitungen
bis zur Ordnung 2 stetige Funktionen sind, ist g mindestens zweimal stetig partiell
differenzierbar.
♦
In den zuvor genannten Beispielen fällt auf, dass einige partielle Ableitungen höherer
Ordnung identisch sind. So gilt in Beispiel (a) etwa ∂1 ∂2 f = ∂2 ∂1 f , wie auch ∂1 ∂22 f =
∂2 ∂1 ∂2 f = ∂22 ∂1 f und ∂2 ∂12 f = ∂1 ∂2 ∂1 f = ∂12 ∂2 f . Im Beispiel (b) erkennt man, dass
∂ 2 g/(∂r∂ϕ) = ∂ 2 g/(∂ϕ∂r) gilt. Dies ist kein Zufall. Vielmehr steckt dahinter ein allgemeines Prinzip, welches durch den Satz von Schwarz formuliert wird.
6.5. PARTIELLE DIFFERENZIERBARKEIT
145
Satz 6.15 (Schwarz). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere, offene
Menge, sei (W, k · k) ein normierter Raum, und sei f ∈ C 2 (D, W ) eine zweimal stetig
partiell differenzierbare Funktion. Dann gilt ∂k ∂l f = ∂l ∂k f für alle k, l ∈ {1, 2, . . . , n}.
Umgangssprachlich kann die Aussage des Satzes von Schwarz folgendermaßen wieder
gegeben werden: Ist eine Funktion zweimal stetig partiell differenzierbar, so spielt es
bei der Bestimmung einer Ableitung der Ordnung 2 keine Rolle, in welcher Reihenfolge
die partiellen Ableitungen nach den jeweiligen Koordinate gebildet werden. Man überlegt sich leicht, dass diese Aussage verallgemeinert werden kann. Für eine dreimal stetig partiell differenzierbare Funktion f , die auf einer Teilmenge des Rn definiert ist,
gilt also ∂k ∂l ∂m f = ∂k ∂m ∂l f = ∂m ∂l ∂k f = ∂l ∂k ∂m f = ∂l ∂m ∂k f = ∂m ∂k ∂l f für alle
k, l, m ∈ {1, 2, . . . , m}.
Mit dem Satz von Schwarz kann man sich beim Berechnen von partiellen Ableitungen
höherer Ordnung ein gewisses Maß an Arbeit ersparen. Hat man nämlich beispielsweise
von einer zweimal stetig partiell differenzierbaren Funktion f die partielle Ableitung ∂1 ∂2 f
berechnet, so muss man die partielle Ableitung ∂2 ∂1 f nicht gesondert berechnen. Nach
dem Satz von Schwarz gilt nämlich ∂1 ∂2 f = ∂2 ∂1 f . Wir wollen dies noch anhand eines
abschließenden Beispiels verdeutlichen.
Beispiel. Die Funktion f : R × R × R → R sei durch f (x, y, z) := xy 3 − y 2 z 4 + x2 z für
alle x ∈ R, alle y ∈ R und alle z ∈ R definiert. Diese Funktion ist beliebig oft stetig
partiell differenzierbar. Sie besitzt genau 9 (= 32 ) partielle Ableitungen der Ordnung 2.
Die partiellen Ableitungen nach nur einer Variable sind dabei durch
∂2f
(x, y, z) = 2z,
∂x2
∂2f
(x, y, z) = 6xy − 2z 4 ,
∂y 2
∂2f
(x, y, z) = −12y 2 z 2
∂z 2
für alle x ∈ R, alle y ∈ R und alle z ∈ R gegeben. Von den gemischten partiellen Ableitungen müssen nur genau drei explizit berechnet werden. Nach dem Satz von Schwarz gilt
nämlich
∂2f
(x, y, z) =
∂x∂y
∂2f
(x, y, z) =
∂x∂z
∂2f
(x, y, z) =
∂y∂z
∂2f
(x, y, z) = 3y 2 ,
∂y∂x
∂2f
(x, y, z) = 2x,
∂z∂x
∂2f
(x, y, z) = −8yz 3
∂z∂y
für alle x ∈ R, alle y ∈ R und alle z ∈ R
Übungsaufgaben
1. Berechnen Sie alle partiellen Ableitungen der Ordnung 1 der folgenden Funktionen:
f1 : R2 → R, x 7→ x31 x2 + ex1 −3x3 ,
q
f2 : R3 → R, x 7→ x41 + x43 + x1 x2 sin(2πx3 ),
♦
146
KAPITEL 6. DIFFERENTIALRECHNUNG
f3 : R × R → R, (x, y) 7→ ex−y + ln(1 + y 2 ),
f4 : R × R × R → R, (x, y, z) 7→ z/(1 + x2 + y 2 ).
2. Geben Sie alle partiellen Ableitungen der Ordnung 2 der folgenden Funktionen an:
f : R3 → R, x 7→ x41 x32 − 2x21 x2 + x1 x32 ,
g : R × [0, 2π) × [0, π) → R, (r, ϕ, θ) 7→ e−r sin(ϕ)(π 2 − θ2 ).
3. Für jede natürliche Zahl n ∈ N ist die Funktion fn : Rn \ {0} → R, welche durch fn (x) := |x|
für alle Vektoren x ∈ Rn definiert ist, partiell differenzierbar. Hierbei bezeichnet |x| die
euklidische Norm des Vektors x. Bestimmen Sie ∂k fn für alle k ∈ {1, 2, . . . , n}.
4. Für die Wirkleistung P , die Stromstärke I und den Widerstand R an einem elektrischen
Verbraucher gilt die Formel P = RI 2 . Bestimmen Sie für jede der drei Größen P , I und R
die Änderungsraten bezüglich der jeweiligen anderen Größen.
6.6. GRADIENT UND HESSE–MATRIX
6.6
147
Gradient und Hesse–Matrix
Definition (Gradient). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere
Menge, und sei x(0) ∈ D◦ ein innerer Punkt dieser Menge. Sei außerdem f : D →R eine
an der Stelle x(0) partiell differenzierbare Funktion. Dann heißt der Vektor ∇f x(0) ∈ Rn ,
welcher durch


∂1 f x(0)  ∂2 f x(0) 


∇f x(0) := 

..

. 
∂n f x(0)
definiert ist, der Gradient von f an der Stelle x(0) . Ist f partiell differenzierbar, so definiert man die Funktion ∇f : D◦ → Rn , x 7→ ∇f (x), welche der Gradient oder das
Gradientenfeld von f genannt wird.
Offenbar ist der Gradient einer Funktion f an einer Stelle x(0) derjenige Vektor, dessen
Komponenten genau den partiellen Ableitungen der Ordnung 1 von f an der Stelle x(0)
entsprechen. Das Gradientenfeld von f ist eine Vektorwertige Funktion. Das Symbol ∇
wird übrigens Nabla genannt.
Der Gradient wird auch für solche Funktionen definiert, die von mehreren reellwertigen
Variablen abhängen. Seien beispielsweise X ⊆ R, Y ⊆ R und Z ⊆ R drei nichtleere
Mengen, und sei f : X ×Y ×Z → R eine partiell differenzierbare Funktion, deren Variablen
mit x, y und z bezeichnet werden. Dann ist der Gradient ∇f : X ◦ × Y ◦ × Z ◦ → R3 durch


∂f
 ∂x (x, y, z)


 ∂f


∇f (x, y, z) := 
 ∂y (x, y, z)



 ∂f
(x, y, z)
∂z
◦
◦
◦
für alle x ∈ X , alle y ∈ Y und alle z ∈ Z definiert. In den nachfolgenden Beispielen
wird sowohl der Gradient einer Funktion mit einer vektorwertigen Variable als auch der
Gradient einer Funktion mit mehreren reellwertigen Variablen berechnet.
Beispiele.
(a) Die Funktion f : R3 → R sei durch f (x) := 3x1 x32 −x22 x43 +x31 x3 für alle Vektoren x =
(x1 , x2 )T ∈ R2 definiert. Die Funktion ist partiell differenzierbar, und ihr Gradient
ist durch


3x32 + 3x21 x3


∇f (x) = 9x1 x22 − 2x2 x43 
−4x22 x33 + x31
für alle x = (x1 , x2 )T ∈ R2 gegeben.
(b) Die Funktion g : R × R × R → R sei durch g(x, y, z) := cos(x)ey + z sin(x) für alle
x ∈ R, alle y ∈ R und alle z ∈ R definiert. Der Gradient von g ist dann durch


− sin(x)ey + z cos(x)


cos(x)ey
∇g(x, y, z) = 

sin(x)
für alle x ∈ R, alle y ∈ R und alle z ∈ R gegeben.
♦
148
KAPITEL 6. DIFFERENTIALRECHNUNG
Welche Informationen liefert das Gradientenfeld einer Funktion? Das folgende Lemma gibt
eine erste Antwort auf diese Frage.
Lemma 6.16. Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere, offene Menge,
und sei f ∈ C 1 (D) eine stetig partiell differenzierbare Funktion von D nach R. Dann
existiert zu jeder Stelle x(0) ∈ D eine positive Zahl r > 0 und eine Funktion ε : Br x(0) →
R, so dass Br x(0) ⊆ D, sowie
f x(0) + h = f x(0) ) + ∇f (x(0) ) · h + ε(h)|h|
für alle h ∈ Br (0) und
lim ε(h) = 0
h→0
gilt.
Man beachte, dass das h in Lemma 6.16 einen Vektor aus dem Rn bezeichnet. Entsprechend
bezeichnet ∇f (x(0) ) · h das euklidische Skalarprodukt von h mit dem Gradienten von f an
der Stelle x(0) , und |h| bezeichnet die euklidische Norm des Vektors h.
Das Lemma 6.16 macht eine Aussage darüber, wie eine stetig partiell differenzierbare
Funktion in der Nähe einer Stelle ihres Definitionsbereichs mit Hilfe des Gradientenfeldes
dargestellt werden. Das Lemma besitzt dabei
eine gewisse Ähnlichkeit zum Lemma 6.1.
(0)
Offenbar ist die Funktion h 7→ f x + h in der Nähe der Stelle h = 0 als Summe der
affinen Funktion h 7→ f x(0) ) + ∇f (x(0) ) · h und der Funktion h 7→ ε(h)|h| darstellbar. Das
Gradientenfeld ermöglicht also lokale Linearisierungen einer stetig partiell differenzierbaren Funktion.
Das Gradientenfeld spielt außerdem eine wichtige Rolle bei der Identifikation so genannter lokaler Extremalstellen einer reellwertigen Funktion. Eine lokale Extremalstelle
ist ein Stelle, an der eine Funktion ein lokales Extremum annimmt. Man unterscheidet
dabei die folgenden zwei Arten lokaler Extrema.
Definition (lokales Minimum). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere Menge, und sei f : D → R eine Funktion. Ein Punkt x(0) ∈ D◦ heißt eine lokale
Minimalstelle von f , wenn eine positive Zahl r > 0 existiert, so dass Br (x(0) ) ⊆ D und
f x(0) = min f (x)
x∈Br (x(0) )
gilt. Der Funktionswert f x(0) wird dann ein lokales Minimum von f genannt.
Definition (lokales Maximum). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine
nichtleere Menge, und sei f : D → R eine Funktion. Ein Punkt x(0) ∈ D◦ heißt eine lokale
Maximalstelle von f , wenn eine positive Zahl r > 0 existiert, so dass Br (x(0) ) ⊆ D und
f x(0) = max f (x)
x∈Br (x(0) )
gilt. Der Funktionswert f x(0) wird dann ein lokales Maximum von f genannt.
Für lokale Extremalstellen einer Funktion gilt der folgende, wichtige Satz.
Satz 6.17 (notwendiges Kriterium für lokale Extrema). Sei n ∈ N eine natürliche
Zahl, sei D ⊆ Rn eine nichtleere, offene Menge, und sei f ∈ C 1 (D) eine stetig partiell
differenzierbare Funktion von D nach R, die an einer Stelle x(0) ∈ D ein lokales Extremum
besitzt. Dann gilt ∇f x(0) ) = 0.
6.6. GRADIENT UND HESSE–MATRIX
149
Der Satz 6.17 ist offenbar die mehrdimensionale Version eines bekannten Resultats aus
dem Mathematikunterricht der Oberstufe: Eine reellwertige, differenzierbare Funktion f ,
die auf einer nichtleeren Teilmenge D der reellen Zahlen definiert ist, kann nur dann an
einer Stelle x0 ∈ D◦ ein lokales Extremum aufweisen, wenn f 0 (x0 ) = 0 gilt. Für reellwertige,
stetig partiell differenzierbare Funktionen, die auf nichtleeren Teilmengen des Rn definiert
sind, wird die Forderung f 0 (x0 ) = 0 durch ∇f (x(0) ) = 0 ersetzt. In diesem Zusammenhang
führt man auch den Begriff der stationären Stelle für Funktionen ein, die auf Teilmengen
des Rn definiert sind.
Definition (stationäre Stelle). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere, offene Menge, und sei und sei f ∈ C 1 (D) eine stetig partiell differenzierbare Funktion
von D nach R. Ein Punkt x(0) ∈ D wird eine stationäre Stelle von f genannt, wenn
∇f (x(0) ) = 0 gilt.
Wie kann man nun entscheiden, ob an einer stationären Stelle einer stetig partiell differenzierbaren Funktion ein lokales Extremum dieser Funktion vorliegt oder nicht? Im Falle
einer zweimal differenzierbaren Funktion f , die auf einer Teilmenge der reellen Zahlen definiert ist, kann man bekanntlich die zweite Ableitung f 00 verwenden. An einer Stelle x0 im
Innern des Definitionsbereichs von f liegt nämlich genau dann ein lokales Minimum vor,
wenn f 0 (x0 ) = 0 und f 00 (x0 ) > 0 gilt. Ein lokales Maximum liegt genau dann vor, wenn
f 0 (x0 ) = 0 und f 00 (x0 ) < 0 gilt. Für Funktionen, die auf Teilmengen des Rn definiert sind,
benötigt man ein Äquivalent zur zweiten Ableitung. Ein solches Äquivalent ist durch die
so genannte Hesse–Matrix gegeben.
Definition (Hesse–Matrix). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere
Menge, und sei x(0) ∈ D◦ ein innerer Punkt dieser Menge. Sei außerdem f : D → R
eine an der
x(0) zweimal partiell differenzierbare Funktion. Dann heißt die Matrix
Stelle
2
(0)
n×n
∇ f x
∈R
, welche durch

∂12 f x(0) ∂1 ∂2 f x(0) . . . ∂1 ∂n f x(0)  ∂2 ∂1 f x(0)
∂22 f x(0)
. . . ∂2 ∂n f x(0) 


2
∇ f (x) := 

..
..
..

.
.
. 
∂n ∂1 f x(0) ∂n ∂2 f x(0) . . . ∂n2 f x(0)

definiert ist, die Hesse–Matrix von f an der Stelle x(0) . Ist f zweimal partiell differenzierbar, so definiert man die Funktion ∇2 f : D◦ → Rn×n , x 7→ ∇2 f (x). Die Funktion ∇2 f
heißt die Hesse–Matrix von f .
Die Hesse-Matrix einer Funktion, die von mehreren reellwertigen Variablen abhängt, wird
folgendermaßen gebildet: Ist f beispielsweise eine zweimal partiell differenzierbare Funktion, die nach R abbildet, und die von drei Variablen x, y und z abhängt. Dann ist die
Hesse-Matrix von f durch
 2

∂ f
∂2f
∂2f
 ∂x2 (x, y, z) ∂x∂y (x, y, z) ∂x∂z (x, y, z)


 2

2f
2f
∂
f
∂
∂


∇2 f (x, y, z) := 

(x, y, z)
(x,
y,
z)
(x,
y,
z)
2
 ∂y∂x

∂y
∂y∂z
 2

2
2
 ∂ f

∂ f
∂ f
(x, y, z)
(x, y, z)
(x,
y,
z)
∂z∂x
∂z∂y
∂z 2
150
KAPITEL 6. DIFFERENTIALRECHNUNG
gegeben. Aus dem Satz von Schwarz (Satz 6.15) folgt, dass die Hesse–Matrix jeder zweimal
stetig partiell differenzierbaren Funktion symmetrisch ist. In den nachfolgenden Beispielen
sind die Hesse–Matrizen von zwei solcher Funktionen angegeben.
Beispiele.
(a) Die Funktion f : R3 → R sei durch f (x) := x31 x2 − x32 x3 + x33 x1 für alle Vektoren
x = (x1 , x2 , x3 )T ∈ R3 definiert. Offenbar ist f zweimal partiell differenzierbar. Die
Hesse–Matrix von f ist durch

3x21
6x1 x2

∇2 f (x) :=  3x21
3x23
−6x2 x3
−3x22
3x23


−3x22 
6x3 x1
für alle x = (x1 , x2 , x3 )T ∈ R3 gegeben.
(b) Die Funktion g : R × R → R sei durch g(x, y) := sin(πx) sin(2πy) für alle x ∈ R und
alle y ∈ R definiert. Die Hesse–Matrix von g ist durch
!
−π 2 sin(πx) sin(2πy) 2π 2 cos(πx) cos(2πy)
2
∇ g(x, y) :=
2π 2 cos(πx) cos(2πy) −4π 2 sin(πx) sin(2πy)
für alle x ∈ R und alle y ∈ R gegeben.
♦
Für das Gradientenfeld und die Hesse–Matrix einer zweimal stetig partiell differenzierbaren
Funktion gilt das folgende Lemma.
Lemma 6.18. Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere, offene Menge,
und sei f ∈ C 2 (D) eine zweimal stetig partiell differenzierbare Funktion von D nach
R. Dann existiert
zu jeder Stellex(0) ∈ D eine positive Zahl r > 0 und eine Funktion
ε : Br x(0) → R, so dass Br x(0) ⊆ D, sowie
f x(0) + h = f x(0) + ∇f x(0) · h + h · ∇2 f x(0) h + ε(h)|h|2
für alle h ∈ Br (0) und
lim ε(h) = 0
h→0
gilt.
Der nachfolgende Satz, welcher hinreichende Kriterien für die Existenz lokaler Extremalstellen einer zweimal stetig partiell differenzierbaren liefert, ist eine einfache Folgerung aus
Satz 6.17 und Lemma 6.18.
Satz 6.19 (hinreichende Kriterien für lokale Extrema). Sei n ∈ N eine natürliche
Zahl, sei D ⊆ Rn eine nichtleere, offene Menge, und sei x(0) ∈ D stationäre Stelle einer
zweimal stetig partiell differenzierbaren Funktion f ∈ C 2 (D). Dann gelten die folgenden
Aussagen:
(1) Die Funktion
f besitzt an der Stelle x(0) ein lokales Minimum, wenn die Hesse–Matrix
∇2 f x(0) positiv definit ist.
6.6. GRADIENT UND HESSE–MATRIX
151
(2) Die Funktion f besitzt an der Stelle x(0) ein lokales Maximum, wenn die Hesse–
Matrix ∇2 f x(0) negativ definit ist.
Die Sätze 6.17 und 6.19 dazu verwendet werden, lokale Extremalstellen einer Funktion zu
bestimmen. Man betrachte dazu die nachfolgenden Beispiele.
Beispiele.
(a) Sei f : R2 → R diejenige Funktion, die durch f (x) = −3x21 −2x1 x2 −x22 +2x1 +2x2 für
alle Vektoren x = (x1 , x2 )T ∈ R2 definiert ist. Besitzt diese Funktion lokale Extremalstellen? Zur Beantwortung dieser Frage bestimmt man zunächst den Gradienten
∇f : R2 → R2 und die Hesse–Matrix ∇2 f : R2 → R2×2 von f . Wie man leicht
nachrechnet, gilt
−6x1 − 2x2 + 2
−6 −2
∇f (x) =
,
∇2 f (x) =
−2x1 − 2x2 + 2
−2 −2
für alle x = (x1 , x2 )T ∈ R2 . Die Hesse–Matrix von f ist also eine konstante, matrixwertige Funktion. Als nächstes bestimmt man die stationären Stelle von f , d.h. man
sucht Vektoren x ∈ R2 , für die
∇f (x) = 0
gilt. Offenbar führt dies auf das lineare Gleichungssystem
−6x1 − 2x2 = −2,
−2x1 − 2x2 = −2.
Die eindeutige Lösung dieses Gleichungssystems lautet x1 = 0 und x2 = 1. Der
Punkt x(0) := (0, 1)T ist also die einzige stationäre Stelle von f . Gemaß Satz 6.17
kann nur an dieser Stelle ein lokales Extremum von f vorliegen. Da die Hesse–Matrix
∇2 f x(0) negativ definit ist, liegt gemäß Satz 6.19 an der Stelle x(0) ein lokales
Maximum von f vor.
(b) Die Funktion g : [0, 1] × [0, 1] → R, welche durch g(x, y) := sin(2πx) + 2y 2 − y für
alle x ∈ [0, 1] und alle y ∈ [0, 1] definiert ist, soll auf lokale Extremalstellen hin
untersucht werden. Der Gradient und die Hesse–Matrix von g sind durch
!
!
2π cos(2πx)
−4π 2 sin(2πx) 0
2
∇g(x, y) =
,
∇ g(x, y) =
4y − 1
0
4
für alle x ∈ [0, 1] und alle y ∈ [0, 1] gegeben. Zunächst sucht man nach stationären
Stellen, d.h. nach Stellen (x, y) ∈ [0, 1] × [0, 1] für die
∇g(x, y) = 0
gilt. Die erste Komponente des Gradienten ist offenbar genau dann Null, wenn x =
1/4 oder x = 3/4 gilt. Die zweite Komponente verschwindet genau dann, wenn
y = 1/4 gilt. Also sind (x, y) = (1/4, 1/4) und (x, y) = (3/4, 1/4) die einzigen
stationären Stellen von g. Nur an diesen Stellen kann ein lokales Extremum von g
vorliegen. Ob an einer stationären Stelle tatsächlich ein lokales Extremum vorliegt,
erkennt man an der Hesse–Matrix. An der Stelle (x, y) = (1/4, 1/4) ist diese durch
−4π 2 0
∇2 g(1/4, 1/4) =
0
4
152
KAPITEL 6. DIFFERENTIALRECHNUNG
1
1
0
−1
x2
−2
0
−3
−4
−5
1
1
0.5
0
0
−1
−1
−0.5
x2
(a)
−1
−1
x1
0
1
x1
(b)
Abbildung 6.5: (a) Graph der Funktion f : R2 → R, x 7→ 1−2x21 −3x22 . (b) Darstellung
des Gradientenfeldes ∇f .
gegeben. Die Hesse–Matrix ∇2 g(1/4, 1/4) ist weder positiv noch negativ definit. Ein
hinreichendes Kriterium für eine lokale Extremalstelle ist also nicht erfüllt. Tatsächlich besitzt die Funktion g an der Stelle (x, y) = (1/4, 1/4) kein lokales Extremum.
An (x, y) = (3/4, 1/4) der Stelle gilt hingegen
2 4π 0
2
.
∇ g(3/4, 1/4) =
0 4
Die Hesse–Matrix ∇2 g(3/4, 1/4) ist positiv definit. Damit liegt an der stationären
Stelle (x, y) = (3/4, 1/4) ein lokales Minimum von g vor.
♦
Zum Abschluss dieses Abschnitts geben wir noch eine recht anschauliche Charakterisierung
des Gradientenfeldes einer stetig partiell differenzierbaren Funktion an.
Satz 6.20. Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere, offene Menge, und
(0)
sei f ∈ C 1 (D) eine stetig partiell differenzierbare Funktion. Sei
weiterhin x ∈ D eine
(0)
nichtstationäre Stelle von f . Dann zeigt der Gradient ∇f x
in diejenige Richtung, in
(0)
die f am steilsten anwächst. Der negative Gradient −∇f x
zeigt in diejenige Richtung,
in die f am steilsten abfällt.
Die Tatsache, dass der negative Gradient einer Funktion immer in die Richtung des steilsten Abfalls einer Funktion zeigt, macht man sich unter anderem in bestimmten numerischen Verfahren zunutze, mit denen lokale Minima einer Funktion bestimmt werden.
Solche Verfahren werden ganz allgemein Gradientenverfahren genannt. Darüber hinaus
nutzt man die in Satz 6.20 formulierte Eigenschaft des Gradientenfelds für die Entwicklung zahlreicher physikalischer und ingenieurswissenschaftlicher Modelle.
Übungsaufgaben
1. Bestimmen Sie den Gradient und die Hesse–Matrix der folgenden Funktionen:
f1 : R3 → R, x 7→ x41 x2 + x21 x2 + x2 x23 ,
6.6. GRADIENT UND HESSE–MATRIX
153
f2 : R2 → R, x 7→ x1 x2 + 1,
f3 : R2 → R, x 7→ sin(x1 ) cos(2x2 ),
f4 : R3 → R, x 7→ exp(x21 + x22 − x23 ).
2. Für jede natürliche Zahl n ∈ N ist die Funktion fn : Rn \ {0} → R, welche durch fn (x) := |x|
für alle Vektoren x ∈ Rn definiert ist, partiell differenzierbar. Hierbei bezeichnet |x| die
euklidische Norm des Vektors x. Bestimmen Sie das Gradientenfeld von fn .
3. Bestimmen Sie alle stationären Stellen und alle Extremalstellen der folgenden Funktionen:
f1 : R2 → R, x 7→ (2x31 + 3x21 − 36x1 ) exp(−x22 ),
f2 : R2 → R, x 7→ (1 − x22 )/(1 + x21 ),
f3 : R2 → R, x 7→ x1 (1 − exp(1 − x22 )),
f4 : (0, π) × (0, π) → R, (x, y) 7→ sin(x) sin(y/2).
4. Sei n ∈ N eine natürliche Zahl, sei d ∈ Rn ein Vektor mit |d| = 1, und sei f : Rn → R eine
stetig partiell differenzierbare Funktion. Zeigen Sie, dass dann
f x(0) + td − f x(0)
= ∇f x(0) · d
lim
t→0
t
für alle x(0) ∈ Rn gilt. Verwenden Sie dazu das Lemma 6.16. Der Grenzwert auf der linken
Seite der Gleichung wird übrigens die Richtungsableitung von f an der Stelle x(0) in Richtung
d genannt.
154
6.7
KAPITEL 6. DIFFERENTIALRECHNUNG
Totale Differenzierbarkeit
Zum Abschluss dieses Kapitels führend wir noch kurz den Begriff der totalen Differenzierbarkeit ein. Totale Differenzierbarkeit ist eine Eigenschaft, die bestimmten Funktionen von
Rn nach Rm mit n ∈ N und m ∈ N zukommt. Falls n = 1 und m = 1 gilt, so entspricht die
totale Differenzierbarkeit genau der gewöhnlichen Differenzierbarkeit. In diesem Sinne ist
die totale Differenzierbarkeit der natürliche Differenzierbarkeitsbegriff für vektorwertige
Funktionen, die von einer vektorwertigen Variable abhängen.
Definition (total differenzierbare Funktion, totale Ableitung). Seien m ∈ N und
n ∈ N zwei natürliche Zahlen, sei D ⊆ Rn eine nichtleere Menge, und sei x(0) ∈ D◦ ein
innerer Punkt dieser Menge. Eine Funktion f : D → Rm wird total differenzierbar an der
Stelle x(0) genannt, wenn eine lineare Funktion ϕ : Rn → Rm existiert, so dass
f x(0) + h −f x(0) − ϕ(h)
lim
=0
h→0
|h|
gilt. Die lineare Funktion
ϕ wird dann die totale Ableitung von f an der Stelle x(0) genannt
(0)
und mit Df x
bezeichnet. Die Funktion f heißt total differenzierbar, wenn sie an jeder
◦
Stelle in D total differenzierbar ist. Die Funktion Df : D◦ → Lin(Rn , Rm ), x 7→ Df (x)
wird dann die totale Ableitung von f genannt. Hierbei bezeichnet Lin(Rn , Rm ) die Menge
aller linearen Abbildungen von Rn nach Rm .
Es muss betont werden, dass für jede Stelle x(0) im Innern des
Definitionsbereichs einer
total differenzierbaren Funktion f die totale Ableitung Df x(0) eine lineare Abbildung ist.
Das bedeutet, dass die totale Ableitung Df x(0) selber von einer vektorwertigen Variable
abhängig ist. Welche Rolle die totale Ableitung einer total differenzierbaren Funktion
spielt, wird anhand des nachfolgenden Lemmas deutlich.
Lemma 6.21. Seien n ∈ N und m ∈ N zwei natürliche Zahlen, und sei D ⊆ Rn eine
nichtleere Menge. Eine Funktion f : D → W ist genau dann an einer Stelle x(0) ∈ D◦ total
differenzierbar, wenn es eine lineare Abbildung ϕ : Rn → Rm , eine positive Zahl r > 0 und
eine Funktion ε : Br (0) → Rm gibt, so dass Br (x0 ) ⊆ D, sowie
f x(0) + h = f x(0) + ϕ(h) + ε(h)|h|
für alle h ∈ Br (0) und
lim ε(h) = 0
h→0
gilt. Es ist dann ϕ = Df x(0) .
Nach Lemma 6.21 kann man eine total differenzierbare Funktion f : D → Rm , die auf
einer Teilmenge D des Rn definiert ist, in der Nähe einer Stelle x(0) ∈ D◦ mit Hilfe der
totalen Ableitung linearisieren. Dies bedeutet, dass man die Funktion h 7→ f x(0) + h
in der Nähe von Null durch die affine Funktion h 7→ f x(0) + Df x(0) (h) approximiert.
Da die Funktion h 7→ ε(h)|h| sehr schnell gegen Null geht, wenn h gegen den Nullvektor
strebt, kann sie in der Regel vernachlässigt werden. Dasselbe Prinzip haben wir bereits bei
der Ableitung und dem Gradienten
einer Funktion
kennen gelernt (siehe Lemma 6.1 und
6.16). Die Funktion h 7→ f x(0) + Df x(0) (h) wird entsprechend die Linearisierung von
f an der Stelle x(0) genannt.
6.7. TOTALE DIFFERENZIERBARKEIT
155
Wie kann die totale Ableitung einer total differenzierbaren Funktion f : D → Rm
mit
n
(0)
◦
(0)
D ⊆ R bestimmt werden? Da für jede Stelle x ∈ D die totale Ableitung Df x
eine
lineare Abbildung von Rn nach Rm ist, muss es eine Matrix A ∈ Rm×n geben, so dass
Df x(0) (h) = Ah
für alle h ∈ Rn gilt. Wir werden sehen, dass diese Matrix A durch die so genannte Jacobi–
Matrix von f an der Stelle x(0) gegeben ist.
Definition (Jacobi–Matrix). Seien m ∈ N und n ∈ N zwei natürliche Zahlen, sei D ⊆
Rn eine nichtleere Menge, und sei x(0) ∈ D◦ ein innerer Punkt dieser Menge. Sei außerdem
f : D → Rm eine an der Stelle x(0) partiell differenzierbare Funktion mit den Komponenten
f1 : D → R, f2 : D → R, . . . , fm : D → R. Dann heißt die Matrix f 0 x(0) ∈ Rm×n ,
welche durch


∂1 f1 x(0) ∂2 f1 x(0) . . . ∂n f1 x(0)  ∂1 f2 x(0)
∂2 f2 x(0)
. . . ∂n f2 x(0) 


f 0 x(0) := 

..
..
..


.
.
.
(0)
(0)
(0)
∂1 fm x
∂2 fm x
. . . ∂n fm x
definiert ist, die Jacobi–Matrix von f an der Stelle x(0) . Ist f partiell differenzierbar, so
definiert man die Funktion f 0 : D◦ → Rm×n , x 7→ f 0 (x), welche die Jacobi–Matrix von f
genannt wird.
Man erkennt, dass in der jeweils j-ten Spalte der Jacobi–Matrix einer Funktion f die
partielle Ableitung nach der j-ten Koordinate von f steht. Natürlich definiert man die
Jacobi–Matrix auch für solche Funktionen, die von mehreren reellwertigen Variablen abhängen. Sind beispielsweise X ⊆ R, Y ⊆ R und Z ⊆ R drei nichtleere Mengen, und ist
f : X × Y × Z → Rm eine partiell differenzierbare, vektorwertige Funktion, die von drei
Variablen x, y und z abhängt, dann ist die Jacobi–Matrix f 0 : X ◦ × Y ◦ × Z ◦ → Rm von
f durch


∂f1
∂f1
∂f1
(x, y, z)
(x, y, z)
(x, y, z)
 ∂x

∂y
∂z


 ∂f2

∂f
∂f
2
2


(x,
y,
z)
(x,
y,
z)
(x,
y,
z)


∂x
∂y
∂z
0


f (x, y, z) = 

..
..
..


.
.
.




 ∂fm

∂fm
∂fm
(x, y, z)
(x, y, z)
(x, y, z)
∂x
∂y
∂z
◦
◦
◦
für alle x ∈ X , y ∈ Y und z ∈ Z gegeben. Nachfolgend sind einige Beispiele für
Jacobi–Matrizen angegeben.
Beispiele.
(a) Die Funktion f : R3 → R2 sei durch
x21 + x22 − x3
x1 − 4x2 + x23
f (x) :=
für alle x = (x1 , x2 , x3 )T ∈ R3 gegeben. Die Jacobi–Matrix f 0 : R3 → R2×3 von f ist
dann durch
2x1 2x2 −1
f 0 (x) =
1
−4 2x3
für alle x = (x1 , x2 , x3 )T ∈ R3 gegeben.
156
KAPITEL 6. DIFFERENTIALRECHNUNG
(b) Die Funktion g : [0, ∞) × [0, 2π) → R2 sei durch
r cos(ϕ)
g(r, ϕ) :=
r sin(ϕ)
für alle r ∈ [0, ∞) und alle ϕ ∈ [0, 2π) definiert. Als Jacobi–Matrix erhält man die
matrixwertige Funktion g 0 : [0, ∞) × [0, 2π) → R2×2 , welche gemäß
cos(ϕ) −r sin(ϕ)
0
g (r, ϕ) =
sin(ϕ)
r cos(ϕ)
für alle r ∈ [0, ∞) und alle ϕ ∈ [0, 2π) definiert ist.
(c) Das Funktional ϕ : R2 → R sei durch ϕ(x) := x41 + x42 für alle x = (x1 , x2 )T ∈ R2
definiert. Die zugehörige Jacobi–Matrix ϕ0 : R2 → R1×2 ist dann an jeder Stelle
x = (x1 , x2 )T ∈ R2 eine einzeilige Matrix, welche durch
ϕ0 (x) = 4x31 4x32
gegeben ist.
♦
Für die Jacobi–Matrix gilt nun der folgende, wichtige Satz.
Satz 6.22. Seien m ∈ N und n ∈ N zwei natürliche Zahlen, sei D ⊆ Rn eine nichtleere
Menge, und sei x(0) ∈ D◦ ein innerer Punkt dieser Menge. Sei außerdem f : D → Rm eine
Funktion, welche an der Stelle x(0) total differenzierbar ist. Dann ist f an der Stelle x(0)
auch partiell differenzierbar und stetig, und es gilt
Df x(0) (h) = f 0 x(0) h
für alle h ∈ Rn . Hierbei bezeichnet f 0 x(0) die Jacobi–Matrix von f an der Stelle x(0) .
Laut 6.22 impliziert die totale Differenzierbarkeit die partielle Differenzierbarkeit einer
Funktion, die von einer vektorwertigen Variable abhängt. Man kann darüber hinaus zeigen,
dass es Funktionen gibt, die an einer Stelle im Innern ihres Definitionsbereichs zwar partiell
differenzierbar, nicht aber total differenzierbar sind. Also ist totale Differenzierbarkeit eine
stärkere Eigenschaft als partielle Differenzierbarkeit. Schließlich gilt noch der folgende Satz.
Satz 6.23. Seien m ∈ N und n ∈ N zwei natürliche Zahlen, sei D ⊆ Rn eine nichtleere,
offene Menge, und sei f ∈ C 1 (D, Rm ) eine stetig partiell differenzierbare Funktion von D
nach Rm . Dann ist f total differenzierbar.
Die Aussage von Satz 6.23 hat eine praktische Konsequenz. Angenommen, man berechnet
die Jacobi–Matrix f 0 einer Funktion f und stellt fest, dass jede Komponente von f 0 eine
stetige Funktion ist. Dann ist f stetig partiell differenzierbar nach Satz 6.23 somit auch
total differenzierbar. In einem solchen Fall erkennt man also die totale Differenzierbarkeit
einer Funktion anhand ihrer Jacobi–Matrix.
Beispiel. Die Funktion f : R2 → R2 sei durch
f (x) :=
x21 − x1 x2 + x22
x31 x2 − x1 x32
!
6.7. TOTALE DIFFERENZIERBARKEIT
157
für alle x = (x1 , x2 )T ∈ R2 definiert. Die Jacobi–Matrix von f ist dann durch
!
2x
−
x
−x
+
2x
1
2
1
2
f 0 (x) :=
3x21 x2 − x32 x31 − 3x1 x22
für alle x = (x1 , x2 )T ∈ R2 gegeben. Offenbar sind alle Komponenten der Jacobi–Matrix
stetige Funktionen. Nach Satz 6.23 ist f also total differenzierbar, und nach Satz 6.22 ist
die Ableitung Df : R2 → Lin(R2 , R2 ) durch
!
!
2x1 − x2
−x1 + 2x2
h1
Df (x)(h) =
3x21 x2 − x32 x31 − 3x1 x22
h2
für alle x = (x1 , x2 )T ∈ R2 und alle h = (h1 , h2 )T ∈ R2 gegeben.
Übungsaufgaben
1. Bestimmen Sie die Jacobi–Matrix und die totale Ableitung der folgenden Funktionen:
!
−4x21 + 5x32 − x3
3
2
f : R → R , x 7→
,
2x1 + 3x22 − 3x53
!
sin(x1 )x2 + x1 cos(x2 )
2
2
g : R → R , x 7→
,
exp(−x1 + x2 )


x21 + x22

p
u : R2 → R3 , x 7→  1 + x21 − x2  ,
x1 x2

2x1 x2 + x23 − 1



v : R3 → R3 , x 7→ 3x1 − 4x2 + 5x3 
x1 x2 x3 − 1
2. Sei n ∈ N eine natürliche Zahl, und sei f : Rn → R eine partiell differenzierbare Funktion.
Zeigen Sie, dass dann
T
∇f x(0) = f 0 x(0)
für alle x(0) ∈ Rn gilt, wobei f 0 x(0) die Jacobi–Matrix von f an der Stelle x(0) bezeichnet.
3. Sei n ∈ N eine natürliche Zahl, und sei f : Rn → R eine stetig partiell
differenzierbare
Funktion. Zeigen Sie, dass f total differenzierbar ist, und dass Df x(0) (h) = ∇f x(0) · h
für alle x(0) ∈ Rn und alle h ∈ Rn gilt. Verwenden Sie dazu die Definition der totalen
Differenzierbarkeit sowie Lemma 6.16.
4. Sei f : R → R eine differenzierbare Funktion. Zeigen Sie, dass f total differenzierbar ist, und
dass Df (x0 )(h) = f 0 (x0 )h für alle x0 ∈ R und alle h ∈ Rn gilt, wobei f 0 (x0 ) die gewöhnliche
Ableitung von f an der Stelle x0 bezeichnet. Verwenden Sie dazu die Definition der totalen
Differenzierbarkeit sowie Lemma 6.1.
5. Sei n ∈ N eine natürliche Zahl, und sei f : Rn → R diejenige Funktion, die durch f (x) := |x|2
ist, wobei |x| die euklidische Norm von x bezeichnet. Zeigen Sie,
für alle x ∈ Rn gegeben
dass dann Df x(0) (h) := 2x(0) · h für alle x(0) ∈ Rn und alle h ∈ Rn gilt. Verwenden Sie
dazu die Definition der totalen Differenzierbarkeit, sowie die Identität |x|2 = x · x, welche
bekanntlich für alle x ∈ Rn gilt.
Lernzielkontrolle
Nach dem Durcharbeiten dieses Kapitels sollten Sie ...
... wissen, was eine differenzierbare Funktion ist.
... wissen, wie die Ableitung einer Funktion an einer Stelle im Innern ihres Definitionsbereichs definiert ist.
... sämtliche Ableitungsregeln (Summenregel, Produktregel, Regel des konstanten Faktors, Quotientenregel, Kettenregel) beherrschen.
... die Ableitung einer Potenzreihe bestimmen können.
... wissen, dass jede Funktion, die an einer Stelle ihres Definitionsbereichs differenzierbar
ist, an dieser Stelle auch stetig ist.
... den Satz von Rolle und den Mittelwertsatz der Differentialrechnung kennen.
... Funktionsgrenzwerte mit Hilfe der Regel von de l’Hôpital berechnen können.
... wissen, was eine k-mal differenzierbare Funktion, und was eine k-mal stetig differenzierbare Funktion ist.
... zu einer gegebenen Zahl N ∈ N und einer gegebenen Stelle x0 das N -te Taylor–
Polynom zur Entwicklungsstelle x0 einer N -mal differenzierbaren Funktion bestimmen können.
... den Satz von Taylor kennen.
... wissen, was eine partiell differenzierbare Funktion ist.
... partielle Ableitungen einer Funktion berechnen können.
... wissen, was eine k-mal partiell differenzierbare Funktion, und was eine k-mal stetig
partiell differenzierbare Funktion ist.
... den Satz von Schwarz kennen.
... den Gradienten einer partiell differenzierbaren Funktion bestimmen können.
... die Hesse–Matrix einer zweimal partiell differenzierbaren Funktion bestimmen können.
... wissen, dass jede lokale Extremalstelle einer reellwertigen Funktion eine stationäre
Stelle der Funktion ist.
... lokale Extremalstellen einer reellwertigen Funktion bestimmen können, die entweder von einer vektorwertigen Variable oder von mehreren reellwertigen Variablen
abhängt.
... wissen, was eine total differenzierbare Funktion ist.
... wissen, dass jede Funktion, die an einer Stelle ihres Definitionsbereichs total differenzierbar ist, an dieser Stelle auch partiell differenzierbar und stetig ist.
... wissen, dass jede stetig partiell differenzierbare Funktion auch total differenzierbar
ist.
... die Jacobi–Matrix einer partiell differenzierbaren Funktion bestimmen können.
158
Kapitel 7
Integralrechnung
7.1
Das Lebesgue–Maß
In diesem wie auch im nächsten Abschnitt soll geklärt werden, was man unter dem Integral
Z
f (x) dx
Ω
einer reellwertigen Funktion f : D → R über einer Menge Ω ⊆ D versteht, wobei D eine
Teilmenge des Vektorraums Rn ist.
Falls n = 1 gilt, und Ω ein nichtleeres Intervall [a, b] mit Intervallgrenzen a ∈ R und
b ∈ R ist, bezeichnet man das Integral von f über Ω üblicherweise mit
Z b
f (x) dx.
a
Wenn die Funktion f stetig ist und darüber hinaus nur nichtnegative Funktionswerte
besitzt, interpretiert man das Integral als den Flächeninhalt der Fläche, die vom Graph
von f , der Abszisse (also der x-Achse) und den beiden senkrechten Graden x = a und x = b
eingeschlossen wird. Eine analoge Interpretation des Integrals wird auch für den Fall, dass
n > 1 gilt, angestrebt: Das Integral soll den Inhalt derjenigen Menge widerspiegeln, die
von dem Graph von f , der Menge Ω × {0} und der Menge ∂Ω × R begrenzt wird. Daher
macht es Sinn, zunächst einmal zu klären, was man unter dem Inhalt bzw. dem Volumen
einer Menge verstehen soll.
Es ist tatsächlich nicht leicht, einen sinnvollen Inhalts- oder Volumenbegriff für Teilmengen des Rn zu definieren. Von einem sinnvollen Volumenbegriff würde man beispielsweise erwarten, dass sich das Volumen einer Menge nicht ändert, wenn man die Menge
verschiebt. Auch sollte die Summe der Volumina zweier disjunkter Mengen genau gleich
dem Volumen der Vereinigung beider Mengen sein. Weiterhin sollte das Volumen einer
Menge stets größer oder gleich dem Volumen jeder Teilmenge sein.
In der Mathematik wird der Inhalt oder das Volumen einer Menge ganz allgemein als
das Maß der Menge bezeichnet. Es hat sich gezeigt, dass es ganz unterschiedliche Möglichkeiten gibt, ein solches Maß zu definieren. Die heutzutage gebräuchlichste Definition des
Maßbegriffs geht auf den französischen Mathematiker Henri Léon Lebesgue (1875–1941)
zurück. In diesem Abschnitt soll dieses so genannte Lebesgue–Maß (gesprochen: Lebäk–
”
Maß“) eingeführt werden. Es wird sich zeigen, dass man nur bestimmten Teilmengen des
Rn in sinnvoller Weise ein Lebesgue–Maß zuordnen kann. Diese Mengen werden dann
Lebesgue–messbar genannt. Das Mengensystem aller Lebesgue–messbaren Teilmengen der
Rn spielt eine wichtige Rolle bei der Definition von Integralen.
159
160
KAPITEL 7. INTEGRALRECHNUNG
Abbildung 7.1: Ein zweidimensionales, rechtsoffenes Intervall.
Bevor wir definieren können, was eine Lebesgue–messbare Menge und was das Lebesgue–
Maß einer solchen Menge ist, benötigen wir noch einige grundlegende Begriffe. Zunächst
erweitern wir den Intervallbegriff auf bestimmte Teilmengen des Rn .
Definition (n-dimensionales, rechtsoffenes Intervall). Sei n ∈ N eine natürliche
Zahl, und seien a = (a1 , a2 , . . . , an )T ∈ Rn und b = (b1 , b2 , . . . , bn )T ∈ Rn zwei Vektoren.
Dann nennt man die Menge
[a, b) := [a1 , b1 ) × [a2 , b2 ) × · · · × [an , bn )
= x = (x1 , x2 , . . . , xn )T ∈ Rn ai ≤ xi < bi für alle i = 1, 2, . . . , n
ein n-dimensionales, rechtsoffenes Intervall. Die Menge aller n-dimensionalen, rechtsoffenen Intervalle wird im Folgenden mit J (Rn ) bezeichnet.
Eine Menge, deren Elemente ebenfalls Mengen sind, wird üblicherweise als Mengensystem
bezeichnet, so auch J (Rn ). Man beachte, dass für jede natürliche Zahl n ∈ N das Mengensystem J (Rn ) insbesondere die leere Menge ∅ enthält, da beispielsweise [a, a) = ∅ für alle
Vektoren a ∈ Rn gilt. Für n = 1 besteht J (Rn ) aus allen rechtsoffenen Intervallen [a, b)
mit Intervallgrenzen a, b ∈ R. Für n = 2 besteht J (Rn ) aus sämtlichen Rechtecken, deren
Seiten parallel zu den Koordinatenachsen verlaufen, und die jeweils nur die linke und die
untere Seite als Teilmenge enthalten (siehe auch Abbildung 7.1). Für n = 3 besteht J (Rn )
aus Quadern, deren Kanten parallel zu den Koordinatenachsen verlaufen. Für rechtsoffene
Intervalle kann man sehr leicht einen Volumenbegriff definieren.
Definition (Volumen eines rechtsoffenen Intervalls). Sei n ∈ N eine natürliche Zahl,
und seien a = (a1 , a2 , . . . , an )T ∈ Rn und b = (b1 , b2 , . . . , bn )T ∈ Rn zwei Vektoren. Dann
nennt man die Zahl


falls [a, b) = ∅,
0
n
Y
vol [a, b) :=

 (bi − ai ) sonst
i=1
das n-dimensionale Volumen von [a, b). Die so definierte Funktion vol : J (Rn ) → R wird
die n-dimensionale Volumenfunktion genannt.
Für n = 1 entspricht vol([a, b)) genau der Länge b−a des Intervalls [a, b) ⊂ R. Für n = 2 ist
vol([a, b)) genau der Flächeninhalt (b1 −a1 )(b2 −a2 ) des Rechtecks [a, b) ⊂ R2 , und für n = 3
ist vol([a, b)) genau der Rauminhalt (b1 − a1 )(b2 − a2 )(b3 − a3 ) des Quaders [a, b) ⊆ R3 . Die
n-dimensionale Volumenfunktion ordnet also jedem rechtsoffenen Intervall ein Volumen
7.1. DAS LEBESGUE–MASS
161
zu, welches für n ∈ {1, 2, 3} genau der geometrischen Länge bzw. dem geometrischen
Flächeninhalt bzw. dem geometrischen Rauminhalt entspricht. Man betrachte dazu auch
die nachfolgenden Beispiele.
Beispiele.
(a) Für das rechtsoffene Intervall [1, 3) ⊆ R gilt vol([1, 3)) = 3 − 1 = 2. Das Volumen
vol([1, 3)) entspricht offenbar genau der Länge des Intervalls.
(b) Für a = (−1, −1)T ∈ R2 und b = (1, 1)T ∈ R2 gilt vol([a, b)) = (1 − (−1))2 = 4.
Tatsächlich ist das rechtsoffene Intervall [a, b) ein Quadrat, dessen Seiten die Länge
2 besitzen. Das Volumen vol([a, b)) entspricht somit genau dem Flächeninhalt des
Quadrats.
Mit Hilfe der n-dimensionale Volumenfunktion kann man für jede Teilmenge des Rn ein so
genanntes äußeres Lebesgue–Maß definieren. Die Definition des äußeren Lebesgue–Maßen
bildet eine wichtige Vorstufe für die Definition eines allgemeinen Volumenbegriffs.
Definition (äußeres Lebesgue–Maß). Sei n ∈ N eine natürliche Zahl, und sei P(Rn )
die Potenzmenge von Rn . Dann heißt die Funktion meas∗ : P(Rn ) → R ∪ {∞}, welche
durch
)
(∞
∞
[
X
∗
n
Jk ⊇ A
meas (A) := inf
vol(Jk ) (Jk )k∈N ist eine Folge in J (R ) mit
k=1
k=1
P(Rn )
für alle A ∈
definiert ist, die n-dimensionale, äußere Lebesgue–Maßfunktion. Für
jede Menge A ∈ P(Rn ) nennt man meas∗ (A) das n-dimensionale, äußere Lebesgue–Maß
von A.
Die Definition des n-dimensionalen äußeren Lebesgue–Maßes kann folgendermaßen motiviert werden: Durch die äußere Lebesgue–Maßfunktion meas∗ soll jeder Teilmenge A des
Rn genau eine nichtnegative Zahl meas∗ (A) zugeordnet werden, die einen möglichen Wert
für das Volumen von A darstellt. Dabei lässt man die Frage außer Acht, ob der Menge A
tatsächlich in sinnvoller Weise ein Volumen zugeordnet werden kann. Zu dem möglichen
Wert für das Volumen von A gelangt man durch folgende Überlegung: Wenn eine Folge
rechtsoffener Intervalle (Jk )k∈N eine Überdeckung (siehe Abschnitt 3.4) von A bildet, dann
muss die Summe aller Intervallvolumina größer oder gleich dem Volumen von A sein. Kann
man die Überdeckung (Jk )k∈N so wählen, dass die Summe der Intervallvolumina möglichst
klein ist, so hat man das mögliche Volumen von A gut approximiert. Man sucht also das
Infimum der Menge
(∞
)
∞
X
[
n
vol(Jk ) (Jk )k∈N ist eine Folge in J (R ) mit
Jk ⊇ A .
k=1
k=1
Da jedes Intervallvolumen größer oder gleich Null ist, ist auch die Summe aller Intervallvolumina größer oder gleich Null. Dies gilt für jede Folge rechtsoffener Intervalle (Jk )k∈N , die
eine Überdeckung von A bildet. Die obige Menge ist also durch Null nach unten beschränkt,
weshalb sie ein Infimum besitzt. Dieses Infimum, welches die Zahl meas∗ (A) definiert, ist
die größte untere Schranke für alle Volumensummen von Intervallfolgen, welche die Menge
A überdecken.
Das äußere Lebesgue–Maß besitzt eine Reihe von Eigenschaften, die man von einem
Volumenbegriff erwarten würde. Der nachfolgende Satz listet die wichtigsten Eigenschaften
des äußeren Lebesgue–Maßes auf.
162
KAPITEL 7. INTEGRALRECHNUNG
Satz 7.1. Sei n ∈ N eine natürliche Zahl. Dann gelten die folgenden Aussagen.
(1) meas∗ (∅) = 0.
(2) Seien A ∈ P(Rn ) und B ∈ P(Rn ) zwei Mengen mit A ⊆ B. Dann gilt
meas∗ (A) ≤ meas∗ (B).
(3) Sei (Ak )k∈N eine Folge in P(Rn ). Dann gilt
!
∞
∞
[
X
∗
meas
Ak ≤
meas∗ (Ak ).
k=1
k=1
(4) Sei A ∈ P(Rn ) eine Menge und x ∈ Rn ein Vektor. Dann gilt
meas∗ (A + x) = meas∗ (A).
Hierbei ist A + x := {a + x | a ∈ A}.
Weiterhin kann man zeigen, dass das n-dimensionale äußere Lebesgue–Maß meas∗ (J) eines
rechtsoffenen Intervalls J ∈ J (Rn ) mit dem Volumen vol(J) des Intervalls überein. Dies
ist der Inhalt des nachfolgenden Satzes.
Satz 7.2. Sei n ∈ N eine natürliche Zahl und J ∈ J (Rn ) ein rechtsoffenes Intervall. Dann
gilt meas∗ (J) = vol(J).
Mit Hilfe des äußeren Lebesgue–Maßes wird eine wichtige Klasse von Mengen definiert,
welche man die Lebesgue–Nullmengen nennt.
Definition (Lebesgue–Nullmenge). Eine Menge N ⊆ Rn wird Lebesgue–Nullmenge
genannt, wenn meas∗ (N ) = 0 gilt. Die Menge aller Teilmengen des Rn , welche Lebesgue–
Nullmengen sind, wird mit N (Rn ) bezeichnet.
Nach Definition des n-dimensionalen äußeren Lebesgue–Maßes ist eine Teilmenge N des
Rn genau dann eine Lebesgue–Nullmenge, wenn es zu jeder positiven Zahl ε > 0 eine Folge
(Jk )k∈N in J gibt, so dass
∞
[
Jk ⊇ N
k=1
und
∞
X
vol(Jk ) < ε
k=1
gilt. Nachfolgend geben wir einige wichtige Beispiele für Lebesgue–Nullmengen an.
Beispiele.
(a) Laut Aussage (1) in Satz 7.1 ist die leere Menge ∅ eine Lebesgue–Nullmenge.
(b) Jede einpunktige Menge {x} mit x ∈ Rn ist eine Lebesgue–Nullmenge.
7.1. DAS LEBESGUE–MASS
163
(c) Man kann zeigen dass jede Vereinigung abzählbar vieler Lebesgue–Nullmengen ebenfalls eine Lebesgue–Nullmenge ist. Daher sind auch die Mengen N, Z und sogar Q
als Teilmengen von R Lebesgue–Nullmengen.
(d) Jede Gerade im Vektorraum Rn mit n ≥ 2 und jede Ebene im Vektorraum Rn mit
n ≥ 3 eine Lebesgue–Nullmenge.
♦
Wie bereits angedeutet wurde, wird das n-dimensionale äußere Lebesgue–Maß letztendlich
nicht dazu verwendet, einen Volumenbegriff für Teilmengen des Rn zu definieren. Der
Grund hierfür ist, dass die Funktion meas∗ im Allgemeinen nicht additiv ist. Man kann
nämlich zeigen, dass es Teilmengen A des Rn gibt, für die jeweils mindestens eine Menge
E ⊆ Rn existiert, so dass
meas∗ (E) < meas∗ (E ∩ A) + meas∗ (E \ A)
gilt. Definiert man nun die Menge B := E \ A, so sind A und B offenbar zwei disjunkte
Mengen, für die A ∪ B = E gilt. Würde man das äußere Lebesgue–Maß dazu verwenden,
die Volumina der Mengen A, B und A∪B zu definieren, so würde dies zu einem paradoxen
Resultat führen. Aus der obigen Ungleichung und der Tatsache, dass E ∩ A ⊆ A gilt, folgt
nämlich die Ungleichungskette
meas∗ (A ∪ B) = meas∗ (E) < meas∗ (E ∩ A) + meas∗ (B) ≤ meas∗ (A) + meas∗ (B).
Die Summe der Volumina von A und B wäre somit echt größer als das Volumen der
disjunkten Vereinigung von A und B. Dies widerspricht jedoch einer fundamentalen Vorstellung, die man üblicherweise von einem Volumenbegriff hat. Die Summe der Volumina
zweier disjunkter Mengen sollte nach dieser Vorstellung nämlich stets gleich dem Volumen
der Vereinigung beider Mengen sein.
Was ist also zu tun? Einerseits besitzt das n-dimensionale äußere Lebesgue–Maß eine Reihe wichtiger Eigenschaften, die man von einem Volumenbegriff erwarten würde.
Andererseits führt das n-dimensionale äußere Lebesgue–Maß für gewisse Teilmengen des
Rn zu Resultaten, die mit einem Volumenbegriff nicht vereinbar sind. Einerseits ist das
Lebesgue–Maß also ein natürlicher Kandidat für einen Volumenbegriff, andererseits liefert
es für bestimmte Mengen paradoxe Resultate. Aus diesem Grund geht man folgendermaßen
vor: Zunächst gibt man das Ziel auf, für jede Teilmenge des Rn ein Volumen zu definieren.
Mit Hilfe des äußeren Lebesgue–Maßes definiert man dann nur für jene Teilmengen des
Rn ein Volumen, für die sich keine paradoxen Resultate ergeben. Solche Mengen werden
Lebesgue–messbar genannt.
Definition (Lebesgue–messbare Menge). Sei n ∈ N eine natürliche Zahl. Eine Menge
A ⊆ Rn wird Lebesgue–messbar genannt, wenn
meas∗ (E) = meas∗ (E ∩ A) + meas∗ (E \ A)
für alle E ⊆ Rn gilt. Das Mengensystem aller Lebesgue–messbaren Teilmengen des Rn
wird mit L(Rn ) bezeichnet.
Das Mengensystem L(Rn ) besteht genau aus den Teilmengen des Rn , für die man mit
Hilfe des äußeren Lebesgue–Maßes einen sinnvollen Volumenbegriff definieren kann. Wie
die nachfolgenden beiden Sätze zeigen, ist das Mengensystem L(Rn ) sehr groß, d.h. es
enthält sehr viele Teilmengen des Rn .
164
KAPITEL 7. INTEGRALRECHNUNG
Satz 7.3. Sei n ∈ N eine natürliche Zahl. Dann gelten die folgenden Aussagen.
(1) Rn ⊆ L(Rn ).
(2) Für jede Menge A ⊆ L(Rn ) gilt auch Rn \ A ∈ L(Rn ).
(3) Sei (Ak )k∈N eine Folge in L(Rn ). Dann gilt
∞
[
Ak ∈ L(Rn ).
k=1
Sei (Ak )k∈N eine Folge in L(Rn ). Dann gilt
∞
\
Ak ∈ L(Rn ).
k=1
Im wesentlichen besagt der Satz 7.3, dass man aus gegebenen Lebesgue–messbaren Mengen durch Bildung des Komplements, der Vereinigung und des Durchschnitts weitere
Lebesgue–messbare Mengen konstruieren kann. Der nachfolgende Satz listet einige Klassen
Lebesgue–messbarer Mengen auf.
Satz 7.4. Sei n ∈ N eine natürliche Zahl. Dann gelten die folgenden Aussagen.
(1) Für jede offene Menge O ⊆ Rn gilt O ∈ L(Rn ).
(2) Für jede abgeschlossene Menge A ⊆ Rn gilt A ∈ L(Rn ).
(3) Für jedes rechtsoffene Intervall J ⊆ J (Rn ) gilt J ∈ L(Rn ).
(4) Für jede Nullmenge N ⊆ N (Rn ) gilt N ∈ L(Rn ).
Für alle Lebesgue–messbaren Teilmengen des Rn definiert man nun in folgender Weise das
so genannte n-dimensionale Lebesgue–Maß.
Definition (Lebesgue–Maß). Sei n ∈ N eine natürliche Zahl, und sei L(Rn ) das Mengensystem aller Lebesgue–messbaren Teilmengen von Rn . Dann heißt die Funktion meas :
L(Rn ) → R ∪ {∞}, welche durch
meas(A) := meas∗ (A)
für alle A ∈ L(Rn ) definiert ist, die n-dimensionale, Lebesgue–Maßfunktion. Für jede
Menge A ∈ L(Rn ) nennt man meas(A) das n-dimensionale, Lebesgue–Maß von A.
Per Definition stimmt das Lebesgue–Maß meas(A) jeder Lebesgue–messbaren Menge A
stets mit dem äußeren Lebesgue–Maß meas∗ (A) der Menge überein. Die Funktionen meas
und meas∗ unterscheiden sich nämlich lediglich in ihren Definitionsbereichen. Während
die äußere Lebesgue–Maßfunktion meas∗ auf der Potenzmenge P(Rn ) definiert ist, ist die
Lebesgue–Maßfunktion meas nur auf dem Mengensystem aller Lebesgue–messbaren Mengen L(Rn ) definiert. Da L(Rn ) eine Teilmenge von P(Rn ) ist, gilt der folgende Grundsatz:
Sämtliche Aussagen in Satz 7.1 bleiben gültig, wenn man P(Rn ) durch L(Rn )
und meas∗ durch meas ersetzt. Darüber hinaus besitzt das n-dimensionale Lebesgue–
Maß weitere wichtige Eigenschaften, die im nachfolgenden Satz aufgelistet werden.
7.1. DAS LEBESGUE–MASS
165
Satz 7.5. Sei n ∈ N eine natürliche Zahl. Dann gelten die folgenden Aussagen.
(1) Sei J ∈ J (Rn ) ein rechtsoffenes Intervall. Dann gilt
meas(J) = vol(J).
(2) Sei (Ak )k∈N eine Folge paarweise disjunkter Mengen in L(Rn ). Dann gilt
!
∞
∞
[
X
meas
Ak =
meas(Ak ).
k=1
k=1
(3) Seien A ∈ L(Rn ) und B ∈ L(Rn ) zwei Lebesgue–messbare Mengen. Dann gilt
meas(A ∪ B) + meas(A ∩ B) = meas(A) + meas(B).
Die Aussage (2) in Satz 7.5 impliziert, dass das Lebesgue–Maß additiv ist. Sind nämlich
A und B zwei disjunkte, Lebesgue–messbare Teilmengen des Rn , so kann man eine Folge
paarweise disjunkter Mengen (Ak )k∈N in L(Rn ) durch A1 := A, A2 := B und Ak := ∅ für
alle k ∈ N mit k ≥ 3 definieren. Es gilt dann
!
∞
∞
[
X
meas(A ∪ B) = meas
Ak =
meas(Ak ) = meas(A) + meas(B).
k=1
k=1
Die Summe der Lebesgue–Maße zweier disjunkter Mengen ist somit immer gleich dem
Lebesgue–Maß der Vereinigung beider Mengen. Diese Eigenschaft war für das äußere
Lebesgue–Maß nicht gegeben. Das Lebesgue–Maß erfüllt indes alle wichtigen Eigenschaften eines Volumens. Daher definiert man für jede Lebesgue–messbare Teilmenge A des Rn
das n-dimensionale Lebesgue–Maß meas(A) als das Volumen von A.
Laut Aussage (1) in Satz 7.5 kann das Lebesgue–Maß eines rechtsoffenen Intervalls
explizit berechnet werden. Kann man weiterhin eine gegebene Menge A ⊆ Rn als disjunkte
Vereinigung einer Folge paarweise disjunkter, rechtsoffener Intervalle (Jk )k∈N und einer
Lebesgue–Nullmenge N darstellen, so kann man auch das Lebesgue–Maß von A explizit
berechnen. Es gilt dann nämlich
!
!
∞
∞
∞
[
[
X
meas(A) = meas N ∪
Ak = meas(N ) + meas
Ak = 0 +
meas(Ak ).
k=1
k=1
k=1
Man betrachte dazu auch die nachfolgenden Beispiele.
Beispiele.
(a) Es soll das eindimensionale Lebesgue–Maß eines nichtleeren, abgeschlossenen Intervalls [a, b] mit den Intervallgrenzen a, b ∈ R bestimmt werden. Offenbar ist [a, b] die
disjunkte Vereinigung des rechtsoffenen Intervalls [a, b) und der Lebesgue–Nullmenge
{b}. Es gilt demnach
meas [a, b] = meas [a, b) ∪ {b}
= meas [a, b) + meas {b}
= meas [a, b)
= b − a.
166
KAPITEL 7. INTEGRALRECHNUNG
(a)
(b)
Abbildung 7.2: (a) Das Dreieck ∆ := {x ∈ R2 | x1 ≥ 0, x2 ≥ 0, x1 + x2 < 1}. (b) Eine
(l)
mögliche Kachelung“ von ∆ mit rechtsoffenen Intervallen Jk .
”
(b) Sei (a, b) ein nichtleeres, offenes Intervall mit den Intervallgrenzen a, b ∈ R. Dann ist
das rechtsoffene Intervall [a, b) offenbar die disjunkte Vereinigung von (a, b) und der
Lebesgue–Nullmenge {a}. Man erhält also
meas (a, b) = meas {a} + meas (a, b)
= meas {a} ∪ (a, b)
= meas [a, b)
= b − a.
(c) Die Menge ∆ := {x = (x1 , x2 )T ∈ R2 |x1 ≥ 0, x2 ≥ 0, x1 +x2 < 1} besitzt die Gestalt
eines rechtwinkligen Dreiecks, dessen Katheten parallel zu den Koordinatenachsen im
R2 verlaufen (siehe Abbildung 7.2(a)). Das zweidimensionale Lebesgue–Maß dieser
Menge kann folgendermaßen bestimmt werden: Für jeden Index l ∈ N0 und jeden
Index k ∈ {0, 1, . . . , 2l − 1} definiert man das zweidimensionale, rechtsoffene Intervall
l
k 2k + 1
2 − k − 1 2l+1 − 2k − 1
(l)
Jk := l , l+1
×
,
.
2 2
2l
2l+1
(l)
Man kann zeigen, dass ∆ die disjunkte Vereinigung all dieser Intervalle Jk ist (siehe
Abbildung 7.2(b)). Man rechnet außerdem leicht nach, dass
(l) meas Jk
=
1
22l+2
für alle l ∈ N0 und alle k ∈ {0, 1, . . . , 2l − 1} gilt. Entsprechende erhält man
!!
!
l −1
l −1
∞ 2[
∞
2X
[
X
(l)
(l)
meas(∆) = meas
Jk
=
meas Jk
=
∞
X
l=0
l=0
l
2
22l+2
k=0
=
1
4
∞ X
l=0
l=0
1
2
l
=
k=0
1
1
·
4 1−
1
2
1
= .
2
Wie erwartet, entspricht das Lebesgue–Maß von ∆ genau dem Flächeninhalt eines
rechtwinkligen Dreiecks, dessen Katheten beide die Länge 1 haben.
♦
Zum Abschluss dieses Kapitels kommen wir noch auf eine Formulierung zu sprechen, die
häufig in der Integrationstheorie wie auch in der Stochastik verwendet wird.
7.1. DAS LEBESGUE–MASS
167
Definition (Lebesgue–fast überall). Sei n ∈ N eine natürliche Zahl, und sei A ⊆ Rn
eine beliebige Menge. Man sagt, dass eine Eigenschaft Lebesgue–fast überall oder einfach
nur fast überall auf A gilt, wenn die Menge N aller Punkte von A, für die die Eigenschaft
nicht gilt, eine Lebesgue–Nullmenge ist.
Die nachfolgenden Beispiele sollen verdeutlichen, wie die Formulierung fast überall“ üb”
licherweise verwendet wird.
Beispiele.
(a) Die Signumfunktion sgn : R → R ist an jeder Stelle x ∈ R \ {0} stetig. An der Stelle
x = 0 ist sie nicht stetig. Die Menge aller Punkte in R, an denen die Signumfunktion
nicht stetig ist, ist also die einpunktige Menge {0}. Da {0} eine Lebesgue–Nullmenge
ist, ist die Signumfunktion fast überall auf R stetig.
(b) Die Betragsfunktion | · | : R → R ist an jeder Stelle x ∈ R \ {0} differenzierbar. Also
ist die Betragsfunktion fast überall auf R differenzierbar.
(c) Die so genannte Dirichlet–Funktion D : R → R ist durch
(
1 falls x ∈ Q,
D(x) :=
0 sonst
für alle x ∈ R definiert. Da die Menge aller rationalen Zahlen Q eine Lebesgue–
Nullmenge ist, besitzt die Dirichlet–Funktion fast überall auf R den Funktionswert
Null.
♦
Übungsaufgaben
1. Sei n ∈ N eine natürliche Zahl, und seien A ∈ L(Rn ) und B ∈ L(Rn ) zwei Lebesgue–messbare
Mengen. Zeigen Sie, dass dann auch A ∪ B ∈ L(Rn ), A ∩ B ∈ L(Rn ) und B \ A ∈ L(Rn )
gilt. Verwenden Sie dazu die Aussagen in Satz 7.3. Dabei kann es hilfreich sein, die Folge
(Ak )k∈N in L(Rn ) zu betrachten, welche durch A1 := A, A2 := B und Ak := ∅ für alle k ≥ 3
definiert ist.
2. Sei n ∈ N eine natürliche Zahl, und seien A ∈ L(Rn ) und B ∈ L(Rn ) zwei Lebesgue–
messbare Mengen mit A ⊆ B. Zeigen Sie, dass dann meas(B \ A) = meas(B) − meas(A)
gilt. Verwenden Sie dazu die definierende Eigenschaft Lebesgue–messbarer Mengen, sowie
die Tatsache, dass meas(M ) = meas∗ (M ) für alle M ∈ L(Rn ) gilt.
3. Bestimmen Sie die zweidimensionalen Lebesgue–Maße der folgenden Mengen:
M1 := [3, 5) × [1, 2) ∪ [3, 4) × [2, 3)
M2 := [0, 3) × [0, 2) ∪ [1, 3) × [1, 4) ,
M3 := [1, 4) × [3, 7) \ [2, 3) × [4, 6) ,
k
!
∞
[
2 − 1 2k+1 − 1
1
M4 :=
,
× 0, k+1
2k
2k+1
2
k=0
Verwenden Sie dazu die Aussagen in Satz 7.5. Es kann hilfreich sein, die Mengen zu skizzieren.
4. Zeigen Sie, dass die Strecke S := {x = (x1 , x2 )T ∈ R2 | 0 ≤ x1 < 1, x2 = x1 } eine Lebesgue–
Nullmenge ist. Konstruieren Sie dazu für jede natürliche Zahl n ∈ N genau n rechtsoffene
(n)
(n)
(n)
(n)
(n)
(n)
Intervalle J1 , J2 , . . . , Jn ∈ J (R2 ) derart, dass die Vereinigung J1 ∪ J2 ∪ · · · ∪ Jn
die Strecke S überdeckt und die Summe der Intervallvolumina genau 1/n beträgt.
168
7.2
KAPITEL 7. INTEGRALRECHNUNG
Das Lebesgue–Integral
Nachdem wir im voran gegangenen Abschnitt das Lebesgue–Maß eingeführt haben, wenden
wir uns in diesem Abschnitt dem so genannten Lebesgue–Integral zu. Es hat sich gezeigt,
dass es verschiedene Möglichkeiten gibt, das Integral
Z
f (x) dx
Ω
einer Funktion f : D → R über einer Menge Ω ⊆ D mit D ⊆ Rn sinnvoll zu definieren.
Verwendet man die Definition, die im wesentlichen auf Henri Léon Lebesgue zurück geht,
erhält man das so genannte Lebesgue–Integral von f über Ω. Andere Definitionen des
Integrals gehen auf den deutschen Mathematiker Bernhard Riemann (1826–1866) bzw.
auf den französischen Mathematiker Marie Ennemond Camille Jordan (1838–1922) zurück.
Verwendet man deren Definitionen, so erhält man das Riemann–Integral bzw. das Jordan–
Integral von f über Ω.
Heutzutage verwendet man in der Regel die Definition des Integrals nach Lebesgue.
Wie wir noch sehen werden, kann das Lebesgue–Integral von f über Ω nur für bestimmte
Funktionen f und nur für bestimmte Mengen Ω definiert werden. Die Menge Ω muss nämlich Lebesgue–messbar sein. Die Funktion f wiederum muss ebenfalls Lebesgue-messbar
sein. Was dies bedeutet soll nachfolgend erläutert werden. Zunächst jedoch definieren wir
einige grundlegende Begriffe.
Definition (charakteristische Funktion). Sei n ∈ N eine natürliche Zahl, und seien
D ⊆ Rn und A ⊆ Rn zwei beliebige Mengen. Dann heißt die Funktion χA : D → R, welche
durch
(
1 falls x ∈ D ∩ A,
χA (x) :=
0 falls x ∈ D \ A
für alle x ∈ D definiert ist, die charakteristische Funktion oder die Indikatorfunktion von
A auf D genannt.
Gemäß Definition nimmt jede charakteristische Funktion χA auf einer Menge D maximal
zwei verschiedene Funktionswerte an, nämlich 0 und 1. Für die zugehörigen Urbilder gilt
−1
χ−1
A ({0}) = D \ A und χA ({1}) = D ∩ A. Wir kennen bereits einige Funktionen, die
als charakteristische Funktionen bestimmter Teilmengen von R aufgefasst werden können.
Man betrachte dazu die nachfolgenden Beispiele.
Beispiele.
(a) Die charakteristische Funktion χ[0,∞) : R → R der Menge aller nichtnegativen Zahlen
auf R entspricht genau der Heaviside–Funktion (siehe Beispiel (b) auf Seite 102).
(b) Die charakteristische Funktion χQ : R → R der Menge aller rationalen Zahlen auf R
entspricht genau der Dirichlet–Funktion (siehe Beispiel (c) auf Seite 167).
♦
Mit Hilfe der charakteristischen Funktionen kann man eine bestimmte Klasse reellwertiger
Funktionen definieren, die als einfache Funktionen bezeichnet werden.
7.2. DAS LEBESGUE–INTEGRAL
169
Definition (einfache Funktion). Sei n ∈ N eine natürliche Zahl und D ∈ L(Rn ) eine
nichtleere, Lebesgue–messbare Menge. Eine Funktion f : D → R wird einfach genannt,
wenn es endlich viele Lebesgue–messbare Mengen A1 , A2 , . . . , AN ∈ L(Rn ) und ebenso
viele von Null verschiedene Zahlen a1 , a2 , . . . , aN ∈ R \ {0} gibt, so dass
f=
N
X
ak χAk
k=1
gilt, wobei χAk für alle k = 1, 2, . . . , N die charakteristische Funktion der Menge Ak auf
D bezeichnet. Die Menge aller einfachen Funktionen von D nach R wird im folgenden mit
E(D) bezeichnet.
Einfache Funktionen sind also Linearkombinationen endlich vieler charakteristischer Funktionen von Lebesgue–messbaren Mengen. Aus diesem Grund besitzt jede einfache Funktion
nur endlich viele unterschiedliche Funktionswerte. Nachfolgend geben wir einige Beispiele
für einfache Funktionen an.
Beispiele.
(a) Für je zwei Lebesgue–messbare Mengen D ∈ L(Rn ) und A ∈ L(Rn ) ist die charakteristische Funktion χA von A auf D einfach.
(b) Jede Nullfunktion f : Rn → {0} ist einfach. Es gilt nämlich f = χ∅ , wobei χ∅ die
charakteristische Funktion der leeren Menge auf Rn bezeichnet. Die leere Menge ist
eine Lebesgue–Nullmenge und somit Lebesgue–messbar laut Satz 7.4(4).
(c) Jede konstante Funktion f : Rn → {a} mit a > 0 ist einfach. Es gilt nämlich
f = aχRn . Hierbei bezeichnet χRn die charakteristische Funktion von Rn auf Rn .
Der Vektorraum Rn ist laut Satz 7.3(1) eine Lebesgue–messbare Menge.
(d) Die Signumfunktion sgn : R → R ist einfach. Es gilt nämlich sgn = χ(0,∞) − χ(−∞,0) ,
wobei χ(−∞,0) und χ(0,∞) die charakteristischen Funktionen der Mengen aller negativen bzw. aller positiven Zahlen auf R bezeichnen. Die Mengen (−∞, 0) und (0, ∞)
sind offen und damit auch Lebesgue–messbar laut Satz 7.4(1).
♦
Für einfache Funktionen, deren Funktionswerte nichtnegativ sind, definiert man das Lebesgue–
Integral in folgender Weise.
Definition (Lebesgue–Integral einer nichtnegativen, einfachen Funktion). Sei
n ∈ N eine natürliche Zahl, sei D ∈ L(Rn ) eine nichtleere, Lebesgue–messbare
Menge,
PN
und sei f ∈ E(D) eine einfache Funktion mit der Darstellung f = k=1 ak χAk , wobei
die Zahlen a1 , a2 , . . . , aN alle positiv seien. Sei ferner Ω ∈ L(Rn ) eine Lebesgue–messbare
Menge mit Ω ⊆ D. Dann nennt man
Z
f (x) dx :=
Ω
das Lebesgue–Integral von f über Ω.
N
X
k=1
ak meas(Ak ∩ Ω)
170
KAPITEL 7. INTEGRALRECHNUNG
(a)
(b)
Abbildung 7.3: (a) Graph der einfachen Funktion f = 2χ[−1,1] +χ[2,3) +3χ[3,5] . (b) Das
Lebesgue–Integral von f über dem Intervall [0, 4] entspricht genau dem Flächeninhalt der
grau unterlegten Fläche.
Um das Lebesgue–Integrals einer nichtnegativen, einfachen Funktion f zu berechnen, muss
man lediglich zu jedem positiven Funktionswert ak von f die Teilmenge Ak ∩ Ω des Integrationsbereichs kennen, auf der dieser Funktionswert angenommen wird. Das Lebesgue–
Integral wird dann berechnet, indem man jeden positiven Funktionswert mit dem Maß der
entsprechenden Menge multipliziert und anschließend alle Produkte aufsummiert. Da das
Lebesgue–Maß einer Menge auch ∞ sein kann, ist es durchaus möglich, dass
Z
f (x) dx = ∞
Ω
gilt. Das Integral wird in diesem Fall unbeschränkt genannt. Die Berechnung des Lebesgue–
Integrals einer nichtnegativen, einfachen Funktion soll noch anhand eines Beispiels verdeutlicht werden.
Beispiel. Die einfache Funktion f ∈ E(R) sei durch f := 2χ[−1,1] + χ[2,3) + 3χ[3,5] definiert
(siehe Abbildung 7.3(a)). Offenbar besitzt f nur nichtnegative Funktionswerte, weshalb das
Lebesgue–Integral von f über jeder Lebesgue–messbaren Teilmenge Ω von R definiert ist.
Im Fall Ω = [0, 4] erhält man insbesondere
Z
f (x) dx = 2 meas [−1, 1] ∩ [0, 4] + meas [2, 3) ∩ [0, 4] + 3 meas [3, 5] ∩ [0, 4]
[0,4]
= 2 meas [0, 1] + meas [2, 3) + 3 meas [3, 4]
=2·1+1+3·1
= 6.
Das Lebesgue–Integral entspricht genau dem Flächeninhalt der Menge aller Punkte, die
sich unterhalb des Graphen von f und oberhalb der x-Achse, sowie innerhalb des Intervalls
[0, 4] befinden (siehe Abbildung 7.3(b)).
♦
Bislang wurde das Lebesgue–Integral lediglich für nichtnegative, einfache Funktionen definiert. Unser nächstes Ziel ist es, das Lebesgue–Integral darüber hinaus für möglichst viele
Funktionen zu definieren. Zu diesem Zwecken führen wir den sogenannten Positivteil und
den Negativteil einer reellwertigen Funktion ein.
Definition (Positivteil). Sei X eine nichtleere Menge und f : X → R eine Funktion.
Dann heißt die Funktion f + : X → R, welche durch f + (x) := max{f (x), 0} für alle x ∈ X
definiert ist, der Positivteil von f .
7.2. DAS LEBESGUE–INTEGRAL
(a)
171
(b)
(c)
Abbildung 7.4: (a) Graph einer Funktion f : R → R. (b) Graph des Positivteils f +
von f . (c) Graph des Negativteils f − von f .
Definition (Negativteil). Sei X eine nichtleere Menge und f : X → R eine Funktion.
Dann heißt die Funktion f − : X → R, welche durch f − (x) := max{−f (x), 0} für alle
x ∈ X definiert ist, der Negativteil von f .
Man macht sich leicht klar, dass für jede reellwertige Funktion f die Identität
f = f+ − f−
gilt. Zu beachten ist, dass sowohl der Positivteil f + als auch der Negativteil f − nichtnegative Funktionen sind. Es ist daher möglich, jede reellwertige Funktion als Differenz
zweier nichtnegativer Funktionen darzustellen. Man überlegt sich außerdem leicht, dass
der Positivteil und der Negativteil jeder einfachen Funktion ebenfalls einfache Funktionen
sind.
Als nächstes definieren wir eine Klasse von Funktionen, die als Grenzfunktionen bestimmter Folgen von einfachen Funktionen darstellbar sind. Diese Funktionen werden
Lebesgue–messbar genannt.
Definition (Lebesgue–messbare Funktion). Sei n ∈ N eine natürliche Zahl, und sei
D ∈ L(Rn ) eine nichtleere, Lebesgue–messbare Menge. Eine Funktion f : D → R wird
Lebesgue–messbar genannt, wenn eine Funktionenfolge (fm )m∈N in E(D) existiert, so dass
+ (x))
−
für jedes x ∈ D die Folgen (fm
m∈N und (fm (x))m∈N monoton wachsend sind und gegen
f + (x) bzw. gegen f − (x) konvergieren.
Die Menge aller Lebesgue–messbaren Funktionen, die auf einer Lebesgue–messbaren Menge D definiert sind, ist sehr groß. Wie der nachfolgende Satz zeigt, umfasst diese Menge
insbesondere alle stetigen Funktionen auf D.
Satz 7.6. Sei n ∈ N eine natürliche Zahl, sei D ∈ L(Rn ) eine Lebesgue–messbare Menge,
und sei f : D → R eine stetige Funktion. Dann ist f Lebesgue–messbar.
Da der Positivteil f + wie auch der Negativteil f − einer Lebesgue–messbaren Funktion f
Grenzfunktionen zweier Folgen nichtnegativer, einfacher Funktionen sind, und da für jede
nichtnegative, einfache Funktion das Lebesgue–Integral über einer Lebesgue–messbaren
Menge Ω definiert ist, kann man in folgender Weise das Lebesgue–Integral von f + und f −
über Ω definieren.
172
KAPITEL 7. INTEGRALRECHNUNG
Definition (Lebesgue–Integral des Positivteils). Sei n ∈ N eine natürliche Zahl, sei
D ∈ L(Rn ) eine nichtleere, Lebesgue–messbare Menge, und sei f : D → R eine Lebesgue–
messbare Funktion. Sei außerdem (fm )m∈N eine Funktionenfolge in E(D), so dass für jedes
+ (x))
+
x ∈ D die Folge (fm
m∈N streng monoton wachsend gegen f (x) konvergiert. Für jede
n
Lebesgue–messbare Menge Ω ∈ L(R ) mit Ω ⊆ D heißt dann
Z
Z
+
fm
(x) dx
f + (x) dx := lim
m→∞ Ω
Ω
das Lebesgue–Integral von f + über Ω.
Definition (Lebesgue–Integral des Negativteils). Sei n ∈ N eine natürliche Zahl, sei
D ∈ L(Rn ) eine nichtleere, Lebesgue–messbare Menge, und sei f : D → R eine Lebesgue–
messbare Funktion. Sei außerdem (fm )m∈N eine Funktionenfolge in E(D), so dass für jedes
− (x))
−
x ∈ D die Folge (fm
m∈N streng monoton wachsend gegen f (x) konvergiert. Für jede
Lebesgue–messbare Menge Ω ∈ L(Rn ) mit Ω ⊆ D heißt dann
Z
Z
−
−
fm
(x) dx
f (x) dx := lim
m→∞ Ω
Ω
das Lebesgue–Integral von f − über Ω.
Man beachte, dass die Integrale der einfachen Funktionen in den obigen Definition unbeschränkt sein können. Außerdem können sie gegen ∞ bestimmt divergieren, wenn m gegen
∞ strebt. In beiden Fällen wäre dann das Integral des Positivteils bzw. des Negativteils
unbeschränkt. Ist hingegen f eine Funktion derart, dass jedes Integral des Positivteils
f + und jedes Integral des Negativteils f − beschränkt ist, so nennt man die Funktion f
Lebesgue–integrierbar.
Definition (Lebesgue–integrierbare Funktion). Sei n ∈ N eine natürliche Zahl, und
sei D ∈ L(Rn ) eine nichtleere, Lebesgue–messbare Menge. Eine Funktion f : D → R wird
Lebesgue–integrierbar genannt, wenn sie Lebesgue–messbar ist, und wenn
Z
f + (x) dx < ∞
D
und
Z
f − (x) dx < ∞
D
gilt. Die Menge aller Lebesgue–integrierbaren Funktionen von D nach R wird üblicherweise
mit L1 (D) bezeichnet.
Für jede Lebesgue–integrierbare Funktion kann nun in folgender Weise das Lebesgue–
Integral definiert werden.
Definition (Lebesgue–Integral). Sei n ∈ N eine natürliche Zahl, und sei D ∈ L(Rn )
eine nichtleere, Lebesgue–messbare Menge, und sei f ∈ L1 (D) eine Lebesgue–messbare
Funktion. Sei ferner Ω ∈ L(Rn ) eine Lebesgue-messbare Menge mit Ω ⊆ D. Dann heißt
Z
Z
Z
+
f (x) dx :=
f (x) dx −
f − (x) dx
Ω
das Lebesgue–Integral von f über Ω.
Ω
Ω
7.2. DAS LEBESGUE–INTEGRAL
(a)
173
(b)
(c)
Abbildung 7.5: (a)–(c) Die Folge nichtnegativer, einfacher Funktionen (fm )m∈N konvergiert punktweise monoton wachsend gegen die Funktion f : [0, 1] → R, x 7→ x2 . Die
Flächeninhalte der grau unterlegten Bereiche entsprechen jeweils genau den Lebesgue–
Integralen der Folgenglieder von (fm )m∈N .
Das nachfolgende Beispiel dient dazu, die Definition des Lebesgue–Integrals noch einmal
zu verdeutlichen. Außerdem zeigt das Beispiel, wie man das Lebesgue–Integral bestimmter
Funktionen streng nach Definition“ berechnen kann.
”
Beispiel. Wir betrachten die Funktion f : [0, 1] → R, welche durch f (x) := x2 für
alle x ∈ Rn definiert ist. Da die Funktion f ausschließlich nichtnegative Funktionswerte
besitzt, gilt f + = f und f − = 0. Für jede natürliche Zahl m ∈ N und jeden Index
k ∈ {1, 2, . . . , 2m − 1} definieren wir das rechtsoffene Intervall
k k+1
(m)
Jk := m , m
2
2
(m)
(m)
sowie die Zahl ak := k 2 /22m . Es gilt dann meas(Jk ) = 1/2m für alle m ∈ N und jeden
Index k ∈ {1, 2, . . . , 2m − 1}. Als nächstes definieren wir die Funktionenfolge (fm )m∈N in
E([0, 1]) durch
m−1
2X
(m)
fm :=
ak χJ (m)
k=1
k
für alle m ∈ N (siehe Abbildung 7.5). Man überlegt sich leicht, dass
m 2
b2 xc
+
fm
(x) = fm (x) =
2m
für alle m ∈ N und alle x ∈ [0, 1] gilt. Verwendet man die Tatsache, dass ba+bc ≥ bac+bbc
+ (x))
für alle a, b ∈ R gilt, so kann man zeigen, dass die Folge (fm
m∈N für jedes x ∈ [0, 1] monoton wächst. Mit Hilfe des Sandwichtheorems (siehe Satz 4.3) zeigt man außerdem leicht,
+ (x))
2
dass die Folge (fm
m∈N für jedes x ∈ [0, 1] gegen x und somit gegen den Funktions+
+
wert f (x) konvergiert. Die Folge (fm )m∈N konvergiert also punktweise monoton wachsend
gegen f + . Die Funktion f ist demnach Lebesgue–messbar. Weiterhin gilt
Z
Z
+
f (x) dx = lim
[0,1]
m→∞ [0,1]
= lim
m→∞
= lim
m→∞
m −1
2X
k=1
1
23m
+
fm
(x) dx
= lim
m→∞
1
k2
= lim
23m m→∞ 23m
m −1
2X
k=1
m −1
2X
(m)
ak
k2
k=1
(2m − 1)2m (2m+1 − 1)
·
6
(m) meas Jk
174
KAPITEL 7. INTEGRALRECHNUNG
2 · 23m − 3 · 22m + 2m
m→∞
6 · 23m
2 − 3 · 2−m + 2−2m
= lim
m→∞
6
1
= ,
3
= lim
sowie
Z
f − (x) dx = 0,
[0,1]
da der Negativteil f − von f die Nullfunktion ist. Die Funktion f ist also Lebesgue–
integrierbar, und ihr Lebesgue–Integral über dem Intervall [0, 1] ist durch
Z
Z
Z
1
+
f − (x) dx =
f (x) dx −
f (x) dx =
3
[0,1]
[0,1]
[0,1]
gegeben.
♦
Natürlich ist die im Beispiel verwendete Methode zur Berechnung des Lebesgue–Integrals
für die meisten Funktionen eher ungeeignet. In vielen Fällen kann man ein Lebesgue–
Integral nämlich mittels bestimmter Integrationsregeln berechnen. Einige dieser Integrationsregeln werden wir im nachfolgenden Abschnitt kennen lernen. Im Folgenden gehen wir
zunächst auf grundlegende Eigenschaften des Lebesgue–Integrals ein. Der nachfolgende
Satz zählt die wichtigsten Eigenschaften auf.
Satz 7.7. Sei n ∈ N eine natürliche Zahl, und seien D ∈ L(Rn ) und Ω ∈ L(Rn ) zwei
Lebesgue–messbare Mengen mit Ω ⊆ D. Seien ferner f ∈ L1 (D) und g ∈ L1 (D) zwei
Lebesgue–integrierbare Funktionen, und sei α ∈ R eine reelle Zahl. Dann gelten die folgenden Aussagen:
(1) Das Lebesgue–Integral ist linear, d.h. es gilt
Z
Z
Z
f (x) + g(x) dx =
f (x) dx +
g(x) dx,
Ω
Ω
Ω
Z
Z
αf (x) dx = α f (x) dx.
Ω
Ω
(2) Wenn eine Lebesgue–Nullmenge N ∈ L(Rn ) mit N ⊆ D existiert, so dass f (x) ≤ g(x)
für alle x ∈ Ω \ N gilt, dann gilt auch
Z
Z
f (x) dx =
g(x) dx.
Ω
Ω
(3) Sei (Ωk )k∈N eine Folge paarweise disjunkter Mengen in L(Rn ), d.h. es gelte Ωk ∩Ωl =
∅ für alle k, l ∈ N mit k 6= l. Wenn außerdem
Ω=
∞
[
Ωk
k=1
gilt, dann gilt auch
Z
f (x) dx =
Ω
∞ Z
X
k=1
Ωk
f (x) dx.
7.2. DAS LEBESGUE–INTEGRAL
175
(4) Für jede Lebesgue–Nullmenge N ∈ L(Rn ) mit N ⊆ D gilt
Z
f (x) dx = 0.
N
Die Aussage (1) in Satz 7.7 ( Das Lebesgue–Integral ist linear.“) kann noch etwas präziser
”
gefasst werden: Definiert man zu je zwei Lebesgue–messbaren Mengen D ∈ L(Rn ) und
Ω ∈ L(Rn ) mit Ω ⊆ D die Abbildung I : L1 (D) → R durch
Z
f (x) dx
I(f ) :=
Ω
für alle Lebesgue–integrierbaren Funktionen f ∈ L1 (D), so ist I eine lineare Abbildung.
Die Aussage impliziert auch, dass die Menge L1 (D) ein Vektorraum über R ist.
Gemäß Aussage (2) in Satz 7.7 ist die Abbildung I im folgenden Sinn monoton wach˙ definieren, indem man
send: Auf der Menge L1 (D) kann man eine Ordnungsrelation ≤
1
für jede zwei Lebesgue–integrierbare Funktionen f ∈ L (D) und g ∈ L1 (D) festlegt, dass
˙ g genau dann gelten soll, wenn eine Lebesgue–Nullmenge N ∈ L(Rn ) mit N ⊆ D
f ≤
˙ g besteht also
existiert, so dass f (x) ≤ g(x) für alle x ∈ D \ N gilt. Die Relation f ≤
genau dann, wenn die Funktionswerte von f fast überall auf D kleiner oder gleich den
˙ g folgt dann stets I(f ) ≤ I(g).
entsprechenden Funktionswerten von g sind. Aus f ≤
Die Aussagen (3) und (4) in Satz 7.7 sind für die Berechnung von Lebesgue–Integralen
oft nützlich. Aus der Aussage (3) folgt insbesondere, dass für je zwei disjunkte Mengen
A ⊆ L(Rn ) und B ⊆ L(Rn ) mit A ⊆ D und B ⊆ D stets
Z
Z
Z
f (x) dx =
f (x) dx +
f (x) dx
A∪B
A
B
gilt. Um dies zu sehen, definiert man die Menge Ω in Aussage (3) einfach durch Ω := A∪B
und die Folge (Ωk )k∈N durch Ω1 := A, Ω2 := B und Ωk := ∅ für alle k ≥ 3. Dann nutzt
man aus, dass gemäß Aussage (4) die Gleichung
Z
f (x) dx = 0
∅
gilt. Eine weitere wichtige Folgerung aus Satz 7.7 ist durch das nachfolgende Lemma
gegeben.
Lemma 7.8. Sei n ∈ N eine natürliche Zahl, und sei D ∈ L(Rn ) eine Lebesgue–messbare
Menge. Seien fernen f ∈ L1 (D) und g ∈ L1 (D) zwei Lebesgue–integrierbare Funktionen
derart, dass eine Lebesgue–Nullmenge N ∈ L(Rn ) mit N ⊆ D existiert, so dass f (x) =
g(x) für alle x ∈ D \ N gilt. Dann gilt
Z
Z
f (x) dx =
g(x) dx.
Ω
Ω
Das Lebesgue–Integral zweier Funktionen stimmt also immer dann überein, wenn die Funktionen fast überall dieselben Funktionswerte annehmen.
Zum Abschluss dieses Abschnitts führen wir noch einige häufig verwendete Schreibweise
für Lebesgue–Integrale über eindimensionalen Intervallen ein. Sind a ∈ R ∪ {−∞} und
b ∈ R ∪ {∞} zwei Zahlen, für die a ≤ b gilt, so definiert man
Z b
Z
f (x) dx :=
f (x) dx.
a
(a,b)
176
KAPITEL 7. INTEGRALRECHNUNG
Den Ausdruck auf der linken Seite bezeichnet man als das Integral von f von a nach b.
Laut den Aussagen (3) und (4) von Satz 7.7 stimmt dieses Integral mit dem Integral von
f über dem abgeschlossenen Intervall [a, b] überein, sofern a und b reelle Zahlen sind. Es
gilt dann nämlich
Z
Z
Z
Z
Z
f (x) dx =
f (x) dx +
f (x) dx +
f (x) dx =
f (x) dx,
{a}
[a,b]
{b}
(a,b)
(a,b)
da die einpunktigen Mengen {a} und {b} Lebesgue–Nullmengen sind. Falls a < b gilt,
definiert man außerdem
Z b
Z a
f (x) dx.
f (x) dx := −
a
b
Übungsaufgaben
1. Die einfache Funktion f : R → R sei durch f := χ[0,1) + 2χ[1,2) + 3χ[2,3) + 4χ[3,4] definiert.
Berechnen Sie das (Lebesgue–)Integral
Z
f (x) dx.
R
2. Die Heaviside–Funktion H : R → R, die charakteristische Funktion χ{0} : R → R, die
Dirichlet–Funktion D : R → R und die Signumfunktion sgn : R → R sind einfache Funktionen. Berechnen die die folgenden (Lebesgue–)Integrale:
Z
1
Z
1
H(x) dx,
−1
Z
χ{0} (x) dx,
1
Z
1
D(x) dx,
−1
sgn(x) dx.
−1
0
3. Sei n ∈ N eine natürliche Zahl, sei D ∈ L(Rn ) eine Lebesgue–messbare Menge, und sei
f : D → R eine Lebesgue–messbare Funktion. Zeigen Sie, dass f genau dann Lebesgue–
integrierbar ist, wenn die Funktion |f | Lebesgue–integrierbar ist.
4. Seien n ∈ N eine natürliche Zahl, seien A ∈ L(Rn ) und B ∈ L(Rn ) zwei Lebesgue–messbare
Mengen, und sei f ∈ L1 (A ∪ B) eine Lebesgue–integrierbare Funktion. Zeigen Sie, dass dann
Z
Z
Z
Z
f (x) dx =
f (x) dx +
f (x) dx −
f (x) dx
A∪B
A
B
A∩B
gilt.
5. Sei n ∈ N eine natürliche Zahl, und sei D ∈ L(Rn ) eine Lebesgue–messbare Menge. Sei
außerdem f ∈ L1 (D) eine Lebesgue–integrierbare Funktion mit der Eigenschaft, dass die
Menge S := {x ∈ D | f (x) 6= 0} eine Lebesgue–Nullmenge ist. Zeigen Sie, dass dann
Z
|f (x)| dx = 0
D
gilt.
7.3. BERECHNUNG VON INTEGRALEN
7.3
177
Berechnung von Integralen
Nachdem in den voran gegangenen beiden Abschnitten definiert wurde, was das Lebesgue–
Integral einer Lebesgue–integrierbaren Funktion über einer Lebesgue-messbaren Menge ist,
wenden wir uns in diesem Abschnitt einigen Methoden zu, mit denen bestimmte Lebesgue–
Integrale explizit berechnet werden können. Im Folgenden wird dabei nur noch von Inte”
gralen“, integrierbaren Funktionen“ und messbaren Mengen“ die Rede sein. Gemeint sind
”
”
damit jeweils Lebesgue–Integrale“, Lebesgue–integrierbare Funktionen“ und Lebesgue–
”
”
”
messbare Mengen“.
Es ist wichtig zu wissen, dass ist es nicht immer möglich ist, das Integral einer integrierbaren Funktion explizit zu berechnen. Auch die in diesem Abschnitt vorgestellten
Integrationsmethoden lassen sich bei weitem nicht auf alle integrierbaren Funktionen anwenden. Das wichtigste Hilfsmittel für die explizite Berechnung von Integralen ist der so
genannt Fundamentalsatz der Analysis. Bevor wir diesen Satz jedoch formulieren können,
müssen wir zunächst definieren, was Stammfunktionen sind.
Definition (Stammfunktion). Sei D ⊆ R eine nichtleere, offene Menge. Seien außerdem
f : D → R und F : D → R zwei Funktionen, so dass F 0 = f gilt. Dann heißt F eine
Stammfunktion von f .
Man beachte, dass Stammfunktionen nicht eindeutig bestimmt sind. Sei beispielsweise F
eine Stammfunktion von f , und sei α ∈ R eine reelle Zahl. Dann ist die Funktion G := F +α
ebenfalls eine Stammfunktion von f . Es gilt nämlich
G0 = (F + α)0 = F 0 = f.
Stammfunktionen sind also nur bis auf additive Konstanten eindeutig bestimmt. Dies
bereitet in der Regel jedoch keine Schwierigkeiten. Tatsächlich eröffnet sich dadurch die
Möglichkeit, eine solche Konstante passend“ zur jeweiligen Anwendung zu wählen.
”
Satz 7.9 (Fundamentalsatz der Analysis). Sei [a, b] ⊂ R ein nichtleeres, abgeschlossenes Intervall. Sei außerdem f ∈ L1 ([a, b]) eine integrierbare Funktion, und sei F : [a, b] → R
eine Stammfunktion von f . Dann gilt
Z b
h
ib
f (x) dx = F (x)
:= F (b) − F (a).
a
x=a
Üblicherweise bezeichnet man die Funktion, deren Integral berechnet werden soll, als Integrand. Der Fundamentalsatz der Analysis besagt, dass man das Integral einer integrierbaren Funktion über einem eindimensionalen Intervall immer dann explizit berechnen kann,
wenn eine Stammfunktion des Integranden existiert. Es ist dabei üblich, die Differenz der
Funktionswerte der Stammfunktion an den Integrationsgrenzen a und b mit
h
ib
F (x)
x=a
zu bezeichnen. Oft wird auch einfach die Schreibweise
h
ib
F (x)
a
verwendet, wenn klar ist, dass x die Variable der Stammfunktion ist. In den nachfolgenden
Beispielen wird demonstriert, wie der Fundamentalsatz der Analysis angewendet wird.
178
KAPITEL 7. INTEGRALRECHNUNG
Beispiele.
(a) Es soll das Integral
π
Z
sin(3x + π) dx
0
berechnet werden. Die Funktion f : R → R, welche durch f (x) := sin(3x + π) für
alle x ∈ R gegeben ist, kann hierbei als Integrand angesehen werden. Wie man leicht
erkennt, ist die Funktion F : R → R, welche durch F (x) := − cos(3x + π)/3 für alle
x ∈ R definiert ist, eine Stammfunktion von f . Es gilt nämlich F 0 = f . Nach dem
Fundamentalsatz der Analysis erhält man also
Z π
cos(3x + π) π
cos(3π + π)
cos(0 + π)
sin(3x + π) dx = −
=−
− −
3
3
3
0
x=0
1 1
cos(4π) cos(π)
=−
+
=− −
3
3
3 3
2
=− .
3
(b) Man betrachte das Integral
Z
1
3x2 − 1 dx.
−1
Der Integrand ist offenbar durch das Polynom f : R → R gegeben, welches durch
f (x) := 3x2 − 1 für alle x ∈ R definiert ist. Man rechnet leicht nach, dass das
Polynom F : R → R, welches durch F (x) = x3 − x für alle x ∈ R definiert ist, eine
Stammfunktion von f ist. Daher erhält man
1
Z 1
= 13 − 1 − (−1)3 − (−1) = 1 − 1 + 1 − 1 = 0
3x2 − 1 dx = x3 − x
−1
−1
nach dem Fundamentalsatz der Analysis.
♦
Es gibt bestimmte Klassen von Funktionen, für die man immer eine Stammfunktion angeben kann. Das bekannteste Beispiel für eine solche Klasse von Funktionen sind die Polynome. Für jedes Polynom f : R → R, welches durch
f (x) := a0 + a1 x + a2 x2 + · · · + an xn
für alle x ∈ R gegeben ist, ist nämlich das Polynom F : R → R, welches durch
a1
a2
an n+1
F (x) := a0 x + x2 + x3 + · · · +
x
2
3
n+1
für alle x ∈ R gegeben ist, eine Stammfunktion. Für Polynome existiert also eine Regel
für die Bildung von Stammfunktionen. In den nachfolgenden Beispielen werden weitere
Regeln für die Bildung von Stammfunktionen aufgeführt.
Beispiele.
(a) Für jede reelle Zahl α ∈ R\{−1} sei die Funktion pα : (0, ∞) → R durch pα (x) := xα
für alle x ∈ R definiert. Wie man leicht nachrechnet, ist für alle α ∈ R \ {−1} die
Funktion Pα : R → R, welche durch Pα (x) := xα+1 /(α + 1) für alle x ∈ R definiert
ist, eine Stammfunktion von pα . Nach dem Fundamentalsatz der Analysis gilt also
α+1 b
Z b
x
α
x dx =
α + 1 x=a
a
für alle a, b ∈ R mit 0 < a ≤ b.
7.3. BERECHNUNG VON INTEGRALEN
179
(b) Für jede positive Zahl α > 0 sei die Funktion fα : R → R durch fα (x) := αx für
alle x ∈ R definiert. Für alle α > 0 ist dann die Funktion Fα : R → R, welche durch
Fα (x) := αx / ln(α) für alle x ∈ R definiert ist, eine Stammfunktion von fα . Laut
Fundamentalsatz der Analysis gilt somit
b
Z
αx
α dx =
ln(α)
x
a
b
x=a
für alle a, b ∈ R mit a ≤ b. Insbesondere erhält man für den Fall, dass α = e gilt, die
Gleichung
Z b
h ib
ex dx = ex
x=a
a
für alle a, b ∈ R mit a ≤ b.
(c) Sei D ⊆ R eine nichtleere, offene Menge, und sei f ∈ C 1 (D) eine stetig differenzierbare Funktion, welche ausschließlich positive Funktionswerte besitzt. Die Funktion
g : D → R sei durch g(x) := f 0 (x)/f (x) für alle x ∈ D definiert. Dann ist die Funktion G : D → R, welche durch G(x) := ln(f (x)) für alle x ∈ R definiert ist, eine
Stammfunktion von g. Entsprechend gilt
Z
b
a
h
i b
f 0 (x)
dx = ln f (x)
f (x)
x=a
für alle a, b ∈ R mit a ≤ b und [a, b] ⊆ D. Wenn D = (0, ∞) und f (x) = x für alle
x ∈ D gilt, erhält man insbesondere
Z
a
b
h
ib
1
dx = ln x
x
x=a
für alle a, b ∈ R mit 0 < a ≤ b.
(d) Die Funktionen − cos und sin sind Stammfunktionen von sin bzw. cos.
♦
Für die Berechnung von Integralen über unbeschränkten Intervallen ist das nachfolgende
Lemma nützlich.
Lemma 7.10. Sei (a, b) ⊂ R ein nichtleeres, offenes Intervall, wobei auch a = −∞ oder
b = ∞ zugelassen sei. Seien außerdem f ∈ L1 ((a, b)) eine integrierbare Funktionen. Dann
gilt
Z b
Z z
Z b
f (x) dx = lim
f (x) dx = lim
f (x) dx.
z→b− a
a
z→a+ z
Aus Lemma 7.10 und dem Fundamentalsatz der Analysis kann man sehr leicht die folgende Aussage herleiten: Ist (a, b) ⊆ R ein offenes Intervall, und ist f ∈ L1 ((a, b)) eine
integrierbare Funktion, die eine Stammfunktion F : (a, b) → R besitzt. Dann gilt
Z
b
f (x) dx = lim F (x) − lim F (x).
a
x→b−
x→a+
Die Stammfunktion F muss also an denen Intervallgrenzen a und b nicht notwendigerweise
definiert sein. Sie muss dort lediglich einen Grenzwert besitzen. Diese Tatsache macht
180
KAPITEL 7. INTEGRALRECHNUNG
man sich insbesondere bei der Berechnung von Integralen über unbeschränkten Intervallen
zunutze. Es gilt nämlich
Z ∞
h
i∞
:= lim F (x) − F (a),
f (x) dx = f (x)
bzw.
Z
b
x→∞
a
a
h
i∞
f (x) dx = f (x)
:= F (b) − lim F (x),
x→∞−
−∞
−∞
sofern die die Funktion f auf dem Intervall [a, ∞) bzw. (−∞, b] definiert und integrierbar
ist. Man betrachte dazu die nachfolgenden Beispiele.
Beispiele.
(a) Das Integral
Z
∞
e−x dx
0
soll berechnet werden. Der Integrand ist offenbar durch die Funktion f : R → R
gegeben, welche durch f (x) := e−x für alle x ∈ R definiert ist. Die Funktion F : R →
R, welche durch F (x) := −ex für alle x ∈ R definiert ist, ist eine Stammfunktion
von f . Nach Lemma 7.10 erhält man
Z ∞
i∞
h
e−x dx = −e−x
= lim −e−x − −e0 = 0 + 1 = 1.
0
0
x→∞
√
(b) Wie man leicht erkennt, ist die Funktion f : (0, 1) → R, welche durch f (x) := 1/ x
für alle x ∈ (0, 1) definiert ist, nicht beschränkt. Sie ist aber dennoch integrierbar,
denn nach Lemma 7.10 gilt
Z
0
1
1
√ dx = lim
z→0+
x
Z
z
1
h √ i1
√
√
1
√ dx = lim 2 x = 2 1 − lim 2 z = 2.
z→0+
z→0+
x
z
(c) Es soll untersucht werden, ob die Funktion f : (1, ∞) → R, welche durch f (x) := 1/x
für alle x ∈ R definiert ist, integrierbar ist. Dies ist genau dann der Fall, wenn das
Integral von f über dem Definitionsbereich (1, ∞) endlich. Tatsächlich erhält man
aber
Z ∞
h
i∞
1
dx = ln(x)
= lim ln(x) − ln(1) = lim ln(x) − 0 = ∞.
x→∞
x→∞
x
1
1
Die Funktion f ist demnach nicht integrierbar.
♦
Als nächstes betrachten wir eine Integrationsmethode, die oft hilfreich ist, wenn der Integrand als Produkt zweier Funktionen darstellbar ist. Diese Methode wird die Methode der
partiellen Integration genannt. Die Grundlage für diese Methode liefert der folgende Satz.
Satz 7.11. Sei (a, b) ⊆ R ein nichtleeres, offenes Intervall, und seien u ∈ C 1 ((a, b)) und
v ∈ C 1 ((a, b)) zwei stetig differenzierbare Funktionen. Dann gilt
Z
a
b
h
ib
u0 (x)v(x) dx = u(x)v(x)
x=a
Z
−
a
b
u(x)v 0 (x) dx.
7.3. BERECHNUNG VON INTEGRALEN
181
Grundsätzlich ist es bei der Berechnung eines Integrals
Z b
f (x) dx
a
immer dann sinnvoll, die Methode der partiellen Integration anzuwenden, wenn sich der
Integrand f als Produkt zweier Funktionen w und v schreiben lässt, so dass w eine Stammfunktion W besitzt und die Ableitung v 0 von v einfacher“ ist als die Funktion v selbst.
”
Man erhält dann die Gleichung
Z b
Z b
Z b
h
ib
W (x)v 0 (x) dx,
w(x)v(x) dx = W (x)v(x)
−
f (x) dx =
a
x=a
a
a
v0
und hofft, dass man das Integral des Produkts von W und
explizit bestimmen kann.
Sollte dies nicht möglich sein, kann man erneut versuchen partiell zu integrieren. Es kann
auch vorkommen, dass die Methode der partiellen Integration eine Gleichung für das gesuchte Integral liefert, die man entsprechend lösen kann. In den nachfolgenden Beispielen
wird die Methode der partiellen Integration demonstriert.
Beispiele.
(a) Es soll das Integral
Z
1
ex x dx
0
bestimmt werden. Da sich der Integrand als Produkt zweier Funktionen darstellen
lässt, ist es nahe liegend die Methode der partiellen Integration anzuwenden. Definiert man die Funktionen u ∈ C 1 (R) und v ∈ C 1 (R) durch u(x) := ex und v(x) := x
für alle x ∈ R, so ist der Integrand gerade durch das Produkt von u0 und v gegeben.
Man erhält also
Z 1
Z 1
h
i1 Z 1
ex x dx =
u0 (x)v(x) dx = u(x)v(x) −
u(x)v 0 (x) dx
0
0
0
0
h
i1 h i1
h
i1 Z 1
ex · 1 dx = ex x − ex
= ex x −
0
0
0
0
= 1.
(b) Mit der Methode der partiellen Integration können auch Integrale der Form
Z b
ln(x) dx
a
mit a > 0 und b ≥ 0 bestimmt werden. Definiert man nämlich die Funktionen
u ∈ C 1 ([a, b]) und v ∈ C 1 ([a, b]) durch u(x) := x und v(x) := ln(x) für alle x ∈ [a, b],
so erhält man
Z b
Z b
Z b
h
ib Z b
0
ln(x) dx =
1 · ln(x) dx =
u (x)v(x) dx = u(x)v(x) −
u(x)v 0 (x) dx
a
a
a
a
a
h
ib Z b
h
ib h ib
= x ln(x) −
1 dx = x ln(x) − x
a
a
a
a
Insgesamt erhält man also
Z
a
b
h
ib
ln(x) dx = x(ln(x) − 1) .
a
182
KAPITEL 7. INTEGRALRECHNUNG
(c) In bestimmten Fällen kann man mit der Methode der partiellen Integration auch
eine Gleichung für ein Integral herleiten. Man betrachte etwa das Integral
2π
Z
sin(x) cos(x) dx.
0
Wir definieren zunächst die Funktionen u ∈ C 1 (R) und v ∈ C 1 (R) durch u(x) :=
− cos(x) und v(x) := cos(x) für alle x ∈ R. Es gilt dann
Z
0
2π
h
i2π Z 2π
u(x)v 0 (x) dx
−
u (x)v(x) dx = u(x)v(x)
sin(x) cos(x) dx =
0
0
0
h
i2π Z 2π
cos(x) sin(x) dx
−
= − cos(x) cos(x)
0
0
Z 2π
=−
sin(x) cos(x) dx.
Z
2π
0
0
Wie man sieht, liefert die Methode der partiellen Integration eine Gleichung von der
Form I = −I, wobei I das gesuchte Integral ist. Löst man diese Gleichung nach I
auf, so erhält man I = 0 und somit
Z
2π
sin(x) cos(x) dx = 0.
0
(d) Manchmal ist es notwendig, die Methode der partiellen Integration mehrfach anzuwenden, um ein Integral zu bestimmen. Dies ist beispielsweise beim Integral
Z π
cos(x)x2 dx
0
der Fall. Durch einmaliges partielles Integrieren erhält man
Z π
Z π
2
cos(x)x dx = −2
sin(x)x dx
0
0
Integriert man die rechte Seite der Gleichung erneut partiell, so erhält man
h
Z π
iπ Z π
2
cos(x)x dx = −2 − cos(x)x −
− cos(x) dx
0
0
0
h
iπ
h
iπ
= −2 − cos(x)x + 2 − sin(x)
0
0
= 2π cos(π)
= −2π
als Ergebnis.
♦
Am Ende dieses Abschnitts wollen wir uns noch mit der Berechnung von Integralen über
mehrdimensionalen Intervallen befassen. Dazu definieren wir zunächst die so genannten
mehrdimensionalen, abgeschlossenen Intervalle wie folgt.
7.3. BERECHNUNG VON INTEGRALEN
183
Definition (n-dimensionales, abgeschlossenes Intervall). Sei n ∈ N eine natürliche
Zahl, und seien a = (a1 , a2 , . . . , an )T ∈ Rn und b = (b1 , b2 , . . . , bn )T ∈ Rn zwei Vektoren.
Dann nennt man die Menge
[a, b] := [a1 , b1 ] × [a2 , b2 ] × · · · × [an , bn ]
= x = (x1 , x2 , . . . , xn )T ∈ Rn ai ≤ xi ≤ bi für alle i = 1, 2, . . . , n
ein n-dimensionales, offenes Intervall.
Für die Berechnung von Integralen über mehrdimensionalen Intervallen ist der folgende
Satz entscheidend, welcher als Satz von Fubini bekannt ist.
Satz 7.12 (Fubini). Sei n ∈ N eine natürliche Zahl, seien a = (a1 , a2 , . . . , an )T ∈ Rn
und b = (b1 , b2 , . . . , bn )T ∈ Rn zwei Vektoren, und sei f ∈ L1 ((a, b)) eine integrierbare
Funktion. Dann gilt
Z
Z
bπ(n)
Z
bπ(n−1)
Z
bπ(1)
···
f (x) dx =
aπ(n)
[a,b]
bπ(2)
Z
f (x) dxπ(1) dxπ(2) · · · dxπ(n−1) dxπ(n)
aπ(n−1)
aπ(2)
aπ(1)
für jede n-stellige Permutation π ∈ Sn .
Die Aussage des Satzes von Fubini kann man folgendermaßen zusammenfassen: Man berechnet das Integral einer Funktion mit vektorwertiger Variable, indem man nacheinander
nach jeder einzelnen Vektorkomponente integriert. Die Reihenfolge, in welcher man nach
den einzelnen Vektorkomponenten integriert, spielt dabei keine Rolle. Es gilt also insbesondere die Identität
Z bn Z bn−1 Z b2 Z b1
Z
···
f (x) dx =
f (x) dx1 dx2 · · · dxn−1 dxn ,
[a,b]
an
an−1
a2
a1
wobei die eindimensionalen Integrale von innen nach außen“ zu berechnen sind.
”
Natürlich gilt eine analoge Regel auch für Integrale von Funktionen, die von mehreren
reellwertigen Variablen abhängen. Seien etwa a, b, c, d ∈ R reelle Zahlen, und sei f : (a, b)×
(c, d) → R eine Funktion, deren Variablen mit x und y bezeichnet werden, so gilt
Z
dZ b
Z
f (x, y) d(x, y) =
[a,b]×[c,d]
Z bZ
f (x, y) dxdy =
c
a
d
f (x, y) dydx.
a
c
Die eindimensionalen Integrale werden wiederum falls möglich mit Hilfe des Fundamentalsatzes der Analysis, oder aber mit der Methode der partiellen Integration bestimmt. Bei
der Bestimmung von Stammfunktionen wird nur diejenige Variable berücksichtigt, nach
der jeweils integriert wird. Die Anwendung des Satzes von Fubini wird in den nachfolgenden Beispielen erläutert.
Beispiele.
(a) Das Integral
Z
[a,b]
2x1 x22 + 4x32 dx
184
KAPITEL 7. INTEGRALRECHNUNG
soll berechnet werden, wobei die Vektoren a ∈ R2 und b ∈ R2 durch a := (1, 2)T und
b := (3, 4)T gegeben seien. Nach dem Satz von Fubini gilt
Z
2x1 x22
+
4x32 dx
Z
4Z 2
=
3
[a,b]
Z
2x1 x22
+
4x32 dx1 dx2
Z 4h
i2
=
x21 x22 + 4x1 x32
x1 =1
3
1
dx2
4
22 x22 + 4 · 2x32 − 12 x22 + 4 · 1x32 dx2
=
3
Z
4
h
i4
3x22 + 4x32 dx2 = x32 + x42
=
x2 =3
3
= 43 + 4 4 − 33 + 3 4
= 212.
(b) Wir betrachten das Integral
Z
sin(x + y) d(x, y).
[−π,π]×[0,π]
Nach dem Satz von Fubini gilt
Z
Z πZ π
Z πh
iπ
sin(x + y) d(x, y) =
sin(x + y) dxdy =
− cos(x + y)
dy
x=−π
[−π,π]×[0,π]
0
−π
0
Z π
=
− cos(π + y) + cos(−π + y) dy
0
h
= − sin(π + y) + sin(−π + y)
iπ
y=0
= − sin(2π) + sin(0) − − sin(π) + sin(−π)
= 0.
Das Integral verschwindet also.
♦
Übungsaufgaben
1. Berechnen Sie die folgenden Integrale:
Z
1
Z
3
x − 5x dx,
−1
Z √
0
1
Z
2x
dx,
2
x +1
e−2x dx,
cos(πx + π/2) dx,
0
e−1
√
ln( 2)
Z
0
π/3
Z
tan(x) dx,
0
0
√
Z
2
2x3 − x2 dx,
1
7
√
3x
dx,
3x2 + 4
2. Untersuchen Sie, ob die folgenden Funktionen integrierbar sind:
f1 : [1, ∞) → R, x 7→ 1/x,
f2 : [1, ∞) → R, x 7→ 1/x2 ,
f3 : (0, 1] → R, x 7→ 1/x,
√
f4 : (0, 1] → R, x 7→ 1/ 3 x.
Z
0
1/2
x
dx.
2x + 1
7.3. BERECHNUNG VON INTEGRALEN
185
3. Berechnen Sie die folgenden Integrale mit der Methode der partiellen Integration:
Z
π/2
Z
x sin(x) dx,
0
2
Z
x ln(x) dx,
1
2 −x
x e
1
0
Z
2π
dx,
sin2 (x) dx.
0
4. Zeigen Sie mittels vollständiger Induktion, sowie der Methode der partiellen Integration, dass
die Gleichung
Z ∞
n!
xn e−αx dx = n+1
α
0
für alle positiven Zahlen α > 0 und alle natürlichen Zahlen n ∈ N gilt.
5. Berechnen Sie die folgenden Integrale:
Z
2 − x2 − y 2 d(x, y),
[−1,1]×[−1,1]
Z
4x3 y − y d(x, y),
[−1,1]×[0,2]
Z
sin(x) sin(y) d(x, y),
[0,π]×[0,π]
Z
x(1 − x)(y − 1)(y − 2) d(x, y).
[0,1]×[1,2]
186
7.4
KAPITEL 7. INTEGRALRECHNUNG
Der Transformationssatz
Bisher haben wir lediglich Methoden für die Berechnung von Integralen über eindimensionalen und mehrdimensionalen Intervallen kennen gelernt. In diesem Abschnitt wenden wir
uns der Berechnung von Integralen über allgemeineren Mengen zu. Das wichtigste Hilfsmittel ist hierbei der so genannte Transformationssatz. Um diesen formulieren zu können,
führen wir zunächst den Begriff des Diffeomorphismus ein.
Definition (Diffeomorphismus). Sei n ∈ N eine natürliche Zahl, und seien D ⊆ Rn und
E ⊆ Rn zwei nichtleere Mengen. Eine Funktion f : D → E wird ein Diffeomorphismus von
D nach E genannt, wenn f bijektiv ist, und wenn sowohl f als auch die Umkehrabbildung
f −1 : E → D stetig differenzierbar sind.
Nachfolgend geben wir einige wichtige Beispiele für Diffeomorphismen an.
Beispiele.
(a) Seien [a, b] ⊂ R und [c, d] ⊂ R zwei nichtleere, beschränkte Intervalle. Dann ist die
Funktion g : [a, b] → [c, d], welche durch
g(x) :=
d−c
(x − a) + c
b−a
für alle x ∈ [a, b] definiert ist, ein Diffeomorphismus von [a, b] nach [c, d]. Die Umkehrabbildung g −1 : [c, d] → [a, b] ist durch
g −1 (x) =
b−a
(x − c) + a
d−c
für alle x ∈ [c, d] gegeben.
(b) Die Menge P ⊆ R2 sei durch P := ((0, ∞) × (−π, π]) ∪ {0} gegeben. Ferner sei die
Funktion g : I → R2 durch
x1 cos(x2 )
g(x) :=
x1 sin(x2 )
für alle x = (x1 , x2 )T ∈ I definiert. Man kann zeigen, dass g bijektiv ist, und dass
die entsprechende Umkehrabbildung g −1 : R2 → P durch
2
x1 + x22
−1
g (x) =
Φ(x1 , x2 )
für alle x = (x1 , x2 )T ∈ B1 (0) gegeben ist. Die Funktion Φ : R × R → R ist hierbei
durch


arctan(x2 /x1 )
falls x1 > 0,



arctan(x /x ) + π falls x < 0, x ≥ 0,
2
1
1
2
Φ(x1 , x2 ) :=

arctan(x2 /x1 ) − π falls x1 < 0, x2 < 0,



sgn(x )π/2
sonst
2
für alle x1 ∈ R und alle x2 ∈ R definiert. Die Funktionen g und g −1 sind beide stetig
differenzierbar, weshalb g ein Diffeomorphismus ist.
Die Funktion g spielt in verschiedenen Anwendungen eine wichtige Rolle. Sie realisiert nämlich die Koordinatentransformation von Polarkoordinaten in kartesische
Koordinaten. Die Umkehrabbildung realisiert entsprechend die Rücktransformation
von kartesischen Koordinaten in Polarkoordinaten.
7.4. DER TRANSFORMATIONSSATZ
187
(c) Sei n ∈ N eine natürliche Zahl, sei A ∈ Rn×n eine reguläre (d.h. invertierbare) Matrix,
und sei b ∈ Rn ein beliebiger Vektor. Dann ist die affine Abbildung g : Rn → Rn ,
welche durch
g(x) := Ax + b
für alle x ∈ Rn bestimmt ist, ein Diffeomorphismus von Rn nach Rn . Die Umkehrabbildung g −1 : Rn → Rn ist durch
g −1 (x) = A−1 x − A−1 b
für alle x ∈ Rn gegeben. Die Jacobi–Matrizen beider Abbildungen sind durch g 0 (x) =
A bzw. (g −1 )0 (x) = A−1 für alle x ∈ Rn gegeben.
♦
Wie im Beispiel (b) bereits angedeutet wurde, treten Diffeomorphismen häufig bei so genannten Koordinatentransformationen auf. In zwei Raumdimensionen kann man die Lage
eines Punktes beispielsweise mit dem kartesischen Koordinatensystem durch Angabe zweier Zahlen x ∈ R und y ∈ R definieren. Diese beiden Zahlen bestimmen die horizontale und
die vertikale Position des Punktes relativ zum Ursprung des Koordinatensystems. Eine
weitere Möglichkeit die Lage des Punktes zu definieren besteht in der Verwendung des so
genannten Polarkoordinatensystems. Im Polarkoordinatensystem wird die Lage des Punktes durch zwei Zahlen r ≥ 0 und ϕ ∈ (−π, π] definiert, wobei r den Abstand des Punktes
zum Ursprung angibt, und ϕ den Winkel zwischen der x-Achse und der Verbindungsstrecke zwischen dem Punkt und dem Ursprung (siehe Abbdilung ??). Die Umrechnung
zwischen kartesischen Koordinaten und Polarkoordinaten erfolgt mittels dem im Beispiel
(b) definierten Diffeomorphismus g gemäß g((r, ϕ)T ) = (x, y)T bzw. g −1 ((x, y)T ) = (r, ϕ)T .
Im folgenden soll noch auf eine weitere Aufgabe von Diffeomorphismen eingegangen
werden. Definiert man die Menge I ⊆ R2 durch I := ((0, 1) × (−π, π]) ∪ {0}), und die
Funktion g : I → B1 (0) durch
g(x) :=
x1 cos(x2 )
x1 sin(x2 )
für alle x ∈ R2 , so ist g ein Diffeomorphismus von I nach B1 (0), wobei B1 (0) die offene Einheitskugel in R2 bezüglich der euklidischen Norm bezeichnet. Die Einheitskugel kann also
als das Bild der Menge I unter dem Diffeomorphismus g charakterisiert werden. Die Menge
I ist dabei im wesentlichen ein zweidimensionales Intervall. Wir erinnern uns, dass Integrale über mehrdimensionalen Intervallen mit Hilfe des Satzes von Fubini (siehe Satz 7.12)
berechnet werden können. Die Frage ist, ob man den Diffeomorphismus g dazu verwenden
kann, Integrale über der Einheitskugel B1 (0) zu berechnen. Die Antwort darauf lautet:
Ja. Man muss dazu lediglich den folgenden Satz anwenden, der als Transformationssatz
bekannt ist.
Satz 7.13 (Transformationssatz). Sei n ∈ N eine natürliche Zahl, seien D ⊆ Rn und
E ⊆ Rn zwei nichtleere, offene Mengen, und sei g : D → E ein Diffeomorphismus von D
nach E. Sei ferner f ∈ L1 (E) eine integrierbare Funktion. Dann gilt
Z
Z
f (x) dx =
(f ◦ g)(x)|det g 0 (x)| dx.
E
D
Hierbei bezeichnet g 0 die Jacobi–Matrix von g.
188
KAPITEL 7. INTEGRALRECHNUNG
Der Transformationssatz wird in der Regel wie folgt angewendet: Gesucht sei das Integral einer Funktion f über einer Menge E, die kein mehrdimensionales Intervall ist.
Man überlegt sich dann, ob ein Intervall I und ein Diffeomorphismus g existiert, so dass
E = g(I) gilt. Wenn ja, kann das Integral von f über E gemäß dem Transformationssatz als Integral der Funktion h über I berechnet werden, wobei die Funktion h durch
h(x) := (f ◦ g)(x)|det g 0 (x)| für alle x ∈ I definiert ist. Dieses Vorgehen wird noch einmal
in den nachfolgenden zwei Beispielen demonstriert.
Beispiele.
(a) Es soll das Integral
Z
x1 + 1 dx
B1 (0)
berechnet werden, wobei B1 (0) die offene Einheitskugel in R2 bezüglich der euklidischen Norm bezeichnet. Der Integrand ist hierbei durch die Funktion f : R2 → R
gegeben, welche durch f (x) := x1 + 1 für alle x = (x1 , x2 )T ∈ R2 definiert ist. Sei
I := ((0, 1) × (−π, π]) ∪ {0}. Wir wissen bereits, dass die Funktion g : I → B1 (0),
welche durch
x1 cos(x2 )
g(x) :=
x1 sin(x2 )
für alle x = (x1 , x2 )T ∈ R2 definiert ist, ein Diffeomorphismus von I nach B1 (0) ist.
Man rechnet außerdem leicht nach, dass
|det g 0 (x)| = x1
für alle x = (x1 , x2 )T ∈ R2 gilt. Nach dem Transformationssatz erhält man also
Z
Z
Z
x1 + 1 dx =
f (x) dx = (f ◦ g)(x)|det g 0 (x)| dx
B1 (0)
B1 (0)
Z
=
I
x21 cos(x2 )
I
Z
1Z π
+ x1 dx =
0
−π
x21 cos(x2 ) + x1 dx2 dx1
Z 1h
Z 1
iπ
2
=
x1 sin(x2 ) + x1 x2
dx1 =
2πx1 dx1
x2 =−π
0
0
h
i1
= πx21
x1 =0
= π.
(b) Es soll das Integral
Z
x21 − 2x2 dx,
P
berechnet werden. Die Menge P := {α1 p(1) + α2 p(2) | α1 , α2 ∈ [0, 1]} ist dabei das
von den Vektoren u(1) := (3, 0)T und u(2) := (1, 1)T aufgespannte Parallelogramm.
Der Integrand ist durch die Funktion f : R2 → R gegeben, welche durch f (x) :=
x21 − 2x2 für alle x = (x1 , x2 )T ∈ R2 definiert ist. Man erkennt leicht, dass P das
Bild des Einheitsquadrats [0, 1]2 ⊂ R2 unter dem Diffeomorphismus g : [0, 1]2 → P
ist, welcher durch
3 1
α1
g(α) :=
0 1
α2
7.4. DER TRANSFORMATIONSSATZ
189
für alle α = (α1 , α2 )T ∈ [0, 1]2 definiert ist. Ferner gilt
|det g 0 (α)| = 3
für alle α ∈ (0, 1)2 . Man erhält also
Z
Z
Z
2
(f ◦ g)(α)|det g 0 (α)| dα
f (x) dx =
x1 − 2x2 dx =
2
(0,1)
P
P
Z
3(2α1 + α2 )2 − 6α2 dα
=
(0,1)2
1Z 1
Z
=
0
12α12 + 12α1 α2 + 3α22 − 6α2 dα1 dα2
0
Z 1h
i1
=
dα2
4α13 + 6α12 α2 + 3α1 α22 − 6α1 α2
α1 =0
0
Z 1
=
4 + 12α2 + 3α22 dα2
0
h
i1
= 4α2 + 6α22 + α23
0
= 11
nach dem Transformationssatz.
♦
Wird der Transformationssatz auf Integrale über eindimensionalen Intervallen angewendet,
so ergeben sich gewisse Vereinfachungen. Man erhält dann die so genannte Substitutionsregel für Integrale.
Satz 7.14. Seien a ∈ R und b ∈ R zwei reelle Zahlen mit a ≤ b, sei I ⊆ R ein Intervall,
sei g : I → [a, b] ein Diffeomorphismus, und sei f ∈ L1 ((a, b)) eine integrierbare Funktion.
Dann gilt
Z b
Z g−1 (b)
f (x) dx =
(f ◦ g)(x) g 0 (x) dx.
g −1 (a)
a
Hierbei bezeichnet g 0 die erste Ableitung von g.
Die Substitutionsregel kann bei der Berechnung bestimmter Integrale hilfreich sein, wie
die nachfolgenden Beispiele zeigen.
Beispiele.
(a) Das Integral
Z
π2
sin
√ x dx
0
√
soll berechnet werden. Offenbar bereitet dabei vor allem der Ausdruck xp
Schwierigkeiten. Es ist daher sinnvoll, einen Diffeomorphismus g zu finden, so dass g(x) = x
gilt. Ein solcher Diffeomorphismus g : [0, π] → [0, π 2 ] ist durch g(x) := x2 für alle
x ∈ [0, π] gegeben. Die entsprechende Umkehrabbildung g −1 : [0, π 2 ] → [0, π] ist
√
durch g −1 (x) := x für alle x ∈ [0, π 2 ] definiert. Gemäß Substitutionsregel (siehe
Satz 7.14) erhält man
Z π2
Z g−1 (π2 )
Z π
p
0
√ sin x dx =
sin g(x) g (x) dx =
2x sin(x) dx.
0
g −1 (0)
0
190
KAPITEL 7. INTEGRALRECHNUNG
Das Integral auf der rechten Seite kann mit Hilfe der Methode der partiellen Integration bestimmt werden. Man erhält
Z π2
√
sin( x) dx = 2π.
0
(b) Wir betrachten das Integral
Z
1p
1 − x2 dx.
0
Definiert man den Diffeomorphismus g : [0, π/2] → [0, 1] durch g(x) := sin(x) für alle
x ∈ [0, π/2], so erhält man gemäß Substitutionsregel (siehe Satz 7.14) die Gleichung
Z π/2 p
Z π/2 p
Z 1p
2
2
1 + x dx =
1 − (sin(x)) cos(x) dx =
(cos(x))2 cos(x) dx
0
0
Z
=
0
π/2
(cos(x))2 dx.
0
Hierbei wurde das Additionstheorem für die Sinus- und die Cosinusfunktion verwendet, welches besagt, dass für alle x ∈ R die Identität (sin(x))2 + (cos(x))2 = 1 gilt.
Das Integral über die quadrierte Cosinusfunktion kann mit Hilfe der Methode der
partiellen Integration berechnet werden. Als Ergebnis erhält man
Z 1p
π
1 + x2 dx = .
4
0
(c) Für a, b ∈ R mit a ≤ b soll das Integral
Z b
a
1
dx
1 + x2
bestimmt werden. Die Tangensfunktion tan : (−π/2, π/2) → R ist bekanntlich streng
monoton wachsend und stetig differenzierbar, wobei tan0 = 1 + tan2 gilt. Ferner
ist sie ein Diffeomorphismus von (−π/2, π/2) nach R, wobei die Umkehrabbildung
durch die Arcustangensfunktion arctan : R → (−π/2, π/2) gegeben ist. Nach der
Substitutionsregel erhält man daher
Z b
Z arctan(b)
Z arctan(b)
1
tan0 (x)
dx =
dx =
1 dx
2
2
a 1+x
arctan(a) 1 + (tan(x))
arctan(a)
= arctan(b) − arctan(a).
Offenbar ist das gesuchte Integral also durch
Z b
h
ib
1
dx
=
arctan(x)
2
x=a
a 1+x
gegeben.
♦
Bei der Anwendung der Substitutionsregel ist es nicht immer offensichtlich, wie der Diffeomorphismus g gewählt werden muss, damit das resultierende Integral explizit berechnet
werden kann. Eine Standardvorgehensweise besteht darin, im Integranden einen Ausdruck
auszuwählen, den man gerne durch die Integrationsvariable ersetzen möchte. Diesen Ausdruck nutzt man zu Definition von g −1 und wendet damit die Substitutionsregel an. Diese
Vorgehensweise wurde auch im zuvor genannten Beispiel (a) gewählt.
7.4. DER TRANSFORMATIONSSATZ
191
Übungsaufgaben
1. Berechnen Sie mit Hilfe des Transformationssatzes die folgenden Integrale:
Z
Z
q
2
2
1 − x1 − x2 dx,
cos π x21 + x22 dx,
B (0)
B (0)
Z 1
Z 1
2
2
e−x1 −x2 dx,
2 − x2 dx.
R2
P
Hierbei bezeichnet B1 (0) die offene Einheitskugel in R2 , und
P := α1 u(1) + α2 u(2) α1 , α2 ∈ [0, 1]
das von den Vektoren u(1) := (1, 1)T und u(2) = (−1, 1)T aufgespannte Parallelogramm.
2. Berechnen Sie die folgenden Integrale:
Z
0
π 2 /4
√ cos x dx,
Z
√
3
π
x5 sin(x3 ) dx,
0
Verwenden Sie dazu die Substitutionsregel.
Z
0
1
1
√ dx,
1+ x
Z
1 √
e
0
2x
dx.
Lernzielkontrolle
Nach dem Durcharbeiten dieses Kapitels sollten Sie ...
... wissen, dass man das Volumen bestimmter Teilmengen des Rn durch das n-dimensionalen
Lebesgue–Maßes definiert.
... wissen, dass nur den Lebesgue–messbaren Teilmengen des Rn in sinnvoller Weise ein
Volumen zugeordnet werden kann.
... wissen, dass alle Intervalle, alle offenen Mengen und alle abgeschlossenen Mengen
Lebesgue–messbar sind.
... wissen, wie das Lebesgue–Maß eines n-dimensionalen Intervalls definiert ist.
... wissen, was eine Lebesgue–Nullmenge ist.
... wissen, was die Formulierung fast überall“ bedeutet.
”
... wissen, was die charakteristische Funktion einer Teilmenge des Rn ist.
... wissen, was eine Lebesgue–messbare Funktion, und was eine Lebesgue–integrierbare
Funktion ist.
... wissen, dass jede stetige Funktion Lebesgue–messbar ist.
... den Fundamentalsatz der Analysis kennen und anwenden können.
... die Methode der partiellen Integration anwenden können.
... Integrale über mehrdimensionalen Intervallen berechnen können.
... den Transformationssatz und die Substitutionsregel kennen.
192
Anhang A
Wichtige Resultate
Wichtige Gleichungen und Ungleichungen
Dreiecksungleichung: Für jede Norm k · k gilt
kx + yk ≤ kxk + kyk
(siehe Seite 8)
Umgekehrte Dreiecksungleichung: Für jede Norm k · k gilt
kxk − kyk ≤ kx − yk
(siehe Seite 12)
Orthogonalentwicklung: Für jede Orthonormalbasis {q1 , q2 , . . . , qn } gilt
x = hx , q1 iq1 + hx , q2 iq2 + · · · + hx , qn iqn
(siehe Seite 22)
Konvergenzverhalten wichtiger Folgen
α
= 0, α, β ∈ R
n→∞ n + β
n+α
lim
= 1, α, β ∈ R
n→∞ n + β
√
lim n n = 1
n→∞
√
n
lim n! = ∞
n→∞
x n
lim 1 +
= ex , x ∈ R
n→∞
n


=0
falls



= 1
falls
lim q n
n→∞

=∞
falls



existiert nicht falls
lim
(siehe Seite 47)
(siehe Seite 48)
(siehe Seite 48)
(siehe Seite 94)
(siehe Seite 73)
|q| < 1,
q = 1,
q > 1,
q ≤ −1
(siehe Seite 48)
193
194
ANHANG A. WICHTIGE RESULTATE
Konvergenzverhalten wichtiger Reihen
(
∞
X
konvergiert falls α > 1,
1
1
1
1
= 1 + α + α + α + ···
nα
2
3
4
=∞
falls α ≤ 1
n=1
(siehe Seite 82)
∞
X
1
1
1
1
= 1 + + + + ··· = e
n!
1! 2! 3!
(siehe Seite 76)
n=0
Harmonische Reihe:
∞
X
1
1 1 1
= 1 + + + + ··· = ∞
n
2 3 4
(siehe Seite 79)
n=1
Alternierende harmonische Reihe:
∞
X
(−1)n+1
=1−
n
n=1
1 1 1
+ − ± · · · = ln(2)
2 3 4
(siehe Seite 76)
Geometrische Reihe:
1
falls |q| < 1,
1−q
n
2
3
q = 1 + q + q + q + ··· = ∞
falls q ≥ 1,


n=0

divergiert falls q ≤ −1



=
∞
X
(siehe Seite 77)
Wichtige Potenzreihen
ex =
∞
X
xn
n=0
sin(x) =
cos(x) =
n!
=1+x+
x2 x3
+
+ ···
2!
3!
(siehe Seite 94)
∞
X
(−1)n
x3 x5 x7
x2n+1 = x −
+
−
± ···
(2n + 1)!
3!
5!
7!
(siehe Seite 96)
(−1)n 2n
x2 x4 x6
x =1−
+
−
± ···
(2n)!
2!
4!
6!
(siehe Seite 96)
n=0
∞
X
n=0
Wichtige Funktionsgrenzwerte
sin(x)
= 1,
x→0
x
lim
lim xn e−x = 0,
x→∞
lim x ln(x) = 0
x→0+
lim
x→0+
ln(x)
= −∞
x
(siehe Seite 101)
n ∈ N0
(siehe Seite 104)
(siehe Seite 128)
(siehe Seite 129)
195
Wichtige Aussagen über stetige Funktionen
f ist an der Stelle x0 stetig ⇐⇒ f (x0 ) = lim f (x).
(siehe Seite 105)
Zwischenwertsatz
(siehe Seite 111)
Nullstellensatz von Bolzano
(siehe Seite 112)
Satz vom Minimum und Maximum
(siehe Seite 114)
D ∈ L(Rn ) und f ∈ C(D) =⇒ f ist Lebesgue–messbar.
(siehe Seite 171)
x→x0
Wichtige Aussagen über differenzierbare Funktionen
f ist an der Stelle x0 differenzierbar =⇒ f ist an der Stelle x0 stetig.
(siehe Seite 122)
Satz von Rolle
(siehe Seite 127)
Mittelwertsatz
(siehe Seite 127)
Wichtige Ableitungen
f (x) = xα ,
f 0 (x) = αxα−1 ,
α∈R
(siehe Seite 125)
f (x) = αx ,
f 0 (x) = ln(α)αx ,
α>0
(siehe Seite 125)
f (x) = ln(x),
f 0 (x) =
f (x) = sin(x),
f 0 (x) = cos(x),
(siehe Seite 125)
f (x) = cos(x),
f 0 (x) = − sin(x),
(siehe Seite 125)
1
,
x
(siehe Seite 125)
Ableitungsregeln
Summenregel: (f + g)0 = f 0 + g 0
Regel des konstanten Faktors: (αf )0 = αf 0 ,
Produktregel: (f g)0 = f 0 g + f g 0
0
f 0g − f g0
f
Quotientenregel:
=
g
g2
(siehe Seite 123)
α∈R
(siehe Seite 123)
(siehe Seite 123)
(siehe Seite 123)
196
ANHANG A. WICHTIGE RESULTATE
Kettenregel: (f ◦ g)0 = (f 0 ◦ g)g 0
(siehe Seite 124)
Wichtige Stammfunktionen
f (x) = xα ,
f (x) = αx ,
xα+1
+ c,
α+1
αx
F (x) =
+ c,
ln(α)
F (x) =
α ∈ R \ {−1}, c ∈ R
(siehe Seite 178)
α > 0, c ∈ R
(siehe Seite 179)
f (x) = ln(x),
F (x) = x(ln(x) − 1) + c,
c∈R
(siehe Seite 181)
f (x) = sin(x),
F (x) = − cos(x) + c,
c∈R
(siehe Seite 179)
f (x) = cos(x),
F (x) = sin(x) + c,
c∈R
(siehe Seite 179)
F (x) = arctan(x) + c,
c∈R
(siehe Seite 190)
F (x) = ln(|g(x)|) + c,
c∈R
(siehe Seite 179)
1
,
1 + x2
g 0 (x)
f (x) =
,
g(x)
f (x) =
Integrationsregeln
Summenregel:
Z
Z
Z
f (x) + g(x) dx =
f (x) dx +
g(x) dx
Ω
Ω
Regel des konstanten Faktors:
Z
Z
αf (x) dx = α f (x) dx,
Ω
(siehe Seite 174)
Ω
α∈R
(siehe Seite 174)
Ω
Additivität:
Z
Z
Z
f (x) dx =
f (x) dx +
f (x) dx
A∪B
A
falls A ∩ B = ∅
(siehe Seite 174)
B
Integrale über Nullmengen:
Z
f (x) dx = 0 falls meas(N ) = 0
(siehe Seite 174)
N
Vertauschen der Integrationsgrenzen:
Z
a
Z
f (x) dx = −
b
b
f (x) dx,
a
(siehe Seite 175)
197
Methode der partiellen Integration:
Z
b
Z
ib
u (x)v(x) dx = u(x)v(x)
h
0
x=a
a
b
−
u(x)v 0 (x) dx
(siehe Seite 180)
a
Satz von Fubini:
Z bZ
Z
a
[a,b]×[c,d]
d
Z
dZ b
f (x, y) dxdy
f (x, y) dy dx =
f (x, y) d(x, y) =
c
c
(siehe Seite 183)
a
Transformationssatz: Für jeden Diffeomorphismus g : D → E gilt
Z
Z
(f ◦ g)(x)|det g 0 (x)|dx
f (x) dx =
(siehe Seite 187)
D
E
Substitutionsregel: Für jeden Diffeomorphismus g : I → [a, b] gilt
Z
b
Z
g −1 (b)
f (x) dx =
a
(f ◦ g)(x)g 0 (x)dx
(siehe Seite 187)
g −1 (a)
Weitere wichtige Resultate
Satz des Pythagoras
(siehe Seite 20)
Satz von Heine–Borel
(siehe Seite 63)
Satz von Taylor
(siehe Seite 136)
Satz von Schwarz
(siehe Seite 145)
Symbolverzeichnis
N
Menge der natürlichen Zahlen, 4
N0
Menge der natürlichen Zahlen mit Null, 4
Z
Menge der ganzen Zahlen, 4
Q
Menge der rationalen Zahlen, 4
R
Menge der reellen Zahlen, 4
C
Menge der komplexen Zahlen, 4
K
Platzhalter für R oder C, 4
Rn×n
sym
Menge aller symmetrischen Matrizen in Rn×n , 25
XN
Menge aller Folgen in X, 30
B(X, W )
Menge aller beschränkten Funktionen von X nach W , 61
C(D, W )
Menge aller stetigen Funktionen von D nach W , 105
C k (D, W )
Menge aller k-mal stetig (partiell) differenzierbaren Funktionen von D
nach W , 132
C ∞ (D, W )
Menge aller glatten Funktionen von D nach W , 132
E(D)
Menge aller einfachen Funktionen von D nach R, 169
L1 (D)
Menge aller Lebesgue–integrierbaren Funktionen von D nach R, 172
Lin(Rn , Rm )
Menge aller Linearen Abbildungen von Rn nach Rm , 154
k·k
Allgemeine Norm, 8
|·|
Betragsfunktion, euklidische Norm oder Standardnorm, 9
k · k1
Betragssummennorm, 9
k · k∞
Maximumnorm, 9
Br (v)
Offene Kugel mit Mittelpunkt v und Radius r, 11
Br (v)
Abgeschlossene Kugel mit Mittelpunkt v und Radius r, 11
Sr (v)
Sphäre mit Mittelpunkt v und Radius r, 12
h· , ·i
Allgemeines Skalarprodukt, 14
198
199
·
Multiplikation oder euklidisches Skalarprodukt, 14
∠(v, w)
Winkel zwischen den Vektoren v und w, 18
inf M
Infimum der Menge M , 37
max M
Maximum der Menge M , 38
min M
Minimum der Menge M , 38
sup M
Supremum der Menge M , 37
lim vn
Grenzwert einer Folge (vn )n∈N , 47
lim f (x)
Grenzwert einer Funktion f in x0 , 99
n→∞
x→x0
lim f (x)
Linksseitiger Grenzwert einer Funktion f in x0 , 102
lim f (x)
Rechtsseitiger Grenzwert einer Funktion f in x0 , 102
x→x0 −
x→x0 +
M◦
Inneres der Menge M , 53
∂M
Rand der Menge M , 53
M
Abschluss der Menge M , 54
f 0 (x0 )
Ableitung von f an der Stelle x0 , 119
f (k) (x0 )
k-te Ableitung von f an der Stelle x0 , 132
∂k f x(0)
∂f
(x0 , y0 , . . . )
∂x
∇f x(0)
∇2 f x(0)
Df x(0)
f 0 x(0)
Z
f (x) dx
Ω
Partielle Ableitung von f nach der k-ten Koordinate an der Stelle x(0) ,
139
Partielle Ableitung von f nach der Variable x an der Stelle x = x0 , y =
y0 , . . . , 141
Gradient von f an der Stelle x(0) , 147
Hesse–Matrix von f an der Stelle x(0) , 149
Totale Ableitung von f an der Stelle x(0) , 154
Jacobi–Matrix von f an der Stelle x(0) , 155
Lebesgue–Integral von f über Ω, 172
Index
ableiten, 119
Ableitung, 119
partielle, 139
partielle der Ordnung k, 142
totale, 154
Abrundungsfunktion, 40
Abschluss, 54
Abstand, 10
Addition, 6
Äquivalenzklasse, 7
Äquivalenzrelation, 7
Algebra, 34
Banach–Algebra, 66
normierte, 35
Approximationsfehler, 136
Aufrundungsfunktion, 40
Axiom
Vollständigkeitsaxiom, 38
Einsnorm, 9
Element
inverses, 6
neutrales, 6
Entwicklungsstelle
einer Potenzreihe, 93
Eulersche Zahl, 72
Exponentialfunktion, 94
Extremalstelle
lokale, 148
Extremum
lokales, 148
Faktormenge, 7
Familie, 32
fast überall, 167
Folge, 30
beschränkte, 60
bestimmt divergente, 50
Cauchy–Folge, 65
divergente, 47
explizit definierte, 31
gegen −∞ bestimmt divergente, 50
gegen ∞ bestimmt divergente, 50
konvergente, 47
monoton fallende, 44
monoton konvergente, 71
monoton wachsende, 44
nach oben beschränkte, 41
nach unten beschränkte, 41
Nullfolge, 47
rekursiv definierte, 31
streng monoton fallende, 45
streng monoton wachsende, 44
Folgenkriterium
für Abgeschlossenheit, 57
für Kompaktheit, 63
für Stetigkeit, 107
Formel
Eulersche, 97
Fundamentalsatz
Banach–Algebra, 66
Banach–Raum, 65
Basis, 6
Betrag, 4
Betragsfunktion, 4
Betragssummennorm, 9
Bild
einer linearen Funktion, 7
Cauchy–Folge, 65
Cauchy–Kriterium, 70
Cosinusfunktion, 96
hyperbolische, 96
Diffeomorphismus, 186
Dimension, 6
Dirichlet–Funktion, 167
Dreiecksungleichung, 8
für absolut konvergente Reihen, 83
umgekehrte, 12
Einheitskugel, 12
Einheitssphäre, 12
200
INDEX
der Analysis, 177
Funktion
k-mal differenzierbare, 132
k-mal partiell differenzierbare, 143
k-mal stetig differenzierbare, 132
k-mal stetig partiell differenzierbare,
143
Abrundungsfunktion, 40
Aufrundungsfunktion, 40
beschränkte, 61
Betragsfunktion, 4
charakteristische, 168
Cosinus, 96
Cosinus Hyperbolicus, 96
differenzierbare, 119
Dirichlet–Funktion, 167
einfache, 169
Exponentialfunktion, 94
glatte, 132
Heaviside–Funktion, 102
Lebesgue–integrierbare, 172
Lebesgue–messbare, 171
lineare, 7
Logarithmus, 97
monoton fallende, 44
monoton wachsende, 44
nach oben beschränkte, 40
nach unten beschränkte, 40
partiell differenzierbare, 139
Signumfunktion, 4
Sinus, 96
Sinus Cardinalis, 106
Sinus Hyperbolicus, 96
Stammfunktion, 177
stetig differenzierbare, 131
stetig partiell differenzierbare, 142
stetige, 105
streng monoton fallende, 44
streng monoton wachsende, 44
total differenzierbare, 154
vektorwertige, 5
Funktional, 23
Funktionenfolge
divergente, 88
gleichmäßig konvergente, 90
punktweise konvergente, 87
Ganzteil, 40
Gauß–Klammer, 40
Gleichung
201
Parallelogrammgleichung, 18
Parsevalsche, 22
Gradient, 147
Grenzfunktion, 87
Grenzwert
einer Folge, 47
einer Funktion, 99
einer Reihe, 76
gegen −∞, 103
gegen ∞, 103
linksseitiger, 102
rechtsseitiger, 102
Gruppe, 6
Hauptminor, 26
Heaviside–Funktion, 102
Hesse–Matrix, 149
Hilbert–Raum, 65
Hülle
abgeschlossene, 54
Infimum
einer Folge, 41
einer Funktion, 40
einer Menge, 37
Innenproduktraum, 15
Inneres, 53
Integrand, 177
Integration
partielle, 180
Intervall, 4
n-dimensionales, abgeschlossenes, 183
n-dimensionales, rechtsoffenes, 160
abgeschlossenes, 5
offenes, 5
Jacobi–Matrix, 155
Kern
einer linearen Funktion, 7
Kettenregel, 124
Koeffizient
einer Potenzreihe, 93
Körper, 6
Komponente
einer Matrix, 5
einer vektorwertigen Funktion, 5
eines Vektors, 5
Konvergenzbereich, 88
Konvergenzkriterium
Cauchy–Kriterium, 70
202
Leibniz–Kriterium, 79
Majorantenkriterium, 83
Monotoniekriterium, 71
Quotientenkriterium, 85
Wurzelkriterium, 84
Konvergenzradius
einer Potenzreihe, 95
Konvergenzverhalten, 48
Koordinatentransformation, 186
Kugel
abgeschlossene, 11
offene, 11
Lebesgue–fast überall, 167
Lebesgue–Integral
des Negativteils, 172
des Positivteils, 172
einer nichtnegativen, einfachen Funktion, 169
Lebesgue–Maß
äußeres, 161
Lebesgue–Nullmenge, 162
Leibniz–Kriterium, 79
linear abhängig, 6
linear unabhängig, 6
Linearisierung
einer Funktion, 121
Logarithmusfunktion, 97
Majorante, 83
Majorantenkriterium, 83
Matrix, 5
Hesse–Matrix, 149
Jacobi–Matrix, 155
negativ definite, 26
positiv definite, 26
symmetrische, 25
Maximalstelle
lokale, 148
Maximierer, 41
Maximum
einer Folge, 42
einer Funktion, 41
einer Menge, 38
lokales, 148
Maximumnorm, 9
Menge
abgeschlossene, 56
beschränkte, 59
kompakte, 62
INDEX
Lebesgue–messbare, 163
nach oben beschränkte, 37
nach unten beschränkte, 37
offene, 56
unvollständige, 65
vollständige, 65
zusammenhängende, 67
Minimalstelle
lokale, 148
Minimierer, 41
Minimum
einer Folge, 42
einer Funktion, 40
einer Menge, 38
lokales, 148
Minorante, 80
Minorantenkriterium, 80
Mittelwertsatz, 127
Monotoniekriterium, 71
Multiplikation, 6
skalare, 6
Nabla, 147
Nachkommaanteil, 40
Negativteil, 171
Norm, 8
Betragssummennorm, 9
Einsnorm, 9
euklidische, 9
Maximumnorm, 9
p-Norm, 9
Standardnorm auf Cn , 9
Standardnorm auf Rn , 9
submultiplikative, 35
Supremumsnorm, 91
Tschebychev–Norm, 9
Unendlichnorm, 9
Nullfolge, 47
Nullmenge, 162
Nullstellensatz von Bolzano, 112
Ordnungsrelation, 7
orthogonal, 20
Orthogonalbasis, 21
Orthogonalität, 20
Orthonormalbasis, 21
Parallelogrammgleichung, 18
Partialpolynom, 93
Partialsumme, 75
INDEX
p-Norm, 9
Polarkoordinaten, 186
Polynom
Taylor–Polynom, 134
Positivteil, 170
Potenzreihe, 93
Produkt
inneres, 14
Produktregel, 123
Punkt
innerer, 53
Randpunkt, 53
Quotientenkriterium, 85
Quotientenregel, 123
Rand, 53
Randpunkt, 53
Raum
Banach–Raum, 65
Hilbert–Raum, 65
Innenproduktraum, 15
normierter, 10
Untervektorraum, 6
Vektorraum, 6
Regel
des konstanten Faktors, 123
Kettenregel, 124
Produktregel, 123
Quotientenregel, 123
Summenregel, 123
von de l’Hôpital, 128
Reihe, 75
absolut konvergente, 82
alternierende, 78
alternierende harmonische, 76
divergente, 76
geometrische, 76
harmonische, 75
konvergente, 76
Leibniz–Reihe, 77
Taylor–Reihe, 134
Relation, 7
Äquivalenzrelation, 7
antisymmetrische, 7
Ordnungsrelation, 7
reflexive, 7
symmetrische, 7
Totalordnung, 7
transitive, 7
203
Rieszscher Darstellungssatz, 24
Sandwichtheorem, 71
Satz
des Pythagoras, 20
Fundamentalsatz der Analysis, 177
Mittelwertsatz, 127
Nullstellensatz von Bolzano, 112
Riemannscher Umordnungssatz, 83
Rieszscher Darstellungssatz, 24
Sandwichtheorem, 71
Umordnungssatz, 83
vom Minimum und Maximum, 114
von Bolzano–Weierstraß, 64
von Fubini, 183
von Heine–Borel, 63
von Rolle, 127
von Schwarz, 145
von Taylor, 136
Zwischenwertsatz, 111
Schranke
obere, 37
untere, 37
Signumfunktion, 4
Sinusfunktion, 96
hyperbolische, 96
Skalarprodukt, 14
euklidisches, 14
Sphäre, 12
Stammfunktion, 177
Standardnorm
auf Cn , 9
auf Rn , 9
Standardskalarprodukt
auf Rn , 14
Steigung, 119
Stelle
stationäre, 149
Subtitutionsregel, 189
Summenregel, 123
Supremum
einer Folge, 42
einer Funktion, 41
einer Menge, 37
Supremumsnorm, 91
Taylor–Polynom, 134
Taylor–Reihe, 134
Teilfamilie, 33
Teilfolge, 45
204
Totalordnung, 7
Tschebychev–Norm, 9
Überdeckung, 62
offene, 62
Umordnungssatz, 83
Riemannscher, 83
Unendlichnorm, 9
Ungleichung
Cauchy–Schwarzsche, 18
Dreiecksungleichung, 8
umgekehrte Dreiecksungleichung, 12
Untervektorraum, 6
Variable
einer Potenzreihe, 93
Vektor, 5
Vektoraddition, 6
Vektorraum, 6
endlichdimensionaler, 6
Verknüpfung, 6
Vollständigkeitsaxiom, 38
Volumen
eines rechtsoffenen Intervalls, 160
Vorzeichen, 4
Winkel, 18
Wurzelkriterium, 84
Zahl
Eulersche, 72
Zwischenwertsatz, 111
INDEX